Przykłady błędnego zastosowania twierdzenia Bayesa

11

To pytanie społecznościowe dotyczące przepełnienia matematyki zawierało „przykłady złych argumentów, które dotyczą zastosowania twierdzeń matematycznych w kontekstach niematematycznych”, i stworzyło fascynującą listę patologicznie stosowanej matematyki.

Zastanawiam się nad podobnymi przykładami patologicznego zastosowania wnioskowania bayesowskiego. Czy ktoś napotkał artykuły naukowe, ekscentryczne posty na blogach, które używają metod bayesowskich w szalony sposób.

Chris Brent
źródło

Odpowiedzi:

3

Tak. Niedawno zostałem zatrudniony jako konsultant statystyczny w celu zbadania konkretnego (okropnego) artykułu, którego autorom udało się pogorszyć wygląd w liście do redakcji, używając twierdzenia Bayesa. Zaczęli od błędnie obliczonej dodatniej wartości predykcyjnej z ich artykułu (rzekomo PPV = 95%). Zasadniczo zlekceważyli krytyczny list Ricci (2004), który próbował (i nie udało się) powiedzieć im, jak powinni to obliczyć (zasugerował 82,3%). Potem znaleźli podręcznik biostatów (Elston i Johnson, 1994) i źle go cytowali . Kupiliśmy książkę i sprawdziliśmy, ale z perspektywy czasu było to tak samo niepotrzebne, jak podejrzewałem. Zdobądź ładunek tego bałaganu (z listu odpowiedzi Barsnessa i wsp. Do redakcji):

Bayesa Twierdzenie 1 ogólnie stwierdza, że niska częstość występowania danej choroby (NAT) wzmacnia pozytywną wartość predykcyjną dodatnią testu (złamania żebra) określenie stanu chorobowego (ofiarą NAT) ... Według Bayesa twierdzenia 1 prawdopodobieństwo zdarzenia definiuje się za pomocą następującego równania: P to prawdopodobieństwo prawdziwego zdarzenia ( ofiara NAT), P (S / D 1 ) oznacza prawdopodobieństwo pozytywnego testu (PPV złamania żebra, aby przewidzieć NAT), a P (S / D 2 ) jest późniejszym prawdopodobieństwem pozytywnego testu (częstość NAT) . Podstawiając nasze dane, prawdopodobieństwo, że złamanie żebra jest prawdziwym zdarzeniem

P=P(S/D1)P(S/D1)+P(S/D2)
[p=95/(95+1.6)]wynosi 98,3 procent. Korzystając z wyżej wspomnianego niższego obliczenia PPV, wynoszącego 82,3 procent, prawdopodobieństwo prawdziwego zdarzenia wynosi 98,1 procent.

Widzisz coś dziwnie spójnego tutaj? Na pewno nie ...

  1. Takie jest twierdzenie Bayesa, ponieważ Elston i Johnson (1994) stosują je do przykładu dziedziczności hemofilii:

    P(D1|S)=P(D1)P(S|D1)P(D1)P(S|D1)+P(D2)P(S|D2)

    Rozbieżności mówią same za siebie, ale oto cytat z ich dyskusji o przykładzie:

    Fakt, że miała jednego syna, który pozostaje nienaruszony, zmniejsza prawdopodobieństwo odziedziczenia genu hemofilii, a tym samym prawdopodobieństwo, że dotknie to drugiego syna.

    Kiedy Barsness i koledzy wpadli na pomysł, że niska rozpowszechnienie wzmacnia PPV, nie wiem, ale na pewno nie zwracali uwagi na własny podręcznik.

  2. Nie wydają się rozumieć, że PPV jest prawdopodobieństwem „prawdziwego zdarzenia” (D 1 ) w przypadku złamania żebra (S). Tak więc, w poetycko kompletnym pokazie „ wyrzucanie śmieci, wyrzucanie śmieci ”, wprowadzają swój PPV jako licznik i mianownik, dodają częstość występowania do mianownika i uzyskują wyższy PPV. Szkoda, że ​​nie zdawali sobie sprawy, że mogą kontynuować to okrągłe muzeum reklam : Chociaż 98,4 to tak naprawdę ; tj. każdy PPV można przekonwertować na 98,4 z rozpowszechnieniem = 1,6, jeśli ich wersja równania byłaby poprawna poprzez zastosowanie iteracyjne.

    p1=95/(95+1.6)=98.3p2=98.3/(98.3+1.6)=98.4
    limkpk(pk1,1.6)
  3. Korzystając z informacji o rozpowszechnieniu oraz niektórych uzasadnionych szacunków czułości i swoistości z innych badań na ten temat, PPV okazuje się znacznie niższy (może nawet 3%). Zabawne jest to, że nawet nie pomyślałbym o użyciu twierdzenia Bayesa, gdyby nie próbowali go użyć do wzmocnienia swojej argumentacji. To wyraźnie nie zadziała w ten sposób, biorąc pod uwagę rozpowszechnienie na poziomie 1,6%.


Referencje
· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM i Strain, JD (2003). Dodatnia wartość predykcyjna złamań żeber jako wskaźnik nieprzypadkowego urazu u dzieci. Journal of Trauma-Injury, Infection and Critical Care, 54 (6), 1107–1110.
· Elston, RC i Johnson, WD (1994). Podstawy biostatystyki (wydanie drugie). Filadelfia: FA Davis Company.
· Ricci, LR (2004). Litery do edytora. Journal of Trauma-Injury, Infection and Critical Care, 56 (3), 721.

Nick Stauner
źródło