Interpretacja twierdzenia Bayesa zastosowana do pozytywnych wyników mammografii

11

Próbuję owinąć głowę wokół wyniku twierdzenia Bayesa zastosowanego do klasycznego przykładu mammograficznego, przy czym obrót mamogramu jest idealny.

To jest,

Częstość występowania raka:.01

Prawdopodobieństwo pozytywnego mammografii, biorąc pod uwagę, że pacjent ma raka:1

Prawdopodobieństwo pozytywnego mammografii, biorąc pod uwagę, że pacjent nie ma raka:.01

Przez Bayes:

P (rak | mammogram +) =1.01(1.01)+(.091.99)

=.5025

Tak więc, jeśli przypadkowa osoba z populacji wykona mammografię i uzyska wynik dodatni, istnieje 50% szansa na raka? Nie rozumiem intuicyjnie, w jaki sposób niewielka 1% szansa na fałszywie dodatni u 1% populacji może wywołać 50% wynik. Logicznie rzecz biorąc, pomyślałbym, że idealnie prawdziwy pozytywny mammogram z małym odsetkiem wyników fałszywie dodatnich byłby znacznie dokładniejszy.

użytkownik2666425
źródło
2
Liczba wyników fałszywie dodatnich nie dotyczy 1%, ale 99% populacji. Dlatego masz prawdopodobieństwo, które może wydawać się niskie, z powodu bardzo wysokiego wcześniejszego prawdopodobieństwa, że ​​ktoś jest zdrowy. Pamiętaj również, że jest to tylko jeden test, co się stanie, jeśli podejmiesz go więcej niż jeden raz? Wtedy dokładność testu zaczyna mieć większe znaczenie.
dsaxton,
Jeśli jest to idealny mammogram, wówczas współczynnik fałszywie dodatnich wyników wyniósłby zero, a następnie p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0 W miarę zbliżania się wskaźnika fałszywie dodatnich wyników mammografii doskonałość (0), to drugi termin na dole zbliża się do zera. „Mały” fałszywie dodatni współczynnik łączy się z podobnie małą stopą podstawową, aby uzyskać wynik sprzeczny z intuicją.
Dave X
Z mojego doświadczenia wynika, że ​​logika, formalnie dedukcyjna, jest cudowną rzeczą, ale generuje skrajnie złe intuicje dotyczące wnioskowania probabilistycznego. Narzędzia tutaj bmj.com/content/343/bmj.d6386 mogą pomóc Twojej intuicji.
conjugateprior
W moim rozumieniu pytaniem jest intuicja, w jaki sposób prawdopodobieństwo warunkowe może być tak niskie, biorąc pod uwagę założenia; nie chodzi o rzeczywiste statystyki mammograficzne z prawdziwego życia (na które wydają się polegać odpowiedzi).
Juho Kokkala,
Myślę, że w mianowniku występuje literówka (2. termin powinien wynosić (.01 * 0,99)? Wynik jest jednak poprawny. Nie do końca intuicja, ale uproszczenie: P (C | +) = P (C) / (P (C) + (P (+ |! C) P (! C)) i P (C) są bardzo niskie, więc P (C | +) jest wyjątkowo wrażliwy na P (+ |! C), tzn. Potrzebujesz P ( + |! C) << P (C), aby P (C | +) zbliżył się do 1
David Waterworth

Odpowiedzi:

11

Odpowiem na to pytanie zarówno z medycznego, jak i statystycznego punktu widzenia. Otrzymał wiele uwagi w prasie świeckich, szczególnie po bestsellerze The Signal and the Noise autorstwa Nate Silver, a także w szeregu artykułów w publikacjach, takich jak The New York Times wyjaśniających tę koncepcję. Bardzo się cieszę, że @ user2666425 otworzył ten temat na CV.

Po pierwsze, proszę wyjaśnić, że nie jest dokładne. Mogę powiedzieć, że ta postać byłaby spełnieniem marzeń. Niestety istnieje wiele fałszywie ujemnych mammografii, szczególnie u kobiet z gęstą tkanką piersi. Szacowana liczba może wynosić lub więcej , w zależności od tego, czy wszystkie różne rodzaje raka piersi zostaną połączone w jeden (inwazyjny w porównaniu z DCIS) i od innych czynników. To jest powód, dla którego stosuje się również inne metody oparte na technologii ultrasonograficznej lub MRI. Różnica między a jest krytyczna w teście przesiewowym.p(+|C)=120%0.81

Twierdzenie Bayesa mówi nam, że , a ostatnio zwróciło na siebie dużą uwagę, ponieważ dotyczy do mammografii u młodszych kobiet niskiego ryzyka . Zdaję sobie sprawę, że nie jest to dokładnie to, o co pytasz, do którego poruszam w końcowych akapitach, ale jest to najbardziej dyskutowany temat. Oto smak problemów:p(C|+)=p(+|C)p(+)p(C)

  1. Przed (lub prawdopodobieństwo zachorowania na raka na podstawie częstości występowania) u młodszych pacjentów, na przykład od 40 - 50 lat, jest raczej niewielka. Według NCI może to zaokrąglić w górę o (patrz tabela poniżej). To stosunkowo niskie prawdopodobieństwo przed badaniem samo w sobie zmniejsza warunkowe prawdopodobieństwo wystąpienia raka po badaniu, biorąc pod uwagę, że mammografia była dodatnia, niezależnie od prawdopodobieństwa lub zebranych danych.1.5%

  2. Prawdopodobieństwo fałszywie dodatniego staje się bardzo istotnym problemem w procedurze przesiewowej, która będzie stosowana wobec tysięcy zdrowych kobiet a priori. Tak więc, choć fałszywie dodatni wskaźnik wynoszący (który jest znacznie wyższy, jeśli skupisz się na skumulowanym ryzyku ) może nie brzmieć tak źle, w rzeczywistości jest to kwestia kolosalnych kosztów psychologicznych i ekonomicznych, szczególnie biorąc pod uwagę niskie prawdopodobieństwo testu u młodszych pacjentów niskiego ryzyka. Twoja liczba jest znacznie odbiegająca od normy - w rzeczywistości „przerażenia” są niezwykle powszechne z powodu wielu czynników, w tym obaw związanych z leczeniem.710%1%

Tak więc, przeliczając i co bardzo ważne, dla młodszych kobiet bez czynników ryzyka :

p(C|+)=p(+|C)p(+)p(C)=

=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=0.80.80.015+0.070.9850.015=0.148 .

Prawdopodobieństwo raka po odczytaniu mammografii przesiewowej jako dodatniej może wynosić nawet u młodych kobiet niskiego ryzyka. Nawiasem mówiąc, odczyty mammograficzne zawierają pośrednie oszacowanie zaufania do diagnozy radiologa (nazywa się to BI-RADS), a ta analiza bayesowska zmieniłaby się radykalnie wraz z przejściem z BI-RADS 3 do BI-RADS 5 - wszystkie z nich „pozytywne” testy w najszerszym tego słowa znaczeniu.15%

Liczbę tę można logicznie zmienić w zależności od szacunków, które bierzesz pod uwagę w swoich obliczeniach, ale prawda jest taka, że ​​zalecenia dotyczące wieku początkowego, aby przejść do programu badań przesiewowych mammografii, zostały ostatnio zwiększone z do4045 .

U starszych kobiet częstość występowania (a zatem prawdopodobieństwo przed badaniem) rośnie liniowo wraz z wiekiem. Według obecnego raportu ryzyko zdiagnozowania raka piersi u kobiety w ciągu następnych 10 lat , począwszy od następującego wieku, jest następujące:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Powoduje to łączne ryzyko w całym okresie życia wynoszące około :10%

Obliczenia u starszych kobiet z częstością byłyby następujące:4%

p(C|+)=0.80.80.04+0.070.960.04=0.3232% mniej niż obliczyłeś.

Nie mogę przecenić liczby „przerażeń” nawet w starszych populacjach. Jako procedura przesiewowa mammografia jest po prostu pierwszym krokiem, więc sensowne jest interpretowanie mammografii dodatniej, ponieważ istnieje możliwość, że pacjent ma raka piersi, co uzasadnia dalszą pracę przy pomocy ultradźwięków, dodatkowych (diagnostycznych) badań mammograficznych, kolejne mammografie, MRI lub biopsja. Gdyby był bardzo wysoki, nie mielibyśmy do czynienia z testem przesiewowym , byłby to test diagnostyczny , taki jak biopsja.p(C|+)

Konkretna odpowiedź na twoje pytanie:

Jest to „przerażenie”, wynoszące , a nie jak w OP, w połączeniu ze względnie niską częstością występowania choroby (niskie prawdopodobieństwo przed badaniem lub wysokie ), zwłaszcza u młodszych kobiet, co odpowiada niższemu prawdopodobieństwu po teście na przestrzeni wieków. p(+|C¯)710%1%p(C¯)Zauważ, że ten „wskaźnik fałszywych alarmów” jest mnożony przez znacznie większy odsetek przypadków bez raka (w porównaniu z pacjentami z chorobą nowotworową) w mianowniku, a nie „niewielką 1% szansę na fałszywie dodatni wynik w 1% populacji” wzmianka. Wierzę, że to odpowiedź na twoje pytanie. Aby podkreślić, chociaż byłoby to nie do zaakceptowania w teście diagnostycznym, nadal warto w procedurze przesiewowej.

Kwestia intuicji: @Juho Kokkala poruszył kwestię, o którą OP pytał o intuicję . Myślałem, że wynikało to z obliczeń i końcowych akapitów, ale w porządku ... Tak wytłumaczyłbym to przyjacielowi ... Udawajmy, że polujemy na fragmenty meteorów za pomocą wykrywacza metalu w Winslow w Arizonie. Tutaj:

Zdjęcie z meteorcrater.com

... i wykrywa metal. Cóż, gdybyś powiedział, że są szanse, że pochodzi z monety, którą podrzucił turysta, prawdopodobnie miałbyś rację. Ale rozumiesz sedno: gdyby to miejsce nie było tak dokładnie sprawdzone, znacznie bardziej prawdopodobne byłoby, że sygnał z detektora w takim miejscu pochodziłby z fragmentu meteoru, niż gdybyśmy byli na ulicach Nowego Jorku.

To, co robimy za pomocą mammografii, trafia do zdrowej populacji, szukającej cichej choroby, która jeśli nie zostanie wcześnie złapana, może być śmiertelna. Na szczęście częstość występowania (choć bardzo wysoka w porównaniu z innymi mniej uleczalnymi nowotworami) jest na tyle niska, że ​​prawdopodobieństwo przypadkowego napotkania raka jest niskie, nawet jeśli wyniki są „pozytywne” , szczególnie u młodych kobiet.

Z drugiej strony, jeśli nie byłoby fałszywych trafień, tj. ( ,p(C¯|+)=0

100%p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=p(+|C)p(+|C)p(C)p(C)=1 , podobnie jak prawdopodobieństwo uderzenia we fragment meteorytu, gdyby nasz wykrywacz metalu zadziałał, byłby w niezależny od obszaru, który badaliśmy, gdyby zamiast zwykłego wykrywacza metalu używaliśmy idealnie dokładnego instrumentu do wykrywania aminokwasów w kosmosie w meteorie fragment (wymyślony przykład). Bardziej prawdopodobne byłoby znalezienie fragmentu na pustyni w Arizonie niż w Nowym Jorku, ale gdyby detektor wydał sygnał dźwiękowy, wiedzielibyśmy, że znaleźliśmy meteor.100%

Ponieważ nigdy nie mamy idealnie dokładnego urządzenia lub układu pomiarowego, ułamek będzie wynosił , a im bardziej niedoskonały, tym mniejszy część lub wcześniej , która zostanie „przekazana” do LHS równania jako późniejsza . Jeśli zdecydujemy się na określony typ detektora, ułamek prawdopodobieństwa będzie działał jako stały w równaniu liniowym postaci, , gdzie <1p(C)tylny=αprzednitylny<przednilikelihoodunconditional p(+)=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)<1p(C)posterior=αpriorposterior<prior, a im mniejszy wcześniejszy, tym liniowo mniejszy będzie tył. Jest to określane jako zależności od występowania w dodatnia wartość predykcyjna (PPV) : prawdopodobieństwo, że pacjenci z dodatnim wynikiem testu przesiewowego pokonać tę chorobę.

Antoni Parellada
źródło
5

Kluczowym problemem związanym z mammografią, który nie został odpowiednio rozwiązany w dyskursie, jest błędna definicja „pozytywu”. Jest to opisane w rozdziale Diagnoza w http://biostat.mc.vanderbilt.edu/ClinStat - patrz link do Biostatystyki w badaniach biomedycznych .

Jednym z najczęściej stosowanych diagnostycznych systemów kodowania w mammografii jest wynik BI-RADS, a wynik 4 to częsty „pozytywny” wynik. Definicja kategorii 4 brzmi: „Nie jest charakterystyczny dla raka piersi, ale rozsądne prawdopodobieństwo złośliwości (3 do 94%); należy wziąć pod uwagę biopsję”. Z zakresem ryzyka sięgającym od 0,03 do 0,94 dla jednej kategorii , tj. Niesamowitą niejednorodnością w tym, co tak naprawdę oznacza „pozytywne”, nic dziwnego, że mamy bałagan na rękach.

Jest to również znak niejasnego myślenia, że ​​system BI-RADS nie ma kategorii dla osoby o szacowanym ryzyku 0,945.

Jak Nate Silver tak elokwentnie dowodzi w Sygnału i hałasie , gdybyśmy myśleli probabilistycznie, podejmowalibyśmy lepsze decyzje dookoła. Usunięcie określeń takich jak „pozytywny” i „negatywny” dla testów medycznych pozwoliłoby na usunięcie fałszywie dodatnich i fałszywych negatywów oraz optymalne przekazanie niepewności (i uzasadnienia dla większej liczby testów przed postawieniem diagnozy).

Frank Harrell
źródło
Piszemy w praktycznej synchronizacji - sprawdź moje komentarze poniżej o BI-RADS. Nie mogłem zgodzić się więcej (mnóstwo osobistych doświadczeń w tym zakresie jako radiolog).
Antoni Parellada,
3

Fajna dyskusja na ten temat znajduje się w książce Calculated Risks

Znaczna część książki dotyczy znalezienia jaśniejszych sposobów mówienia o prawdopodobieństwie i ryzyku. Przykład:

Prawdopodobieństwo, że kobieta w wieku 40 lat ma raka piersi, wynosi około 1 procent. Jeśli ma raka piersi, prawdopodobieństwo pozytywnego wyniku testu na mammografii przesiewowej wynosi około 90 procent. Jeśli nie ma raka piersi, prawdopodobieństwo, że mimo to będzie pozytywna, wynosi 9 procent. Jakie są szanse, że kobieta z pozytywnym wynikiem testu ma raka piersi?

W ten sposób książka przedstawia rozwiązanie, używając „częstotliwości naturalnych”. Weźmy pod uwagę 10 000 kobiet, 1% ma raka, czyli 100 kobiet. Spośród nich 90% zwróci wyniki dodatnie (tj. 90 kobiet z rakiem uzyska wynik dodatni). Z 9900 bez raka 9% zwróci pozytywny wynik testu lub 891 kobiet. Tak więc jest 891 + 90 = 981 kobiet z pozytywnymi testami, z których 90 ma raka. Tak więc prawdopodobieństwo, że kobieta z pozytywnym wynikiem testu ma raka, wynosi 90/981 = 0,092

Jeśli 100% kobiet z rakiem ma wynik pozytywny, to tylko zmienia trochę liczby na 100 / (100 + 891) = 0,1

Podejście częstotliwości naturalnej do zrozumienia wyników fałszywie dodatnich

Tony Ladson
źródło
1

Być może ten sposób myślenia jest prawidłowy ?:

Dla każdej przypadkowej osoby istnieje 1% szansa na raka, a zatem istnieje szansa na że mammografia przypadkowej osoby będzie dodatnia. Jeśli nie mają raka, istnieje 1% szans, że mammografia będzie dodatnia..011

Jest więc intuicyjnie zbliżony do rzutu monetą dla przypadkowej osoby. Nie jestem pewien, jak wyjaśnić dodatkowe na korzyść raka, biorąc pod uwagę pozytywny mammograf.0.0025

użytkownik2666425
źródło
1

Oto uproszczony, ale intuicyjny sposób patrzenia na to. Rozważ 100 osób. Jeden ma raka i da wynik pozytywny. Spośród 99, którzy tego nie zrobią, jeden z nich dostanie fałszywie pozytywny test. Tak więc z dwóch pozytywnych przypadków jeden będzie miał raka, a drugi nie.

Emil Friedman
źródło