Mam pytanie dotyczące czegoś, co mój nauczyciel statystyk powiedział o następującym problemie. Moje pytanie nawet nie dotyczy wystąpienia paradoksu Simpsona w tej sytuacji. Moje pytanie dotyczy po prostu nacisku mojego profesora, że A) i D) są prawidłowymi odpowiedziami zamiast A) i F). Powiedział:
„Ponieważ wskaźnik skuteczności w przypadku operacji typu E jest tak niski, możemy stwierdzić, że są one trudne i nie tylko rzadkie. Dlatego Mercy prawdopodobnie ma lepszy sprzęt / lekarzy w porównaniu z Hope”.
Nie rozumiem, jak mógł wnioskować statystycznie, że Mercy wykonuje „trudniejsze operacje”. Miłosierdzie ma oczywiście lepszy wskaźnik powodzenia w operacjach typu E, ale dlaczego to oznacza, że wykonują „trudniejsze operacje”. Wydaje mi się, że jestem pod wrażeniem sformułowania tego problemu i profesor się nie porusza. Czy ktoś może wyjaśnić, dlaczego się mylę lub jak to wytłumaczyć profesorowi?
W twoim mieście są dwa szpitale o nazwie Miłosierdzie i Nadzieja. Musisz wybrać jeden z nich, w którym chcesz poddać się operacji. Zdecydujesz się oprzeć swoją decyzję na sukcesie ich zespołów chirurgicznych. Na szczęście, zgodnie z nowym planem zdrowotnym, szpitale podają dane dotyczące powodzenia swoich operacji, w podziale na pięć szerokich kategorii operacji. Załóżmy, że otrzymujesz następujące dane dla dwóch szpitali:
Mercy Hospital
Type A B C D E All
Operations 359 1836 299 2086 149 4729
Successful 292 1449 179 434 13 2366
Hope Hospital
Type A B C D E All
Operations 88 514 222 86 45 955
Successful 70 391 113 12 2 588
Zauważasz, że we wszystkich rodzajach operacji Mercy ma wyższy wskaźnik sukcesu niż Hope, ale Hope ma najwyższy ogólny wskaźnik sukcesu. Który szpital wybrałbyś i dlaczego (wybierz dwie odpowiedzi)?
A) Miłosierdzie; ponieważ wybrałbym się na konkretną operację, chcę szpitala, który ma najlepszy wskaźnik sukcesu dla tej operacji.
B) Nadzieja; ponieważ wykonują mniej operacji we wszystkich kategoriach, nie są „zadowoleni z operacji” jak Miłosierdzie.
C) Nadzieja; jest to przykład paradoksu Simpsona i zawsze powinniśmy wybierać „oczywisty” wniosek.
D) Miłosierdzie; patrząc na kolumnę E, Mercy wyraźnie robi trudniejsze operacje i prawdopodobnie jest to lepszy szpital.
E) Nadzieja; ma lepszy ogólny wskaźnik sukcesu.
F) Miłosierdzie; jest to przykład paradoksu Simpsona i zawsze powinniśmy wybierać przeciwieństwo „oczywistego” wniosku.
źródło
Odpowiedzi:
Myślę, że A i E nie są dobrą kombinacją, ponieważ A mówi, że powinieneś wybrać Mercy, a E mówi, że powinieneś wybrać Hope.
A i D mają tę zaletę, że opowiadają się za tym samym wyborem. Ale przyjrzyjmy się bliżej linii rozumowania w D, ponieważ wydaje się, że jest to zamieszanie. Prawdopodobieństwo sukcesu operacji jest takie samo w obu szpitalach, przy czym typ A jest najbardziej skuteczny, a typ E najmniej. Jeśli zawalimy się (tzn. Zignorujemy) szpitale, możemy zauważyć, że marginalne prawdopodobieństwo powodzenia operacji jest następujące:
Ponieważ E jest znacznie mniej prawdopodobne, aby odnieść sukces, uzasadnione jest wyobrażenie sobie, że jest trudniejsze (chociaż w prawdziwym świecie istnieją również inne możliwości). Możemy rozszerzyć tę linię myślenia również na pozostałe cztery typy. Teraz przyjrzyjmy się, jaka część całkowitych operacji każdego szpitala jest każdego typu:
Zauważamy tutaj, że Hope robi więcej łatwiejszych operacji AC (a zwłaszcza B & C), a mniej trudnych operacji, takich jak D. E jest dość rzadkie w obu szpitalach, ale, dla tego, co jest warte, Hope faktycznie robi wyższy procent. Niemniej jednak efekt paradoksu Simpsona będzie głównie napędzany przez BD (nie tak naprawdę kolumna E, jak sugeruje wybór odpowiedzi D).
Paradoks Simpsona występuje, ponieważ operacje różnią się stopniem trudności (ogólnie), a także dlatego, że N różnią się. To różne stawki podstawowe różnych rodzajów operacji sprawiają, że jest to sprzeczne z intuicją. Łatwo byłoby zobaczyć, co się dzieje, gdyby oba szpitale wykonały dokładnie taką samą liczbę operacji każdego rodzaju. Możemy to zrobić po prostu obliczając prawdopodobieństwo sukcesu i mnożąc przez 100; dostosowuje się to dla różnych częstotliwości:
Ponieważ oba szpitale wykonały po 100 operacji (łącznie 500), odpowiedź jest oczywista: Miłosierdzie jest lepszym szpitalem.
źródło
Żadna z odpowiedzi nie jest całkowicie bezpodstawna. Ale WSZYSCY zakładają znaczną wiedzę zewnętrzną i nie można ich uważać za ścisłe na podstawie statystyk.
A, B, D i E wymagają założenia o czynnikach, które powodują, że pacjenci wybierają jeden szpital zamiast drugiego; proces, w którym lekarze i pacjenci są dobierani, stopień, w jakim wskaźniki powodzenia można przypisać do poszczególnych klas operacji w porównaniu do wspólnych czynników, takich jak OIOM, i tak dalej.
W prawdziwym świecie moglibyśmy słusznie rozważyć wiele alternatywnych czynników, takich jak dostawcy płatności, które szpital oficjalnie akceptuje, wskaźniki społeczno-ekonomiczne i otyłości w okolicy, czy jest to szpital dydaktyczny (w takim przypadku wskaźnik sukcesu spada, gdy przybywają nowi stażyści, a my trzeba rozważyć miesięczny mix), i tak dalej.
Oczywiście możemy i robimy rozsądne założenia dotyczące tych czynników, ale bez konkretnego rozwiązania problemu lub wykluczenia go z problemu nie można stwierdzić, czy odpowiedź jest „słuszna”, czy nie.
źródło
@gung udzielił bardzo dokładnej odpowiedzi, ale jest jeszcze jeden powód, dla którego D jest poprawną odpowiedzią na pytanie: lepsze szpitale wykonują więcej trudnych operacji, ponieważ są lepsze. Oznacza to, że jeśli ktoś przyjdzie do szpitala Hope na operację E (najtrudniejszy), może wysłać go do Miłosierdzia, ponieważ w Hope nie wie, jak to zrobić.
Dzieje się tak nawet w prawdziwym świecie, a najtrudniejsze przypadki są wysyłane do większych lub bardziej wyspecjalizowanych szpitali.
źródło