Który szpital powinien zostać wybrany? Jeden ma wyższy wskaźnik sukcesu, ale drugi ma wyższy ogólny wskaźnik sukcesu

27

Mam pytanie dotyczące czegoś, co mój nauczyciel statystyk powiedział o następującym problemie. Moje pytanie nawet nie dotyczy wystąpienia paradoksu Simpsona w tej sytuacji. Moje pytanie dotyczy po prostu nacisku mojego profesora, że ​​A) i D) są prawidłowymi odpowiedziami zamiast A) i F). Powiedział:

„Ponieważ wskaźnik skuteczności w przypadku operacji typu E jest tak niski, możemy stwierdzić, że są one trudne i nie tylko rzadkie. Dlatego Mercy prawdopodobnie ma lepszy sprzęt / lekarzy w porównaniu z Hope”.

Nie rozumiem, jak mógł wnioskować statystycznie, że Mercy wykonuje „trudniejsze operacje”. Miłosierdzie ma oczywiście lepszy wskaźnik powodzenia w operacjach typu E, ale dlaczego to oznacza, że ​​wykonują „trudniejsze operacje”. Wydaje mi się, że jestem pod wrażeniem sformułowania tego problemu i profesor się nie porusza. Czy ktoś może wyjaśnić, dlaczego się mylę lub jak to wytłumaczyć profesorowi?


W twoim mieście są dwa szpitale o nazwie Miłosierdzie i Nadzieja. Musisz wybrać jeden z nich, w którym chcesz poddać się operacji. Zdecydujesz się oprzeć swoją decyzję na sukcesie ich zespołów chirurgicznych. Na szczęście, zgodnie z nowym planem zdrowotnym, szpitale podają dane dotyczące powodzenia swoich operacji, w podziale na pięć szerokich kategorii operacji. Załóżmy, że otrzymujesz następujące dane dla dwóch szpitali:

Mercy Hospital

Type         A    B      C    D      E    All
Operations  359  1836   299   2086  149  4729
Successful  292  1449   179   434   13   2366

Hope Hospital 

Type          A   B  C   D   E   All
Operations   88 514 222 86  45   955
Successful   70 391 113 12  2    588

Zauważasz, że we wszystkich rodzajach operacji Mercy ma wyższy wskaźnik sukcesu niż Hope, ale Hope ma najwyższy ogólny wskaźnik sukcesu. Który szpital wybrałbyś i dlaczego (wybierz dwie odpowiedzi)?

A) Miłosierdzie; ponieważ wybrałbym się na konkretną operację, chcę szpitala, który ma najlepszy wskaźnik sukcesu dla tej operacji.

B) Nadzieja; ponieważ wykonują mniej operacji we wszystkich kategoriach, nie są „zadowoleni z operacji” jak Miłosierdzie.

C) Nadzieja; jest to przykład paradoksu Simpsona i zawsze powinniśmy wybierać „oczywisty” wniosek.

D) Miłosierdzie; patrząc na kolumnę E, Mercy wyraźnie robi trudniejsze operacje i prawdopodobnie jest to lepszy szpital.

E) Nadzieja; ma lepszy ogólny wskaźnik sukcesu.

F) Miłosierdzie; jest to przykład paradoksu Simpsona i zawsze powinniśmy wybierać przeciwieństwo „oczywistego” wniosku.

świecki
źródło
Och wow, przepraszam, masz całkowitą rację. Tak naprawdę nie widziałem, że istnieje strona SE do analizy statystycznej. Dziękuję Ci.
swiecki
Nie ma powodu do przeprosin. Właśnie ostrzegałem cię o tym na wypadek, gdybyś nie był świadomy. Możesz kliknąć link „flaga” i poprosić go o migrację. Powinno to nastąpić dość szybko. Nawiasem mówiąc (+1) również w tym pytaniu.
kardynał
Mam zamiar przenieść to pytanie do strony Statistics.SE. Pod pytaniem pojawi się link umożliwiający przejście do nowej lokalizacji pytania. Jeśli potrzebujesz pomocy w powiązaniu konta ze statystyką.SE, możesz oflagować swoje pytanie, aby zwrócić uwagę moderatora, a ktoś tam pomoże.
Zev Chonoles

Odpowiedzi:

22

Myślę, że A i E nie są dobrą kombinacją, ponieważ A mówi, że powinieneś wybrać Mercy, a E mówi, że powinieneś wybrać Hope.

A i D mają tę zaletę, że opowiadają się za tym samym wyborem. Ale przyjrzyjmy się bliżej linii rozumowania w D, ponieważ wydaje się, że jest to zamieszanie. Prawdopodobieństwo sukcesu operacji jest takie samo w obu szpitalach, przy czym typ A jest najbardziej skuteczny, a typ E najmniej. Jeśli zawalimy się (tzn. Zignorujemy) szpitale, możemy zauważyć, że marginalne prawdopodobieństwo powodzenia operacji jest następujące:

Type     A     B     C     D     E     All  
Prob   .81   .78   .56   .21   .08     .52

Ponieważ E jest znacznie mniej prawdopodobne, aby odnieść sukces, uzasadnione jest wyobrażenie sobie, że jest trudniejsze (chociaż w prawdziwym świecie istnieją również inne możliwości). Możemy rozszerzyć tę linię myślenia również na pozostałe cztery typy. Teraz przyjrzyjmy się, jaka część całkowitych operacji każdego szpitala jest każdego typu:

Type     A     B     C     D     E  
Mercy  .08   .39   .06   .44   .03  
Hope   .09   .54   .23   .09   .05

Zauważamy tutaj, że Hope robi więcej łatwiejszych operacji AC (a zwłaszcza B & C), a mniej trudnych operacji, takich jak D. E jest dość rzadkie w obu szpitalach, ale, dla tego, co jest warte, Hope faktycznie robi wyższy procent. Niemniej jednak efekt paradoksu Simpsona będzie głównie napędzany przez BD (nie tak naprawdę kolumna E, jak sugeruje wybór odpowiedzi D).

Paradoks Simpsona występuje, ponieważ operacje różnią się stopniem trudności (ogólnie), a także dlatego, że N różnią się. To różne stawki podstawowe różnych rodzajów operacji sprawiają, że jest to sprzeczne z intuicją. Łatwo byłoby zobaczyć, co się dzieje, gdyby oba szpitale wykonały dokładnie taką samą liczbę operacji każdego rodzaju. Możemy to zrobić po prostu obliczając prawdopodobieństwo sukcesu i mnożąc przez 100; dostosowuje się to dla różnych częstotliwości:

Type     A     B     C     D     E     All  
Mercy   81    79    60    21    09     250  
Hope    80    76    51    14    04     225

Ponieważ oba szpitale wykonały po 100 operacji (łącznie 500), odpowiedź jest oczywista: Miłosierdzie jest lepszym szpitalem.

gung - Przywróć Monikę
źródło
+1 Bawiłem się pbinomem w R, a ty odpowiedziałeś na to. :)
Michelle,
1
Och, kochanie, patrząc na twoją odpowiedź, zdałem sobie sprawę, że popełniłem niewielki błąd, podając szczegóły: wierzę, że A) i F) są odpowiedzią, a nie E), ponieważ oczywiście nie pasuje. Przepraszam za to. Jeśli byłbyś tak uprzejmy, aby zostawić kolejny komentarz lub odpowiedź na odpowiedź F), byłbym bardzo szczęśliwy, mogąc go głosować i oczywiście przyjąć tę odpowiedź.
swiecki
2
Więc nie zgadzam się, czy on mówi A i D, a ty mówisz A i F, prawda? Jeśli mimo wszystko próbujesz go przekonać, by dał ci punkty za odpowiedź, możesz powiedzieć, że operacja E nie jest głównym czynnikiem wpływającym na efekt, jak pokazałem powyżej. OTOH, F nie jest tak naprawdę dobrą odpowiedzią, apeluje do uznania tego zjawiska bez dogłębnego zrozumienia go. Ponieważ istnieją tylko 3 opcje, które opowiadają się za Miłosierdziem (właściwym szpitalem), który opuszcza A i D. Ponadto operacja E jest częścią tego efektu, nawet jeśli nie jest to największy wpływ. Wybrałbym A i D, ale odpowiedzi były źle zaprojektowane.
gung - Przywróć Monikę
1
+1 To jest chyba najjaśniejsze wyjaśnienie paradoksu Simpsona (dzięki!). Jedna bardzo drobna rzecz - w twojej ostatniej tabeli otrzymuję nieco inny wynik dla ostatniej kolumny, pierwszego rzędu ( github.com/RInterested/SIMULATIONS_and_PROOFS/blob/master/… )
Antoni Parellada
1
@gung Ah! Miałeś na myśli odsetki, a nie liczby całkowite?
Grecki - Obszar 51 Wniosek
4

Żadna z odpowiedzi nie jest całkowicie bezpodstawna. Ale WSZYSCY zakładają znaczną wiedzę zewnętrzną i nie można ich uważać za ścisłe na podstawie statystyk.

A, B, D i E wymagają założenia o czynnikach, które powodują, że pacjenci wybierają jeden szpital zamiast drugiego; proces, w którym lekarze i pacjenci są dobierani, stopień, w jakim wskaźniki powodzenia można przypisać do poszczególnych klas operacji w porównaniu do wspólnych czynników, takich jak OIOM, i tak dalej.

W prawdziwym świecie moglibyśmy słusznie rozważyć wiele alternatywnych czynników, takich jak dostawcy płatności, które szpital oficjalnie akceptuje, wskaźniki społeczno-ekonomiczne i otyłości w okolicy, czy jest to szpital dydaktyczny (w takim przypadku wskaźnik sukcesu spada, gdy przybywają nowi stażyści, a my trzeba rozważyć miesięczny mix), i tak dalej.

Oczywiście możemy i robimy rozsądne założenia dotyczące tych czynników, ale bez konkretnego rozwiązania problemu lub wykluczenia go z problemu nie można stwierdzić, czy odpowiedź jest „słuszna”, czy nie.

Jonathan
źródło
3

@gung udzielił bardzo dokładnej odpowiedzi, ale jest jeszcze jeden powód, dla którego D jest poprawną odpowiedzią na pytanie: lepsze szpitale wykonują więcej trudnych operacji, ponieważ są lepsze. Oznacza to, że jeśli ktoś przyjdzie do szpitala Hope na operację E (najtrudniejszy), może wysłać go do Miłosierdzia, ponieważ w Hope nie wie, jak to zrobić.

Dzieje się tak nawet w prawdziwym świecie, a najtrudniejsze przypadki są wysyłane do większych lub bardziej wyspecjalizowanych szpitali.

Peter Flom - Przywróć Monikę
źródło
Czy operacja E nie jest najtrudniejsza w tym przykładzie? Ponadto w tym problemie wiemy, że operacja E jest wykonywana zarówno w Nadziei, jak i Miłosierdziu, ponieważ mamy dane na ich temat.
Jarad,
E jest najtrudniejszy, mój błąd, ale chociaż oba szpitale wykonują E, nie robią równej proporcji E. To jest część powodu, dla którego to paradoks.
Peter Flom - Przywróć Monikę