Rozważ następujące stwierdzenia dotyczące Titanica:
Założenie 1: tylko mężczyźni i kobiety byli na statku
Założenie 2: Było wielu mężczyzn i kobiet
Oświadczenie 1: 90 procent wszystkich kobiet przeżyło
Oświadczenie 2: 90 procent wszystkich, którzy przeżyli, to kobiety
Pierwszy wskazuje, że ratowanie kobiet miało prawdopodobnie wysoki priorytet (niezależnie od tego, czy ratowanie mężczyzn było)
Kiedy przydatna jest druga statystyka?
Czy możemy powiedzieć, że jedno z nich jest prawie zawsze bardziej przydatne niż drugie?
Odpowiedzi:
W obecnej formie ani jedno z oświadczeń 1, ani 2 nie jest bardzo przydatne. Gdyby 90% pasażerów stanowiły kobiety, a 90% ludzi przeżyło losowo, wówczas oba stwierdzenia byłyby prawdziwe. Oświadczenia należy rozpatrywać w kontekście ogólnego składu pasażerów. I ogólna szansa na przeżycie.
Załóżmy, że mieliśmy tyle mężczyzn, ile kobiet, po 100 osób. Oto kilka możliwych matryc mężczyzn (M) przeciwko kobietom (W) i przeżywających (S) przeciwko zmarłym (D):
90% kobiet przeżyło. Podobnie jak 90% mężczyzn. Stwierdzenie 1 jest prawdziwe, stwierdzenie 2 jest fałszywe, ponieważ połowa osób, które przeżyły, to kobiety. Jest to zgodne z wieloma ocalałymi, ale nie ma różnicy między płciami .
90% kobiet przeżyło, ale tylko 10% mężczyzn. 90% osób, które przeżyły, stanowiły kobiety. Oba stwierdzenia są prawdziwe. Jest to zgodne z różnicą między płciami : kobiety częściej przeżyły niż mężczyźni.
9% kobiet przeżyło, ale tylko 1% mężczyzn. 90% osób, które przeżyły, stanowiły kobiety. Oświadczenie 1 jest fałszywe, oświadczenie 2 jest prawdziwe. Jest to znowu zgodne z różnicą między płciami : kobiety częściej przeżyły niż mężczyźni.
źródło
(or indeed, if *everyone* survived)...
Jeśli wszyscy przeżyli, przeżyło 100% wszystkich kobiet, niezależnie od proporcji.Na pierwszy rzut oka warunkowe prawdopodobieństwo przeżycia uzależnionego od seksu jest bardziej przydatne, po prostu ze względu na kierunek przepływu informacji. Płeć danej osoby znana jest przed jej statusem przeżycia, a prawdopodobieństwo to można wykorzystać w sensie predykcyjnym i prospektywnym. Nie ma również wpływu na rozpowszechnienie kobiet. W razie wątpliwości pomyśl o przewidywaniu.
źródło
Słowo „priorytet” pochodzi od łacińskiego słowa „przed”. Priorytetem jest coś, co pojawia się przed czymś innym (gdzie „przed” jest używane w znaczeniu „ważniejsze”). Jeśli powiesz, że ratowanie kobiet było priorytetem, to ratowanie kobiet musi nastąpić przed czymś innym. Naturalnym założeniem jest to, że przedtem ratuje ludzi. Jeśli powiesz „bez względu na to, czy ratowanie ludzi było”, to zastanawiamy się, co się stało wcześniej.
To, że kobiety miały wysoki wskaźnik przeżycia, niewiele mówi, jeśli nie wiemy, jaki był ogólny wskaźnik przeżycia. Ostatni statek, na którym byłem, przeżył ponad 90% kobiet, ale nie scharakteryzowałbym tego jako wykazanie, że ratowanie kobiet było priorytetem.
Wiedząc, jaki procent kobiet, które przeżyły, stanowiły kobiety, niewiele mówi, nie wiedząc, jaki procent ogółu ludzi to kobiety.
To, która statystyka jest bardziej użyteczna, naprawdę zależy od sytuacji. Jeśli chcesz wiedzieć, jak niebezpieczne jest coś, śmiertelność jest ważniejsza. Jeśli chcesz wiedzieć, co wpływa na to, jak niebezpieczne jest coś, ważny jest procentowy podział ofiar.
źródło
Być może przydatne będzie zbadanie, w jaki sposób te prawdopodobieństwa są powiązane.
Twierdzenie Bayesa ilustruje związek między tymi stwierdzeniami prawdopodobieństwa.
źródło
To zależy od tego, co uważa się za przydatne.
Z drugiej strony, jeśli zastanawiasz się, dlaczego historie osób, które przeżyły, pochodzą głównie od kobiet, to stwierdzenie 2 wyjaśniłoby to, czyniąc stwierdzenie 2 użytecznym nawet przy braku innych informacji.
Nie mogę wymyślić niczego, co oświadczenie 1 byłoby przydatne poza kontekstem. Z pewnością nie mówi nic o priorytecie, jakim jest ratowanie kobiet, w porównaniu do czegokolwiek innego. Jedyne, co mówi mi 1, to to, że każę powiedzieć „powiedz mi więcej”.
źródło
Na powierzchni (lub w oderwaniu od rzeczywistości) oba stwierdzenia wydają się równie bezużyteczne dla celu państwa. Jednak biorąc pod uwagę kontekst, drugie stwierdzenie jest zdecydowanie bardziej przydatne.
Oświadczenie 2
Zobaczmy, co możemy wyciągnąć z drugiego wyrażenia. Stosunek kobietw wśród wszystkich zachowało się:
Testujemy hipoH.0: x > z
Napiszmy równanie, aby uzyskać niezbędne warunkiH.0 :
Tak więc, dla twojej hipotezy, że kobiety miały większe szanse na przeżycie, wystarczy sprawdzić, czy wśród pasażerów było mniej niż 90% kobiet. Jest to zgodne z twoim założeniem 2, co wydaje się implikowaćP ≈ 1 / 2 . Dlatego oświadczam, że to stwierdzenie 2 prawie wszystko zapewnia, że kobiety miały większe szanse na przeżycie, tj. Jest to całkiem przydatne dla twojego celu.
Oświadczenie 1
Pierwsze stwierdzenie jest naprawdę bezużyteczne w oderwaniu, ale ma ograniczone zastosowanie w kontekście. Jeśli udajemy, że nic nie wiemy o tym wydarzeniu, to mówimy tox = 0,9 tells us nothing about z , and whether x>z ?
However, from that little that I know about the event - I haven't seen the movie - it seems unlikely thatx≤z . Why?
We know from Assumption 2 thatp≈1/2 , so the total survival rate is
px+(1−p)z . If we assume that x≈z and p≈1/2 we get
Wniosek
Powiedziałbym, że oba stwierdzenia potwierdzają Twoją hipotezę, że kobiety miały większe szanse na przeżycie niż mężczyźni, ale Oświadczenie 1 robi to raczej słabo, podczas gdy Oświadczenie 2 w połączeniu z założeniami prawie na pewno ustanawia twoje hipo jako fakt.
źródło