- Oświadczenie pierwsze (S1): „Jedna na 80 ofiar śmiertelnych jest spowodowana wypadkiem samochodowym”.
- Oświadczenie drugie (S2): „Jedna na 80 osób umiera w wyniku wypadku samochodowego”.
Teraz osobiście nie widzę żadnej różnicy między tymi dwoma stwierdzeniami. Pisząc, uważałbym je za wymienne dla świeckich odbiorców. Jednak dwoje ludzi rzuciło mi obecnie wyzwanie i szukam dodatkowej perspektywy.
Moja domyślna interpretacja S2 brzmi: „Spośród 80 osób losowo wybranych losowo z populacji ludzi, spodziewalibyśmy się, że jedna z nich umrze w wyniku wypadku samochodowego” - i uważam to kwalifikowane stwierdzenie za równoważne z S1.
Moje pytania są następujące:
P1) Czy moja domyślna interpretacja rzeczywiście jest równoważna z Oświadczeniem pierwszym?
Q2) Czy to nietypowe lub lekkomyślne, aby była to moja domyślna interpretacja?
P3) Jeśli uważasz, że S1 i S2 są inne, aby podać drugą, gdy jedna oznacza, że pierwsza wprowadza w błąd / jest niepoprawna, czy możesz podać w pełni kwalifikowaną wersję S2, która jest równoważna?
Odłóżmy na bok oczywistą spór, że S1 nie odnosi się konkretnie do śmierci ludzi i załóżmy, że jest to rozumiane w kontekście. Odłóżmy także na bok wszelką dyskusję na temat prawdziwości samego twierdzenia: ma ono być ilustracyjne.
Jak mogę najlepiej powiedzieć, dotychczasowe nieporozumienia wydają się koncentrować na domyślnej odmiennej interpretacji pierwszego i drugiego zdania.
Po pierwsze, moi pretendenci wydają się interpretować to jako 1/80 * num_deaths = liczba zgonów spowodowanych wypadkami samochodowymi, ale z jakiegoś powodu domyślna jest inna interpretacja drugiego w stylu „jeśli masz jakiś zestaw z 80 osób, jedna z nich będzie śmierć w wypadku samochodowym”(co nie jest oczywiście równoważne roszczenia). Wydaje mi się, że biorąc pod uwagę ich interpretację S1, domyślną wartością dla S2 byłoby odczytanie jej jako (1/80 * num_dead_people = liczba osób, które zginęły w wypadku samochodowym == liczba zgonów spowodowanych wypadkiem samochodowym). Nie jestem pewien, dlaczego rozbieżność w interpretacji (ich domyślna wartość dla S2 jest znacznie silniejszym założeniem), czy też jeśli mają jakieś wrodzone poczucie statystyczne, którego tak naprawdę brakuje.
źródło
Odpowiedzi:
Po pierwsze, moją pierwszą intuicyjną myślą było: „S2 może być taki sam jak S1, jeśli śmiertelność w ruchu drogowym pozostaje stała, być może przez dziesięciolecia” - co z pewnością nie byłoby dobrym założeniem w ciągu ostatnich dziesięcioleci. To już wskazuje, że jedną z trudności są ukryte / niewypowiedziane założenia czasowe.
Powiedziałbym, że twoje oświadczenia mają formę
1 na związane z .x p o p u l a t i o n e v e n t
W S1 populacją są zgony, a domniemana specyfikacja czasowa jest obecnie lub „w odpowiednio dużym [aby mieć wystarczającą liczbę spraw], ale niezbyt szerokim przedziale czasowym [aby mieć w przybliżeniu stałą charakterystykę wypadku samochodowego] wokół teraźniejszości”
W S2 populacja to ludzie. Inni wydają się czytać to nie jako „umierający”, ale jako „żyjący” (co przecież ludzie robią częściej / dłużej). Jeśli odczytasz ludność jako żywych ludzi, najwyraźniej nikt na 80 żyjących teraz nie umiera „teraz” w wypadku samochodowym. Czyta się to jako „kiedy umierają [prawdopodobnie za dziesięciolecia], przyczyną śmierci jest wypadek samochodowy”.
Weź wiadomość do domu: zawsze bądź ostrożny, aby określić, kim jest twoja populacja i ogólnie mianownik ułamków. (Gerd Gigerenzer ma dokumenty na temat nieokreślania mianownika będącego główną przyczyną nieporozumień, szczególnie w statystyce i komunikacji ryzyka).
źródło
Dla mnie „1 na 80 zgonów ...” jest zdecydowanie jaśniejszym stwierdzeniem. Mianownik w „1 na 80” jest zbiorem wszystkich zdarzeń śmierci, a to stwierdzenie wyraźnie to określa.
W sformułowaniu „1 na 80 osób ...” występuje dwuznaczność. Naprawdę masz na myśli „1 na 80 osób, które umierają ...”, ale stwierdzenie to można z łatwością zinterpretować jako „1 na 80 osób, które obecnie żyją ...” lub podobne.
Jestem za jawnym wyrażeniem odniesienia w ustawieniach prawdopodobieństwa lub częstotliwości, takich jak ten. Jeśli mówisz o odsetku zgonów, powiedz „zgony”, a nie „ludzie”.
źródło
the 1/80 ratio does focus on the present time in particular
. Czy też nie rozumiem?To zależy od tego, czy opisujesz, czy przewidujesz .
„1 na 80 osób zginie w wypadku samochodowym” to przepowiednia. Spośród wszystkich ludzi żyjących dzisiaj, w pewnym okresie życia, jeden na 80 umrze w ten sposób.
„1 na 80 zgonów spowodowanych wypadkiem samochodowym” to opis. Spośród wszystkich osób, które zmarły w danym okresie (np. Czas trwania badania pomocniczego), 1 na 80 z nich rzeczywiście zginęło w wypadku samochodowym.
Zauważ, że okno czasowe tutaj jest niejednoznaczne. Jedno zdanie sugeruje, że śmierć już miała miejsce; inne sugerują, że kiedyś się pojawią. Jedno zdanie sugeruje, że twoja linia bazowa to ludzie, którzy zmarli (i którzy żyli wcześniej); drugi oznacza podstawową populację ludzi, którzy żyją dzisiaj (i ostatecznie umrą).
Są to tak naprawdę różne instrukcje i tylko jedna z nich jest prawdopodobnie obsługiwana przez dane źródłowe.
Na marginesie, dwuznaczność wynika z niedopasowania między stanem bycia osobą (która zdarza się ciągle) a zdarzeniem śmierci (które zdarza się w danym momencie). Ilekroć łączysz rzeczy w ten sposób, dostajesz coś, co jest podobnie niejednoznaczne. Możesz natychmiast rozwiązać niejednoznaczność, używając dwóch zdarzeń zamiast jednego stanu i jednego zdarzenia; na przykład: „Z każdych 80 urodzonych osób 1 umiera w wypadku samochodowym”.
źródło
Te dwa stwierdzenia różnią się ze względu na stronniczość próby, ponieważ wypadki samochodowe są bardziej prawdopodobne, gdy ludzie są młodzi.
Uczyńmy to bardziej konkretnym, zakładając nierealistyczny scenariusz.
Rozważ dwa stwierdzenia:
Pokażemy, że te dwa stwierdzenia nie są takie same.
Uprośćmy to znacznie i załóżmy, że wszyscy urodzeni umrą z powodu zawału serca w wieku 80 lat lub wypadku samochodowego w wieku 40 lat. Przypuśćmy ponadto, że pierwsze stwierdzenie jest ważne i że jesteśmy w stałej populacji, więc zgony równoważą porody. Wtedy będą trzy populacje ludzi, wszystkie jednakowo duże.
Te trzy populacje muszą być jednakowo duże, ponieważ odsetek osób umierających w wypadkach samochodowych (z pierwszej populacji powyżej) i liczba osób umierających na zawał serca (z trzeciej populacji powyżej) są równe.
Tak więc w tym przypadku tylko jedna trzecia wszystkich ludzi żyjących dzisiaj umrze w wypadku samochodowym, więc te dwa stwierdzenia nie są takie same.
W prawdziwym życiu mam wrażenie, że wypadki samochodowe zdarzają się w znacznie młodszym wieku niż większość innych przyczyn śmierci. W takim przypadku będzie znaczna różnica między liczbami w pierwszym i drugim wyciągu.
Jeśli zmodyfikujesz drugą instrukcję na
następnie przy założeniu, że populacja stanu stacjonarnego obie wypowiedzi będą równoważne. Ale oczywiście w prawdziwym świecie nie mamy populacji w stanie ustalonym, a podobny (choć bardziej skomplikowany) argument pokazuje, że w przypadku rosnącej lub malejącej populacji odchylenie w próbkowaniu wciąż czyni te dwie wypowiedzi innymi.
źródło
Nie.
Powiedzmy, że mamy 800 osób. 400 zmarło: 5 z powodu wypadku samochodowego, pozostałe 395 zapomniało oddychać. S1 jest teraz prawdą: 5/400 = 1/80. S2 jest fałszem: 5/800! = 1/80.
Problem polega na tym, że technicznie S2 jest niejednoznaczny, ponieważ nie określa, ile zgonów w sumie było, podczas gdy S1 tak. Alternatywnie S1 ma jeszcze jedną informację (całkowita liczba zgonów) i jedną mniej informacji (całkowita liczba osób). Przyjmowane według wartości nominalnej opisują różne stosunki.
Właściwie nie zgadzam się z twoją interpretacją, ale myślę, że to nie ma znaczenia. Prawdopodobnie kontekst uwidoczniłby, o co chodzi.
Możesz zapytać, gdzie możesz spotkać ludzi, którzy nie umierają. Po pierwsze, moglibyśmy pracować z zestawem danych statystycznych, który śledzi ludzi tylko przez 5 lat, więc te, które jeszcze żyją pod koniec badania, muszą zostać zignorowane, ponieważ nie wiadomo, z czego umrą. Alternatywnie, przyczyna śmierci może być nieznana, w takim przypadku nie można tak naprawdę przypisać jej do samochodów, ani do samochodów.
„Jedna na 80 osób, które umierają, robi to w wyniku wypadku samochodowego”. co odpowiada przeformułowaniu S1.
źródło
Zgadzam się, że twoja interpretacja drugiego stwierdzenia jest zgodna z pierwszym stwierdzeniem. Zgodziłbym się również, że jest to całkowicie rozsądna interpretacja drugiego stwierdzenia. Biorąc to pod uwagę, drugie stwierdzenie jest znacznie bardziej niejednoznaczne.
Drugie zdanie można również interpretować jako:
Druga i trzecia interpretacja powyżej mogą być wystarczająco bliskie dla świeckich odbiorców, ale pierwsza jest całkiem inna.
źródło
Podstawowa różnica polega na tym, że oba stwierdzenia odnoszą się do różnych populacji ludzi i różnych ram czasowych.
„Jedna na 80 zgonów jest spowodowana wypadkiem samochodowym” prawdopodobnie odnosi się do odsetka zgonów w dość dość ograniczonym okresie czasu (powiedzmy jeden rok). Ponieważ zarówno odsetek całkowitej liczby osób korzystających z samochodów, jak i dane dotyczące bezpieczeństwa samochodów zmieniły się znacznie w czasie, stwierdzenie nie ma sensu, chyba że podasz, do którego przedziału czasu się odnosi. (Jako absurdalny przykład byłoby to całkowicie błędne w 1919 r., Biorąc pod uwagę poziom posiadania i użytkowania samochodów w całej populacji w tym czasie). Uwaga: powyższy „odsetek całkowitej populacji korzystającej z samochodów” jest w rzeczywistości błędem - powinien to być „odsetek osób, które umrą w najbliższym czasie przy użyciu samochodów”
„Jedna na 80 osób umiera w wyniku wypadku samochodowego” prawdopodobnie odnosi się do wszystkich ludzi, którzy obecnie żyją w jakimś regionie, i ich ostatecznej przyczyny śmierci w nieznanym czasie w przyszłości. Ponieważ częstość i bezpieczeństwo podróży samochodem prawie na pewno zmieni się w ciągu ich życia (powiedzmy w ciągu następnych 100 lat, w przypadku dzisiejszych noworodków), jest to zupełnie inne stwierdzenie niż pierwsze.
źródło
A1) Zakładając, że wszyscy umrą, i zakładając kontekst wystarczająco krótkiego okresu wokół tego, w którym dokonano pomiarów, tak, twoja interpretacja S2 pasuje do S1.
A2) Tak, twoja interpretacja S2 jest lekkomyślna. S2 można interpretować jako „umiera 1 na 80 osób uczestniczących w wypadkach samochodowych”, co oczywiście nie jest równoznaczne z S1. Dlatego użycie S2 może powodować zamieszanie.
Twoja interpretacja 1 na 80 jest rozsądna, choć i druga interpretacja (1 w każdym 80) jest bardzo nietypowe. „1 na N U jest P” jest bardzo częstym skrótem dla „biorąc pod uwagę predykat, P i N losowych próbek, x, z wszechświata U, oczekiwana liczba próbek, tak że P (x) jest prawdziwe, w przybliżeniu równa się 1” .
A3) Wykluczone, jeśli wszyscy ludzie, 1 na 80 umiera w wyniku wypadku samochodowego.
źródło
Tak, jest źle i żadne sformułowanie nie wydaje się wystarczające, aby konsekwentnie przekazywać pożądane znaczenie
Mówiąc jako laik, jeśli twoim celem są laicy, zdecydowanie polecam opublikowanie go na https://english.stackexchange.com/ , a nie tutaj - twoje pytanie zajęło mi kilka lektur, aby rozjaśnić, co S1 i S2 intuicyjnie oznaczają dla mnie kontra to, co chciałeś powiedzieć.
Dla przypomnienia, moje interpretacje każdego stwierdzenia:
(S1) - na 80 zgonów, 1 zgon w wyniku wypadku samochodowego
(S2) - na 80 osób w wypadku samochodowym, 1 śmierć
Aby przekazać twoje znaczenie, prawdopodobnie użyłbym zmodyfikowanego S2: „Jedna na 80 osób zginie w wypadku samochodowym”.
To wciąż zawiera pewne niejasności, ale zachowuje podobną zwięzłość.
źródło