Przedział ufności i prawdopodobieństwo - gdzie jest błąd w tym stwierdzeniu?

12

Jeśli ktoś złoży oświadczenie takie jak poniżej:

„Ogólnie rzecz biorąc, osoby niepalące narażone na dym środowiskowy miały względne ryzyko choroby niedokrwiennej serca wynoszące 1,25 (95 procent przedział ufności, 1,17 do 1,32) w porównaniu z osobami niepalącymi nie narażonymi na dym”.

Jakie jest względne ryzyko dla całej populacji? Ile rzeczy jest związanych z chorobą niedokrwienną serca? Spośród ogromnej liczby rzeczy, które można przetestować, bardzo niewiele z nich jest związanych z chorobą niedokrwienną serca, więc szansa, że ​​jakakolwiek konkretna rzecz wybrana losowo jest powiązana, jest znikomo mała. Możemy zatem powiedzieć, że względne ryzyko dla populacji wynosi 1. Ale podany przedział nie zawiera wartości 1. Więc albo faktycznie istnieje związek między tymi dwiema rzeczami, którego prawdopodobieństwo jest znikomo małe, lub jest to jedno z 5% przedziałów, które nie zawierają parametru. Ponieważ ten drugi jest znacznie bardziej prawdopodobny niż ten pierwszy, powinniśmy to założyć. Dlatego właściwym wnioskiem jest to, że zestaw danych był prawie na pewno nietypowy dla populacji,

Oczywiście, jeśli istnieją podstawy do przyjęcia, że ​​ponad 5% rzeczy jest związanych z chorobą niedokrwienną serca, statystyki mogą zawierać pewne dowody potwierdzające sugestię, że jednym z nich jest dym środowiskowy. Zdrowy rozsądek sugeruje, że jest to mało prawdopodobne.

Jaki jest błąd w ich uzasadnieniu (ponieważ wszystkie organizacje zdrowia zgadzają się, że istnieje znaczna literatura na temat szkodliwych skutków palenia z drugiej ręki)? Czy to z powodu ich przesłanki, że „spośród ogromnej liczby rzeczy, które można przetestować, bardzo niewiele faktycznie ma związek z chorobą niedokrwienną serca”? To zdanie może być prawdziwe dla dowolnego losowo wybranego czynnika (tj. Liczby psów, których dana osoba ma ryzyko choroby wieńcowej), ale prawdopodobieństwo a priori jest znacznie wyższe w przypadku palenia biernego i choroby niedokrwiennej serca niż tylko „dowolny czynnik losowy” .

Czy to prawidłowe uzasadnienie? Czy jest coś jeszcze?

BYS2
źródło
Cytowany tekst wydaje się ... cóż, cytatem. Skąd to jest? :)
MånsT
haha tak, to cytat z wikipedii ... ktoś dodał to do artykułu dla „przedziału ufności”. Próbuję go usunąć, ponieważ jest to wyraźnie niepoprawne, ale facet odmawia, więc potrzebuję matematycznie uzasadnionego powodu zamiast po prostu „to jest wyraźnie złe” .. chociaż mam kilka pomysłów, chciałem wiedzieć, czy ktoś może wyjaśnić jakie dokładnie błędy są tutaj popełniane. Ponieważ gdyby było to poprawne, wiele badań można by obalić na podobnych podstawach
BYS2,
3
Jeśli trochę się przeciągnie, przejdę i spróbuję pomóc. Jego argument jest wyraźnie błędny i mocno wskazuje na to, że ma plan.
Erik,
3
Jako fizyk, który używa wielu statystyk, ale nie jest statystą, ten akapit jest naprawdę nieprzydatny, nie wspominając o tym, że brzmi to zupełnie źle. Zawsze myślałem, być może niepoprawnie, że 95% cl oznacza, że ​​gdyby hipoteza zerowa była prawdziwa, to 1 raz na 20, jeśli powtórzę mój eksperyment, czy osiągnęłbym znaczący wynik na poziomie 95% (moim zdaniem dobry powód nie używaj mniej niż 99,9, ale to kolejna dyskusja). Ten post wydaje się bardziej wskazywać na skorelowane czynniki i tak naprawdę wcale nie pomaga nie-ekspertom (ani nikomu).
Bowler
@Erik. Użytkownik ma dość podejrzaną historię marionetek skarpetkowych (miał kilka kont i korzysta z edycji IP) i został wcześniej zablokowany ... nie jestem pewien, jaka jest jego oferta. Ale wydaje się kłopotliwy
BYS2

Odpowiedzi:

10

H0H1

H0H1

Następnie aktualizuje swój uprzedni, stwierdzając, że prawdopodobieństwo uzyskania przedziału ufności 95% nie zawierającego prawdziwej wartości ma prawdopodobieństwo 5%. Chociaż jest to prawda, nie jest to szansa na uzyskanie tego konkretnego przedziału przy założeniu hipotezy zerowej . Zauważ, że potraktowałby przedział ufności [1.17, 1.32] dokładnie tak samo, jak przedział ufności [100, 200], co jest wyraźnie problematyczne.

Jest to naprawdę ważne w podejściu bayesowskim: podczas gdy masz całkowite prawdopodobieństwo 5% nieotrzymania przedziału zawierającego 1 przy założeniu, że 1 wynosi zero, gęstość prawdopodobieństwa uzyskania tego konkretnego przedziału jest inna (i mniejsza).

H0H1

Czwarty błąd polega na tym, że właściwym działaniem byłoby usunięcie danych. Zauważ, że jego wynik nawet nie zależy od danych, jego argument sugeruje, że dokładnie taka sama akcja zostałaby wykonana dla dowolnych danych. Jeśli znajdziesz interesujący link, ale podejrzewasz, że to może być przypadek, właściwą naukową rzeczą jest próba powtórzenia wyniku!

Erik
źródło
Dziękujemy za rozwinięcie odpowiedzi Nestora! Szybkie pytanie stwierdziło jednak, że „... to nie jest szansa na uzyskanie tego konkretnego przedziału przy założeniu hipotezy zerowej”. Gdybyśmy chcieli znaleźć szansę na uzyskanie określonego przedziału przy założeniu hipotezy zerowej, musielibyśmy zastosować wnioskowanie bayesowskie, a wiarygodny przedział jest poprawny? Częstotliwości przedziały ufności mówią tylko „szansę, że przedział będzie zawierał prawdziwą wartość”.
Jeszcze
Częstotliwość przedziału ufności wynosząca 95% jest skonstruowana w taki sposób, że co najmniej 95% razy przedział ufności zawiera prawdziwą wartość. Na razie w porządku. Biorąc to pod uwagę, można również obliczyć prawdopodobieństwo (lub wartość gęstości) uzyskania określonego przedziału ufności, jeśli hipoteza zerowa jest prawdziwa. Dokładna lokalizacja zawiera więcej „informacji” niż tylko to, czy zawiera hipotezę zerową. Wyrzucenie tej informacji jest złe, gdy używa się wnioskowania bayesowskiego, ponieważ ma ona znaczenie dla prawdopodobieństwa, że ​​wartość null jest prawdziwa.
Erik,
Przykładem zabawkowego byłoby: wnioskowanie bayesowskie, chcesz wnioskować o formie dystrybucji. Prior dopuszcza dwie możliwości: H1: Dystrybucja jest standardowa normalna. H2: Rozkład normalny, średnia = sd = 1. Próbka wartości rozkładów pozwala zaktualizować swoje wcześniejsze. Gdy otrzymasz tylko znaki swoich wartości, możesz również zaktualizować swoje wcześniejsze, ale aktualizacja będzie mniej informacyjna, ponieważ wyrzuciłeś odpowiednie informacje.
Erik,
7

Jest to dość interesująca kwestia filozoficzna związana z testowaniem hipotez (a zatem w ustawieniach częstych także przedziały ufności, jak wyjaśniam tutaj ).

Istnieje oczywiście wiele hipotez, które można zbadać - bierne palenie powoduje chorobę wieńcową serca, picie alkoholu powoduje chd, posiadanie psów powoduje chd, bycie Koziorożcem powoduje chd ...

Jeśli wybieramy losowo jedną z tych hipotez, prawdopodobieństwo, że wybieramy prawdziwą hipotezę, wynosi praktycznie zero. To wydaje się być argumentem w cytowanym tekście - że jest bardzo mało prawdopodobne, abyśmy przetestowali prawdziwą hipotezę.

Ale hipoteza nie została wybrana losowo. Było to motywowane wcześniejszą wiedzą epidemiologiczną i medyczną na temat choroby niedokrwiennej serca. Istnieją teoretyczne mechanizmy wyjaśniające, w jaki sposób palenie może powodować chorobę niedokrwienną serca, więc nie wydaje się zbyt daleko idące przypuszczenie, że te pasują również do biernego palenia.

Krytyka cytatu może dotyczyć badań eksploracyjnych, w których zestaw danych jest wykorzystywany do hipotez. Dlatego nie uznajemy takich „odkryć” za fakty - zamiast tego wymagamy, aby wyniki mogły być powtórzone w nowych badaniach. Tak czy inaczej, artykuł cytowany w cytacie jest meta-badaniem i dlatego problem ten nie ma na niego wpływu.

W ciągu ostatnich stuleci widzieliśmy empirycznie, że testowanie hipotez motywowanych teorią przez porównanie przewidywanych wyników z zaobserwowanymi wynikami działa. To, że wierzymy w tę procedurę, jest powodem, dla którego dokonaliśmy tak dużego postępu w medycynie, inżynierii i nauce. To jest powód, dla którego mogę to napisać na moim komputerze i że możesz przeczytać na swoim. Argumentowanie, że ta procedura jest niewłaściwa, oznacza twierdzenie, że metoda naukowa jest zasadniczo wadliwa - i mamy mnóstwo dowodów, które mówią inaczej.

Wątpię, czy istnieje coś, co osoba, która nie chce zaakceptować tego rodzaju dowodów, faktycznie zaakceptuje ...

MånsT
źródło
Naprawdę nie dostałem twojego akapitu przed ostatnim; czy masz na myśli „testowanie istotności” (np. obliczanie prawdopodobieństwa danych co najmniej bardziej ekstremalnie), czy naprawdę „testowanie hipotez” (ustawienie bayesowskie)? Kto powiedział, że któryś z nich nie działa, jeśli zadajesz właściwe pytanie?
Néstor,
@ Néstor: Być może powinienem to napisać inaczej. Tak naprawdę nie wypowiadałem się na temat testowania hipotez statystycznych , ale raczej obserwowałem fakt, że porównywanie prognoz modelu z danymi ze świata rzeczywistego (tj. „Testowanie”, jeśli hipoteza jest poprawna) wydaje się być bardzo skutecznym sposobem na zrobienie tego nauka. U podstaw tej krytyki wobec CI leży, jak sądzę, niechęć do przyjęcia tej metody. Argumenty podane w cytacie dotyczyłyby każdej metody statystycznej - przy zerowych wcześniejszych prawdopodobieństwach dla wszystkich hipotez zerowych nigdy w nic byśmy nie uwierzyli.
MånsT
6

Naprawdę nie rozumiem, dlaczego autor twierdzi, że prawdopodobieństwo względnego ryzyka wystąpienia choroby niedokrwiennej serca 1 może być znikomo małe, opierając swoją analizę wyłącznie na przedziale ufności; to jest po prostu złe. Dla mnie wygląda na to, że używa ustawień częstych, ale rozumuje bayesianly (co jest dość powszechne).

H0:p(De|H0)Dep(H0|D)D

p(H0|D)p(D|H0)p(H0),
p(H0)H0
Néstor
źródło
Czy nie byłoby H0: nie ma związku między biernym paleniem a CHD? Ponieważ hipoteza zerowa jest zwykle hipotezą, że nie ma efektu. Poza tym dziękuję za tę odpowiedź!
BYS2,
Tak, masz rację! Nie zauważyłem tego, dopóki nie zauważyłeś :-). Zmienię swoją odpowiedź.
Néstor
3

Chociaż w tej tok rozumowania Bayesa jest coś (bardzo dokładnie zdekonstruowany przez Erika!), I rzeczywiście ta myśl wyjaśniałaby, dlaczego nie można odtworzyć wielu odkryć medycznych, ten konkretny argument stosuje to myślenie jak młot kowalski.

Autor zakłada dwie rzeczy bez dostarczenia dowodów: że ekspozycja na dym została wybrana losowo i że prawie nic na świecie nie powoduje chorób serca. Zgodnie z tymi luźnymi standardami rozumowania autor mógłby odrzucić KAŻDY wniosek, że coś powoduje chorobę serca. Wszystko, co musisz zrobić, to potwierdzić:

  1. Że hipoteza została wybrana losowo, i
  2. Ta choroba serca ma bardzo bliskie zeru przyczyny.

Oba te twierdzenia są dyskusyjne (i na podstawie mojej ogólnej wiedzy bardzo prawdopodobne, że są fałszywe). Ale przy tych założeniach, nawet zauważając, że 100% osób narażonych na bierne palenie padło martwych na zawał serca w ciągu roku, można stwierdzić, że związek jest jedynie przypadkową korelacją z ukrytą, pojedynczą, „prawdziwą” przyczyną .

Jonathan
źródło
W porządku dzięki za twoje przemyślenia! Tak, autor zdecydowanie założył, że hipoteza została „wybrana losowo”, co jest nieprawidłowe.
BYS2
-1

Nie widzę nic wyraźnie złego w akapicie w cytatach, ale nie widziałem danych i nie mogę sprawdzić liczb. Jednak dwa następujące po nim akapity są bardzo niejasne.

Załóżmy, że powiedział: „Ogólnie rzecz biorąc, osoby niepalące, które były chorobliwie otyłe, miały względne ryzyko choroby wieńcowej na poziomie 1,25 (95 procent przedziału ufności, 1,17 do 1,32) w porównaniu z osobami niepalącymi, które miały normalną masę ciała”. Czy ktoś miałby powód, by w niego wątpić?

Emil Friedman
źródło
Cóż, pierwszy akapit w cytatach był tylko autorem cytującym wnioski z badania epidemiologicznego, więc nie ma w tym nic złego. W kolejnych kilku akapitach próbuje zdyskredytować badanie, w którym podaje pewne wątpliwe stwierdzenia.
BYS2