Znalazłem niezgodne informacje na pytanie: „ Jeśli ktoś konstruuje 95% przedział ufności (CI) różnicy średnich lub różnicy proporcji, czy wszystkie wartości w CI są jednakowo prawdopodobne? Czy też oszacowanie punktowe jest najbardziej prawdopodobne , z wartościami zbliżonymi do „ogonów” CI mniej prawdopodobne niż wartości w środku CI?
Na przykład, jeśli w randomizowanym raporcie z badania klinicznego stwierdzono, że względne ryzyko zgonu w przypadku konkretnego leczenia wynosi 1,06 (95% CI 0,96 do 1,18), czy prawdopodobieństwo, że 0,96 jest prawidłową wartością, jest równe 1,06?
Znalazłem wiele odniesień do tej koncepcji w Internecie, ale następujące dwa przykłady odzwierciedlają jej niepewność:
Moduł Lisy Sullivan o przedziałach ufności stwierdza:
Przedziały ufności dla różnicy średnich zapewniają zakres prawdopodobnych wartości dla ( ). Należy zauważyć, że wszystkie wartości w przedziale ufności są równie prawdopodobnymi szacunkami prawdziwej wartości ( μ_1-μ_2 ).
Ten blog zatytułowany „Margines błędu” stanowi:
Mam na myśli nieporozumienie dotyczące „marginesu błędu”, który traktuje wszystkie punkty w przedziale ufności jako równie prawdopodobne, tak jakby centralne twierdzenie graniczne sugerowało ograniczony rozkład jednorodny zamiast rozkładu t . [...]
To, co mówi o „marginesie błędu”, to fakt, że możliwości bliskie oszacowaniu punktowemu są znacznie bardziej prawdopodobne niż możliwości, które znajdują się na skraju marginesu ”.
Wydają się one sprzeczne, więc co jest poprawne?
źródło
Odpowiedzi:
Należy odpowiedzieć na jedno pytanie: co w tym kontekście oznacza „prawdopodobne”?
Jeśli oznacza to prawdopodobieństwo (ponieważ jest czasami używane jako synonim), a my używamy ścisłych definicji częstokroć, wówczas prawdziwa wartość parametru to pojedyncza wartość, która się nie zmienia, więc prawdopodobieństwo (prawdopodobieństwo) tego punktu wynosi 100% i wszystkie inne wartości wynoszą 0%. Tak więc prawie wszystkie są jednakowo prawdopodobne przy 0%, ale jeśli przedział zawiera prawdziwą wartość, to różni się od innych.
Jeśli zastosujemy podejście bayesowskie, wówczas CI (przedział wiarygodności) pochodzi z rozkładu tylnego i można porównać prawdopodobieństwo w różnych punktach w tym przedziale. O ile tył nie jest idealnie równomierny w przedziale (teoretycznie możliwe, ale byłoby to dziwne okoliczności), wówczas wartości mają różne prawdopodobieństwa.
Jeśli użyjemy prawdopodobnie podobnego do ufności, pomyśl o tym w ten sposób: Oblicz 95% przedział ufności, 90% przedział ufności i 85% przedział ufności. Bylibyśmy 5% pewni, że prawdziwa wartość leży w regionie wewnątrz przedziału 95%, ale poza przedziałem 90%, możemy powiedzieć, że prawdziwa wartość prawdopodobnie spadnie w tym regionie o 5%. To samo dotyczy regionu, który znajduje się w przedziale 90%, ale poza przedziałem 85%. Więc jeśli każda wartość jest jednakowo prawdopodobna, wówczas rozmiar powyższych 2 regionów musiałby być dokładnie taki sam i to samo dotyczyłoby regionu wewnątrz 10% przedziału ufności, ale poza 5% przedziałem ufności. Żadna ze standardowych rozkładów, przy użyciu których tworzone są interwały, nie ma tej właściwości (oprócz specjalnych przypadków z 1 losowaniem z munduru).
Możesz to dodatkowo udowodnić, symulując dużą liczbę zestawów danych ze znanych populacji, obliczając interesujący przedział ufności, a następnie porównując, jak często prawdziwy parametr jest bliżej oszacowania punktu niż każdego z punktów końcowych.
źródło
To świetne pytanie! Istnieje matematyczna koncepcja zwana prawdopodobieństwem, która pomoże ci zrozumieć problemy. Fisher wynalazł prawdopodobieństwo, ale uznał je za nieco mniej pożądane niż prawdopodobieństwo, ale prawdopodobieństwo okazuje się bardziej „prymitywne” niż prawdopodobieństwo, a Ian Hacking (1965) uznał je za aksjomatyczne, ponieważ nie jest możliwe do udowodnienia. Prawdopodobieństwo leży u podstaw prawdopodobieństwa, a nie odwrotnie.
Hacking, 1965. Logika wnioskowania statystycznego .
Prawdopodobieństwo nie jest zwracane na uwagę w standardowych podręcznikach statystyki bez uzasadnionego powodu. Różni się od prawdopodobieństwa posiadania prawie dokładnie takich właściwości, jakich można by się spodziewać, a funkcje prawdopodobieństwa i przedziały są bardzo przydatne do wnioskowania. Być może niektórzy statystycy nie lubią prawdopodobieństwa, ponieważ czasami nie ma „właściwego” sposobu uzyskania odpowiednich funkcji prawdopodobieństwa. Jednak w wielu przypadkach funkcje prawdopodobieństwa są oczywiste i dobrze zdefiniowane. Badanie prawdopodobieństwa wnioskowania powinno prawdopodobnie rozpocząć się od małej i łatwej do zrozumienia książki Richarda Royalla, zatytułowanej „ Dowody statystyczne: paradygmat prawdopodobieństwa” .
Odpowiedź na twoje pytanie brzmi: nie, punkty w dowolnym przedziale nie mają tego samego prawdopodobieństwa. Te na krawędziach przedziału ufności mają zwykle mniejsze prawdopodobieństwo niż inne w kierunku środka przedziału. Oczywiście konwencjonalny przedział ufności nie mówi nic bezpośrednio o parametrze istotnym dla konkretnego eksperymentu. Przedziały ufności Neymana są „globalne”, ponieważ mają długoterminowe właściwości, a nie „lokalne” właściwości istotne dla danego eksperymentu. (Na szczęście dobre wyniki długoterminowe można interpretować lokalnie, ale jest to raczej skrót intelektualny niż rzeczywistość matematyczna). Przedziały prawdopodobieństwa - w przypadkach, w których można je zbudować - bezpośrednio odzwierciedlają prawdopodobieństwo powiązania eksperymentu.
źródło
Załóżmy, że ktoś mi powiedział, że powinienem pokładać równe zaufanie we wszystkich wartościach w CI95 jako potencjalnych wskaźnikach wartości populacji. (Celowo unikam określeń „prawdopodobne” i „prawdopodobne”). Co jest specjalnego w 95? Nic: aby zachować spójność, musiałbym pokładać równe zaufanie we wszystkich wartościach w CI96, CI97, ... i CI99.9999999. Ponieważ zasięg CI zbliżył się do limitu, praktycznie wszystkie liczby rzeczywiste musiałyby zostać uwzględnione. Niedorzeczność tego wniosku doprowadziłaby mnie do odrzucenia pierwotnego twierdzenia.
źródło
Zacznijmy od definicji przedziału ufności. Jeśli powiem, że 95% przedział ufności przechodzi od tego do tego, mam na myśli, że stwierdzenia tego rodzaju będą prawdziwe w 95% przypadków, a fałszywe w 5% przypadków. Mam nie musi oznaczać, że jestem w 95% przekonany o tym konkretnym stwierdzeniem. Przedział ufności 90% będzie węższy, a jeszcze 80% węższy. Dlatego zastanawiając się, jaka jest prawdziwa wartość, mam mniejszą wiarę w wartości, ponieważ zbliżają się one coraz bardziej do krawędzi określonego przedziału ufności.
Pamiętaj, że wszystkie powyższe mają charakter jakościowy, szczególnie „wiarygodność”. (Unikałem określenia „pewność” lub „prawdopodobieństwo” w tym stwierdzeniu, ponieważ niosą one bagaż matematyczny, który może różnić się od naszego intuicyjnego bagażu). Podejścia Bayesa sformułują twoje pytanie na coś, co ma ilościową odpowiedź, ale nie chcę otwierać puszka robaków tutaj.
Pomocny może być również tekst Box, Hunter & Hunter („Statistics for Experimenters”, Wiley, 1978). Patrz „Zestawy przedziałów ufności” na s. 113, str.
źródło