Czy przedział ufności faktycznie stanowi miarę niepewności oszacowania parametru?

12

Czytałem post na blogu autorstwa statystyka Williama Briggsa, a poniższe stwierdzenie zainteresowało mnie co najmniej.

co o tym myślisz?

Co to jest przedział ufności? Jest to oczywiście równanie, które zapewni przedział czasowy dla danych. Ma on na celu zapewnienie miary niepewności oszacowania parametru. Teraz, ściśle według teorii częstokroć - którą możemy nawet założyć, że jest prawdą - jedyną rzeczą, którą możesz powiedzieć o CI, którą masz pod ręką, jest to, że prawdziwa wartość parametru leży w nim lub nie. To jest tautologia, dlatego zawsze jest prawdziwa. Tak więc CI nie zapewnia żadnej miary niepewności: w rzeczywistości jest to bezużyteczne ćwiczenie.

Link: http://wmbriggs.com/post/3169/

Pięć σ
źródło
3
Bez dokładnego odniesienia nie ma tu, co najważniejsze, żadnego kontekstu. Nie ma też sposobu, aby uzyskać wskazówki na temat stylu i referencji Williama Briggsa (mnie nie znają). Możliwe, że tutaj jest ktoś, kto po prostu lubi być prowokujący i oburzający. Istnieją oczywiście głębokie i trudne kwestie techniczne i filozoficzne, które są pytaniem, ale proszenie nas o debatę na temat cytatu bez tła jest mało prawdopodobne (tylko jedno spojrzenie).
Nick Cox,
1
@NickCox Jeśli chodzi o pominięcie odpowiedniego kontekstu, zredagowałem początkowy post.
Pięć σ
6
Bardzo dziękuję za udzielenie kopii zapasowej. To tylko komentarz i nie mam ochoty go przedłużać, ale moja trzyliterowa reakcja jest taka, że ​​ostatnie zdanie jest przesadnym twierdzeniem . Możesz spodziewać się pełniejszych odpowiedzi.
Nick Cox,
1
@NickCox Nie ma problemu Nick. Doceniam jednak twoje sentymenty, ponieważ nie mogłem odnieść się do mojego pytania.
Pięć σ
2
@Nick Powiedziałbym, że Briggsowi udało się osiągnąć jeden z jego dwóch celów: „Dzisiejsze myśli są jedynie szkicem, który pomaga oczyścić mój umysł i rozpocząć dyskusję. Oznacza to, że prawdopodobnie padnę ofiarą mojej własnej skargi” (że twoje „sąsiedztwo” statystyka „to„ niechlujny myśliciel ”).
whuber

Odpowiedzi:

24

Odnosi się raczej niezdarnie do dobrze znanego faktu, że analiza częstokrzyska nie modeluje stanu naszej wiedzy o nieznanym parametrze z rozkładem prawdopodobieństwa, więc obliczając (powiedzmy 95%) przedział ufności (powiedzmy 1,2 do 3,4) dla parametr populacji (powiedzmy średnią z rozkładu Gaussa) z niektórych danych, których nie można następnie kontynuować i twierdzić, że istnieje 95% prawdopodobieństwo, że średnia spadnie między 1,2 a 3,4. Prawdopodobieństwo wynosi jeden lub zero - nie wiesz który. Ale ogólnie możesz powiedzieć, że twoja procedura obliczania 95% przedziałów ufności to taka, która zapewnia, że ​​zawierają one prawdziwą wartość parametru przez 95% czasu. Wydaje się to wystarczającym powodem do stwierdzenia, że ​​IK odzwierciedlają niepewność. Jak ujął to sir David Cox

Definiujemy procedury oceny dowodów, które są skalibrowane według ich skuteczności, gdyby były stosowane wielokrotnie. W tym sensie nie różnią się od innych przyrządów pomiarowych.

Zobacz tutaj i tutaj, aby uzyskać dalsze wyjaśnienia.

Inne rzeczy, które możesz powiedzieć, różnią się w zależności od konkretnej metody użytej do obliczenia przedziału ufności; jeśli upewnisz się, że wartości wewnątrz mają większe prawdopodobieństwo, biorąc pod uwagę dane, niż punkty na zewnątrz, możesz to powiedzieć (i często jest to w przybliżeniu prawdziwe w przypadku powszechnie używanych metod). Zobacz tutaj po więcej.

† Cox (2006), Zasady wnioskowania statystycznego , § 1.5.2

Scortchi - Przywróć Monikę
źródło
1
Wyobrażam sobie, że to Sir David Cox.
Nick Cox,
@NickCox: Rzeczywiście tak jest.
Scortchi - Przywróć Monikę
Czy przytoczona analogia Sir Davida jest poprawna? (Niepoprawny cytat, ale poprawna analogia.) Nie wyobrażam sobie termometru, który w 95% przypadków podaje temperaturę , ale 5% czasu podaje temperaturę poza - i może daleko poza tym zakresem? ± ϵ±ϵ±ϵ
Wayne
1
μXμμ(bL(Xμ),bU(Xμ))Pr[bU(Xμ)<μ<bU(Xμ)]=0.95μμ=2
1
... jest prawdą, a jeśli , jest prawdą. Teraz podstawienie w zrealizowanych wartościach daje np. , tj. Jeśli , i jeśli , - co jest nonsensem. Pr[bU(X2)<2<bU(X2)]=0.95μ=7Pr[bU(X7)<7<bU(X7)]=0.95XμPr[1.2<μ<3.4]=0.95μ=2Pr[1.2<2<3.4]=0.95μ=7Pr[1.2<2<3.4]=0.95
Scortchi - Przywróć Monikę
2

Matematyczna charakterystyka niepewności może być trudna, ale znam ją, kiedy ją widzę; zwykle ma szerokie 95% przedziały ufności.

N Brouwer
źródło