Ponieważ można obliczyć przedziały ufności dla wartości p, a ponieważ przeciwieństwem oszacowania przedziału jest oszacowanie punktowe: czy wartość p jest oszacowaniem punktowym?
confidence-interval
estimation
p-value
estimators
point-estimation
00schneider
źródło
źródło
Odpowiedzi:
Szacunki punktowe i przedziały ufności dotyczą parametrów opisujących rozkład, np. Średniej lub odchylenia standardowego.
Jednak w przeciwieństwie do innych statystyk próby, takich jak średnia próbki i odchylenie standardowe próbki, wartość p nie jest użytecznym estymatorem interesującego parametru rozkładu. Spójrz na odpowiedź @whuber po szczegóły techniczne.
Wartość p dla statystyki testowej daje prawdopodobieństwo zaobserwowania odchylenia od oczekiwanej wartości statystyki testowej co najmniej tak dużej, jak obserwowana w próbce, obliczonej przy założeniu, że hipoteza zerowa jest prawdziwa. Jeśli masz cały rozkład, jest on albo zgodny z hipotezą zerową, albo nie jest. Można to opisać za pomocą zmiennej wskaźnikowej (ponownie, patrz odpowiedź @whuber).
Ale wartość p nie może być użyta jako użyteczny estymator zmiennej wskaźnikowej, ponieważ nie jest spójna, ponieważ wartość p nie zbiega się wraz ze wzrostem wielkości próby, jeśli hipoteza zerowa jest prawdziwa. Jest to dość skomplikowany alternatywny sposób stwierdzenia, że test statystyczny może odrzucić lub nie odrzucić wartości zerowej, ale nigdy jej nie potwierdza.
źródło
Tak, można (i tak było) argumentować, że wartość p jest oszacowaniem punktowym.
Aby zidentyfikować dowolną właściwość rozkładu, którą mogłaby oszacować wartość p, musielibyśmy założyć, że jest ona asymptotycznie bezstronna. Ale asymptotycznie średnia wartość p dla hipotezy zerowej wynosi (idealnie; w przypadku niektórych testów może to być inna liczba niezerowa), a dla każdej innej hipotezy wynosi . Zatem wartość p można uznać za estymator połowy funkcji wskaźnika dla hipotezy zerowej.1/2 0
Trzeba wprawdzie trochę kreatywności, aby spojrzeć na wartość p w ten sposób. Moglibyśmy zrobić trochę więcej, patrząc na dany estymator jako na decyzję, którą podejmujemy za pomocą wartości p: czy rozkład leżący u podstaw jest elementem hipotezy zerowej lub hipotezy alternatywnej? Nazwijmy ten zestaw możliwych decyzji . Jack Kiefer piszeD
W tym przypadku, ponieważ jest dyskretna, „dość gładka” wcale nie jest ograniczeniem. Terminologia Kiefera odzwierciedla to, odnosząc się do procedur statystycznych z dyskretnymi przestrzeniami decyzyjnymi jako „testy” zamiast „estymatorów punktowych”.D
Chociaż interesujące jest zbadanie granic (i ograniczeń) takich definicji, jak to pytanie nas zachęca, być może nie powinniśmy zbyt mocno nalegać, aby wartość p była estymatorem punktowym, ponieważ to rozróżnienie między estymatorami a testami jest zarówno przydatne i konwencjonalne.
W komentarzu do tego pytania Christian Robert zwrócił uwagę na artykuł z 1992 r., W którym on i współautorzy wzięli dokładnie ten punkt widzenia i przeanalizowali dopuszczalność wartości p jako estymatora funkcji wskaźnika . Zobacz link w odnośnikach poniżej. Artykuł zaczyna się
[Podkreślenie dodane.]
Referencje
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells i Roger H. Farrell, Estimation of Accuracy in Testing . Ann. Statystyk. Tom 20, numer 1 (1992), 490-509. Otwarty dostęp .
Jack Carl Kiefer, Wprowadzenie do wnioskowania statystycznego . Springer-Verlag, 1987.
źródło
źródło