Dlaczego ten fragment mówi, że obiektywne oszacowanie odchylenia standardowego zwykle nie jest istotne?

14

Czytałem o obliczeniach obiektywnego oszacowania odchylenia standardowego i czytałem źródła, które czytałem

(...) z wyjątkiem niektórych ważnych sytuacji, zadanie to nie ma większego znaczenia dla zastosowań statystyki, ponieważ jego potrzeby unika się za pomocą standardowych procedur, takich jak stosowanie testów istotności i przedziałów ufności lub za pomocą analizy bayesowskiej.

Zastanawiałem się, czy ktokolwiek mógłby wyjaśnić uzasadnienie tego stwierdzenia, na przykład czy przedział ufności nie wykorzystuje odchylenia standardowego jako części obliczeń? Czy zatem na przedziały ufności nie wpłynęłoby stronnicze odchylenie standardowe?

EDYTOWAĆ:

Dzięki za dotychczasowe odpowiedzi, ale nie jestem pewien, czy podążam za niektórymi z nich, dlatego dodam bardzo prosty przykład. Chodzi o to, że jeśli źródło jest poprawne, to coś jest nie tak z mojego wniosku do przykładu i chciałbym, aby ktoś wskazał, w jaki sposób wartość p nie zależy od odchylenia standardowego.

Załóżmy, że badacz chciał sprawdzić, czy średnia ocena piątej równiarki w teście w jego mieście różni się od średniej krajowej 76 z poziomem istotności 0,05. Badacz losowo pobrał próbki 20 uczniów. Średnia próbki wyniosła 80,85, a odchylenie standardowe próbki - 8,87. Oznacza to: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Następnie stosuje się tabelę t do obliczenia, że ​​dwustronna wartość prawdopodobieństwa wynosząca 2,44 przy 19 df wynosi 0,025. Jest to poniżej naszego poziomu istotności 0,05, więc odrzucamy hipotezę zerową.

Czy w tym przykładzie wartość p (i może twój wniosek) nie zmieniłaby się w zależności od tego, jak oszacowałeś odchylenie standardowe próbki?

BYS2
źródło
2
To wydaje się dziwne z tego powodu, który podajesz. Być może mógłbyś również podać nam akapit na wypadek, gdyby czegoś nam brakowało? Jedną z rzeczy, która sprawia, że ​​odchylenie nie jest niczym wielkim, jest to, że staje się dość nieistotne, gdy wielkość próbki staje się większa i prawdopodobnie nie jest istotna w porównaniu do wszystkich innych problemów, np. Błędnej specyfikacji modelu, którą zwykle mamy - ale to nie jest powód podane w twoim źródle.
Peter Ellis,
1
@PeterEllis, tak naprawdę pochodzi ze strony wikipedii na temat „obiektywnej oceny odchylenia standardowego” ( en.wikipedia.org/wiki/Niezależna_estymacja_typu_deviation ).
BYS2

Odpowiedzi:

17

Zgadzam się w tej sprawie z Glen_b. Może mógłbym dodać kilka słów, aby wyjaśnić to jeszcze bardziej. Jeżeli dane pochodzą z rozkładu normalnego (sytuacja iid) o nieznanej wariancji, statystyka t jest kluczową wielkością wykorzystywaną do generowania przedziałów ufności i wykonywania testów hipotez. Jedyne, co ma znaczenie dla tego wnioskowania, to jego rozkład w ramach hipotezy zerowej (w celu ustalenia wartości krytycznej) i w ramach alternatywy (w celu określenia mocy i próbki). Są to odpowiednio środkowe i niecentralne rozkłady t. Teraz rozważając przez chwilę problem jednej próbki, test t ma nawet optymalne właściwości jako test dla średniej rozkładu normalnego. Teraz wariancja próbki jest obiektywnym estymatorem wariancji populacji, ale jej pierwiastek kwadratowy jest BIASED estymatorem odchylenia standardowego populacji. Nie robi nie ma znaczenia, że ​​estymator BIASED wchodzi w mianownik ilości zasadniczej. Teraz odgrywa pewną rolę, ponieważ jest spójnym estymatorem. To pozwala rozkładowi t zbliżyć się do standardowej normy, gdy wielkość próbki zbliża się do nieskończoności. Ale jest stronniczy w stosunku do każdego ustalonego nie wpływa na dobre właściwości testu.n

Moim zdaniem bezstronność jest nadmiernie podkreślana w klasach wprowadzających. Dokładność i spójność estymatorów to nieruchomości, które zasługują na podkreślenie.

W przypadku innych problemów, w których stosowane są metody parametryczne lub nieparametryczne, szacunkowe odchylenie standardowe nawet nie wchodzi w skład wzoru.

Michael R. Chernick
źródło
7
Zależy to od oszacowania, ale jest tylko jedno oszacowanie, do którego stosuje się t z 19 stopniami swobody, i to oszacowanie jest pierwiastkiem kwadratowym zwykłego oszacowania wariancji próbki. Jeśli użyjesz innego oszacowania odchylenia standardowego, masz inny rozkład odniesienia dla statystyki testowej pod hipotezą zerową. To nie jest t.
Michael R. Chernick
2
@ BYS2: Zauważ, że jeśli chodzi o interwał skonstruowany w podanym przez ciebie przykładzie, nic się nie zmienia, mnożąc standardowe odchylenie próbki przez współczynnik skali (np. Aby uczynić go bezstronnym). Rozkład statystyki badania zmieniłby (nieznacznie) w tym przypadku, ale CI skonstruowane by skończyć się dokładnie tak samo! Teraz, jeśli wykonałeś jakąś „korektę”, która zależała od samych danych, dałoby to coś innego (ogólnie). Zobacz mój komentarz pod odpowiedzią Glen.
kardynał
4
@ BYS2: W normalnym przypadku modelu wykorzystującym statystykę istnieje ładna zgodność między CI i wartością p . Zatem wartość p nie zmieni się, jeśli „przeskalujesz” przykładowe odchylenie standardowe o znaną stałą. Na przykład niech ~ T b = ( ˉ X - μ ) / ( b Ď ) = T / b na stałe b > 0 . Następnie P ( ˜ T b > u ) = P (tppT~b=(X¯μ)/(bσ^)=T/bb>0 a zatem wartość krytyczna ˜ t b , α = b t α , tj. Istnieje między nimi odpowiednik jeden do jednego. Czy to ma sens?
P(T~b>u)=P(T>bu)
t~b,α=btα
kardynał
1
Kardynał słusznie nie wskazuje, że można pomnożyć statystykę t przez stałą, aby zasadniczo użyć innego oszacowania odchylenia standardowego. Statystyka testowa nie ma już rozkładu t. Jest to nieco inny rozkład ze względu na stałą. Średnia zmienia się o współczynnik b, podobnie jak odchylenie standardowe. Kiedy zaczynasz obliczać wartość krytyczną statystyki testowej, zmienia się ona odpowiednio, jak pokazuje to powyżej.
Michael R. Chernick
1
@ BYS2 Tak, zgadza się.
Michael R. Chernick
5

Rozważmy przedział obliczony na podstawie liczby zasadniczej, takiej jak statystyka t. Średnia wartość estymatora odchylenia standardowego tak naprawdę do niego nie wchodzi - przedział opiera się na rozkładzie statystyki. Tak więc oświadczenie jest słuszne.

Glen_b - Przywróć Monikę
źródło
1
Tak, ale czy rozkład statystyki nie opiera się na jej standardowym odchyleniu, które w większości przypadków jest nieznane, więc musisz użyć estymatora?
BYS2
4
(+1) Glen. Do @ BYS2: Jest tu kilka kluczowych punktów. Po pierwsze, jeśli mamy pod ręką kluczową ilość, zapewnia to bardzo wygodny sposób konstruowania zbiorów pewności, ale często nie istnieją. Chodzi o to, że rozkład zależy wyłącznie od znanych wielkości. Po drugie, kluczowa ilość jest ściśle związana z modelem bazowym. Jeżeli dane odbiegają od założonego modelu, rozkład statystyki testowej może być równie dobrze, a jej charakterystyka jako wielkości kluczowej może nie być tak istotna. :)
kardynał
4

Interpretacja jest zawsze częścią spekulacji, ale myślę, że implikowane znaczenie polega na tym, że często można uzyskać pożądany wynik bez wyraźnego szacowania odchylenia standardowego. Innymi słowy, myślę, że autor odnosi się do sytuacji, w których chcesz używać żadnego oszacowanie odchylenia standardowego, a nie stronniczy oszacowania.

Na przykład, jeśli potrafisz skonstruować oszacowanie całego rozkładu statystyki, możesz obliczyć przedziały ufności bez użycia odchylenia standardowego. W rzeczywistości dla wielu (nienormalnych) rozkładów samo odchylenie standardowe (i średnia) nie jest wystarczające do obliczenia oszacowania przedziału ufności. W innych przypadkach, takich jak test znaku , nie potrzebujesz oszacowania odchylenia standardowego.

(Oczywiście nie jest trywialne konstruowanie obiektywnego oszacowania pełnego rozkładu, a w statystykach bayesowskich w rzeczywistości dość powszechne jest wprowadzanie uprzedzeń jawnie przez wcześniejsze.)

MLS
źródło
1
Interesujące może być nieco pełniejsze rozwinięcie tego, co miałeś na myśli w ostatnim akapicie. Na przykład, jeśli mogę próbkować z rozkładu danej statystyki, to empiryczny plik cdf zapewnia bardzo łatwy i prosty sposób generowania punktowej obiektywnej oceny funkcji rozkładu. :)
kardynał
1
@ cardinal Prawda, ale zakłada się, że można próbkować z rozkładu statystyki. Nie zawsze jest to możliwe. Weźmy na przykład statystykę . Okazuje się, że niemożliwe jest zbudowanie obiektywnego estymatora dla max i X imaxiXimaxiXiXi
1
XiimaxiXi
2
Jest to prawda i bliska punktu, który próbowałem wyciągnąć. Pierwsze zdanie ostatniego akapitu odnosi się do konstruowania obiektywnego oszacowania nieliniowej funkcji statystycznej z np. Pojedynczej próby losowej. Różni się to od konstruowania obiektywnego oszacowania pełnego rozkładu na podstawie losowej próbki samej funkcji. :-)
kardynał