Co się stanie w teście t dla jednej próbki, jeśli w estymatorze wariancji średnia próbki zostanie zastąpiona przez

10

Załóżmy test t dla jednej próbki, w którym hipoteza zerowa wynosi μ=μ0 . Statystyka wynosi wtedy t=x¯-μ0s/n używając przykładowego odchylenia standardowegos. Przy szacowaniusporównuje się obserwacje ze średnią próbkix¯:

.s=1n-1ja=1n(xja-x¯)2)

Jeśli jednak założymy, że dane jest prawdziwe, można również oszacować odchylenie standardowe s ∗, stosując μ 0 zamiast średniej próbki ¯ x :μ0sμ0x¯

.s=1n-1ja=1n(xja-μ0)2)

Dla mnie to podejście wygląda bardziej naturalnie, ponieważ w konsekwencji używamy hipotezy zerowej również do oszacowania SD. Czy ktoś wie, czy uzyskana statystyka jest używana w teście, czy wie, dlaczego nie?

Michał
źródło
Kontynuuję to pytanie, ponieważ miałem je opublikować, a SE ostrzegła mnie. Zastanawiałem się, czy istnieją dokumenty referencyjne dotyczące tego pytania. Intuicyjnie, byłby zdecydowanie lepszym oszacowaniemσ2, a rozkład ˉ x -μs2)=1n(xja-μ0)2)σ2) można wyprowadzić (prawdopodobnie nie Student). Wszelkie referencje będą mile widziane! x¯-μ0s/n
AG

Odpowiedzi:

6

Wystąpił problem z oryginalną symulacją w tym poście, który, mam nadzieję, został teraz naprawiony.

O ile szacunkowe odchylenie standardowe próbki rośnie wraz z licznikiem, gdy średnia odbiega od , okazuje się, że nie ma tak dużego wpływu na moc przy „typowych” poziomach istotności, ponieważ w średnich i dużych próbkach s / μ0 wciąż jest wystarczająco duży, aby go odrzucić. W mniejszych próbkach może to jednak mieć pewien efekt, a przy bardzo małych poziomach istotności może to stać się bardzo ważne, ponieważ spowoduje górną granicę mocy, która będzie mniejsza niż 1.s/n

Druga kwestia, być może ważniejsza na „wspólnych” poziomach istotności, wydaje się polegać na tym, że licznik i mianownik statystyki testowej nie są już niezależne od wartości zerowej (kwadrat jest skorelowany z oszacowaniem wariancji).x¯-μ

Oznacza to, że test nie ma już rozkładu t pod wartością zerową. To nie jest fatalna wada, ale oznacza to, że nie możesz po prostu używać tabel i uzyskać pożądanego poziomu istotności (jak zobaczymy za chwilę). Oznacza to, że test staje się konserwatywny, co wpływa na moc.

Gdy n staje się duże, zależność ta staje się mniejszym problemem (nie tylko dlatego, że można wywołać CLT dla licznika i użyć twierdzenia Slutsky'ego, aby powiedzieć, że istnieje asymptotyczny rozkład normalny dla zmodyfikowanej statystyki).

Oto krzywa mocy dla zwykłej dwóch próbek t (krzywa fioletowa, test dwustronny) i dla testu wykorzystującego wartość zerową w obliczeniach s (niebieskie kropki, uzyskane przez symulację i przy użyciu tabel t), jak średnia populacji odchodzi od wartości hipotetycznej, dla n = 10 :μ0sn=10

n = 10

wprowadź opis zdjęcia tutaj

Widać, że krzywa mocy jest niższa (staje się znacznie gorsza przy mniejszych rozmiarach próby), ale znaczna część wydaje się wynikać z tego, że zależność między licznikiem a mianownikiem obniżyła poziom istotności. Jeśli odpowiednio dostosujesz wartości krytyczne, niewiele będzie między nimi nawet przy n = 10.

I znów krzywa mocy, ale teraz dla n=30

n = 30

wprowadź opis zdjęcia tutaj

Sugeruje to, że przy niemałych próbkach nie ma między nimi zbyt wiele, o ile nie trzeba używać bardzo małych poziomów istotności.

Glen_b - Przywróć Monikę
źródło
9

Gdy hipoteza zerowa jest prawdziwa, twoja statystyka powinna być podobna do zwykłej statystyki testu t (chociaż przy obliczaniu standardowego odchylenia prawdopodobnie powinieneś podzielić przez zamiast n -nn1μ0 .

Ale teraz zastanów się, co się stanie, gdy hipoteza zerowa nie będzie prawdziwa. Oznacza to, że przy obliczaniu błędu standardowego odejmujesz wartość, która nie jest prawdziwą średnią, lub szacunkową wartość prawdziwej średniej, w rzeczywistości możesz odejmować wartość, która nawet nie mieści się w zakresie wartości x. Dzięki temu odchylenie standardowe będzie większe ( x¯μ0

Tak więc, gdy wartość null jest prawdziwa, każda z tych dróg prawdopodobnie będzie działać, ale gdy wartość null jest fałszywa, użyj x¯ da lepszą moc (i prawdopodobnie także inne właściwości), więc jest to preferowane.

Greg Snow
źródło