Załóżmy test t dla jednej próbki, w którym hipoteza zerowa wynosi . Statystyka wynosi wtedy używając przykładowego odchylenia standardowego. Przy szacowaniuporównuje się obserwacje ze średnią próbki:
.
Jeśli jednak założymy, że dane jest prawdziwe, można również oszacować odchylenie standardowe s ∗, stosując μ 0 zamiast średniej próbki ¯ x :
.
Dla mnie to podejście wygląda bardziej naturalnie, ponieważ w konsekwencji używamy hipotezy zerowej również do oszacowania SD. Czy ktoś wie, czy uzyskana statystyka jest używana w teście, czy wie, dlaczego nie?
Odpowiedzi:
Wystąpił problem z oryginalną symulacją w tym poście, który, mam nadzieję, został teraz naprawiony.
O ile szacunkowe odchylenie standardowe próbki rośnie wraz z licznikiem, gdy średnia odbiega od , okazuje się, że nie ma tak dużego wpływu na moc przy „typowych” poziomach istotności, ponieważ w średnich i dużych próbkach s ∗ / √μ0 wciąż jest wystarczająco duży, aby go odrzucić. W mniejszych próbkach może to jednak mieć pewien efekt, a przy bardzo małych poziomach istotności może to stać się bardzo ważne, ponieważ spowoduje górną granicę mocy, która będzie mniejsza niż 1.s∗/ n--√
Druga kwestia, być może ważniejsza na „wspólnych” poziomach istotności, wydaje się polegać na tym, że licznik i mianownik statystyki testowej nie są już niezależne od wartości zerowej (kwadrat jest skorelowany z oszacowaniem wariancji).x¯- μ
Oznacza to, że test nie ma już rozkładu t pod wartością zerową. To nie jest fatalna wada, ale oznacza to, że nie możesz po prostu używać tabel i uzyskać pożądanego poziomu istotności (jak zobaczymy za chwilę). Oznacza to, że test staje się konserwatywny, co wpływa na moc.
Gdy n staje się duże, zależność ta staje się mniejszym problemem (nie tylko dlatego, że można wywołać CLT dla licznika i użyć twierdzenia Slutsky'ego, aby powiedzieć, że istnieje asymptotyczny rozkład normalny dla zmodyfikowanej statystyki).
Oto krzywa mocy dla zwykłej dwóch próbek t (krzywa fioletowa, test dwustronny) i dla testu wykorzystującego wartość zerową w obliczeniach s (niebieskie kropki, uzyskane przez symulację i przy użyciu tabel t), jak średnia populacji odchodzi od wartości hipotetycznej, dla n = 10 :μ0 s n = 10
Widać, że krzywa mocy jest niższa (staje się znacznie gorsza przy mniejszych rozmiarach próby), ale znaczna część wydaje się wynikać z tego, że zależność między licznikiem a mianownikiem obniżyła poziom istotności. Jeśli odpowiednio dostosujesz wartości krytyczne, niewiele będzie między nimi nawet przy n = 10.
I znów krzywa mocy, ale teraz dlan = 30
Sugeruje to, że przy niemałych próbkach nie ma między nimi zbyt wiele, o ile nie trzeba używać bardzo małych poziomów istotności.
źródło
Gdy hipoteza zerowa jest prawdziwa, twoja statystyka powinna być podobna do zwykłej statystyki testu t (chociaż przy obliczaniu standardowego odchylenia prawdopodobnie powinieneś podzielić przez zamiast n -n n−1 μ0 .
Ale teraz zastanów się, co się stanie, gdy hipoteza zerowa nie będzie prawdziwa. Oznacza to, że przy obliczaniu błędu standardowego odejmujesz wartość, która nie jest prawdziwą średnią, lub szacunkową wartość prawdziwej średniej, w rzeczywistości możesz odejmować wartość, która nawet nie mieści się w zakresie wartości x. Dzięki temu odchylenie standardowe będzie większe (x¯ μ0
Tak więc, gdy wartość null jest prawdziwa, każda z tych dróg prawdopodobnie będzie działać, ale gdy wartość null jest fałszywa, użyjx¯ da lepszą moc (i prawdopodobnie także inne właściwości), więc jest to preferowane.
źródło