Czy test t i jednokierunkowa ANOVA są testami Walda?

11

Test t do testowania, czy średnia normalnie rozłożonej próbki jest równa stałej, jest testem Walda, poprzez oszacowanie standardowego odchylenia średniej próbki na podstawie informacji Fishera o rozkładzie normalnym w średniej próbki. Ale statystyka testu w teście t ma rozkład t-studenta, podczas gdy test staistyczny w teście Walda asymptotycznie ma rozkład chi-kwadrat. Zastanawiam się, jak to wyjaśnić?

W jednostronnej ANOVA statystykę testową definiuje się jako stosunek wariancji między klasami do wariancji wewnątrz klasy. Zastanawiałem się, czy to także test Walda? Ale statystyka testowa w jednostronnej ANOVA ma rozkład F, a statystyka testowa w teście Walda asymptotycznie ma rozkład chi-kwadrat. Zastanawiam się, jak to wyjaśnić?

Dziękuję i pozdrawiam!

Tim
źródło

Odpowiedzi:

17

Rozważ następującą konfigurację. Mamy -wymiarowy wektor parametrów który całkowicie określa model, i estymator maksymalnego prawdopodobieństwa . Informacja Fishera w jest oznaczona . Co jest zwykle określany jako statystyka Wald jestθ θ θ I ( θ )pθθ^θja(θ)

(θ^-θ)T.ja(θ^)(θ^-θ)

gdzie jest informacją Fishera ocenianą w estymatorze największego prawdopodobieństwa. W warunkach prawidłowości statystyka Walda podąża asymptotycznie a -dystrybucja z stopniami swobody, gdy jest prawdziwym parametrem. Statystyka Walda może być wykorzystana do przetestowania prostej hipotezy na całym wektorze parametrów.χ 2 P θ H 0 : θ = θ 0ja(θ^)χ2)pθH.0:θ=θ0

Przy odwrotna informacja Fishera, statystyka testowa Walda hipotezy to Jego asymptotyczny rozkład jest rozkładem z 1 stopniem swobody. H 0 : θ 1 = θ 0 , 1 ( θ 1 - θ 0 , 1 ), 2Σ(θ)=ja(θ)-1H.0:θ1=θ0,1χ2

(θ^1-θ0,1)2)Σ(θ^)jaja.
χ2)

W przypadku normalnego modelu, w którym jest wektorem parametrów średniej i wariancji, statystyka testu Walda, jeśli wynosi z wielkością próbki. Tutaj jest estymatorem największego prawdopodobieństwa (gdzie dzielisz przez ). -test parametrem jest , gdzie jest Nienaprężone estymatorem wariancji (gdzie dzielenia przez ) . Statystyka testu Walda jest prawie, ale nie dokładnie, równa kwadratowiμ = μ 0 n ( μ - μ 0 ) 2θ=(μ,σ2))μ=μ0

n(μ^-μ0)2)σ^2)
nσ^2)σ2)nt
n(μ^-μ0)s
s2)n-1t-test statystyki, ale są asymptotycznie równoważne, gdy . Kwadratowa statystyka -test ma dokładną dystrybucję , która jest zbieżna z z 1 stopniem swobody dla .ntfa(1,n-1)χ2)n

Ta sama historia dotyczy testu w jednostronnej ANOVA.fa

NRH
źródło
Dzięki! Właśnie odkryłem, że statystyka testu t jest konstruowana bezpośrednio na podstawie statystyki testu prawdopodobieństwa, a nie na statystyce testu Walda. Czy jednokierunkowa ANOVA opiera się bezpośrednio na teście współczynnika wiarygodności?
Tim
3
@Tim, testy stosowane w ANOVA są równoważne testom współczynnika wiarygodności opartym na normalnym rozkładzie błędów. fa
NRH
Dzięki! W ramach normalnego modelu statystycznego niektórzy twierdzą również, że rozkład niewielkiej modyfikacji statystyki testu Walda ma rozkład F poniżej zera. Czy to prawda? Zadaję pytanie tutaj
Tim
13

@NRH dał dobrą odpowiedź teoretyczną, oto ta, która ma być prostsza, bardziej intuicyjna.

Istnieje formalny test Walda (opisany w odpowiedzi NRH), ale odnosimy się również do testów, które sprawdzają różnicę między oszacowanym parametrem a jego hipotetyczną wartością w stosunku do wariancji oszacowanej przy szacowanym parametrze jako test w stylu Walda. Test t, jak zwykle go używamy, jest testem stylu Wald, nawet jeśli różni się nieco od dokładnego testu Walda (różnica vs.nn-1wewnątrz pierwiastka kwadratowego). Moglibyśmy nawet zaprojektować test stylu Wald na podstawie szacunkowej mediany pomniejszonej o hipotetyczną medianę podzieloną przez funkcję IQR, ale nie wiem, jaki byłby rozkład, lepiej byłoby użyć ładowania początkowego, permutacji lub symulacji rozkład dla tego testu, a nie zależny od asymptotyków chi-kwadrat. Test F dla ANOVA pasuje również do ogólnego wzorca, licznik można uznać za pomiar różnicy średnich od ogólnej średniej, a mianownik jest miarą zmienności.

Należy również zauważyć, że jeśli kwadratowa zmienna losowa, która następuje po rozkładzie, będzie miała rozkład F o wartości 1 df dla licznika, a mianownik df będzie równy rozkładowi t. Zauważ też, że rozkład F o nieskończonym mianowniku df jest rozkładem chi-kwadrat. Oznacza to, że zarówno statystyka t (kwadrat), jak i statystyka F są asymptotycznie chi-kwadrat, podobnie jak statystyka Walda. Po prostu używamy dokładniejszego rozkładu w praktyce.

Greg Snow
źródło