Test Walda w regresji (OLS i GLM): rozkład t- vs.

22

Rozumiem, że test Walda dla współczynników regresji oparta jest na następujących nieruchomości, które posiada asymptotycznie (np Wasserman (2006): Wszystko statystyk , stron 153, 214-215): gdzieβoznacza oszacowany współczynnik regresji,^se(β)oznacza błąd standardowy współczynnik regresji iβ0jest wartością zainteresowania (β0zazwyczaj wynosi 0 aby sprawdzić, czy współczynnik różni się znacznie od 0). ZatemtestαWaldwielkości: odrzucajH0,gdy| W| >zα/

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0 gdzie W=|W|>zα/2
W=β^se^(β^).

Ale kiedy wykonujesz regresję liniową zw lmR, wartość zamiast wartości z jest używana do testowania, czy współczynniki regresji różnią się znacznie od 0 (z ). Co więcej, wynik w R czasami daje z - a czasami wartości t jako statystyki testowe. Najwyraźniej wartości z są używane, gdy zakłada się, że parametr dyspersji jest znany, a wartości t są używane, gdy szacowany jest parametr dyspersji (patrz ten link ).tzsummary.lmglmztzt

Czy ktoś mógłby wyjaśnić, dlaczego rozkład jest czasem stosowany w teście Walda, mimo że zakłada się, że stosunek współczynnika do jego błędu standardowego rozkłada się jako standardowa normalna?t

Edytuj po odpowiedzi na pytanie

Ten post zawiera również przydatne informacje do pytania.

COOLSerdash
źródło
2
Co sprawia, że ​​myślisz, że raportowana statystyka testu jest koniecznie testem Walda?
Glen_b
3
Ponieważ wartości lub t są zawsze współczynnikiem podzielonym przez błąd standardowy w i . ztlmglm
COOLSerdash

Odpowiedzi:

20

glmzλglmt rozkład .

tz zamiast tego statystyki test.

t

wcampbell
źródło
3

Ogólnie rzecz biorąc, w strukturze GLM wspomniana statystyka testu W jest asymptotycznie rozkładem normalnym , dlatego widzisz w R wartości z .

Poza tym, gdy mamy do czynienia z modelem liniowym, czyli GLM z zmiennej Normal rozprowadzane odpowiedzi, rozkład statystyczny badania jest danej t Studenta , więc w R masz t wartości.

EdoLu
źródło