Rozumiem, że test Walda dla współczynników regresji oparta jest na następujących nieruchomości, które posiada asymptotycznie (np Wasserman (2006): Wszystko statystyk , stron 153, 214-215): gdzieβoznacza oszacowany współczynnik regresji,^se(β)oznacza błąd standardowy współczynnik regresji iβ0jest wartością zainteresowania (β0zazwyczaj wynosi 0 aby sprawdzić, czy współczynnik różni się znacznie od 0). ZatemtestαWaldwielkości: odrzucajH0,gdy| W| >zα/
Ale kiedy wykonujesz regresję liniową zw lm
R, wartość zamiast wartości z jest używana do testowania, czy współczynniki regresji różnią się znacznie od 0 (z ). Co więcej, wynik w R czasami daje z - a czasami wartości t jako statystyki testowe. Najwyraźniej wartości z są używane, gdy zakłada się, że parametr dyspersji jest znany, a wartości t są używane, gdy szacowany jest parametr dyspersji (patrz ten link ).summary.lm
glm
Czy ktoś mógłby wyjaśnić, dlaczego rozkład jest czasem stosowany w teście Walda, mimo że zakłada się, że stosunek współczynnika do jego błędu standardowego rozkłada się jako standardowa normalna?
Edytuj po odpowiedzi na pytanie
Ten post zawiera również przydatne informacje do pytania.
źródło
lm
glm
Odpowiedzi:
glm
glm
źródło
Ogólnie rzecz biorąc, w strukturze GLM wspomniana statystyka testu W jest asymptotycznie rozkładem normalnym , dlatego widzisz w R wartości z .
Poza tym, gdy mamy do czynienia z modelem liniowym, czyli GLM z zmiennej Normal rozprowadzane odpowiedzi, rozkład statystyczny badania jest danej t Studenta , więc w R masz t wartości.
źródło