O ile rozumiem test Walda w kontekście regresji logistycznej służy do ustalenia, czy określona zmienna predykcyjna jest znacząca, czy nie. Odrzuca hipotezę zerową odpowiadającego współczynnikowi równego zero.
Test polega na podzieleniu wartości współczynnika przez błąd standardowy .
Mylę się, że jest również znany jako Z-score i wskazuje, jak prawdopodobne jest, że dana obserwacja pochodzi z rozkładu normalnego (ze średnią zero).
logistic
z-statistic
użytkownik695652
źródło
źródło
Odpowiedzi:
Oszacowania współczynników i przechwytywania w regresji logistycznej (i dowolnym GLM) można znaleźć poprzez oszacowanie największej wiarygodności (MLE). Szacunki te są oznaczane w kapeluszu nad parametrami, coś θ . Nasz parametr będący przedmiotem zainteresowania jest oznaczony θ 0 i zwykle jest to 0, ponieważ chcemy sprawdzić, czy współczynnik różni się od 0, czy nie. Od asymptotycznej teorii MLE, wiemy, że różnica między θ i θ 0 będzie w przybliżeniu rozkład normalny ze średnią 0 (szczegóły można znaleźć w każdej książce statystyki matematycznej, takich jak Larry Wasserman na wszystkich statystyk ). Przypomnij sobie, że standardowe błędy to nic innego jakθ^ θ0 θ^ θ0 standardowe odchylenia statystyczne (Sokal i Rohlf piszą w swojej książce Biometry : „ statystyka to dowolna z wielu obliczonych lub oszacowanych wielkości statystycznych”, np. średnia, mediana, odchylenie standardowe, współczynnik korelacji, współczynnik regresji, ...). Dzielenie rozkładu normalnego ze średnią 0 i odchyleniem standardowym przez jego odchylenie standardowe da standardowy rozkład normalny ze średnią 0 i odchyleniem standardowym 1. Statystyka Walda jest zdefiniowana jako (np. Wasserman (2006): All of Statistics , strony 153, 214 -215):
W = ( β - β 0 )σ
lub
W2=(β-β0)2
R
, spójrz na te dwa przykłady:Regresja logistyczna
Normalna regresja liniowa (OLS)
Kolejny powiązany post można znaleźć tutaj .
źródło