Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.7422 -1.0257 0.0027 0.7169 3.5347
Coefficients:
Estimate Std.Error z value Pr(>|z|)
(Intercept) 3.144257 0.218646 14.381 < 2e-16 ***
riverWatauga -0.049016 0.051548 -0.951 0.34166
pH 0.086460 0.029821 2.899 0.00374 **
temp -0.059667 0.009149 -6.522 6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21
Chcę wiedzieć, jak interpretować oszacowanie każdego parametru w powyższej tabeli.
Odpowiedzi:
Nie sądzę, aby tytuł twojego pytania dokładnie oddawał to, o co prosisz.
Pytanie, jak interpretować parametry w GLM, jest bardzo szerokie, ponieważ GLM jest bardzo szeroką klasą modeli. Przypomnijmy, że GLM modeluje zmienną odpowiedzi która zakłada się, że podąża za znanym rozkładem z rodziny wykładniczej i że wybraliśmy funkcję odwracalną g taką, że E [ yy sol
dla J zmiennych predykcyjnych x . W tym modelu, interpretację żadnego konkretnego parametru p j jest szybkość zmiany g ( y ) względem x j . Zdefiniuj μ ≡ E [ y
co w końcu oznacza coś namacalnego:
Należy tu zwrócić uwagę na trzy ważne elementy:
źródło
Moją sugestią byłoby utworzenie małej siatki składającej się z kombinacji dwóch rzek i dwóch lub trzech wartości każdej z zmiennych towarzyszących, a następnie użycie tej
predict
funkcji z siatką jakonewdata
. Następnie wykreślić wyniki. O wiele łatwiej jest spojrzeć na wartości, które model faktycznie przewiduje. Możesz, ale nie chcesz, przekształcić prognozy do pierwotnej skali pomiaru (type = "response"
).źródło