Mam pytanie dotyczące interpretacji parametrów dla GLM ze zmienną zależną od rozkładu gamma. Oto, co R zwraca dla mojego GLM z log-link:
Call:
glm(formula = income ~ height + age + educat + married + sex + language + highschool,
family = Gamma(link = log), data = fakesoep)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.47399 -0.31490 -0.05961 0.18374 1.94176
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.2202325 0.2182771 28.497 < 2e-16 ***
height 0.0082530 0.0011930 6.918 5.58e-12 ***
age 0.0001786 0.0009345 0.191 0.848
educat 0.0119425 0.0009816 12.166 < 2e-16 ***
married -0.0178813 0.0173453 -1.031 0.303
sex -0.3179608 0.0216168 -14.709 < 2e-16 ***
language 0.0050755 0.0279452 0.182 0.856
highschool 0.3466434 0.0167621 20.680 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Gamma family taken to be 0.1747557)
Null deviance: 757.46 on 2999 degrees of freedom
Residual deviance: 502.50 on 2992 degrees of freedom
AIC: 49184
Jak interpretować parametry? Jeśli obliczę exp(coef())
mój model, otrzymam ~ 500 za przechwycenie. Teraz uważam, że nie oznacza to oczekiwanego dochodu, jeśli wszystkie inne zmienne są utrzymywane na stałym poziomie, prawda? Ponieważ średnia lub mean(age)
wynosi ~ 2000. Ponadto nie mam pojęcia, jak interpretować kierunek i wartość współczynników współzmiennych.
r
generalized-linear-model
interpretation
gamma-distribution
gung - Przywróć Monikę
źródło
źródło
Odpowiedzi:
Logmana powiązanej specyfikacji gamma GLM jest identyczna z regresją wykładniczą:
Trzecią metodą jest potęgowanie współczynników. Uwaga:
źródło
Najpierw przyjrzę się resztkom, aby zobaczyć, jak dobrze pasuje model. Jeśli wszystko jest w porządku, spróbowałbym użyć innych funkcji łącza, chyba że miałbym powód, by sądzić, że tak naprawdę pochodzi z rozkładu gamma. Jeśli gamma nadal wyglądałaby przekonująco, doszłbym do wniosku, że statystycznie znaczącymi terminami są punkt przecięcia, wzrost, wykształcenie, płeć i szkoła średnia (te oznaczone trzema gwiazdkami). Między sobą nie można powiedzieć więcej, jeśli nie są znormalizowane (mają ten sam zakres).
Odpowiedź na komentarz: Teraz lepiej rozumiem twoje pytanie. Absolutnie możesz to zrobić! Wzrost jednostki o wysokość powoduje exp (0,0082530) -1 ~ = 0,0082530 (używając przybliżenia exp x = 1 + x dla małej x) względnej zmiany dochodu. Bardzo łatwa do interpretacji, nie?
źródło