Jak interpretować oszacowania parametrów w wynikach Poissona GLM [zamknięte]

14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

Chcę wiedzieć, jak interpretować oszacowanie każdego parametru w powyższej tabeli.

tomjerry001
źródło
Interpretacja jest identyczna: stats.stackexchange.com/a/126225/7071
Dimitriy V.
6
To pytanie wydaje się być nie na temat, ponieważ dotyczy wyjaśnienia wyniku R bez jakiejkolwiek formy inteligentnego pytania. To jest kategoria „Zrzucam tam dane wyjściowe z komputera, a ty przeprowadzasz dla mnie analizę statystyk” ...
Xi'an,
1
Wydaje się, że parametr dyspersji wskazuje na pewne problemy z modelem. Być może powinieneś rozważyć użycie zamiast tego quasipoissona. Założę się, że twoje oszacowania parametrów drastycznie się zmienią, podobnie jak interpretacja. Jeśli uruchomisz „wykres (model)”, dostaniesz kilka wykresów swoich pozostałości, spójrz na te wykresy w poszukiwaniu niepożądanych wzorów, zanim zaczniesz interpretować swój rzeczywisty model. Aby szybko wykreślić dopasowanie modelu, możesz także użyć „visreg (modelfit)” z pakietu visreg
Robbie,
3
@ Xi'an, chociaż pytanie jest rzadkie i wymagało edycji, nie sądzę, aby było nie na temat. Zastanów się nad tymi pytaniami, które nie są uważane za nie na temat: Interpretacja wyniku lm () R i Interpretacja wyniku R dla regresji dwumianowej . Wygląda jednak na duplikat .
gung - Przywróć Monikę
2
Jest to duplikat Jak interpretować współczynniki w regresji Poissona? Przeczytaj połączony wątek. Jeśli po przeczytaniu nadal masz pytanie, wróć tutaj i edytuj swoje pytanie, aby powiedzieć, czego się nauczyłeś i co musisz wiedzieć, możemy dostarczyć potrzebnych informacji bez kopiowania materiałów w innym miejscu, które już nie pomogły ty.
gung - Przywróć Monikę

Odpowiedzi:

28

Nie sądzę, aby tytuł twojego pytania dokładnie oddawał to, o co prosisz.

Pytanie, jak interpretować parametry w GLM, jest bardzo szerokie, ponieważ GLM jest bardzo szeroką klasą modeli. Przypomnijmy, że GLM modeluje zmienną odpowiedzi która zakłada się, że podąża za znanym rozkładem z rodziny wykładniczej i że wybraliśmy funkcję odwracalną g taką, że E [ yyg dla J zmiennych predykcyjnych x . W tym modelu, interpretację żadnego konkretnego parametru p j jest szybkość zmiany g ( y ) względem x j . Zdefiniuj μ E [ y

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xj iηxβ,aby utrzymać czystość zapisu. Następnie dla dowolnegoj{1,,J}, β j =μE[y|x]=g1(x)ηxβj{1,,J} Teraz określenieejbyć wektoraJ-1zera i pojedynczy1doj-tego położenia tak, że na przykład w przypadkuJ=5, a następniee3=(0,0,1,0,0). Następnie βj=g(E [ y
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

βjηxj

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

gβjηyxjyxjg1(β)


yPoisson(λ)g=ln

μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

co w końcu oznacza coś namacalnego:

xjy^y^βj

Uwaga: to przybliżenie może faktycznie działać dla zmian tak dużych jak 0,2, w zależności od wymaganej precyzji.

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

xjy^y^(ejβ1)

Należy tu zwrócić uwagę na trzy ważne elementy:

  1. Efekt zmiany predyktorów zależy od poziomu odpowiedzi.
  2. Addytywna zmiana predyktorów ma multiplikatywny wpływ na odpowiedź.
  3. Nie możesz zinterpretować współczynników po prostu przez ich odczytanie (chyba że możesz obliczyć dowolne wykładnicze w twojej głowie).

lny^y^(e0.091) y^e0.091.09

Shadowtalker
źródło
Dokonałem tutaj kilku poprawek, @ssdecontrol. Myślę, że ułatwią śledzenie twojego posta, ale jeśli ci się nie podoba, cofnij je z moimi przeprosinami.
gung - Przywróć Monikę
Nie potrafię tego rozgryźć na podstawie mojej odpowiedzi, więc oczywiście muszę zmienić odpowiedź. Nadal jesteś zdezorientowany?
shadowtalker,
Podłącz te liczby do równania, tak jak w regresji liniowej
shadowtalker
1
E[y|x]xyxjxj
2
I nie przemyśl tego. Kiedy zrozumiesz wszystkie elementy w GLM, manipulacje tutaj są tylko bezpośrednim zastosowaniem zasad rachunku różniczkowego. To naprawdę jest tak proste, jak pobranie pochodnej w odniesieniu do zmiennej, którą jesteś zainteresowany.
shadowtalker
3

Moją sugestią byłoby utworzenie małej siatki składającej się z kombinacji dwóch rzek i dwóch lub trzech wartości każdej z zmiennych towarzyszących, a następnie użycie tej predictfunkcji z siatką jako newdata. Następnie wykreślić wyniki. O wiele łatwiej jest spojrzeć na wartości, które model faktycznie przewiduje. Możesz, ale nie chcesz, przekształcić prognozy do pierwotnej skali pomiaru ( type = "response").

Russ Lenth
źródło
1
Chociaż bardzo podoba mi się to podejście (robię to cały czas), myślę, że jest to bezproduktywne dla budowania zrozumienia.
shadowtalker,