Jak mogę zinterpretować główne efekty (współczynniki dla fikcyjnego czynnika) w regresji Poissona?
Załóżmy następujący przykład:
treatment <- factor(rep(c(1, 2), c(43, 41)),
levels = c(1, 2),
labels = c("placebo", "treated"))
improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)),
levels = c(1, 2, 3),
labels = c("none", "some", "marked"))
numberofdrugs <- rpois(84, 10) + 1
healthvalue <- rpois(84, 5)
y <- data.frame(healthvalue, numberofdrugs, treatment, improved)
test <- glm(healthvalue~numberofdrugs+treatment+improved, y, family=poisson)
summary(test)
Dane wyjściowe to:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.88955 0.19243 9.819 <2e-16 ***
numberofdrugs -0.02303 0.01624 -1.418 0.156
treatmenttreated -0.01271 0.10861 -0.117 0.907 MAIN EFFECT
improvedsome -0.13541 0.14674 -0.923 0.356 MAIN EFFECT
improvedmarke -0.10839 0.12212 -0.888 0.375 MAIN EFFECT
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Wiem, że częstość incydentów numberofdrugs
wynosi exp(-0.023)=0.977
. Ale jak interpretować główne efekty dla zmiennych fikcyjnych?
r
generalized-linear-model
interpretation
poisson-distribution
regression-coefficients
gung - Przywróć Monikę
źródło
źródło
Odpowiedzi:
numberofdrugs
Współczynnik wykładniczy to multiplikatywny termin używany do obliczania szacunku,healthvalue
gdynumberofdrugs
wzrasta o 1 jednostkę. W przypadku zmiennych kategorialnych (czynnikowych) współczynnik wykładniczy jest multiplikatywnym terminem w stosunku do poziomu podstawowego (pierwszego czynnika) dla tej zmiennej (ponieważ R domyślnie stosuje kontrasty leczenia). Jestexp(Intercept)
to stopa bazowa, a wszystkie inne szacunki byłyby do niej względne.W twoim przykładzie oszacowano
healthvalue
dla kogoś z2
narkotykami,"placebo"
iimprovement=="none"
byłoby (używając dodawania wewnątrz exp jako ekwiwalentu mnożenia):Podczas gdy ktoś na
4
leki,"treated"
oraz"some"
poprawa miałaby szacunkowohealthvalue
odDODATEK: To znaczy „być addytywnym w skali logu”. „Dodatek w skali logarytmicznej szansy” to zwrot, którego moja nauczycielka Barbara McKnight użyła, podkreślając potrzebę stosowania wszystkich współczynników terminów stosowanych w regresji logistycznej podczas prognozowania. Najpierw dodajesz wszystkie współczynniki razy zmienne towarzyszące, a następnie potęgujesz. Sposobem na zwrócenie współczynników z obiektów regresji w R jest na ogół użycie
coef()
funkcji ekstraktora (wykonanej z inną losową realizacją poniżej):Tak więc obliczenie szacunku dla pacjenta z
4
narkotykami"treated"
, z"some"
poprawą, byłoby:A predyktorem liniowym dla tego przypadku powinna być suma:
Zasady te powinny mieć zastosowanie do każdego pakietu statystyk, który zwraca użytkownikowi tabelę współczynników. Metoda i zasady są bardziej ogólne, niż mogłoby się wydawać na podstawie mojego użycia R.
Kopiuję wybrane komentarze wyjaśniające, ponieważ „znikają” w domyślnym ekranie:
Odp .: Współczynniki są logarytmami naturalnymi stosunków. - DWin
A2: Nie. Gdyby to była regresja logistyczna, byliby, gdyby nie regresja Poissona, gdzie LHS jest liczbą zdarzeń, a domniemany mianownik to liczba ryzyka, wówczas współczynniki wykładnicze to „współczynniki częstości” lub „ryzyko względne”.
źródło