Jak interpretować wariancję efektu losowego w uogólnionym liniowym modelu mieszanym

9

W logistycznym uogólnionym liniowym modelu mieszanym (rodzina = dwumianowy) nie wiem, jak interpretować wariancję efektów losowych:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Jak interpretować ten wynik liczbowy?

Mam próbkę pacjentów po transplantacji nerki w wieloośrodkowym badaniu. Testowałem, czy prawdopodobieństwo leczenia konkretnego leczenia przeciwnadciśnieniowego u pacjenta jest takie samo w ośrodkach. Odsetek leczonych pacjentów różni się znacznie między ośrodkami, ale może wynikać z różnic w podstawowych cechach pacjentów. Oszacowałem więc uogólniony liniowy model mieszany (logistyczny), dostosowując się do głównych cech patiens. Oto wyniki:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Zmienne ilościowe są wyśrodkowane. Wiem, że odchylenie standardowe między szpitalem przechwytywania wynosi 0,6554, w skali logarytmicznej. Ponieważ punkt przecięcia wynosi -1,804469, w skali logarytmicznej, prawdopodobieństwo leczenia przeciwnadciśnieniowego mężczyzny w średnim wieku, ze średnią wartością we wszystkich zmiennych i leczeniem inmuno A, dla „przeciętnego” centrum wynosi 14,1% . A teraz zaczyna się interpretacja: przy założeniu, że efekty losowe mają rozkład normalny, spodziewalibyśmy się, że około 95% centrów będzie miało wartość w granicach 2 odchyleń standardowych od średniej zero, więc prawdopodobieństwo leczenia dla przeciętnego człowieka będzie się różnić w zależności od ośrodka, a zakres zasięgu wynosi:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Czy to jest poprawne?

Ponadto, jak mogę przetestować w glmer, jeśli zmienność między centrami jest statystycznie znacząca? Kiedyś pracowałem z MIXNO, doskonałym oprogramowaniem Donalda Hedekera, i tam mam standardowy błąd oszacowania wariancji, którego nie mam w blasku. W jaki sposób mogę leczyć „przeciętnego” mężczyznę w każdym ośrodku z przedziałem ufidenu?

Dzięki

użytkownik2310909
źródło

Odpowiedzi:

10

Prawdopodobnie jest to najbardziej pomocne, jeśli pokażesz nam więcej informacji o swoim modelu, ale: wartość wyjściowa logarytmicznych szans na odpowiedź (np. Śmiertelność) jest różna w różnych szpitalach. Wartość wyjściowa (termin przechwytywania w jednym szpitalu) to logarytmiczna śmiertelność (lub cokolwiek) w kategorii wyjściowej (np. „Nieleczona”), przy zerowej wartości dowolnych predyktorów ciągłych. Zakłada się, że ta odmiana jest rozkładem normalnym, w skali logarytmicznej. Odchylenie standardowe między szpitalem przechwytywania wynosi 0,6554; wariancja (tylko kwadrat odchylenie standardowe do kwadratu - nie miara niepewności odchylenia standardowego) wynosi .0.65542=0.4295

(Jeśli wyjaśnisz swoje pytanie / dodasz więcej szczegółów na temat twojego modelu, mogę spróbować powiedzieć więcej).

aktualizacja : Twoja interpretacja zmiany wydaje się poprawna. Dokładniej,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

powinien dać ci przedział 95% (niezupełnie przedziały ufności, ale bardzo podobne) dla prawdopodobieństwa odniesienia leczenia (mężczyzna / średni wiek / itd.) w szpitalach.

Aby przetestować znaczenie losowego efektu, masz wiele możliwości wyboru ( więcej informacji można znaleźć na stronie http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html ). (Należy zauważyć, że błąd standardowy wariancji RE zwykle nie jest wiarygodnym sposobem testowania istotności, ponieważ rozkład próbkowania jest często wypaczony / nienormalny.) Najprostszym podejściem jest wykonanie testu współczynnika wiarygodności, np.

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

Ostateczny podział przez 2 poprawia fakt, że test współczynnika prawdopodobieństwa jest zachowawczy, gdy wartość zerowa (tj. Wariancja RE = 0) znajduje się na granicy możliwej przestrzeni (tzn. Wariancja RE nie może wynosić <0).

Ben Bolker
źródło
Zredagowałem pytanie
użytkownik2310909,
1
Dzięki, z przyjemnością czytam komuś, kto dobrze zna ten temat.
user2310909