Jaka jest różnica między uogólnionymi równaniami szacunkowymi a GLMM?

27

Korzystam z GEE na 3-poziomowych niezrównoważonych danych, używając łącza logit. Czym to się różni (pod względem wniosków, które mogę wyciągnąć i znaczenia współczynników) od GLM z efektami mieszanymi (GLMM) i linkiem logit?

Więcej szczegółów: Obserwacje są pojedynczymi próbami bernoulli. Są one pogrupowane w klasy i szkoły. Za pomocą R. Przypadkowe pominięcie NA. 6 predyktorów również warunki interakcji.

(Nie rzucam dzieci, żeby sprawdzić, czy wylądują jeden na jednego).

Jestem skłonny potęgować współczynniki do ilorazów szans. Czy to ma takie samo znaczenie w obu przypadkach?

Coś czai się w moich myślach o „marginalnych środkach” w modelach GEE. Potrzebuję tego wyjaśnienia.

Dzięki.

rosser
źródło

Odpowiedzi:

44

Pod względem interpretacji współczynników występuje różnica w przypadku binarnym (między innymi). To, co różni się między GEE i GLMM, to cel wnioskowania: średnia dla populacji lub specyficzna dla przedmiotu .

Rozważmy prosty, wymyślony przykład związany z twoim. Chcesz modelować wskaźnik niepowodzenia wśród chłopców i dziewcząt w szkole. Podobnie jak w przypadku większości (podstawowych) szkół, populacja uczniów jest podzielona na klasy. Zachowujecie binarną odpowiedź z dzieci w klasach (tj Odpowiedzi binarne skupione przez klasie), gdzie , jeżeli uczeń od klasie przeszły i jeśli on / ona zawiodła. I jeśli uczeń z klasy jest mężczyzną, a 0 w przeciwnym razie.n i N N i = 1 n i Y i j = 1 j i Y i j = 0 x i j = 1 j iYnjaN.ja=1N.njaYjajot=1jotjaYjajot=0xjajot=1jotja

Aby wprowadzić terminologię, której użyłem w pierwszym akapicie, możesz myśleć o szkole jako o populacji, a klasach o przedmiotach .

Najpierw rozważ GLMM. GLMM dopasowuje model z efektami mieszanymi. Warunki modelu na ustalonej macierzy projektowej (która w tym przypadku składa się z punktu przecięcia i wskaźnika płci) oraz wszelkie przypadkowe efekty w klasach, które uwzględniamy w modelu. W naszym przykładzie uwzględnijmy losowe przechwytywanie, , które weźmie pod uwagę podstawowe różnice w odsetku niepowodzeń w klasach. Więc modelujemybja

log(P.(Yjajot=1)P.(Yjajot=0)xjajot,bja)=β0+β1xjajot+bja

Iloraz szans ryzyka niepowodzenia w powyższym modelu różni się w zależności od wartości która jest różna w klasach. Tak więc szacunki są specyficzne dla przedmiotu .bja

Z drugiej strony GEE pasuje do modelu marginalnego. Te modelowe średnie populacyjne . Modelujesz oczekiwanie tylko na stałej matrycy projektowej.

log(P.(Yjajot=1)P.(Yjajot=0)xjajot)=β0+β1xjajot

Jest to sprzeczne z modelami efektów mieszanych, jak wyjaśniono powyżej, które warunki zarówno na ustalonej macierzy projektowej, jak i efektach losowych. Tak więc w powyższym marginalnym modelu mówisz: „zapomnij o różnicy między salami lekcyjnymi, chcę tylko, aby wskaźnik populacji (w szkole) był niepowodzeniem i jego związek z płcią”. Pasujesz do modelu i otrzymujesz iloraz szans, który jest ilorazem prawdopodobieństwa niepowodzenia dla populacji związanym z płcią.

Może się więc okazać, że twoje szacunki z modelu GEE mogą różnić się od twojego modelu GLMM, a to dlatego, że nie szacują tego samego.

(Jeśli chodzi o konwersję logarytmicznego ilorazu szans do ilorazu szans przez wykładniczość, tak, robisz to niezależnie od tego, czy jest to oszacowanie na poziomie populacji, czy dla konkretnego przedmiotu)

Niektóre uwagi / literatura:

W przypadku liniowym szacunki dla populacji i dla poszczególnych osób są takie same.

Zeger, i in. 1988 wykazał, że w przypadku regresji logistycznej

βM.[(163)15π)2)V.+1]-1/2)βRmi

gdzie to krańcowe, to oszacowania specyficzne dla danego podmiotu, a to wariancja efektów losowych.β R E VβM.βRmiV.

Molenberghs, Verbeke 2005 zawiera cały rozdział na temat modeli efektów krańcowych i losowych.

Dowiedziałem się o tym i pokrewnych materiałach na kursie opartym w dużej mierze na Diggle, Heagerty, Liang, Zeger 2002 , świetnej referencji.


źródło
1
Mike: Czy zbyt łatwo jest powiedzieć, że GEE uśrednia losowe efekty?
B_Miner
3
@B_Miner Nie jest to wcale takie proste, właśnie to robisz :)
3
@Mike Wierzbicki: Ładna i czysta odpowiedź, Mike! Jeden mały szczegół, który mógłbym dodać w „Some Notes / Literature”: GEE i GLMM są takie same w przypadku liniowym (odpowiedź Gaussa, łącze tożsamości) tylko wtedy, gdy podasz wymienną macierz korelacji dla GEE.
Czy nie ma też GEE dla określonego tematu?
giordano
@MikeWierzbicki Więc jeśli dobrze cię rozumiem, GEE to nic innego jak prosty model z efektami mieszanymi bez efektów losowych (co czyni go prostą linią regresji nieliniowej)?
Robin Kramer