Korzystam z GEE na 3-poziomowych niezrównoważonych danych, używając łącza logit. Czym to się różni (pod względem wniosków, które mogę wyciągnąć i znaczenia współczynników) od GLM z efektami mieszanymi (GLMM) i linkiem logit?
Więcej szczegółów: Obserwacje są pojedynczymi próbami bernoulli. Są one pogrupowane w klasy i szkoły. Za pomocą R. Przypadkowe pominięcie NA. 6 predyktorów również warunki interakcji.
(Nie rzucam dzieci, żeby sprawdzić, czy wylądują jeden na jednego).
Jestem skłonny potęgować współczynniki do ilorazów szans. Czy to ma takie samo znaczenie w obu przypadkach?
Coś czai się w moich myślach o „marginalnych środkach” w modelach GEE. Potrzebuję tego wyjaśnienia.
Dzięki.
Odpowiedzi:
Pod względem interpretacji współczynników występuje różnica w przypadku binarnym (między innymi). To, co różni się między GEE i GLMM, to cel wnioskowania: średnia dla populacji lub specyficzna dla przedmiotu .
Rozważmy prosty, wymyślony przykład związany z twoim. Chcesz modelować wskaźnik niepowodzenia wśród chłopców i dziewcząt w szkole. Podobnie jak w przypadku większości (podstawowych) szkół, populacja uczniów jest podzielona na klasy. Zachowujecie binarną odpowiedź z dzieci w klasach (tj Odpowiedzi binarne skupione przez klasie), gdzie , jeżeli uczeń od klasie przeszły i jeśli on / ona zawiodła. I jeśli uczeń z klasy jest mężczyzną, a 0 w przeciwnym razie.n i N ∑ N i = 1 n i Y i j = 1 j i Y i j = 0 x i j = 1 j iY nja N. ∑N.i = 1nja YI j= 1 jot ja YI j= 0 xI j= 1 jot ja
Aby wprowadzić terminologię, której użyłem w pierwszym akapicie, możesz myśleć o szkole jako o populacji, a klasach o przedmiotach .
Najpierw rozważ GLMM. GLMM dopasowuje model z efektami mieszanymi. Warunki modelu na ustalonej macierzy projektowej (która w tym przypadku składa się z punktu przecięcia i wskaźnika płci) oraz wszelkie przypadkowe efekty w klasach, które uwzględniamy w modelu. W naszym przykładzie uwzględnijmy losowe przechwytywanie, , które weźmie pod uwagę podstawowe różnice w odsetku niepowodzeń w klasach. Więc modelujemybja
Iloraz szans ryzyka niepowodzenia w powyższym modelu różni się w zależności od wartości która jest różna w klasach. Tak więc szacunki są specyficzne dla przedmiotu .bja
Z drugiej strony GEE pasuje do modelu marginalnego. Te modelowe średnie populacyjne . Modelujesz oczekiwanie tylko na stałej matrycy projektowej.
Jest to sprzeczne z modelami efektów mieszanych, jak wyjaśniono powyżej, które warunki zarówno na ustalonej macierzy projektowej, jak i efektach losowych. Tak więc w powyższym marginalnym modelu mówisz: „zapomnij o różnicy między salami lekcyjnymi, chcę tylko, aby wskaźnik populacji (w szkole) był niepowodzeniem i jego związek z płcią”. Pasujesz do modelu i otrzymujesz iloraz szans, który jest ilorazem prawdopodobieństwa niepowodzenia dla populacji związanym z płcią.
Może się więc okazać, że twoje szacunki z modelu GEE mogą różnić się od twojego modelu GLMM, a to dlatego, że nie szacują tego samego.
(Jeśli chodzi o konwersję logarytmicznego ilorazu szans do ilorazu szans przez wykładniczość, tak, robisz to niezależnie od tego, czy jest to oszacowanie na poziomie populacji, czy dla konkretnego przedmiotu)
Niektóre uwagi / literatura:
W przypadku liniowym szacunki dla populacji i dla poszczególnych osób są takie same.
Zeger, i in. 1988 wykazał, że w przypadku regresji logistycznej
gdzie to krańcowe, to oszacowania specyficzne dla danego podmiotu, a to wariancja efektów losowych.β R E VβM. βR E V.
Molenberghs, Verbeke 2005 zawiera cały rozdział na temat modeli efektów krańcowych i losowych.
Dowiedziałem się o tym i pokrewnych materiałach na kursie opartym w dużej mierze na Diggle, Heagerty, Liang, Zeger 2002 , świetnej referencji.
źródło