Od dłuższego czasu całkiem chętnie używam modeli efektów mieszanych z danymi podłużnymi. Chciałbym dopasować relacje AR w mniejszym (myślę, że mam rację, że nie mogę tego zrobić?), Ale nie sądzę, że jest to niezwykle ważne, więc nie martwię się zbytnio.
Właśnie natknąłem się na ogólne równania szacunkowe (GEE) i wydają się one oferować znacznie większą elastyczność niż modele ME.
Czy istnieje ryzyko, że zadamy zbyt ogólne pytanie, czy jest jakaś rada, która z nich jest lepsza do różnych zadań? Widziałem kilka prac porównujących je i mają one formę:
„W tym wysoce wyspecjalizowanym obszarze nie używaj GEE dla X, nie używaj modeli ME dla Y”.
Nie znalazłem żadnej bardziej ogólnej porady. Czy ktoś może mnie oświecić?
Dziękuję Ci!
mixed-model
gee
Chris Beeley
źródło
źródło
glmmPQL
może również pasować do struktur korelacji AROdpowiedzi:
Użyj GEE, jeśli chcesz odkryć średni efekt populacyjny zmiennej towarzyszącej w porównaniu z efektem indywidualnym. Te dwie rzeczy są równoważne tylko w modelach liniowych, ale nie w nieliniowych (np. Logistycznych). Aby to zobaczyć, weźmy na przykład model logistyczny efektów losowych -tej obserwacji -tego podmiotu, ;jot ja YI j
gdzie jest efekt losowy przedmiotowi i .ηja∼ N.( 0 , σ2)) ja pI j= P( YI j= 1 | ηja)
Jeśli użyjesz modelu losowych efektów na tych danych, uzyskasz szacunkową wartość która uwzględnia fakt, że dla każdej osoby zastosowano średnie zerowe zaburzenie o rozkładzie normalnym, co czyni ją indywidualną.μ
Jeśli użyjesz GEE do tych danych, oszacujesz średnie dzienne szanse na rejestrację. W tym przypadku tak by było
Edycja: Ogólnie model efektów mieszanych bez predyktorów można zapisać jako
gdzie jest funkcją łącza. Kiedy tylkoψ
będzie różnica między średnimi współczynnikami populacji (GEE) a poszczególnymi współczynnikami specyficznymi (modele efektów losowych). Oznacza to, że średnie zmieniają się przez przekształcenie danych, zintegrowanie losowych efektów na przekształconej skali, a następnie przekształcenie z powrotem. Zauważ, że w modelu liniowym (tj. ) równość obowiązuje, więc są równoważne.ψ(x)=x
Edycja 2: Warto również zauważyć, że „solidne” standardowe błędy typu sandwich generowane przez model GEE zapewniają prawidłowe asymptotyczne przedziały ufności (np. Faktycznie zajmują 95% czasu), nawet jeśli określona w modelu struktura korelacji nie jest poprawny.
Edycja 3: Jeśli interesuje Cię zrozumienie struktury asocjacji w danych, szacunki GEE powiązań są notorycznie nieefektywne (a czasem niespójne). Widziałem odniesienie do tego, ale nie mogę go teraz umieścić.
źródło
Moim zdaniem GEE jest najbardziej użyteczny, gdy nie używamy modelowania bayesowskiego i gdy rozwiązanie pełnego prawdopodobieństwa nie jest dostępne. Ponadto GEE może wymagać większych próbek, aby być wystarczająco dokładnym, i jest bardzo mało odporny na przypadkowo brakujące dane podłużne. GEE zakłada brak losowy całkowicie, podczas gdy metody wiarygodności (na przykład modele z efektem mieszanym lub uogólnione najmniejsze kwadraty) zakładają brak tylko losowo.
źródło
Dokładną dyskusję i konkretne przykłady można znaleźć w Fitzmaurice, Laird and Ware, Applied Longitudinal Analysis , John Wiley & Sons, 2011, 2. wydanie, rozdziały 11-16.
Jeśli chodzi o przykłady, możesz znaleźć zestawy danych i programy SAS / Stata / R na stronie internetowej towarzyszącej .
źródło