Jak mogę ocenić dopasowanie GEE / modelu logistycznego, gdy zmienne towarzyszące zawierają braki danych?

9

Do moich danych dopasowałem dwa uogólnione modele równań szacunkowych (GEE):

1) Model 1: Wynik jest zmienną podłużną Tak / Nie (A) (rok 1,2,3,4,5) z podłużnym ciągłym predyktorem (B) dla lat 1,2,3,4,5.

2) Model 2: Wynik jest tą samą podłużną zmienną Tak / Nie (A), ale teraz z moim predyktorem ustalonym na wartość z roku 1, tj. Zmuszoną do pozostania niezmiennikiem czasowym (B).

Z powodu brakujących pomiarów w moim predyktorze podłużnym w kilku punktach czasowych dla różnych przypadków liczba punktów danych w modelu 2 jest wyższa niż w modelu 1.

Chciałbym wiedzieć o tym, jakie porównania mogę prawidłowo wykonać między ilorazem szans, wartościami p i dopasowaniem dwóch modeli, np .:

  • Jeśli OR dla predyktora B jest większy w modelu 1, czy mogę poprawnie powiedzieć, że związek między A i B jest silniejszy w modelu 1?

  • Jak mogę ocenić, który model jest lepszy dla moich danych? czy mam rację sądząc, że kwadraty pseudo R QIC / AIC nie powinny być porównywane między modelami, jeśli liczba obserwacji nie jest taka sama?

Każda pomoc byłaby bardzo mile widziana.

N26
źródło
Ponieważ Model 2 nie jest tak naprawdę uważany za „zagnieżdżony” z Modelu 1, nie wiem, jak poprawne byłoby użycie QIC do oceny dopasowania porównawczego. Jedną z moich myśli było zastosowanie wielu technik imputacji w celu wyrównywania liczby obserwacji, a następnie można było prawdopodobnie porównać wartości QIC dla tych modeli. Jednak niektóre piśmiennictwo, np. „Applied Longitudinal Data Analysis for Epidemiology” autorstwa Twiska, pokazało naprawdę niespójne wyniki dzięki zastosowaniu technik MI w modelach, które mają zmienne odpowiedzi dychotomiczne. Chciałbym więcej pomóc.
Iris Tsui
1
Dlaczego brakuje wartości? Czy ich brak jest systematyczny w sposób, który sprawia, że ​​brakujące wartości zasadniczo różnią się od wartości brakujących?
Makro

Odpowiedzi:

1

Zdecydowanie spróbowałbym wielokrotnej imputacji (np. U myszy lub Amelii w R), prawdopodobnie za pomocą kilku alternatywnych metod przypisywania brakujących wartości.

W najgorszym przypadku można to uznać za analizę wrażliwości.

Joe_74
źródło