Mam losową regresję logistyczną przechwytującą (z powodu powtarzających się pomiarów) i chciałbym przeprowadzić diagnostykę, szczególnie dotyczącą wartości odstających i wpływowych obserwacji.
Spojrzałem na pozostałości, aby zobaczyć, czy istnieją spostrzeżenia, które się wyróżniają. Ale chciałbym też spojrzeć na coś w rodzaju odległości Cooka lub DFFITS. Hosmer i Lemeshow (2000) twierdzą, że z powodu braku modelowych narzędzi diagnostycznych dla skorelowanych danych, wystarczy dopasować zwykły model regresji logistycznej, ignorując korelację, i użyć narzędzi diagnostycznych dostępnych dla regularnej regresji logistycznej. Twierdzą, że byłoby to lepsze niż wcale nie przeprowadzanie diagnostyki.
Książka pochodzi z 2000 roku i zastanawiam się, czy są teraz dostępne metody diagnostyki modeli z regresją logistyczną efektów mieszanych? Jakie byłoby dobre podejście do sprawdzania wartości odstających?
Edytuj (5 listopada 2013 r.):
Z powodu braku odpowiedzi zastanawiam się, czy diagnostyka przy użyciu modeli mieszanych nie jest ogólnie przeprowadzana, czy raczej nie jest ważnym krokiem podczas modelowania danych. Pozwólcie, że sformułuję moje pytanie: co robisz, kiedy znalazłeś „dobry” model regresji?
źródło
Odpowiedzi:
Metody diagnostyczne są rzeczywiście różne dla uogólnionych liniowych modeli mieszanych. Rozsądny, który widziałem, oparty na pozostałościach z GLMM, jest spowodowany przez Pan i Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x). Wykorzystują skumulowane sumy reszt, gdzie porządek jest narzucany albo przez zmienne objaśniające, albo przez predyktor liniowy, testując w ten sposób specyfikację formy funkcjonalnej danego predyktora lub funkcję połączenia jako całości. Rozkłady zerowe oparte są na symulacjach z przestrzeni projektowej z rozkładu zerowego prawidłowych specyfikacji i wykazały przyzwoity rozmiar i właściwości mocy tego testu. Nie dyskutowali konkretnie o wartościach odstających, ale mogę sobie wyobrazić, że wartości odstające powinny prawdopodobnie zrzucić przynajmniej funkcję link, zakrzywiając ją zbyt mocno w kierunku wpływowej obserwacji.
źródło
Istnieje wiele różnych opinii na temat tego, jak najlepiej spojrzeć na diagnostykę modeli mieszanych. Ogólnie rzecz biorąc, będziesz chciał przyjrzeć się zarówno pozostałym, jak i standardowym aspektom, które zostałyby zbadane dla modelu z powtarzanymi pomiarami.
Oprócz tych, zazwyczaj będziesz chciał również przyjrzeć się losowym efektom. Metody często obejmują wykreślanie efektów losowych według różnych zmiennych towarzyszących i poszukiwanie nienormalności w rozkładzie efektów losowych. Istnieje wiele innych metod (niektóre wspomniane w poprzednich komentarzach), ale zazwyczaj jest to dobry początek.
źródło