Jeśli Hosmer-Lemeshow wskazuje na brak dopasowania, ale AIC jest najniższy spośród wszystkich modeli ... czy nadal powinieneś używać tego modelu?
Jeśli usunę zmienną, statystyka Hosmera-Lemeshowa nie będzie znacząca (co oznacza, że nie ma rażącego braku dopasowania). Ale AIC wzrasta.
Edycja : Ogólnie myślę, że jeśli AIC różnych modeli są sobie bliskie (tj. ), to są one zasadniczo takie same. Ale AIC są bardzo różne. Wydaje się to wskazywać, że powinienem użyć tego z najniższym AIC, chociaż test Hosmer-Lemeshow wskazuje inaczej.
A może test HL dotyczy tylko dużych próbek? Ma małą moc dla małych rozmiarów próbek (moja wielkość próbki wynosi ~ 300). Ale jeśli otrzymuję znaczący wynik ... Oznacza to, że nawet przy małej mocy dostaję odrzucenie.
Czy miałoby to znaczenie, gdybym użył AICc kontra AIC? Jak uzyskać AICc w SAS? Wiem, że mogą występować problemy z wielokrotnością. Ale z góry hipotezę, że zmienne mają wpływ na wynik.
Jakieś komentarze?
Edycja2 : Myślę, że powinienem użyć modelu z jedną mniejszą zmienną i wyższym AIC z nieistotnym HL. Powodem jest to, że dwie zmienne są ze sobą skorelowane. Więc pozbycie się jednego ma sens.
Odpowiedzi:
Test Hosmera-Lemeshowa jest w pewnym stopniu przestarzały, ponieważ wymaga arbitralnego łączenia przewidywanych prawdopodobieństw i nie ma doskonałej mocy do wykrycia braku kalibracji. Nie w pełni karuje również za ekstremalne przeregulowanie modelu. Dostępne są lepsze metody, takie jak Hosmer, DW; Hosmer, T .; le Cessie, S. i Lemeshow, S. Porównanie testów dopasowania pod kątem modelu regresji logistycznej. Statistics in Medicine , 1997, 16 , 965-980. Ich nowy środek został wdrożony w RR2) do
rms
źródło
rms