Problem z porównywaniem modeli GLM posiadających inną funkcję łącza

12

Biorąc pod uwagę ten sam zestaw zmiennych towarzyszących i rodziny dystrybucji, jak mogę porównać modele posiadające różne funkcje łącza?

Myślę, że poprawną odpowiedzią jest „AIC / BIC”, ale nie jestem w 100% pewien.

Czy można mieć modele zagnieżdżone, jeśli mają inne łącze?

Davide
źródło
Należy zauważyć, że „AIC / BIC” jest jedną z możliwych odpowiedzi, ale w zasadzie można zastosować dowolną (odpowiednią) technikę wyboru modelu.
2
Nie, nie są zagnieżdżone. Przypomnij również, że podczas korzystania z AIC / BIC ważne są również stałe normalizujące .
5
Kryteria informacyjne, takie jak AIC i BIC, po prostu dostosowują odchylenie modelu pod kątem jego złożoności (tj. Liczby parametrów). Jeśli masz taką samą liczbę zmiennych towarzyszących (niekoniecznie same te same zmienne towarzyszące), dostosowanie to będzie nieistotne. Możesz to sprawdzić, porównując bezpośrednio odchylenia. Pomocne może być przeczytanie mojej odpowiedzi tutaj: różnica między modelami logit i probit , która dotyczy tego problemu.
gung - Przywróć Monikę
3
Inną możliwością porównywania modeli, która jest bardzo ogólna, ale wymaga od ciebie więcej, jest użycie metody krzyżowej dopasowania parametrycznego Bootstrap. Można znaleźć pdf tutaj .
gung - Przywróć Monikę
2
Czy masz na myśli konkretną rodzinę z 2 możliwymi funkcjami łączenia? tj. rodzina dwumianowa, logit vs. log link?
Placidia

Odpowiedzi:

9

W przypadku tego problemu można również zastosować tak zwane „testy dobroci linków”, których kanoniczne podejście opublikował Daryl Pregibon w Applied Statistics w 1980 r. Możesz przeczytać tutaj artykuł .

Ostatnio pojawiły się także prace na tym froncie, szczególnie Chenga i Wu w artykule JASA z 1994 roku .

Jak stwierdził @gung, korzystanie z dewiacji jest również możliwe, patrz np. Ten artykuł, jeśli nie chcesz brać go za wartość nominalną.

Momo
źródło
3
+1, miło jest mieć kanoniczny papier. BTW, podejrzewam, że miałeś na myśli ostatnią pracę, a nie „rozumowanie”.
gung - Przywróć Monikę
6

(Właśnie kopiuję informacje z komentarzy tutaj, aby to pytanie nie pojawiło się jako oficjalnie bez odpowiedzi).

Możesz porównać dwa modele, porównując odchylenia. Wszystko, co robią AIC i BIC, to dostosowywanie odchyleń do liczby parametrów w modelu. Ponieważ ta liczba jest taka sama, nie ma znaczenia. Zasadniczo bardzo trudno będzie rozróżnić różne funkcje łącza, chyba że różnią się one kształtem; często lepiej jest wykorzystać wiedzę teoretyczną do określenia odpowiedniej funkcji łącza. Na przykład logit i linki probit w ogóle nie różnią się kształtem, ale różnią się sposobem myślenia o procesie generowania danych (jak tutaj omawiam ).

gung - Przywróć Monikę
źródło