Skalowane odchylenie, zdefiniowane jako D = 2 * (logarytmiczne prawdopodobieństwo modelu nasyconego minus logarytmiczne prawdopodobieństwo modelu dopasowanego), jest często stosowane jako miara dobroci dopasowania w modelach GLM. Wyjaśnione procentowe odchylenie, zdefiniowane jako [D (model zerowy) - D (model dopasowany)] / D (model zerowy), jest również czasami używane jako analog GLM do kwadratu R regresji liniowej. Oprócz faktu, że rozkłady ZIP i ZINB nie są częścią wykładniczej rodziny rozkładów, mam problem ze zrozumieniem, dlaczego skalowane odchylenie i procent odchylenia wyjaśnionego nie są używane w modelowaniu z zerowym zawyżeniem. Czy ktoś może rzucić na to trochę światła lub podać pomocne referencje? Z góry dziękuję!
goodness-of-fit
zero-inflation
deviance
aleanjeo
źródło
źródło
Odpowiedzi:
Odchylenie jest koncepcją GLM, modele ZIP i ZINB nie są glms, ale są sformułowane jako skończone mieszanki rozkładów, które są GLM i dlatego można je łatwo rozwiązać za pomocą algorytmu EM.
Te notatki zwięźle opisują teorię dewiacji. Po przeczytaniu tych notatek zobaczysz dowód na to, że model nasycony dla regresji Poissona ma logarytmiczne prawdopodobieństwo
co wynika z wtyczką szacunków .yja= λ^ja
Przejdę teraz do prawdopodobieństwa ZIP, ponieważ matematyka jest prostsza, podobne wyniki dotyczą ZINB. Niestety w przypadku ZIP nie ma prostej relacji jak w Poissonie. Prawdopodobieństwo logarytmu obserwacji jestja
nie są przestrzegane, tak aby rozwiązać ten problem, że trzeba wziąć pochodne cząstkowe WRT zarówno Î i cp ustaw równań na 0, a następnie rozwiązać za Î i cp . Trudności są tu y i = 0 wartości, mogą one wejść do Î lub do cp i nie jest możliwe bez zachowania Z i które umieścić y i = 0 uwag do. Gdybyśmy jednak znali Z iZja λ ϕ λ ϕ yja= 0 λ^ ϕ^ Zja yja= 0 Zja wartość nie potrzebowalibyśmy modelu ZIP, ponieważ nie mielibyśmy brakujących danych. Zaobserwowane dane odpowiadają prawdopodobieństwu „kompletnych danych” w formalizmie EM.
Jednym z rozwiązań, które mogą być uzasadnione jest do pracy z oczekiwaniem wrt kompletnych danych dziennika prawdopodobieństwa, E ( ℓ I ( φ , λ ) ) , która usuwa Z I i zastępuje z oczekiwaniem, jest częścią tego, co Algorytm EM oblicza (krok E) z najnowszymi aktualizacjami. Mi znany żaden literatury badał to podejście do e x P e c t e d odchyleniem chociaż.Zi E(ℓi(ϕ,λ)) Zi expected
Również to pytanie zostało zadane jako pierwsze, więc odpowiedziałem na ten post. Istnieje jednak inne pytanie na ten sam temat z ładnym komentarzem Gordona Smytta: dewiacja dla złożonego modelu Poissona o zerowym napełnieniu, ciągłe dane (R), w których wspomniał o tej samej odpowiedzi (jest to opracowanie tego komentarza powiedzmy) oraz wspomnieli w komentarzach do drugiego postu artykuł, który możesz chcieć przeczytać. (zrzeczenie się, nie przeczytałem referatu, do którego się odwołuje)
źródło