Niedawno dopasowałem 4 modele regresji wielokrotnej dla tych samych danych predykcyjnych / odpowiedzi. Dwa modele pasuję do regresji Poissona.
model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)
Dwa modele pasuję do ujemnej regresji dwumianowej.
library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)
Czy istnieje test statystyczny, którego można użyć do porównania tych modeli? Użyłem AIC jako miary dopasowania, ale AFAIK nie reprezentuje rzeczywistego testu.
regression
aic
count-data
likelihood-ratio
model-comparison
Daniel Standage
źródło
źródło
model.nb.inter
jest znacznie lepsze niż dopasowaniemodel.pois.inter
. Tak, AIC jest niższy, ale o ile niższy jest znacznie lepszy ?model.pois
model.pois.inter
model.nb
model.nb.inter
Odpowiedzi:
Możesz porównać ujemny model dwumianowy z odpowiednim modelem Poissona za pomocą testu współczynnika wiarygodności. Model Poissona jest równoważny ujemnemu dwumianowemu modelowi z parametrem naddyspersji równym zero. Dlatego są to modele zagnieżdżone, a współczynniki wiarygodności są prawidłowe. Komplikacja polega na tym, że parametr nadmiernej dyspersji jest ograniczony do wartości nieujemnych, tzn. Logicznie nie może być mniejszy od zera, więc hipoteza zerowa znajduje się na granicy przestrzeni parametrów. Oznacza to, że zamiast porównywać dwa razy prawdopodobieństwo logarytmu z rozkładem chi-kwadrat z jednym stopniem swobody, należy porównać go z rozkładem mieszaniny składającym się z równych części chi-kwadrat z 1 df i masą punktową zero (rozkład chi-kwadrat z zerowymi stopniami swobody). W praktyce oznacza to, że można obliczyć wartość p za pomocą chi-kwadrat z 1 df, a następnie o połowę. Aby uzyskać więcej informacji i tło, patrz przypadek 5 zSelf & Liang JASA 1987; 82 : 605–610. .
Zauważ, że niektóre pakiety oprogramowania statystycznego, takie jak Stata, zrobią to wszystko automatycznie po dopasowaniu do modelu dwumianowego ujemnego. W rzeczywistości bezwstydnie przekopałem wiele z powyższych z systemu pomocy Stata - jeśli masz Statę
help j_chibar
.źródło
Wierzę, że
anova()
w tym celu można użyć R. Mimo swojej nazwy jest to test współczynnika wiarygodności. Crawley w swojej książce R ma kilka przykładów użycia.źródło
Jak zauważa onestop, ponieważ modele są zagnieżdżone, można wykonać test współczynnika wiarygodności.
Ogólnie jednak nie jest to prawdą, więc jeśli chcesz porównać nie zagnieżdżone modele, możesz użyć testu Vuonga .
źródło