Porównywanie modeli regresji na danych zliczania

11

Niedawno dopasowałem 4 modele regresji wielokrotnej dla tych samych danych predykcyjnych / odpowiedzi. Dwa modele pasuję do regresji Poissona.

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

Dwa modele pasuję do ujemnej regresji dwumianowej.

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

Czy istnieje test statystyczny, którego można użyć do porównania tych modeli? Użyłem AIC jako miary dopasowania, ale AFAIK nie reprezentuje rzeczywistego testu.

Daniel Standage
źródło
Chcesz porównać dopasowanie modeli za pomocą testu statystycznego, prawda? Jaką hipotezę chciałbyś przetestować?
Firefeather
@Firefeather Na przykład chciałbym przetestować, czy dopasowanie model.nb.interjest znacznie lepsze niż dopasowanie model.pois.inter. Tak, AIC jest niższy, ale o ile niższy jest znacznie lepszy ?
Daniel Standage
Uwaga: odpowiedź na to pytanie nie musi zawierać AIC.
Daniel Standage
Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF
1
@Firefeather, tak, jestem świadomy potrzeby kontrolowania poziomu zaufania rodzinnego. Czy Scheffe byłby tu bardziej odpowiedni niż, powiedzmy, Bonferroni?
Daniel Standage

Odpowiedzi:

14

Możesz porównać ujemny model dwumianowy z odpowiednim modelem Poissona za pomocą testu współczynnika wiarygodności. Model Poissona jest równoważny ujemnemu dwumianowemu modelowi z parametrem naddyspersji równym zero. Dlatego są to modele zagnieżdżone, a współczynniki wiarygodności są prawidłowe. Komplikacja polega na tym, że parametr nadmiernej dyspersji jest ograniczony do wartości nieujemnych, tzn. Logicznie nie może być mniejszy od zera, więc hipoteza zerowa znajduje się na granicy przestrzeni parametrów. Oznacza to, że zamiast porównywać dwa razy prawdopodobieństwo logarytmu z rozkładem chi-kwadrat z jednym stopniem swobody, należy porównać go z rozkładem mieszaniny składającym się z równych części chi-kwadrat z 1 df i masą punktową zero (rozkład chi-kwadrat z zerowymi stopniami swobody). W praktyce oznacza to, że można obliczyć wartość p za pomocą chi-kwadrat z 1 df, a następnie o połowę. Aby uzyskać więcej informacji i tło, patrz przypadek 5 zSelf & Liang JASA 1987; 82 : 605–610. .

Zauważ, że niektóre pakiety oprogramowania statystycznego, takie jak Stata, zrobią to wszystko automatycznie po dopasowaniu do modelu dwumianowego ujemnego. W rzeczywistości bezwstydnie przekopałem wiele z powyższych z systemu pomocy Stata - jeśli masz Statę help j_chibar.

jeden przystanek
źródło
5

Wierzę, że anova()w tym celu można użyć R. Mimo swojej nazwy jest to test współczynnika wiarygodności. Crawley w swojej książce R ma kilka przykładów użycia.

Roman Luštrik
źródło
1

Jak zauważa onestop, ponieważ modele są zagnieżdżone, można wykonać test współczynnika wiarygodności.

Ogólnie jednak nie jest to prawdą, więc jeśli chcesz porównać nie zagnieżdżone modele, możesz użyć testu Vuonga .

Xodarap
źródło