Chciałbym przetestować, która regresja najlepiej pasuje do moich danych. Moja zmienna zależna jest liczbą i ma wiele zer.
Potrzebowałbym pomocy w ustaleniu, jakiego modelu i rodziny użyć (poissona lub quasipoissona lub regresji poissona z zerowym napełnieniem) i jak przetestować założenia.
- Regresja Poissona: o ile rozumiem, silnym założeniem jest, że zmienna zależna średnia = wariancja. Jak to przetestujesz? Jak blisko siebie muszą być? Czy stosuje się do tego bezwarunkową lub warunkową średnią i wariancję? Co mam zrobić, jeśli to założenie się nie sprawdza?
- Czytam, że jeśli wariancja jest większa niż średnia, mamy nadmierną dyspersję, a potencjalnym sposobem radzenia sobie z tym jest uwzględnienie bardziej niezależnych zmiennych lub rodzina = quasipoisson. Czy ten rozkład ma jakieś inne wymagania lub założenia? Jakiego testu używam, aby sprawdzić, czy (1) lub (2) pasuje lepiej - po prostu
anova(m1,m2)
? - Przeczytałem również, że rozkład ujemny-dwumianowy może być stosowany, gdy pojawia się nadmierna dyspersja. Jak to zrobić w R? Jaka jest różnica w stosunku do quasipoisson?
Zero napompowana regresja Poissona: Czytam, że za pomocą testu vuong sprawdza się, które modele pasują lepiej.
> vuong (model.poisson, model.zero.poisson)
Czy to jest poprawne? Jakie założenia ma regresja z napompowaniem zerowym?
Academic Technology Services z UCLA, Statistics Consulting Group ma sekcję o zerowo napompowanych regresjach Poissona i testuje model o napompowaniu zerowym (a) względem standardowego modelu Poissona (b):
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
Nie rozumiem, co robi | persons
część pierwszego modelu i dlaczego można porównać te modele. Spodziewałem się, że regresja będzie taka sama i po prostu użyję innej rodziny.
stat.desc (dep_var) - a następnie sprawdź, czy średnia i wariancja są równe. Stąd możesz również obliczyć% zer w wektorze.
źródło