Nadmierna i niska dyspersja w ujemnej regresji dwumianowej / regresji Poissona

11

Przeprowadziłem regresję Poissona w SAS i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosiła około 5, co wskazuje na znaczną naddyspersję. Tak więc dopasowałem ujemny model dwumianowy do proc genmod i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosi 0,80. Czy jest to obecnie uważane za zbyt rozproszone? Jeśli tak, to jak sobie z tym poradzić? Dużo czytałem o nadmiernej dyspersji i wierzę, że wiem, jak sobie z tym poradzić, ale informacje o tym, jak sobie poradzić lub ustalić, czy występuje zbyt mała dyspersja, są niewielkie. Czy ktoś może pomóc?

Dzięki.

StatsStudent
źródło

Odpowiedzi:

17

μμ

V(μ)=μ

V(μ)=ψμ
ψ>0p

V(μ)=aμ2+bμ+c,
λ>0
V(μ)=μ(1+μλ).
λ

λ=λ<Testy oparte na regresji dla nadmiernej dyspersji w modelu Poissona bada klasę testów dla funkcji wariancji ogólnej.

Zalecałbym jednak przede wszystkim zbadanie wykresów resztkowych, np. Wykresu resztek Pearsona lub odchyleń dewiacyjnych (lub ich kwadratowej wartości) w stosunku do dopasowanych wartości. Jeśli funkcjonalna forma wariancji jest nieprawidłowa, zobaczysz to jako kształt lejka (lub trend kwadratowych reszt) na wykresie resztkowym. Jeśli forma funkcjonalna jest poprawna, to znaczy brak lejka lub trendu, nadal może występować nadmierna lub niedostateczna dyspersja, ale można to wyjaśnić poprzez oszacowanie parametru dyspersji. Zaletą wykresu resztkowego jest to, że sugeruje on wyraźniej niż test, co jest nie tak z funkcją wariancji, jeśli w ogóle.

W konkretnym przypadku PO nie można stwierdzić, czy 0,8 wskazuje na zaniżoną dyspersję od podanych informacji. Zamiast skupiać się na szacunkach 5 i 0,8, sugeruję przede wszystkim zbadanie dopasowania funkcji wariancyjnych modelu Poissona i ujemnego modelu dwumianowego. Po określeniu najbardziej odpowiedniej formy funkcjonalnej funkcji wariancji, parametr dyspersji może być dołączony, w razie potrzeby, do dowolnego modelu w celu dostosowania wnioskowania statystycznego dla każdej dodatkowej nadmiernej lub zbyt niskiej dyspersji. Jak łatwo to zrobić w SAS, powiedzmy, niestety nie mogę pomóc.

NRH
źródło
2
+1, to dobra ogólna informacja. Może być bardziej pomocny dla PO, jeśli konkretnie odniósłeś się do jego wyraźnych pytań: (1) jest .8 niedostatecznie rozproszony; I (2) jeśli tak, jak sobie z tym poradzić.
gung - Przywróć Monikę
@gung, zredagowałem odpowiedź, aby udzielić bardziej szczegółowych porad. Na podstawie dostępnych informacji nie można ustalić, czy wartość 0,8 jest znacznie mniejsza niż 1, a skupienie się na tym, czy parametr dyspersji wynosi 1, jest przekierowaniem. Moja edycja wyjaśnia, na czym moim zdaniem powinna się skupić PO.
NRH