Dlaczego reszty Pearsona z ujemnej regresji dwumianowej są mniejsze niż z regresji Poissona?

9

Mam te dane:

set.seed(1)
predictor  <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)

Przeprowadziłem regresję Poissona

poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")

I ujemna regresja dwumianowa:

require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)

Następnie obliczyłem statystyki dyspersji dla regresji Poissona:

sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)

# [1] 145.4905

I ujemna regresja dwumianowa:

sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)

# [1] 0.7650289

Czy ktokolwiek jest w stanie wyjaśnić, BEZ UŻYCIA RÓWNIKÓW, dlaczego statystyka dyspersji dla ujemnej regresji dwumianowej jest znacznie mniejsza niż statystyka dyspersji dla regresji Poissona?

luciano
źródło

Odpowiedzi:

9

Jest to dość proste, ale „bez użycia równań” jest znaczną przeszkodą. Mogę to wyjaśnić słowami, ale te słowa koniecznie odzwierciedlają równania. Mam nadzieję, że będzie to dla ciebie akceptowalne / nadal miało jakąś wartość. (Odpowiednie równania nie są trudne.)

Istnieje kilka rodzajów resztek. Surowe reszty to po prostu różnica między zaobserwowanymi wartościami odpowiedzi (w twoim przypadku counts) a przewidywanymi wartościami odpowiedzi modelu. Reszty Pearsona dzielą je przez odchylenie standardowe (pierwiastek kwadratowy z funkcji wariancji dla konkretnej wersji uogólnionego modelu liniowego, którego używasz).

Odchylenie standardowe związane z rozkładem Poissona jest mniejsze niż odchylenie dwumianowe . Zatem, gdy dzielisz przez większy mianownik, iloraz jest mniejszy.

Ponadto ujemny dwumian jest bardziej odpowiedni dla twojego przypadku, ponieważ twój countsbędzie rozłożony jako jednolity w populacji. Oznacza to, że ich wariancja nie będzie równa ich średniej.

gung - Przywróć Monikę
źródło
4
Chociaż PO prosi o wyjaśnienie niematematyczne, nadal miło byłoby zobaczyć matematyczne (lub równie rygorystyczne i jasne) uzasadnienie tej odpowiedzi. Po przeczytaniu pytania moja intuicja brzmiała: „Ponieważ Poisson jest (ograniczającym) specjalnym przypadkiem NB, a NB ma więcej parametrów, istnieje większa elastyczność dopasowania, więc oczywiście jakakolwiek rozsądna miara reszt nie powinna się zwiększać podczas wymiany Poisson GLM przez NB GLM. ” Zastanawiam się, czy taka intuicja była naprawdę poprawna.
whuber
Jeśli , . Jeśli , i . Zatem wariancja Poissona jest równa średniej, wariancja NegBin jest większa niż średnia ( ). Dlatego „odchylenie standardowe związane z rozkładem Poissona jest mniejsze niż odchylenie dwumianowe”. XPoisson(λ)E[X]=V[X]=λXNegBin(r,p)E[X]=pr/(1p)V[X]=pr/(1p)2p<1(1p)2<(1p)
Sergio
3
@Sergio Sedno sprawy polega na tym, że w modelu Poissona pracujemy z oszacowaniem zamiast z samym , aw modelu NB podobnie pracujemy z dwoma oszacowaniami i . . Twoje porównanie nie ma zatem bezpośredniego zastosowania. Bez faktycznego spisania wzorów dla MLE w obu modelach wcale nie jest oczywiste, jakie muszą być relacje między tymi zestawami oszacowań. Co więcej, reszta Pearsona jest współczynnikiem, a spór o wariancje odnosi się tylko do mianowników, co stanowi zaledwie połowę historii. λ^λr^p^
whuber
Szacunki MLE są spójne. Problem polega na tym, że kiedy, jak mówi Gung, „liczba będzie rozłożona w populacji jako jednolita. Oznacza to, że ich wariancja nie będzie równa swojej średniej”, nigdy nie będziesz w stanie uzyskać oszacowanej wariancji Poissona większej niż szacowana Poissona, nawet jeśli twoje szacunki są obiektywne i spójne. To problem błędnej specyfikacji.
Sergio
5

W przypadku modelu Poissona, jeśli oczekiwanie dla tej obserwacji wynosi jego wariancja wynosi , a zatem resztkowa wartość PearsoniYiμiμi

yiμ^iμ^i

gdzie jest oszacowaniem średniej. Wyjaśniono tutaj parametryzację ujemnego modelu dwumianowego stosowanego w MASS . Jeśli oczekiwaniem dla tej obserwacji jest jej wariancja wynosi , a zatem pozostałość Pearsonaμ^iYiμiμi+μ2θ

yiμ~iμ~i+μ~2θ

gdzie jest oszacowaniem średniej. Im mniejsza wartość - tj. Bardziej dodatkowa wariancja Poissona - tym mniejsza wartość resztkowa w porównaniu do jej ekwiwalentu Poissona. [Ale jak zauważył @whuber, oszacowania średnich nie są takie same, , ponieważ procedura estymacji waży obserwacje zgodnie z ich zakładaną wariancją. Jeśli mielibyście wykonać pomiary dla tego wzoru predykcyjnego, zbliżyliby się i ogólnie dodanie parametru powinno dać lepsze dopasowanie do wszystkich obserwacji, chociaż nie wiem, jak to dokładnie wykazać. Mimo to szacowane ilości populacji są większe, jeśli model Poissona utrzymuje, więc nie powinno to być zaskoczeniem.]μ~θμ^μ~i

Scortchi - Przywróć Monikę
źródło
1
Dziękujemy za wprowadzenie niektórych równań. Ale czy w dwóch modelach będzie mieć takie same wartości? (Nie wydaje mi się.) Jeśli nie, to jak można porównać dwie pozostałości Pearsona? μi
whuber
@whuber W tym przypadku okazuje się, że dopasowane wartości dla obu modeli są prawie identyczne. W końcu „prawdziwy” model ma po prostu przecięcie i zasadniczo modeluje średnią, ponieważ w symulacji nie ma związku między x i Y.
jsk
1
@jsk Tak, przejrzałem dane i uruchomiłem kod. (BTW, możliwa jest zmiana danych i uzyskanie zasadniczo tej samej statystyki dyspersji dla dwóch modeli). Niestety, wasz punkt, który jest prawidłowy, nadal nie rozwiązuje konkretnego pytania ani nie odnosi się do (domyślnego) pytania ogólnego na temat porównanie reszt Poissona z resztami NB, ponieważ oszacowane wariancje również mogą być prawie identyczne. Jednym potencjalnie mylącym aspektem obecnej odpowiedzi jest użycie symbolu „ ” w odniesieniu do tego, co (w zasadzie) mogłoby być różnymi szacunkami w dwóch modelach tych samych danych. μi
whuber
1
@ whuber Rzeczywiście, masz ważne punkty na temat korzystania z . Co ciekawe, nie mogę znaleźć sposobu na symulację danych, które spowodowałyby niższą statystykę dyspersji dla Poissona niż NB. Być może nie jest to możliwe? Zgadzam się, że ma to sens intuicyjnie. Nie jest to łatwe do udowodnienia, ponieważ nie ma zamkniętego rozwiązania dla mle, gdy masz glm z funkcją link inną niż tożsamość. Ale tak, łatwo jest uczynić te dwie statystyki dyspersji bardzo podobnymi. μi
jsk
1
@jsk - jednym teoretycznym argumentem, aby podejrzewać, że model NB zawsze będzie pasował lepiej niż Poisson, jest to, że można napisać NB jako rozkład związku poissona-gamma. Masz więc a następnie daje ujemny model dwumianowy . Teraz dodanie tych parametrów pozwala modelowi zbliżyć przewidywaną średnią do obserwowanej wartości (gdy zobaczysz , zmniejszając resztkową).(yi|λ,vi,r)Poisson(λvi)(vi|λ,r)Gamma(r,r)(yi|λ,r)NB(r,λr+λ)viyi>λvi>1
prawdopodobieństwo