Co to jest theta w ujemnej regresji dwumianowej dopasowanej do R?

26

Mam pytanie dotyczące ujemnej regresji dwumianowej: Załóżmy, że masz następujące polecenia:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Pamiętaj, że samochody to zestaw danych, który jest dostępny w R, i tak naprawdę nie obchodzi mnie, czy ten model ma sens).

Chciałbym wiedzieć: jak mogę interpretować zmienną theta(zwróconą na końcu wywołania do summary). Czy jest to parametr kształtu rozkładu negbiny i czy można go interpretować jako miarę skośności?

MarkDollar
źródło
Podsumowanie tego, co mówi MASS , znajduje się tutaj .
Scortchi - Przywróć Monikę

Odpowiedzi:

17

Tak, thetajest parametrem kształtu ujemnego rozkładu dwumianowego i nie, tak naprawdę nie można interpretować go jako miary skośności. Dokładniej:

  • skośność będzie zależeć od wartości theta, ale także od średniej
  • nie ma żadnej wartości theta, która gwarantuje brak przekrzywienia

Jeśli tego nie zepsułem, w mu/ thetaparametryzacji stosowanej w ujemnej regresji dwumianowej skośność jest

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

W tym kontekście jest zwykle interpretowana jako miara nadmiernej dyspersji w odniesieniu do rozkładu Poissona. Wariancja ujemnego dwumianu wynosiθμ+μ2/θ , więc naprawdę kontroluje nadmierną zmienność w porównaniu do Poissona (który byłby μ ), a nie przekrzywienie.θμ

Aniko
źródło
dzięki do tej pory! To dobra pomoc ... Ale: Jak mogę interpretować wysokie lub (niskie) wartości theta? W książce uogólnionych modeli liniowych McCaullaughsa jest link do tego artykułu z anscombe, aby dokonać interpretacji k. Ale niestety tak naprawdę nie rozumiem. Artykuł jest claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar
Musisz tylko przeczytać pierwszą stronę. Zatem theta (lub k w anscombe) jest parametrem kształtu rozkładu negbina i zarządza, jeśli rozkład jest bliższy gamma (k -> 0) lub poissona (k -> nieskończoność). Ale co to znaczy dla dopasowania? Jak mogę zinterpretować theta na przykład przy szacowaniu samochodów?
MarkDollar
33

Jeden z moich studentów skierował mnie na tę stronę podczas mojego kursu Modeling Count Data . Wydaje się, że istnieje wiele dezinformacji na temat ujemnego modelu dwumianowego, szczególnie w odniesieniu do statystyki dyspersji i parametru dyspersji.

μglmglm.nb θ

glm.nbglmμ+μ2)θμ+αμ2)glm.nbglmglm.nbnajwyraźniej wziął pośredni związek z McCullagh & Nelder, ale Nelder (który był współzałożycielem GLM w 1972 r.) napisał swój dodatek do systemu kk do Genstat w 1993 r., w którym argumentował, że preferowany jest bezpośredni związek. On i jego żona odwiedzali mnie i moją rodzinę co roku w Arizonie, począwszy od początku 1993 roku, aż do roku przed jego śmiercią. Omówiliśmy to dość dokładnie, ponieważ włączyłem bezpośredni związek z programem glm, który napisałem pod koniec 1992 roku dla oprogramowania Stata i Xplore oraz dla makra SAS w 1994 roku.

nbinomialαθnbinomial

Joseph Hilbe
źródło
2
ϕdoov(β^)=ϕ(XT.W.̂^X)-1θμθ„kształt” - ten ostatni nie uważam za nieuzasadniony, ponieważ z pewnością wpływa na kształt.
Momo
Jaki jest zasięg theta? Czy theta musi być wartością większą niż jeden?
News_is_Selection_Bias
2

dwumian negatywny odniesienia glm: wprowadź opis zdjęcia tutaj

Wikipedia dwumianowa „r” jest „theta” glm, co oznacza, że ​​„theta” jest parametrem kształtu. Mówiąc prościej, „theta” glm to liczba awarii.

datageek
źródło