Ile dystrybucji jest w GLM?

11

Zidentyfikowałem wiele miejsc w podręcznikach, w których GLM jest opisany z 5 dystrybucjami (mianowicie, Gamma, Gaussian, Dwumianowy, Odwrotny Gaussian i Poisson). Jest to również zilustrowane funkcją rodzinną w R.

Czasami natrafiam na odniesienia do GLM, w których uwzględniono dodatkowe dystrybucje ( przykład ). Czy ktoś może wyjaśnić, dlaczego te 5 są wyjątkowe lub zawsze znajdują się w GLM, ale czasami inne są?

Z tego, czego się nauczyłem do tej pory, rozkłady GLM w rodzinie wykładniczej pasują do postaci: gdzie jest parametrem dyspersji, a jest parametrem kanonicznym.ϕθ

f(y;θ,ϕ)=exp{yθb(θ)ϕ+c(y,ϕ)}
ϕθ

Czy nie można przekształcić żadnej dystrybucji, aby pasowała do GLM?

timothy.s.lau
źródło
5
Oczywiście jednolity rozkład nie należy do wykładniczej rodziny.
Zhanxiong,
Fajne pytanie. Np. Co z lognormal?
Michael M
1
@Zhanxiong, czy jednolity nie jest specjalnym przypadkiem rozkładu beta, a rozkład beta należy do rodziny wykładniczej?
shf8888,
@ shf8888 AFAIK to tylko rozkład wykładniczej rodziny w limicie, gdy jest zbieżny z rozkładem gamma.
shadowtalker
@Zhanxiong, dzięki za wyjaśnienie! Przepraszam, masz rację, z nieznanymi granicami nie jest wykładniczy rozkład rodziny.
shf8888,

Odpowiedzi:

4

Jak wskazujesz, kwalifikacją do zastosowania rozkładu w GLM jest to, że należy on do rodziny wykładniczej (uwaga: nie jest to to samo, co rozkład wykładniczy! Chociaż rozkład wykładniczy, jako rozkład gamma, sam jest częścią rozkładu rodzina wykładnicza). Pięć list, które wymieniasz, należą do tej rodziny, a co ważniejsze, są BARDZO powszechnymi dystrybucjami, więc są używane jako przykłady i wyjaśnienia.

Jak zauważa Zhanxiong, rozkład równomierny (z nieznanymi granicami) jest klasycznym przykładem niewykładniczego rozkładu rodziny. shf8888 myli ogólny rozkład równomierny w dowolnym przedziale z Uniform (0, 1). Rozkład Uniform (0,1) jest szczególnym przypadkiem rozkładu beta, który jest rodziną wykładniczą. Inne niewykładnicze rozkłady rodziny to modele mieszanin i rozkład t.

Masz poprawną definicję rodziny wykładniczej, a parametr kanoniczny jest bardzo ważny dla korzystania z GLM. Mimo to zawsze łatwiej mi było zrozumieć wykładniczą rodzinę, pisząc ją jako:

f(x;θ)=a(θ)g(x)exp[b(θ)R(x)]

Istnieje bardziej ogólny sposób na napisanie tego, z wektorem zamiast skalarnego ; ale jednowymiarowy przypadek wiele wyjaśnia. W szczególności musisz być w stanie rozdzielić nie wykładnikową część swojej gęstości na dwie funkcje, jedną z nieznanych parametrów ale danych nieobserwowanych i jedną z a nie ; i to samo dla części wykładniczej. Może być trudno zrozumieć, jak np. Rozkład dwumianowy można zapisać w ten sposób; ale z pewnym żonglowaniem algebraicznym, w końcu staje się jasne.θθ x x θθθxxθ

Korzystamy z rodziny wykładniczej, ponieważ ułatwia to wiele rzeczy: na przykład znajduje wystarczające statystyki i testuje hipotezy. W GLM parametr kanoniczny jest często używany do znalezienia funkcji łącza. Wreszcie, pokrewna ilustracja tego, dlaczego statystycy wolą korzystać z rodziny wykładniczej w prawie każdym przypadku, stara się przeprowadzić dowolne klasyczne wnioskowanie statystyczne, powiedzmy, na podstawie Uniform ( , ), w którym zarówno i są nieznane . Nie jest to niemożliwe, ale jest o wiele bardziej skomplikowane i zaangażowane niż robienie tego samego w przypadku wykładniczych rozkładów rodzin.θ 2 θ 1 θ 2θ1θ2θ1θ2

Henz
źródło
Dystrybucja beta z nieznanymi obydwoma parametrami jest nadal rodziną wykładniczą (ale dwuparametrową rodziną wykładniczą). Co sprawia, że ​​myślisz, że tak nie jest? www2.stat.duke.edu/courses/Spring11/sta114/lec/… lub wikipedia
DavidR
Dzięki za zwrócenie na to uwagi, zmieniłem swój komentarz ... masz rację! Naprawdę nie wiem, co miałem na myśli
Henry