Zidentyfikowałem wiele miejsc w podręcznikach, w których GLM jest opisany z 5 dystrybucjami (mianowicie, Gamma, Gaussian, Dwumianowy, Odwrotny Gaussian i Poisson). Jest to również zilustrowane funkcją rodzinną w R.
Czasami natrafiam na odniesienia do GLM, w których uwzględniono dodatkowe dystrybucje ( przykład ). Czy ktoś może wyjaśnić, dlaczego te 5 są wyjątkowe lub zawsze znajdują się w GLM, ale czasami inne są?
Z tego, czego się nauczyłem do tej pory, rozkłady GLM w rodzinie wykładniczej pasują do postaci: gdzie jest parametrem dyspersji, a jest parametrem kanonicznym.ϕθ
Czy nie można przekształcić żadnej dystrybucji, aby pasowała do GLM?
r
probability
distributions
generalized-linear-model
timothy.s.lau
źródło
źródło
Odpowiedzi:
Jak wskazujesz, kwalifikacją do zastosowania rozkładu w GLM jest to, że należy on do rodziny wykładniczej (uwaga: nie jest to to samo, co rozkład wykładniczy! Chociaż rozkład wykładniczy, jako rozkład gamma, sam jest częścią rozkładu rodzina wykładnicza). Pięć list, które wymieniasz, należą do tej rodziny, a co ważniejsze, są BARDZO powszechnymi dystrybucjami, więc są używane jako przykłady i wyjaśnienia.
Jak zauważa Zhanxiong, rozkład równomierny (z nieznanymi granicami) jest klasycznym przykładem niewykładniczego rozkładu rodziny. shf8888 myli ogólny rozkład równomierny w dowolnym przedziale z Uniform (0, 1). Rozkład Uniform (0,1) jest szczególnym przypadkiem rozkładu beta, który jest rodziną wykładniczą. Inne niewykładnicze rozkłady rodziny to modele mieszanin i rozkład t.
Masz poprawną definicję rodziny wykładniczej, a parametr kanoniczny jest bardzo ważny dla korzystania z GLM. Mimo to zawsze łatwiej mi było zrozumieć wykładniczą rodzinę, pisząc ją jako:
Istnieje bardziej ogólny sposób na napisanie tego, z wektorem zamiast skalarnego ; ale jednowymiarowy przypadek wiele wyjaśnia. W szczególności musisz być w stanie rozdzielić nie wykładnikową część swojej gęstości na dwie funkcje, jedną z nieznanych parametrów ale danych nieobserwowanych i jedną z a nie ; i to samo dla części wykładniczej. Może być trudno zrozumieć, jak np. Rozkład dwumianowy można zapisać w ten sposób; ale z pewnym żonglowaniem algebraicznym, w końcu staje się jasne.θ θ x x θθ θ x x θ
Korzystamy z rodziny wykładniczej, ponieważ ułatwia to wiele rzeczy: na przykład znajduje wystarczające statystyki i testuje hipotezy. W GLM parametr kanoniczny jest często używany do znalezienia funkcji łącza. Wreszcie, pokrewna ilustracja tego, dlaczego statystycy wolą korzystać z rodziny wykładniczej w prawie każdym przypadku, stara się przeprowadzić dowolne klasyczne wnioskowanie statystyczne, powiedzmy, na podstawie Uniform ( , ), w którym zarówno i są nieznane . Nie jest to niemożliwe, ale jest o wiele bardziej skomplikowane i zaangażowane niż robienie tego samego w przypadku wykładniczych rozkładów rodzin.θ 2 θ 1 θ 2θ1 θ2 θ1 θ2
źródło