Dlaczego regresji Beta / Dirichleta nie uważa się za uogólnione modele liniowe?

26

Założeniem jest ten cytat z winiety z pakietu R betareg1 .

Co więcej, model ma pewne właściwości (takie jak predyktor liniowy, funkcja łącza, parametr dyspersji) z uogólnionymi modelami liniowymi (GLM; McCullagh i Nelder 1989), ale nie jest to szczególny przypadek tego szkieletu (nawet dla ustalonej dyspersji )

Ta odpowiedź nawiązuje również do faktu:

[...] Jest to rodzaj modelu regresji, który jest odpowiedni, gdy zmienna odpowiedzi jest dystrybuowana jako Beta. Można myśleć o nim jako analogiczny do uogólnionego modelu liniowego. To jest dokładnie to, czego szukasz [...] (moje podkreślenie)

Tytuł pytania mówi wszystko: dlaczego regresja Beta / Dirichleta nie jest uważana za uogólnione modele liniowe (czy nie są)?


O ile mi wiadomo, uogólniony model liniowy definiuje modele zbudowane na oczekiwaniu ich zmiennych zależnych od niezależnych.

g Y X β σ 2fa jest funkcją łącza, która odwzorowuje oczekiwanie, jest rozkładem prawdopodobieństwa, wyniki i prognozy, są parametrami liniowymi, a wariancją.solYXβσ2)

fa(mi(YX))sol(βX,jaσ2))

Różne GLM narzucają (lub rozluźniają) związek między średnią a wariancją, ale musi być rozkładem prawdopodobieństwa w rodzinie wykładniczej, pożądaną właściwością, która powinna poprawić wiarygodność oszacowania, jeśli dobrze pamiętam. Dystrybucje Beta i Dirichlet są jednak częścią wykładniczej rodziny, więc nie mam pomysłów.sol


[1] Cribari-Neto, F., i Zeileis, A. (2009). Regresja beta w R.

Firebug
źródło
2
(+1) Powiązane: stats.stackexchange.com/a/189196 .
ameba mówi Przywróć Monikę
@amoeba Dzięki za link, nie widziałem wcześniej tego pytania.
Firebug
2
Myślę, że problem polega na tym, że jeśli napiszesz rozkład beta ze standardowymi parametrami , (tj. oznacza jednolity (0,1)), to rozkład beta jest w rodzinie wykładniczej, jeśli go napiszesz jeśli chodzi o (średnia) i (dyspersja), nie jest. Ale nigdy tak bardzo nie dbałem o to, czy rozkład należy do rodziny wykładniczej. b a = b = 1 μ ϕzabza=b=1μϕ
Cliff AB
@CliffAB Po przeczytaniu komentarzy pod odpowiedzią Tima poniżej wydaje się, że parametryzacja Beta prowadzi do nieortogonalności parametrów, co wydaje się być wymogiem dla GLM McCullagha-Neldera.
Firebug
1
Myślę, że ta krótka odpowiedź: stats.stackexchange.com/a/18812/28666 jest istotna i dodaje do odpowiedzi tutaj (wskazując, dlaczego GLM zostały pierwotnie zdefiniowane w rodzinie dyspersyjnej wykładniczej).
ameba mówi Przywróć Monikę

Odpowiedzi:

20

Sprawdź oryginalne odniesienie:

Ferrari, S., i Cribari-Neto, F. (2004). Regresja beta dla modelowania stawek i proporcji. Journal of Applied Statistics, 31 (7), 799-815.

jak zauważają autorzy, parametry ponownie sparametryzowanego rozkładu beta są skorelowane, więc

Należy zauważyć, że parametry i ϕ nie są ortogonalne, w przeciwieństwie do tego, co zostało zweryfikowane w klasie uogólnionych modeli regresji liniowej (McCullagh i Nelder, 1989).βϕ

Więc chociaż model wygląda jak GLM i szarlatanko jak GLM, nie idealnie pasuje do ramy.

Tim
źródło
7
+1, ale byłoby wspaniale mieć bardziej szczegółową odpowiedź. Ja osobiście nie rozumiem cytatu (nawet po otwarciu powiązanego dokumentu). Dlaczego te parametry nie są ortogonalne w regresji beta? .. Dlaczego jest to wymagane dla GLM? .. Itd.
Amoeba mówi Przywróć Monikę
3
@amoeba szczerze mówiąc, nie jestem osobą, która może udzielić ci szczegółowej odpowiedzi na ten temat. Nigdy tak bardzo nie interesowałem się teorią GLM, aby mieć wystarczająco głębokie zrozumienie takich subtelności. McCullagh i Nelder wspominają o tym wymogu, ale muszę sprawdzić ich książkę, aby zobaczyć, dlaczego dokładnie jest to ważne. Gdyby ktoś udzielił szczegółowego wyjaśnienia, dlaczego jest to problem, rozważę nagrodę za taką odpowiedź.
Tim
9
Wymagania dotyczące ortogonalności w GLM są ważne: Oznacza to, że możesz oszacować równanie bez obawy o błędne określenie reszty prawdopodobieństwa. Szacunki parametrów są spójne, jeśli powyższe równanie średnie jest poprawnie określone. Wnioskowanie jest ważne, jeśli dodatkowo wariancja jest poprawnie określona. Jednak w regresji beta nie można w ten sposób rozdzielić dwóch równań modelu, nawet jeśli ϕ jest tylko stałą. Aby uzyskać spójne wyniki, wszystko musi być poprawnie określone. g(μ)=xβϕ
Achim Zeileis,
3
@AchimZeileis Pamiętam, że widziałem twoje imię w CV. To, co mówisz, ma doskonały sens. Może chcesz przekształcić swój komentarz, aby uzyskać odpowiedź, dodając trochę uzasadnienia? Jak powiedziałem, chętnie przyznam nagrodę za osobę, która udzieli wystarczająco szczegółowej odpowiedzi na pytanie.
Tim
2
@ Tim spróbuje to zrobić, gdy będę miał więcej czasu. Dlatego pomyślałem, że szybki komentarz jest lepszy niż nic ...
Achim Zeileis,
8

Odpowiedź @probabilityislogic jest na dobrej drodze.

Rozkład beta należy do dwuparametrowej rodziny wykładniczej . Proste modele GLM opisane przez Neldera i Wedderburn (1972) nie uwzględniają wszystkich rozkładów w dwuparametrowej rodzinie wykładniczej.

Zgodnie z artykułem N&W, GLM stosuje się do funkcji gęstości następującego typu (później nazwano ją rodziną dyspersji wykładniczej w Jørgensen 1987 ):

π(z;θ,ϕ)=exp[α(ϕ){zθ-sol(θ)+h(z)}+β(ϕ,z)]

z dodatkową funkcją połączenia i modelem liniowym dla parametru naturalnego θ = f ( μ ) = f ( X β ) .fa()θ=fa(μ)=fa(Xβ)


Abyśmy mogli przepisać powyższą dystrybucję również:

π(z;μ,ϕ)=mixp[z(fa(μ)α(ϕ))+h(z)α(ϕ)-sol(fa(μ))α(ϕ)+β(ϕ,z)]

Dwuparametrowa rodzina wykładnicza to:

fa(z;θ1,θ2))=mixp[T.1(z)η1(θ1,θ2))+T.2)(z)η2)(θ1,θ2))-sol(θ1,θ2))+h(z)]

który wygląda podobnie, ale bardziej ogólnie (także jeśli jedno z jest stałe).θ


Różnica jest wyraźna, a także umieszczenie rozkładu beta w formie, ponieważ GLM nie jest możliwe.

Brakuje mi jednak wystarczającego zrozumienia, aby stworzyć bardziej intuicyjną i dobrze poinformowaną odpowiedź (mam wrażenie, że mogą istnieć znacznie głębsze i bardziej eleganckie relacje z różnymi podstawowymi zasadami). GLM uogólnia rozkład błędu za pomocą modelu pojedynczej zmiennej wykładniczej dyspersji zamiast modelu najmniejszych kwadratów i uogólnia zależność liniową w średniej za pomocą funkcji link.

Najlepszą i najprostszą intuicją wydaje się być termin dyspersyjny w wykładniczym, który jest mnożony przez wszystko, a zatem dyspersja nie zmienia się z θ . Podczas gdy kilka dwuparametrowych rodzin wykładniczych i metod quasi-prawdopodobieństwa pozwala, aby parametr dyspersji również był funkcją θ .α(ϕ)θθ

Sextus Empiricus
źródło
Drugim parametrem w definicji df N&W jest dyspersja. Jest rozszerzeniem jednoparametrowej naturalnej rodziny wykładniczej π ( z ; θ )ϕπ(z;θ)
Sextus Empiricus
@amoeba beta jest dwuwymiarową wykładniczą rodziną, np. www2.stat.duke.edu/courses/Spring11/sta114/lec/expofam.pdf
Tim
2
Nie jestem pewien, czy nie jest to całkowicie możliwe, nawet przy stałym rozproszeniu. Przynajmniej nie zgodnie z glm, jak stwierdził N&W (wiem, że wiele osób robi znacznie trudniejsze rzeczy, aby rozwiązać regresję beta). Przeredaguję odpowiedź, aby pokazać, co się dzieje i gdzie idzie źle, jeśli spróbujemy podążać tą samą ścieżką iteracyjnej, ponownie ważonej najmniejszych kwadratów.
Sextus Empiricus,
2
Trochę zredagowałem odpowiedź. 1) Mój początkowy opis rodzin i modeli dyspersyjnych był niepoprawny. GLM obejmuje wszystkie rozkłady rodzin wykładniczych jednoparametrowych, ponieważ nie jest to tylko funkcja gęstości, ale także funkcja łącza. 2) Jeśli chodzi o lepszy intuicyjny widok, nie mogłem dostać się daleko i nie spodziewam się, że wkrótce się oddalę. Modele GLM odnoszą się do klasycznego modelu w różnych przedstawieniach, dodając wagi do formułowania macierzy procedur dopasowania, pochodnych funkcji logarytmu prawdopodobieństwa, w tym terminów z funkcją połączenia i wariancją, .....
Sextus Empiricus,
2
Pozwoliłem sobie trochę edytować twoją odpowiedź, mam nadzieję, że wszystko w porządku z edycjami. Wygląda też na to, że ta odpowiedź stats.stackexchange.com/a/18812/28666 wskazuje, dlaczego N&W korzystała z tej konkretnej rodziny dystrybucji, a nie z szerszej.
ameba mówi Przywróć Monikę
2

Nie sądzę, że rozkład beta jest częścią rodziny wykładniczej dyspersji . Aby to uzyskać, musisz mieć gęstość

fa(y;θ,τ)=exp(yθ-do(θ)τ+re(y,τ))

do()re()do(θ)τdo(θ)θ

ylog[y]log[1-y]

fabmitza(y;μ,ϕ)=exp(ϕμlog[y1-y]+ϕlog[1-y]-log[b(ϕμ,ϕ(1-μ)]-log[y1-y])

y=xx+zxz

prawdopodobieństwo prawdopodobieństwa
źródło
1
Ta odpowiedź jest nieprawidłowa, jak napisano. Jednym ze sposobów na to jest to, że zgodnie z przedstawioną logiką, na przykład rozkłady Bernoulliego i dwumianowe również nie należałyby do klasy rodzin wykładniczych.
kardynał
2
Przepraszamy, masz rację, że podany przeze mnie przykład był błędny. (Ostrzeżenie: arytmetyka myślenia i mobilne korzystanie z CrossValidated może być niebezpieczne!) Jednak mój punkt widzenia jest nadal słuszny. Ta odpowiedź jest niepoprawna, ponieważ opowiada się za bardzo wąsko „zdefiniowaną” koncepcją „rodziny wykładniczej” - znacznie węższą niż jakiekolwiek konwencjonalne źródło lub praktyczne zastosowanie.
kardynał
2
Hmm Wikipedia umieszcza wersję beta na liście wykładniczych rozkładów rodzin.
ameba mówi Przywróć Monikę
1
To prawda, że ​​myślałem o naturalnej rodzinie wykładniczej - co jest szczególnym przypadkiem
probabilislogic
1
θ