Założeniem jest ten cytat z winiety z pakietu R betareg
1 .
Co więcej, model ma pewne właściwości (takie jak predyktor liniowy, funkcja łącza, parametr dyspersji) z uogólnionymi modelami liniowymi (GLM; McCullagh i Nelder 1989), ale nie jest to szczególny przypadek tego szkieletu (nawet dla ustalonej dyspersji )
Ta odpowiedź nawiązuje również do faktu:
[...] Jest to rodzaj modelu regresji, który jest odpowiedni, gdy zmienna odpowiedzi jest dystrybuowana jako Beta. Można myśleć o nim jako analogiczny do uogólnionego modelu liniowego. To jest dokładnie to, czego szukasz [...] (moje podkreślenie)
Tytuł pytania mówi wszystko: dlaczego regresja Beta / Dirichleta nie jest uważana za uogólnione modele liniowe (czy nie są)?
O ile mi wiadomo, uogólniony model liniowy definiuje modele zbudowane na oczekiwaniu ich zmiennych zależnych od niezależnych.
g Y X β σ 2 jest funkcją łącza, która odwzorowuje oczekiwanie, jest rozkładem prawdopodobieństwa, wyniki i prognozy, są parametrami liniowymi, a wariancją.
Różne GLM narzucają (lub rozluźniają) związek między średnią a wariancją, ale musi być rozkładem prawdopodobieństwa w rodzinie wykładniczej, pożądaną właściwością, która powinna poprawić wiarygodność oszacowania, jeśli dobrze pamiętam. Dystrybucje Beta i Dirichlet są jednak częścią wykładniczej rodziny, więc nie mam pomysłów.
[1] Cribari-Neto, F., i Zeileis, A. (2009). Regresja beta w R.
Odpowiedzi:
Sprawdź oryginalne odniesienie:
jak zauważają autorzy, parametry ponownie sparametryzowanego rozkładu beta są skorelowane, więc
Więc chociaż model wygląda jak GLM i szarlatanko jak GLM, nie idealnie pasuje do ramy.
źródło
Odpowiedź @probabilityislogic jest na dobrej drodze.
Rozkład beta należy do dwuparametrowej rodziny wykładniczej . Proste modele GLM opisane przez Neldera i Wedderburn (1972) nie uwzględniają wszystkich rozkładów w dwuparametrowej rodzinie wykładniczej.
Zgodnie z artykułem N&W, GLM stosuje się do funkcji gęstości następującego typu (później nazwano ją rodziną dyspersji wykładniczej w Jørgensen 1987 ):
z dodatkową funkcją połączenia i modelem liniowym dla parametru naturalnego θ = f ( μ ) = f ( X β ) .fa( ) θ = f( μ ) = f( Xβ)
Abyśmy mogli przepisać powyższą dystrybucję również:
Dwuparametrowa rodzina wykładnicza to:
który wygląda podobnie, ale bardziej ogólnie (także jeśli jedno z jest stałe).θ
Różnica jest wyraźna, a także umieszczenie rozkładu beta w formie, ponieważ GLM nie jest możliwe.
Brakuje mi jednak wystarczającego zrozumienia, aby stworzyć bardziej intuicyjną i dobrze poinformowaną odpowiedź (mam wrażenie, że mogą istnieć znacznie głębsze i bardziej eleganckie relacje z różnymi podstawowymi zasadami). GLM uogólnia rozkład błędu za pomocą modelu pojedynczej zmiennej wykładniczej dyspersji zamiast modelu najmniejszych kwadratów i uogólnia zależność liniową w średniej za pomocą funkcji link.
Najlepszą i najprostszą intuicją wydaje się być termin dyspersyjny w wykładniczym, który jest mnożony przez wszystko, a zatem dyspersja nie zmienia się z θ . Podczas gdy kilka dwuparametrowych rodzin wykładniczych i metod quasi-prawdopodobieństwa pozwala, aby parametr dyspersji również był funkcją θ .α ( ϕ ) θ θ
źródło
Nie sądzę, że rozkład beta jest częścią rodziny wykładniczej dyspersji . Aby to uzyskać, musisz mieć gęstość
źródło