Jaka jest różnica między regresją dwumianową a regresją logistyczną?

20

Zawsze myślałem o regresji logistycznej jako po prostu szczególnym przypadku regresji dwumianowej, w którym funkcja połączenia jest funkcją logistyczną (zamiast, powiedzmy, funkcji probit).

Jednak po przeczytaniu odpowiedzi na inne pytanie brzmię, jakbym mógł się pomylić, i istnieje różnica między regresją logistyczną a regresją dwumianową z łączem logistycznym.

Co za różnica?

raegtin
źródło

Odpowiedzi:

13

Regresja logistyczna to regresja dwumianowa z funkcją łącza „logistycznego”:

g(p)=log(p1p)=Xβ

Chociaż myślę również, że regresja logistyczna jest zwykle stosowana do proporcji dwumianowych, a nie do liczb dwumianowych.

prawdopodobieństwo prawdopodobieństwa
źródło
1
Co masz na myśli mówiąc, że regresja logistyczna jest zwykle stosowana do proporcji, a nie do zliczeń? Przypuśćmy, że próbuję przewidzieć, czy ludzie wezmą udział w imprezie, a jeśli chodzi o konkretną imprezę, wiem, że uczestniczyło w niej 9 osób, a 1 nie. Czy masz na myśli, że regresja logistyczna bierze to za jeden przykład szkolenia (tj. ta partia osiągnęła wskaźnik skuteczności 0,9), podczas gdy regresja dwumianowa z linkiem przyjęłaby to jako 10 przykładów szkolenia (9 sukcesów, 1 porażka)?
raegtin
@raehtin - w obu przypadkach byłby to przypadek próbny / szkoleniowy, przy czym odpowiednio ( n i , f i ) = ( 10 , 0,9 ) i ( n i , x i ) = ( 10 , 9 ) . Różnica jest formą funkcji średniej i wariancji. W przypadku dwumianu średnia wynosi μ i = n i p i , łącze kanoniczne jest teraz log ( μ i1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipi(zwany również „parametrem naturalnym”), a funkcją wariancji jestV(μi)=μi(ni-μi)log(μiniμi) z parametrem dyspersjiϕi=1. Dla logistyki mamy średniąμi=pi, powyższe ogniwo, funkcję wariancjiV(μi)=μi(1-μi)oraz dyspersję równąϕi=1V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi) . ϕi=1ni
probabilityislogic
Z logistycznego The oddziela się od średniej i wariancji funkcje, więc łatwiej można wziąć pod uwagę poprzez ważenieni
probabilityislogic
Ach, rozumiem, myślę, że rozumiem. Czy to oznacza, że ​​dają one równoważne wyniki (po prostu uzyskane z innej drogi)?
raegtin
1
@raegtin - tak mi się wydaje. Wagi GLM, wi2=1ϕiV(μi)[g(μi)]2
4

var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))[0,1]

AdamO
źródło