Dlaczego wykładnicze współczynniki regresji logistycznej są uważane za „iloraz szans”?

10

Regresja logistyczna modeluje dzienne szanse zdarzenia jako pewien zestaw predyktorów. To znaczy, log (p / (1-p)), gdzie p jest prawdopodobieństwem pewnego wyniku. Zatem interpretacja surowych współczynników regresji logistycznej dla niektórych zmiennych (x) musi być zgodna z logarytmiczną skalą szans. Oznacza to, że jeśli współczynnik dla x = 5, to wiemy, że zmiana o 1 jednostkę x odpowiada zmianie o 5 jednostek na logarytmicznej skali szans, że nastąpi wynik.

Jednak często widzę, jak ludzie interpretują wykładnicze współczynniki regresji logistycznej jako iloraz szans. Jednak wyraźnie exp (log (p / (1-p))) = p / (1-p), co jest szansą. O ile rozumiem, iloraz szans to prawdopodobieństwo wystąpienia jednego zdarzenia (np. P / (1-p) dla zdarzenia A) w stosunku do prawdopodobieństwa innego zdarzenia (np. P / (1-p) dla zdarzenia B).

Czego tu brakuje? Wydaje się, że ta powszechna interpretacja wykładniczych współczynników regresji logistycznej jest nieprawidłowa.

Jacek
źródło

Odpowiedzi:

10

@ Odpowiedź Laconic jest, moim zdaniem, świetna i kompletna. Chciałem dodać, że oryginalne współczynniki opisują różnicę w logarytmicznych szansach dla dwóch jednostek, które różnią się o 1 w predyktorze. Np. Dla współczynnika na 5 możemy powiedzieć, że różnica w logarytmicznych szansach między dwiema jednostkami, które różnią się na o 1, wynosi 5. Matematycznie,XXX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Kiedy potęgujesz , otrzymujeszβ

exp(β)=exp(log(szansa(p|X=x0+1))-log(szansa(p|X=x0)))=exp(log(szansa(p|X=x0+1)))exp(log(szansa((p|X=x0)))=szansa(p|X=x0+1)szansa(p|X=x0))

który jest ilorazem szans, ilorazem szans.

Noah
źródło
2
Jest to dla mnie niezwykle jasne. Moje pytanie zostało rozwiązane.
jack
10

Rozważmy dwa zestawy warunków, pierwszy opisany przez wektor zmiennych niezależnych , a drugi opisany przez wektor , który różni się tylko i-tą zmienną , i jedną jednostką. Niech będzie jak zwykle wektorem parametrów modelu.X x i βXXxjaβ

Zgodnie z modelem regresji logistycznej prawdopodobieństwo wystąpienia zdarzenia w pierwszym przypadku wynosi , więc prawdopodobieństwo wystąpienia zdarzenia wynosi . p1p1=11+exp(-Xβ)p11-p1=exp(Xβ)

Prawdopodobieństwo wystąpienia zdarzenia w drugim przypadku wynosi , więc prawdopodobieństwo wystąpienia zdarzenia wynosi .p2)=11+exp(-Xβ)p2)1-p2)=exp(Xβ)=exp(Xβ+βja)

Stosunek szans w drugim przypadku do szans w pierwszym przypadku wynosi zatem . Stąd interpretacja wykładniczego parametru jako iloraz szans.exp(βja)

The Laconic
źródło