Regresja logistyczna modeluje dzienne szanse zdarzenia jako pewien zestaw predyktorów. To znaczy, log (p / (1-p)), gdzie p jest prawdopodobieństwem pewnego wyniku. Zatem interpretacja surowych współczynników regresji logistycznej dla niektórych zmiennych (x) musi być zgodna z logarytmiczną skalą szans. Oznacza to, że jeśli współczynnik dla x = 5, to wiemy, że zmiana o 1 jednostkę x odpowiada zmianie o 5 jednostek na logarytmicznej skali szans, że nastąpi wynik.
Jednak często widzę, jak ludzie interpretują wykładnicze współczynniki regresji logistycznej jako iloraz szans. Jednak wyraźnie exp (log (p / (1-p))) = p / (1-p), co jest szansą. O ile rozumiem, iloraz szans to prawdopodobieństwo wystąpienia jednego zdarzenia (np. P / (1-p) dla zdarzenia A) w stosunku do prawdopodobieństwa innego zdarzenia (np. P / (1-p) dla zdarzenia B).
Czego tu brakuje? Wydaje się, że ta powszechna interpretacja wykładniczych współczynników regresji logistycznej jest nieprawidłowa.
źródło
Rozważmy dwa zestawy warunków, pierwszy opisany przez wektor zmiennych niezależnych , a drugi opisany przez wektor , który różni się tylko i-tą zmienną , i jedną jednostką. Niech będzie jak zwykle wektorem parametrów modelu.X ′ x i βX X′ xja β
Zgodnie z modelem regresji logistycznej prawdopodobieństwo wystąpienia zdarzenia w pierwszym przypadku wynosi , więc prawdopodobieństwo wystąpienia zdarzenia wynosi . p1p1= 11 + exp( - Xβ) p11 - p1= exp( Xβ)
Prawdopodobieństwo wystąpienia zdarzenia w drugim przypadku wynosi , więc prawdopodobieństwo wystąpienia zdarzenia wynosi .p2)= 11 + exp( - X′β) p2)1 - p2)= exp( X′β) = exp( Xβ+ βja)
Stosunek szans w drugim przypadku do szans w pierwszym przypadku wynosi zatem . Stąd interpretacja wykładniczego parametru jako iloraz szans.exp( βja)
źródło