Interpretacja logarytmicznych predyktorów w regresji logistycznej

15

Jeden z predyktorów w moim modelu logistycznym został przekształcony w log. Jak interpretujesz szacowany współczynnik predyktora przekształconego logem i jak obliczasz wpływ tego predyktora na iloraz szans?


źródło
1
Bardzo jasnym, kompleksowym podejściem do tego pytania jest odpowiedź jthetzela
rolando2
Dziękuję za twoją pomoc. Dalsze wyjaśnienie. Właściwie, jeśli przekształcę się w logarytmiczną bazę 2-, to zgodnie z wcześniejszą odpowiedzią intuicyjnie wydaje się, że podwojenie predyktora powoduje zmianę% wyniku ax.
mp77,

Odpowiedzi:

16

Jeśli potęgujesz szacowany współczynnik, otrzymasz iloraz szans związany z krotnym wzrostemb predyktora, gdzie b jest podstawą logarytmu, którego użyłeś podczas transformacji logarytmicznej predyktora.

Zazwyczaj w tej sytuacji wybieram logarytmy do podstawy 2, więc mogę interpretować współczynnik wykładniczy jako iloraz szans związany z podwojeniem predyktora.

jeden przystanek
źródło
3
Ciekawy. I zawsze używać naturalnych dzienników, ponieważ wiele współczynników wydają się być bliskie zeru, a następnie mogą być interpretowane jako proporcjonalnych (względnych) różnic. Nie jest to możliwe w żadnej innej bazie logarytmu. Widzę jakąś korzyść z używania innych baz, ale myślę, że musisz wyjaśnić swoją odpowiedź, ponieważ prima facie twoja interpretacja w ogóle nie wykorzystuje wartości współczynnika!
whuber
@whuber przepraszam, co znaczy prima facie ? Pierwsza twarz?
onestop
8

@gung jest całkowicie poprawny, ale jeśli zdecydujesz się go zachować, możesz zinterpretować, że współczynnik ma wpływ na każdą wielokrotność IV, a nie na każde dodanie IV.

Jednym z IV, który często należy przekształcić, jest dochód. Jeśli uwzględnisz go jako nietransformowany, to każdy (powiedzmy) wzrost dochodu o 1000 USD będzie miał wpływ na iloraz szans określony przez iloraz szans. Z drugiej strony, jeśli weźmiesz log (10) dochodu, to każdy 10-krotny wzrost dochodu będzie miał wpływ na iloraz szans określony w ilorazie szans.

To ma sens, aby to zrobić, ponieważ w odniesieniu do dochodu, na wiele sposobów, co stanowi wzrost o $ 1000 w dochodach jest znacznie większa dla kogoś, kto sprawia, że $ 10,000 rok niż ktoś, kto sprawia, że $ 100,000.

Ostatnia uwaga - chociaż regresja logistyczna nie przyjmuje założeń normalności, nawet regresja OLS nie przyjmuje założeń dotyczących zmiennych, lecz przyjmuje założenia dotyczące błędu, oszacowane na podstawie wartości resztkowych.

Peter Flom - Przywróć Monikę
źródło
1
+1, dobre punkty. Przypuszczam, że mógłbym być bardziej kompletny. Ponadto wyłączyłem nieumyślny mathjax, umieszczając ukośnik odwrotny „\” bezpośrednio przed znakami dolara. Mam nadzieję, że nie masz nic przeciwko.
gung - Przywróć Monikę
Co rozumiesz przez „regresja logistyczna przyjmuje założenia o błędach”?
Nie, regresja OLS przyjmuje założenia dotyczące błędów. To co powiedziałem.
Peter Flom - Przywróć Monikę
3

Ta odpowiedź jest adaptowana przez The Statistics Sleuth autorstwa Freda L. Ramseya i Daniela W. Schafera.

Jeśli twoje równanie modelu to:

losol(p/(1-p))=β0+βlosol(X)

Następnie każdy k-fold wzrost w X jest związany ze zmianą szans przez mnożnik wynoszący kβ.

Na przykład mam następujący model obecności odleżyn cofniętych na podstawie długości pobytu w szpitalu.

losol(oreresofabmiresormi)=-.44+0,45(lminsolthofastzay)

Więc moje β=0,45.

Możesz wybrać dowolny k, based on what's works best for your model's interpretability.

I decide that k=2 and get the following:

kβ=20.45=1.37

Each doubling (k=2) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.

Or if you decide k=0.5.

kβ=0.50.45=0.73

Each halving (k=0.5) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.

LindsayL
źródło