Interpretacja logarytmicznych predyktorów w regresji logistycznej
15
Jeden z predyktorów w moim modelu logistycznym został przekształcony w log. Jak interpretujesz szacowany współczynnik predyktora przekształconego logem i jak obliczasz wpływ tego predyktora na iloraz szans?
Bardzo jasnym, kompleksowym podejściem do tego pytania jest odpowiedź jthetzela
rolando2
Dziękuję za twoją pomoc. Dalsze wyjaśnienie. Właściwie, jeśli przekształcę się w logarytmiczną bazę 2-, to zgodnie z wcześniejszą odpowiedzią intuicyjnie wydaje się, że podwojenie predyktora powoduje zmianę% wyniku ax.
mp77,
Odpowiedzi:
16
Jeśli potęgujesz szacowany współczynnik, otrzymasz iloraz szans związany z krotnym wzrostemb predyktora, gdzie b jest podstawą logarytmu, którego użyłeś podczas transformacji logarytmicznej predyktora.
Zazwyczaj w tej sytuacji wybieram logarytmy do podstawy 2, więc mogę interpretować współczynnik wykładniczy jako iloraz szans związany z podwojeniem predyktora.
Ciekawy. I zawsze używać naturalnych dzienników, ponieważ wiele współczynników wydają się być bliskie zeru, a następnie mogą być interpretowane jako proporcjonalnych (względnych) różnic. Nie jest to możliwe w żadnej innej bazie logarytmu. Widzę jakąś korzyść z używania innych baz, ale myślę, że musisz wyjaśnić swoją odpowiedź, ponieważ prima facie twoja interpretacja w ogóle nie wykorzystuje wartości współczynnika!
whuber
@whuber przepraszam, co znaczy prima facie ? Pierwsza twarz?
@gung jest całkowicie poprawny, ale jeśli zdecydujesz się go zachować, możesz zinterpretować, że współczynnik ma wpływ na każdą wielokrotność IV, a nie na każde dodanie IV.
Jednym z IV, który często należy przekształcić, jest dochód. Jeśli uwzględnisz go jako nietransformowany, to każdy (powiedzmy) wzrost dochodu o 1000 USD będzie miał wpływ na iloraz szans określony przez iloraz szans. Z drugiej strony, jeśli weźmiesz log (10) dochodu, to każdy 10-krotny wzrost dochodu będzie miał wpływ na iloraz szans określony w ilorazie szans.
To ma sens, aby to zrobić, ponieważ w odniesieniu do dochodu, na wiele sposobów, co stanowi wzrost o $ 1000 w dochodach jest znacznie większa dla kogoś, kto sprawia, że $ 10,000 rok niż ktoś, kto sprawia, że $ 100,000.
Ostatnia uwaga - chociaż regresja logistyczna nie przyjmuje założeń normalności, nawet regresja OLS nie przyjmuje założeń dotyczących zmiennych, lecz przyjmuje założenia dotyczące błędu, oszacowane na podstawie wartości resztkowych.
+1, dobre punkty. Przypuszczam, że mógłbym być bardziej kompletny. Ponadto wyłączyłem nieumyślny mathjax, umieszczając ukośnik odwrotny „\” bezpośrednio przed znakami dolara. Mam nadzieję, że nie masz nic przeciwko.
gung - Przywróć Monikę
Co rozumiesz przez „regresja logistyczna przyjmuje założenia o błędach”?
Nie, regresja OLS przyjmuje założenia dotyczące błędów. To co powiedziałem.
Peter Flom - Przywróć Monikę
3
Ta odpowiedź jest adaptowana przez The Statistics Sleuth autorstwa Freda L. Ramseya i Daniela W. Schafera.
Jeśli twoje równanie modelu to:
l o g( p / ( 1 - p ) ) = β0+ βl o g( X)
Następnie każdy k-fold wzrost w X jest związany ze zmianą szans przez mnożnik wynoszący kβ.
Na przykład mam następujący model obecności odleżyn cofniętych na podstawie długości pobytu w szpitalu.
l o g( o dres O Fb e ds o r e ) = - .44 + 0,45 ( l e n gt h o fs t a y)
Więc moje β= 0,45.
Możesz wybrać dowolny k, based on what's works best for your model's interpretability.
I decide that k=2 and get the following:
kβ=20.45=1.37
Each doubling (k=2) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.
Or if you decide k=0.5.
kβ=0.50.45=0.73
Each halving (k=0.5) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.
Odpowiedzi:
Jeśli potęgujesz szacowany współczynnik, otrzymasz iloraz szans związany z krotnym wzrostemb predyktora, gdzie b jest podstawą logarytmu, którego użyłeś podczas transformacji logarytmicznej predyktora.
Zazwyczaj w tej sytuacji wybieram logarytmy do podstawy 2, więc mogę interpretować współczynnik wykładniczy jako iloraz szans związany z podwojeniem predyktora.
źródło
@gung jest całkowicie poprawny, ale jeśli zdecydujesz się go zachować, możesz zinterpretować, że współczynnik ma wpływ na każdą wielokrotność IV, a nie na każde dodanie IV.
Jednym z IV, który często należy przekształcić, jest dochód. Jeśli uwzględnisz go jako nietransformowany, to każdy (powiedzmy) wzrost dochodu o 1000 USD będzie miał wpływ na iloraz szans określony przez iloraz szans. Z drugiej strony, jeśli weźmiesz log (10) dochodu, to każdy 10-krotny wzrost dochodu będzie miał wpływ na iloraz szans określony w ilorazie szans.
To ma sens, aby to zrobić, ponieważ w odniesieniu do dochodu, na wiele sposobów, co stanowi wzrost o $ 1000 w dochodach jest znacznie większa dla kogoś, kto sprawia, że $ 10,000 rok niż ktoś, kto sprawia, że $ 100,000.
Ostatnia uwaga - chociaż regresja logistyczna nie przyjmuje założeń normalności, nawet regresja OLS nie przyjmuje założeń dotyczących zmiennych, lecz przyjmuje założenia dotyczące błędu, oszacowane na podstawie wartości resztkowych.
źródło
Ta odpowiedź jest adaptowana przez The Statistics Sleuth autorstwa Freda L. Ramseya i Daniela W. Schafera.
Jeśli twoje równanie modelu to:
Następnie każdyk -fold wzrost w X jest związany ze zmianą szans przez mnożnik wynoszący kβ .
Na przykład mam następujący model obecności odleżyn cofniętych na podstawie długości pobytu w szpitalu.
Więc mojeβ= 0,45 .
Możesz wybrać dowolnyk , based on what's works best for your model's interpretability.
I decide thatk=2 and get the following:
Each doubling (k=2 ) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of 1.37. Or if you double my length of stay, my odds of getting a bedsore will be 137% what they would have been otherwise.
Or if you decidek=0.5 .
Each halving (k=0.5 ) of the length of stay is associated with a change in the odds of getting a bedsore by a factor of .73. Or if you cut my length of stay in half, my odds of getting a bedsore will only 73% of what they would have been otherwise.
źródło