Pracuję na wielokrotnej regresji logistycznej w R użyciem glm
. Zmienne predykcyjne są ciągłe i kategoryczne. Wyciąg z podsumowania modelu pokazuje, co następuje:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.451e+00 2.439e+00 1.005 0.3150
Age 5.747e-02 3.466e-02 1.658 0.0973 .
BMI -7.750e-02 7.090e-02 -1.093 0.2743
...
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Przedziały ufności:
2.5 % 97.5 %
(Intercept) 0.10969506 1.863217e+03
Age 0.99565783 1.142627e+00
BMI 0.80089276 1.064256e+00
...
Dziwne proporcje:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.159642e+01 11.464683 2.7310435 1.370327
Age 1.059155e+00 1.035269 5.2491658 1.102195
B 9.254228e-01 1.073477 0.3351730 1.315670
...
Pierwszy wynik pokazuje, że jest znaczący. Jednak przedział ufności dla obejmuje wartość 1, a iloraz szans dla jest bardzo zbliżony do 1. Co oznacza znacząca wartość p z pierwszego wyniku? Czy jest predyktorem wyniku, czy nie?A g e A g e A g e
r
logistic
interpretation
p-value
SabreWolfy
źródło
źródło
Odpowiedzi:
Na stronie znajduje się wiele pytań, które pomogą w interpretacji wyników modeli (oto trzy różne przykłady, 1 2 3 , i jestem pewien, że jest więcej, jeśli przejrzysz archiwum). Oto także samouczek na stronie statystyk UCLA, w jaki sposób interpretować współczynniki regresji logistycznej.
Chociaż iloraz szans dla współczynnika wieku jest bliski jedności, niekoniecznie oznacza to, że efekt jest niewielki (to, czy efekt jest mały, czy duży, jest często tak samo pytaniem normatywnym, jak empirycznym). Aby uzyskać bardziej świadomą opinię, trzeba znać typową różnicę wieku między obserwacjami.
źródło