Regresja logistyczna i porządkowe zmienne niezależne

10

Znalazłem ten post:

Tak. Współczynnik odzwierciedla zmianę ilorazów logarytmicznych dla każdego przyrostu zmiany w predyktorze porządkowym. Ta (bardzo powszechna) specyfikacja modelu zakłada, że ​​predyktor ma liniowy wpływ na swoje przyrosty. Aby przetestować to założenie, możesz porównać model, w którym używasz zmiennej porządkowej jako pojedynczego predyktora, z modelem, w którym dyskretyzujesz odpowiedzi i traktujesz je jako wiele predyktorów (tak jak gdyby zmienna była nominalna); jeśli ten drugi model nie zapewnia znacznie lepszego dopasowania, uzasadnione jest traktowanie każdego przyrostu jako efektu liniowego.

- @ dmk38, 12 grudnia 10 o 5:21

Czy możesz mi powiedzieć, gdzie można znaleźć coś, co potwierdza to twierdzenie? Pracuję z danymi i chciałbym użyć porządkowych zmiennych niezależnych w regresji logistycznej.

Frederico
źródło
Zobacz podobne pytanie stats.stackexchange.com/q/195246/3277
ttnphns

Odpowiedzi:

2

Jak zauważa @Scortchi , możesz również używać wielomianów ortogonalnych. Oto krótka demonstracja w języku R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...
gung - Przywróć Monikę
źródło
8

Każda dobra książka na temat regresji logistycznej będzie miała taką możliwość, choć może nie w tych słowach. Wypróbuj kategoryczną analizę danych Agresti, aby uzyskać bardzo wiarygodne źródło.

Wynika to również z definicji regresji logistycznej (lub innych regresji). Istnieje kilka metod dla niezależnych porządkowych zmiennych. Zazwyczaj traktuje się go jako kategoryczny (który traci porządek) lub ciągły (co sprawia, że ​​założenie jest określone w tym, co zacytowałeś). Jeśli traktujesz to jako ciągłe, program wykonujący analizę nie wie, że jest porządkowy. Załóżmy na przykład, że twój IV to „Jak bardzo lubisz Prezydenta Obamę?” a twoje odpowiedzi są w skali Likerta od 1. „Bardzo” do 5. „Wcale”. Jeśli traktujesz to jako ciągłe, to (z punktu widzenia programu) odpowiedź „5” jest 5 razy większa niż odpowiedź „1”. To może, ale nie musi być nierozsądne.

Peter Flom
źródło
3
Sekcja 5.4.6. I możesz rozszerzyć ten pomysł, używając wielomianów ortogonalnych do kodowania predyktora porządkowego.
Scortchi - Przywróć Monikę
Dziękuję za komentarze, bardzo pomogą w mojej analizie.
Frederico
2
@Frederico, jeśli odpowiedź Petera rozwiązała twoje pytanie, powinieneś je zaakceptować, klikając znacznik wyboru poniżej ogólnej liczby głosów po lewej stronie.
gung - Przywróć Monikę