Korzystam z modelu logit. Moja zmienna zależna jest binarna. Jednak mam niezależną zmienną, która jest kategoryczne i zawiera odpowiedzi: 1.very good, 2.good, 3.average, 4.poor and 5.very poor
. Jest to więc porządkowe („ilościowe jakościowe”). Nie jestem pewien, jak sobie z tym poradzić w modelu. Używam gretl
.
[Uwaga z @ttnphns: Chociaż pytanie mówi, że model jest logit (ponieważ zależne jest kategoryczne), kluczowy problem - porządkowe zmienne niezależne - jest zasadniczo podobny, bądź zależny kategorycznie lub ilościowo. Dlatego pytanie jest równie istotne, powiedzmy, regresja liniowa - jak regresja logistyczna lub inny model logit.]
Odpowiedzi:
Problem z niezależną zmienną porządkową polega na tym, że ponieważ z definicji prawdziwe przedziały metryczne między jej poziomami nie są znane , nie można przyjąć, że apriori nie jest żadnym stosunkiem odpowiedniego typu - poza parasolowym „monotonicznym”. Musimy coś z tym zrobić, na przykład - „ekranować lub łączyć warianty” lub „preferować to, co maksymalizuje”.
Jeśli nalegasz, aby traktować swoją ocenę IV jako porządkową (zamiast przedziałową lub nominalną), mam dla ciebie parę alternatyw.
Mogą być też inne sugestie. Trzy powyższe są tym, co przychodzi mi do głowy po prostu od razu czytając twoje pytanie.
Pozwól, że polecę Ci również odwiedzenie tych wątków: Kojarzenie między wartością nominalną a skalą lub porządkową ; Powiązanie między porządkową a skalą . Mogą być pomocne, mimo że nie dotyczą one konkretnie regresji.
Ale te wątki dotyczą regresji, szczególnie logistycznych: musisz zajrzeć do środka: raz , dwa , trzy , cztery , pięć .
źródło
Aby dodać do innych doskonałych odpowiedzi: nowoczesny sposób radzenia sobie z tym może być za pomocą modelu addytywnego, reprezentującego porządkową zmienną niezależną za pomocą splajnu. Jeśli masz pewność, że efekt zmiennej jest monotoniczny, możesz ograniczyć się do monotonicznego splajnu. (Aby zobaczyć przykład używanych splajnów monotonicznych, zobacz Poszukiwanie funkcji pasującej do krzywej sigmoidalnej ).
W R, jeśli ustawisz predyktor porządkowy jako „czynnik uporządkowany” (na przykład z kodem
ord <- factor(sample(1:5,20,replace=TRUE),ordered=TRUE)
), to w modelu liniowym będzie on reprezentowany przez wielomiany ortogonalne.źródło
źródło