Załóżmy, że mamy porządkową odpowiedź i zbiór zmiennych który naszym zdaniem wyjaśni . Następnie wykonujemy uporządkowaną regresję logistyczną (macierz projektowa) na (odpowiedź).
Załóżmy, że szacowany współczynnik , to nazwać p 1 , w uporządkowane regresji logistycznej - 0,5 . Jak interpretować iloraz szans (OR) e - 0,5 = 0,607 ?
Czy powiem „dla wzrostu o 1 jednostkę , ceteris paribus, szanse na zaobserwowanie są razy większe niż prawdopodobieństwo zaobserwowania , a dla tej samej zmiany szanse na zaobserwowanie wynoszą razy szanse na zaobserwowanie ”?
Nie mogę znaleźć żadnych przykładów negatywnej interpretacji współczynników w moim podręczniku lub Google.
logit
odds-ratio
ordered-logit
mdewey
źródło
źródło
Odpowiedzi:
Jesteś na dobrej drodze, ale zawsze spójrz do dokumentacji używanego oprogramowania, aby zobaczyć, który model jest odpowiedni. Załóżmy sytuację z kategorycznie zależną zmienną z uporządkowanymi kategoriami 1 , … , g , … , k i predyktorami X 1 , … , X j , … , X p .Y 1,…,g,…,k X1,…,Xj,…,Xp
„Na wolności” można napotkać trzy równoważne opcje do napisania teoretycznego modelu proporcjonalnych kursów o różnych implikowanych znaczeniach parametrów:
(Modele 1 i 2 mają takie ograniczenie, że w oddzielnych binarnych regresjach logistycznych β j nie różnią się w zależności od g , a β 0 1 < … < β 0 g < … < β 0 k - 1 , model 3 ma to samo ograniczenie o p j , i wymaga, że β 0 2 > ... > β 0 g > ... > β 0 k )k−1 βj g β01<…<β0g<…<β0k−1 βj β02>…>β0g>…>β0k
Zakładając, że twoje oprogramowanie korzysta z modelu 2 lub 3, możesz powiedzieć „przy wzroście o 1 jednostkę , ceteris paribus, przewidywane szanse na zaobserwowanie„ Y = dobry ”vs. zaobserwowanie„ Y = neutralny LUB zły ”zmiana o współczynnik e β 1 = 0,607 . „a także” ze wzrostem 1 jednostka w X 1 , przy pozostałych warunkach równych, gdy przewidywane szans zaobserwowania « Y = dobre lub neutralny » w porównaniu z obserwacji « strony Y = złych zmiana» o współczynnik e βX1 Y=Good Y=Neutral OR Bad eβ^1=0.607 X1 Y=Good OR Neutral Y=Bad . ”Zauważ, że w przypadku empirycznym mamy tylko przewidywane szanse, a nie rzeczywiste.eβ^1=0.607
Oto kilka dodatkowych ilustracji dla modelu 1 z kategoriami . Po pierwsze, założenie modelu liniowego dla logarytmów skumulowanych o proporcjonalnych szansach. Po drugie, implikowane prawdopodobieństwa zaobserwowania co najwyżej kategorii g . Prawdopodobieństwa są zgodne z funkcjami logistycznymi o tym samym kształcie.k=4 g
Dla samych prawdopodobieństw kategorii przedstawiony model implikuje następujące uporządkowane funkcje:
PS O ile mi wiadomo, model 2 jest używany w SPSS, a także w funkcjach R
MASS::polr()
iordinal::clm()
. Model 3 jest używany w funkcjach Rrms::lrm()
iVGAM::vglm()
. Niestety nie wiem o SAS i Stacie.źródło
glm(..., family=binomial)