Współczynnik ujemny w uporządkowanej regresji logistycznej

Załóżmy, że mamy porządkową odpowiedź $y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}$ i zbiór zmiennych $X:=[x_1,x_2,x_3]$ który naszym zdaniem wyjaśni $y$ . Następnie wykonujemy uporządkowaną regresję logistyczną $X$ (macierz projektowa) na $y$ (odpowiedź).

Załóżmy, że szacowany współczynnik $x_1$ , to nazwać , w uporządkowane regresji logistycznej . Jak interpretować iloraz szans (OR) ? $\hat{\beta}_1$ $-0.5$ $e^{-0.5} = 0.607$

Czy powiem „dla wzrostu o 1 jednostkę $x_1$ , ceteris paribus, szanse na zaobserwowanie $\text{Good}$ są $0.607$ razy większe niż prawdopodobieństwo zaobserwowania $\text{Bad}\cup \text{Neutral}$ , a dla tej samej zmiany $x_1$ szanse na zaobserwowanie $\text{Neutral} \cup \text{Good}$ wynoszą $0.607$ razy szanse na zaobserwowanie $\text{Bad}$ ”?

Nie mogę znaleźć żadnych przykładów negatywnej interpretacji współczynników w moim podręczniku lub Google.

logit odds-ratio ordered-logit mdewey
źródło

Tak to jest poprawne. Jest prawie identyczny z interpretacją współczynników dodatnich.

Peter Flom - Przywróć Monikę

Uwaga: zwykle mówimy „regress

”, a nie na odwrót.

y

$y$

X

$X$

Gung - Przywróć Monikę

Jesteś na dobrej drodze, ale zawsze spójrz do dokumentacji używanego oprogramowania, aby zobaczyć, który model jest odpowiedni. Załóżmy sytuację z kategorycznie zależną zmienną z uporządkowanymi kategoriami i predyktorami . $Y$ $1, \ldots, g, \ldots, k$ $X_{1}, \ldots, X_{j}, \ldots, X_{p}$

„Na wolności” można napotkać trzy równoważne opcje do napisania teoretycznego modelu proporcjonalnych kursów o różnych implikowanych znaczeniach parametrów:

$\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} \quad(g = 1, \ldots, k-1)$
$\text{logit}(p(Y \leqslant g)) = \ln \frac{p(Y \leqslant g)}{p(Y > g)} = \beta_{0_g} - (\beta_{1} X_{1} + \dots + \beta_{p} X_{p}) \quad(g = 1, \ldots, k-1)$
$\text{logit}(p(Y \geqslant g)) = \ln \frac{p(Y \geqslant g)}{p(Y < g)} = \beta_{0_g} + \beta_{1} X_{1} + \dots + \beta_{p} X_{p} \quad(g = 2, \ldots, k)$

(Modele 1 i 2 mają takie ograniczenie, że w oddzielnych binarnych regresjach logistycznych nie różnią się w zależności od , a , model 3 ma to samo ograniczenie o , i wymaga, że ) $k-1$ $\beta_{j}$ $g$ $\beta_{0_1} < \ldots < \beta_{0_g} < \ldots < \beta_{0_k-1}$ $\beta_{j}$ $\beta_{0_2} > \ldots > \beta_{0_g} > \ldots > \beta_{0_k}$

We wzorze 1, a pozytywne oznacza, że wzrost czynnikiem wiąże się ze wzrostem kursów dla niższej kategorii w . $\beta_{j}$ $X_{j}$ $Y$
Model 1 jest nieco sprzeczny z intuicją, dlatego model 2 lub 3 wydaje się być preferowanym oprogramowaniem. Tutaj pozytywny oznacza, że wzrost predyktora jest związana ze zwiększonym kursów dla wyższych kategorii w . $\beta_{j}$ $X_{j}$ $Y$
Modele 1 i 2 prowadzą do tych samych szacunków dla , ale ich szacunki dla mają przeciwne znaki. $\beta_{0_g}$ $\beta_{j}$
Modele 2 i 3 prowadzą do tych samych oszacowań dla , ale ich oszacowania dla mają przeciwne znaki. $\beta_{j}$ $\beta_{0_g}$

Zakładając, że twoje oprogramowanie korzysta z modelu 2 lub 3, możesz powiedzieć „przy wzroście o 1 jednostkę , ceteris paribus, przewidywane szanse na zaobserwowanie„ ”vs. zaobserwowanie„ ”zmiana o współczynnik . „a także” ze wzrostem 1 jednostka w , przy pozostałych warunkach równych, gdy przewidywane szans zaobserwowania « » w porównaniu z obserwacji « zmiana» o współczynnik $X_1$ $Y = \text{Good}$ $Y = \text{Neutral OR Bad}$ $e^{\hat{\beta}_{1}} = 0.607$ $X_1$ $Y = \text{Good OR Neutral}$ $Y = \text{Bad}$ . ”Zauważ, że w przypadku empirycznym mamy tylko przewidywane szanse, a nie rzeczywiste. $e^{\hat{\beta}_{1}} = 0.607$

Oto kilka dodatkowych ilustracji dla modelu 1 z kategoriami . Po pierwsze, założenie modelu liniowego dla logarytmów skumulowanych o proporcjonalnych szansach. Po drugie, implikowane prawdopodobieństwa zaobserwowania co najwyżej kategorii . Prawdopodobieństwa są zgodne z funkcjami logistycznymi o tym samym kształcie. $k = 4$ $g$ wprowadź opis zdjęcia tutaj

Dla samych prawdopodobieństw kategorii przedstawiony model implikuje następujące uporządkowane funkcje: wprowadź opis zdjęcia tutaj

PS O ile mi wiadomo, model 2 jest używany w SPSS, a także w funkcjach R MASS::polr()i ordinal::clm(). Model 3 jest używany w funkcjach R rms::lrm()i VGAM::vglm(). Niestety nie wiem o SAS i Stacie.

karakal
źródło

Y

$Y$ glm(..., family=binomial)

Czy masz referencję dotyczącą sposobu wyrażenia specyfikacji nr 2 na liście 3 alternatyw?

@Harokitty Zostało to krótko opisane w „Analizie porządkowych danych porządkowych Agrestiego”, sekcja 3.2.2, s. 49, równanie 3.8 . Alternatywnie w „Kategorycznej analizie danych” Agresti, sekcja 9.4, p323, równanie 9.12.

karakal

Cześć, przepraszam, że przeszkadzam, czy macie referencje do trzeciego? Agresti chyba o tym nie mówi.

logit (Y > g)

$\text{logit}(Y > g)$

logit (Y ⩾ g)

$\text{logit}(Y \geqslant g)$

Współczynnik ujemny w uporządkowanej regresji logistycznej

Odpowiedzi: