Współczynnik ujemny w uporządkowanej regresji logistycznej

17

Załóżmy, że mamy porządkową odpowiedź y:{Bad, Neutral, Good}{1,2,3} i zbiór zmiennych X:=[x1,x2,x3] który naszym zdaniem wyjaśni y . Następnie wykonujemy uporządkowaną regresję logistyczną X (macierz projektowa) na y (odpowiedź).

Załóżmy, że szacowany współczynnik x1 , to nazwać p 1 , w uporządkowane regresji logistycznej - 0,5 . Jak interpretować iloraz szans (OR) e - 0,5 = 0,607 ?β^10.5e0.5=0.607

Czy powiem „dla wzrostu o 1 jednostkę x1 , ceteris paribus, szanse na zaobserwowanie Good0.607 razy większe niż prawdopodobieństwo zaobserwowania BadNeutral , a dla tej samej zmiany x1 szanse na zaobserwowanie NeutralGood wynoszą 0.607 razy szanse na zaobserwowanie Bad ”?

Nie mogę znaleźć żadnych przykładów negatywnej interpretacji współczynników w moim podręczniku lub Google.

mdewey
źródło
2
Tak to jest poprawne. Jest prawie identyczny z interpretacją współczynników dodatnich.
Peter Flom - Przywróć Monikę
2
Uwaga: zwykle mówimy „regress on X ”, a nie na odwrót. yX
Gung - Przywróć Monikę

Odpowiedzi:

25

Jesteś na dobrej drodze, ale zawsze spójrz do dokumentacji używanego oprogramowania, aby zobaczyć, który model jest odpowiedni. Załóżmy sytuację z kategorycznie zależną zmienną z uporządkowanymi kategoriami 1 , , g , , k i predyktorami X 1 , , X j , , X p .Y1,,g,,kX1,,Xj,,Xp

„Na wolności” można napotkać trzy równoważne opcje do napisania teoretycznego modelu proporcjonalnych kursów o różnych implikowanych znaczeniach parametrów:

  1. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g+β1X1++βpXp(g=1,,k1)
  2. logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)
  3. logit(p(Yg))=lnp(Yg)p(Y<g)=β0g+β1X1++βpXp(g=2,,k)

(Modele 1 i 2 mają takie ograniczenie, że w oddzielnych binarnych regresjach logistycznych β j nie różnią się w zależności od g , a β 0 1 < < β 0 g < < β 0 k - 1 , model 3 ma to samo ograniczenie o p j , i wymaga, że β 0 2 > ... > β 0 g > ... > β 0 k )k1βjgβ01<<β0g<<β0k1βjβ02>>β0g>>β0k

  • We wzorze 1, a pozytywne oznacza, że wzrost czynnikiem X J wiąże się ze wzrostem kursów dla niższej kategorii w Y .βjXjY
  • Model 1 jest nieco sprzeczny z intuicją, dlatego model 2 lub 3 wydaje się być preferowanym oprogramowaniem. Tutaj pozytywny oznacza, że wzrost predyktora X j jest związana ze zwiększonym kursów dla wyższych kategorii w Y .βjXjY
  • Modele 1 i 2 prowadzą do tych samych szacunków dla , ale ich szacunki dla p j mają przeciwne znaki.β0gβj
  • Modele 2 i 3 prowadzą do tych samych oszacowań dla , ale ich oszacowania dla β 0 g mają przeciwne znaki.βjβ0g

Zakładając, że twoje oprogramowanie korzysta z modelu 2 lub 3, możesz powiedzieć „przy wzroście o 1 jednostkę , ceteris paribus, przewidywane szanse na zaobserwowanie„ Y = dobry ”vs. zaobserwowanie„ Y = neutralny LUB zły ”zmiana o współczynnik e β 1 = 0,607 . „a także” ze wzrostem 1 jednostka w X 1 , przy pozostałych warunkach równych, gdy przewidywane szans zaobserwowania « Y = dobre lub neutralny » w porównaniu z obserwacji « strony Y = złych zmiana» o współczynnik e βX1Y=GoodY=Neutral OR Badeβ^1=0.607X1Y=Good OR NeutralY=Bad. ”Zauważ, że w przypadku empirycznym mamy tylko przewidywane szanse, a nie rzeczywiste.eβ^1=0.607

Oto kilka dodatkowych ilustracji dla modelu 1 z kategoriami . Po pierwsze, założenie modelu liniowego dla logarytmów skumulowanych o proporcjonalnych szansach. Po drugie, implikowane prawdopodobieństwa zaobserwowania co najwyżej kategorii g . Prawdopodobieństwa są zgodne z funkcjami logistycznymi o tym samym kształcie. k=4gwprowadź opis zdjęcia tutaj

Dla samych prawdopodobieństw kategorii przedstawiony model implikuje następujące uporządkowane funkcje: wprowadź opis zdjęcia tutaj

PS O ile mi wiadomo, model 2 jest używany w SPSS, a także w funkcjach R MASS::polr()i ordinal::clm(). Model 3 jest używany w funkcjach R rms::lrm()i VGAM::vglm(). Niestety nie wiem o SAS i Stacie.

karakal
źródło
Yglm(..., family=binomial)
Czy masz referencję dotyczącą sposobu wyrażenia specyfikacji nr 2 na liście 3 alternatyw?
1
@Harokitty Zostało to krótko opisane w „Analizie porządkowych danych porządkowych Agrestiego”, sekcja 3.2.2, s. 49, równanie 3.8 . Alternatywnie w „Kategorycznej analizie danych” Agresti, sekcja 9.4, p323, równanie 9.12.
karakal
Cześć, przepraszam, że przeszkadzam, czy macie referencje do trzeciego? Agresti chyba o tym nie mówi.
2
logit(Y>sol)logit(Ysol)