Przeprowadziłem liniową regresję akceptacji na studia w porównaniu z wynikami SAT i pochodzeniem rodzinnym / etnicznym. Dane są fikcyjne. Jest to kontynuacja wcześniejszego pytania, na które już udzielono odpowiedzi. Pytanie skupia się na zbieraniu i interpretacji ilorazów szans, gdy pomija się wyniki SAT dla uproszczenia.
Zmienne to Accepted
(0 lub 1) i Background
(„czerwony” lub „niebieski”). Skonfigurowałem dane, aby osoby z „czerwonym” pochodzeniem miały większe szanse na wejście:
fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))
Odds_Ratio_RedvBlue 2.5 % 97.5 %
(Intercept) 0.7088608 0.5553459 0.9017961
Backgroundred 2.4480042 1.7397640 3.4595454
Pytania:
Czy 0,7 jest nieparzysty w stosunku do osoby o „niebieskim” tle? Proszę o to, ponieważ dostaję 0.7 za „
Backgroundblue
”, jeśli zamiast tego uruchomię następujący kod:fit <- glm(Accepted~Background-1, data=dat, family="binomial") exp(cbind(OR=coef(fit), confint(fit)))
r
regression
logistic
Antoni Parellada
źródło
źródło
R
wyraźnie nazywa współczynniki (za pomocą funkcjicoef
), nazywa się „ilorazem szans” na wyjściu. To sugeruje, że warto zrewidować różnicę między nimi.Odpowiedzi:
Pracowałem nad odpowiedzią na moje pytanie, obliczając ręcznie szanse i iloraz szans:
Tak więc iloraz szans dostania się do szkoły Red over Blue wynosi:
I to jest
Backgroundred
powrót:Jednocześnie112 / 158 = 0,7089 .
(Intercept)
odpowiada licznikowi ilorazu szans , który jest dokładnie szansą na uzyskanie „niebieskiego” tła rodzinnego:Jeśli zamiast tego uruchamiam:
Zwroty to dokładnie szansa na uzyskanie „niebieskiego”:
Backgroundblue
(0,7089) i szansa na przyjęcie bycia „czerwonym”:Backgroundred
(1,7353). Nie ma tam współczynnika szans . Dlatego te dwie zwracane wartości nie powinny być wzajemne.Wreszcie, jak odczytać wyniki, jeśli w kategorycznym regresorze występują 3 czynniki?
Takie same obliczenia ręczne w porównaniu z [R]:
Stworzyłem inny fikcyjny zestaw danych z tą samą przesłanką, ale tym razem były trzy pochodzenie etniczne: „czerwony”, „niebieski” i „pomarańczowy”, i prowadziłem tę samą sekwencję:
Po pierwsze, tabela awaryjna:
I obliczył szanse dostania się dla każdej grupy etnicznej:
Jak również różne iloraz szans :
Kontynuowano rutynową regresję logistyczną, a następnie potęgowanie współczynników:
Uzyskując szanse na dostanie się do „bluesa” jako
(Intercept)
, oraz iloraz szans pomarańczowego w stosunku do niebieskiego wBackgroundorange
, oraz iloraz szans czerwonego w niebieskiego wBackgroundred
.Z drugiej strony regresja bez przechwytywania w sposób przewidywalny zwróciła tylko trzy niezależne szanse :
źródło