Jestem zainteresowany oszacowaniem skorygowanego współczynnika ryzyka, analogicznie do tego, jak szacuje się skorygowany iloraz szans za pomocą regresji logistycznej. Niektóre piśmiennictwo (np. To ) wskazuje, że użycie regresji Poissona ze standardowymi błędami Hubera-White'a jest metodą modelową, aby to zrobić
Nie znalazłem literatury na temat tego, jak wpływa to na ciągłe zmienne towarzyszące. Poniższa prosta symulacja pokazuje, że ten problem nie jest tak prosty:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
W takim przypadku rzeczywisty współczynnik ryzyka wynosi 2, który odzyskuje się niezawodnie, gdy efekt zmiennej jest niewielki. Ale gdy efekt kowariancji jest duży, zostaje on zniekształcony. Zakładam, że wynika to z faktu, że efekt kowariancji może przesunąć się w górę w stosunku do górnej granicy (1) i to zanieczyszcza oszacowanie.
Szukałem, ale nie znalazłem żadnej literatury na temat korygowania ciągłych zmiennych towarzyszących w oszacowaniu skorygowanego współczynnika ryzyka. Jestem świadomy następujących postów na tej stronie:
- Regresja Poissona w celu oszacowania względnego ryzyka wyników binarnych
- Regresja Poissona dla danych binarnych
ale nie odpowiadają na moje pytanie. Czy są na to jakieś dokumenty? Czy są jakieś znane przestrogi, które należy zastosować?
źródło
Odpowiedzi:
Nie wiem, czy nadal potrzebujesz odpowiedzi na to pytanie, ale mam podobny problem, w którym chciałbym zastosować regresję Poissona. Podczas uruchamiania kodu odkryłem, że jeśli skonfiguruję model jako
zamiast jako model regresji Poissona, pojawia się ten sam wynik: szacunkowa OR wynosi ~ 1,5 w miarę zbliżania się 1. Nie jestem więc pewien, czy twój przykład dostarcza informacji o możliwym problemie z wykorzystaniem regresji Poissona do wyników binarnych.
źródło
binomial(link=log)
aby faktycznie pasował do modelu ryzyka względnego, ale rzadko zbiega się z powodu zbyt zawyżonego wyniku.Uważam, że zastosowanie bezpośredniego maksymalnego prawdopodobieństwa z właściwą funkcją prawdopodobieństwa znacznie poprawia oszacowanie względnego ryzyka. Możesz bezpośrednio określić funkcję obciętego ryzyka jako przewidywaną szybkość procesu.
Zwykle używamy Hesji do tworzenia CI dla oszacowania. Nie badałem możliwości wykorzystania tego jako matrycy „B” (mięso) w błędzie Huber White i użycia dopasowanego ryzyka, aby uzyskać matrycę „A” (chleb) ... ale podejrzewam, że to może zadziałać! Co więcej, można użyć paska startowego, aby uzyskać błędy modelu, które są odporne na źle określoną relację średniej wariancji.
Daje:
Średni współczynnik daje to, czego chcesz.
źródło