Załóżmy, że zamierzam wykonać jednoczynnikową regresję logistyczną dla kilku niezależnych zmiennych, takich jak to:
mod.a <- glm(x ~ a, data=z, family=binominal("logistic"))
mod.b <- glm(x ~ b, data=z, family=binominal("logistic"))
Zrobiłem porównanie modelu (test współczynnika prawdopodobieństwa), aby sprawdzić, czy model jest lepszy niż model zerowy za pomocą tego polecenia
1-pchisq(mod.a$null.deviance-mod.a$deviance, mod.a$df.null-mod.a$df.residual)
Następnie zbudowałem inny model ze wszystkimi zmiennymi
mod.c <- glm(x ~ a+b, data=z, family=binomial("logistic"))
Aby sprawdzić, czy zmienna jest istotna statystycznie w modelu wielowymiarowym, użyłem lrtest
polecenia zepicalc
lrtest(mod.c,mod.a) ### see if variable b is statistically significant after adjustment of a
lrtest(mod.c,mod.b) ### see if variable a is statistically significant after adjustment of b
Zastanawiam się, czy pchisq
metoda i lrtest
metoda są równoważne z wykonaniem testu wiarygodności? Jak nie wiem, jak korzystać lrtest
z univate modelu logistycznego.
r
logistic
diagnostic
lokheart
źródło
źródło
epicalc
został usunięty ( źródło ). Alternatywą może byćlmtest
.Odpowiedzi:
Zasadniczo tak, pod warunkiem, że użyjesz prawidłowej różnicy w prawdopodobieństwie dziennika:
a nie odchylenie dla modelu zerowego, który jest taki sam w obu przypadkach. Liczba df to liczba parametrów, które różnią się między dwoma modelami zagnieżdżonymi, tutaj df = 1. BTW, możesz spojrzeć na kod źródłowy,
lrtest()
po prostu wpisującpo znaku zachęty R.
źródło
anova(model1, model0)
będzie działać.glm(output ~ 1, data=z, family=binomial("logistic"))
byłby bardziej naturalnym modelem zerowym, któryoutput
tłumaczy to stałym terminem (przechwytywanie) / Przechwytywanie jest implikowane we wszystkich twoich modelach, więc testujesz efekta
po uwzględnieniu przechwytywania.Alternatywą jest
lmtest
pakiet, który malrtest()
funkcję, która akceptuje jeden model. Oto przykład ze?lrtest
wlmtest
opakowaniu, które jest na LM, ale istnieją sposoby, że praca z GLMs:źródło
fm1
ma niższe prawdopodobieństwo dziennika, a zatem gorsze dopasowanie niżfm2
. LRT mówi nam, że stopień, w jakim stworzyliśmyfm1
gorszy model,fm2
jest nieoczekiwanie duży, jeśli użyteczne byłyby terminy różniące się między modelami (wyjaśnił odpowiedź).lrtest(fm2)
nie jest w porównaniu zfm1
wcale, modelfm2
jest w porównaniu z tym w przypadku, gdy, jak stwierdzono na wyjściu, to:con ~ 1
. Ten model, model zerowy, mówi, że najlepszym predyktoremcon
jest średnia próbkowacon
(punkt przecięcia / stały).