Patrzyłem na modelowanie efektów mieszanych przy użyciu pakietu lme4 w R. Używam głównie lmer
polecenia, więc zadam pytanie poprzez kod, który używa tej składni. Przypuszczam, że ogólne łatwe pytanie może być takie: czy można porównywać dowolne dwa modele zbudowane przy lmer
użyciu współczynników wiarygodności opartych na identycznych zestawach danych? Uważam, że odpowiedzią na to musi być „nie”, ale mogę się mylić. Przeczytałem sprzeczne informacje na temat tego, czy efekty losowe muszą być takie same, czy też nie, i co to oznacza? Przedstawię więc kilka przykładów. Wyciągnę je z danych z powtarzanych pomiarów za pomocą bodźców słownych, być może coś takiego jak Baayen (2008) byłoby przydatne w interpretacji.
Powiedzmy, że mam model, w którym istnieją dwa predyktory efektów stałych, nazwiemy je A i B, a niektóre efekty losowe ... słowa i podmioty, które je dostrzegły. Mógłbym zbudować model podobny do następującego.
m <- lmer( y ~ A + B + (1|words) + (1|subjects) )
(zauważ, że celowo pominąłem data =
i założymy, że zawsze mam na myśli REML = FALSE
dla jasności)
Teraz z poniższych modeli, które można porównać ze współczynnikiem prawdopodobieństwa do powyższego, a które nie?
m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )
m5 <- lmer( y ~ A * B + (1|subjects) )
Przyznaję, że interpretacja niektórych z tych różnic może być trudna lub niemożliwa. Ale odłóżmy to na chwilę. Chcę tylko wiedzieć, czy w tych zmianach jest coś fundamentalnego, co wyklucza możliwość porównania. Chcę również wiedzieć, czy, jeśli LR są w porządku, a także porównania AIC.
Odpowiedzi:
Przy maksymalnym prawdopodobieństwie każde z nich można porównać z AIC; jeśli ustalone efekty są takie same (
m1
dom4
), użycie REML lub ML jest w porządku, z REML zwykle preferowanym, ale jeśli są różne, można użyć tylko ML. Jednak interpretacja jest zwykle trudna, gdy zmieniają się zarówno efekty stałe, jak i efekty losowe, dlatego w praktyce większość zaleca zmianę tylko jednego lub drugiego na raz.Korzystanie z testu ilorazu wiarygodności jest możliwe, ale trudne, ponieważ zwykłe przybliżenie chi-kwadrat nie zachowuje się podczas testowania, czy składnik wariancji wynosi zero. Szczegółowe informacje można znaleźć w odpowiedzi Aniko. (Uznanie dla Aniko za to, że zarówno przeczytałem pytanie uważniej niż ja, jak i przeczytałem moją oryginalną odpowiedź na tyle ostrożnie, aby zauważyć, że pominęło ten punkt. Dzięki!)
Pinhiero / Bates to klasyczne odniesienie; opisuje
nlme
pakiet, ale teoria jest taka sama. Cóż, w większości takie same; Doug Bates zmienił swoje zalecenia dotyczące wnioskowania od czasu napisania tej książki, a nowe rekomendacje znajdują odzwierciedlenie wlme4
pakiecie. Ale to więcej, niż chcę się tutaj dostać. Bardziej czytelnym odniesieniem jest Weiss (2005), Modeling Longitudinal Data.źródło
m
m
m4
m
m2
Jednak, jak stwierdził @Aaron, wielu ekspertów nie zaleca przeprowadzania takiego testu współczynnika wiarygodności. Potencjalnymi alternatywami są kryteria informacyjne (AIC, BIC itp.) Lub bootstrapowanie LRT.
[1] Self, SG i Liang, K. Właściwości asymptotyczne estymatorów maksymalnego prawdopodobieństwa i testy współczynnika wiarygodności w niestandardowych warunkach J. Amer. Statystyk. Assoc., 1987, 82, 605-610.
źródło