Tło: Uwaga: Mój zestaw danych i kod r są zawarte poniżej tekstu
Chciałbym użyć AIC do porównania dwóch modeli efektów mieszanych wygenerowanych przy użyciu pakietu lme4 w R. Każdy model ma jeden ustalony efekt i jeden efekt losowy. Efekt stały różni się w zależności od modelu, ale efekt losowy pozostaje taki sam między modelami. Odkryłem, że jeśli użyję REML = T, model2 ma niższy wynik AIC, ale jeśli użyję REML = F, model1 ma niższy wynik AIC.
Obsługa używania ML:
Zuur i in. (2009; STRONA 122) sugerują, że „Aby porównać modele z zagnieżdżonymi efektami stałymi (ale o tej samej losowej strukturze), należy zastosować oszacowanie ML, a nie REML”. Wskazuje mi to, że powinienem używać ML, ponieważ moje losowe efekty są takie same w obu modelach, ale moje stałe efekty różnią się. [Zuur i in. 2009. Modele z efektami mieszanymi i rozszerzenia w ekologii z R. Springerem.]
Obsługa korzystania z REML:
Zauważam jednak, że kiedy używam ML, wariancja rezydualna związana z efektami losowymi różni się między dwoma modelami (model1 = 136,3; model2 = 112,9), ale kiedy używam REML, jest taka sama między modelami (model1 = model2 = 151,5). To sugeruje, że powinienem zamiast tego użyć REML, aby losowa wariancja resztkowa pozostała taka sama między modelami z tą samą zmienną losową.
Pytanie:
Czy nie ma większego sensu stosowanie REML niż ML do porównywania modeli, w których zmieniają się efekty stałe, a efekty losowe pozostają takie same? Jeśli nie, czy możesz wyjaśnić dlaczego lub wskazać mi inną literaturę, która wyjaśnia więcej?
# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)
# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)
Zestaw danych:
Response Fixed1 Fixed2 Random1
5.20 A A 1
32.50 A A 1
6.57 A A 2
24.77 A B 3
41.69 A B 3
34.29 A B 4
1.80 A B 4
10.00 A B 5
15.56 A B 5
4.44 A C 6
21.65 A C 6
9.20 A C 7
4.11 A C 7
12.52 B D 8
0.25 B D 8
27.34 B D 9
11.54 B E 10
0.86 B E 10
0.68 B E 11
4.00 B E 11
Odpowiedzi:
Zuur i wsp. Oraz Faraway (z powyższego komentarza @ janhove) mają rację; zastosowanie metod opartych na prawdopodobieństwie (w tym AIC) do porównania dwóch modeli z różnymi stałymi efektami, które są dopasowane przez REML, generalnie prowadzi do nonsensów.
źródło
Mamy zatem przykład dwóch różnych parametryzacji tego samego modelu, podając różne wartości prawdopodobieństwa, zakładając, że|B|≠1
To przykład, dlaczego REML nie powinien być stosowany przy porównywaniu modeli z różnymi stałymi efektami. Jednak REML często lepiej szacuje parametry efektów losowych, dlatego czasami zaleca się stosowanie ML do porównań i REML do szacowania jednego (być może ostatecznego) modelu.
źródło