Biorąc pod uwagę przewidywaną zmienną (P), efekt losowy (R) i efekt stały (F), można by dopasować dwa * modele efektów mieszanych ( składnia Lme4 ):
m1 = lmer( P ~ (1|R) + F )
m2 = lmer( P ~ (1+F|R) + F)
Jak rozumiem, drugim modelem jest ten, który pozwala, aby efekt stały zmieniał się na różnych poziomach efektu losowego.
W moich badaniach zwykle używam modeli efektów mieszanych do analizy danych z eksperymentów przeprowadzonych na wielu ludzkich uczestnikach. Uczestnika modeluję jako efekt losowy, a manipulacje eksperymentalne jako efekty ustalone. Myślę, że a priori sensowne jest, aby stopień, w jakim ustalone efekty wpływają na wydajność eksperymentu, był różny dla różnych uczestników. Mam jednak problem z wyobrażeniem sobie okoliczności, w których nie powinienem ani nie pozwolić, aby ustalone efekty różniły się w zależności od poziomu efektu losowego, więc moje pytanie brzmi:
Kiedy nie należy dopuszczać, aby ustalony efekt zmieniał się na różnych poziomach efektu losowego?
źródło
Odpowiedzi:
Nie jestem ekspertem w modelowaniu z efektami mieszanymi, ale pytanie jest o wiele łatwiej odpowiedzieć, jeśli zostanie przeformułowane w kontekście modelowania regresji hierarchicznej. Zatem nasze obserwacje mają dwa indeksy i z indeksem reprezentującym klasę i członków klasy. Modele hierarchiczne pozwalają dopasować regresję liniową, w której współczynniki różnią się w zależności od klasy: F i j i jPij Fij i j
To jest nasza regresja pierwszego poziomu. Regresja drugiego poziomu odbywa się na współczynnikach pierwszego regresji:
kiedy zastąpimy to regresją pierwszego poziomu, otrzymamy
Tutaj są ustalonymi efektami, a są efektami losowymi. Szacunkowe modele mieszane i wariancje .u γ uγ u γ u
Model, który zapisałem, odpowiada
lmer
składniTeraz, jeśli bez losowego terminu, który otrzymamyβ1i=γ01
co odpowiada
lmer
składniPojawia się zatem pytanie, kiedy możemy wykluczyć termin błędu z regresji drugiego poziomu? Odpowiedzią kanoniczną jest to, że gdy jesteśmy pewni, że regresory (tutaj ich nie mamy, ale możemy je uwzględnić, to naturalnie są stałe w ramach klas) w regresji drugiego poziomu w pełni wyjaśniają wariancję współczynników między klasami.
Tak więc w tym konkretnym przypadku, jeśli współczynnik nie zmienia się, lub alternatywnie wariancja jest bardzo mała, powinniśmy się zastanowić, że prawdopodobnie jesteśmy lepsi w pierwszym modelu. u 1 iFij u1i
Uwaga . Podałem tylko wyjaśnienie algebraiczne, ale myślę, że mając to na uwadze, łatwiej jest wymyślić konkretny zastosowany przykład.
źródło
Możesz myśleć o „stałym efekcie” jako o „losowym efekcie” ze składnikiem wariancji równym zero.
Zatem prosta odpowiedź na pytanie, dlaczego nie pozwolisz, aby ustalony efekt się zmieniał, jest niewystarczającym dowodem na „wystarczająco dużą” składową wariancji. Dowody powinny pochodzić zarówno z wcześniejszych informacji, jak i danych. Jest to zgodne z podstawową zasadą „brzytwy okazjonalnej”: nie komplikuj swojego modelu bardziej, niż powinien.
Myślę o liniowych modelach mieszanych w następujący sposób, wypisz regresję wielokrotną w następujący sposób:
Więc to „stała” część modelu, to „losowa” część, a to pozostałość w stylu OLS. Mamy , dla parametrów wariancji „losowego efektu” i . To daje standardowe wyniki , co oznacza, że mamy:Xβ Zu e u∼N(0,D(θ)) θ e∼N(0,σ2I) (Zu+e)∼N(0,ZD(θ)ZT+σ2I)
Porównaj to z regresją OLS (która ma ), a otrzymamy:Z=0
Tak więc „losowa” część modelu może być postrzegana jako sposób na określenie wcześniejszych informacji o strukturze korelacji komponentu szumu lub błędu w modelu. OLS zasadniczo zakłada, że jakikolwiek błąd ze stałej części modelu w jednym przypadku jest bezużyteczny do przewidywania każdego innego błędu, nawet jeśli z całą pewnością znamy stałą część modelu. Dodanie efektu losowego oznacza po prostu, że uważasz, że niektóre błędy mogą być przydatne w przewidywaniu innych błędów.
źródło
To dość stare pytanie z kilkoma bardzo dobrymi odpowiedziami, jednak myślę, że można skorzystać z nowej odpowiedzi, aby zająć się bardziej pragmatyczną perspektywą.
Nie zajmę się problemami opisanymi już w innych odpowiedziach, zamiast tego odniosę się do znanego teraz, choć wolę powiedzieć „niesławny” artykuł Barr i in. (2013), często nazywany po prostu „Zachowaj maksimum”
Barr, DJ, Levy, R., Scheepers, C. and Tily, HJ, 2013. Struktura losowych efektów do testowania potwierdzających hipotez: Utrzymuj wartość maksymalną. Journal of memory and language, 68 (3), s. 255–278.
W tym artykule autorzy twierdzą, że wszystkie ustalone efekty powinny się różnić w zależności od poziomów czynników grupujących (przechwytywanie losowe). Ich argument jest dość przekonujący - w zasadzie, że nie pozwalając im się zmieniać, nakłada ograniczenia na model. Jest to dobrze opisane w innych odpowiedziach. Istnieją jednak potencjalnie poważne problemy z tym podejściem, które opisuje Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. i Baayen, H., 2015. Parsimonious mieszane modele. nadruk arXiv arXiv: 1506.04967
Warto zauważyć, że Bates jest głównym autorem
lme4
pakietu do dopasowywania modeli mieszanych w R, który jest prawdopodobnie najczęściej używanym pakietem dla takich modeli. Bates i wsp. Zauważają, że w wielu rzeczywistych aplikacjach dane po prostu nie będą obsługiwały maksymalnej struktury efektów losowych, często dlatego, że w każdej grupie nie ma wystarczającej liczby obserwacji dla odpowiednich zmiennych. Może się to objawiać w modelach, które nie są zbieżne lub występują w przypadkowych efektach. Świadczy o tym duża liczba pytań na tej stronie dotyczących takich modeli. Zauważają również, że Barr i wsp. Zastosowali stosunkowo prostą symulację, z „dobrze wychowanymi” losowymi efektami jako podstawą do opracowania. Zamiast tego Bates i wsp. Sugerują następujące podejście:W tym samym artykule zauważają również:
I:
Bates i in. (2015)
Z bardziej stosowanej perspektywy należy również rozważyć, czy proces generowania danych, biologiczna / fizyczna / chemiczna teoria leżąca u podstaw danych, powinien prowadzić analityka w kierunku określenia struktury efektów losowych.
źródło