Pytania dotyczące sposobu określania efektów losowych w lmer

55

Niedawno zmierzyłem, w jaki sposób znaczenie nowego słowa jest uzyskiwane na podstawie wielokrotnych ekspozycji (ćwiczenie: od 1 do 10 dnia) poprzez pomiar ERP (EEG), gdy słowo było oglądane w różnych kontekstach. Kontrolowałem także właściwości kontekstu, na przykład jego przydatność do odkrywania nowego znaczenia słowa (wysoki kontra niski). Szczególnie interesuje mnie efekt praktyki (dni). Ponieważ poszczególne nagrania ERP są hałaśliwe, wartości składników ERP są uzyskiwane przez uśrednienie z prób danego stanu. Za pomocą tej lmerfunkcji zastosowałem następującą formułę:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

i

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Widziałem także w literaturze odpowiednik następujących efektów losowych:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Co można osiągnąć za pomocą losowego współczynnika formularza participants:context? Czy istnieje dobre źródło, które pozwoliłoby komuś, kto tylko pobieżnie zna algebrę macierzy, dokładnie zrozumieć, jakie czynniki losowe działają w liniowych modelach mieszanych i jak należy je wybrać?

alwin hoff
źródło

Odpowiedzi:

77

Opiszę, jaki jest model każdego z wezwań do lmer()dopasowania i jak się różnią, a następnie odpowiem na ostatnie pytanie dotyczące wybierania efektów losowych.

Każdego z trzech modeli zawierają stałe efekty dla practice, contextoraz interakcji między nimi. Losowe efekty różnią się w zależności od modelu.

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

zawiera losowe przechwytywanie wspólne dla osób o tej samej wartości participants. Oznacza to, participantże linia regresji każdego z nich jest przesuwana w górę / w dół o losową wartość ze średnią .0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Ten model, oprócz losowego przechwytywania, zawiera również losowe nachylenie w practice. Oznacza to, że tempo, w jakim osoby uczą się w praktyce, jest różne w zależności od osoby. Jeśli dana osoba ma pozytywny efekt losowy, wówczas zwiększa się szybciej z praktyką niż średnia, podczas gdy negatywny efekt losowy wskazuje, że uczy się szybciej z praktyką niż średnia, lub być może gorzej z praktyką, w zależności od wariancji losowej efekt (przy założeniu, że ustalony efekt praktyki jest pozytywny).

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Ten model pasuje do losowego nachylenia i przechwytywania practice(musisz zrobić, (practice-1|...)aby stłumić przechwytywanie), podobnie jak poprzedni model, ale teraz dodałeś również losowe nachylenie i przechwytywanie w współczynniku participants:context, który jest nowym czynnikiem, którego poziomy są każdą kombinacją poziomów obecnych participantsi contextodpowiadające im efekty losowe są wspólne dla obserwacji, które mają tę samą wartość zarówno participantsi context. Aby dopasować ten model, musisz mieć wiele obserwacji, które mają te same wartości dla obu participantsicontextw przeciwnym razie model jest nie do oszacowania. W wielu sytuacjach grupy utworzone przez tę zmienną interakcji są bardzo rzadkie i skutkują bardzo głośnymi / trudnymi do dopasowania modelami efektów losowych, dlatego należy zachować ostrożność, stosując czynnik interakcji jako zmienną grupującą.

Zasadniczo (czytaj: bez nadmiernego komplikowania) należy zastosować efekty losowe, jeśli uważasz, że zmienne grupujące definiują „kieszenie” niejednorodności w zbiorze danych lub że osoby, które dzielą poziom współczynnika grupowania, powinny być ze sobą skorelowane (podczas gdy osoby, które nie powinny być skorelowane) - osiągają to efekty losowe. Jeśli sądzisz, że obserwacje, które dzielą poziomy obu participantsi contextsą bardziej podobne niż suma dwóch części, to odpowiedni może być losowy efekt „interakcji”.

Edycja: Jak wspomina @Henrik w komentarzach, modele, które pasujesz, np .:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

sprawiają, że losowe nachylenie i losowe przechwytywanie są ze sobą skorelowane, a korelacja jest szacowana przez model. Aby ograniczyć model, tak aby losowe nachylenie i losowe przechwytywanie były nieskorelowane (a zatem niezależne, ponieważ są normalnie rozmieszczone), zamiast tego należy dopasować model:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

Wybór między tymi dwoma powinien opierać się na tym, czy uważasz, że na przykład participants z wyższą linią bazową niż średnia (tj. Dodatnie losowe przechwytywanie) może również mieć wyższą szybkość zmian niż średnia (tj. Dodatnie losowe nachylenie). Jeśli tak, pozwoliłbyś na korelację między nimi, a jeśli nie, ograniczyłbyś ich niezależność. (Ponownie w tym przykładzie założono, że stałe nachylenie efektu jest dodatnie).

Makro
źródło
2
Nie chcę być wybredna, ale czy drugi model nie zawiera również korelacji między przecięciem a zboczami. Dodanie stoków powinno brzmieć: lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)czy się mylę? (Niepowiązane: Przepraszam za moją małą edycję twojego postu. Jeśli nie zgadzasz się z wyjaśnieniem, po prostu zmień je z powrotem)
Henrik
@Henrik, tak, masz rację, że szacuje również korelację między dwoma losowymi efektami. Pisząc tę ​​odpowiedź, starałem się dać ogólny obraz tego, co się dzieje z tymi modelami, co nie obejmowało wspominania o korelacji między efektami losowymi, która nie ma prostego opisu „dwóch centów” tak jak nachylenie i przechwytywanie :) W każdym razie nie sądzę, że to pominięcie powoduje, że interpretacja, którą podjąłem w mojej odpowiedzi, jest nieprawidłowa. BTW, dzięki za edycję.
Makro
1
@Henrik, dodałem notatkę na temat różnicy między korelacją efektów losowych a nieskorelowaną, co moim zdaniem poprawia odpowiedź - dziękuję za jej wskazanie.
Makro
Dzięki. Próbuję zająć się kwestią modelowania mieszanego, a także zmagam się z pytaniem, jak i kiedy użyć struktury losowych efektów, o których chciałem się tylko upewnić. Podsumowując, świetna odpowiedź (+1).
Henrik
1
@pom, dziękuję za komplement. Re: Twój komentarz, przetestowałem to na danych symulowanych i myślę, że masz to wstecz. Drugi model pod moją edycją ma jeden parametr mniejszy niż pierwszy. Wynika to z faktu, że drugi model ogranicza korelację między dwoma efektami losowymi do zera. Poza tym modele są takie same. Nie jestem pewien, co napotykasz, ale pomógłby to powtarzalny przykład. Oto moja:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
Makro
13

@Macro podał tutaj dobrą odpowiedź, chcę tylko dodać jedną drobną kwestię. Jeśli niektóre osoby w Twojej sytuacji używają:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Podejrzewam, że popełniają błąd. Rozważ: (practice|participants)oznacza, że ​​istnieje losowe nachylenie (i przecięcie) dla efektu practicedla każdego participant, natomiast (practice|participants:context)oznacza, że ​​istnieje losowe nachylenie (i przecięcie) dla efektu practicedla każdej participant by context kombinacji . To jest w porządku, jeśli to, co chcą, ale podejrzewam, że chcą (practice:context|participants), co oznacza, że nie jest przypadkowa nachylenie (a osią) dla efektu interakcji z practice by contextdla każdego participant.

gung - Przywróć Monikę
źródło
4

W modelu efektów losowych lub mieszanych efekt losowy jest używany, gdy chcesz potraktować zaobserwowany efekt tak, jakby był on narysowany z pewnego rozkładu prawdopodobieństwa efektów.

Jednym z najlepszych przykładów, jakie mogę podać, jest modelowanie danych z badania klinicznego z wieloośrodkowego badania klinicznego. Efekt witryny jest często modelowany jako efekt losowy. Odbywa się to, ponieważ około 20 witryn faktycznie używanych w teście pochodzi z znacznie większej grupy potencjalnych witryn. W praktyce wybór mógł nie być przypadkowy, ale nadal przydatne może być traktowanie go tak, jakby było.

Chociaż efekt witryny można by modelować jako efekt stały, trudno byłoby uogólnić wyniki na większą populację, gdybyśmy nie wzięli pod uwagę faktu, że efekt dla innego wybranego zestawu 20 witryn byłby inny. Traktowanie go jako efektu losowego pozwala nam to uwzględnić w ten sposób.

Michael Chernick
źródło
1
-1, ponieważ ta odpowiedź nie dotyczy tutaj faktycznych pytań.
ameba mówi Przywróć Monikę