Na tym forum toczy się wiele dyskusji na temat właściwego sposobu określania różnych modeli hierarchicznych lmer
.
Pomyślałem, że wspaniale byłoby mieć wszystkie informacje w jednym miejscu. Kilka pytań na początek:
- Jak określić wiele poziomów, gdzie jedna grupa jest zagnieżdżony w drugiej: jest to
(1|group1:group2)
albo(1+group1|group2)
? - Jaka jest różnica między
(~1 + ....)
i(1 | ...)
a(0 | ...)
itp.? - Jak określić interakcje na poziomie grupy?
lme4
pakietu można znaleźć na CRANlmer
ma ogólne znaczenie statystyczne, a zatem nie jest wyłącznie kwestią programowania. Dlatego głosuję za utrzymaniem tego wątku otwartego.Odpowiedzi:
Załóżmy, że masz zmienną V1 przewidywaną przez zmienną kategoryczną V2, która jest traktowana jako efekt losowy, i zmienną ciągłą V3, która jest traktowana jako liniowy efekt stały. Używając składni Lmer, najprostszym modelem (M1) jest:
Ten model oszacuje:
P1: Globalny przechwytywanie
P2: Przechwytuje efekt losowy dla V2 (tj. Dla każdego poziomu V2, odchylenie przechwytywania tego poziomu od globalnego przechwytywania)
P3: Pojedyncza globalna ocena wpływu (nachylenia) V3
Następny najbardziej złożony model (M2) to:
Ten model szacuje wszystkie parametry z M1, ale dodatkowo oszacuje:
P4: Wpływ V3 na każdym poziomie V2 (a dokładniej stopień, w jakim efekt V3 na danym poziomie odbiega od globalnego efektu V3), jednocześnie wymuszając zerową korelację między odchyleniami przechwytującymi a odchyleniami efektu V3 między poziomami V2 .
To ostatnie ograniczenie jest złagodzone w ostatecznym najbardziej złożonym modelu (M3):
W którym szacowane są wszystkie parametry z M2, umożliwiając jednocześnie korelację między odchyleniami przechwytującymi a odchyleniami efektu V3 w obrębie poziomów V2. Tak więc w M3 szacowany jest dodatkowy parametr:
P5: Korelacja między odchyleniami przechwytującymi a odchyleniami V3 na różnych poziomach V2
Zwykle obliczane są pary modeli, takie jak M2 i M3, a następnie porównywane w celu oceny dowodów na korelacje między ustalonymi efektami (w tym globalnym przechwytywaniem).
Teraz rozważ dodanie kolejnego predyktora efektu stałego, V4. Model:
oszacowałby:
P1: Globalny przechwytywanie
P2: Pojedyncza globalna ocena wpływu V3
P3: Pojedyncza globalna ocena wpływu V4
P4: Pojedyncza globalna ocena dla interakcji między V3 i V4
P5: Odchylenia punktu przecięcia od P1 na każdym poziomie V2
P6: Odchylenia efektu V3 od P2 na każdym poziomie V2
P7: Odchylenia efektu V4 od P3 na każdym poziomie V2
P8: Odchylenia interakcji V3-przez-V4 od P4 na każdym poziomie V2
P9 Korelacja między P5 i P6 na różnych poziomach V2
P10 Korelacja między P5 i P7 na różnych poziomach V2
P11 Korelacja między P5 i P8 na różnych poziomach V2
P12 Korelacja między P6 i P7 na różnych poziomach V2
P13 Korelacja między P6 i P8 na różnych poziomach V2
P14 Korelacja między P7 i P8 na różnych poziomach V2
Uff , to dużo parametrów! I nawet nie zadałem sobie trudu, aby wymienić parametry wariancji oszacowane przez model. Co więcej, jeśli masz zmienną kategorialną z więcej niż 2 poziomami, którą chcesz zamodelować jako efekt stały, zamiast jednego efektu dla tej zmiennej zawsze będziesz oceniać efekty k-1 (gdzie k jest liczbą poziomów) , tym samym jeszcze bardziej eksplodując liczbę parametrów, które model ma oszacować.
źródło
lmer
Y~X+Z+(1|group)+(0+X|Z)
group
Ogólna sztuczka polega na tym, że, jak wspomniano w innej odpowiedzi , formuła jest zgodna z formą
dependent ~ independent | grouping
. Zasadniczogrouping
jest to czynnik losowy, można uwzględnić czynniki stałe bez grupowania i można mieć dodatkowe czynniki losowe bez żadnego czynnika stałego (model tylko przechwytujący).+
Pomiędzy czynnikami oznacza brak oddziaływania, A*
oznacza interakcję.W przypadku czynników losowych masz trzy podstawowe warianty:
(1 | random.factor)
(0 + fixed.factor | random.factor)
(1 + fixed.factor | random.factor)
Należy zauważyć, że wariant 3 ma nachylenie i przecięcie obliczone w tej samej grupie, tj. W tym samym czasie. Jeśli chcemy, aby nachylenie i przecięcie były obliczane niezależnie, tj. Bez jakiejkolwiek zakładanej korelacji między nimi, potrzebujemy czwartego wariantu:
(1 | random.factor) + (0 + fixed.factor | random.factor)
. Alternatywnym sposobem napisania tego jest użycie notacji z podwójnym słupkiemfixed.factor + (fixed.factor || random.factor)
.W innej odpowiedzi na to pytanie jest także miłe podsumowanie, na które powinieneś spojrzeć.
Jeśli masz ochotę trochę zagłębić się w matematykę, Barr i in. (2013)
lmer
całkiem ładnie podsumowują składnię w Tabeli 1, dostosowanej tutaj, aby spełnić ograniczenia bezobsługowej tabldown. Ten artykuł dotyczył danych psycholingwistycznych, więc dwa losowe efekty toSubject
iItem
.Modele i równoważna
lme4
składnia formuły:Y ∼ X+(1∣Subject)
Y ∼ X+(1 + X∣Subject)
Y ∼ X+(1 + X∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(1∣Item)
Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
Y ∼ X+(0 + X∣Subject)+(1∣Item)
Bibliografia:
Barr, Dale J, R. Levy, C. Scheepers und HJ Tily (2013). Struktura efektów losowych do testowania hipotez potwierdzających: zachowaj maksymalną wartość . Journal of Memory and Language, 68: 255–278.
źródło
|
Symbol oznacza czynnik grupujący w metodach mieszanych.Zgodnie z Pinheiro i Bates:
W zależności od metody, której używasz do przeprowadzania analizy metod mieszanych
R
, konieczne może być utworzeniegroupedData
obiektu, aby móc korzystać z grupowania w analizie (szczegóły wnlme
pakiecie,lme4
wydaje się , że nie jest to potrzebne). Nie mogę mówić o sposobie, w jaki określiłeślmer
instrukcje modelu, ponieważ nie znam twoich danych. Jednak posiadanie wielokrotności(1|foo)
w linii modelu jest niezwykłe z tego, co widziałem. Co próbujesz wymodelować?źródło