Notacja do modelowania wielopoziomowego

10

Potrzeby jeden wzór, aby określić za szkolenie wielopoziomowego modelu (korzystając lmerz lme4 Rbiblioteki) zawsze mnie trafia. Czytałem niezliczone podręczniki i samouczki, ale nigdy nie zrozumiałem tego poprawnie.

Oto przykład z tego samouczka , który chciałbym zobaczyć sformułowany w równaniu. Staramy się modelować częstotliwość głosu jako funkcję płci (kobiety mają wyższy ton głosu niż mężczyźni w ogóle) i postawy osoby (niezależnie od tego, czy odpowiedziała uprzejmie czy nieformalnie) w różnych scenariuszach. Ponadto, jak widać z subjectkolumny, każda osoba była kilkakrotnie poddawana pomiarom.

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject, genderI attitudeczynniki (z informali femaleuważane za poziomów bazowych attitudei genderw równaniach poniżej). Jednym z pomysłów jest wytrenowanie modelu z różnymi punktami przechwytywania dla każdego subjecti scenario:

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

Jeśli moje rozumienie zapisu jest prawidłowe, odpowiada to:

pol i + γ mężczyzna iyi=aj[i]1+ak[i]2+β attitudepoli+γ gendermalei

gdzie oznacza punkt danych , oznacza poziom grupy dla i oznacza poziom grupy dla punktu danych. i są wskaźnikami binarnymi.I T H J [ I ] k [ I ] i T h pol męskiejiithj[i]subjectk[i]scenarioithattitudepolgendermale

Aby wprowadzić losowe nachylenia dla nastawienia, możemy napisać:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

Ponownie, jeśli moje zrozumienie jest jasne, odpowiada to:

pol i + γ male iyi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepolja+γ gendermęskija

Jakie równanie odpowiada następującemu Rpoleceniu?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)
abhinavkulkarni
źródło
1
niezbyt rozsądny; przyjmuje się, że średnie nachylenie populacji w stosunku do nastawienia wynosi zero ...
Ben Bolker
@BenBolker: Hej, możesz napisać to w formie równania? Czy moje poprzednie równania są prawidłowe? W ostatnim modelu nadal widzę, attitudeże jestem uwarunkowany subjecti scenario.
abhinavkulkarni

Odpowiedzi:

12

Napisałbym

~ attitude + gender + (1|subject) + (1|scenario)

tak jak

yjaβ0+β1ja(nastawienie=pol)+β2)ja(płeć=męski)+b1,jot[ja]+b2),k[ja]+ϵjab1N.(0,σ12))b2)N.(0,σ2)2))ϵN.(0,σr2))
gdzie oznacza współczynnik o stałym efekcie, oznacza zmienną losową, jest funkcją wskaźnika (jest to w zasadzie to samo, co powiedziałeś powyżej, tylko nieco inna notacja).βbja
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

dodaje zmienność między podmiotami w odpowiedzi na attitudei scenario(moglibyśmy w równoważny sposób zapisać część efektów losowych jako (attitude|subject) + (attitude|scenario), tj. pozostawiając domyślny punkt przecięcia; jest to kwestia gustu). Teraz

yjaβ0+β1ja(nastawienie=pol)+β2)ja(płeć=męski)+b1,jot[ja]+b3),jot[ja]ja(nastawienie=pol)+b2),k[ja]+b4,k[ja]ja(nastawienie=pol)+ϵja{b1,b3)}MVN(0,Σ1){b2),b4}MVN(0,Σ2))ϵN.(0,σr2))
gdzie i są nieustrukturyzowanymi macierzami wariancji-kowariancji, tj. są symetryczne i dodatnie (pół) określony, ale nie ma innych ograniczeń: i podobnie dla .Σ1Σ2)
Σ1=(σ12)σ13σ13σ3)2))
Σ2)

terminów może być pouczające w następujący sposób: dzięki czemu możesz zobaczyć, które efekty losowe wpływają na przechwytywanie, a które na reakcję na postawę.

yja(β0+b1,jot[ja]+b2),k[ja])+(β1+b3),jot[ja]+b4,k[ja])ja(nastawienie=pol)+β2)ja(płeć=męski)+ϵja

Teraz, jeśliattitude termin o ustalonym efekcie (tj. lub termin ze wzoru), zobaczysz (bez przepisywania wszystkiego), że ponieważ zakłada się, że efekty losowe mają zerową średnią, będziemy przy założeniu, że średnia reakcja na postawę między podmiotami i scenariuszami będzie wynosić dokładnie zero, podczas gdy nadal istnieje zróżnicowanie między podmiotami i scenariuszami. Nie powiem, że to nigdy nie ma sensu ze statystycznego punktu widzenia, ale rzadko tak jest. Od czasu do czasu dyskutuje się na ten temat na liście mailingowej [email protected] ... (lub może być gdzieś omawiany na StackExchange - jeśli nie, byłby dobrym następcą -up pytanie SE ...)β1=0attitude

Ben Bolker
źródło