Dlaczego modele efektów mieszanych rozwiązują zależność?

14

Powiedzmy, że interesuje nas, w jaki sposób na oceny egzaminów studenckich wpływa liczba godzin, które studenci studiują. Aby zbadać tę relację, możemy uruchomić następującą regresję liniową:

egzamin. ocenyja=za+β1×godziny. badaneja+mija

Ale jeśli próbkujemy uczniów z kilku różnych szkół, możemy oczekiwać, że uczniowie w tej samej szkole będą bardziej do siebie podobni niż uczniowie z różnych szkół. Aby poradzić sobie z tym problemem zależności, wskazówką w wielu podręcznikach / w Internecie jest uruchomienie mieszanych efektów i wejście do szkoły jako efekt losowy. Model miałby więc : Ale dlaczego to rozwiązuje problem zależności, który był obecny w regresja liniowa?

exam.gradesi=a+β1×hours.studiedi+schoolj+ei

Odpowiedz tak, jakbyś rozmawiał z 12-latkiem

luciano
źródło
To, czy „rozwiązuje” problem zależności, zależy od kontekstu. Ale prawdopodobnie widać, że teraz rozszerzony model ma termin, który może, przynajmniej częściowo, tłumaczyć efekt związany z daną szkołą.
image_doctor

Odpowiedzi:

23

Uwzględnienie losowych terminów w modelu jest sposobem na wywołanie pewnej struktury kowariancji między stopniami. Losowy czynnik dla szkoły wywołuje niezerową kowariancję między różnymi uczniami z tej samej szkoły, podczas gdy wynosi gdy szkoła jest inna.0

Napiszmy swój model jako gdzie s indeksy szkoły i : i indeksy (uczniowie w każdej szkole). Pojęcia szkoła s są niezależnymi zmiennymi losowymi narysowanymi w N ( 0 , τ ) . Do e e , i są niezależnymi zmiennymi losowymi narysowane N ( 0 , Ď

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,i .N(0,σ2)

Wektor ten oczekiwał wartości która jest określona przez liczbę przepracowanych godzin.

[α+hourss,iβ]s,i

Kowariancja pomiędzy i Y s " , i " jest 0 gdy s s ' , co oznacza, że odejście z klas od oczekiwanej wartości są niezależne, gdy uczniowie nie są w tej samej szkole.Ys,iYs,i0ss

Kowariancja pomiędzy i Y s , ja " jest τ kiedy ja I ' , a wariancja Y s , i jest τ + σ 2 : klas uczniów z tej samej szkoły będą miały skorelowane odstępstw od ich wartości oczekiwanych .Ys,iYs,iτiiYs,iτ+σ2

Przykładowe i symulowane dane

Oto krótka symulacja R dla pięćdziesięciu uczniów z pięciu szkół (tutaj biorę ); nazwy zmiennych są samokontrujące: σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

Planujemy odstępstwa od oczekiwanej oceny dla każdego ucznia, czyli warunki wraz ze (kropkowaną linią) średni odstęp dla każdej szkoły:schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

model mieszany

schoolsα+hoursβ

Macierz wariancji dla tego przykładu

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].
Elvis
źródło
1
Elvis: to prawdopodobnie świetna odpowiedź dla osób bardziej zaznajomionych ze statystykami niż ja. Jednak nie mogę z tego wydobyć żadnego znaczenia. Czy możesz edytować swoją odpowiedź w sposób, który może zrozumieć 12-latek?
luciano,
1
A ... 12 lat ?! Łał! Dodam kilka symulacji, jeśli to może pomóc.
Elvis
5
Gotowy. Mam nadzieję że to pomoże. Jeśli nie, proszę sprecyzować, czego nie otrzymujesz. Zauważ, że 12 lat również nie zrozumie pytania ... nie możesz prosić o odpowiedź prostszą niż pytanie.
Elvis