Uzgadnianie notacji dla modeli mieszanych

12

Znam notacje takie jak:

yij=β0+βixij+uj+eij=β0j+βixij+eij
gdzie iβ0j=β0+uj

yij=β0+β1xij+u0j+u1jxij+eij=β0j+β1jxij+eij
gdzie iβ0j=β0+u0jβ1j=β1+u1j

odpowiednio dla modelu losowego przechwytywania i losowego nachylenia + losowego modelu przechwytywania.

Natknąłem się również na notację macierzową / wektorową, o której mówiono mi, że „notacja modelu mieszanego dla dorosłych” (według mojego starszego brata):

y=Xβ+Zb+e
gdzie to ustalone efekty, a to efekty losowe.βb

Jeśli dobrze zrozumiałem, ten drugi zapis jest bardziej ogólny dla tych pierwszych, które są konkretnymi wersjami drugiego.

Chciałbym zobaczyć, w jaki sposób można wyprowadzić te pierwsze.

Joe King
źródło
2
Czy pytasz o wyjaśnienie notacji macierzowej? Pytam dlatego, że to pytanie nie wymaga matematycznego wyprowadzenia: wszystkie twoje formuły mówią dokładnie te same rzeczy, a powiązanie ich ze sobą jest tylko kwestią zrozumienia, jak działa notacja macierzowa.
whuber
@ whuber Rozumiem notację macierzy i algebrę macierzy do pewnego stopnia. Ale nie wiem, jak zacząć od formy matrycowej i dojść do innych form. Prawdopodobnie nie rozumiem czegoś o matrycach X i Z, ale miałem tylko nadzieję, że ktoś to przeliteruje.
Joe King
@ Whuber jest coś, co mogę zrobić, aby poprawić pytanie, czy mówisz, że jest to tak podstawowe, że nie zasługuje na odpowiedź?
Joe King
@JoeKing: Myślę, że mówi, że notacja macierzowa jest z definicji równoważna notacji macierzy. To znaczy, masz już (macierz ixj razy macierz jx1 daje macierz ix1 ), która wynosi . (Możesz w , włączając 1 w )xijβiyiy=Xββ0βX
Wayne
2
@Wayne oba modele mają efekty losowe i efekty stałe. Pierwszy ma losowy punkt przecięcia, podczas gdy drugi ma losowy punkt przecięcia i losowe nachylenie. Gdybym mógł sam to rozgryźć, nie zadałbym tutaj pytania !!!!
Joe King,

Odpowiedzi:

13

Rozważamy model mieszany z losowymi nachyleniami i losowymi przechwytywaniami. Ponieważ mamy tylko jeden regressor, model ten można zapisać jako gdzie oznacza -tą obserwację grupy odpowiedzi, a i odpowiedni czynnik predykcyjny i błąd.

yij=β0+β1xij+u0j+u1jxij+ϵij,
yijijxijϵij

Model ten można wyrazić w notacji macierzowej w następujący sposób:

Y=Xβ+Zb+ϵ,
co odpowiada

Y=[XZ][βb]+ϵ

Załóżmy, że mamy grupy , tj. i niech oznacza liczbę obserwacji w tej grupie. Partycjonowane dla każdej grupy, możemy napisać powyższą formułę jakoJj=1,,Jnjj

[Y1Y2YJ]=[X1Z1000X20Z200XJ000ZJ][βb1b2bJ]+[ϵ1ϵ2ϵJ]

gdzie jest zawierającą wszystkie obserwacje odpowiedzi dla grupy , i są macierzami projektowymi w tym przypadku, a jest ponownie macierz.Yjnj×1jXjZjnj×2ϵjnj×1

Pisząc je, mamy:

Yj=[y1jy2jynjj],Xj=Zj=[1x1j1x2j1xnjj] i ϵj=[ϵ1jϵ2jϵnjj].

Wektory współczynników regresji są zatem

β=(β0β1) , bj=(u0ju1j)

Aby zobaczyć, że te dwie formuły modelowe są rzeczywiście równoważne, spójrzmy na dowolną z grup (powiedzmy -ta).j

Yj=Xjβ+Zjbj+ϵj

Stosując powyższe definicje, można pokazać, że ty rząd wynikowego wektora to po prostu gdzie wynosi od do .i

yij=β0+β1xij+u0j+u1jxij+ϵij,
i1nj
Philipp Burckhardt
źródło
2
+1, chciałbym tylko , że istnieją duże zalety obliczeniowe wynikające z implementacji przy użyciu zamiast pełnej macierzy są zasadniczo rozproszenie wersja przechowywania matrycy Z Z j ZZjZZjZ
probabilityislogic