Rzucanie wielowymiarowego modelu liniowego jako regresji wielokrotnej

20

Czy przekształcenie wielowymiarowego modelu regresji liniowej jako wielokrotnej regresji liniowej jest całkowicie równoważne? Ja nie odnosząc się po prostu działa t oddzielnych regresji.

Przeczytałem o tym w kilku miejscach (Bayesian Data Analysis - Gelman i wsp. Oraz Multivariate Old School - Marden), że wielowymiarowy model liniowy można łatwo sparametryzować jako regresję wielokrotną. Jednak żadne źródło w ogóle o tym nie rozwija. Zasadniczo po prostu o tym wspominają, a następnie kontynuują korzystanie z modelu wielowymiarowego. Matematycznie napiszę najpierw wersję na wielu odmianach,

gdzie zmienne pogrubione to macierze z ich rozmiarami poniżej nich. Jak zwykle,Yto dane,Xto macierz projektowa,Rto zwykle reszty rozmieszczone, aBto to, czym jesteśmy zainteresowani wnioskować.

Yn×t=Xn×kBk×t+Rn×t,
YXRB

Aby ponownie sparametryzować to jako znaną wielokrotną regresję liniową, wystarczy przepisać zmienne w następujący sposób:

ynt×1=Dnt×nkβnk×1+rnt×1,

gdzie zastosowanymi reparametryzacjami są , β = r o w ( B ) i D = XI n . r o w ( ) oznacza, że ​​rzędy matrycy są ułożone od końca do końca w długi wektor, a jest produktem Kroneckera lub zewnętrznym.y=row(Y)β=row(B)D=XInrow()

Jeśli więc jest to tak łatwe, po co męczyć się z pisaniem książek na modelach wielowymiarowych, statystykami testów itp.? Najbardziej efektywne jest najpierw przekształcenie zmiennych i użycie typowych technik jednowymiarowych. Jestem pewien, że istnieje dobry powód, po prostu trudno mi się zastanowić nad jednym, przynajmniej w przypadku modelu liniowego. Czy zdarzają się sytuacje z wielowymiarowym modelem liniowym i normalnie rozłożonymi błędami losowymi, w których ta zmiana parametrów nie ma zastosowania, lub ogranicza możliwości analizy, którą można przeprowadzić?

Źródła Widziałem to: Marden - Statystyki na wielu odmianach: Old School. Rozdziały 5.3–5.5. Książka jest dostępna bezpłatnie pod adresem : http://istics.net/stat/

Gelman i in. - Analiza danych bayesowskich. Mam drugie wydanie, aw tej wersji jest mały akapit w rozdz. 19 „Modele regresji wielowymiarowej” zatytułowane: „Równoważny model regresji wielowymiarowej”

Zasadniczo, czy możesz zrobić wszystko z równoważnym modelem regresji liniowej jednowymiarowej, co można zrobić z modelem wielowymiarowym? Jeśli tak, to po co w ogóle opracowywać metody wielowymiarowych modeli liniowych?

A co z podejściami bayesowskimi?

bill_e
źródło
To dobre pytanie. Być może możesz poprosić o więcej w kategoriach fundamentów niż konstrukcji.
Subhash C. Davar,
1
Co rozumiesz przez fundamenty, a nie strukturę? Czy mógłbyś opracować?
bill_e
Mogę zauważyć, że nauczyłem się tylko dwóch prac w ramach mojego pierwszego i podyplomowego stopnia dawno temu, nie mam uwodzenia w opisach technicznych. Rozumiem, że analiza wielowymiarowa ma różne założenia w porównaniu z wielokrotną regresją liniową lub po prostu modelem regresji liniowej. Założenia analizy wielowymiarowej są różne, tzn. Przeważają oczekiwania matematyczne. wielokrotna regresja liniowa przyjmuje pewne inne założenia, które prowadzą do heteroscedatyczności. Mam tutaj na myśli strukturę, która odnosi się do twoich równań.
Subhash C. Davar,
Powinieneś powiedzieć to wyraźnie w tytule lub na początku, czy mówisz o wielowymiarowym (ogólnym) modelu liniowym, czy o bayesowskiej regresji wielowymiarowej .
ttnphns,
1
Ok, więc .. to nie jest moje podejście, wskazałem dwa miejsca, w których to widziałem. Podejście to stanowi sedno problemu. Jaka jest różnica między wersją wielowymiarową a sparametryzowaną wersją jednowymiarową?
bill_e

Odpowiedzi:

5

Zasadniczo, czy możesz zrobić wszystko z równoważnym modelem regresji liniowej jednowymiarowej, co można zrobić z modelem wielowymiarowym?

Uważam, że odpowiedź brzmi „nie”.

Jeśli Twoim celem jest po prostu oszacowanie efektów (parametry w ) lub dalsze przewidywanie w oparciu o model, to tak, nie ma znaczenia, aby przyjąć formułę modelu między nimi.B

Jednak w celu wnioskowania statystycznego, szczególnie w celu przeprowadzenia klasycznego testu istotności, sformułowanie wielowymiarowe wydaje się praktycznie niezastąpione. Mówiąc dokładniej, mogę posłużyć się typową analizą danych w psychologii jako przykładem. Dane od badanych są wyrażone jakon

Yn×t=Xn×kBk×t+Rn×t,

gdzie k1XtY

W powyższym sformułowaniu dowolną ogólną hipotezę liniową można łatwo wyrazić jako

LBM=C,

gdzie LLC0

Piękno systemu wielowymiarowego polega na jego oddzieleniu między dwoma typami zmiennych, między podmiotem a wewnątrz podmiotu. To rozdzielenie pozwala na łatwe sformułowanie trzech rodzajów testów istotności w ramach wielowymiarowych: klasyczne testowanie na wielu odmianach, testowanie na wielu odmianach z powtarzanymi pomiarami i testowanie na wielu odmianach z powtarzanymi pomiarami. Co więcej, testowanie Mauchly pod kątem naruszenia sferyczności i odpowiednie metody korekcji (Greenhouse-Geisser i Huynh-Feldt) również stają się naturalne dla testów jednowymiarowych w systemie wielowymiarowym. Właśnie w ten sposób pakiety statystyczne zaimplementowały te testy, takie jak samochód w R, GLM w IBM SPSS Statistics i instrukcja REPEATED w PROC GLM SAS.

Nie jestem pewien, czy sformułowanie ma znaczenie w analizie danych bayesowskich, ale wątpię, aby powyższe możliwości testowania można było sformułować i wdrożyć na platformie jednoczynnikowej.

bluepole
źródło
Rozumiem, to ma sens. Dziękuję za świetną odpowiedź. Chciałbym też usłyszeć perspektywę bayesowską.
bill_e
@PeterRabbit Jeśli podoba Ci się odpowiedź, proszę wyrazić wdzięczność dla bluepole, akceptując jego odpowiedź. Dostanie punkty.
pteetor,
Zrobię to, tylko trochę się zastanawiam, czy ktoś nie zaoferuje perspektywy Bayesa.
bill_e
4

Oba modele są równoważne, jeśli dopasujesz odpowiednią strukturę wariancji-kowariancji. W przekształconym modelu liniowym musimy dopasować macierz wariancji-kowariancji komponentu błędu do produktu Kronecker, który ma ograniczoną dostępność w dostępnych programach komputerowych. Teoria modeli liniowych - modele jednowymiarowe, wielowymiarowe i mieszane to doskonałe odniesienie do tego tematu.

Edytowane

Oto kolejna miła referencja dostępna za darmo.

MYaseen208
źródło
2
No dobrze, więc w normalnym modelu jednowymiarowym nie ma żadnej struktury kowariancji „wewnątrz” DV. Dlatego testy hipotez dotyczące tego nie istnieją. Dziękuję Ci! Zobaczę, czy mogę odebrać tę książkę.
bill_e