Czy przekształcenie wielowymiarowego modelu regresji liniowej jako wielokrotnej regresji liniowej jest całkowicie równoważne? Ja nie odnosząc się po prostu działa oddzielnych regresji.
Przeczytałem o tym w kilku miejscach (Bayesian Data Analysis - Gelman i wsp. Oraz Multivariate Old School - Marden), że wielowymiarowy model liniowy można łatwo sparametryzować jako regresję wielokrotną. Jednak żadne źródło w ogóle o tym nie rozwija. Zasadniczo po prostu o tym wspominają, a następnie kontynuują korzystanie z modelu wielowymiarowego. Matematycznie napiszę najpierw wersję na wielu odmianach,
gdzie zmienne pogrubione to macierze z ich rozmiarami poniżej nich. Jak zwykle,Yto dane,Xto macierz projektowa,Rto zwykle reszty rozmieszczone, aBto to, czym jesteśmy zainteresowani wnioskować.
Aby ponownie sparametryzować to jako znaną wielokrotną regresję liniową, wystarczy przepisać zmienne w następujący sposób:
gdzie zastosowanymi reparametryzacjami są , β = r o w ( B ) i D = X ⊗ I n . r o w ( ) oznacza, że rzędy matrycy są ułożone od końca do końca w długi wektor, a ⊗ jest produktem Kroneckera lub zewnętrznym.
Jeśli więc jest to tak łatwe, po co męczyć się z pisaniem książek na modelach wielowymiarowych, statystykami testów itp.? Najbardziej efektywne jest najpierw przekształcenie zmiennych i użycie typowych technik jednowymiarowych. Jestem pewien, że istnieje dobry powód, po prostu trudno mi się zastanowić nad jednym, przynajmniej w przypadku modelu liniowego. Czy zdarzają się sytuacje z wielowymiarowym modelem liniowym i normalnie rozłożonymi błędami losowymi, w których ta zmiana parametrów nie ma zastosowania, lub ogranicza możliwości analizy, którą można przeprowadzić?
Źródła Widziałem to: Marden - Statystyki na wielu odmianach: Old School. Rozdziały 5.3–5.5. Książka jest dostępna bezpłatnie pod adresem : http://istics.net/stat/
Gelman i in. - Analiza danych bayesowskich. Mam drugie wydanie, aw tej wersji jest mały akapit w rozdz. 19 „Modele regresji wielowymiarowej” zatytułowane: „Równoważny model regresji wielowymiarowej”
Zasadniczo, czy możesz zrobić wszystko z równoważnym modelem regresji liniowej jednowymiarowej, co można zrobić z modelem wielowymiarowym? Jeśli tak, to po co w ogóle opracowywać metody wielowymiarowych modeli liniowych?
A co z podejściami bayesowskimi?
Odpowiedzi:
Uważam, że odpowiedź brzmi „nie”.
Jeśli Twoim celem jest po prostu oszacowanie efektów (parametry w ) lub dalsze przewidywanie w oparciu o model, to tak, nie ma znaczenia, aby przyjąć formułę modelu między nimi.B
Jednak w celu wnioskowania statystycznego, szczególnie w celu przeprowadzenia klasycznego testu istotności, sformułowanie wielowymiarowe wydaje się praktycznie niezastąpione. Mówiąc dokładniej, mogę posłużyć się typową analizą danych w psychologii jako przykładem. Dane od badanych są wyrażone jakon
gdziek−1 X t Y
W powyższym sformułowaniu dowolną ogólną hipotezę liniową można łatwo wyrazić jako
gdzieL L C 0
Piękno systemu wielowymiarowego polega na jego oddzieleniu między dwoma typami zmiennych, między podmiotem a wewnątrz podmiotu. To rozdzielenie pozwala na łatwe sformułowanie trzech rodzajów testów istotności w ramach wielowymiarowych: klasyczne testowanie na wielu odmianach, testowanie na wielu odmianach z powtarzanymi pomiarami i testowanie na wielu odmianach z powtarzanymi pomiarami. Co więcej, testowanie Mauchly pod kątem naruszenia sferyczności i odpowiednie metody korekcji (Greenhouse-Geisser i Huynh-Feldt) również stają się naturalne dla testów jednowymiarowych w systemie wielowymiarowym. Właśnie w ten sposób pakiety statystyczne zaimplementowały te testy, takie jak samochód w R, GLM w IBM SPSS Statistics i instrukcja REPEATED w PROC GLM SAS.
Nie jestem pewien, czy sformułowanie ma znaczenie w analizie danych bayesowskich, ale wątpię, aby powyższe możliwości testowania można było sformułować i wdrożyć na platformie jednoczynnikowej.
źródło
Oba modele są równoważne, jeśli dopasujesz odpowiednią strukturę wariancji-kowariancji. W przekształconym modelu liniowym musimy dopasować macierz wariancji-kowariancji komponentu błędu do produktu Kronecker, który ma ograniczoną dostępność w dostępnych programach komputerowych. Teoria modeli liniowych - modele jednowymiarowe, wielowymiarowe i mieszane to doskonałe odniesienie do tego tematu.
Edytowane
Oto kolejna miła referencja dostępna za darmo.
źródło