Mam 2 zmienne zależne (DV), na które na każdy wynik może mieć wpływ zestaw 7 zmiennych niezależnych (IV). DV są ciągłe, podczas gdy zestaw IV składa się z kombinacji zmiennych ciągłych i binarnie kodowanych. (W kodzie poniżej zmienne ciągłe są pisane dużymi literami, a zmienne binarne małymi literami.)
Celem badania jest odkrycie, jak zmienne IV wpływają na te DV. Zaproponowałem następujący model wielowymiarowej regresji wielokrotnej (MMR):
my.model <- lm(cbind(A, B) ~ c + d + e + f + g + H + I)
Aby zinterpretować wyniki, nazywam dwie instrukcje:
summary(manova(my.model))
Manova(my.model)
Wyniki obu połączeń są wklejone poniżej i znacznie się różnią. Czy ktoś może wyjaśnić, które oświadczenie należy wybrać, aby właściwie podsumować wyniki MMR i dlaczego? Wszelkie sugestie będą mile widziane.
Dane wyjściowe za pomocą summary(manova(my.model))
instrukcji:
> summary(manova(my.model))
Df Pillai approx F num Df den Df Pr(>F)
c 1 0.105295 5.8255 2 99 0.004057 **
d 1 0.085131 4.6061 2 99 0.012225 *
e 1 0.007886 0.3935 2 99 0.675773
f 1 0.036121 1.8550 2 99 0.161854
g 1 0.002103 0.1043 2 99 0.901049
H 1 0.228766 14.6828 2 99 2.605e-06 ***
I 1 0.011752 0.5887 2 99 0.556999
Residuals 100
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dane wyjściowe za pomocą Manova(my.model)
instrukcji:
> library(car)
> Manova(my.model)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
c 1 0.030928 1.5798 2 99 0.21117
d 1 0.079422 4.2706 2 99 0.01663 *
e 1 0.003067 0.1523 2 99 0.85893
f 1 0.029812 1.5210 2 99 0.22355
g 1 0.004331 0.2153 2 99 0.80668
H 1 0.229303 14.7276 2 99 2.516e-06 ***
I 1 0.011752 0.5887 2 99 0.55700
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
lm
funkcji, przeprowadzam regresję wielowymiarową tylko przez podanie więcej niż jednej zmiennej respose wlm
funkcji. Nauczyłem się, że używanielm
funkcji, gdy moje dane są w rzeczywistości wielowymiarowe, daje błędny wynik dla błędu standardowego. Ale czy w tym przypadkumy.model <- lm(cbind(A, B) ~ c + d + e + f + g + H + I);
nievcov(my.model )
doceni się błędu standardowego, czylm
inteligentnie dostosuje korelację między zmiennymi zależnymi?Cóż, wciąż nie mam wystarczającej liczby punktów, aby skomentować poprzednią odpowiedź i dlatego piszę ją jako osobną odpowiedź, więc proszę wybacz mi. (Jeśli to możliwe, popchnij mnie ponad 50 punktów rep;)
Oto 2 centy: Testowanie błędów typu I, II i III to zasadniczo warianty z powodu niezrównoważenia danych. (Defn niezrównoważony: brak równej liczby obserwacji w każdej z warstw). Jeśli dane są zrównoważone, testy błędów typu I, II i III dają dokładnie takie same wyniki.
Co się dzieje, gdy dane są niezrównoważone?
Rozważ model, który obejmuje dwa czynniki A i B; istnieją zatem dwa główne efekty i interakcja, AB. SS (A, B, AB) oznacza pełny model SS (A, B) oznacza model bez interakcji. SS (B, AB) wskazuje model, który nie uwzględnia efektów czynnika A i tak dalej.
Ta notacja ma teraz sens. Pamiętaj o tym.
Typ I, zwany także „sekwencyjną” sumą kwadratów:
1)
SS(A) for factor A.
2)
SS(B | A) for factor B.
3)
SS(AB | B, A) for interaction AB.
Tak więc najpierw oceniamy główny efekt A, efekt B, biorąc pod uwagę A, a następnie oceniamy interakcję AB, biorąc pod uwagę A i B (w tym przypadku, gdy dane są niezrównoważone, pojawiają się różnice. Gdy najpierw oceniamy główny efekt, a następnie główny inny i następnie interakcja w „sekwencji”)
Typ II:
1)
SS(A | B) for factor A.
2)
SS(B | A) for factor B.
Test typu II znaczenie głównego efektu A po B i B po A. Dlaczego nie ma SS (AB | B, A)? Zastrzeżenie polega na tym, że metody typu II można użyć tylko wtedy, gdy już przetestowaliśmy interakcję jako nieistotną. Biorąc pod uwagę brak interakcji (SS (AB | B, A) jest nieistotny), test typu II ma lepszą moc niż typ III
Typ III:
1)
SS(A | B, AB) for factor A.
2)
SS(B | A, AB) for factor B.
Testowaliśmy więc interakcję podczas typu II i interakcja była znacząca. Teraz musimy użyć typu III, ponieważ uwzględnia on termin interakcji.
Jak już powiedział @caracal, kiedy dane są zrównoważone, czynniki są ortogonalne, a typy I, II i III dają takie same wyniki. Mam nadzieję, że to pomoże !
Ujawnienie: Większość nie jest moją pracą. Znalazłem link do tej doskonałej strony i miałem ochotę ją jeszcze bardziej ułożyć.
źródło