summary(aov)wykorzystuje tak zwane sumy kwadratów typu I (sekwencyjne). summary(lm)wykorzystuje tak zwane sumy kwadratów typu III, które nie są sekwencyjne. Szczegółowe informacje można znaleźć w odpowiedzi Gunga .
Pamiętaj, że musisz zadzwonić lm(data ~ factor(f1) * factor(2))( aov()automatycznie konwertuje RHS formuły na czynniki). Następnie zwróć uwagę na mianownik ogólnej statystyki w regresji liniowej ( dalsze wyjaśnienia znajdują się w tej odpowiedzi ):t
t = ψ^- ψ0σ^do′( X′X )- 1do----------√
do′( X′X )- 1do różni się dla każdej badanej współczynnika ponieważ wektor zmienia. Natomiast mianownik w teście ANOVA to zawsze MSE.βdofa
Myślę, że pierwsze zdanie tej odpowiedzi jest błędne. Różnica wydaje się wynikać właśnie z różnych rodzajów sum kwadratów: mianowicie typu I vs. typu II / III. Typ I jest sekwencyjny, co lmpodaje, podczas gdy Typ II / III nie. Jest to wyjaśnione dość szczegółowo w odpowiedzi na @ gung, z którą prowadziłeś link.
ameba mówi Przywróć Monikę
@amoeba Co sugerujesz, aby poprawić odpowiedź?
caracal
Zredagowałem pierwszy akapit, sprawdź, czy zgadzasz się z edycją i możesz go dowolnie zmieniać.
ameba mówi Przywróć Monikę
2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))DfSumSqMeanSq F valuePr(>F)
f1 10.5350.53470.5970.462
f2 10.0020.00180.0020.966
f1:f2 10.1210.12080.1350.723Residuals87.1690.8962
summary(lm(data~f1*f2))$coeff
EstimateStd.Error t valuePr(>|t|)(Intercept)0.052220242.7327560.01910900.9852221
f1 -0.179923291.728346-0.10410140.9196514
f2 -0.626371091.728346-0.36241060.7264325
f1:f2 0.401394391.0931020.36720660.7229887
Są to dwa różne kody. z modelu Lm potrzebujesz współczynników. podczas gdy z modelu aov po prostu zestawiasz źródła zmienności. Wypróbuj kod
anova(lm(data~f1*f2))AnalysisofVarianceTableResponse: data
DfSumSqMeanSq F valuePr(>F)
f1 10.53470.534680.59660.4621
f2 10.00180.001770.00200.9657
f1:f2 10.12080.120840.13480.7230Residuals87.16920.89615
Daje to tabelaryczne źródła zmienności prowadzące do tych samych wyników.
Nie wydaje się to odpowiadać na pytanie, które pyta, dlaczego wartości p dla f1i f2różnią się w dwóch podsumowaniach górnego panelu. Wygląda na to, że są tylko pokazując summary(aov(...))i anova(lm(...))w Rmają podobną wydajność.
lm
podaje, podczas gdy Typ II / III nie. Jest to wyjaśnione dość szczegółowo w odpowiedzi na @ gung, z którą prowadziłeś link.Są to dwa różne kody. z modelu Lm potrzebujesz współczynników. podczas gdy z modelu aov po prostu zestawiasz źródła zmienności. Wypróbuj kod
Daje to tabelaryczne źródła zmienności prowadzące do tych samych wyników.
źródło
f1
if2
różnią się w dwóch podsumowaniach górnego panelu. Wygląda na to, że są tylko pokazującsummary(aov(...))
ianova(lm(...))
wR
mają podobną wydajność.