Jak powinienem zrozumieć anova
wynik, porównując dwa modele?
Przykład:
Res.Df RSS Df Sum of Sq F Pr(>F)
1 9 54.032
2 7 4.632 2 49.4 37.329 0.0001844 ***
Strona podręcznika stwierdza: „Obliczanie tabel wariancji (lub dewiacji) dla jednego lub większej liczby dopasowanych obiektów modelu”. Jednak nasz profesor wspomniał, że można to wykorzystać do porównania modeli - to właśnie zamierzam zrobić.
Dlatego zakładam, że mógłbym użyć anova(model1, model2)
i uzyskać wartość p, która mówi mi, czy mam odrzucić hipotezę zerową: „modele są takie same”.
Czy mogę stwierdzić, że jeśli wartość p jest mniejsza niż (powiedzmy) 0,05, modele różnią się znacznie?
r
regression
anova
petrbel
źródło
źródło
Y ~ X + X^2
a drugiY ~ X + X^2 + X^3
Odpowiedzi:
Zakładając, że twoje modele są zagnieżdżone (tj. Ta sama zmienna wyniku, a model 2 zawiera wszystkie zmienne modelu 1 plus 2 dodatkowe zmienne), wówczas wyniki analizy ANOVA stwierdzają, że 2 dodatkowe zmienne łącznie uwzględniają wystarczającą wariancję, że można odrzucić hipotezę zerową, że współczynniki dla obu zmiennych wynoszą 0. To jest efektywne, co powiedziałeś. Jeśli oba współczynniki są równe 0, modele są takie same.
Dla dodatkowej uwagi, na wypadek, gdybyś nie był świadomy, ANOVA zawsze jest odpowiednikiem robienia porównań modeli. Kiedy patrzysz na ANOVA dla pojedynczego modelu, daje to efekty dla każdej zmiennej predykcyjnej. Jest to równoważne z przeprowadzeniem porównania modelu między pełnym modelem a modelem usuwającym jedną ze zmiennych. to znaczyM.o de l 1 : y= a + bx1+ cx2)+ dx3); M.o de l 2 : y= a + bx1+ cx2) poda sumę kwadratów (typ III) i statystyki testowe x3) . Zauważ, że R daje ci sumę kwadratów typu I. Jeśli potrzebujesz typu III, użyj
car::Anova
lub użyjanova
i ciągle zmieniaj kolejność zmiennych w modelu i weź tylko sumę kwadratów dla ostatniej zmiennej.źródło
anova()
zastosowano jeden model?