Jak korzystać z anova do porównywania dwóch modeli?

9

Jak powinienem zrozumieć anovawynik, porównując dwa modele?

Przykład:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

Strona podręcznika stwierdza: „Obliczanie tabel wariancji (lub dewiacji) dla jednego lub większej liczby dopasowanych obiektów modelu”. Jednak nasz profesor wspomniał, że można to wykorzystać do porównania modeli - to właśnie zamierzam zrobić.

Dlatego zakładam, że mógłbym użyć anova(model1, model2)i uzyskać wartość p, która mówi mi, czy mam odrzucić hipotezę zerową: „modele są takie same”.

Czy mogę stwierdzić, że jeśli wartość p jest mniejsza niż (powiedzmy) 0,05, modele różnią się znacznie?

petrbel
źródło
W twoim przykładzie, czy model1 i model2 są zagnieżdżone? To znaczy, czy oba modele mają wspólny zestaw zmiennych predykcyjnych i tę samą zmienną wynikową, ale jeden model ma jedną lub więcej dodatkowych zmiennych predykcyjnych?
EdM
Jeden jest podobny, Y ~ X + X^2a drugiY ~ X + X^2 + X^3
petrbel

Odpowiedzi:

13

Zakładając, że twoje modele są zagnieżdżone (tj. Ta sama zmienna wyniku, a model 2 zawiera wszystkie zmienne modelu 1 plus 2 dodatkowe zmienne), wówczas wyniki analizy ANOVA stwierdzają, że 2 dodatkowe zmienne łącznie uwzględniają wystarczającą wariancję, że można odrzucić hipotezę zerową, że współczynniki dla obu zmiennych wynoszą 0. To jest efektywne, co powiedziałeś. Jeśli oba współczynniki są równe 0, modele są takie same.

Dla dodatkowej uwagi, na wypadek, gdybyś nie był świadomy, ANOVA zawsze jest odpowiednikiem robienia porównań modeli. Kiedy patrzysz na ANOVA dla pojedynczego modelu, daje to efekty dla każdej zmiennej predykcyjnej. Jest to równoważne z przeprowadzeniem porównania modelu między pełnym modelem a modelem usuwającym jedną ze zmiennych. to znaczyM.oremil1:y=za+bx1+dox2)+rex3);M.oremil2):y=za+bx1+dox2) poda sumę kwadratów (typ III) i statystyki testowe x3). Zauważ, że R daje ci sumę kwadratów typu I. Jeśli potrzebujesz typu III, użyj car::Anovalub użyj anovai ciągle zmieniaj kolejność zmiennych w modelu i weź tylko sumę kwadratów dla ostatniej zmiennej.

le_andrew
źródło
Jeśli dobrze cię zrozumiałem, wartość p mniejsza niż 0,05 dowodzi, że modele różnią się, ciasno?
petrbel
3
Nie użyłbym tych słów (tzn. „Udowodnić” i „modele różnią się”), ale mamy na myśli to samo. Powiedziałbym, że twoje dane nie obsługują hipotezy zerowej, że współczynniki są
równe
1
Przed złożeniem wniosku, że udowodniono, że modele są różne lub że hipoteza zerowa nie jest obsługiwana, należy upewnić się, że dane rozsądnie spełniają założenia ANOVA, które leżą u podstaw obliczeń i interpretacji wartości p.
EdM
Dla pewności, ostatnia część dotycząca sumy kwadratów typu I dotyczy tylko sytuacji, w której anova()zastosowano jeden model?
Jasper