Chcę przeprowadzić analizę ANCOVA danych dotyczących gęstości epifitów roślinnych. Na początku chciałbym wiedzieć, czy istnieje jakakolwiek różnica w gęstości rośliny między dwoma zboczami, jednym N i jednym S, ale mam inne dane, takie jak wysokość, otwartość czaszy i wysokość rośliny żywicielskiej. Wiem, że moją zmienną towarzyszącą musiałyby być dwa zbocza (N i S). Zbudowałem ten model, który działa w R i chociaż nie mam pojęcia, czy działa dobrze. Chciałbym również wiedzieć, jaka jest różnica, jeśli użyję symbolu +
lub *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Odpowiedzi:
Podstawowym narzędziem do tego jest
lm
; zauważ, żeaov
jest to opakowanie dlalm
.W szczególności, jeśli masz jakąś zmienną grupującą (czynnik),g oraz ciągłą zmienną towarzyszącą x , model
y ~ x + g
pasowałby do modelu ANCOVA z głównymi efektami, natomiasty ~ x * g
pasowałby do modelu, który obejmuje interakcję z zmienną towarzyszącą.aov
przyjmie te same formuły.Zwróć szczególną uwagę
Note
na pomoc waov
.Jeśli chodzi o
+
vs*
, russellpierce prawie to obejmuje, ale polecam przyjrzeć się,?lm
a?formula
zwłaszcza sekcji 11.1 instrukcji Wprowadzenie do R, która pochodzi z R (lub możesz znaleźć go online, jeśli nie zorientowałeś się, jak to zrobić znaleźć go na komputerze; najłatwiej polega na znalezieniu rozwijanego menu „Pomoc” w R lub RStudio).źródło
anova
(wkrótce zobaczysz, czy podasz je w niewłaściwej kolejności, ponieważ niektóre SS będą ujemne, jeśli to zrobisz )Polecam pobieranie i czytanie Discovering Statistics using R by Field. Ma fajną sekcję o ANCOVA.
Aby uruchomić ANCOVA w R, załaduj następujące pakiety:
Jeśli używasz
lm
lubaov
(używamaov
), upewnij się, że ustawiłeś kontrasty za pomocą funkcji „kontrasty” przed wykonaniem którejkolwiekaov
lublm
. R domyślnie używa kontrastów nieortogonalnych, które mogą zepsuć wszystko w ANCOVA. Jeśli chcesz ustawić kontrasty ortogonalne, użyj:następnie uruchom swój model jako
Aby wyświetlić model, użyj:
Upewnij się, że używasz tutaj kapitału „A”
Anova
, a nieanova
. To da wyniki przy użyciu SS typu III.summary.lm(model.1)
poda kolejne podsumowanie i obejmie R-sq. wynik.Jeśli chcesz przetestować homogeniczność nachyleń regresji, możesz również dołączyć termin interakcji dla IV i kowariancji. To byłoby:
Jeśli termin interakcji jest znaczący, to nie masz jednorodności.
źródło
Oto uzupełniająca dokumentacja http://goo.gl/yxUZ1R procedury sugerowanej przez @Butorovich. Ponadto, moje spostrzeżenie jest takie, że gdy zmienna towarzysząca jest binarna, użycie podsumowania (lm.object) dałoby takie samo oszacowanie IV jak wygenerowane przez Anova (lm.object, type = "III").
źródło
ASK QUESTION
na górze i tam zadając. W takim razie możemy Ci właściwie pomóc.Używamy analizy regresji do tworzenia modeli opisujących wpływ zmienności zmiennych predykcyjnych na zmienną odpowiedzi. Czasami, jeśli mamy zmienną kategorialną o wartościach takich jak Tak / Nie lub Mężczyzna / Kobieta itp., Prosta analiza regresji daje wiele wyników dla każdej wartości zmiennej jakościowej. W takim scenariuszu możemy zbadać wpływ zmiennej jakościowej, używając jej wraz ze zmienną predykcyjną i porównując linie regresji dla każdego poziomu zmiennej jakościowej. Taka analiza jest określana jako Analiza kowariancji zwana również ANCOVA.
Przykład
Rozważ
R
wbudowany zestaw danychmtcars
. Obserwujemy w nim, że poleam
reprezentuje typ transmisji (automatyczny lub ręczny). Jest to zmienna kategorialna o wartościach 0 i 1. Wartość mil na galon (mpg
) samochodu może również zależeć od niej oprócz wartości mocy konia (hp
). Badamy wpływ wartościam
na regresję międzympg
ihp
. Odbywa się to za pomocąaov()
funkcji, po której następujeanova()
funkcja porównywania wielu regresji.Dane wejściowe
Tworzenie ramkę danych zawierającą pola
mpg
,hp
aam
ze zbioru danychmtcars
. Przyjmujemy tutajmpg
jako zmienną odpowiedzi, zmiennąhp
predykcyjną iam
zmienną kategorialną.Wykonanie powyższego kodu powoduje następujący wynik:
Analiza ANCOVA
Tworzymy model regresji przyjmujący
hp
jako zmienną predykcyjną impg
jako zmienną odpowiedzi uwzględniającą interakcję międzyam
ihp
.Model z interakcją między zmienną kategorialną a zmienną predykcyjną
Utwórz model regresji 1
Wykonanie powyższego kodu powoduje następujący wynik:
Ten wynik pokazuje, że zarówno moc konia, jak i rodzaj transmisji mają znaczący wpływ na mile na galon, ponieważ wartość p w obu przypadkach jest mniejsza niż 0,05. Ale interakcja między tymi dwiema zmiennymi nie jest znacząca, ponieważ wartość p jest większa niż 0,05.
Model bez interakcji między zmienną kategorialną a zmienną predykcyjną
Utwórz model regresji 2
Wykonanie powyższego kodu powoduje następujący wynik:
Ten wynik pokazuje, że zarówno moc konia, jak i rodzaj transmisji mają znaczący wpływ na mile na galon, ponieważ wartość p w obu przypadkach jest mniejsza niż 0,05.
Porównywanie dwóch modeli
Teraz możemy porównać dwa modele, aby stwierdzić, czy interakcja zmiennych jest naprawdę nieistotna. Do tego używamy
anova()
funkcji.Ponieważ wartość p jest większa niż 0,05, dochodzimy do wniosku, że interakcja między mocą konia a rodzajem przenoszenia nie jest znacząca. Tak więc przebieg na galon będzie zależał w podobny sposób od mocy samochodu w trybie automatycznym i manualnym.
źródło