Czy mogę uzyskać pomoc w ukończeniu tej wstępnej (w toku) próby uzyskania orientacji na równoważnikach ANOVA i REGRESSION? Próbowałem pogodzić pojęcia, nazewnictwo i składnię tych dwóch metod. Na tej stronie znajduje się wiele postów na temat ich podobieństwa, na przykład to czy tamto , ale nadal dobrze jest mieć szybką mapę „jesteś tutaj” na początku.
Planuję zaktualizować ten post i mam nadzieję uzyskać pomoc w poprawianiu błędów.
ANOVA w jedną stronę:
Structure: DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario: miles-per-gal. vs cylinders
Note that Income vs Gender (M, F) is a t-test.
Syntax: fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
Dwukierunkowa ANOVA:
Structure: DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario: mpg ~ cylinders & carburators
Syntax: fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
Dwukierunkowa czynnikowa ANOVA:
Structure: All possible COMBINATIONS of LEVELS are considered.
Scenario: mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax: fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars);
summary(fit); TukeyHSD(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars)
# with F dummy coded;
summary(fit); anova(fit)
ANCOVA:
Structure: DV continuous ~ Factor and continuous COVARIATE.
Scenario: mpg ~ cylinders + weight
Syntax: fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression: fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars)
# with F dummy coded;
summary(fit); anova(fit)
MANOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario: mpg and wt ~ cylinders
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression: N/A
MANCOVA:
Structure: > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario: mpg and wt ~ cyl + displacement (cubic inches)
Syntax: fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression: N/A
BEZ WSPÓŁCZYNNIKA (lub PRZEDMIOTU) ANOVA: ( kod tutaj )
Structure: DV continuous ~ FACTOR with each level * with subject (repeated observations).
Extension paired t-test. Each subject measured at each level multiple times.
Scenario: Memory rate ~ Emotional value of words for Subjects @ Times
Syntax: fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data);
summary(fit); print(model.tables(fit, "means"), digits=3);
boxplot(Recall_Rate ~ Emtl_Value, data=data)
with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
summary(fit); anova(fit); coefficients(fit); confint(fit)
SPLIT-PLOT: ( kod tutaj )
Structure: DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario: Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer
& RANDOM EFFECTS (Blocks and plots of land):
Syntax: fit <- aov(yield ~ irrigation * density * fertilizer +
Error(block/irrigation/density), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest);
fit <- lmer(yield ~ irrigation * fertilizer +
(1|block/irrigation/density), data = splityield);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
library(nlme)
fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
summary(fit); anova(fit)
NESTED DESIGN: ( kod tutaj )
Structure: DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario: [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect:
Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide).
Syntax: fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression: Mixed Effects
require(lme4); require(lmerTest)
fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats);
anova(fit); summary(fit); coefficients(fit); confint(fit)
or
require(nlme)
fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
summary(fit); anova(fit); VarCorr(fit)
PRZYDATNE STRONY:
regression
anova
mixed-model
Antoni Parellada
źródło
źródło
cyl + hp
. Horespower jest ciągły, więc tutaj nie działa.carb
, liczba gaźników byłaby lepszym wyborem.Odpowiedzi:
Ładna lista, Antoni. Oto kilka drobnych sugestii:
ANOVA jednokierunkowa: IV to CZYNNIK z 3 lub więcej poziomami. Możesz także dodać przykładowe dane: mtcars do tego wpisu. (Podobnie, możesz dodać instrukcje * Przykładowe dane) do wszystkich swoich wpisów, aby wyjaśnić, jakich zestawów danych używasz.)
Dwukierunkowa Anova: dlaczego nie użyć IV1 i IV2 i stwierdzić, że dwie niezależne zmienne powinny być czynnikami o co najmniej dwóch poziomach? Sposób, w jaki to stwierdziłeś, obecnie sugeruje, że dwukierunkowa anova może zawierać więcej niż 2 niezależne zmienne (lub czynniki), co nie jest sensowne.
W przypadku dwukierunkowej Anova rozróżniam te dwa podtypy: 1. Dwukierunkowa Anova z głównymi efektami dla IV1 i IV2 oraz 2. Dwukierunkowa Anova z interakcją między IV1 i IV2. Ten drugi punkt jest tym, co nazywacie dwoma jako czynnikową dwukierunkową anovą.) Lepszym sposobem opisania tych dwóch podgrup jest: 1. Wpływ IV1 na DV jest niezależny od wpływu IV2 i 2. Wpływ IV1 na DV zależy od IV2. Można również wyjaśnić, że to zmienne niezależne IV1 i IV2 są obojętne w ustawieniach regresji.
W przypadku ANCOVA możesz wyjaśnić, że w obecnym przykładzie rozważasz tylko jednokierunkową ANCOVA. Dla kompletności można dodać dwukierunkowy przykład ANCOVA bez interakcji między IV1 i IV2 oraz jeden z interakcją między tymi dwiema zmiennymi.
W związku z powyższym można również dodać element o nazwie Cel , który opisuje, kiedy analizy są przydatne. Na przykład:
Cel (jednokierunkowej anova): Zbadaj, czy średnie wartości DV są różne na poziomach IV.
Czy w przypadku MANOVA możesz wyjaśnić, że potrzebowałbyś (a) dwóch lub więcej DV i (2) jednej lub więcej IV, które są czynnikami? Sądzę, że możesz rozróżnić jednokierunkową MANOVA (z 1 czynnikiem) i dwukierunkową MANOVA? To samo dotyczy MANCOVA.
ANOVA WEWNĄTRZ FAKTORA jest również znana jako ANOVA POWTARZAJĄCYCH SIĘ, więc być może możesz dodać tę terminologię do listy dla tych, którzy ją znają. Pomocne byłoby również wyjaśnienie, że modelowanie efektów mieszanych stanowi alternatywny sposób modelowania danych z powtarzanych pomiarów. W przeciwnym razie czytelnicy mogą nie docenić różnicy między tymi dwoma podejściami.
źródło