Moje pytanie jest bardzo ściśle związane z poprzednim poście Określanie Błąd () termin w ANOVA z powtarzanymi pomiarami w R . Chciałbym jednak uzyskać więcej informacji na temat definiowania terminu błędu.
Załóżmy, że mam dwukierunkową powtarzaną ANOVA. Czynnikiem pomiędzy efektami grupowymi jest Leczenie (kontrola vs. placebo), podczas gdy Czas jest efektem wewnątrz grupy mierzonym wielokrotnie ponad 4 razy (T1 ~ T4). Identyfikatory pacjentów są rejestrowane jako podmiot. Tutaj pożyczyłem dane z przykładu z samouczka w http://gjkerns.github.io/R/2012/01/20/power-sample-size.html, więc dane wyglądają tak
Time Subject Method NDI
0min 1 Treat 51.01078
15min 1 Treat 47.12314
48hrs 1 Treat 26.63542
96hrs 1 Treat 20.78196
0min 2 Treat 42.61345
15min 2 Treat 32.77171
Aby zastosować ANOVA:
aovComp <- aov(NDI ~ Time*Method + Error(Subject/Time), theData)
summary(aovComp)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Subject:Time
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Próbowałem również innego terminu błędu:
aovComp1 <- aov(NDI ~ Time*Method + Error(Subject), theData)
summary(aovComp1)
Error: Subject
Df Sum Sq Mean Sq F value Pr(>F)
Method 1 113 112.7 0.481 0.491
Residuals 58 13579 234.1
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Time 3 13963 4654 103.789 < 2e-16 ***
Time:Method 3 1221 407 9.074 1.3e-05 ***
Residuals 174 7803 45
Czy ktoś może mi pomóc wyjaśnić różnice między tymi dwoma terminami błędów? Jeśli pierwszy termin jest prawidłowy, co oznaczają wyniki z drugiego terminu błędu?
Aktualizacja autorstwa @amoeba: dwa wyjścia są takie same, więc wydaje się, że w tym przypadku nie ma różnicy, ale pozostaje pytanie, jaka jest różnica w zasadzie . Czy Error(subject)
i Error(subject/time)
zawsze to samo?
źródło
time
), toError(subject)
iError(subject/time)
da różne wartości F i p dlatime
.Odpowiedzi:
Po pierwsze,
subject/time
zapis dlatime
zagnieżdżonegosubject
, a więc rozwija się do dwóch częścisubject
isubject:time
interakcji. Pytanie staje się bardziej właściwe: kiedy należy określićsubject:time
interakcję i jaką to robi różnicę?Przed udzieleniem odpowiedzi na to pytanie należy jeszcze zdać sobie sprawę z tego, że wszystkie modele zawierają jeden dodatkowy termin błędu, który nie musi być określony, który jest terminem błędu związanym z poszczególnymi pomiarami (najniższy poziom, jeśli myślisz o tym hierarchicznie).
W tym przypadku
subject:time
interakcja jest na najniższym poziomie, który jest zawsze uwzględniany w modelu. Więc używającError(subject)
iError(subject/time)
daj ten sam rezultat; jedyną różnicą jest to, że na wyjściu ten poziom wyników jest wywoływanyWithin
dla pierwszego i jest wywoływanysubject:time
dla drugiego.Jednak w przypadkach, gdy istnieje wiele pomiarów dla każdej
subject/time
kombinacji, konieczne jest określeniesubject:time
interakcji, ponieważ wtedy interakcja nie jest na najniższym poziomie.źródło
subject/time
kombinacji, dlaczego mielibyśmy koniecznie chcesz przetestować efekttime
stosunku dosubject:time
interakcji? Taka jest zasadniczo treść mojego pytania tutaj stats.stackexchange.com/questions/286280 , dlatego zapraszam przyszłych czytelników tego wątku do szukania tam uzasadnienia koncepcyjnego.