Powtarzane miary ANOVA: jakie jest założenie normalności?

15

Jestem zdezorientowany co do założenia normalności w ANOVA z powtarzanymi pomiarami. W szczególności zastanawiam się, jaki rodzaj normalności powinien być dokładnie spełniony. Czytając literaturę i odpowiedzi na CV, natrafiłem na trzy różne sformułowania tego założenia.

  1. Zmienna zależna w ramach każdego (powtarzanego) warunku powinna być rozłożona normalnie.

    Często mówi się, że rANOVA ma takie same założenia jak ANOVA oraz sferyczność. Takie jest twierdzenie w statystykach Field's Discovering, a także w artykule Wikipedii na ten temat oraz w tekście Lowry'ego .

  2. Resztki (różnice między wszystkimi możliwymi parami?) Powinny być rozkładane normalnie.

    Znalazłem to stwierdzenie w wielu odpowiedziach na CV ( 1 , 2 ). Przez analogię rANOVA do sparowanego testu t może to również wydawać się intuicyjne.

  3. Normalność wielowymiarowa powinna być spełniona.

    Wikipedia i to źródło wspominają o tym. Wiem też, że rANOVA może być zamieniona z MANOVA, co może uzasadniać to twierdzenie.

Czy są one w jakiś sposób równoważne? Wiem, że normalność wielowymiarowa oznacza, że każda liniowa kombinacja DV jest normalnie rozłożona, więc 3. naturalnie obejmowałby 2., jeśli dobrze rozumiem to drugie.

Jeśli nie są takie same, jakie jest „prawdziwe” założenie rANOVA? Czy możesz podać referencje?

Wydaje mi się, że pierwsze poparcie ma największe poparcie. Nie jest to jednak zgodne z zwykle podawanymi tutaj odpowiedziami.


Liniowe modele mieszane

Dzięki podpowiedzi @ utobi rozumiem teraz, w jaki sposób rANOVA może być przekształcona jako liniowy model mieszany. W szczególności, aby modelować zmiany ciśnienia krwi w czasie, modelowałbym oczekiwaną wartość jako: gdzie y i j to pomiary ciśnienia krwi, a i średnia krew ciśnienie ı -tego przedmiotu, a t i J , jak j -ty czasu i -tym przedmiotem mierzono b i

E[yij]=ai+bitij,
yijaiitijjibioznaczając, że zmiana ciśnienia krwi również różni się w zależności od pacjenta. Oba efekty są uważane za losowe, ponieważ próba osobników jest tylko losową podgrupą populacji, która ma zasadnicze znaczenie.

Wreszcie próbowałem pomyśleć o tym, co to oznacza dla normalności, ale bez powodzenia. Parafrazując McCulloch i Searle (2001, s. 35. Eq. (2.14)):

E[yij|ai]=aiyij|aiindep. N(ai,σ2)aii.i.d. N(a,σa2)

Rozumiem, że to znaczy

4. dane każdej osoby muszą być normalnie rozpowszechniane, ale testowanie przy użyciu kilku punktów czasowych jest nieuzasadnione.

Mam na myśli to trzecie wyrażenie

5. średnie z poszczególnych przedmiotów są zwykle rozkładane. Zauważ, że są to kolejne dwie odrębne możliwości oprócz trzech wymienionych powyżej.


McCulloch, CE i Searle, SR (2001). Modele uogólnione, liniowe i mieszane . Nowy Jork: John Wiley & Sons, Inc.

Fato39
źródło
aby dać ci wskazówkę. Możesz podać model rANOVA w kategoriach liniowego modelu mieszanego (LMM). Gdy masz LMM, natychmiast widzisz domniemane założenie normalności. Zobacz tutaj ( eu.wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html ), aby zapoznać się z pewną teorią LMM
utobi
Dziękuję, @utobi, za przekazane przez Ciebie referencje! Rzeczywiście, studiowałem pierwsze kilka rozdziałów, ale nie udało mi się znaleźć odpowiedzi na moje pytanie. Zaktualizowałem go, aby odzwierciedlić ograniczone postępy, które zrobiłem.
Fato39
3
To wydaje mi się idealnie dobrym pytaniem. Głosuję za pozostawieniem otwartego.
gung - Przywróć Monikę
To prawda, że ​​dane każdej osoby muszą być normalnie rozpowszechniane. Ale jeśli spojrzysz na to, co napisałeś, wszystkie indywidualne dane, gdy zostaną poniżone (aiσa2

Odpowiedzi:

2

Jest to najprostszy model ANOVA z powtarzanymi pomiarami, jeśli traktujemy go jako model jednowymiarowy:

yit=ai+bt+ϵit

gdzie reprezentuje każdy przypadek it czasy, w których je mierzyliśmy (więc dane są w długiej formie). r i tityitaibtϵit

aiFb1=...=bt=0

F

ϵitN(0,σ)these errors are normally distributed and homoskedastic

F

Jeśli chcesz traktować ANOVA z powtarzanymi pomiarami jako model wielowymiarowy, założenia normalności mogą być inne i nie mogę ich rozszerzyć poza to, co widzieliśmy na Wikipedii.

Heteroskedastic Jim
źródło
0

Wyjaśnienie normalności ANOVA z powtarzalnym pomiarem można znaleźć tutaj:

Zrozumienie założeń ANOVA z powtarzanymi pomiarami do poprawnej interpretacji wyników SPSS


31325

Federico Tedeschi
źródło
2
Federico, dziękuję za odpowiedź. Byłem świadomy tego wyjaśnienia (patrz mój punkt nr 2 i pierwsze łącze do CV tam przywołane). Doceniam jakość odpowiedzi w CV, ale podczas korzystania z różnych źródeł dotarłem do różnych (sprzecznych?) Odpowiedzi na moje pytanie. Dlatego wolałbym źródło, które w sposób wyraźny lub jednoznaczny zajęłoby się niuansami, o których wspomniałem w moich pięciu punktach powyżej.
Fato39,