tło
Aby przeanalizować różnice w niektórych zmiennych ciągłych między różnymi grupami (podanymi przez zmienną kategorialną), można wykonać jednokierunkową ANOVA. Jeśli istnieje kilka zmiennych objaśniających (kategorycznych), można przeprowadzić czynnikową ANOVA. Jeśli chce się analizować różnice między grupami w kilku zmiennych ciągłych (tj. W kilku zmiennych odpowiedzi), należy wykonać wieloczynnikową ANOVA (MANOVA).
Pytanie
Nie rozumiem, w jaki sposób można przeprowadzić test typu ANOVA dla kilku zmiennych odpowiedzi, a co ważniejsze, nie rozumiem, jaka mogłaby być hipoteza zerowa. Czy hipoteza zerowa:
- „Dla każdej zmiennej odpowiedzi średnie wszystkich grup są równe”,
Albo to jest
- „Dla co najmniej jednej zmiennej odpowiedzi średnie wszystkich grup są równe”,
czy jest czymś innym?
hypothesis-testing
anova
manova
Remi.b
źródło
źródło
H0
MANOVA polega na tym, że nie ma różnicy w przestrzeni wielowymiarowej . Przypadek wielowymiarowy jest znacznie bardziej złożony niż jednowymiarowy, ponieważ mamy do czynienia z kowariancjami, a nie tylko wariancjami. Istnieje kilka sposobów formułowaniaH0-H1
hipotez w MANOVA. Czytaj Wikipedię.For each response variable
. Dla mnie to brzmi jak (lub czytam to jako) „testowanie odbywa się jednoznacznie na każdym” (a następnie jakoś połączone).Odpowiedzi:
Hipoteza jednokierunkowej ANOVA jest taka, że średnie wszystkich grup są równe:Hipoteza jednostronnej metody MANOVA jest taka, że średnie [wielowymiarowe] wszystkich grup są równe:Jest to równoważne stwierdzeniu, że średnie są równe dla każdej zmiennej odpowiedzi, tj. Twoja pierwsza opcja jest poprawna .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0
W obu przypadkach alternatywną hipotezą jest negacja wartości zerowej. W obu przypadkach założeniami są (a) rozkłady Gaussa wewnątrz grupy oraz (b) równe wariancje (dla ANOVA) / macierze kowariancji (dla MANOVA) między grupami.H1
Różnica między MANOVA i ANOVA
Może się to wydawać nieco mylące: hipoteza zerowa MANOVA jest dokładnie taka sama, jak kombinacja hipotez zerowych dla zbioru jednowymiarowych ANOVA, ale jednocześnie wiemy, że robienie MANOVA nie jest równoważne z robieniem jednoczynnikowych ANOVA, a następnie jakoś „ łączenie ”wyników (można wymyślić różne sposoby łączenia). Dlaczego nie?
Odpowiedź jest taka, że uruchamianie wszystkich jednoczynnikowych ANOVA, nawet gdyby przetestowałoby tę samą hipotezę zerową, będzie miało mniejszą moc. Zobacz moją odpowiedź tutaj w celu zilustrowania: Jak MANOVA może zgłosić znaczącą różnicę, gdy żadna z jednoczynnikowych ANOVA nie osiąga znaczenia? Naiwna metoda „łączenia” (odrzucanie globalnego zera, jeśli przynajmniej jedna ANOVA odrzuca zera) również doprowadziłaby do ogromnej inflacji poziomu błędu typu I; ale nawet jeśli ktoś wybierze jakiś sprytny sposób „łączenia” w celu utrzymania prawidłowego poziomu błędu, traci moc.
Jak działa testowanie
ANOVA rozkłada całkowitej sumy kwadratów z na między grupami z sumy kwadratów i wewnętrzną z grupy sumy kwadratów tak, że . Następnie oblicza się stosunek . Zgodnie z hipotezą zerową stosunek ten powinien być mały (około ); można obliczyć dokładny rozkład tego stosunku oczekiwany zgodnie z hipotezą zerową (będzie to zależeć od i liczby grup). Porównanie obserwowanej wartości z tym rozkładem daje wartość p.T B W T=B+W B/W 1 n B/W
MANOVA rozkłada całkowitego rozproszenia matrycy do rozproszenia między grupami matrycy i wewnątrzgrupowa rozrzut matrycy , tak że . Następnie oblicza matrycy . Zgodnie z hipotezą zerową ta macierz powinna być „mała” (wokół ); ale jak określić ilościowo, jak „mały” jest? MANOVA analizuje wartości własne tej macierzy (wszystkie są dodatnie). Ponownie, zgodnie z hipotezą zerową, te wartości własne powinny być „małe” (okołoT B W T=B+W W−1B I λi 1 ). Aby jednak obliczyć wartość p, potrzebujemy jednej liczby (zwanej „statystyką”), aby móc porównać ją z oczekiwanym rozkładem poniżej wartości zerowej. Można to zrobić na kilka sposobów: weź sumę wszystkich wartości własnych ; weź maksymalną wartość własną itd. W każdym przypadku liczba ta jest porównywana z rozkładem tej wielkości oczekiwanym poniżej zera, co daje wartość p.∑λi max{λi}
Różne wybory statystyki testowej prowadzą do nieco różnych wartości p, ale ważne jest, aby zdać sobie sprawę, że w każdym przypadku testowana jest ta sama hipoteza zerowa.
źródło
SSdifference/SSerror
skalar. W MANOVA efektem wielowymiarowym jestSSCPerror^(-1)SSCPdifference
matryca (kowariancje ogółem i uwzględnione w grupach). Ale ponieważ jest w nim kilka wartości własnych, które można by „połączyć” nie w jeden sposób w statystyce testowej, istnieje kilka możliwych alternatywnych hipotez. Więcej mocy - większa złożoność teoretyczna.To jest ten pierwszy.
Jednak sposób, w jaki to robi, nie polega na dosłownym porównywaniu średnich z każdej z pierwotnych zmiennych po kolei. Zamiast tego zmienne odpowiedzi są przekształcane liniowo w sposób bardzo podobny do analizy głównych składników . (Tutaj jest doskonały wątek na temat PCA: zrozumienie analizy głównych składników, wektorów własnych i wartości własnych .) Różnica polega na tym, że PCA orientuje twoje osie, aby dopasować je do kierunków maksymalnej zmienności, podczas gdy MANOVA obraca twoje osie w kierunkach, które zmaksymalizuj separację swoich grup.
Dla jasności żaden z testów związanych z MANOVA nie testuje wszystkich środków jeden po drugim w bezpośrednim znaczeniu, ani ze środkami w pierwotnej przestrzeni, ani w przestrzeni przekształconej. Istnieje kilka różnych statystyk testowych, z których każda działa w nieco inny sposób, jednak mają one tendencję do działania w oparciu o wartości własne rozkładu, który przekształca przestrzeń. Ale jeśli chodzi o naturę hipotezy zerowej, chodzi o to, że wszystkie środki wszystkich grup są takie same dla każdej zmiennej odpowiedzi, nie że mogą się różnić w przypadku niektórych zmiennych, ale są takie same w co najmniej jednej.
źródło