Kilka miesięcy temu opublikowałem pytanie dotyczące testów homoscedastyczności w R na SO, a Ian Fellows odpowiedział na to (sparafrazuję jego odpowiedź bardzo luźno):
Testy homoscedastyczności nie są dobrym narzędziem do testowania dopasowania modelu. Przy małych próbkach nie masz wystarczającej mocy, aby wykryć odstępstwa od homoscedastyczności, podczas gdy przy dużych próbkach masz „dużą moc”, więc masz większe szanse na sprawdzenie nawet trywialnych odstępstw od równości.
Jego wspaniała odpowiedź pojawiła się jako uderzenie w moją twarz. Sprawdzałem założenia normalności i homoscedastyczności za każdym razem, gdy prowadziłem ANOVA.
Jaka jest Twoim zdaniem najlepsza praktyka przy sprawdzaniu założeń ANOVA?
Kilka wykresów będzie zwykle znacznie bardziej pouczających niż wartość p z testu normalności lub homoskedastyczności. Wykreślić zmienne zależne względem zmiennych niezależnych. Wykreślić obserwacje przeciw atakom. Wykreśl resztki względem zmiennych niezależnych. Zbadaj wszystko, co wygląda dziwnie na tych działkach. Jeśli coś nie wygląda dziwnie, nie martwiłbym się znaczącym testem założenia.
źródło
Oto kilka bardzo dobrych przewodników internetowych do sprawdzania założeń ANOVA i postępowania w razie niepowodzenia. Oto jeden To jest inny
Zasadniczo twoje oko jest najlepszym sędzią, więc zrób analizę eksploracyjną . Oznacza to, że wykreśl dane - histogramy i wykresy pudełkowe są dobrym sposobem oceny normalności i homoscedascity. I pamiętaj, że ANOVA jest odporna na drobne naruszenia tych zasad.
źródło
Wykresy QQ są całkiem dobrym sposobem na wykrycie nienormalności.
Aby uzyskać homoscedastyczność, spróbuj testu Levene'a lub testu Browna-Forsythe'a. Oba są podobne, choć BF jest nieco bardziej solidny. Są mniej wrażliwe na nienormalność niż test Bartletta, ale mimo to uważam, że nie są najbardziej niezawodne przy małych próbkach.
Fabuła QQ
Test Browna-Forsythe'a
Test Levene'a
źródło
Zgadzam się z innymi, że testowanie istotności dla założeń jest problematyczne.
Metody półparametryczne (ranga), takie jak testy Wilcoxona i Kruskala-Wallisa, przyjmują znacznie mniej założeń. Logarytm ECDF powinien być równoległy, aby testy Wilcoxona-Kruskala-Wallisa miały maksymalną moc (błąd typu I nigdy nie stanowi dla nich problemu). Liniowość nie jest wymagana. Testy rangowe przyjmują założenia dotyczące powiązania rozkładów różnych grup z innymi, ale nie zakładają kształtu jednego rozkładu.
źródło