Obecnie próbuję zaradzić naruszeniom założeń ANOVA. Użyłem Shapiro-Wilka, aby przetestować normalność, i bawiłem się zarówno testem Levene'a, jak i testem równości wariancji Bartletta. Od tego czasu log przekształciłem moje dane, aby spróbować naprawić nierówne wariancje. Zmieniłem test Bartletta na dane przekształcone w dzienniku i nadal otrzymałem znaczną wartość p, a z ciekawości uruchomiłem również test Levene'a i uzyskałem nieistotną wartość p. Na którym teście powinienem polegać?
Prawdopodobnie nie. Lepiej byłoby spojrzeć na swoje dane i zobaczyć, jak poważne są naruszenia. Modele liniowe (np. ANOVA) są dość odporne na drobne naruszenia, gdy grupa jest równa. Ogólna zasada heteroscedastyczności polega na tym, że maksymalna wariancja grupowa może być nawet czterokrotnie większa od minimalnej wariancji grupowej bez zbytniego uszkodzenia analizy. Jeśli obawiasz się, że mogą wystąpić naruszenia, jeszcze lepszym rozwiązaniem jest po prostu stosowanie analiz, które są odporne na możliwe naruszenia od samego początku, zamiast próbować wykrywać naruszenia, a następnie podejmować decyzje na podstawie tego 1 . n
Co warte jest tego, Wikipedia mówi, że test Bartletta jest bardziej wrażliwy na naruszenia normalności niż test Levene'a. Więc możesz mieć niestandardowe dane zamiast danych heteroscedastycznych. Ponownie lepsza analiza może być lepsza 2 .
... dość odporny na drobne naruszenia z równymi Ns.
John
I jest jeszcze problem, który może mieć mocny powód, by sądzić, że próbki pochodzą z populacji o mniej więcej równych wariancjach ... Na tym opierają się testy odporności.
John
Czy mogę wizualnie sprawdzić zakres odchyleń za pomocą wykresów diagnostycznych?
Clarice
Jasne, @Clarice. Pomoże w tym dowolna liczba wykresów. Możesz utworzyć wykres rozproszenia z kropkami rozmieszczonymi pionowo w obrębie poziomów kategorii zaznaczonych na osi X, a następnie zobaczyć, jak się porównują. Możesz także wypróbować boxplots, np.
gung - Przywróć Monikę
4
W przypadku mniej czułego testu na nietypowe warunki niż test Levene'a przynajmniej czasami należy zastosować test Conovera, test nieparametryczny oznaczony kwadratem AKA. Odkryłem, że jest to co najmniej czasem preferowane niż test Bartletta w implementacji testu matematycznego testu VarianceEquivalenceTest .
Oto lista metod i założeń testów wariancji skopiowanych z powyższego linku Równoważność wariancji
Bartlett normality modified likelihood ratio test
BrownForsythe robust robust Levene test
Conover symmetry Conover's squared ranks test
FisherRatio normality based on variance ratio
Levene robust,symmetry compares individual and group variances
Z tej listy powinno być oczywiste, że naruszenia założeń są testowalne, chociaż dokumentacja Mathematica nie precyzuje, na przykład, w jaki sposób przeprowadzany jest test symetrii Conovera, a nawet dlaczego testuje się symetrię. I jak dotąd nikt nie odpowiedział na to pytanie .
Tak więc odpowiedź na pytanie PO jest taka, że tylko testowanie warunków może zasugerować, która metoda jest preferowana w danym przypadku. Co więcej, jeśli spróbuje się wykonać wszystkie 5 testów i nie zostaną one wykluczone z powodu naruszenia założeń, wówczas można ogólnie rozróżnić odpowiedzi lepsze i gorsze z tymi, które zostaną wygenerowane.
W najgorszym przypadku można przeprowadzić symulację Monte Carlo przy użyciu znanych wartości prawdy, aby sprawdzić, które warunki prowadzą do jakich prawdopodobieństw. Jednak bez dodatkowych informacji na temat samego problemu nie można udzielić odpowiedzi na pytanie dotyczące zestawu danych PO. Jeśli PO chce odpowiedzi ukierunkowanej na dane, proszę podać dane.
Test Conovera jest tutaj rozsądną sugestią. Ale nie powinieneś mieszać odpowiedzi na to pytanie z nowym pytaniem i prośbą o informacje zwrotne (od kogo?) Dotyczące części odpowiedzi lub prośbą o zatwierdzenie sugerowanej zmiany.
Gung - Przywróć Monikę
@gung Tak, w porządku, zmieniłem na bardziej przydatne natychmiast.
W przypadku mniej czułego testu na nietypowe warunki niż test Levene'a przynajmniej czasami należy zastosować test Conovera, test nieparametryczny oznaczony kwadratem AKA. Odkryłem, że jest to co najmniej czasem preferowane niż test Bartletta w implementacji testu matematycznego testu VarianceEquivalenceTest .
Oto lista metod i założeń testów wariancji skopiowanych z powyższego linku Równoważność wariancji
Z tej listy powinno być oczywiste, że naruszenia założeń są testowalne, chociaż dokumentacja Mathematica nie precyzuje, na przykład, w jaki sposób przeprowadzany jest test symetrii Conovera, a nawet dlaczego testuje się symetrię. I jak dotąd nikt nie odpowiedział na to pytanie .
Tak więc odpowiedź na pytanie PO jest taka, że tylko testowanie warunków może zasugerować, która metoda jest preferowana w danym przypadku. Co więcej, jeśli spróbuje się wykonać wszystkie 5 testów i nie zostaną one wykluczone z powodu naruszenia założeń, wówczas można ogólnie rozróżnić odpowiedzi lepsze i gorsze z tymi, które zostaną wygenerowane.
W najgorszym przypadku można przeprowadzić symulację Monte Carlo przy użyciu znanych wartości prawdy, aby sprawdzić, które warunki prowadzą do jakich prawdopodobieństw. Jednak bez dodatkowych informacji na temat samego problemu nie można udzielić odpowiedzi na pytanie dotyczące zestawu danych PO. Jeśli PO chce odpowiedzi ukierunkowanej na dane, proszę podać dane.
źródło