Istnieją różnice w założeniach i testowanych hipotezach.
ANOVA (i test t) jest wyraźnie testem równości średnich wartości. Kruskal-Wallis (i Mann-Whitney) można technicznie postrzegać jako porównanie średnich rang .
Stąd, pod względem oryginalnych wartości, Kruskal-Wallis jest bardziej ogólny niż porównanie średnich: bada, czy prawdopodobieństwo, że losowa obserwacja z każdej grupy jest równie prawdopodobne, jest powyżej lub poniżej losowej obserwacji z innej grupy. Rzeczywista ilość danych, która leży u podstaw tego porównania, nie jest ani różnicami w średnich, ani różnicami w medianach (w przypadku dwóch próbek) jest w rzeczywistości medianą wszystkich różnic parowych - między próbkami Hodgesa-Lehmanna.
Jeśli jednak zdecydujesz się na pewne restrykcyjne założenia, to Kruskal-Wallis może być postrzegany jako test równości średnich populacji, a także kwantyli (np. Median), a nawet szerokiej gamy innych miar. Oznacza to, że jeśli założymy, że rozkłady grup w ramach hipotezy zerowej są takie same i że w ramach alternatywy jedyną zmianą jest przesunięcie dystrybucyjne (tak zwana „ alternatywa przesunięcia lokalizacji ”), to jest to również test równości liczby ludności (i jednocześnie median, dolnych kwartyli itp.).
[Jeśli przyjmiesz to założenie, możesz uzyskać oszacowania i przedziały dla przesunięć względnych, tak jak możesz to zrobić za pomocą ANOVA. Cóż, możliwe jest również uzyskiwanie przedziałów bez tego założenia, ale trudniej je interpretować.]
Jeśli spojrzysz na odpowiedź tutaj , szczególnie pod koniec, omawia ona porównanie testu t i testu Wilcoxona-Manna-Whitneya, które (wykonując przynajmniej testy dwustronne) są odpowiednikami ANOVA i Kruskala-Wallisa zastosowane do porównania tylko dwóch próbek; daje nieco więcej szczegółów, a większość tej dyskusji przenosi się na Kruskal-Wallis kontra ANOVA.
Nie jest do końca jasne, co rozumiesz przez praktyczną różnicę. Korzystasz z nich w ogólnie podobny sposób. Kiedy stosuje się oba zestawy założeń, zwykle dają one dość podobne wyniki, ale z pewnością mogą dawać całkiem różne wartości p w niektórych sytuacjach.
Edycja: Oto przykład podobieństwa wnioskowania nawet przy małych próbkach - oto wspólny region akceptacji dla przesunięć lokalizacji między trzema grupami (każda druga i trzecia w porównaniu z pierwszą) próbkowanymi z rozkładów normalnych (przy małych próbkach) dla określonego zestawu danych na poziomie 5%:
Można wyróżnić wiele interesujących cech - w tym przypadku nieco większy obszar akceptacji dla KW, którego granica składa się z pionowych, poziomych i ukośnych odcinków linii prostych (nietrudno zrozumieć, dlaczego). Dwa regiony mówią nam bardzo podobne rzeczy na temat interesujących parametrów tutaj.
Tak jest. Jest
anova
to podejście parametryczne, podczas gdykruskal.test
jest to podejście nieparametryczne. Więckruskal.test
nie potrzeba żadnego dystrybucyjne założenie.Z praktycznego punktu widzenia, kiedy twoje dane są wypaczone,
anova
nie byłoby dobrym podejściem do korzystania. Spójrz na przykład na to pytanie .źródło
Jak twierdziłem na początku, nie jestem pewien dokładnej budowy KW. Być może moja odpowiedź jest bardziej poprawna dla kolejnego testu nieparametrycznego (Mann-Whitney? ..), ale podejście powinno być podobne.
źródło
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersion
Jak wspomniano w odpowiedzi Glen, komentarzach i wielu innych miejscach na tej stronie, to prawda, ale jest to zawężony odczyt tego, co robi test.same shape/dispersion
nie jest w rzeczywistości nieodłącznym elementem, ale stanowi dodatkowe założenie, które jest stosowane w niektórych, a nie w innych sytuacjach.distributions are equal
jest, błędem jest myśleć. H0 jest tylko tym, że, figuralnie, dwa punkty „kondensacji grawitacji” nie odbiegają od siebie.krusal.test()
the equality of the location parameters of the distribution
jest właściwym sformułowaniem (choć „lokalizacja” nie powinna być traktowana jako zwykła lub mediana, w ogólnym przypadku). Jeśli przyjmiesz te same kształty, to oczywiście ten sam H0 stanie się „identycznym rozkładem”.Kruskal-Wallis opiera się raczej na randze niż na wartości. Może to mieć dużą różnicę, jeśli istnieją wypaczone rozkłady lub jeśli występują ekstremalne przypadki
źródło