Dlaczego test Levene'a równości wariancji zamiast współczynnika F?

Odpowiedzi:

34

Państwo mogli wykorzystywać test F do oceny wariancji dwóch grup, ale przy użyciu testu F dla różnic wariancji bezwzględnie wymaga, aby dystrybucje są normalne. Zastosowanie testu Levene'a (tj. Bezwzględnych wartości odchyleń od średniej) jest bardziej niezawodne, a zastosowanie testu Browna-Forsythe'a (tj. Bezwzględnych wartości odchyleń od mediany ) jest jeszcze bardziej niezawodne. SPSS stosuje tutaj dobre podejście.

Aktualizacja W odpowiedzi na poniższy komentarz chcę wyjaśnić, co próbuję tu powiedzieć. Pytanie dotyczy zastosowania „prostego współczynnika F stosunku wariancji dwóch grup”. Na tej podstawie zrozumiałem, że alternatywą może być tak zwany test Hartleya , który jest bardzo intuicyjnym podejściem do oceny heterogeniczności wariancji. Chociaż wykorzystuje to współczynnik wariancji, nie jest taki sam jak ten zastosowany w teście Levene'a. Ponieważ czasami trudno jest zrozumieć, co to znaczy, gdy jest wyrażone tylko słowami, dam równania, aby to wyjaśnić.

Test Hartleya:

fa=s2)2)s12)
Test Levene'a / Brown-Forsythe:
fa=M.S.b/t-lmivmilsM.S.w/ja-lmivmils

We wszystkich trzech przypadkach mamy współczynniki wariancji, ale poszczególne zastosowane wariancje różnią się między sobą. Tym, co czyni test Levene'a i test Browna-Forsythe'a bardziej niezawodnym (a także różniącym się od innych ANOVA), jest to, że są one przeprowadzane na przekształconych danych, podczas gdy współczynnik F wariancji grupowych (test Hartleya) wykorzystuje surowe dane. Przekształcone dane, o których mowa, to bezwzględne wartości odchyleń (od średniej w przypadku testu Levene'a i od mediany w przypadku testu Browna-Forsythe'a).

Istnieją inne testy na niejednorodność wariancji, ale ograniczam moją dyskusję do nich, ponieważ zrozumiałem, że są one przedmiotem pierwotnego pytania. Uzasadnienie wyboru między nimi opiera się na ich wydajności, jeśli oryginalne dane nie są naprawdę normalne; przy czym test F jest wystarczająco niewystarczający, aby nie był zalecany; Test levene'a jest nieco mocniejszy niż BF jeśli dane są naprawdę normalne, ale nie całkiem tak wytrzymałe, jeśli nie są. Kluczowym cytatem tutaj jest O'Brien (1981), chociaż nie mogłem znaleźć dostępnej wersji w Internecie. Przepraszam, jeśli źle zrozumiałem pytanie lub było niejasne.

gung - Przywróć Monikę
źródło
2
Ponieważ statystyka Levene'a jest stosunkiem kwadratów zbudowanych z tych absolutnych reszt i odnosi się do rozkładu F, nie jest od razu oczywiste, że powinna być bardziej solidna niż inne testy oparte na stosunkach kwadratów! Być może myślisz o bardziej solidnych wariantach, takich jak test Browna-Forsythe'a . Zobacz dobrą dyskusję autorstwa @chl na stronie stats.stackexchange.com/questions/2591/… .
whuber
@ Whuber, dziękuję za komentarz i link. W komentarzu jest za dużo odpowiedzi, więc zredagowałem swoją odpowiedź. Uważam, że to, do czego staram się dotrzeć, powinno być teraz jaśniejsze. Jeśli jednak źle zrozumiem lub po prostu się mylę, mogę usunąć tę odpowiedź.
gung - Przywróć Monikę
(Nowy) ostatni akapit dobrze nadaje punkt (+1).
whuber