Czy dane wyjściowe statystyki W przez wilcox.test () w R są takie same jak statystyki U?

22

Niedawno czytałem o teście U Manna-Whitneya. Okazuje się, że aby przeprowadzić ten test w R, trzeba przeprowadzić test Wilcoxona!

Moje pytanie: czy statystyka W wilcox.testw R jest identyczna ze statystyką U?

luciano
źródło

Odpowiedzi:

25

Wilcoxon jest ogólnie uznawany za oryginalnego wynalazcę testu *, choć podejście Manna i Whitneya było wielkim krokiem naprzód i rozszerzyło przypadki, dla których zestawiono statystyki. Wolę odnosić się do testu jako Wilcoxon-Mann-Whitney, aby rozpoznać oba wkłady (Mann-Whitney-Wilcoxon jest również widoczny; nie mam nic przeciwko temu).

* Jednak rzeczywisty obraz jest nieco bardziej mętny, a kilku innych autorów również przedstawia te same lub podobne statystyki dotyczące tego czasu lub wcześniej, lub w niektórych przypadkach wnosi wkład ściśle związany z testem. Przynajmniej część kredytu powinna trafić gdzie indziej.

Test Wilcoxona i test U Manna-Whitneya są równoważne (a pomoc stwierdza, że ​​są), ponieważ zawsze odrzucają te same przypadki w tych samych okolicznościach; co najwyżej ich statystyki testowe będą się różnić tylko przesunięciem (aw niektórych przypadkach po prostu zmianą znaku).

Test Wilcoxona jest zdefiniowany w literaturze na wiele sposobów (a ta dwuznaczność sięga pierwotnej tabeli statystyk testu, więcej niż za chwilę), więc należy zadbać o to, o czym dyskutuje się test Wilcoxona.

Dwie najczęstsze formy definicji zostały omówione w tej parze postów:

Test sumy rang Wilcoxona w R.

Różne sposoby obliczania statystyki testu dla testu sumy rang Wilcoxona

Aby zająć się tym, co konkretnie dzieje się w R:

Statystyka użyta przez wilcox.testw R jest zdefiniowana w help ( ?wilcox.test), a pytanie dotyczące relacji do statystyki U Manna-Whitneya jest tam wyjaśnione:

W literaturze nie ma jednomyślności co do definicji sumy rang Wilcoxona i testów Manna-Whitneya

Dwie najczęstsze definicje odpowiadają sumie rang pierwszej próbki z minimalną wartością odjętą lub nie: R odejmuje, a S-PLUS nie, dając wartość większą o m (m + 1) / 2 dla a pierwsza próbka o rozmiarze m. (Wygląda na to, że oryginalny artykuł Wilcoxona wykorzystał nieskorygowaną sumę stopni, ale kolejne tabele odjęły minimum).

Wartość R można również obliczyć jako liczbę wszystkich par, (x[i], y[j])dla których y[j]nie jest większa niż x[i], najczęstsza definicja testu Manna-Whitneya.

To ostatnie zdanie całkowicie odpowiada temu aspektowi twojego pytania - wersja W, którą wystawia R *, jest również wartością U.

n1(n1+1)2)

Glen_b - Przywróć Monikę
źródło
7

Zarówno test sumy rang Wilcoxona, jak i test Manna-Whitneya są nieparametrycznymi odpowiednikami niezależnego testu t . W niektórych przypadkach wersja W, którą daje R, jest również valua U. Ale nie we wszystkich przypadkach.

Kiedy używasz: wilcox.test(df$var1 ~ df$var2, paired=FALSE)podana W jest taka sama jak U. Możesz więc zgłosić ją jako statystykę U Manna-Whitneya.

Jednak gdy użyjesz: wilcox.test(df$var1 ~ df$var2, paired=TRUE)faktycznie przeprowadzasz test rangi podpisany przez Wilcoxona. Podpisany test rang Wilcoxona jest odpowiednikiem zależnego testu t .

Źródło: „Odkrywanie statystyk za pomocą R” Andy Field (2013)

Jaap
źródło
1
Dobrym pomysłem jest wskazanie, że jeśli użyjesz argumentu, paired=TRUEnie będzie to Wilcoxon-Mann-Whitney, ale podpisana ranga.
Glen_b
1

Zauważ jednak, że kod: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(używając „~”)

stworzy inną statystykę W niż: wilcox.test(df$var1, df$var2, paired=FALSE)(używając „,”)

Tilen
źródło
Witamy na stronie @Tilen. Czy miało to być odpowiedzią na pytanie PO, komentarzem wymagającym wyjaśnień od PO lub jednego z respondentów, czy też własnym pytaniem? Użyj tylko pola „Twoja odpowiedź”, aby podać odpowiedzi na pierwotne pytanie. Będziesz mógł komentować w dowolnym miejscu, gdy Twoja reputacja będzie> 50. Jeśli masz nowe pytanie, kliknij szary kolor ASK QUESTION u góry strony i zadaj je tam, a my pomożemy Ci właściwie. Ponieważ jesteś tutaj nowy, możesz wybrać się na naszą wycieczkę , która zawiera informacje dla nowych użytkowników.
gung - Przywróć Monikę
Wielkie dzięki @gung. Rzeczywiście, to chyba odpowiedź i pytanie. Dziękuję za wskazówki. Nie mogę się doczekać bycia częścią tego.
Tilen
„Odpowiedzi” dotyczą wyłącznie bezpośrednich odpowiedzi na pytanie. Czy możesz to edytować, aby była czysto odpowiedzią?
gung - Przywróć Monikę
Przepraszam za to. Zredagowałem to teraz. Czy teraz wygląda lepiej?
Tilen
1
Nie ma potrzeby przepraszać. Myślę, że twoja odpowiedź jest ukryta w tym, co tu umieściłeś, ale ludzie będą musieli czytać między wierszami. Czy potrafisz wyrazić to jasno i zawiązać wszystko w ukłon? Nie jestem jednak pewien, czy to prawda. Aby użyć wersji formuły, potrzebujesz wektora wartości i wskaźnika grupowania. Np wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Kiedy to robię, robię to samo w Wobie strony.
gung - Przywróć Monikę