Niedawno czytałem o teście U Manna-Whitneya. Okazuje się, że aby przeprowadzić ten test w R, trzeba przeprowadzić test Wilcoxona!
Moje pytanie: czy statystyka W wilcox.test
w R jest identyczna ze statystyką U?
źródło
Niedawno czytałem o teście U Manna-Whitneya. Okazuje się, że aby przeprowadzić ten test w R, trzeba przeprowadzić test Wilcoxona!
Moje pytanie: czy statystyka W wilcox.test
w R jest identyczna ze statystyką U?
Wilcoxon jest ogólnie uznawany za oryginalnego wynalazcę testu *, choć podejście Manna i Whitneya było wielkim krokiem naprzód i rozszerzyło przypadki, dla których zestawiono statystyki. Wolę odnosić się do testu jako Wilcoxon-Mann-Whitney, aby rozpoznać oba wkłady (Mann-Whitney-Wilcoxon jest również widoczny; nie mam nic przeciwko temu).
* Jednak rzeczywisty obraz jest nieco bardziej mętny, a kilku innych autorów również przedstawia te same lub podobne statystyki dotyczące tego czasu lub wcześniej, lub w niektórych przypadkach wnosi wkład ściśle związany z testem. Przynajmniej część kredytu powinna trafić gdzie indziej.
Test Wilcoxona i test U Manna-Whitneya są równoważne (a pomoc stwierdza, że są), ponieważ zawsze odrzucają te same przypadki w tych samych okolicznościach; co najwyżej ich statystyki testowe będą się różnić tylko przesunięciem (aw niektórych przypadkach po prostu zmianą znaku).
Test Wilcoxona jest zdefiniowany w literaturze na wiele sposobów (a ta dwuznaczność sięga pierwotnej tabeli statystyk testu, więcej niż za chwilę), więc należy zadbać o to, o czym dyskutuje się test Wilcoxona.
Dwie najczęstsze formy definicji zostały omówione w tej parze postów:
Różne sposoby obliczania statystyki testu dla testu sumy rang Wilcoxona
Aby zająć się tym, co konkretnie dzieje się w R:
Statystyka użyta przez wilcox.test
w R jest zdefiniowana w help ( ?wilcox.test
), a pytanie dotyczące relacji do statystyki U Manna-Whitneya jest tam wyjaśnione:
W literaturze nie ma jednomyślności co do definicji sumy rang Wilcoxona i testów Manna-Whitneya
Dwie najczęstsze definicje odpowiadają sumie rang pierwszej próbki z minimalną wartością odjętą lub nie: R odejmuje, a S-PLUS nie, dając wartość większą o m (m + 1) / 2 dla a pierwsza próbka o rozmiarze m. (Wygląda na to, że oryginalny artykuł Wilcoxona wykorzystał nieskorygowaną sumę stopni, ale kolejne tabele odjęły minimum).
Wartość R można również obliczyć jako liczbę wszystkich par,
(x[i], y[j])
dla którychy[j]
nie jest większa niżx[i]
, najczęstsza definicja testu Manna-Whitneya.
To ostatnie zdanie całkowicie odpowiada temu aspektowi twojego pytania - wersja W, którą wystawia R *, jest również wartością U.
Zarówno test sumy rang Wilcoxona, jak i test Manna-Whitneya są nieparametrycznymi odpowiednikami niezależnego testu t . W niektórych przypadkach wersja W, którą daje R, jest również valua U. Ale nie we wszystkich przypadkach.
Kiedy używasz: wilcox.test(df$var1 ~ df$var2, paired=FALSE)
podana W jest taka sama jak U. Możesz więc zgłosić ją jako statystykę U Manna-Whitneya.
Jednak gdy użyjesz: wilcox.test(df$var1 ~ df$var2, paired=TRUE)
faktycznie przeprowadzasz test rangi podpisany przez Wilcoxona. Podpisany test rang Wilcoxona jest odpowiednikiem zależnego testu t .
Źródło: „Odkrywanie statystyk za pomocą R” Andy Field (2013)
paired=TRUE
nie będzie to Wilcoxon-Mann-Whitney, ale podpisana ranga.Zauważ jednak, że kod:
wilcox.test(df$var1 ~ df$var2, paired=FALSE)
(używając „~”)stworzy inną statystykę W niż:
wilcox.test(df$var1, df$var2, paired=FALSE)
(używając „,”)źródło
ASK QUESTION
u góry strony i zadaj je tam, a my pomożemy Ci właściwie. Ponieważ jesteś tutaj nowy, możesz wybrać się na naszą wycieczkę , która zawiera informacje dla nowych użytkowników.wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE)
. Kiedy to robię, robię to samo wW
obie strony.