Różnica między testem sumy rang Wilcoxona a testem rang podpisanych Wilcoxona

22

Zastanawiałem się, jaka jest teoretyczna różnica między testem sumy rang Wilcoxona a testem rang Wilcoxona przy użyciu sparowanych obserwacji. Wiem, że test sumy rang Wilcoxona pozwala na różną liczbę obserwacji w dwóch różnych próbkach, podczas gdy test rangi ze znakiem w parach nie pozwala na to, jednak wydaje mi się, że oba testują to samo. Czy ktoś może podać mi więcej podstawowych / teoretycznych informacji, kiedy należy zastosować test sumy rang Wilcoxona, a kiedy należy zastosować test rang Wilcoxona ze sparowanymi obserwacjami?

Płatek śniegu
źródło

Odpowiedzi:

25

Powinieneś użyć podpisanego testu rangi po sparowaniu danych .

Znajdziesz wiele definicji parowania, ale w gruncie rzeczy kryterium jest coś, co sprawia, że ​​pary wartości są co najmniej w pewnym stopniu dodatnie zależne, podczas gdy niesparowane wartości nie są zależne. Często parowanie zależności występuje, ponieważ są obserwacjami na tej samej jednostce (powtarzane pomiary), ale nie musi to być na tej samej jednostce, po prostu w jakiś sposób ma tendencję do powiązania (podczas pomiaru tego samego rodzaju rzeczy) , uważane za „sparowane”.

Powinieneś użyć testu sumy rang, gdy dane nie są sparowane.

To w zasadzie wszystko.

Zauważ, że mając to samo n nie oznacza, że ​​dane są sparowane i mają różne nnie oznacza, że ​​nie ma parowania (może być tak, że kilka par utraciło obserwację z jakiegoś powodu). Parowanie wynika z rozważenia tego, co zostało pobrane.

Efektem zastosowania sparowanego testu, gdy dane są sparowane, jest to, że generalnie daje on większą moc do wykrycia zmian, którymi jesteś zainteresowany. Jeśli powiązanie prowadzi do silnej zależności *, wówczas wzrost mocy może być znaczny.

* konkretnie, ale mówiąc nieco swobodnie, jeśli rozmiar efektu jest duży w porównaniu z typowym rozmiarem różnic między parami, ale mały w porównaniu z typowym rozmiarem różnic niesparowanych, możesz zauważyć różnicę w sparowanym teście na dość mała próbka, ale z niesparowanym testem tylko przy znacznie większej próbce.

Jednak gdy dane nie są sparowane, traktowanie danych jako sparowanych może (przynajmniej nieznacznie) przynieść efekt przeciwny do zamierzonego. To powiedziawszy, koszt - utraty mocy - może w wielu okolicznościach być dość mały - badanie mocy, które wykonałem w odpowiedzi na to pytanie, wydaje się sugerować, że średnio utrata mocy w typowych sytuacjach małej próby (powiedzmy dla n rzędu od 10 do 30 w każdej próbce, po uwzględnieniu różnic w poziomie istotności) może być zaskakująco mały.

[Jeśli jesteś naprawdę niepewny, czy dane są sparowane, czy nie, utrata traktowania niesparowanych danych jako sparowanych jest zwykle stosunkowo niewielka, a korzyści mogą być znaczne, jeśli zostaną sparowane. Sugeruje to, że jeśli tak naprawdę nie wiesz i masz sposób, aby dowiedzieć się, co jest sparowane z tym, co przy założeniu, że zostały sparowane - takie jak wartości znajdujące się w tym samym rzędzie w tabeli, może w praktyce sensownie działać tak jakby dane zostały sparowane, aby były bezpieczne - chociaż niektórzy ludzie mogą mieć z tego powodu dość ćwiczenia.]

Glen_b - Przywróć Monikę
źródło
7

Nie jestem badaczem, ale jestem specjalistą od statystyki. Najpierw ułożę wymagania dla testu sumy rang podpisanych Wilcoxona (WSRST).

  • WSRST wymaga, aby populacje zostały połączone, na przykład ta sama grupa ludzi jest testowana przy dwóch różnych okazjach lub rzeczach i POMIARAJĄ na efektach każdej z nich, a następnie porównujemy te dwie rzeczy lub okazje.
  • WSRST wymaga, aby dane były ilościowe. Dane ilościowe to dane mierzone wzdłuż skali, dlatego podkreśliłem świat mierzony w pierwszym punkcie. Gdyby uczestnicy zostali poproszeni o uszeregowanie swoich odpowiedzi, będziesz miał do czynienia z danymi jakościowymi, gdzie będziesz musiał użyć testu znaków, aby sprawdzić swoją hipotezę.

[Istnieją inne wymagania dotyczące WSRST, ale te, które wymieniłem, są wystarczające do rozróżnienia dwóch testów]

Teraz test sumy rang Wilcoxona (WRST)

  • Głównym wymaganiem jest, aby próbki były pobierane z niezależnych populacji. Na przykład możesz chcieć sprawdzić, czy papier egzaminacyjny 1 jest trudniejszy niż papier egzaminacyjny 2, i aby to zrobić, będziesz mieć dwie grupy studentów i grupy nie muszą być tego samego rozmiaru. Z przykładu dwie grupy są niezależne, jeśli poprosiłeś tę samą grupę o dwukrotne napisanie tego samego artykułu, użyjesz WSRST do przetestowania swojej hipotezy.
  • Drugim wymogiem jest to, że dane nie muszą być ilościowe, tzn. Można również przeprowadzić test na danych jakościowych.
S'busiso
źródło