W jakiej sytuacji test podpisania rang Wilcoxona byłby lepszy od testu t lub testu znaku?

10

Po krótkiej dyskusji (poniżej) mam teraz jaśniejszy obraz skoncentrowanego pytania, więc oto poprawione pytanie, chociaż niektóre komentarze mogą wydawać się niezwiązane z pierwotnym pytaniem.

Wydaje się, że testy t zbiegają się szybko dla rozkładów symetrycznych , że test rangi ze znakiem zakłada symetrię i że dla rozkładu symetrycznego nie ma różnicy między średnimi / pseudomedianami / medianami. Jeśli tak, to w jakich okolicznościach stosunkowo niedoświadczony statystyk uznałby za przydatny test rangi ze znakiem, kiedy ma do dyspozycji zarówno test t, jak i test znaku? Jeśli jeden z moich (np. Nauk społecznych) studentów próbuje sprawdzić, czy jedno leczenie działa lepiej niż inne (za pomocą względnie łatwej do interpretacji miary, np. Pojęcia „przeciętnej” różnicy), staram się znaleźć miejsce na podpisane- test rangowy, chociaż wydaje się, że jest ogólnie nauczany, a test znakowy zignorowany na moim uniwersytecie.

tylko ja
źródło
1
Justme: oczywiście nie myślałem o tym.
JonB
1
To zależy od tego, na czyją mądrość patrzysz; moje doświadczenie jest bardzo różne od twojego. Z pewnością łatwo jest znaleźć zasoby, które jasno stwierdzają, że symetria wyników różnic przyjmowana jest pod wartością zerową (i że ma to znaczenie). Ale zauważ, że jest to poniżej zera - w rezultacie znalezienie braku symetrii w różnicach w próbce niekoniecznie jest istotne - nie musisz mieć symetrii w ramach alternatywy. Jeśli jesteś bardzo pewny, że gdyby zerowy był prawdziwy, symetria się utrzyma - a w wielu przypadkach jest to bardzo prawdopodobne założenie - ... ctd
Glen_b
1
ctd ... to nie ma problemu. Problem polega na tym, że jeśli nie jesteś przygotowany na przyjęcie tego z góry, nie wiesz, czy odrzucenie było spowodowane niepowodzeniem założenia; oczywistą rzeczą do zrobienia jest po prostu nie zakładanie tego.
Glen_b
2
Patrząc najpierw na twój drugi komentarz: (oprócz tego, co już wspomniałeś), zauważ, że 1. normalne założenia nie wyczerpują testów parametrycznych. 2. Podpisany test rangowy nie jest tak naprawdę testem median, ale statystyk Hodgesa-Lehmanna / pseudomedianów z jedną próbą (chociaż jeśli dodasz założenie symetrii do alternatywy, będzie to również testować mediany i tam, gdzie istnieją środki, także dla środków, między innymi). Podobnie test sumy rang nie jest testem median, ale mediany różnic parami. Masz rację, że poziom podpisanego testu rangi może być dość wrażliwy na asymetrię.
Glen_b
2
Wcześniejszy komentarz: 1 Symetria nie jest generalnie postrzegana jako część wartości zerowej, ale jako część założeń, których potrzebujesz, aby permutacje były wymienne pod wartością zerową. 2. jak już wspomniano, tak naprawdę nie jest to próba median, ale pseudomedianów, i dotyczy to nawet asymetrycznej alternatywy. Prawdą jest, że interpretacja jest czasami łatwiejsza, jeśli przyjmujesz pewne restrykcyjne założenia, ale ograniczenia wymagane, aby uczynić ją rozsądnym testem dla median, nie muszą być tak surowe, jak przyjęcie symetrii w ramach alternatywy.
Glen_b

Odpowiedzi:

3

Rozważ rozkład różnic par, który jest nieco cięższy niż zwykle, ale niezbyt „szczytowy”; wtedy często podpisany test rangowy będzie zwykle silniejszy niż test t, ale także silniejszy niż test znakowy.

Na przykład przy rozkładzie logistycznym asymptotyczna wydajność względna podpisanego testu rangi w stosunku do testu t wynosi 1,097, więc podpisany test rangi powinien być silniejszy niż t (przynajmniej w większych próbkach), ale asymptotyczna wydajność względna testu znakowego w stosunku do testu t wynosi 0,822, więc test znakowy byłby mniej skuteczny niż t (ponownie, przynajmniej w większych próbkach).

Gdy przechodzimy do rozkładów o większym ogonie (wciąż unikając nadmiernie szczytowych), t będzie miało tendencję do działania stosunkowo gorzej, podczas gdy test znaku powinien się nieco poprawić, a zarówno znak, jak i ranga ze znakiem będą przewyższać t w wykrywaniu małych efekty o znacznych marginesach (tj. będą wymagały znacznie mniejszych próbek do wykrycia efektu). Będzie duża klasa dystrybucji, dla których test rangi ze znakiem jest najlepszy z trzech.

t3)tδ

wykres krzywych mocy dla t, Wilcoxon podpisał testy rangowe i znakowe przy n = 100 i 5% poziomie istotności dla t3

Jak widzimy na wykresie, podpisany test rangowy ma większą moc niż test znakowy, który z kolei ma większą moc niż test t.

Glen_b - Przywróć Monikę
źródło
Wielkie dzięki za to @Glen_b! Wciąż staram się ustalić, gdzie pasuje do naszego programu nauczania, kiedy mamy studentów, dla których nawet pojęcie władzy jest poza zakresem ich studiów i dlaczego uczymy Wilcoxona jako głównej alternatywy dla sparowanego t. Daje to jednak kilka przydatnych motywacji. Dziękuję Ci!
justme
Nawiasem mówiąc, po zastanowieniu się, jaka cecha dystrybucyjna wpływa na asymptotyczną wariancję mediany (a zatem i mocy testu znakowego), przyszedł mi do głowy przykład, w którym względne pozycje testu ti znaku są odwrócone; w związku z tym myślę, że istnieje dobra możliwość skonstruowania przypadku, w którym podpisany test rangowy może być znacznie lepszy niż którykolwiek z dwóch pozostałych testów. Będę z tym jeszcze grać, kiedy będę mógł i może coś o tym napiszę.
Glen_b Przywróć Monikę
Jeśli chodzi o twój program nauczania, jasne jest, że zdecydowanie istnieją przypadki, w których podpisana ranga przewyższa oba pozostałe testy (jak wskazałem w moich odpowiedziach - rozkłady, które są nieco cięższe niż normalnie, ale nie są szczególnie wysokie); t jest lepsze na normalnym lub lżejszym, a test znaku jest lepszy, gdy rozkład ma silny pik (który często ma tendencję do łączenia się z bardzo ciężkimi ogonami, ale nie musi). [Uważaj jednak, myląc te pomysły ze zwykłymi zmianami w rozkładzie, co nie zmienia ich względnych właściwości.] ... Jestem pewien, że możesz wcisnąć kilka takich zdań w
Glen_b
Wielkie dzięki @Glen_b! Problem w tym, że nie uczę sylabusa, tylko go wspieram! Program nauczania w większości działów wydaje się: (i) zastosować test hipotezy o normalności (zabij mnie teraz) i na tej podstawie (ii) użyć testu Wilcoxona lub t-testu. Tak więc nawet najdrobniejsze szczegóły ramion dystrybucji itp. Nie są nawet dotykane, podobnie jak moc, tylko to, czy założenia są spełnione (w nieco bzdurny sposób). Ale twoje myśli są dla mnie bardzo pomocne, przynajmniej!
justme
Świetny post @Glen_b! Czy w związku z wyborem dwóch testów mogę stwierdzić, że zawsze powinniśmy najpierw obliczyć moc? Zamiast przyjąć założenie, że zawsze używa się testu znaku, jeśli rozkład różnic nie jest normalny? Dzięki!
Lumos