Próbuję przetestować zerową wartość , względem lokalnej alternatywy E [ X ] > 0 , dla zmiennej losowej X , z zastrzeżeniem łagodnego do średniego pochylenia i kurtozy zmiennej losowej. Zgodnie z sugestiami Wilcoxa w „Wstęp do solidnego szacowania i testowania hipotez” spojrzałem na testy oparte na skróconej średniej, medianie, a także estymatorze M lokalizacji (procedura „jednoetapowa” Wilcoxa). Te solidne testy przewyższają standardowy test t pod względem mocy podczas testowania z rozkładem, który nie jest przekrzywiony, ale leptokurtotyczny.
Jednak podczas testowania z rozkładem, który jest przekrzywiony, te jednostronne testy są albo zbyt zbyt liberalne, albo zdecydowanie zbyt konserwatywne w ramach hipotezy zerowej, w zależności od tego, czy rozkład jest odpowiednio przesunięty w lewo czy w prawo. Na przykład przy 1000 obserwacji test oparty na medianie faktycznie odrzuci ~ 40% czasu, przy nominalnym poziomie 5%. Powód tego jest oczywisty: w przypadku przekrzywionych rozkładów mediana i średnia są raczej różne. Jednak w mojej aplikacji naprawdę muszę przetestować średnią, a nie średnią, a nie średnią obciętą.
Czy istnieje bardziej niezawodna wersja testu t, która faktycznie sprawdza średnią, ale jest odporna na przekrzywienie i kurtozę?
Idealnie byłoby, gdyby procedura działała dobrze również w przypadku braku przekrzywienia i wysokiej kurtozy. Test „jednoetapowy” jest prawie wystarczająco dobry, przy ustawionym stosunkowo wysokim parametrze „zgięcia”, ale jest on mniej skuteczny niż średnie przycięte testy, gdy nie ma pochylenia, i ma pewne problemy z utrzymaniem nominalnego poziomu odrzutów pod pochyleniem .
tło: powodem, dla którego naprawdę zależy mi na średniej, a nie na medianie, jest to, że test zostałby zastosowany w aplikacji finansowej. Na przykład, jeśli chcesz sprawdzić, czy portfel ma dodatnie oczekiwane zwroty z logów, średnia jest w rzeczywistości odpowiednia, ponieważ jeśli zainwestujesz w portfel, zobaczysz wszystkie zwroty (czyli średnią razy liczbę próbek), zamiast duplikaty mediany. Oznacza to, że troszczą się o sumę n czerpie z RV X .
źródło
Odpowiedzi:
Dlaczego patrzysz na testy nieparametryczne? Czy naruszone są założenia testu t? Mianowicie dane porządkowe lub nietypowe oraz niestałe odchylenia? Oczywiście, jeśli twoja próbka jest wystarczająco duża, możesz uzasadnić parametryczny test t jego większą mocą pomimo braku normalności w próbce. Podobnie, jeśli Twoim problemem są nierówne wariancje, w teście parametrycznym pojawiają się poprawki, które dają dokładne wartości p (korekcja Welcha).
W przeciwnym razie porównanie wyników z t-testem nie jest dobrym sposobem na obejście tego, ponieważ wyniki testu t są tendencyjne, gdy założenia nie są spełnione. Mann-Whitney U to odpowiednia nieparametryczna alternatywa, jeśli naprawdę tego potrzebujesz. Tracisz moc tylko wtedy, gdy korzystasz z testu nieparametrycznego, gdy możesz w uzasadniony sposób zastosować test t (ponieważ założenia są spełnione).
I, po więcej tła, przejdź tutaj ...
http://www.jerrydallal.com/LHSP/STUDENT.HTM
źródło
Zgadzam się, że jeśli chcesz faktycznie sprawdzić, czy średnie grupy są różne (w przeciwieństwie do testowania różnic między medianami grupy lub środkami przyciętymi itp.), To nie chcesz używać testu nieparametrycznego, który testuje inną hipotezę.
Zasadniczo wartości p z testu t wydają się być dość dokładne, biorąc pod uwagę umiarkowane odstępstwa od założenia normalności reszt. Sprawdź ten aplet, aby uzyskać intuicję na temat tej odporności: http://onlinestatbook.com/stat_sim/robustness/index.html
Jeśli nadal martwisz się naruszeniem założenia normalności, możesz chcieć uruchomić . np. http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf
Możesz także przekształcić zmienną zależną skośną, aby rozwiązać problemy z odstępstwami od normalności.
źródło
trimpb
itrimcibt
, ale są one trochę zbyt wolne, aby wykonać moje testy mocy, przynajmniej według mojego gustu. do: 3, myślałem o tej metodzie, ale interesuje mnie średnia z nieprzetworzonych danych (tj. nie porównuję 2 RV z testem t, w którym to przypadku transformacja monotoniczna byłaby odpowiednia dla porównanie według rang, jak zauważył @JoFrhwld.)Johnson (1978) podaje modyfikację dlat -statystyczne i przedziały ufności, które są dobrym punktem wyjścia dla mojego problemu. Korekta oparta jest na rozszerzeniu Cornish-Fisher i wykorzystuje pochylenie próbki.
„Najnowsze i największe” należą do Ogaswary , z odniesieniami do Hall i innych.
źródło
Nie mam wystarczającej reputacji na komentarz, więc jako odpowiedź: spójrz na to obliczenie. Myślę, że to doskonała odpowiedź. W skrócie:
źródło