Testuję równość środków za pomocą testu t Welcha. Podstawowy rozkład jest daleki od normalnego (bardziej wypaczony niż przykład w pokrewnej dyskusji tutaj ). Mogę uzyskać więcej danych, ale chciałbym w pewien sposób ustalić sposób, w jaki sposób to zrobić.
- Czy istnieje dobra heurystyka dla dokonania oceny, czy rozkład próbki jest akceptowalny? Jakie odchylenia od normalności najbardziej dotyczą?
- Czy istnieją inne podejścia - np. Polegające na przedziale ufności ładowania początkowego dla statystyki próbki - które miałyby większy sens?
Odpowiedzi:
Ponieważ test t zakłada normalność, a leżące u jego podstaw rozkłady nie są normalne, nie może być zasadniczy sposób ustalenia, czy rozkład próbki jest akceptowalny. Jednakże, gdy wielkość próbki staje się „duża”, pojawia się Centralne Twierdzenie Graniczne i możesz użyć dużego próbnego testu Z, który zasadniczo da ci taką samą odpowiedź jak test t, ponieważ t zbliża się do rozkładu normalnego z duże próbki.
Statystyki książek / kursów często sugerują, że przy próbce 25 lub 30 CLT wchodzi w grę w przydatny sposób. Jednak z mojego doświadczenia wynika, że nawet przy rozmiarach próbek w setkach dużych próbek Z testy nadal mogą być dość słabe (np. Z danymi zliczeń).
Moim zdaniem test permutacji dobrze pasuje do twojego problemu. Powinien mieć taką samą lub lepszą moc niż nieparametryczne testy w puszkach (np. Mann-Whitney) i nie musisz się martwić kwestią normalności. I są fajnie pisać.
źródło