Oceny „w przybliżeniu normalne” dla testów t

Testuję równość środków za pomocą testu t Welcha. Podstawowy rozkład jest daleki od normalnego (bardziej wypaczony niż przykład w pokrewnej dyskusji tutaj ). Mogę uzyskać więcej danych, ale chciałbym w pewien sposób ustalić sposób, w jaki sposób to zrobić.

Czy istnieje dobra heurystyka dla dokonania oceny, czy rozkład próbki jest akceptowalny? Jakie odchylenia od normalności najbardziej dotyczą?
Czy istnieją inne podejścia - np. Polegające na przedziale ufności ładowania początkowego dla statystyki próbki - które miałyby większy sens?

normal-distribution t-test bootstrap central-limit-theorem approximation kohoz
źródło

To świetne pytanie. Poza tym, czy testowanie normalności jest „zasadniczo bezużyteczne”? (już powiązane), dwa kolejne powiązane pytania brzmią: Jak wybrać między testem t lub testem nieparametrycznym, np. Wilcoxon w małych próbkach? i test T na nietypowy, gdy N> 50? Dobra odpowiedź na to pytanie byłaby potencjalnie cenna dla czytelników tych dwóch powiązanych pytań.

Silverfish,

O ile mi wiadomo, nie ma żadnych zasadniczych sposobów określania, ile danych potrzebujesz, aby dystrybucja była „wystarczająco normalna”. Wynika to z faktu, że „wystarczająco normalny” jest trudny do zdefiniowania i zależy od tego, jak nienormalny jest podstawowy rozkład, oprócz szczególnego sposobu, w jaki odchodzisz od normalności. Jeśli masz poważnie nietypowe dane, użyłbym zamiast tego testu nieparametrycznego. Minusem jest to, że nie byłbyś w stanie uzyskać przedziałów ufności, które są bardziej przydatne niż samotne testy hipotez.

dsaxton

Zgadzam się, że „wystarczająco normalny” jest trudny do zdefiniowania, ale każdy praktykujący musi dokonać oceny przed uzasadnieniem danych empirycznych, dlatego jestem zaskoczony, jak mało dyskusji udało mi się odkryć (być może szukam w niewłaściwych miejscach) . W przypadku przypadków użycia, które mam na myśli (które wydają się wystarczająco powszechne) testy nieparametryczne są niezadowalające w porównaniu z gromadzeniem większej ilości danych w celu zapewnienia „normalnego” rozkładu próbkowania.

cohoz

Ponieważ test t zakłada normalność, a leżące u jego podstaw rozkłady nie są normalne, nie może być zasadniczy sposób ustalenia, czy rozkład próbki jest akceptowalny. Jednakże, gdy wielkość próbki staje się „duża”, pojawia się Centralne Twierdzenie Graniczne i możesz użyć dużego próbnego testu Z, który zasadniczo da ci taką samą odpowiedź jak test t, ponieważ t zbliża się do rozkładu normalnego z duże próbki.

Statystyki książek / kursów często sugerują, że przy próbce 25 lub 30 CLT wchodzi w grę w przydatny sposób. Jednak z mojego doświadczenia wynika, że nawet przy rozmiarach próbek w setkach dużych próbek Z testy nadal mogą być dość słabe (np. Z danymi zliczeń).

Moim zdaniem test permutacji dobrze pasuje do twojego problemu. Powinien mieć taką samą lub lepszą moc niż nieparametryczne testy w puszkach (np. Mann-Whitney) i nie musisz się martwić kwestią normalności. I są fajnie pisać.

Tim
źródło

Oceny „w przybliżeniu normalne” dla testów t

Odpowiedzi: