Czy istnieje „reguła” określająca minimalną wielkość próbki wymaganą do prawidłowego przeprowadzenia testu t?
Na przykład należy dokonać porównania między średnimi 2 populacji. Istnieje 7 punktów danych z jednej populacji i tylko 2 punkty danych z drugiej. Niestety eksperyment jest bardzo kosztowny i czasochłonny, a uzyskanie większej ilości danych nie jest możliwe.
Czy można zastosować test t? Dlaczego lub dlaczego nie? Podaj szczegóły (wariancje i rozkłady populacji nie są znane). Jeśli nie można zastosować testu t, to czy można zastosować test nieparametryczny (Mann Whitney)? Dlaczego lub dlaczego nie?
t-test
sample-size
small-sample
wilcoxon-mann-whitney
Johnny Puzzled
źródło
źródło
Odpowiedzi:
Zalecałbym użycie nieparametrycznego testu U Manna-Whitneya zamiast niesparowanego t -test tutaj.
Nie ma absolutnie minimalnej wielkości próbki dla testu t , ale gdy rozmiary próbek stają się mniejsze, test staje się bardziej wrażliwy na założenie, że obie próbki są pobierane z populacji o rozkładzie normalnym. Przy tak małych próbkach, szczególnie z jedną próbką złożoną tylko z dwóch, trzeba być bardzo pewnym, że rozkłady populacji były normalne - i to musi być oparte na wiedzy zewnętrznej, ponieważ takie małe próbki same w sobie dają bardzo mało informacji na temat normalność lub inaczej ich dystrybucji. Ale mówisz, że „różnice populacji i rozkłady nie są znane” (moja kursywą).
Test U Manna-Whitneya nie wymaga żadnych założeń dotyczących parametrycznej postaci rozkładów, wymagając jedynie założenia, że rozkłady dwóch grup są takie same w ramach hipotezy zerowej.
źródło
(zrzeczenie się: Nie mogę dzisiaj dobrze pisać: moja prawa ręka jest złamana!)
W przeciwieństwie do porady dotyczącej stosowania testu nieparametrycznego w innych odpowiedziach, należy wziąć pod uwagę, że w przypadku bardzo małych próbek metody te nie są zbyt przydatne. Łatwo zrozumieć, dlaczego: w badaniach o wyjątkowo małych rozmiarach nie można ustalić różnicy między grupami, chyba że zaobserwuje się duży rozmiar efektu. Jednak metody nieparametryczne nie dbają o wielkość różnicy między grupami. Tak więc, nawet jeśli różnica między dwiema grupami jest ogromna, przy małej wielkości próby test nieparametryczny zawsze nie odrzuci hipotezy zerowej.
Rozważ ten przykład: dwie grupy, rozkład normalny, ta sama wariancja. Grupa 1: średnio 1,0, 7 próbek. Grupa 2: średnio 5, 2 próbki. Istnieje duża różnica między średnimi.
Obliczona wartość p wynosi 0,055556, co nie odrzuca hipotezy zerowej (przy 0,05). Teraz, nawet jeśli zwiększysz odległość między dwoma średnimi 10 razy, otrzymasz tę samą wartość p:
Teraz zapraszam do powtórzenia tej samej symulacji z testem t i obserwowania wartości p w przypadku dużych (średnio 5 vs 1) i ogromnych (średnio 50 vs 1) różnic.
źródło
Nie ma minimalnej wielkości próby dla testu t; Test t został w rzeczywistości zaprojektowany dla małych próbek. W dawnych czasach, kiedy tabele były drukowane, widziałeś tabele testów t dla bardzo małych próbek (mierzonych df).
Oczywiście, podobnie jak w przypadku innych testów, jeśli jest mała próbka, tylko całkiem duży efekt będzie statystycznie istotny.
źródło
Zakładam, że masz na myśli, że masz 7 punktów danych z jednej grupy i 2 punkty danych z drugiej grupy, z których oba stanowią podzbiory populacji (np. Podzbiór mężczyzn i podzbiór kobiet).
Matematykę testu t można uzyskać na tej stronie Wikipedii . Przyjmiemy niezależny test t dla dwóch próbek, z nierównymi wielkościami próbek (7 vs. 2) i nierównymi wariancjami, czyli mniej więcej w połowie tej strony. Widać, że obliczenia oparte są na średnich i odchyleniach standardowych. Przy zaledwie 7 osobnikach w jednej grupie i 2 osobach w innej nie możesz założyć, że masz dobre oszacowania zarówno średniej, jak i odchylenia standardowego. Dla grupy z 2 podmiotami średnia to po prostu wartość leżąca dokładnie pośrodku dwóch punktów danych, więc nie jest dobrze oszacowana. W grupie z 7 osobnikami wielkość próby silnie wpływa na wariancje (a zatem odchylenia standardowe, które są pierwiastkiem kwadratowym wariancji), ponieważ wartości ekstremalne wywierają znacznie silniejszy efekt, gdy masz mniejszą próbkę.
Na przykład, jeśli spojrzysz na podstawowy przykład na stronie Wikipedii dla odchylenia standardowego , zobaczysz, że odchylenie standardowe wynosi 2, a wariancja (kwadrat odchylenie standardowe) wynosi zatem 4. Ale gdybyśmy mieli tylko dwa pierwsze punkty danych (9 i 1) wariancja wynosiłaby 10/2 = 5, a odchylenie standardowe wynosiłaby 2,2, a gdybyśmy mieli tylko dwie ostatnie wartości (4 i 16), wariancja wynosiłaby 20/2 = 10 a odchylenie standardowe wyniosłoby 3,2. Nadal używamy tych samych wartości, tylko ich mniej, i możemy zobaczyć wpływ na nasze szacunki.
To jest problem z używaniem wnioskowania statystycznego przy małych rozmiarach próbek, na wyniki będą szczególnie silnie wpływać próbki.
Aktualizacja: czy jest jakiś powód, dla którego nie można po prostu zgłosić wyników według tematu i wskazać, że jest to praca badawcza? Tylko w dwóch przypadkach dane są bardzo podobne do studium przypadku i oba są (1) ważne do napisania i (2) zaakceptowana praktyka.
źródło
Ciekawy powiązany artykuł: „Korzystanie z testu t-Studenta przy bardzo niskich rozmiarach próbek” JCF de Winter (w praktyce oceny, badań i oceny) http://goo.gl/ZAUmGW
źródło
Poleciłbym porównać wnioski wyciągnięte z obu, testem t i testem Manna-Whitneya, a także przyjrzeć się wykresom pudełkowym i prawdopodobieństwu profilu średniej dla każdej populacji.
źródło
Ponieważ test przeprowadzony na małych próbkach prawdopodobnie nie spełnia wymagań testu (głównie normalność populacji, z których pobrano dwie próbki), zaleciłbym wykonanie testu ładowania początkowego (z nierównymi wariancjami), po Efronie B, Tibshirani Rj. Wprowadzenie do Bootstrap. Boca Raton, Floryda: Chapman & Hall / CRC, 1993: 220-224. Kod testu ładowania początkowego na danych dostarczonych przez Johnny'ego Puzzleda w Stata 13 / SE pokazano na powyższym obrazku.
źródło
Przy wielkości próbki wynoszącej 2 najlepiej jest spojrzeć na same liczby, a nawet nie zawracać sobie głowy analizą statystyczną.
źródło