Jakie odniesienia należy przytoczyć, aby poprzeć użycie 30 jako wystarczająco dużej próbki?

41

Wielokrotnie czytałem / słyszałem, że wielkość próbki co najmniej 30 jednostek jest uważana za „dużą próbkę” (założenia dotyczące normalności środków zwykle w przybliżeniu zachowują się z powodu CLT, ...). Dlatego w moich eksperymentach zwykle generuję próbki 30 jednostek. Czy możesz podać mi odniesienie, które należy zacytować, gdy używasz próbki o wielkości 30?

Lan
źródło
2
Bez odniesienia do liczby parametrów, które próbujesz oszacować, lub równoważnie z rodzajem modelu, z którym pracujesz, wydaje się raczej trudne dać jasną odpowiedź.
chl
2
Przyjęcie n = 30 jako granicy małych i dużych próbek nie jest dobrze poparte żadną techniką statystyczną.
Jibol,

Odpowiedzi:

37

Wybór n = 30 dla granicy między małymi i dużymi próbkami jest jedynie regułą. Istnieje wiele książek, które cytują (w przybliżeniu) tę wartość, na przykład „ Prawdopodobieństwo i wnioskowanie statystyczne Hogga i Tanisa” (7e) mówi „więcej niż 25 lub 30”.

Powiedział, że historia opowiedziana mi się, że jedynym powodem, 30 uznano za granica była dobra, ponieważ jest wykonane za ładna Studenta t tabel w podręcznikach do tyłu ładnie mieści się na jednej stronie. To, a wartości krytyczne (między t Studenta i Normalne) są wyłączone tylko o około 0,25, w każdym razie od df = 30 do df = nieskończoność. W przypadku obliczeń ręcznych różnica tak naprawdę nie miała znaczenia.

W dzisiejszych czasach łatwo jest obliczyć wartości krytyczne dla różnych rzeczy z dokładnością do 15 miejsc po przecinku. Ponadto mamy metody ponownego próbkowania i permutacji, dla których nie jesteśmy nawet ograniczeni do parametrycznych rozkładów populacji.

W praktyce nigdy nie polegam na n = 30. Wykreśl dane. Nałóż normalny rozkład, jeśli chcesz. Wizualnie oceń, czy normalne zbliżenie jest właściwe (i zapytaj, czy zbliżenie jest naprawdę potrzebne). Jeśli generowanie próbek do badań i aproksymacja jest obowiązkowa, należy wygenerować wystarczającą wielkość próby, aby aproksymacja była tak bliska, jak to pożądane (lub tak bliska, jak to możliwe obliczeniowo).


źródło
13
Oto strona dokładnie tego, jak dobre jest normalne przybliżenie rozkładu t dla n = 30. johndcook.com/normal_approx_to_t.html
John D. Cook
41

W rzeczywistości „magiczna liczba” 30 jest błędem. Zobacz zachwycający artykuł Jacoba Cohena, Things I Have Learned (So Far) (Am. Psych. Grudzień 1990 45 # 12, s. 1304–1312) . Ten mit jest jego pierwszym przykładem tego, że „niektóre rzeczy, których się uczysz, nie są takie”.

[O] jeden z moich doktorantów podjął rozprawę [z] próbką tylko 20 przypadków na grupę. ... [L] ater odkryłem ... że dla porównania dwóch niezależnych średnich grup z na grupę na uświęconym dwustronnym poziomie , prawdopodobieństwo, że efekt średniej wielkości będzie oznaczony co jest znaczące przez ... test t był tylko . Tak więc w przybliżeniu rzut monetą uzyskał znaczący wynik, nawet jeśli w rzeczywistości rozmiar efektu był znaczący. ... [Mój przyjaciel] skończył z nieistotnymi rezultatami - z którymi zaczął niszczyć ważną gałąź teorii psychoanalitycznej.n=30.05.47

Carlos Accioly
źródło
2
Piękne referencje - i odpowiednie miejsce. Dziękuję Ci.
whuber
1
@whuber Czy pamiętasz, który to był papier? Link jest już zepsuty. Może ten psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf , „Rzeczy, których się nauczyłem (do tej pory )”? Rok jest zgodny z rokiem w adresie URL uszkodzonego linku.
ameba mówi Przywróć Monikę
1
@Amoeba Zapisałem ten artykuł, kiedy go przeczytałem, dzięki czemu mogę potwierdzić, że znalazłeś zamierzony. Zaktualizowałem tę odpowiedź, aby zawierała cytat wraz z linkiem.
whuber
@Carlos Accioly Zaktualizowałem go nowym linkiem, ponieważ poprzedni był zepsuty.
Akshay Bansal
9

IMO, wszystko zależy od tego, do czego chcesz użyć próbki. Dwa „głupie” przykłady ilustrujące to, co mam na myśli: jeśli potrzebujesz oszacować średnią, 30 obserwacji jest więcej niż wystarczające. Jeśli musisz oszacować regresję liniową za pomocą 100 predyktorów, 30 obserwacji nie będzie wystarczająco blisko.

bhm
źródło
9

Przeważnie arbitralna zasada. To stwierdzenie zależy od wielu czynników. Na przykład przy dystrybucji danych. Jeśli dane pochodzą na przykład z Cauchy'ego, nawet 30 ^ 30 obserwacji nie wystarczy do oszacowania średniej (w takim przypadku nawet nieskończona liczba obserwacji nie wystarczyłaby, aby spowodować Zbiegać się). Ta liczba (30) jest również fałszywa, jeśli wartości, które rysujesz, nie są od siebie niezależne (ponownie możesz mieć pewność, że nie ma żadnej zbieżności, niezależnie od wielkości próby).μ¯(n)

Mówiąc bardziej ogólnie, CLT potrzebuje zasadniczo dwóch filarów:

  1. Że zmienne losowe są niezależne: możesz ponownie uporządkować swoje obserwacje bez utraty jakichkolwiek informacji *.
  2. Że rv pochodzą z rozkładu o skończonych drugich momentach: co oznacza, że ​​klasyczne estymatory średniej i sd mają tendencję do zbieżności wraz ze wzrostem wielkości próby.

(Oba te warunki mogą być nieco osłabione, ale różnice mają w dużej mierze charakter teoretyczny)

użytkownik603
źródło
6
Twój przykład ilustruje wartość solidnych statystyk. Próbka mediana szacuje parametr lokalizację Rozkład Cauchy'ego dobrze. Można argumentować, że najsłabszym ogniwem w stosowaniu testu t z 30 próbkami jest test t, a nie 30 próbek.
John D. Cook,
1
John:> „Można argumentować, że najsłabszym ogniwem w stosowaniu testu t z 30 próbkami jest test t, a nie 30 próbek”. Bardzo prawdziwe, a także założenie, że dane są identyczne . Ponadto, mediana wynosi MLE dla zmiennych losowych rozkładanych przez Cauchy'ego (a zatem wydajnych), ale generalnie możesz potrzebować więcej niż 30 obserwacji.
user603
1
Nie wszystkie wersje CLT opierają się na identycznej dystrybucji, a nawet na niezależności. Często robią to te podstawowe, których uczy się studentów, ale istnieją wersje, które nie przyjmują obu założeń, np. CLI Lapunowa zakłada niezależność, ale nie identyczne rozkłady, a warunki niezależności można również złagodzić, na przykład patrz tutaj . Ta „zmiana kolejności” również nie jest tym samym, co niezależność. Niektóre formy zależności nie polegają na porządku.
Glen_b
2
Wielkość próbki 50 000 jest niewystarczająca, aby CLT działał wystarczająco dobrze, aby obliczyć przedział ufności dla średniej rozkładu logarytmiczno-normalnego.
Frank Harrell