Dlaczego zwiększenie wielkości próby obniża wariancję (próbkowanie)?

35

Duży obraz:

Próbuję zrozumieć, jak zwiększenie wielkości próbki zwiększa moc eksperymentu. Slajdy mojego wykładowcy wyjaśniają to za pomocą obrazu 2 rozkładów normalnych, jednego dla hipotezy zerowej i drugiego dla hipotezy alternatywnej i progu decyzyjnego c między nimi. Twierdzą, że zwiększenie wielkości próby obniży wariancję, a tym samym spowoduje wyższą kurtozę, zmniejszając wspólny obszar pod krzywymi, a zatem prawdopodobieństwo błędu typu II.

Małe zdjęcie:

Nie rozumiem, jak większy rozmiar próbki obniży wariancję.
Zakładam, że po prostu obliczasz wariancję próbki i używasz jej jako parametru w rozkładzie normalnym.

Próbowałem:

  • googling , ale większość akceptowanych odpowiedzi ma 0 głosów pozytywnych lub są jedynie przykładami
  • myślenie : Zgodnie z prawem wielkich liczb każda wartość powinna ostatecznie ustabilizować się wokół prawdopodobnej wartości zgodnie z założonym rozkładem normalnym. Dlatego wariancja powinna zatem zbiegać się z wariancją naszego założonego rozkładu normalnego. Ale jaka jest wariancja tego rozkładu normalnego i czy jest to wartość minimalna, tj. Czy możemy być pewni, że nasza wariancja próbki spadnie do tej wartości?
użytkownik2740
źródło
Twój eksperyment myślowy dotyczył normalnie rozpowszechnianych danych, ale dotyczy to również danych pochodzących z wielu innych dystrybucji (jak zauważył @Aksakal, nie wszystkie! Cauchy jest często cytowanym przykładem takiego złego zachowania). W przypadku danych dwumianowych dobrze dyskutuje się o tym, jak moc i błąd standardowy różnią się w zależności od wielkości próbki, na stronie stats.stackexchange.com/q/87730/22228
Silverfish,
1
Ponieważ jesteś nowy w CrossValidated, pozwól, że zwrócę uwagę, że jeśli otrzymałeś odpowiedź, którą uważasz za zadowalającą, powinieneś rozważyć oznaczenie jej jako „zaakceptowanej”, klikając zielony znaczek po lewej stronie. Zapewnia to dodatkową reputację dla odpowiadającego, a także oznacza pytanie jako rozwiązane.
ameba mówi Przywróć Monikę
Myślę o tym w ten sposób: każdy nowy punkt ma unikalną informację. Nieskończone punkty mają wystarczająco dużo, aby dokonać dokładnej oceny. Gdy dodajemy coraz więcej nowych punktów próbnych, różnica między informacjami, których potrzebujemy, aby uzyskać idealne oszacowanie, a informacjami, które faktycznie posiadamy, stają się coraz mniejsze.
EngrStudent - Przywróć Monikę
To jest źródło zamieszania: nie wariancja próbki maleje, ale wariancja wariancji próbki. Wariancja próby jest estymatorem (stąd zmienna losowa). Jeśli twoje dane pochodzą z normalnego N (0, 5), wariancja próbki będzie bliska 5. Jak blisko? Zależy od wariancji estymatora dla wariancji próbki. Przy 100 punktach danych możesz znaleźć coś takiego jak 4,92. Z 1000 znajdziesz coś takiego jak 4,98. Z 10000 znajdziesz 5.0001. Wzrasta więc dokładność pomiarów, a nie same pomiary.
Ant

Odpowiedzi:

32

Standardowe odchylenia średnich są mniejsze niż standardowe odchylenia poszczególnych obserwacji. [Tutaj przyjmuję niezależne, identycznie rozmieszczone obserwacje ze skończoną wariancją populacji; coś podobnego można powiedzieć, jeśli rozluźnisz pierwsze dwa warunki.]

Jest to konsekwencja prostego faktu, że odchylenie standardowe sumy dwóch zmiennych losowych jest mniejsze niż suma odchyleń standardowych (może być równe tylko wtedy, gdy dwie zmienne są doskonale skorelowane).

W rzeczywistości, gdy mamy do czynienia z nieskorelowanymi zmiennymi losowymi, możemy powiedzieć coś bardziej szczegółowego: wariancja sumy zmiennych jest sumą ich wariancji.

Oznacza to, że przy niezależnych (a nawet po prostu nieskorelowanych) zmianach z tym samym rozkładem, wariancja średniej jest wariancją osobnika podzieloną przez wielkość próby .n

Odpowiednio do niezależnych (lub nawet po prostu nieskorelowanych) wahań z tym samym rozkładem, odchylenie standardowe ich średniej jest odchyleniem standardowym danej osoby podzielonym przez pierwiastek kwadratowy z wielkości próby:n

σX¯=σ/n .

W miarę dodawania kolejnych danych otrzymujesz coraz bardziej precyzyjne szacunki średnich grupowych. Podobny efekt dotyczy problemów z regresją.

Ponieważ możemy uzyskać bardziej precyzyjne oszacowania średnich poprzez zwiększenie wielkości próby, łatwiej jest nam rozróżnić środki, które są blisko siebie - nawet jeśli rozkłady dość się pokrywają, biorąc dużą liczbę próbek nadal możemy oszacować ich populacja oznacza wystarczająco dokładnie, aby powiedzieć, że nie są takie same.

Glen_b - Przywróć Monikę
źródło
8

Zmienność, która maleje wraz ze wzrostem N, jest zmiennością średniej próbki, często wyrażaną jako błąd standardowy. Lub, innymi słowy, rośnie pewność prawdziwości średniej próby.

Wyobraź sobie, że prowadzisz eksperyment, w którym zbierasz 3 mężczyzn i 3 kobiety i mierzysz ich wysokości. Czy jesteś pewien, że średnie wysokości każdej grupy są prawdziwym środkiem oddzielnych populacji mężczyzn i kobiet? Powinienem pomyśleć, że wcale nie byłbyś bardzo pewien. Możesz łatwo zebrać nowe próbki 3 i znaleźć nowe środki kilka cali od pierwszych. Kilka takich powtarzanych eksperymentów może nawet sprawić, że kobiety będą wyraźnie wyższe niż mężczyźni, ponieważ środki będą się tak bardzo różnić. Przy niskiej wartości N nie masz dużej pewności w średniej z próbki i różni się ona znacznie w zależności od próbki.

Teraz wyobraź sobie 10 000 obserwacji w każdej grupie. Trudno będzie znaleźć nowe próbki 10 000, które mają znacznie różniące się od siebie środki. Będą znacznie mniej zmienne, a będziesz bardziej pewny ich dokładności.

Jeśli możesz zaakceptować ten tok myślenia, możemy wprowadzić go do obliczeń statystyk jako błąd standardowy. Jak widać z jego równania, jest to oszacowanie parametru (który powinien stać się bardziej dokładny w miarę wzrostu n) podzielonego przez wartość, która zawsze wzrasta z n, . Ten błąd standardowy reprezentuje zmienność średnich lub efektów w twoich obliczeniach. Im jest mniejszy, tym silniejszy jest twój test statystyczny.σn

Oto mała symulacja w R, aby wykazać związek między błędem standardowym a odchyleniem standardowym średnich z wielu wielu powtórzeń początkowego eksperymentu. W tym przypadku zaczniemy od średniej populacji 100 i odchylenia standardowego 15.

mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)

Zwróć uwagę, że końcowe odchylenie standardowe jest zbliżone do teoretycznego błędu standardowego. Grając tutaj zmienną n, możesz zobaczyć, że miara zmienności będzie się zmniejszać wraz ze wzrostem n.

[Nawiasem mówiąc, kurtoza na wykresach tak naprawdę się nie zmienia (zakładając, że są to rozkłady normalne). Obniżenie wariancji nie zmienia kurtozy, ale rozkład będzie wyglądał na węższy. Jedynym sposobem na wizualne zbadanie zmian kurtozy jest umieszczenie rozkładów w tej samej skali.]

Jan
źródło
miałeś rację, więcej
pomysłów
Dwie rzeczy nie są do końca jasne: (1) Czy krzywe dzwonowe, które OP mówi o rozkładach średnich próbek? (2) Czy wielkości próbek są brane pod uwagę zarówno dla rozkładu średniej z próbek z grupy kontrolnej, jak i dla rozkładu średniej z próbek z grupy eksperymentalnej?
Lenar Hoyt
4

Jeśli chcesz wiedzieć, jaka jest średnia waga obywateli amerykańskich, w idealnym przypadku natychmiast poprosisz każdego obywatela, aby stanął na wadze i zebrał dane. Otrzymasz dokładną odpowiedź. Jest to bardzo trudne, więc może uda ci się nakłonić kilku obywateli do zwiększenia skali, obliczenia średniej i zorientowania się, jaka jest średnia populacji. Czy spodziewałbyś się, że średnia próby będzie dokładnie równa średniej populacji? Mam nadzieję, że nie.

Czy zgodziłbyś się, że gdybyś miał coraz więcej ludzi, w pewnym momencie zbliżylibyśmy się do liczby ludności? Powinniśmy, prawda? Ostatecznie większość ludzi, których możemy pozyskać, to cała populacja, a jej średnia jest tym, czego szukamy. To jest intuicja.

To był wyidealizowany eksperyment myślowy. W rzeczywistości są komplikacje. Dam ci dwa.

  • Wyobraź sobie, że dane pochodzą z dystrybucji Cauchy'ego . Możesz zwiększyć próbkę w nieskończoność, ale wariancja się nie zmniejszy. W tym rozkładzie nie ma wariancji populacji. W gruncie rzeczy, ściśle mówiąc, nie ma też żadnej próbki. To smutne. O dziwo, ten rozkład jest całkiem realny, pojawia się tu i tam w fizyce.
  • Wyobraź sobie, że zdecydowałeś się kontynuować zadanie polegające na określeniu średniej wagi obywateli amerykańskich. Więc weź swoją wagę i idź z domu do domu. Zajmie ci to wiele lat. Do czasu zebrania miliona obserwacji niektórzy obywatele w twoim zestawie danych bardzo zmienią swoją wagę, niektórzy zmarli itp. Chodzi o to, że zwiększenie wielkości próby w tym przypadku nie pomaga.
Aksakal
źródło
1
Podejrzewam, że miałeś na myśli „średnią wagę” w pierwszym zdaniu. Podoba mi się eksperyment myślowy. Kolejne komplikacje mogą wynikać z twojego narzędzia pomiarowego - tj. Wagi, które się zużyją, mogą mieć błąd paralaksy lub błąd użytkownika, który wprowadza inną zmienność.
MarkR
1

Uważam, że Prawo Dużych Liczb wyjaśnia, dlaczego wariancja (błąd standardowy) maleje wraz ze wzrostem wielkości próby. Artykuł Wikipedii na ten temat mówi:

Zgodnie z prawem średnia wyników uzyskanych z dużej liczby prób powinna być zbliżona do wartości oczekiwanej i będzie się zbliżać w miarę przeprowadzania większej liczby prób.

W kategoriach centralnego twierdzenia granicznego:

Podczas losowania pojedynczej próby losowej, im większa jest próbka, tym bliższa jest średnia próbki w stosunku do średniej populacji (w powyższym cytacie pomyśl o „liczbie prób” jako o „wielkości próby”, więc każda „próba” jest obserwacją ). Dlatego podczas rysowania nieskończonej liczby losowych próbek wariancja rozkładu próbkowania będzie mniejsza, im większy będzie rozmiar każdej próbki.

Innymi słowy, kształt dzwonu będzie węższy, gdy każda próbka będzie duża, a nie mała, ponieważ w ten sposób każda średnia próbki będzie bliżej środka dzwonu.

Jose Vila
źródło
0

Wraz ze wzrostem wielkości próbki rośnie wariancja próbki (różnica między obserwacjami), ale wariancja średniej próbki (błąd standardowy) maleje, a tym samym zwiększa się precyzja.

Dr Vikas Doshi
źródło