W jaki sposób rozkład próbkowania w próbkach oznacza przybliżoną średnią dla populacji?

16

Próbuję nauczyć się statystyki, ponieważ uważam, że jest tak powszechna, że ​​zabrania mi uczenia się niektórych rzeczy, jeśli nie rozumiem jej poprawnie. Mam problem ze zrozumieniem tego pojęcia rozkładu próbkowania średnich próbek. Nie rozumiem, w jaki sposób niektóre książki i strony to wyjaśniły. Myślę, że rozumiem, ale nie jestem pewien, czy jest poprawny. Poniżej moja próba zrozumienia tego.

Kiedy mówimy o pewnym zjawisku przyjmującym rozkład normalny, dotyczy to zasadniczo (nie zawsze) populacji.

Chcemy użyć statystyk wnioskowania, aby przewidzieć pewne rzeczy na temat pewnej populacji, ale nie mamy wszystkich danych. Używamy losowego próbkowania i każda próbka o wielkości n jest równie prawdopodobna do wybrania.

Pobieramy więc wiele próbek, powiedzmy 100, a następnie rozkład średnich z tych próbek będzie w przybliżeniu normalny zgodnie z centralnym twierdzeniem granicznym. Średnia średnich z próby przybliży średnią populacji.

Teraz nie rozumiem wielu razy, kiedy widzisz „Próbkę 100 osób…” Czy nie potrzebowalibyśmy 10 lub 100 próbek 100 osób, aby przybliżyć średnią populacji? Czy może jest tak, że możemy pobrać pojedynczą próbkę, która jest wystarczająco duża, powiedzmy 1000, a następnie powiedzmy, że średnia przybliża średnią populacji? LUB czy pobieramy próbkę 1000 osób, a następnie pobieramy 100 losowych próbek 100 osób w każdej próbce z pierwotnego 1000 osób, które pobraliśmy, a następnie wykorzystujemy to jako przybliżenie?

Czy pobranie wystarczająco dużej próbki w celu przybliżenia średniej (prawie) zawsze działa? Czy populacja musi być normalna, aby to działało?

scalesort
źródło

Odpowiedzi:

9

Myślę, że możesz pomylić oczekiwany rozkład próbkowania średniej (który obliczalibyśmy na podstawie pojedynczej próbki) z (zwykle hipotetycznym) procesem symulowania tego, co by się stało, gdybyśmy wielokrotnie próbkowali z tej samej populacji wiele razy.

Dla dowolnej wielkości próby (nawet n = 2) powiedzielibyśmy, że średnia próby (od dwóch osób) szacuje średnią populacji. Ale dokładność oszacowania - to znaczy, jak dobrze wykonaliśmy zadanie polegające na oszacowaniu średniej populacji na podstawie naszych danych przykładowych, co znajduje odzwierciedlenie w standardowym błędzie średniej - będzie gorsze niż gdybyśmy mieli 20 lub 200 ludzie w naszej próbie. Jest to względnie intuicyjne (większe próbki dają lepszą dokładność oszacowania).

Następnie zastosowalibyśmy błąd standardowy do obliczenia przedziału ufności, który (w tym przypadku) opiera się na rozkładzie normalnym (prawdopodobnie zastosowalibyśmy rozkład t w małych próbkach, ponieważ odchylenie standardowe populacji jest często niedoceniane w mała próbka, co prowadzi do zbyt optymistycznych błędów standardowych).

W odpowiedzi na twoje ostatnie pytanie: nie, nie zawsze potrzebujemy populacji o rozkładzie normalnym, aby zastosować te metody szacowania - centralne twierdzenie graniczne wskazuje, że rozkład próby średniej (szacowanej ponownie z pojedynczej próbki) będzie miał tendencję do postępować zgodnie z rozkładem normalnym, nawet jeśli populacja podstawowa ma rozkład inny niż normalny. Jest to zwykle odpowiednie dla „większych” próbek.

To powiedziawszy, jeśli masz nietypową populację, z której pobierasz próbki, średnia może nie być odpowiednią statystyką podsumowującą, nawet jeśli rozkład próbkowania dla tej średniej można uznać za wiarygodny.

James Stanley
źródło
więc w gruncie rzeczy jestem zbyt rozluźniony, gdy rozumiem te teoretyczne podstawy działania niektórych z tych rzeczy? Czy naprawdę interesująca jest tutaj przedział ufności? Innymi słowy, jeśli chciałbym opublikować badanie powiedzmy, ile godzin śpi przeciętny dorosły w USA, i pobieram próbkę 5000, a mój przedział ufności wynosi 99,9%, średnia wynosi między 6,46 a 6,54, a następnie mogę przejść naprzód i opublikuj moje badanie, mówiąc „pewnie”, że średnia osoba dorosła w USA śpi 6,5 godziny?
Łączy
2
Tam, gdzie powiedziałeś: „ mówiąc„ pewnie ”, że przeciętna dorosła osoba w USA śpi 6,5 godziny ”. Cóż, nie, możesz być całkiem pewny, że tak naprawdę nie jest to średnio 6,5 godziny. Możesz mieć pewność, że jest to prawie 6,5 godziny, lub możesz mieć pewność, że „6,5 godziny do najbliższych 5 minut”, lub coś takiego. Tylko zakresy będą powiązane z pewnym poziomem ufności.
Glen_b
1
@Glen_b przechodzi do sedna sprawy - nigdy nie możemy powiedzieć, że jesteśmy pewni, że dokładnie oszacowaliśmy wartość populacji, ale raczej, że mamy pojęcie o dokładności naszego procesu szacowania.
James Stanley,
@angrymonkey Myślę, że nadal przydatne jest uzyskanie koncepcji leżących u podstaw (symulowanego) podejścia do wielokrotnego próbkowania. Ponadto do oszacowania oznacza, że ​​nie potrzeba „ogromnych” rozmiarów próbek - wzór na standardowy błąd średniej to sample std deviation / square root(n)- pierwiastek kwadratowy z części n mówi nam, że otrzymujemy malejące zwroty z dokładności oszacowania dla stałych przyrostów jako wielkości próby staje się większy (np. przejście od 10 do 20 osób w próbie poprawia dokładność oszacowania bardziej niż od 210 do 220 osób)
James Stanley
świetnie ... dziękuję bardzo za pomoc. więc CI pozwala nam powiedzieć, że jestem w 95% pewien, że przeciętna osoba śpi między 6,45 a 6,56 godzin na dobę? to dlaczego niektóre artykuły zawierają takie ostateczne stwierdzenia, jak przeciętny człowiek ogląda 4,5 godziny telewizji dziennie? z pewnością przedział ufności wynosi około 95% 4,43 i 4,56
połączy
10
  • σ2/nnn staje się większe, wariancja rozkładu średniej maleje, tak że w granicy średnia próbki ma tendencję do wartości średniej populacji.
  • Jeśli weźmiesz kilka niezależnych próbek, każda średnia próbki będzie normalna, a średnia średnich będzie normalna i będzie miała tendencję do prawdziwej średniej.
  • Jeśli twoje próbki są naprawdę z tej samej dystrybucji (np. 100 próbek po 10), wyciągniesz takie same wnioski, jak gdybyś wziął jedną dużą próbkę 1000. (Ale w prawdziwym świecie różne próbki prawdopodobnie różnią się w różny sposób nie można zignorować; patrz „losowy projekt bloku”).
  • n
  • Jeśli weźmiesz 100 próbek po 10 sztuk, średnie próbki będą miały rozkład bardziej normalny niż oryginalne dane, ale mniej normalny niż rozkład ogólnej średniej.
  • Pobranie dużej próbki sprawi, że zbliżysz się do normalności.
  • Jeśli chcesz oszacować średnią populacji, nie ma (teoretycznie) różnicy, jeśli weźmiesz dużą próbkę 1000 lub 100 próbek po 10.
  • Ale w praktyce ludzie z teorii pobierania próbek mogą dzielić próbkę z powodu grupowania, stratyfikacji i innych problemów. Następnie biorą pod uwagę schemat próbkowania podczas dokonywania oszacowania. Ale to naprawdę ważne w przypadku innego pytania.
Placidia
źródło
w większości podręczników poprowadzą cię przez to pojęcie rozkładu próbkowania średnich próbek. W istocie mówi to: „hej, jeśli weźmiesz dużo próbek, zwykle będzie to normalne i będzie zbliżone do średniej populacji”. Następnie mówią ci, że jeśli pobierzesz wystarczająco duże próbki, możesz trochę wziąć tylko jedną. Czy rozkład próbkowania w próbce ma sugerować, że możesz pobrać jedną dużą próbkę? Innymi słowy, po co to rozumieć? Czy to po prostu pomoże ci zrozumieć intuicję związaną z pobieraniem dużej próbki? ignorując pomysł pobrania próbki
scalesort
Myślę, że @ „James Stanley” odpowiada na to bardzo dobrze. W każdym prawdziwym przypadku bierzesz próbkę, obliczasz średnią z próby i to jest twoje oszacowanie.
Placidia
1

Rozkład próbkowania średniej jest rozkładem WSZYSTKICH próbek o danym rozmiarze. Średnia dystansu próbkowania jest równa średniej populacji. Kiedy mówimy o odległości próbkowania średniej dla próbek o danym rozmiarze, nie mówimy o jednej próbce lub nawet tysiącu próbek, ale o wszystkich próbkach.

Allen Moser
źródło
0

Średnia odległość próbkowania nie ma nic wspólnego z przedziałami ufności. To kolejna koncepcja. W przypadku dystansu próbkowania populacja może być normalna lub nienormalna a) Jeśli pop jest normalny, to średnia próbkowana średniej będzie normalna dla dowolnej wielkości próby. b) Jeśli pop nie jest normalny, to 1) dystans próbkowania średniej NIE MOŻE być uznany za normalny, chyba że wielkość próbki wynosi 30 lub więcej. Następnie Centralne Twierdzenie Graniczne mówi nam, że dystans próbkowania można uznać za normalny.

Mówisz o przewidywaniu. Przewidywanie też nie ma z tym nic wspólnego. Wstawiasz za dużo w samp dist. Samp dist to po prostu wszystkie próbki, a następnie pobierana jest średnia. Średnia ze wszystkich tych próbek, mu sub x bar, jest równa średniej populacji, mi i standardowej odległości próbkowania dev, sigma sub x bar = sigma podzielona przez pierwiastek kwadratowy z n. (Nie będziemy rozmawiać o skończonym współczynniku korekcji popu. Weź swoją statystykę za wartość nominalną. Nie wczytuj zbyt wiele w pojęcie. Pięść rozumiesz podstawową koncepcję.

PS Samp dist mean nie ma nic ro do abput pr

Allen Moser
źródło
Zastanawiam się, czy tę odpowiedź można połączyć z pierwszą odpowiedzią, a nie wpisać jako inną odpowiedź. Zwykle wolimy, abyś miał 1 odpowiedź na wątek. (Są jednak wyjątki.) Możesz dodać materiał do istniejącej odpowiedzi lub wprowadzić zmiany, klikając szarą „edytuj” w lewym dolnym rogu.
gung - Przywróć Monikę
0

Myślałem o problemach z dużymi zbiorami danych i przeglądałem niektóre z tych postów dziś rano. Nie sądzę, że jest to w ogóle trywialny problem, różnica między analizą 1000 danych jako jednego zestawu w porównaniu do analizy 10 zestawów 100. Teoretycznie , jeśli hipoteza zerowa jest prawdziwa, że ​​dane są ididalne, to nie robi różnica. Jednak grupowanie i wzorce w danych nie są w ogóle uwzględniane, jeśli po prostu bierze się średnią z 1000 danych i podaje się oszacowaną średnią i związany z nią błąd standardowy.

Doszedłem do wniosku, patrząc na niektóre strony na stackexchange i wikipedii, że duże zbiory danych pozwalają zobaczyć to, co oczywiste . Jeśli w populacji są jakieś interesujące cechy, duży zestaw danych pokazałby je jako wyraźne w dzień. Gdybym miał bardzo duży zestaw danych, na który mogłem spojrzeć wizualnie, nie wskoczyłbym i nie wykonałbym krótkich podsumowań bez uprzedniego wyszukania bardzo oczywistych funkcji. Od moich najwcześniejszych lekcji wnioskowania statystycznego nauczono mnie patrzeć na wykresy i wizualizacje danych jako pierwszy krok. Nie mogę tego wystarczająco podkreślić. Jeśli zestaw danych jest zbyt duży, aby człowiek mógł na niego spojrzeć na ekranie, należy pobrać próbkę częściową z rozdzielczością czytelną dla człowieka.

Olivia Grigg
źródło
Nie podpisuj swoich postów - do tego służy nazwa użytkownika w prawym dolnym rogu posta.
Glen_b