Rozumiem, że gdy próbkowanie ze skończonej populacji, a nasza próbka stanowi więcej niż 5% populacji, musimy skorygować średni i standardowy błąd próby za pomocą tego wzoru:
Gdzie to wielkość populacji, a to wielkość próby.n
Mam 3 pytania dotyczące tej formuły:
- Dlaczego próg wynosi 5%?
- Jak powstała formuła?
- Czy oprócz tego artykułu istnieją inne zasoby internetowe, które kompleksowo wyjaśniają tę formułę ?
Odpowiedzi:
Próg dobiera się w taki sposób, aby zapewnić zbieżność rozkładu hipergeometrycznego ( to SD), zamiast rozkładu dwumianowego (do próbkowania z podmianą), do rozkładu normalnego (jest to Twierdzenie o granicy centralnej, patrz np. Krzywa normalna, Twierdzenie o granicy centralnej oraz Nierówności dla Markowa i Chebycheva dla Zmienne losowe). Innymi słowy, gdyn/N≤0,05(tj.Nnie jest „zbyt duży” w porównaniu doN), FPC można bezpiecznie zignorować; to łatwo zrozumieć, w jaki sposób ewoluuje współczynnik korekcyjny z różnymnza ustalonąN: zN=10,000, mamyFPC=N.- nN.- 1----√ n / n≤ 0,05 n N. n N. N.= 10 , 000 , gdy n = 10 , a FPC = .3162 gdy n = 9 , 000 . Kiedy N → ∞ , FPC zbliża się do 1, a my jesteśmy blisko sytuacji pobierania próbek z wymianą (tj. Jak w przypadku nieskończonej populacji).FPC = .9995 n = 10 FPC=.3162 n=9,000 N→∞
Aby zrozumieć te wyniki, dobrym punktem wyjścia jest przeczytanie kilku samouczków online na temat teorii próbkowania, w których próbkowanie odbywa się bez zamiany ( proste losowe próbkowanie ). Ten internetowy samouczek dotyczący statystyki nieparametrycznej zawiera ilustrację obliczania oczekiwań i wariancji dla całości.
Jeśli chodzi o referencje online, mogę ci zasugerować
źródło