Określanie wielkości próbki niezbędnej dla metody ładowania początkowego / proponowanej metody

33

Wiem, że jest to dość gorący temat, na który nikt tak naprawdę nie jest w stanie udzielić prostej odpowiedzi. Niemniej jednak zastanawiam się, czy poniższe podejście nie byłoby przydatne.

Metoda ładowania początkowego jest użyteczna tylko wtedy, gdy twoja próbka odpowiada mniej więcej (dokładnie odczytać) tej samej dystrybucji, co pierwotna populacja. Aby mieć to pewność, należy odpowiednio zwiększyć wielkość próbki. Ale co jest wystarczająco duże?

Jeśli moje założenie jest poprawne, masz ten sam problem, gdy używasz twierdzenia o granicy środkowej do określenia średniej populacji. Tylko wtedy, gdy liczebność próby jest wystarczająco duża, możesz być pewien, że populacja średnich z próby jest normalnie rozmieszczona (wokół średniej populacji). Innymi słowy, twoje próbki muszą wystarczająco dobrze reprezentować populację (rozkład). Ale znowu, co jest wystarczająco duże?

W moim przypadku (procesy administracyjne: czas potrzebny na zakończenie zapotrzebowania a ilość żądań) mam populację o rozkładzie multimodalnym (wszystkie żądania zakończone w 2011 r.), Z czego jestem w 99% pewien, że jest jeszcze mniej zwykle rozłożone niż populacja (wszystkie wymagania, które są spełnione między dniem dzisiejszym a dniem w przeszłości, najlepiej ten przedział czasowy jest tak mały, jak to możliwe) Chcę zbadać.

Moja populacja z 2011 r. Nie ma wystarczającej liczby jednostek, aby wykonać próbek o wielkości próby . Wybieram wartość , przypuśćmy, że ( ). Teraz używam metody prób i błędów, aby określić dobry rozmiar próbki. Przyjmuję i sprawdzam, czy średnia populacji mojej próby jest normalnie rozłożona przy użyciu Kołmogorowa-Smirnowa. Jeśli tak, powtarzam te same kroki, ale z wielkością próbki , jeśli nie, powtarzam z wielkością próbki (itp.).n x 10 x = 10 n = 50 40 60xnx10x=10n=504060

Po chwili dochodzę do wniosku, że jest absolutną minimalną wielkością próby, aby uzyskać mniej więcej dobrą reprezentację mojej populacji z 2011 roku. Ponieważ wiem, że moja populacja stanowiąca przedmiot zainteresowania (wszystkie wymagania, które zostały spełnione między dniem dzisiejszym a dniem w przeszłości) ma mniejszą wariancję, mogę bezpiecznie użyć próby o wielkości do uruchomienia. (Pośrednio, określa rozmiar mojego przedziału czasowego: czas potrzebny do ukończenia żądań).n = 45 n = 45 45n=45n=45n=4545

To w skrócie mój pomysł. Ale ponieważ nie jestem statystykiem, ale inżynierem, którego lekcje statystyki odbywały się w dniach poprzednich, nie mogę wykluczyć możliwości, że właśnie wygenerowałem dużo śmieci :-). Co wy myślicie Jeśli moja przesłanka ma sens, czy muszę wybrać większy niż lub mniejszy? W zależności od twoich odpowiedzi (czy muszę się czuć zawstydzony czy nie? :-) Zamieszczę jeszcze kilka pomysłów na dyskusję.10x10

odpowiedź na pierwszą odpowiedź Dziękuję za odpowiedź, Twoja odpowiedź była dla mnie bardzo przydatna, zwłaszcza linki do książek.
Obawiam się jednak, że przy próbie przekazania informacji całkowicie zaciemniłem swoje pytanie. Wiem, że próbki bootstrap przejmują rozkład próby populacji. Podążam za tobą całkowicie, ale ...

Oryginalna próbka populacji musi być wystarczająco duża, aby mieć umiarkowaną pewność, że rozkład próby populacji odpowiada (równy) „rzeczywistemu” rozkładowi populacji.

Jest to jedynie pomysł na określenie, jak duża powinna być pierwotna wielkość próby, aby mieć pewność, że rozkład próby odpowiada rozkładowi populacji.

Załóżmy, że masz bimodalny rozkład populacji, a jeden szczyt jest znacznie większy niż drugi. Jeśli twoja próbka ma wielkość 5, istnieje duża szansa, że ​​wszystkie 5 jednostek ma wartość bardzo zbliżoną do dużego szczytu (szansa na losowe narysowanie jednostki jest największa). W takim przypadku rozkład próbek będzie wyglądał monomodalnie.

Przy wielkości próby wynoszącej sto szansa, że ​​rozkład próbek jest również bimodalny, jest znacznie większa !! Problem z ładowaniem polega na tym, że masz tylko jedną próbkę (i budujesz dalej na tej próbce). Jeśli rozkład próbek naprawdę nie odpowiada rozkładowi populacji, masz kłopoty. Jest to po prostu pomysł, aby ryzyko wystąpienia „złego rozkładu próbki” było jak najniższe, bez konieczności zwiększania nieskończenie dużej wielkości próbki.

siegfried
źródło

Odpowiedzi:

38

Zainteresowałem się tym pytaniem, ponieważ zobaczyłem słowo bootstrap i napisałem książki na bootstrap. Również ludzie często pytają: „Ile próbek bootstrapu potrzebuję, aby uzyskać dobre przybliżenie Monte Carlo do wyniku bootstrapu?” Moją sugerowaną odpowiedzią na to pytanie jest ciągłe zwiększanie rozmiaru aż do uzyskania konwergencji. Żadna liczba nie pasuje do wszystkich problemów.

Ale najwyraźniej nie jest to pytanie, które zadajesz. Wygląda na to, że pytasz, jaki powinien być oryginalny rozmiar próbki, aby bootstrap działał. Przede wszystkim nie zgadzam się z twoim założeniem. Podstawowy nieparametryczny pasek startowy zakłada, że ​​próbka jest pobierana losowo z populacji. Tak więc dla dowolnej wielkości próbki rozkład dla próbek wybranych losowo jest rozkładem próbkowania przyjętym podczas ładowania początkowego. Zasada ładowania początkowego mówi, że wybranie losowej próbki o wielkości z populacji można naśladować, wybierając próbkę ładowania początkowego o wielkościn nnnnz oryginalnej próbki. To, czy obowiązuje zasada ładowania początkowego, nie zależy od żadnej indywidualnej próbki „wyglądającej na reprezentatywną dla populacji”. Od tego zależy oszacowanie i niektóre właściwości rozkładu populacji (np. Działa to w przypadku próbkowania z rozkładami populacji, które mają skończone wariancje, ale nie, gdy mają nieskończone wariancje). Nie będzie działać w celu oszacowania ekstremów bez względu na rozkład populacji.

Teoria bootstrap polega na wykazaniu spójności oszacowania. Można więc teoretycznie wykazać, że działa dla dużych próbek. Ale może również działać w małych próbkach. Widziałem, że szczególnie dobrze sprawdza się w szacowaniu poziomu błędu klasyfikacji w małych próbkach, takich jak 20 dla danych dwuwymiarowych.

Teraz, jeśli wielkość próbki jest bardzo mała --- powiedzmy 4 --- bootstrap może nie działać tylko dlatego, że zestaw możliwych próbek bootstrap nie jest wystarczająco bogaty. W mojej książce lub książce Petera Halla omówiono ten problem zbyt małej próbki. Ale ta liczba różnych próbek bootstrap bardzo szybko się powiększa. Nie stanowi to więc problemu nawet dla próbek o wielkości tak małych, jak 8. Możesz spojrzeć na te referencje:

Michael R. Chernick
źródło
3
Czy istnieje jakiś standardowy test, aby sprawdzić, czy (na przykład 4 próbki) nie wystarczy? Mam zestaw danych, w którym obliczam przedziały ufności ładowania początkowego dla średniej, ale niektóre osoby mają bardzo niewiele punktów danych (<8 w niektórych przypadkach). Instynkt podpowiada mi, że powinienem lekceważyć osoby, które mają mniej niż n punktów danych, ale jak mam zdefiniować tę granicę n? Miałem nadzieję znaleźć ogólnie przyjętą wartość odcięcia (analogicznie do tego, jak 6 lub 7 jest arbitralnym punktem odcięcia dla liczby próbek na grupę w analizie modelu mieszanego).
RTbecard