To pytanie zostało zadane dawno temu, ale zamieszczam odpowiedź na wypadek, gdyby ktoś odkrył ją w przyszłości. Krótko mówiąc, odpowiedź brzmi tak: możesz to zrobić w wielu ustawieniach, a poprawność wielkości próby jest uzasadniona przez . Takie podejście jest zwykle nazywane boostraperem z i działa w większości ustawień, które wykonuje `` tradycyjny '' bootstrap, a także w niektórych ustawieniach, w których nie działa.MN−−√MN
Powodem jest to, że wiele argumentów spójności ładowania początkowego używa estymatorów w postaci , gdzie są zmiennymi losowymi, a jest pewnym parametrem rozkład podstawowy. Na przykład dla średniej próbki i .1N√(TN−μ)X1,…,XNμTN=1N∑Ni=1Xiμ=E(X1)
Wiele dowodów zgodności bootstrap argumentuje, że jako , biorąc pod uwagę skończoną próbkę i powiązane oszacowanie punktu ,
gdzie są rysowane z prawdziwego rozkładu leżącego u podstaw, a są rysowane z zastąpieniem z .N→∞{x1,…,xN}μ^N=TN(x1,…,xN)N−−√(TN(X∗1,…,X∗N)−μ^N)→DN−−√(TN(X1,…,XN)−μ)(1)
XiX∗i{x1,…,xN}
Moglibyśmy jednak również użyć krótszych próbek o długości i rozważyć estymator
Okazuje się, że jako estymator ( ) ma taki sam rozkład ograniczenia jak powyżej w większości ustawień, w których ( ) trzyma i niektóre tam, gdzie nie. W tym przypadku ( ) i ( ) mają ten sam rozkład graniczny, motywując współczynnik korygujący np. W odchyleniu standardowym próbki.M<NM−−√(TM(X∗1,…,X∗M)−μ^N).(2)
M,N→∞2112MN−−√
Wszystkie te argumenty są asymptotyczne i trzymają się tylko granicy . Aby to zadziałało, ważne jest, aby nie wybierać za małego. Istnieje pewna teoria (np. Bickel i Sakov poniżej), jak wybrać optymalne jako funkcję aby uzyskać najlepsze wyniki teoretyczne, ale w twoim przypadku decydujące mogą być zasoby obliczeniowe.M,N→∞M MN
Dla pewnej intuicji: w wielu przypadkach mamy jako , więc
można traktować trochę jak poza bootstrap z i (używam małych liter, aby uniknąć pomyłki w notacji ). W ten sposób emulowanie rozkładu ( ) za pomocą z bootstrapu z jest bardziej `` właściwą '' rzeczą niż tradycyjne ( zμ^N→DμN→∞N−−√(TN(X1,…,XN)−μ),(3)
mnm=Nn=∞MNM<NNN3MNM<NNN) uprzejmy. Dodatkowym bonusem w twoim przypadku jest to, że jego wycena jest tańsza pod względem obliczeniowym.
Jak wspomniałeś, głównym tematem są Politis i Romano. Bickel i wsp. (1997) znajduję również poniżej ładny przegląd z bootstrapu.MN
Źródła :
PJ Bickel, F Goetze, WR van Zwet. 1997. Ponowne próbkowanie mniej niż obserwacji: zyski, straty i środki zaradcze na straty. Statistica Sinica.n
PJ Bickel, A Sakov. 2008. Z wyboru w ouf z bootstrap i granice ufności dla ekstremów. Statistica Sinica.mmn