Często twierdzi się, że ładowanie początkowe może zapewnić oszacowanie błędu systematycznego w estymatorze.
Jeśli jest szacunkiem dla niektórych statystyk, a są replikami ładowania początkowego (z ), to szacunek obciążenia początkowego szacunku wynosi co wydaje się niezwykle proste i potężne, do tego stopnia, że niepokoi. ~ T II∈{1,⋯,N}biyt≈1
Nie mogę się zastanowić, jak to możliwe, bez uprzedniego obiektywnego oszacowania statystyki. Na przykład, jeśli mój estymator po prostu zwraca stałą niezależną od obserwacji, powyższe oszacowanie błędu jest wyraźnie nieważne.
Chociaż ten przykład jest patologiczny, nie widzę, jakie są rozsądne założenia dotyczące estymatora i rozkładów, które zagwarantują, że oszacowanie ładowania początkowego jest rozsądne.
Próbowałem przeczytać oficjalne odniesienia, ale nie jestem statystykiem ani matematykiem, więc nic nie zostało wyjaśnione.
Czy ktoś może przedstawić ogólne podsumowanie, kiedy można oczekiwać, że szacunek będzie ważny? Jeśli znasz dobre referencje na ten temat, byłoby również świetnie.
Edytować:
Gładkość estymatora jest często podawana jako wymóg, aby bootstrap działał. Czy to możliwe, że wymaga się także pewnego rodzaju lokalnej odwracalności transformacji? Stała mapa wyraźnie tego nie spełnia.
Odpowiedzi:
Opisany przez ciebie problem to problem interpretacji, a nie ważności. Szacunkowa wartość błędu początkowego dla twojego stałego estymatora nie jest nieprawidłowa, w rzeczywistości jest idealna.
Ładowanie początkowe oszacowanie błędu wynosi od estymatora i parametr gdzie jest jakiś nieznany dystrybucji oraz próbki z . Funkcję można w zasadzie obliczyć, gdybyś miał pod ręką populację. Czasami wziąć wtykowego oszacowania przy użyciu empirycznego rozkładu w miejsce . Jest to prawdopodobnie to, co opisałeś powyżej. We wszystkich przypadkach oszacowanie obciążenia początkowego szacunku to gdzieθ=T(M),MxFT(F)a(x)=t( F ),T(F) F FbIs F =E F [s(x*)]-T( Fθ^=s(x) θ=t(F), F x F t(F) s(x)=t(F^), t(F) F^ F x ∗ x
Stała jest doskonałym wtykowe oszacowania dla tej samej stałej:c Populacja jest i próbka , rozkład empirycznej, która jest zbliżona do . Gdybyś mógł ocenić , dostałbyś . Po obliczeniu oszacowania wtyczki otrzymujesz również . Bez uprzedzeń, jak można się spodziewać.~ F F T ( F ) = C C T ( F ) = c c∼F ∼F^ F t(F)=c c t(F^)=c c
Dobrze znanym przypadkiem, w którym występuje błąd w oszacowaniu wtyczki jest oszacowanie wariancji, stąd korekta Bessela. Poniżej to demonstruję. Szacunek błędu początkowego nie jest taki zły:t(F^)
Zamiast tego możemy przyjąć, że jest średnią populacji, a , sytuacja, w której w większości przypadków powinno być wyraźne odchylenie: s ( x ) = ct(F) s(x)=c
Ponownie oszacowanie bootstrap nie jest takie złe.
źródło
Popełniasz jeden błąd i może to jest mylące. Mówisz:
Bootstrap nie polega na tym, na ile twoja metoda jest stronnicza, ale na ile twoje wyniki uzyskane przez jakąś funkcję, biorąc pod uwagę twoje dane są tendencyjne.
Jeśli wybierzesz odpowiednią metodę statystyczną do analizy danych, a wszystkie założenia tej metody zostaną spełnione, a matematyka została poprawnie wykonana, wówczas metoda statystyczna powinna zapewnić „najlepszą” możliwą ocenę, którą można uzyskać na podstawie danych .
Idea bootstrap polega na próbkowaniu z danych w taki sam sposób, w jaki próbkowałeś swoje przypadki z populacji - więc jest to rodzaj replikacji twojego próbkowania. Pozwala to uzyskać przybliżony rozkład (przy użyciu słów Efrons) swojej wartości, a tym samym oszacować błąd szacunku.
Argumentuję jednak, że twój przykład wprowadza w błąd i dlatego nie jest to najlepszy przykład do omawiania bootstrapu. Ponieważ po obu stronach były nieporozumienia, pozwolę sobie zaktualizować odpowiedź i napisać ją w bardziej formalny sposób, aby zilustrować mój punkt widzenia.
Odchylenie dla będącego oszacowaniem prawdziwej wartości jest zdefiniowane jako: θθ^ θ
gdzie:
gdzie jest estymatorem.g(⋅)
Jak zauważa Larry Wasserman w swojej książce „All the Statistics” :
Stały estymator, będący stałą funkcją : , nie spełnia tego wymogu, ponieważ jest niezależny od danych, a rosnąca liczba obserwacji nie spowodowałaby, że zbliżyłaby się do prawdziwej wartości (chyba że przez szczęście lub posiadanie bardzo solidne założenia a priori dotyczące , to że ).g ( X ) = λ θ λ λ = θx g(X)=λ θ λ λ=θ
Stały estymator nie spełnia podstawowego wymogu bycia rozsądnym estymatorem, a zatem niemożliwe jest oszacowanie jego błędu, ponieważ nie zbliża się nawet przy . Nie można tego zrobić za pomocą bootstrapu ani żadnej innej metody, więc nie ma problemu z bootstrapem.θn→∞θ^n θ n→∞
źródło
Myślę, że twoja formuła jest zła. Ostatni powinien mieć gwiazdkę zamiast czapki: b i a s t ≈ 1t
Chcesz użyć rzeczywistej statystyki obliczonej na rozkładzie empirycznym (jest to często łatwe, ponieważ oryginalna próbka jest zbiorem skończonym), a nie oszacowania. W niektórych przypadkach mogą być one takie same (na przykład średnia empiryczna jest taka sama jak średnia z próby), ale ogólnie nie będą. Podałeś jeden przypadek, w którym są one różne, ale mniej patologicznym przykładem jest zwykle obiektywny estymator wariancji, który nie jest taki sam jak wariancja populacyjna po zastosowaniu do skończonego rozkładu.
Jeśli statystyka nie ma sensu w rozkładzie empirycznym (na przykład, jeśli zakłada rozkład ciągły), nie powinieneś używać waniliowego ładowania początkowego. Możesz zastąpić rozkład empiryczny oszacowaniem gęstości jądra (gładki bootstrap), lub jeśli wiesz, że oryginalny rozkład należy do określonej rodziny, możesz zastąpić rozkład empiryczny maksymalnym prawdopodobnym oszacowaniem z tej rodziny (parametryczny bootstrap).t
TL / DR: Metoda ładowania początkowego nie jest magiczna. Aby uzyskać obiektywne oszacowanie błędu, musisz być w stanie obliczyć interesujący parametr dokładnie na skończonym rozkładzie.
źródło
Uważam, że warto pomyśleć o procedurach ładowania początkowego pod kątem funkcjonałów dystrybucji, na których działają - podałem przykład w tej odpowiedzi na inne pytanie dotyczące ładowania początkowego.
Szacunek, który podałeś, jest tym, czym jest - szacunkiem. Nikt nie mówi, że nie występują problemy, które mogą wynikać z szacunków statystycznych. To da ci niezerowe oszacowanie odchylenia dla średniej próbki, na przykład, o której wszyscy wiemy, że na początku jest obiektywna. Jednym z problemów z tym estymatorem błędu jest to, że cierpi on na zmienność próbkowania, gdy bootstrap jest wdrażany jako Monte Carlo, a nie na pełne wyliczenie wszystkich możliwych podprób (a zresztą nikt nie jest to teoretyczny bootstrap w praktyce).
W związku z tym implementacja bootstrap w Monte Carlo jest nie do naprawienia i musisz użyć innego schematu bootstrap. Davison i in. glin. (1986) zademonstrowali, jak stworzyć inny schemat ładowania początkowego, który ogranicza losowe losowanie w celu uzyskania zrównoważonych próbek: jeśli tworzysz repliki ładowania początkowego , to każdy z oryginalnych elementów musi być użyty dokładnie razy dla równowagi pierwszego rzędu. (Bilans drugiego rzędu, który działa lepiej dla drugich momentów estymatorów, jest dalej omawiany przez Graham i in. (1990) .)B.B B
źródło