Obecnie próbuję omówić niektóre kwestie dotyczące parametrycznego ładowania początkowego. Większość rzeczy jest prawdopodobnie trywialna, ale nadal myślę, że coś przeoczyłem.
Załóżmy, że chcę uzyskać przedziały ufności dla danych przy użyciu parametrycznej procedury ładowania początkowego.
Mam więc tę próbkę i zakładam, że jest normalnie dystrybuowana. Oszacowałbym wtedy wariancję i znaczyłbym i uzyskałem szacunkową dystrybucję , co oczywiście jest po prostu . m P N( m , v )
Zamiast próbkowania z tego rozkładu mogłem po prostu obliczyć kwantyle analitycznie i zrobić.
a) Wnioskuję: w tym trywialnym przypadku parametryczny bootstrap byłby taki sam jak obliczanie rzeczy w założeniu rozkładu normalnego?
Teoretycznie byłoby tak w przypadku wszystkich parametrycznych modeli ładowania początkowego, o ile tylko mogę obsłużyć obliczenia.
b) Wnioskuję: zastosowanie założenia określonego rozkładu przyniesie mi dodatkową dokładność w parametrycznym ładowaniu początkowym w stosunku do nieparametrycznego (jeśli jest to oczywiście poprawne). Ale poza tym po prostu to robię, ponieważ nie mogę obsłużyć obliczeń analitycznych i próbować symulować wyjście z tego?
c) Użyłbym tego również, jeśli obliczenia są „zwykle” wykonywane przy użyciu przybliżenia, ponieważ może to dałoby mi większą dokładność…?
Dla mnie korzyść z (nieparametrycznego) bootstrapu polegała na tym, że nie muszę zakładać żadnej dystrybucji. W przypadku parametrycznego ładowania początkowego ta przewaga zniknęła - czy są rzeczy, za którymi tęskniłem i gdzie parametryczny rozruch zapewnia przewagę nad rzeczami wymienionymi powyżej?
źródło
Odpowiedzi:
Tak. Masz rację. Ale parametryczny bootstrap chroni lepsze wyniki, gdy założenia są spełnione. Pomyśl o tym w ten sposób:
Mamy losowej próbie z rozkładu . Szacujemy parametr zainteresowania jako funkcję próbki, . Prognoza ta jest zmienną losową, więc ma rozkład nazywamy . Ten rozkład jest całkowicie określona przez i , co oznacza, . Wykonując dowolny rodzaj ładowania początkowego (parametryczne, nieparametryczne, ponowne próbkowanie), wykonujemy oszacowanie pomocą , aby uzyskać oszacowanie , . ZX1,…,Xn F θ θ^=h(X1,…,Xn) G h F G=G(h,F) F F^ G G^=G(h,F^) G^ oceniamy właściwości . To, co zmienia różne typy bootstrap, to sposób, w jaki otrzymujemy .θ^ F^
Jeśli potrafisz analitycznie obliczyć , powinieneś to zrobić, ale ogólnie rzecz biorąc, jest to raczej trudne. Magia bootstrap jest to, że możemy wygenerować próbki z dystrybucją . W tym celu generujemy losowe próbki z rozkładem i obliczamy które nastąpi dystrybucji. G X b 1 ,...,X, B, n F θ b=h(X b 1 ,...,X b n ) GG^=G(h,F^) G^ Xb1,…,Xbn F^ θ^b=h(Xb1,…,Xbn) G^
Gdy pomyślisz o tym w ten sposób, zalety parametrycznego ładowania początkowego są oczywiste. byłby lepszym przybliżeniem , wtedy byłby bliższy i wreszcie oszacowania właściwości byłyby lepsze. M G G θF^ F G^ G θ^
źródło