Dlaczego dane powinny być ponownie próbkowane w ramach hipotezy zerowej w testach hipotezy bootstrap?

11

Prosta aplikacja metody bootstrap do testowania hipotez jest oszacować przedział ufności testu statystycznego θ poprzez wielokrotne obliczenia go na bootstrapped próbek (Let statystyka θ próbki z bootstrap nazwać ^ θ * ). Odrzucamy H 0, jeśli hipotetyczny parametr θ 0 (który zwykle jest równy 0) leży poza przedziałem ufności ^ θ .θ^θ^θ^H0θ0θ^

Czytałem, że ta metoda nie ma pewnej mocy. W artykule Hall P. Wilson SR „dwie wytyczne dla Bootstrap testowanie hipotez” (1992) jest napisane jako pierwszy wytycznych, które należy przeprowadzić ponowne próbkowanie , a nie ^ θ * - θ 0 . I tej części nie rozumiem.θ^θ^θ^θ0

Czy to nie jest środki tylko stronniczość estymatora ^ θ * ? Dla estymatorów nieobciążonych przedziały ufności tej wypowiedzi powinny zawsze być mniejsza niż ^ θ * - θ 0 , ale nie widzę, co to ma do czynienia z testowaniem dla θ = θ 0 ? Nigdzie nie widzę, żebyśmy umieścili informacje o θ 0 .θ^θ^θ^θ^θ0θ^=θ0θ0


Dla tych z was, którzy nie mają dostępu do tego artykułu, jest to cytat odpowiedniego akapitu, który pojawia się bezpośrednio po pracy:

Aby zrozumieć, dlaczego jest to ważne, należy zauważyć, że test będzie polegał na odrzuceniu jeśli w | Θ - θ 0 | jest za duży." Jeśli θ 0 jest daleka od prawdziwej wartości θ (tj. Jeśli H 0 jest rażąco błędem), to różnica | Θ - θ 0 | nigdy nie będzie wyglądał na zbyt duży w porównaniu z nieparametrycznym rozkładem bootstrapu | Θ - θ 0 | . Bardziej znaczące jest porównanie z rozkłademH0|θ^θ0|θ0θH0|θ^θ0||θ^θ0|. W rzeczywistości, jeśli prawdziwa wartośćθwynosi θ 1, to moc testu ładowania początkowego wzrasta do 1 jako | θ 1 - θ 0 | wzrasta, pod warunkiem że test oparty jest na ponownym próbkowaniu | ^ Θ * - θ | , ale moc zmniejsza się co najwyżej do poziomu istotności (wraz zewzrostem | θ 1 - θ 0 | ), jeśli test opiera się na ponownym próbkowaniu | θ -|θ^θ^|θθ1|θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Adam Ryczkowski
źródło

Odpowiedzi:

7

Jest to zasada analogii do bootstrapu. (Nieznanej) bazowego prawdziwego rozkładu otrzymano próbkę pod ręką x 1 , ... , x n z ED F n , co z kolei wytworzonego statystyczną θ = T ( M n ) dla pewnego funkcjonalnego T ( ) . Twoim pomysłem użycia bootstrap jest wypowiadanie się na temat rozkładu próbkowania na podstawie znanego rozkładu ˜ F.Fx1,,xnFnθ^=T(Fn)T()F~, w którym próbujesz użyć identycznego protokołu próbkowania (co jest dokładnie możliwe tylko dla danych identyfikacyjnych; dane zależne zawsze prowadzą do ograniczeń w dokładności odtworzenia procesu próbkowania) i stosują tę samą funkcjonalną . Zademonstrowałem to w innym poście z (moim zdaniem) zgrabnym diagramem. Więc analogowego z bootstrap (próbkowania) + systematyczne odchylenia θ - θ 0 , ilość swoim centrum zainteresowania, to odchylenie od bootstrap kopią θ * od tego, co jest znane jako prawdziwe w odniesieniu do dystrybucji ~ F , pobierania próbek zastosowany proces oraz funkcjonalnośćT()θ^θ0θ^F~ , tzn. Miarą tendencji centralnej jest T ( ˜ F ) . Jeśli użyto standardowego nieparametrycznej bootstrap z wymianą z oryginalnych danych, twój ~ F = F n , więc miarą tendencji centralnej musi być T ( F n ) θ na podstawie oryginalnych danych.T()T(F~)F~=FnT(Fn)θ^

Oprócz tłumaczenia, przy testach bootstrap pojawiają się subtelniejsze problemy, które czasami są trudne do przezwyciężenia. Rozkład statystyki testowej poniżej wartości zerowej może drastycznie różnić się od rozkładu statystyki testowej w ramach alternatywy (np. W testach na granicy przestrzeni parametrów, które zawodzą przy ładowaniu ). Proste testy, których uczysz się na zajęciach licencjackich, takich jak test, są niezmienne w trakcie zmiany, ale myślenie: „Heck, właśnie zmieniam wszystko” kończy się niepowodzeniem, gdy musisz przejść na kolejny poziom złożoności konceptualnej, testy asymptotyczne χ 2 . Pomyśl o tym: testujesz, że μ = 0 , a zaobserwowane ˉ x =tχ2μ=0 . Następnie, gdy konstruujesztest χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 /x¯=0.78χ2 z analogiem ładowania początkowego ˉ x 2 / ( s 2 / n ) , wtedy ten test ma wbudowaną niecentralność n ˉ x 2 / s 2(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2od samego początku, zamiast być centralnym testem, jak się spodziewalibyśmy. Aby ustawić test ładowania początkowego jako centralny, naprawdę musisz odjąć pierwotne oszacowanie.

W testy są nieuniknione w kontekście wielowymiarowych, począwszy od Pearson × 2 stoły awaryjnych Bollen-Stine bootstrap statystyki badania w modelach równań strukturalnych. Pojęcie przesunięcia rozkładu jest niezwykle trudne do zdefiniowania w takich sytuacjach ... chociaż w przypadku testów na wielowymiarowych macierzach kowariancji jest to możliwe dzięki odpowiedniej rotacji .χ2χ2

StasK
źródło
Dziękuję Ci. Jest jedna myśl, której wciąż nie rozumiem: gdzie umieszczamy informacje o w bootstrapie? Gdy H 0 jest fałszem, θ 0 może być znacznie wyłączone z rozkładu rzeczywistego. θ0H0θ0
Adam Ryczkowski
θ0
3

OK, rozumiem Dziękuję, StasK, za tak dobrą odpowiedź. Będę akceptować, aby inni się uczyli, ale w moim konkretnym przypadku brakowało mi bardzo prostego faktu:

Procedura bootstrap zgodnie z wytycznymi Hall & Wilson dla prostego testu z pojedynczą próbką jest następująca (w pseudo-kodzie inspirowanym R):

1function(data, θθ 00 ^ θ *θ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

θ02θ^

26p.valuestatistic7

Adam Ryczkowski
źródło
Głosowałem wcześniej, ale potem zdałem sobie sprawę, że to właściwie nieprawda. Według Hall & Wilson (§ 2, str. jest estymatorem θ , nie statystyka testowa jak już przedstawiono. Sposób, że θ 0 wchodzi do gry jest to, że tworzą resampled dystrybucję ( θ * - θθ^θθ0(θ^θ^)(θ^θ0)
1
Być może pomocne: Michael Chernick przedstawił zwięzłą intuicję w odpowiedzi na moje powiązane pytanie tutaj. stats.stackexchange.com/questions/289236/... )
pół-przepustowy