Dlaczego nie zawsze używać elementów CI bootstrap?

Zastanawiałem się, jak CI bootstrap (i BCa w układzie dwubiegunowym) działają na normalnie dystrybuowanych danych. Wydaje się, że dużo pracy analizuje ich wydajność w różnych typach dystrybucji, ale nie można znaleźć niczego w normalnie dystrybuowanych danych. Ponieważ najpierw wydaje się rzeczą oczywistą studiowanie, przypuszczam, że dokumenty są po prostu za stare.

Zrobiłem kilka symulacji Monte Carlo przy użyciu pakietu rozruchowego R i okazało się, że CI bootstrap są zgodne z dokładnymi CI, chociaż dla małych próbek (N <20) są one nieco liberalne (mniejsze CI). W przypadku wystarczająco dużych próbek są one zasadniczo takie same.

To sprawia, że zastanawiam się, czy istnieje jakiś dobry powód, aby nie zawsze używać ładowania początkowego. Biorąc pod uwagę trudność w ocenie, czy rozkład jest normalny, i wiele pułapek, które za tym stoją, rozsądne wydaje się nie podejmowanie decyzji i zgłaszanie CI bootstrap niezależnie od rozkładu. Rozumiem motywację do nieużywania testów nieparametrycznych systematycznie, ponieważ mają one mniej mocy, ale moje symulacje wskazują, że nie jest tak w przypadku elementów CI bootstrap. Są jeszcze mniejsze.

Podobnym pytaniem, które mnie wkurza, jest to, dlaczego nie zawsze używam mediany jako miary tendencji centralnej. Ludzie często zalecają stosowanie go do scharakteryzowania danych normalnie dystrybuowanych, ale skoro mediana jest taka sama jak średnia dla danych normalnie dystrybuowanych, po co robić rozróżnienie? Wydaje się całkiem korzystne, gdybyśmy mogli pozbyć się procedur decydujących o tym, czy rozkład jest normalny, czy nie.

Jestem bardzo ciekawy twoich przemyśleń na te tematy i tego, czy zostały one wcześniej omówione. Referencje będą bardzo mile widziane.

Dzięki!

Pierre

confidence-interval bootstrap normality-assumption resampling dragice
źródło

Zobacz moje pytanie tutaj dotyczące średniej i mediany: stats.stackexchange.com/questions/96371/...

Alexis

W przypadku wielu problemów ponowne próbkowanie jest niewykonalne obliczeniowo. Na przykład, jeśli chcesz po prostu obliczyć CI dla dużej matrycy 3D lub dla długich szeregów czasowych.

jona

Odpowiedzi:

Warto przyjrzeć się motywacji do przedziału BCa i jego mechanizmom (tj. Tak zwanym „współczynnikom korekcyjnym”). Przedziały BCa są jednym z najważniejszych aspektów bootstrapu, ponieważ są bardziej ogólnym przypadkiem przedziałów procentowych Bootstrap (tj. Przedział ufności oparty wyłącznie na samej dystrybucji bootstrapu).

W szczególności spójrz na związek między interwałami BCa a przedziałami procentowymi Bootstrap: gdy korekta dla przyspieszenia (pierwszy „współczynnik korekcji”) i skosu (drugi „współczynnik korekcji”) wynosi zero, wówczas interwały BCa wracają do typowy interwał procentowy Bootstrap.

Nie sądzę, że dobrym pomysłem byłoby ZAWSZE używanie ładowania początkowego. Bootstrapping to solidna technika, która ma wiele mechanizmów (np .: przedziały ufności i istnieją różne warianty bootstrap dla różnych rodzajów problemów, takich jak dziki bootstrap, gdy występuje heteroscedastyczność) w celu dostosowania do różnych problemów (np. Nienormalność ), ale opiera się na jednym kluczowym założeniu: dane dokładnie reprezentują prawdziwą populację.

To założenie, choć z natury proste, może być trudne do zweryfikowania, szczególnie w kontekście małych rozmiarów próby (może się zdarzyć, że mała próbka jest dokładnym odzwierciedleniem prawdziwej populacji!). Jeśli oryginalna próbka, na której rozkład bootstrapu (a więc wszystkie wynikające z niego wyniki) nie jest odpowiednio dokładna, to twoje wyniki (a zatem twoja decyzja oparta na tych wynikach) będą błędne.

WNIOSEK: Z bootstrapem wiąże się wiele niejednoznaczności i przed zastosowaniem go należy zachować ostrożność.

mmmmmmmmmm
źródło

„Jeśli pierwotna próbka, na której rozkład ładowania początkowego (a więc wszystkie wynikające z niego wyniki) nie jest odpowiednio dokładna, wówczas wyniki (a zatem i decyzja oparta na tych wynikach) będą błędne”. -> ale czy CI bootstrap działa w tych przypadkach gorzej niż alternatywa analityczna?

jona

Założenie, że dane odpowiednio reprezentują populację, nie ogranicza się wyłącznie do ładowania początkowego: dotyczy ono statystyk w ogólności, więc jeśli dane są nieodpowiednie, wówczas wszelkie wnioski, wnioski dotyczące ładowania początkowego lub inne, które zostały wprowadzone, są mylące (fałszywe założenie oznacza, że wszelkie wniosek!).

mmmmmmmmmm

Zatem to zastrzeżenie nie jest skierowane na bootstrap, ale na wnioskowanie, i nie jest argumentem przeciwko używaniu bootstrap w stosunku do innej metody, ale na temat polegania na absolutnej wierze w omylne metody. Nie rozumiem więc, jak to jest istotne w tym kontekście.

jona

Przepraszam, trochę za późno na ten wątek ... @ jona: czy nie byłoby to istotne, ponieważ bootstrapping jeszcze bardziej wzmocni próbkę? Więc jeśli twoja próbka jest niefortunnym błędnym przedstawieniem populacji, to użycie ładowania początkowego odesłałoby cię jeszcze dalej od centrum populacji? Czy nie jest to potencjalny argument przeciwko systematycznemu poleganiu na ładowaniu systemu?

sisdog