Dlaczego potrzebujemy ładowania początkowego?

16

Obecnie czytam „Wszystkie statystyki” Larry'ego Wassermana i zastanawia mnie coś, co napisał w rozdziale o szacowaniu funkcji statystycznych modeli nieparametrycznych.

On napisał

„Czasami możemy znaleźć szacowany błąd standardowy funkcji statystycznej, wykonując pewne obliczenia. Jednak w innych przypadkach nie jest oczywiste, jak oszacować błąd standardowy”.

Chciałbym zaznaczyć, że w następnym rozdziale mówi o bootstrapie, aby rozwiązać ten problem, ale ponieważ tak naprawdę nie rozumiem tego stwierdzenia, nie mam w pełni motywacji do bootstrapowania?

Jaki jest przykład, gdy nie jest oczywiste, jak oszacować błąd standardowy?

Wszystkie dotychczasowe przykłady były „oczywiste”, takie jak a następnieX1,...Xn Ber(p)se^(p^n)=p^(1p^)/n

Shookie
źródło

Odpowiedzi:

16

Dwie odpowiedzi.

  1. Jaki jest standardowy błąd stosunku dwóch średnich? Jaki jest standardowy błąd mediany? Jaki jest standardowy błąd dowolnej złożonej statystyki? Może istnieje równanie o zamkniętej formie, ale możliwe, że nikt go jeszcze nie opracował.
  2. Aby użyć wzoru na (powiedzmy) błąd standardowy średniej, musimy poczynić pewne założenia. Jeśli te założenia zostaną naruszone, niekoniecznie będziemy mogli zastosować tę metodę. Jak zauważa @Whuber w komentarzach, ładowanie początkowe pozwala nam rozluźnić niektóre z tych założeń, a tym samym może zapewnić bardziej odpowiednie standardowe błędy (chociaż może również powodować dodatkowe założenia).
Jeremy Miles
źródło
2
Odpowiedź 1 jest dobra, ale odpowiedź 2 wydaje się nasuwać pytanie, ponieważ ładowanie początkowe również zakłada założenia. Przypuszczam, że chodzi o to, że zazwyczaj przyjmuje inne założenia niż inne popularne procedury, ale to tylko moje przypuszczenie, co próbujesz powiedzieć i mogę się mylić.
whuber
@ Whuber - dzięki, dodałem trochę wyjaśnień.
Jeremy Miles,
5
Dziękuję za zmiany. Ale czy nie jest tak, że ładowanie zwykle przyjmuje inne założenia , a nie rozluźnia niektóre? Na przykład, założenia potrzebne do oszacowania SE średniej próbki są takie, że dane są identyczne, a podstawowy rozkład ma skończoną wariancję. Bootstrap musi w tym przypadku dodać założenia: nie działa, chyba że wielkość próbki jest „wystarczająco duża”. Chociaż może się to wydawać sprzeczką o szczegóły techniczne, staram się rozwiązać duży obraz: ładowanie początkowe nie jest panaceum ani nie zawsze ma zastosowanie.
whuber
3
@JeremyMiles bootstrap nie jest wolny od założeń. Musisz sprawdzić, czy rozkład jest kluczowy dla większości obliczeń błędów ładowania początkowego, które często mogą być bardziej skomplikowane niż uzyskanie spójnego estymatora błędu standardowego. Ponadto stosunek średnich ma bardzo łatwe przybliżenie błędu uzyskane z metody δ. Nie sądzę więc, aby ten przykład przeczył argumentowi PO.
AdamO
9

Przykład może pomóc zilustrować. Załóżmy, że w ramach modelowania przyczynowego, jesteś zainteresowany w ustalaniu, czy relacja między (ekspozycja zainteresowania) W Y (wypadkową interesów) odbywa się za pośrednictwem zmiennej W . Oznacza to, że w dwóch modelach regresji:XYW

E[Y|X]=β0+β1XE[Y|X,W]=γ0+γ1X+γ2W

Efekt jest inny niż efekt γ 1 .β1γ1

Jako przykład weź pod uwagę związek między paleniem a ryzykiem sercowo-naczyniowym (CV). Palenie oczywiście zwiększa ryzyko CV (w przypadku zdarzeń takich jak zawał serca i udar), powodując kruchość i zwapnienie żył. Jednak palenie również tłumi apetyt. Bylibyśmy więc ciekawi, czy w szacowanym związku między paleniem a ryzykiem CV pośredniczy BMI, który niezależnie jest czynnikiem ryzyka dla ryzyka CV. Tutaj może być zdarzeniem binarnym (zawał mięśnia sercowego lub neurologicznego) w modelu regresji logistycznej lub zmienną ciągłą, taką jak zwapnienie tętnic wieńcowych (CAC), frakcja wyrzutowa lewej komory (LVEF) lub masa lewej komory (LVM).Y

Dopasowalibyśmy dwa modele 1: dostosowanie do palenia i wynik wraz z innymi zaburzeniami, takimi jak wiek, płeć, dochód i historia choroby serca, a następnie 2: wszystkie poprzednie zmienne towarzyszące, a także wskaźnik masy ciała. Różnica w efektach palenia między modelami 1 i 2 polega na tym, na czym opieramy nasze wnioskowanie.

Interesuje nas testowanie hipotez

H:β1=γ1K:β1γ1

Jednym z możliwych pomiarów efektu może być: lub S = β 1 / γ 1 lub dowolna liczba pomiarów. Można używać zwykłych estymatorów dla T i S . Wyznaczenie standardowego błędu tych estymatorów jest bardzo skomplikowane. Bootstrapowanie ich rozkładu jest jednak powszechnie stosowaną techniką i łatwo jest na tej podstawie obliczyć wartość p .T=β1γ1S=β1/γ1TSp

AdamO
źródło
Myślę, że rozumiem, dokąd zmierzasz z tą odpowiedzią, ale jestem zaskoczony szczegółami. Czy zamierzałeś umieścić czapki nad parametrami w swoich opisach i S ? Wygląda na to, że tekst powinien mieć właściwości modelu, a nie estymatory. Jaki sens ma mieszanie właściwości dwóch różnych modeli takich jak ten? Jeśli naprawdę miałeś na myśli kapelusze, to T i S są statystykami, najwyraźniej do wykorzystania jako estymatory, ale co mają one oszacować? TSTS
whuber
TS
γ2=0
@ whuber Ah Widzę zamieszanie. Zobacz zalecany artykuł z MacKinnon tutaj .
AdamO
TSTTT
2

Posiadanie rozwiązań parametrycznych dla każdej miary statystycznej byłoby pożądane, ale jednocześnie dość nierealne. Bootstrap jest przydatny w takich przypadkach. Przykład, który przychodzi mi do głowy, dotyczy różnicy między dwoma środkami bardzo wypaczonego rozkładu kosztów. W takim przypadku klasyczny test t dla dwóch próbek nie spełnia swoich wymagań teoretycznych (rozkłady, z których pobrano badane próbki, z pewnością odbiegają od normalności ze względu na ich długi prawy ogon), a testy nieparametryczne nie są w stanie przekazać przydatne informacje dla decydentów (którzy zwykle nie są zainteresowani szeregami). Możliwym rozwiązaniem pozwalającym uniknąć utknięcia w martwym punkcie jest test t bootstrap z dwoma próbkami.

Carlo Lazzaro
źródło