Bootstrap: oszacowanie jest poza przedziałem ufności

Zrobiłem bootstrapping z modelem mieszanym (kilka zmiennych z interakcją i jedna zmienna losowa). Mam ten wynik (tylko częściowy):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

Teraz chciałem uzyskać przedziały ufności dla przechwytywania:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

Szacowana skorygowana stronniczość wynosi:

48,873 -1,677
1 47,196

Problemem jest to, że normalne i podstawowe CI są poza oszacowaniami (oryginalne i poprawione). Zastanawiam się, jak sobie z tym poradzić.

Aktualizacja 1:
Oto podobne pytania z dużą ilością odpowiedzi.

r confidence-interval bootstrap bias Giordano
źródło

Tylko komentarz: Efron i Tibshirani (1993) w klasycznej książce opowiadali się raczej przeciwko korekcie uprzedzeń, twierdząc, że jest to „niebezpieczna” i „problematyczna” praktyka, która może prowadzić do zwiększenia standardowego błędu.

Tim

@Tim Dziękujemy za komentarz. Rzucę okiem na książkę. Być może rozwiązaniem jest użycie szacunków i bootstrap se * do obliczenia przedziałów ufności. W moim przypadku stronniczość tylko nieznacznie wpływa na szacunki.

giordano

Odpowiedzi:

Trudność, przed którą stoisz, wynika z matematyki implikowanej. Centrum estymatora lokalizacji lub estymator interwału można traktować jako minimalizację funkcji kosztu w rozkładzie. Średnia próbki powyżej Gaussa minimalizuje straty kwadratowe, podczas gdy mediana minimalizuje bezwzględną funkcję straty liniowej ponad Gaussa. Mimo że w populacji znajdują się w tym samym punkcie, odkrywa się je przy użyciu różnych funkcji kosztów.

Dajemy ci algorytm i mówimy „zrób to”, ale zanim algorytm został opracowany, ktoś rozwiązał problem optymalizacji.

Zastosowano cztery różne funkcje kosztów, co daje trzy przedziały i estymator punktowy. Ponieważ funkcje kosztów są różne, zapewniają różne punkty i interwały. Nic nie można na to poradzić poza ręcznym ujednoliceniem metodologii.

Musisz znaleźć dokumenty bazowe i spojrzeć na kod bazowy, aby zrozumieć, które z nich mapują na jakie rodzaje problemów.

Przykro mi to mówić, ale oprogramowanie Cię zdradziło. Wykonał swoją pracę i średnio działa świetnie, ale masz próbkę, w której oprogramowanie nie będzie działać. A raczej działa idealnie i musisz naprawdę cofnąć się w literaturze, aby określić, co naprawdę robi.

Dave Harris
źródło

Dzięki za to, że wykonał swoją pracę, i średnio działa świetnie, ale masz próbkę, w której oprogramowanie nie działa, i inne informacje. Rzeczywiście, próbka jest dziwna, dlatego chciałem użyć Bootsstrap do obliczenia CI. Oczywiście ta metoda nie wydaje się tak prosta, jak się wydaje.

giordano,