Zrobiłem bootstrapping z modelem mieszanym (kilka zmiennych z interakcją i jedna zmienna losowa). Mam ten wynik (tylko częściowy):
> boot_out
ORDINARY NONPARAMETRIC BOOTSTRAP
Call:
boot(data = a001a1, statistic = bootReg, R = 1000)
Bootstrap Statistics :
original bias std. error
t1* 4.887383e+01 -1.677061e+00 4.362948e-01
t2* 3.066825e+01 1.264024e+00 5.328387e-01
t3* 8.105422e+01 2.368599e+00 6.789091e-01
t4* 1.620562e+02 4.908711e+00 1.779522e+00
......
Teraz chciałem uzyskać przedziały ufności dla przechwytywania:
> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates
CALL :
boot.ci(boot.out = boot_out, type = c("norm", "basic",
"perc"), index = 1)
Intervals :
Level Normal Basic Percentile
95% (49.70, 51.41 ) (49.70, 51.41 ) (46.34, 48.05 )
Calculations and Intervals on Original Scale
Szacowana skorygowana stronniczość wynosi:
48,873 -1,677
1 47,196
Problemem jest to, że normalne i podstawowe CI są poza oszacowaniami (oryginalne i poprawione). Zastanawiam się, jak sobie z tym poradzić.
Aktualizacja 1:
Oto podobne pytania z dużą ilością odpowiedzi.
r
confidence-interval
bootstrap
bias
Giordano
źródło
źródło
Odpowiedzi:
Trudność, przed którą stoisz, wynika z matematyki implikowanej. Centrum estymatora lokalizacji lub estymator interwału można traktować jako minimalizację funkcji kosztu w rozkładzie. Średnia próbki powyżej Gaussa minimalizuje straty kwadratowe, podczas gdy mediana minimalizuje bezwzględną funkcję straty liniowej ponad Gaussa. Mimo że w populacji znajdują się w tym samym punkcie, odkrywa się je przy użyciu różnych funkcji kosztów.
Dajemy ci algorytm i mówimy „zrób to”, ale zanim algorytm został opracowany, ktoś rozwiązał problem optymalizacji.
Zastosowano cztery różne funkcje kosztów, co daje trzy przedziały i estymator punktowy. Ponieważ funkcje kosztów są różne, zapewniają różne punkty i interwały. Nic nie można na to poradzić poza ręcznym ujednoliceniem metodologii.
Musisz znaleźć dokumenty bazowe i spojrzeć na kod bazowy, aby zrozumieć, które z nich mapują na jakie rodzaje problemów.
Przykro mi to mówić, ale oprogramowanie Cię zdradziło. Wykonał swoją pracę i średnio działa świetnie, ale masz próbkę, w której oprogramowanie nie będzie działać. A raczej działa idealnie i musisz naprawdę cofnąć się w literaturze, aby określić, co naprawdę robi.
źródło