Zrozumienie danych wyjściowych bootstrap wykonywanych w R (tsboot, MannKendall)

11

Mam pytanie dotyczące interpretacji wywołania tsboot w R. Sprawdziłem dokumentację zarówno Kendalla, jak i pakietu rozruchowego, ale nie jestem mądrzejszy niż wcześniej.

Kiedy uruchamiam bootstrap, używając np. Przykładu z pakietu Kendall, gdzie statystyką testową jest tau Kendalla:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

co potwierdza trend wzrostowy:

tau = 0.265, 2-sided pvalue =0.00029206

W przykładzie nadal użyto bloku ładowania początkowego:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Otrzymuję następujący wynik:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Jeśli dobrze rozumiem, „t1 * oryginał” jest oryginalnym MKtau, „odchylenie” jest średnią MKtau z szeregów czasowych ładowania początkowego R = 500, a „standardowy błąd” to standardowe odchylenie MKtaus od 500 próbek.

Mam problem ze zrozumieniem, co to oznacza - to w zasadzie mówi mi, że wszystkie 500 MKTaus są niższe od oryginału i że oryginalny t1 * jest w zakresie 3 sd bootstrapped MKtaus. Ergo to jest zupełnie inne?

A może powiedziałbym, że MKtau dla zestawu danych wynosi błąd standardowy 0,26 plus / minus?

Przykro mi z powodu długiego pytania, ale jestem nowicjuszem w dziedzinie statystyki i uczę się przez samokształcenie, brakuje mi kogoś, kto mógłby odrzucić ten prawdopodobnie bardzo prosty problem w tę iz powrotem.

Maria
źródło
6
Na wyjściu biasjest po prostu różnica między średnią z 500 przechowywanych próbek bootstrapu a pierwotnym oszacowaniem. Jest std. errorto standardowe odchylenie dla 500 próbek bootstrapu i jest oszacowaniem standardowego błędu. Dane wyjściowe mówią, że twoje pierwotne oszacowanie jest wyższe niż średnia z 500 oszacowań bootstrapped (więc nie wszystkie MKtaus bootstrapped są niższe). Bootstrap jest często używany do obliczania standardowych błędów / przedziałów ufności bez przyjmowania założeń dotyczących rozkładu. Użyj boot.cifunkcji, aby obliczyć przedziały ufności.
COOLSerdash
@COOLSerdash, dzięki za to! Więc jeśli moja oryginalna statystyka jest o 3 sd wyższa niż średnia statystyki bootstrapped, czy mogę następnie wyciągnąć bezpośrednie wnioski (powiedzmy: statystyki są istotne przy 0,99)? Użyłem również boot.cido obliczenia przedziałów ufności i ponownie, pierwotnie obliczona statystyka leży poza tymi przedziałami.
Maria
Nie, nie porównujesz statystyki ładowania początkowego z oryginalną statystyką z testem hipotez. Chciałbym po prostu użyć / zgłosić standardowe błędy i przedziały ufności podczas ładowania w twoim przypadku.
COOLSerdash,

Odpowiedzi:

3

Przeprowadziwszy w tej samej kwestii i zbadać je kontrolowanym zestaw danych - wzór y = ax + b o N (0, SIG) błędów, to okaże się, że pakiet Kendall nie może pracować jako reklamowane. X mi przypadku była 1:100, a Y = X , SIG = 100 (wariancja czynnik błędu).

Regresja wygląda dobrze, podobnie jak tau Kendalla. Nie ma tutaj autokorelacji innej niż indukowana przez model liniowy. Przeprowadzenie testu Kendall zgodnie z reklamą dla bloków o długości 1, 3, 5 i 10 daje bardzo duże wartości odchylenia i boot.cinie wykazuje trendu.

Następnie ręcznie zakodowałem bootstrap danych tymi długościami bloków, a dzięki mojej serii kontrolnej otrzymuję rozsądne wyniki co do średniej próbek bootstrap i ich rozprzestrzeniania. Dlatego możliwe jest, że coś poszło nie tak z pakietem Kendall w odniesieniu do bloku ładowania początkowego.

użytkownik46157
źródło