Obliczanie błędu prognozy przy krzyżowej weryfikacji szeregów czasowych

Mam model prognozowania dla szeregów czasowych i chcę obliczyć jego błąd prognozowania poza próbą. W tej chwili strategię, którą stosuję, jest ta sugerowana na blogu Roba Hyndmana (w dolnej części strony), która wygląda następująco (zakładając szereg czasowy i zestaw treningowy o rozmiarze ) $y_1,\dots,y_n$ $k$

Dopasować model do danych i niech jest prognoza dla następnego obserwacji. $y_t,\dots,y_{t+k-1}$ $\hat{y}_{t+k}$
Obliczenia prognozowanych błąd jako . $e_{t} = \hat{y}_{t+k} - y_{t+k}$
Powtórz dla $t=1,\dots,n-k$
Oblicz średni błąd kwadratowy jako $\textrm{MSE}=\frac{1}{n-k}\sum_{t=1}^{n-k} e_t^2$

Moje pytanie brzmi: jak bardzo muszę się martwić o korelacje z powodu moich nakładających się zestawów treningowych. W szczególności, że chcę prognozować nie tylko kolejną wartość, ale następny wartości, tak że mam przewidywania i błędy i chcę zbudować strukturę terminów błędów prognozowania. $m$ $\hat{y}_{t+k},\dots,\hat{y}_{t+k+m-1}$ $e_{t,1},\dots,e_{t,m}$

Czy mogę za każdym razem obrócić okno zestawu treningowego o 1, czy też powinienem obrócić go do przodu o ? Jak zmieniają się odpowiedzi na te pytania, jeśli w przewidywanej przeze mnie serii występuje znaczna autokorelacja (możliwe, że jest to proces o długiej pamięci, tj. Funkcja autokorelacji rozpada się raczej jako prawo mocy niż wykładniczo). $m$

Byłbym wdzięczny za wyjaśnienie tutaj lub linki do miejsca, w którym mogę znaleźć teoretyczne wyniki dotyczące przedziałów ufności wokół MSE (lub innych miar błędów).

time-series forecasting Chris Taylor
źródło

Odpowiedzi:

Wygląda na to, że bardziej interesuje Cię oszacowanie błędów przy użyciu bootstrapu z maksymalną entropią , a nie weryfikacji krzyżowej. Umożliwi to wygenerowanie wielu danych początkowych, które można następnie podzielić na tyle zestawów pociągów / testów, ile chcesz, aby obliczyć przedziały ufności dla swoich prognoz.

Rob Hyndman ma dalsze dyskusje na temat walidacji krzyżowej szeregów czasowych na swoim blogu , gdzie wdraża kilka różnych metod „walcowania” i prognozowania, ale głównie koncentruje się na implementacji. Mam także kilka innych implementacji na moim blogu . Być może najprostszym podejściem byłoby uśrednienie błędu we wszystkich oknach czasowych, a zatem zignorowanie i potencjalne korelacje błędów.

O ile mogę stwierdzić, teoretyczny stan walidacji krzyżowej dla danych szeregów czasowych jest nieco za teoretycznym stanem ogólnej walidacji krzyżowej. Intuicyjnie spodziewam się wzrostu błędu wraz ze wzrostem horyzontu, co sugeruje, że należy spodziewać się skorelowanych błędów w różnych horyzontach prognozy. Dlaczego to Cię martwi?

Zach
źródło