Myślenie o wykorzystaniu rekurencyjnych sieci neuronowych do prognozowania szeregów czasowych. Zasadniczo wdrażają rodzaj uogólnionej nieliniowej auto-regresji, w porównaniu do modeli ARMA i ARIMA, które wykorzystują liniową auto-regresję.
Jeśli wykonujemy nieliniową autoregresję, czy nadal konieczne jest, aby szeregi czasowe były nieruchome i czy musielibyśmy różnicować sposób działania w modelach ARIMA?
Czy też nieliniowy charakter modelu daje mu zdolność do obsługi niestacjonarnych szeregów czasowych?
Innymi słowy: czy wymóg stacjonarności (w średniej i wariancji) dla modeli ARMA i ARIMA wynika z faktu, że modele te są liniowe, czy może z innego powodu?
time-series
autoregressive
nonlinear
stationarity
Skander H.
źródło
źródło
Odpowiedzi:
Jeśli celem twojego modelu jest przewidywanie i prognozowanie, to krótka odpowiedź brzmi TAK, ale stacjonarność nie musi być na poziomach.
Wytłumaczę. Jeśli sprowadzasz prognozowanie do jego najbardziej podstawowej formy, będzie to ekstrakcja niezmiennika. Zastanów się: nie możesz przewidzieć, co się zmieni. Jeśli powiem wam, że jutro będzie inne niż dziś pod każdym możliwym do wyobrażenia aspektem , nie będziecie w stanie stworzyć żadnego rodzaju prognozy .
Tylko wtedy, gdy jesteś w stanie przedłużyć coś od dzisiaj do jutra, możesz stworzyć jakąkolwiek prognozę. Dam ci kilka przykładów.
W każdym przypadku rozsądnej prognozy najpierw wydobywamy coś, co jest stałe z procesu, i rozszerzamy ją na przyszłość. Stąd moja odpowiedź: tak, szeregi czasowe muszą być nieruchome, jeśli wariancja i średnia są niezmiennikami, które zamierzasz rozszerzyć na przyszłość z historii. Ponadto chcesz, aby relacje z regresorami również były stabilne.
Po prostu określ, co jest niezmiennikiem w twoim modelu, czy to średni poziom, tempo zmian, czy coś innego. Te rzeczy muszą pozostać takie same w przyszłości, jeśli chcesz, aby Twój model miał jakąkolwiek moc prognozowania.
Przykład Holta Wintersa
Filtr Holt Winters został wspomniany w komentarzach. Jest popularnym wyborem do wygładzania i prognozowania niektórych rodzajów serii sezonowych i może poradzić sobie z seriami niestacjonarnymi. W szczególności może obsługiwać serie, w których średni poziom rośnie liniowo z czasem. Innymi słowy, gdy nachylenie jest stabilne . W mojej terminologii nachylenie jest jednym z niezmienników, które to podejście wydobywa z szeregu. Zobaczmy, jak zawodzi, gdy nachylenie jest niestabilne.
Na tym wykresie pokazuję szeregi deterministyczne z wykładniczym wzrostem i sezonowością addytywną. Innymi słowy, nachylenie z czasem staje się coraz bardziej strome:
Możesz zobaczyć, jak filtr bardzo dobrze pasuje do danych. Dopasowana linia jest czerwona. Jeśli jednak spróbujesz przewidzieć za pomocą tego filtra, nie powiedzie się to dobrze. Prawdziwa linia jest czarna, a czerwony, jeśli jest wyposażony w niebieskie granice pewności na następnym wykresie:
Przyczynę niepowodzenia można łatwo sprawdzić, badając równania modelu Holta Wintersa . Wydobywa zbocze z przeszłości i rozciąga się na przyszłość. Działa to bardzo dobrze, gdy nachylenie jest stabilne, ale gdy stale rośnie, filtr nie może nadążyć, jest o krok do tyłu i efekt kumuluje się w rosnącym błędzie prognozy.
Kod R:
W tym przykładzie możesz poprawić wydajność filtra, po prostu zapisując dziennik serii. Gdy weźmiesz logarytm z wykładniczo rosnących serii, ponownie ustalasz jego nachylenie i dajesz temu filtrowi szansę. Oto przykład:
Kod R:
źródło
Zgodziłbym się również z @Aksakal, że jeśli głównym celem jest przewidywanie, to kardynalne cechy serii stacjonarnej muszą się utrzymać.
źródło