Prognozowanie szeregów czasowych przy użyciu ARIMA vs LSTM

10

Problemem, z którym mam do czynienia, jest przewidywanie wartości szeregów czasowych. Patrzę na jeden szereg czasowy naraz i na podstawie np. 15% danych wejściowych chciałbym przewidzieć jego przyszłe wartości. Do tej pory natknąłem się na dwa modele:

  • LSTM (długoterminowa pamięć krótkotrwała; klasa rekurencyjnych sieci neuronowych)
  • ARIMA

Próbowałem obu i przeczytałem kilka artykułów na ich temat. Teraz staram się lepiej zrozumieć, jak porównać oba. Co znalazłem do tej pory:

  1. LSTM działa lepiej, jeśli mamy do czynienia z ogromną ilością danych i dostępna jest wystarczająca ilość danych szkoleniowych, natomiast ARIMA jest lepszy dla mniejszych zestawów danych (czy to prawda?)
  2. ARIMA wymaga szeregu parametrów, (p,q,d)które należy obliczyć na podstawie danych, podczas gdy LSTM nie wymaga ustawiania takich parametrów. Jednak istnieją pewne hiperparametry, które musimy dostroić do LSTM.

Poza wyżej wymienionymi właściwościami nie mogłem znaleźć żadnych innych punktów ani faktów, które mogłyby pomóc mi w wyborze najlepszego modelu. Byłbym bardzo wdzięczny, gdyby ktoś mógł mi pomóc w znalezieniu artykułów, artykułów lub innych rzeczy (jak dotąd nie miał szczęścia, tylko niektóre ogólne opinie tu i tam i nic na podstawie eksperymentów).

Muszę wspomnieć, że pierwotnie mam do czynienia z przesyłaniem danych, jednak na razie korzystam z zestawów danych NAB, które obejmują 50 zestawów danych o maksymalnym rozmiarze 20 000 punktów danych.

ahajib
źródło
1
Może po prostu wypróbujesz dwa modele z części danych, zobaczysz, który z nich jest lepszy w prognozowaniu, i wybierzesz. Lub użyj obu modeli i połącz ich prognozy. Kombinacje prognoz często przewyższają poszczególne prognozy.
Richard Hardy,
@RichardHardy Już to zrobiłem i jestem świadomy ich wydajności w moich zestawach danych. Staram się lepiej zrozumieć oba, a zwłaszcza ich wady, aby zobaczyć, który z nich może być najlepszym kandydatem do obsługi nadchodzących próbek danych.
ahajib
Przeczytaj centrum pomocy - w szczególności ostatni akapit, w którym jest napisane: „ Pamiętaj jednak, że w witrynach SE nie zaleca się krzyżowania postów. Wybierz jedną najlepszą lokalizację, aby opublikować swoje pytanie. Później, jeśli okaże się to bardziej odpowiednie dla inną witrynę, można ją migrować.
Glen_b

Odpowiedzi:

3

Porównanie sztucznych sieci neuronowych i modeli szeregów czasowych do prognozowania cen towarów porównuje wyniki ANN i ARIMA w prognozowaniu finansowych szeregów czasowych. Myślę, że to dobry punkt wyjścia do przeglądu literatury.

W wielu przypadkach sieci neuronowe mają tendencję do przewyższania modeli opartych na AR. Myślę jednak, że jedną z głównych wad (która nie jest tak często omawiana w literaturze akademickiej) w przypadku bardziej zaawansowanych metod uczenia maszynowego jest to, że używają czarnych skrzynek. Jest to duży problem, jeśli musiałbyś wyjaśnić działanie modelu komuś, kto nie zna tak wielu z tych modeli (na przykład w korporacji). Ale jeśli robisz tę analizę tylko jako pracę szkolną, nie sądzę, że będzie to problem.

Ale jak powiedział poprzedni komentator, zwykle najlepszym sposobem jest utworzenie estymatora zespołu, w którym łączysz dwa lub więcej modeli.

Juha
źródło
7
Cytowany przez ciebie artykuł dotyczy prostych sieci neuronowych typu feedforward i jest zbyt stary, aby był użyteczny (lata 90. to wiek temu). Pytanie OP dotyczy rekurencyjnej sieci neuronowej z architekturą LSTM, a niniejszy artykuł tego nie obejmuje.
horaceT
1
Jak wspomniałem @horaceT, ten artykuł jest nieco przestarzały, a gdybyś mógł zasugerować nowszy artykuł, który zawiera informacje o LSTM, byłby niesamowity. Dzięki
ahajib