Problemem, z którym mam do czynienia, jest przewidywanie wartości szeregów czasowych. Patrzę na jeden szereg czasowy naraz i na podstawie np. 15% danych wejściowych chciałbym przewidzieć jego przyszłe wartości. Do tej pory natknąłem się na dwa modele:
Próbowałem obu i przeczytałem kilka artykułów na ich temat. Teraz staram się lepiej zrozumieć, jak porównać oba. Co znalazłem do tej pory:
- LSTM działa lepiej, jeśli mamy do czynienia z ogromną ilością danych i dostępna jest wystarczająca ilość danych szkoleniowych, natomiast ARIMA jest lepszy dla mniejszych zestawów danych (czy to prawda?)
- ARIMA wymaga szeregu parametrów,
(p,q,d)
które należy obliczyć na podstawie danych, podczas gdy LSTM nie wymaga ustawiania takich parametrów. Jednak istnieją pewne hiperparametry, które musimy dostroić do LSTM.
Poza wyżej wymienionymi właściwościami nie mogłem znaleźć żadnych innych punktów ani faktów, które mogłyby pomóc mi w wyborze najlepszego modelu. Byłbym bardzo wdzięczny, gdyby ktoś mógł mi pomóc w znalezieniu artykułów, artykułów lub innych rzeczy (jak dotąd nie miał szczęścia, tylko niektóre ogólne opinie tu i tam i nic na podstawie eksperymentów).
Muszę wspomnieć, że pierwotnie mam do czynienia z przesyłaniem danych, jednak na razie korzystam z zestawów danych NAB, które obejmują 50 zestawów danych o maksymalnym rozmiarze 20 000 punktów danych.
źródło
Odpowiedzi:
Porównanie sztucznych sieci neuronowych i modeli szeregów czasowych do prognozowania cen towarów porównuje wyniki ANN i ARIMA w prognozowaniu finansowych szeregów czasowych. Myślę, że to dobry punkt wyjścia do przeglądu literatury.
W wielu przypadkach sieci neuronowe mają tendencję do przewyższania modeli opartych na AR. Myślę jednak, że jedną z głównych wad (która nie jest tak często omawiana w literaturze akademickiej) w przypadku bardziej zaawansowanych metod uczenia maszynowego jest to, że używają czarnych skrzynek. Jest to duży problem, jeśli musiałbyś wyjaśnić działanie modelu komuś, kto nie zna tak wielu z tych modeli (na przykład w korporacji). Ale jeśli robisz tę analizę tylko jako pracę szkolną, nie sądzę, że będzie to problem.
Ale jak powiedział poprzedni komentator, zwykle najlepszym sposobem jest utworzenie estymatora zespołu, w którym łączysz dwa lub więcej modeli.
źródło