To tylko ogólne pytanie. Jeśli masz dane szeregów czasowych, kiedy lepiej jest stosować techniki szeregów czasowych (aka, ARCH, GARCH itp.) Zamiast technik uczenia maszynowego / statystycznego (KNN, regresja)? Jeśli istnieje podobne pytanie dotyczące weryfikacji krzyżowej, proszę skierować mnie do niego - spojrzałem i nie mogłem go znaleźć.
10
Odpowiedzi:
Typowe metody uczenia maszynowego zakładają, że dane są niezależne i identycznie dystrybuowane, co nie jest prawdą w przypadku danych szeregów czasowych. Dlatego są niekorzystne w porównaniu do technik szeregów czasowych pod względem dokładności. Przykłady tego można znaleźć w poprzednich pytaniach. Porządkowanie szeregów czasowych w uczeniu maszynowym i losowy las jest zbyt dobry .
źródło
Francis Diebold opublikował niedawno na swoim blogu „ML and Metrics VI: A Key Difference between ML and TS Econometrics” . Dostarczam jego skróconą wersję, więc wszelkie podziękowania należą się mu. (Pogrubienie jest moje).
Zatem wniosek jest następujący:
Polecam przeczytanie całego oryginalnego postu tutaj .
źródło
Jak zauważył @Tom Minka, większość technik ML zakłada dane wejściowe iid. Istnieje jednak kilka rozwiązań:
Można wykorzystać wszystkie wcześniejsze próbki szeregów czasowych w systemie „Pamięć” jako jeden wektor cech, tj .: x = [x (t-1), x (t-2), ... x (tM)]. Ma to jednak 2 problemy: 1) w zależności od binowania, możesz mieć ogromny wektor cech 2 - niektóre metody wymagają, aby cechy w wektorze cech były niezależne, co nie ma miejsca w tym przypadku.
Istnieje wiele technik ML, które są specjalnie zaprojektowane dla takich danych szeregów czasowych, na przykład Ukryte modele Markowa, które zostały bardzo skutecznie wykorzystane do wykrywania napadów, przetwarzania mowy itp.
Wreszcie, zastosowałem podejście polegające na wykorzystaniu technik „ekstrakcji cech” do przekształcenia problemu regresji dynamicznej (który ma element czasu) w problem statyczny. Na przykład podejście Principal Dynamics Mode (PDM) mapuje wejściowy wektor cech przeszłości ([x (t-1), x (t-2), ... x (tM)]) na statyczny ([v ( 1), v (2), .. v (L)]) poprzez połączenie przeszłości z specyficznym dla systemu liniowym bankiem filtrów (PDM), patrz Marmarelis, 2004 książka lub Marmarelis, Vasilis Z. "Metodologia modelowania nieliniowych układów fizjologicznych . ” Roczniki inżynierii biomedycznej 25.2 (1997): 239-251 ...
źródło