Analiza szeregów czasowych a uczenie maszynowe?

10

To tylko ogólne pytanie. Jeśli masz dane szeregów czasowych, kiedy lepiej jest stosować techniki szeregów czasowych (aka, ARCH, GARCH itp.) Zamiast technik uczenia maszynowego / statystycznego (KNN, regresja)? Jeśli istnieje podobne pytanie dotyczące weryfikacji krzyżowej, proszę skierować mnie do niego - spojrzałem i nie mogłem go znaleźć.

Nagy
źródło
1
Ważne: cs.stackexchange.com/questions/13937/…
Anton Tarasenko,

Odpowiedzi:

9

Typowe metody uczenia maszynowego zakładają, że dane są niezależne i identycznie dystrybuowane, co nie jest prawdą w przypadku danych szeregów czasowych. Dlatego są niekorzystne w porównaniu do technik szeregów czasowych pod względem dokładności. Przykłady tego można znaleźć w poprzednich pytaniach. Porządkowanie szeregów czasowych w uczeniu maszynowym i losowy las jest zbyt dobry .

Tom Minka
źródło
Dzięki za twoją odpowiedź. Co więcej, wydaje się, że uczenie maszynowe bardziej koncentruje się na znajdowaniu relacji w danych, podczas gdy analiza szeregów czasowych dotyczy bardziej prawidłowego identyfikowania przyczyn danych - tj. Wpływu czynników stochastycznych na to. Czy zgadzasz się z tym?
Nagy,
4
Nie, nie zgodziłbym się z tym streszczeniem.
Tom Minka,
4

Francis Diebold opublikował niedawno na swoim blogu „ML and Metrics VI: A Key Difference between ML and TS Econometrics” . Dostarczam jego skróconą wersję, więc wszelkie podziękowania należą się mu. (Pogrubienie jest moje).

[S] tatystyczne uczenie maszynowe (ML) i ekonometria szeregów czasowych (TS) mają ze sobą wiele wspólnego. Ale jest też ciekawa różnica: nacisk ML na elastyczne nieparametryczne modelowanie nieliniowości warunkowej-średniej nie odgrywa dużej roli w TS. <...>

[T] tutaj jest bardzo mało dowodów na istotną warunkową średnią nieliniowość w kowariancyjno-stacjonarnej (nie trendowanej, nie sezonowej) dynamice większości ekonomicznych szeregów czasowych. <...> Rzeczywiście, mogę wymyślić tylko jeden rodzaj nieliniowości warunkowo-średniej, który okazał się wielokrotnie ważny dla (przynajmniej niektórych) ekonomicznych szeregów czasowych: dynamika przełączania Markowa w stylu Hamiltona.

[Oczywiście w pokoju jest nieliniowy słoń: dynamika typu GARCH w stylu Engle. Są niezwykle ważne w ekonometrii finansowej, a czasem także w makroekonometrii, ale dotyczą warunkowych odchyleń, a nie środków warunkowych.]

Istnieją więc w zasadzie tylko dwa ważne nieliniowe modele w TS i tylko jeden z nich mówi o dynamice warunkowej średniej. Co najważniejsze, oba są bardzo ściśle parametryczne, ściśle dopasowane do specjalistycznych cech danych ekonomicznych i finansowych.

Zatem wniosek jest następujący:

ML kładzie nacisk na aproksymację nieliniowych funkcji średnich warunkowych w wysoce elastyczny sposób nieparametryczny. To okazuje się podwójnie niepotrzebne w TS: po prostu nie ma się o co martwić nieliniową średnią warunkową, a kiedy to się zdarza, zwykle ma wysoce wyspecjalizowany charakter najlepiej przybliżony w wysoce specjalistyczny (ściśle parametryczny) sposób .

Polecam przeczytanie całego oryginalnego postu tutaj .

Richard Hardy
źródło
+1. Bardzo zgadzam się z tą odpowiedzią. Typowe metody ML charakteryzują się modelowaniem nieparametrycznym i mają bardzo łagodne założenia, podczas gdy modele ARMA są „ściśle parametryczne”.
Digio,
2

Jak zauważył @Tom Minka, większość technik ML zakłada dane wejściowe iid. Istnieje jednak kilka rozwiązań:

  1. Można wykorzystać wszystkie wcześniejsze próbki szeregów czasowych w systemie „Pamięć” jako jeden wektor cech, tj .: x = [x (t-1), x (t-2), ... x (tM)]. Ma to jednak 2 problemy: 1) w zależności od binowania, możesz mieć ogromny wektor cech 2 - niektóre metody wymagają, aby cechy w wektorze cech były niezależne, co nie ma miejsca w tym przypadku.

  2. Istnieje wiele technik ML, które są specjalnie zaprojektowane dla takich danych szeregów czasowych, na przykład Ukryte modele Markowa, które zostały bardzo skutecznie wykorzystane do wykrywania napadów, przetwarzania mowy itp.

  3. Wreszcie, zastosowałem podejście polegające na wykorzystaniu technik „ekstrakcji cech” do przekształcenia problemu regresji dynamicznej (który ma element czasu) w problem statyczny. Na przykład podejście Principal Dynamics Mode (PDM) mapuje wejściowy wektor cech przeszłości ([x (t-1), x (t-2), ... x (tM)]) na statyczny ([v ( 1), v (2), .. v (L)]) poprzez połączenie przeszłości z specyficznym dla systemu liniowym bankiem filtrów (PDM), patrz Marmarelis, 2004 książka lub Marmarelis, Vasilis Z. "Metodologia modelowania nieliniowych układów fizjologicznych . ” Roczniki inżynierii biomedycznej 25.2 (1997): 239-251 ...

DankMasterDan
źródło