RNN przy użyciu wielu szeregów czasowych

14

Próbuję utworzyć sieć neuronową, używając szeregów czasowych jako danych wejściowych, aby trenować ją w oparciu o typ każdej serii. Czytałem, że używając RNN możesz podzielić dane wejściowe na partie i wykorzystać każdy punkt szeregu czasowego na poszczególne neurony i ostatecznie wyszkolić sieć.

Staram się jednak używać wielu szeregów czasowych jako danych wejściowych. Na przykład możesz otrzymać sygnał wejściowy z dwóch czujników. (Więc dwie serie czasowe), ale chcę użyć ich obu, aby uzyskać końcowy wynik.

Również nie próbuję przewidzieć przyszłych wartości szeregów czasowych, staram się uzyskać klasyfikację na podstawie ich wszystkich.

Jak mam podejść do tego problemu?

  • Czy istnieje sposób na użycie wielu szeregów czasowych jako danych wejściowych do RNN?

  • Czy powinienem próbować agregować szeregi czasowe w jeden?

  • Czy powinienem po prostu użyć dwóch różnych sieci neuronowych? A jeśli to ostatnie podejście jest prawidłowe, czy liczba szeregów czasowych rośnie, czy nie byłoby to zbyt intensywne komputerowo?

Ploo
źródło

Odpowiedzi:

10

Szeregi czasowe na wielu odmianach to aktywny temat badawczy, w którym znajdziesz wiele najnowszych artykułów na ten temat.

Aby odpowiedzieć na pytania, możesz użyć jednego numeru RNN. Możesz wprowadzić jedną wartość dla każdego kroku czasowego. Nic nie powstrzymuje Cię przed dodaniem kolejnej wartości na każdym kroku (jeśli czujnik jest zsynchronizowany). Twój model nauczy się następnie klasyfikować za pomocą dwuwymiarowych szeregów czasowych.

Sprawdzasz tego bloga . W twoim przypadku tylko wynik jest inny.

Jeśli chodzi o dwa ostatnie punkty, agregacja szeregów czasowych w jeden jest ryzykowna w tym sensie, że możesz stracić ważne informacje podczas procesu. Wreszcie główną wadą ostatniego punktu jest to, że nie będziesz w stanie wykorzystać potencjalnej korelacji między dwoma szeregami czasowymi do ostatecznej klasyfikacji.

Daerken
źródło
Jeśli użyjesz wielu szeregów czasowych, jak zareaguje sieć, jeśli z jakiegoś powodu dla próbki 1 masz 5 serii, ale dla próbki 2 masz 4, (może dlatego, że nie masz danych z ostatniego czujnika). Czy konieczne jest, aby zacząć od 5 serii, zawsze powinna to być 5? Czy powinieneś dołączyć piąty szereg czasowy dla sample2 z fałszywymi uśrednionymi danymi, które zamówię, aby mieć wszystkie 5?
Ploo
1
no cóż, istnieją różne podejścia do brakujących danych. Polecam użycie wartości 0, jeśli nie masz żadnych wartości. Jest często używany, gdy nie mamy całej sekwencji X_t, ale wciąż musimy wprowadzić sekwencję długości t. Nazywa się to padding, jeśli chcesz dowiedzieć się więcej na ten temat.
Daerken