Czy istnieją jakieś nienadzorowane algorytmy uczenia się danych sekwencyjnych?

9

Każda obserwacja w moich danych była zbierana z różnicą 0,1 sekundy. Nie nazywam go szeregiem czasowym, ponieważ nie ma on znacznika daty i godziny. W przykładach algorytmów grupowania (znalazłem online) i PCA przykładowe dane mają 1 obserwację na przypadek i nie są mierzone w czasie. Ale moje dane zawierają setki obserwacji zbieranych co 0,1 sekundy na pojazd i jest wiele pojazdów.

Uwaga: zadałem to pytanie również na quora.

umair durrani
źródło
1
Proszę zwrócić uwagę na język. Twoje pytanie jest całkowicie niejasne. Co oznacza „dane przykładowe mają 1 obserwację na przypadek i nie są mierzone w czasie”?
Kasra Manshaei
1
Mówiłem o przykładach, które znalazłem w samouczkach online. Dane przykładowe, z których korzystają, mają tylko 1 obserwację na przypadek / osobę (np. Klient, kraj itp.). A te dane nie są szeregami czasowymi.
umair durrani

Odpowiedzi:

7

To, co masz, to sekwencja wydarzeń według czasu, więc nie wahaj się nazwać to Szeregiem Czasowym!

Grupowanie w szeregi czasowe ma 2 różne znaczenia:

  1. Segmentacja szeregów czasowych, tzn. Chcesz podzielić poszczególne szeregi czasowe na różne przedziały czasowe zgodnie z wewnętrznymi podobieństwami.
  2. Grupowanie szeregów czasowych, tzn. Masz kilka szeregów czasowych i chcesz znaleźć różne klastry według podobieństw między nimi.

Zakładam, że masz na myśli drugi, a oto moja propozycja:

Masz wiele pojazdów i wiele obserwacji na pojazd, tzn. Masz wiele pojazdów. Masz więc kilka macierzy (każdy pojazd jest macierzą), a każda macierz zawiera N wierszy (Liczba obserwacji) i T kolumn (punkty czasowe). Jedną z sugestii może być zastosowanie PCA do każdej matrycy w celu zmniejszenia wymiarów i obserwacji danych w przestrzeni PC i sprawdzenie, czy istnieją znaczące relacje między różnymi obserwacjami w obrębie matrycy (nośnika) . Następnie możesz umieścić każdą obserwację dla wszystkich pojazdów na sobie i zrobić matrycę i zastosować do tego PCA, aby zobaczyć relacje pojedynczej obserwacji między różnymi pojazdami.

Jeśli nie masz wartości ujemnych, zalecamy faktoryzację macierzy w celu zmniejszenia wymiarów danych postaci matrycy.

Inną sugestią może być umieszczenie wszystkich macierzy jeden na drugim i zbudowanie tensora N x M x T, gdzie N to liczba pojazdów, M to liczba obserwacji, a T to sekwencja czasowa i zastosowanie dekompozycji Tensor, aby zobaczyć relacje globalnie.

Bardzo przyjemne podejście do klastrowania szeregów czasowych zostało przedstawione w tym artykule, w którym wdrożenie jest ciche od samego początku.

Mam nadzieję, że to pomogło!

Powodzenia :)


EDYTOWAĆ

Jak wspomniałeś, masz na myśli segmentację szeregów czasowych. Dodaję to do odpowiedzi.

Segmentacja szeregów czasowych jest jedynym problemem klastrowym, który ma podstawową prawdę do oceny. Rzeczywiście rozważyć rozmieszczenie generowania za szeregów czasowych i analizować je gorąco polecam to , to , to , to , to i to , gdzie problemem jest wszechstronnie badane. Szczególnie ostatni i praca doktorska.

Powodzenia!

Kasra Manshaei
źródło
1
Dzięki za świetną odpowiedź. W rzeczywistości moim celem jest „segmentacja szeregów czasowych” dla każdego pojazdu w moim zbiorze danych.
umair durrani
1
Studiuję samouczki na temat rozkładu szeregów czasowych. Odkryłem, że istnieją sposoby na ich rozłożenie na komponenty trendowe, sezonowe i cykliczne. Moje szeregi czasowe to jednak kilka sekund trajektorii pojazdu. Czy można je rozłożyć na różne elementy zachowania podczas jazdy w oparciu o trendy przyspieszeń, prędkości, prędkości pojazdu wiodącego i przyspieszenia w obrębie obserwowanej trajektorii?
umair durrani
2
Może! w tym celu lepiej rozważyć zarówno „rozkład”, jak i „segmentację”. Na przykład jeśli twoje szeregi czasowe pokazują znaczące skupienia w przestrzeni komputera, możesz powiązać je z zachowaniem podczas jazdy. Segmentacja służy również do wykrywania różnych zachowań podczas jazdy w szeregu czasowym. Długa historia mówi, że możesz użyć segmentacji dla różnych segmentów zachowań podczas jazdy dla jednego pojazdu i technik dekompozycji do wykrywania globalnych zachowań podczas jazdy we wszystkich pojazdach.
Kasra Manshaei