Każda obserwacja w moich danych była zbierana z różnicą 0,1 sekundy. Nie nazywam go szeregiem czasowym, ponieważ nie ma on znacznika daty i godziny. W przykładach algorytmów grupowania (znalazłem online) i PCA przykładowe dane mają 1 obserwację na przypadek i nie są mierzone w czasie. Ale moje dane zawierają setki obserwacji zbieranych co 0,1 sekundy na pojazd i jest wiele pojazdów.
Uwaga: zadałem to pytanie również na quora.
algorithms
umair durrani
źródło
źródło
Odpowiedzi:
To, co masz, to sekwencja wydarzeń według czasu, więc nie wahaj się nazwać to Szeregiem Czasowym!
Grupowanie w szeregi czasowe ma 2 różne znaczenia:
Zakładam, że masz na myśli drugi, a oto moja propozycja:
Masz wiele pojazdów i wiele obserwacji na pojazd, tzn. Masz wiele pojazdów. Masz więc kilka macierzy (każdy pojazd jest macierzą), a każda macierz zawiera N wierszy (Liczba obserwacji) i T kolumn (punkty czasowe). Jedną z sugestii może być zastosowanie PCA do każdej matrycy w celu zmniejszenia wymiarów i obserwacji danych w przestrzeni PC i sprawdzenie, czy istnieją znaczące relacje między różnymi obserwacjami w obrębie matrycy (nośnika) . Następnie możesz umieścić każdą obserwację dla wszystkich pojazdów na sobie i zrobić matrycę i zastosować do tego PCA, aby zobaczyć relacje pojedynczej obserwacji między różnymi pojazdami.
Jeśli nie masz wartości ujemnych, zalecamy faktoryzację macierzy w celu zmniejszenia wymiarów danych postaci matrycy.
Inną sugestią może być umieszczenie wszystkich macierzy jeden na drugim i zbudowanie tensora N x M x T, gdzie N to liczba pojazdów, M to liczba obserwacji, a T to sekwencja czasowa i zastosowanie dekompozycji Tensor, aby zobaczyć relacje globalnie.
Bardzo przyjemne podejście do klastrowania szeregów czasowych zostało przedstawione w tym artykule, w którym wdrożenie jest ciche od samego początku.
Mam nadzieję, że to pomogło!
Powodzenia :)
EDYTOWAĆ
Jak wspomniałeś, masz na myśli segmentację szeregów czasowych. Dodaję to do odpowiedzi.
Segmentacja szeregów czasowych jest jedynym problemem klastrowym, który ma podstawową prawdę do oceny. Rzeczywiście rozważyć rozmieszczenie generowania za szeregów czasowych i analizować je gorąco polecam to , to , to , to , to i to , gdzie problemem jest wszechstronnie badane. Szczególnie ostatni i praca doktorska.
Powodzenia!
źródło