Powiedzmy, że mam szereg szeregów czasowych, np. Kilka rekordów temperatury z różnych stacji w regionie. Chcę uzyskać pojedynczy rekord temperatury dla całego regionu, z którym mógłbym opisać aspekty klimatu regionalnego. Intuicyjnym podejściem może być po prostu uśrednianie wszystkich stacji w każdym czasie, ale mój statystyczny zmysł pająka (z którym zdecydowanie nie jestem jeszcze w kontakcie) mówi mi, że może to nie być takie łatwe. W szczególności wyobrażam sobie, że uśrednianie dla całego regionu usunie niektóre z interesujących ekstremów temperaturowych i mogę mieć problemy z zależnością między bliskimi stacjami.
Z jakimi innymi problemami mogę się spotkać, gdy wypróbuję taką strategię i czy istnieją sposoby na ich przezwyciężenie lub bardziej rozsądne metody łączenia tego rodzaju danych?
Uwaga: odpowiedzi mogą być bardziej ogólne niż podany przykład przestrzenny.
źródło
Odpowiedzi:
Po pierwsze, chciałbym powiedzieć, że dodam komentarz, ale nie mogę tego jeszcze zrobić (rep), ale podoba mi się pytanie i chciałem wziąć udział, więc oto „odpowiedź”. Widzę też, że jest stary, ale interesujący.
Po pierwsze, czy byłoby możliwe zastosowanie techniki redukcji wymiarów, takiej jak PCA, do skondensowania szeregów czasowych? Jeśli pierwsza wartość własna jest duża, być może oznacza to, że użycie wektora własnego reprezentowałoby większość dynamiki.
Po drugie, i bardziej ogólnie, jakie jest twoje pożądane wykorzystanie szeregów czasowych? Nie wiedząc wiele więcej, zgaduję, że temperatury mogą się znacznie różnić. Na przykład, jeśli niektóre zapisy temperatury znajdują się w pobliżu miast, można uzyskać efekt typu „wyspa ciepła”. A może mała zmiana odległości bocznej powoduje dużą zmianę odległości pionowej - jedno miejsce może znajdować się na poziomie morza i tuż nad oceanem, a drugie nie „za daleko”, ale na wysokości jednego kilometra. Te z pewnością miałyby różne temperatury!
To tylko niektóre przemyślenia. Może ktoś inny mógłby wskoczyć i dać lepszą odpowiedź.
źródło