Czy istnieje złoty standard modelowania szeregów czasowych o nieregularnych odstępach?

45

W dziedzinie ekonomii (myślę) mamy ARIMA i GARCH dla regularnie rozmieszczonych szeregów czasowych i Poissona, Hawkesa dla modelowania procesów punktowych, więc co powiesz na próby modelowania nieregularnie (nierównomiernie) szeregów czasowych - czy są (przynajmniej) jakieś powszechne praktyki ?

(Jeśli masz trochę wiedzy w tym temacie, możesz także rozwinąć odpowiedni artykuł wiki ).

Edycja (o brakujących wartościach i szeregach czasowych o nieregularnych odstępach):

Odpowiedz na komentarz @Lucas Reis. Jeśli odstępy między zmiennymi pomiarów lub realizacji są rozstawione z powodu (na przykład) procesu Poissona, nie ma wiele miejsca na tego rodzaju regularyzację, ale istnieje prosta procedura: t(i)czy i-ty indeks czasowy zmiennej x (i-ty czas realizacja x), a następnie określić luki między czasie pomiarów jak g(i)=t(i)-t(i-1), potem discretize g(i)użyciem stałej c, dg(i)=floor(g(i)/ca także tworzyć nowe szeregów czasowych z wielu pustych wartości między starymi obserwacjach z oryginalnym szeregów czasowych ii i+1równać do DG (i), ale problemem jest to, że procedura może z łatwością wytworzyć szeregi czasowe z liczbą brakujących danych znacznie większą niż liczba obserwacji, więc rozsądne oszacowanie wartości brakujących obserwacji może być niemożliwe i zbyt dużecusuń „strukturę czasu / zależność czasu itp.” analizowanego problemu (skrajny przypadek podano, biorąc c>=max(floor(g(i)/c))po prostu, że po prostu zapadają się nieregularnie rozmieszczone szeregi czasowe w regularnie rozmieszczone

Edition2 (dla zabawy): Obrazowanie brakujących wartości w szeregach czasowych o nieregularnych odstępach lub nawet w przypadku przetwarzania punktowego.

Qbik
źródło
Żeby wyjaśnić, kiedy mówisz „nieregularnie rozmieszczone”, nie masz na myśli „regularnie rozmieszczonych, ale z brakującymi wartościami”, prawda?
Wayne,
2
Nie :) t(i)- czas x[t(i)],x[t(i+1)],x[t(i+2)]...i t(j+1)-t(j)nie jest stały. Dane są gromadzone w rozproszonej lub asynchronicznej rezydencji.
Qbik,
2
Co powiesz na interpolację i analizę z interpolowanymi wartościami, regularnie rozmieszczonymi? Czy ktoś wie, jakie byłyby implikacje tej metody?
Lucas Reis,
Co powiesz na najpierw modelowanie czasów punktów, a następnie wartości punktów, zależnie od ich czasów? Uważam, że terminem są „oznaczone procesy punktowe”.
PeterR,

Odpowiedzi:

26

Jeśli obserwacje procesu stochastycznego są nieregularnie rozmieszczone, najbardziej naturalnym sposobem modelowania obserwacji są dyskretne obserwacje czasowe z ciągłego procesu czasowego.

Zasadniczo potrzebna jest specyfikacja modelu - wspólny rozkład obserwacji obserwowany w czasach , i można to na przykład podzielić na rozkłady warunkowe otrzymał . Jeżeli proces jest procesem Markowa rozkład ten warunkowego zależy nie na i zależy od i . Jeśli proces jest jednorodny czasowo, zależność od punktów czasowych wynika tylko z ich różnicy .X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

Widzimy z tego, że jeśli mamy obserwacje w równej odległości ( powiedzmy ) z jednorodnego czasowo procesu Markowa, musimy jedynie określić pojedynczy rozkład prawdopodobieństwa warunkowego, , aby określić Model. W przeciwnym razie musimy określić całą kolekcję warunkowych rozkładów prawdopodobieństwa indeksowanych przez różnice czasowe obserwacji, aby określić model. To ostatnie jest w rzeczywistości najłatwiejsze do wykonania przez określenie rodziny ciągłych rozkładów prawdopodobieństwa warunkowego w czasie.titi1=1P1Ptiti1Pt

Powszechnym sposobem uzyskania specyfikacji modelu ciągłego czasu jest stochastyczne równanie różniczkowe (SDE) Dobrym miejscem do rozpoczęcia tworzenia statystyk dla modeli SDE jest Symulacja i wnioskowanie dla stochastycznych równań różniczkowych autorstwa Stefano Iacusa. Możliwe, że wiele metod i wyników jest opisanych dla równomiernych obserwacji, ale zazwyczaj jest to po prostu wygodne do prezentacji i nie jest niezbędne do zastosowania. Jedną z głównych przeszkód jest to, że specyfikacja SDE rzadko pozwala na wyraźne prawdopodobieństwo, gdy masz dyskretne obserwacje, ale istnieją dobrze rozwinięte alternatywy równań szacunkowych.

dXt=a(Xt)dt+b(Xt)dBt.

Jeśli chcesz wyjść poza procesy Markowa, modele zmienności stochastycznej są jak (G) modele ARCH próbują modelować heterogeniczną wariancję (zmienność). Można również rozważyć równania opóźniające, takie jak które są analogami ciągłego czasu procesów AR .

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Myślę, że uczciwie jest powiedzieć, że powszechną praktyką w przypadku obserwacji w nieregularnych punktach czasowych jest budowanie ciągłego modelu stochastycznego w czasie.

NRH
źródło
1
GARCH nie jest procesem zmienności stochastycznej. Objętość w GARCH jest całkowicie określona dla tego okresu na podstawie obserwacji z poprzednich okresów.
Aksakal
11

W przypadku szeregów czasowych o nieregularnych odstępach łatwo jest zbudować filtr Kalmana .

Jest to papier, jak przenieść ARIMA w postaci przestrzeni stanów tutaj

I jeden artykuł, który porównuje Kalmana do GARCH tutaj(1)

(1) Choudhry, Taufiq i Wu, Hao (2008)
Zdolność prognozowania metody filtrowania GARCH w porównaniu z metodą Kalmana: dowody z codziennej wersji beta zmieniającej się w czasie w Wielkiej Brytanii.
Journal of Forecasting , 27, (8), 670-689. (doi: 10.1002 / for.1096).

bdecaf
źródło
Przepraszam, nie mam dostępu do tego ostatniego artykułu, czy możesz mi pomóc?
Kwarc
2
Dodałem cytat, aby łatwo było go znaleźć - tutaj jest też przedruk: eprints.soton.ac.uk/147383
bdecaf
Artykuł o przeniesieniu ARIMI do przestrzeni stanów wydaje się mieć zerwane łącze.
ofey73
9

Kiedy szukałem sposobu pomiaru wielkości wahań w nieregularnie próbkowanych danych, natknąłem się na te dwa artykuły na temat wygładzania wykładniczego nieregularnych danych Cipry [ 1 , 2 ]. Opierają się one dalej na technikach wygładzania Browna, Wintersa i Holta (patrz artykuł Wikipedii dotyczący Wygładzania wykładniczego ) oraz na innej metodzie Wrighta (patrz artykuł dla odniesienia). Metody te nie zakładają wiele o podstawowym procesie, a także działają w przypadku danych pokazujących wahania sezonowe.

Nie wiem, czy którykolwiek z nich liczy się jako „złoty standard”. Dla własnego celu postanowiłem zastosować dwukierunkowe (pojedyncze) wygładzanie wykładnicze zgodnie z metodą Browna. Wpadłem na pomysł, aby dwukierunkowo wygładzić, czytając streszczenie do artykułu dla studentów (którego nie mogę teraz znaleźć).

Ivana
źródło
7

Analiza szeregów czasowych nieregularnie próbowanych może być trudna, ponieważ nie ma wielu dostępnych narzędzi. Czasami praktyką jest stosowanie regularnych algorytmów i nadzieja na najlepsze. To niekoniecznie najlepsze podejście. Innym razem ludzie próbują interpolować dane w lukach. Widziałem nawet przypadki, w których luki są wypełnione losowymi liczbami, które mają taki sam rozkład jak znane dane. Jednym z algorytmów specjalnie dla szeregów nieregularnych jest Periodogram Lomb-Scargle, który daje periodogram (myśl spektrum mocy) dla nierównomiernie próbkowanych szeregów czasowych. Lomb-Scargle nie wymaga „warunkowania szczelin”.

cwkulp
źródło
3

Jeśli chcesz „lokalnego” modelu w dziedzinie czasu - w przeciwieństwie do szacowania funkcji korelacji lub widm mocy), powiedz, aby wykryć i scharakteryzować przejściowe impulsy, skoki i tym podobne - algorytm bloku bayesowskiego może być przydatny. Zapewnia optymalną, stałą, cząstkową reprezentację szeregów czasowych w dowolnym trybie danych i przy arbitralnym (nierównomiernym) próbkowaniu w odstępach. Widzieć

„Badania w astronomicznej analizie szeregów czasowych. VI. Reprezentacje bloków bayesowskich”, Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Astrophysical Journal, tom 764, 167, 26 s. (2013). http://arxiv.org/abs/1207.5578

Jeff Scargle
źródło
2

RJMartin, „Nieregularnie próbkowane sygnały: teorie i techniki analizy”, praca doktorska, UCL, 1998, dostępna online. Rozdział 4 dotyczy modeli autoregresyjnych i rozwija temat z ciągłej perspektywy czasowej, jak powiedzieli inne posty.

Richard Martin
źródło
1

Sekcja 4.10 J.Durbin, SJKoopman, Analiza szeregów czasowych metodą State Space Methods , wydanie 2, 2012, poświęcona jest modelowaniu w warunkach brakujących obserwacji.

Jan Galkowski
źródło
1

W analizie danych przestrzennych przez większość czasu próbkuje się nieregularnie w przestrzeni. Jednym z pomysłów byłoby sprawdzenie, co się tam dzieje i wdrożenie estymacji wariogramu, krigowania itd. Dla jednowymiarowej dziedziny „czasu”. Wariogramy mogą być interesujące nawet dla regularnie rozmieszczonych danych szeregów czasowych, ponieważ mają inne właściwości niż funkcja autokorelacji oraz są zdefiniowane i znaczące nawet dla danych niestacjonarnych.

Oto jeden artykuł (po hiszpańsku), a tu drugi.

kjetil b halvorsen
źródło