Jaki jest model szeregów czasowych do prognozowania procentu związanego (0,1)?

10

To musi się pojawić --- prognozowanie rzeczy, które utknęły między 0 a 1.

W mojej serii podejrzewam, że jest to komponent auto-regresji, a także komponent odwracający średnie, więc chcę czegoś, co mogę interpretować jak ARIMA --- ale nie chcę, aby w przyszłości spadło do 1000% .

Czy używasz modelu ARIMA jako parametru w regresji logistycznej, aby ograniczyć wynik od 0 do 1?

Lub dowiedziałem się tutaj, że regresje Beta są bardziej odpowiednie dla danych (0,1). Jak zastosowałbym to do szeregów czasowych? Czy istnieją dobre pakiety R lub funkcje Matlab, które ułatwiają dopasowanie i prognozowanie?

Mittenchops
źródło
Mógłbym zacząć od oszacowania modelu typu logit / probit przez włączenie opóźnień. Uważam jednak, że w tego typu modelach występują problemy z korektą autokorelacji, dlatego wahałbym się wyciągać wnioski statystyczne.
Jan

Odpowiedzi:

2

W mojej rozprawie doktorskiej w Stanford w 1978 roku zbudowałem rodzinę procesu autoregresji pierwszego rzędu o jednolitych rozkładach krańcowych na [0,1] Dla dowolnej liczby całkowitej r2) pozwolić X(t)=X(t-1)/r+mi(t) gdzie mi(t) ma następujący dyskretny rozkład równomierny P.(mi(t)=k/r)=1/r dla k=0,1,...,r-1. Ciekawe, że mimo tomi(t) jest dyskretny X(t) ma ciągły jednolity rozkład na [0,1] jeśli zaczniesz zakładać X(0) jest jednolity [0,1]. Później Richard Davis i ja rozszerzyliśmy to na korelację ujemną, tjX(t)=-X(t-1)/r+mi(t). Jest to interesujący przykład stacjonarnego autoregresyjnego szeregu czasowego, który może się różnić0 i 1 jak wskazał OP, jest nim zainteresowany. Jest to nieco patologiczny przypadek, ponieważ chociaż maksimum sekwencji spełnia skrajny limit wartości podobny do limitu dla mundurów IID, ma on wskaźnik ekstremalności mniejszy niż 1. W mojej pracy magisterskiej i Kronikach prawdopodobieństwa pokazałem, że wskaźnik ekstremalny był(r-1)/r. Nie mówiłem o nim jako o wskaźniku ekstremalnym, ponieważ termin ten został ukuty później przez Leadbettera (przede wszystkim wspomniany w jego tekście Springera z 1983 r. Wspólnie z Rootzenem i Lindgrenem). Nie wiem, czy ten model ma wiele praktycznych zalet. Myślę, że prawdopodobnie nie, ponieważ rozkład hałasu jest tak osobliwy. Ale służy to jako nieco patologiczny przykład.

Michael R. Chernick
źródło
1

Zapytałem o to dawno temu, ale SO po prostu wyskoczyło z powrotem. W przypadku, na który patrzyłem, zakończyłem prognozowanie licznika i mianownika osobno, co i tak miało więcej sensu dla metryki.

Mittenchops
źródło