Czy ktoś może wyjaśnić funkcję autokorelacji w danych szeregów czasowych? Po zastosowaniu acf do danych, jaka byłaby aplikacja?
autocorrelation
użytkownik1471980
źródło
źródło
Odpowiedzi:
W przeciwieństwie do zwykłych danych z próbkowania, uporządkowane są dane szeregów czasowych. Dlatego istnieją dodatkowe informacje na temat próbki, które można wykorzystać, jeśli istnieją przydatne wzory czasowe. Funkcja autokorelacji jest jednym z narzędzi używanych do wyszukiwania wzorców w danych. W szczególności funkcja autokorelacji informuje o korelacji między punktami oddzielonymi różnymi opóźnieniami czasowymi. Jako przykład podajemy kilka możliwych wartości funkcji acf dla serii z dyskretnymi przedziałami czasowymi:
Notacją jest ACF (n = liczba przedziałów czasowych między punktami) = korelacja między punktami oddzielonymi n przedziałami czasowymi. Podam przykłady pierwszych kilku wartości n.
ACF (0) = 1 (wszystkie dane są idealnie skorelowane ze sobą), ACF (1) =. 9 (korelacja między punktem a następnym punktem wynosi 0,9), ACF (2) =. 4 (korelacja między punktem a punkt dwa kroki do przodu to 0,4) ... itd.
Tak więc ACF informuje, jak skorelowane są ze sobą punkty, w oparciu o liczbę kroków czasowych, którymi są oddzielone. Na tym polega istota autokorelacji, czyli jak skorelowane przeszłe punkty danych są z przyszłymi punktami danych dla różnych wartości rozdziału czasu. Zazwyczaj można oczekiwać, że funkcja autokorelacji spadnie w kierunku 0, ponieważ punkty stają się bardziej rozdzielone (tj. N staje się duże w powyższej notacji), ponieważ generalnie trudniej jest przewidzieć przyszłość w oparciu o dany zestaw danych. To nie jest reguła, ale jest typowa.
Teraz do drugiej części ... dlaczego nas to obchodzi? ACF i jego siostrzana funkcja, częściowafunkcja autokorelacji (więcej o tym za chwilę), są stosowane w podejściu modelowania Boxa-Jenkinsa / ARIMA w celu ustalenia, w jaki sposób przeszłe i przyszłe punkty danych są powiązane w szeregach czasowych. Częściową funkcję autokorelacji (PACF) można uznać za korelację między dwoma punktami oddzielonymi pewną liczbą okresów n, ALE z efektem usuniętych korelacji pośrednich. Jest to ważne, ponieważ powiedzmy, że w rzeczywistości każdy punkt danych jest tylko bezpośrednio skorelowany z punktem danych NASTĘPNY i żaden inny. Pojawi się jednak tak, jakby bieżący punkt był skorelowany z punktami w przyszłości, ale tylko z powodu efektu typu „reakcji łańcuchowej”, tj. T1 jest bezpośrednio skorelowany z T2, który jest bezpośrednio skorelowany z T3, więc WYGLĄDA jak T1 jest bezpośrednio skorelowane z T3. PACF usunie pośrednią korelację z T2, abyś mógł lepiej rozpoznać wzorce. Ładne wprowadzenie do tego jest tutaj.
Podręcznik NIST Engineering Statistics, online, zawiera również rozdział na ten temat oraz przykładową analizę szeregów czasowych z wykorzystaniem autokorelacji i autokorelacji częściowej. Nie powielę go tutaj, ale przejrzyjmy go i powinniście lepiej zrozumieć autokorelację.
źródło
pozwól, że dam ci inną perspektywę.
wykreśl opóźnione wartości szeregu czasowego z bieżącymi wartościami szeregu czasowego.
jeśli wykres, który widzisz, jest liniowy, oznacza to zależność liniową między bieżącymi wartościami szeregu czasowego a opóźnionymi wartościami szeregu czasowego.
wartości autokorelacji są najbardziej oczywistym sposobem pomiaru liniowości tej zależności.
źródło