Co to jest funkcja autokorelacji?

16

Czy ktoś może wyjaśnić funkcję autokorelacji w danych szeregów czasowych? Po zastosowaniu acf do danych, jaka byłaby aplikacja?

użytkownik1471980
źródło
W kontekście szeroko rozumianych stacjonarnych szeregów czasowych daje miarę zależności szeregu czasowego od jego wersji opóźnionej.
Cagdas Ozgenc
1
jest miarą tego, na ile na bieżącą wartość mają wpływ poprzednie wartości w szeregu czasowym.
htrahdis
@htrahdis Podobnie jak w standardowych ustawieniach regresji, wystrzegaj się łączenia korelacji z wpływem (lub związku przyczynowego).
whuber
@Andy Ten wątek rzeczywiście wygląda podobnie - dziękuję za jego zlokalizowanie - ale zaakceptowana (i jedyna) odpowiedź nie odnosi się bezpośrednio do tego pytania: koncentruje się na konkretnym pliku ACF. Jako taki stanowi ilustrację, w jaki sposób można interpretować acf, ale nie jest dla mnie jasne, czy którykolwiek z tych materiałów odpowiada na niniejsze żądanie ogólnego wyjaśnienia ACF.
whuber

Odpowiedzi:

31

W przeciwieństwie do zwykłych danych z próbkowania, uporządkowane są dane szeregów czasowych. Dlatego istnieją dodatkowe informacje na temat próbki, które można wykorzystać, jeśli istnieją przydatne wzory czasowe. Funkcja autokorelacji jest jednym z narzędzi używanych do wyszukiwania wzorców w danych. W szczególności funkcja autokorelacji informuje o korelacji między punktami oddzielonymi różnymi opóźnieniami czasowymi. Jako przykład podajemy kilka możliwych wartości funkcji acf dla serii z dyskretnymi przedziałami czasowymi:

Notacją jest ACF (n = liczba przedziałów czasowych między punktami) = korelacja między punktami oddzielonymi n przedziałami czasowymi. Podam przykłady pierwszych kilku wartości n.

ACF (0) = 1 (wszystkie dane są idealnie skorelowane ze sobą), ACF (1) =. 9 (korelacja między punktem a następnym punktem wynosi 0,9), ACF (2) =. 4 (korelacja między punktem a punkt dwa kroki do przodu to 0,4) ... itd.

Tak więc ACF informuje, jak skorelowane są ze sobą punkty, w oparciu o liczbę kroków czasowych, którymi są oddzielone. Na tym polega istota autokorelacji, czyli jak skorelowane przeszłe punkty danych są z przyszłymi punktami danych dla różnych wartości rozdziału czasu. Zazwyczaj można oczekiwać, że funkcja autokorelacji spadnie w kierunku 0, ponieważ punkty stają się bardziej rozdzielone (tj. N staje się duże w powyższej notacji), ponieważ generalnie trudniej jest przewidzieć przyszłość w oparciu o dany zestaw danych. To nie jest reguła, ale jest typowa.

Teraz do drugiej części ... dlaczego nas to obchodzi? ACF i jego siostrzana funkcja, częściowafunkcja autokorelacji (więcej o tym za chwilę), są stosowane w podejściu modelowania Boxa-Jenkinsa / ARIMA w celu ustalenia, w jaki sposób przeszłe i przyszłe punkty danych są powiązane w szeregach czasowych. Częściową funkcję autokorelacji (PACF) można uznać za korelację między dwoma punktami oddzielonymi pewną liczbą okresów n, ALE z efektem usuniętych korelacji pośrednich. Jest to ważne, ponieważ powiedzmy, że w rzeczywistości każdy punkt danych jest tylko bezpośrednio skorelowany z punktem danych NASTĘPNY i żaden inny. Pojawi się jednak tak, jakby bieżący punkt był skorelowany z punktami w przyszłości, ale tylko z powodu efektu typu „reakcji łańcuchowej”, tj. T1 jest bezpośrednio skorelowany z T2, który jest bezpośrednio skorelowany z T3, więc WYGLĄDA jak T1 jest bezpośrednio skorelowane z T3. PACF usunie pośrednią korelację z T2, abyś mógł lepiej rozpoznać wzorce. Ładne wprowadzenie do tego jest tutaj.

Podręcznik NIST Engineering Statistics, online, zawiera również rozdział na ten temat oraz przykładową analizę szeregów czasowych z wykorzystaniem autokorelacji i autokorelacji częściowej. Nie powielę go tutaj, ale przejrzyjmy go i powinniście lepiej zrozumieć autokorelację.


źródło
2

pozwól, że dam ci inną perspektywę.

wykreśl opóźnione wartości szeregu czasowego z bieżącymi wartościami szeregu czasowego.

jeśli wykres, który widzisz, jest liniowy, oznacza to zależność liniową między bieżącymi wartościami szeregu czasowego a opóźnionymi wartościami szeregu czasowego.

wartości autokorelacji są najbardziej oczywistym sposobem pomiaru liniowości tej zależności.

htrahdis
źródło