Jak interpretować te wykresy acf i pacf

20

Poniżej przedstawiono wykresy acf i pacf miesięcznych serii danych. Drugi wykres to acf z ci.type = 'ma':

wprowadź opis zdjęcia tutaj

Utrzymywanie się wysokich wartości na wykresie acf prawdopodobnie reprezentuje długoterminowy pozytywny trend. Pytanie brzmi, czy odzwierciedla to sezonowość?

Próbowałem zobaczyć różne strony na ten temat, ale nie jestem pewien, czy te wątki pokazują sezonowość.

Analiza wykresów ACF i PACF

Pomóż w interpretacji wykresów ACF i PACF

Pomóż zrozumieć poniższy obraz ACF

Autokorelacja i częściowa interpretacja autokorelacji

Edycja: poniżej znajduje się wykres dla opóźnienia do 60:

wprowadź opis zdjęcia tutaj

Poniżej przedstawiono wykresy diff (my_series):

wprowadź opis zdjęcia tutaj

I upto lag 60:

wprowadź opis zdjęcia tutaj

Edycja: Te dane pochodzą z: Czy jest to odpowiednia metoda testowania sezonowości w danych dotyczących liczby samobójstw? Tutaj autorzy nie wzięli pod uwagę fabuły acf i pacf oryginalnych lub zróżnicowanych serii, o których warto wspomnieć (więc nie musi to być ważne). Tylko wykresy reszt acf / pacf zostały przywołane w kilku miejscach.

rnso
źródło
1
Czy możesz dodać coś o swoich danych (np. Podstawowy wykres)? Próbowałeś czegoś takiego stl()?
Gung - Przywróć Monikę
Próbuję zrozumieć, jak określić sezonowość na podstawie wykresów acf i pacf. Czy do tego niezbędny jest przegląd podstawowej fabuły lub STL? Czy nie możemy ustalić czegoś na podstawie tych fabuł?
rnso 18.04.15
1
Tak będzie dobrze. Dla jasności twoje pytanie tak naprawdę nie dotyczy tego, co dzieje się z twoimi danymi, ale dotyczy tego, co można zrozumieć z tych wykresów w oderwaniu, prawda?
Gung - Przywróć Monikę
1
Tak. Często muszę ustalić, czy w moich danych występuje sezonowość, więc chcę zrozumieć, jakie informacje mogę uzyskać z wykresów acf i pacf. Wykresy funkcji stl są dość łatwe do zrozumienia, ale nie te wykresy.
rnso 18.04.15
Twoje dane rzeczywiście mają pewną sezonowość. Proszę zobaczyć moją odpowiedź na @javlacalle.
IrishStat,

Odpowiedzi:

9

patrzenie na wykresy w celu próby zaszufladkowania danych do odgadniętego modelu arimy działa dobrze, gdy 1: Nie ma wartości odstających / pulsów / przesunięć poziomów, trendów czasu lokalnego i brak sezonowych deterministycznych pulsów w danych ORAZ 2) gdy model arimy ma stałe parametry w czasie ORAZ 3) gdy wariancja błędu z modelu arima ma stałą wariancję w czasie. Kiedy te trzy rzeczy obowiązują .... w większości zestawów danych podręczników prezentujących łatwość modelowania arima. Kiedy 1 lub więcej z 3 nie jest przechowywanych ... w każdym prawdziwym zestawie danych, jaki kiedykolwiek widziałem. Prosta odpowiedź na twoje pytanie wymaga dostępu do oryginalnych faktów (danych historycznych), a nie dodatkowych informacji opisowych na twoich działkach. Ale to tylko moja opinia!

Zredagowane po otrzymaniu danych:

Byłem na greckich wakacjach (właściwie robiłem coś innego niż analiza szeregów czasowych) i nie byłem w stanie przeanalizować DANYCH o samobójstwie, ale w połączeniu z tym postem. Teraz jest słuszne i słuszne, że przesyłam analizę w celu śledzenia / udowodnienia na przykład moich komentarzy na temat strategii identyfikacji modeli wieloetapowych i wad prostej analizy wizualnej prostych wykresów korelacji, ponieważ „dowód jest w puddingu”.

Oto ACF oryginalnych danych wprowadź opis zdjęcia tutajPACF oryginalnej serii wprowadź opis zdjęcia tutaj. AUTOBOX http://www.autobox.com/cms/ oprogramowanie, które pomogłem opracować, wykorzystuje heurystykę do identyfikacji modelu początkowego W tym przypadku ustalono, że początkowo zidentyfikowano model wprowadź opis zdjęcia tutaj. Kontrola diagnostyczna reszt z tego modelu sugerowała pewne powiększenie modelu przy użyciu przesunięcia poziomu, impulsów i impulsu sezonowego. Zauważ, że przesunięcie poziomu jest wykrywane w okresie około 164 lub w przybliżeniu, co jest prawie identyczne z wcześniejszym wnioskiem o okresie 176 z okresu przedpremierowego. Wszystkie drogi nie prowadzą do Rzymu, ale niektóre mogą cię zbliżyć!wprowadź opis zdjęcia tutaj. Testowanie stałości parametrów odrzucało zmiany parametrów w czasie. Po sprawdzeniu deterministycznych zmian wariancji błędu stwierdzono, że nie wykryto żadnych deterministycznych zmian wariancji błędu. wprowadź opis zdjęcia tutaj. Test Box-Coxa na potrzebę transformacji mocy był pozytywny z wnioskiem, że transformacja logarytmiczna była konieczna. wprowadź opis zdjęcia tutaj. Ostateczny model jest tutaj wprowadź opis zdjęcia tutaj. Resztki z ostatecznego modelu wydają się być wolne od autokorelacji wprowadź opis zdjęcia tutaj. Fabuła końcowych reszt modeli wydaje się być wolna od jakichkolwiek naruszeń Gaussa wprowadź opis zdjęcia tutaj. Fabuła Rzeczywiste / Dopasowane / Prognozy jest tutaj wprowadź opis zdjęcia tutajz prognozami tutajwprowadź opis zdjęcia tutaj

IrishStat
źródło
Dziękuję za odpowiedź. Czy te założenia są tak ważne i zawsze tak lekceważone w rzeczywistych danych, że wykresy acf i pacf prawie nigdy nie mogą być interpretowane osobno?
rnso
Nienawidzę mówić nigdy, ALE założenia, które przedstawiłem, poważnie skomplikowałyby proces identyfikacji wizualnej, gdyby zostały naruszone. Twój zestaw danych wyraźnie (moim starym oczom) jest tego przykładem. Zidentyfikowanie modelu początkowego, oszacowanie i ponowna identyfikacja na podstawie diagnostyki szczątkowej jest procesem wieloetapowym, a nie jednym, i WYJĄTKIEM w trywialnych przypadkach.
IrishStat,
Powtórzmy jeszcze raz, śledząc mojego przyjaciela stats.stackexchange.com/users/48766/javlacalle : Konieczne jest również sprawdzenie obecności pulsów i przesunięć poziomu ORAZ pulsów sezonowych ORAZ lokalnych trendów czasowych ORAZ stałości wariancji błędów.
IrishStat
(+1) Dobra analiza danych. A co z pierwotnym pytaniem? czy w danych można zidentyfikować sezonowość? Być może można to wywnioskować z wyświetlanych wyników, ale nie mogłem tego rozgryźć.
javlacalle,
sezonowość występuje w ujęciu AR (12) w modelu ARIMA oraz w impulsie sezonowym rozpoczynającym się w okresie 98 (2003/2)
IrishStat
10

Interpretacja ACF i PACF

Powolny zanik funkcji autokorelacji sugeruje, że dane przechodzą proces długiej pamięci. Czas trwania wstrząsów jest stosunkowo trwały i wpływa na dane przed kilkoma obserwacjami. Prawdopodobnie znajduje to odzwierciedlenie w gładkich trendach w danych.

ACF i PACF rzędu 12 wykraczają poza przedziały ufności istotności. Nie musi to jednak oznaczać obecności możliwego do zidentyfikowania wzoru sezonowego. ACF i PACF innych zamówień sezonowych (24, 36, 48, 60) mieszczą się w przedziałach ufności. Na podstawie grafiki nie można stwierdzić, czy znaczenie ACF i PACF rzędu 12 wynika z sezonowości czy przejściowych fluktuacji.

Wspomniana wcześniej trwałość ACF sugeruje, że pierwsze różnice mogą być potrzebne do unieruchomienia danych. Jednak ACF / PACF z różnej serii wyglądają podejrzanie, korelacja ujemna mogła zostać wywołana przez filtr różnicujący i może nie być w rzeczywistości odpowiednia. Zobacz ten post, aby uzyskać szczegółowe informacje.

Ustal, czy występuje sezonowość

Analiza ACF i PACF powinna zostać uzupełniona innymi narzędziami, na przykład:

  • Widmo (widok na ACF w dziedzinie częstotliwości) może ujawnić okresowość cykli, które wyjaśniają większość zmienności danych.
  • Dopasuj podstawowy strukturalny model szeregów czasowych i sprawdź, czy wariancja składnika sezonowego jest bliska zeru w stosunku do innych parametrów (w funkcji R stats::StructTSi pakiet stsm ).
  • Testy sezonowości oparte na manekinach sezonowych, cyklach sezonowych lub opisanych i wdrożonych w X-12 .
  • Sprawdzanie obecności pulsów i przesunięć poziomów, jak wspomniano w IrishStat, jest również konieczne, ponieważ mogą one zniekształcać wnioski z poprzednich metod (w R pakiet tsoutliers może być przydatny do tego celu).
javlacalle
źródło
Dodałem fabułę do opóźnienia 60. Jakie byłoby polecenie R, aby uzyskać „zróżnicowaną serię”? Dodam wykresy dla diff (my_series).
rnso 18.04.15
@ mso Dodałem poważne zmiany do mojej poprzedniej odpowiedzi. Polecenie dla zróżnicowanej serii jest funkcją diff, której użyłeś.
javlacalle,
javlacalle - były dwa bardzo podobne akapity i @rnso próbował pomóc, usuwając jeden. Usunąłem coś, co myślę, że chciałeś zastąpić. Czy możesz sprawdzić, czy poprawny akapit został usunięty?
Glen_b
@Glen_b dzięki za edycję, wprowadziłem kilka zmian.
javlacalle,
@ javlacalle, @IrishStat: proszę zobaczyć edycję mojego pytania dotyczącą oryginalnych danych.
rnso