Jak się dowiedzieć, czy szereg czasowy jest stacjonarny czy niestacjonarny?

30

Używam R, szukałem w Google i dowiedział się, że kpss.test(), PP.test()iadf.test() są wykorzystywane wiedzieć o stacjonarności szeregów czasowych.

Ale nie jestem statystykiem, który potrafi interpretować swoje wyniki

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

Mam do czynienia z tysiącami szeregów czasowych, uprzejmie mi powiem, jak sprawdzić ilościowo o stacjonarności szeregów czasowych.

Sagar Nikam
źródło

Odpowiedzi:

22

Testowanie, czy seria jest stacjonarna czy niestacjonarna, wymaga rozważenia sekwencji alternatywnych hipotez. Jeden dla każdego wymienionego założenia Gaussa. Należy zrozumieć, że założenia Gaussa dotyczą procesu błędów i nie mają nic wspólnego z ocenianą serią. Jak prawidłowo podsumował StasK, może to obejmować naruszenia stacjonarności, takie jak zmiana średnia, zmiana wariancji, zmiany parametrów modelu w czasie. Na przykład zestaw wartości z tendencją wzrostową byłby na pierwszy rzut oka przykładem szeregu, który w Y nie był stały, podczas gdy reszty z odpowiedniego modelu można opisać jako mające stałą średnią. Zatem pierwotna seria jest niestacjonarna w średniej, ale seria resztkowa jest stacjonarna w swojej średniej. Jeżeli istnieją nieprzekraczalne średnie naruszenia w szeregach resztkowych, takich jak impulsy, przesunięcia poziomu, sezonowe impulsy i / lub lokalne trendy czasowe, wówczas szereg rezydualny (nieleczony) można scharakteryzować jako średnią niestacjonarną, podczas gdy szereg zmiennych wskaźnikowych może być łatwe do wykrycia i włączenia do modelu w celu unieruchomienia resztek modelu w średniej. Teraz, jeśli wariancja oryginalnej serii wykazuje wariancję niestacjonarną, rozsądnie jest zawęzić filtr / model w celu renderowania procesu błędu, który ma stałą wariancję. Podobnie reszty z modelu mogą mieć niestałą wariancję wymagającą jednego z trzech możliwych środków zaradczych - Pulsy sezonowe i / lub lokalne trendy czasowe, wówczas szereg resztkowy (nietraktowany) można scharakteryzować jako średnią niestacjonarną, podczas gdy szereg zmiennych wskaźnikowych można łatwo wykryć i włączyć do modelu, aby uczynić resztki modelu stacjonarne w średniej . Teraz, jeśli wariancja oryginalnej serii wykazuje wariancję niestacjonarną, rozsądnie jest zawęzić filtr / model w celu renderowania procesu błędu o stałej wariancji. Podobnie reszty z modelu mogą mieć niestałą wariancję wymagającą jednego z trzech możliwych środków zaradczych - Pulsy sezonowe i / lub lokalne trendy czasowe, wówczas szereg resztkowy (nietraktowany) można scharakteryzować jako średnią niestacjonarną, podczas gdy szereg zmiennych wskaźnikowych można łatwo wykryć i włączyć do modelu, aby uczynić resztki modelu stacjonarne w średniej . Teraz, jeśli wariancja oryginalnej serii wykazuje wariancję niestacjonarną, rozsądnie jest zawęzić filtr / model w celu renderowania procesu błędu o stałej wariancji. Podobnie reszty z modelu mogą mieć niestałą wariancję wymagającą jednego z trzech możliwych środków zaradczych - Teraz, jeśli wariancja oryginalnej serii wykazuje wariancję niestacjonarną, rozsądnie jest zawęzić filtr / model w celu renderowania procesu błędu o stałej wariancji. Podobnie reszty z modelu mogą mieć niestałą wariancję wymagającą jednego z trzech możliwych środków zaradczych - Teraz, jeśli wariancja oryginalnej serii wykazuje wariancję niestacjonarną, rozsądnie jest zawęzić filtr / model w celu renderowania procesu błędu o stałej wariancji. Podobnie reszty z modelu mogą mieć niestałą wariancję wymagającą jednego z trzech możliwych środków zaradczych -

  1. Ważone najmniejsze kwadraty (szeroko pomijane przez niektórych analityków)
  2. Transformacja mocy w celu oddzielenia wartości oczekiwanej od wariancji błędów możliwych do zidentyfikowania za pomocą testu Box-Cox i / lub
  3. Potrzeba, aby model GARCH uwzględniał strukturę ARIMA widoczną w kwadratowych resztach. Kontynuując, jeśli parametry zmieniają się w czasie LUB forma modelu zmienia się w czasie, stajemy przed potrzebą wykrycia tej cechy i zaradzenia jej albo poprzez segmentację danych, albo wykorzystanie podejścia TAR à la Tong.
IrishStat
źródło
34

yt=sint

yt=yt1+ϵt
yt2)yt-3)z małymi współczynnikami). Jest to prosty model wydajnego rynku finansowego, w którym nie można wykorzystać żadnych informacji do przewidzenia przyszłych zmian cen. Większość ekonomistów uważa, że ​​ich szeregi czasowe pochodzą z modeli ARIMA; te szeregi czasowe mają dobrze zdefiniowane okresy, w których coś się dzieje (miesiąc, kwartał lub rok), więc rzadko staje się gorszy niż zintegrowane szeregi czasowe. Dlatego te testy nie są zaprojektowane dla bardziej złożonych naruszeń stacjonarności, takich jak zmiana średnia, zmiana wariancji, zmiana współczynników autoregresji itp., Chociaż oczywiście opracowano również testy dla tych efektów.

W inżynierii lub naukach przyrodniczych istnieje większe prawdopodobieństwo, że szeregi czasowe napotkają bardziej skomplikowane problemy, takie jak zależność dalekiego zasięgu, integracja ułamkowa, różowy szum itp. Przy braku jasnych wskazówek z opisu procesu dotyczących typowych skal czasowych ( jak często zmiany klimatu?), zwykle bardziej sensowne jest analizowanie danych w dziedzinie częstotliwości (podczas gdy dla ekonomistów dziedzina częstotliwości jest dość jasna: istnieją roczne cykle sezonowe oraz dłuższe 3-4-5 letnie cykle biznesowe ; w przeciwnym razie może wystąpić kilka niespodzianek).

p0,05/(3)M.)M.3)0,05ppp.test(x)$p.value

StasK
źródło
4

Szeregi czasowe są nieruchome, jeśli ich średni poziom i wariancja pozostają stabilne w czasie. Możesz przeczytać więcej na ten temat (ze specyfikacją odpowiednich testów w R), w naszym poście .. http://www.statosphere.com.au/check-time-series-stationary-r/

STAToSphere
źródło
1
Późny komentarz, ale co to znaczy, że ten sposób i wariancja pozostają niezmienne w czasie? Dla danego zestawu danych średnia i wariancja są tym, czym są, prawda? Czy oznacza to, że średnia / zmienna wszystkich podzbiorów danych musi być równa?
Erik Vesterlund
2
Rzuciłem okiem na linkowaną stronę. Stwierdzono, że „Test Ljunga-Boxa sprawdza, czy istnieją znaczące dowody na niezerowe korelacje przy opóźnieniach 1-20. Małe wartości p (tj. Mniejsze niż 0,05) sugerują, że szereg jest stacjonarny”. Wniosek jest po prostu błędny. Zerem jest to, że obserwacje są tam. Odrzucenie wartości null na podstawie małej wartości p wskazuje tylko, że istnieje co najmniej jedno znaczące opóźnienie. Wniosek na stronie internetowej oznaczałby, że stacjonarność wymaga znacznej autokorelacji dla co najmniej jednego opóźnienia. I to nie jest prawda.
random_guy