Ja pracuje na danych przedstawionych electricity
dostępny w pakiecie R TSA
. Moim celem jest sprawdzenie, czy arima
model będzie odpowiedni dla tych danych i ostatecznie je dopasuje. Postępowałem więc następująco:
1. Wykreśl szereg czasowy, który powstał, jeśli następujący wykres:
2.: Chciałem wziąć logarytm, electricity
aby ustabilizować wariancję, a następnie odpowiednio różnicować szereg, ale tuż przed tym, przetestowałem stacjonarność na oryginalny zestaw danych przy użyciu adf
testu (Augmented Dickey Fuller) i, co zaskakujące, wynik był następujący:
Kod i wyniki:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Cóż, według mojego początkującego pojęcia szeregów czasowych, przypuszczam, że oznacza to, że dane są nieruchome (mała wartość p, odrzucenie zerowej hipotezy niestacjonarności). Ale patrząc na fabułę ts, nie znajduję żadnego sposobu, aby to mogło być stacjonarne. Czy ktoś ma na to ważne wyjaśnienie?
źródło
Odpowiedzi:
adf.test
źródło
Zakładając, że „adf.test” naprawdę pochodzi z pakietu „tseries” (bezpośrednio lub pośrednio), przyczyną byłoby automatyczne uwzględnienie liniowego trendu czasowego. Z dokumentu tseries (wersja 0.10-35): „Stosuje się ogólne równanie regresji, które zawiera stałą i trend liniowy [...]” Tak więc wynik testu rzeczywiście wskazuje na stacjonarność trendu (który pomimo nazwy nie jest stacjonarny).
Zgadzam się również z Panterą, że efekty sezonowe mogą zniekształcić wynik. Szereg ten może w rzeczywistości być trendem czasowym + sezonistycznymi determinantami + procesem stochastycznego pierwiastka, ale test ADF może błędnie interpretować wahania sezonowe jako stochastyczne odwrócenie trendu deterministycznego, co oznaczałoby korzenie mniejsze niż jedność. (Z drugiej strony, biorąc pod uwagę, że uwzględniono wystarczającą liczbę opóźnień, powinno to raczej pokazywać się jako (fałszywe) pierwiastki jednostkowe przy częstotliwościach sezonowych, a nie częstotliwości zerowej / długoterminowej, na którą patrzy test ADF. W każdym razie, biorąc pod uwagę wzór sezonowy lepiej jest uwzględnić sezonowe).
źródło