Pomyłka z rozszerzonym testem Dickeya Fullera

16

Ja pracuje na danych przedstawionych electricitydostępny w pakiecie R TSA. Moim celem jest sprawdzenie, czy arimamodel będzie odpowiedni dla tych danych i ostatecznie je dopasuje. Postępowałem więc następująco:

1. Wykreśl szereg czasowy, który powstał, jeśli następujący wykres: ts plot1

2.: Chciałem wziąć logarytm, electricityaby ustabilizować wariancję, a następnie odpowiednio różnicować szereg, ale tuż przed tym, przetestowałem stacjonarność na oryginalny zestaw danych przy użyciu adftestu (Augmented Dickey Fuller) i, co zaskakujące, wynik był następujący:

Kod i wyniki:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Cóż, według mojego początkującego pojęcia szeregów czasowych, przypuszczam, że oznacza to, że dane są nieruchome (mała wartość p, odrzucenie zerowej hipotezy niestacjonarności). Ale patrząc na fabułę ts, nie znajduję żadnego sposobu, aby to mogło być stacjonarne. Czy ktoś ma na to ważne wyjaśnienie?

Vara
źródło
5
ADF sprawdza tylko stacjonarne urządzenie główne, może to być trend stacjonarny. Dlatego powinieneś użyć testu KPSS, patrz stats.stackexchange.com/questions/30569/… Ogólnie rzecz biorąc, istnieje różnica między modelami DS (różnica stacjonarna) i TS (trend stacjonarna). KPSS jest lepszym testem do rozróżnienia między tymi modelami, zobacz link po więcej szczegółów.
Stat Tistician
3
Wygląda na to, że seria ma sezonowe trendy. Włącz do testu ADF trend deterministyczny + sezonowe manekiny i przeprowadź test. Sprawdź także pozostałości autokorelowane.
Pantera

Odpowiedzi:

12

adf.testxt-xt-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary
horaceT
źródło
2

Zakładając, że „adf.test” naprawdę pochodzi z pakietu „tseries” (bezpośrednio lub pośrednio), przyczyną byłoby automatyczne uwzględnienie liniowego trendu czasowego. Z dokumentu tseries (wersja 0.10-35): „Stosuje się ogólne równanie regresji, które zawiera stałą i trend liniowy [...]” Tak więc wynik testu rzeczywiście wskazuje na stacjonarność trendu (który pomimo nazwy nie jest stacjonarny).

Zgadzam się również z Panterą, że efekty sezonowe mogą zniekształcić wynik. Szereg ten może w rzeczywistości być trendem czasowym + sezonistycznymi determinantami + procesem stochastycznego pierwiastka, ale test ADF może błędnie interpretować wahania sezonowe jako stochastyczne odwrócenie trendu deterministycznego, co oznaczałoby korzenie mniejsze niż jedność. (Z drugiej strony, biorąc pod uwagę, że uwzględniono wystarczającą liczbę opóźnień, powinno to raczej pokazywać się jako (fałszywe) pierwiastki jednostkowe przy częstotliwościach sezonowych, a nie częstotliwości zerowej / długoterminowej, na którą patrzy test ADF. W każdym razie, biorąc pod uwagę wzór sezonowy lepiej jest uwzględnić sezonowe).

Sven S.
źródło