Korzystam z następującego testu root root (Dickey-Fuller) na szeregu czasowym, używając ur.df()
funkcji w urca
pakiecie.
Polecenie to:
summary(ur.df(d.Aus, type = "drift", 6))
Dane wyjściowe to:
###############################################
# Augmented Dickey-Fuller Test Unit Root Test #
###############################################
Test regression drift
Call:
lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)
Residuals:
Min 1Q Median 3Q Max
-0.266372 -0.036882 -0.002716 0.036644 0.230738
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.001114 0.003238 0.344 0.73089
z.lag.1 -0.010656 0.006080 -1.753 0.08031 .
z.diff.lag1 0.071471 0.044908 1.592 0.11214
z.diff.lag2 0.086806 0.044714 1.941 0.05279 .
z.diff.lag3 0.029537 0.044781 0.660 0.50983
z.diff.lag4 0.056348 0.044792 1.258 0.20899
z.diff.lag5 0.119487 0.044949 2.658 0.00811 **
z.diff.lag6 -0.082519 0.045237 -1.824 0.06874 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.06636 on 491 degrees of freedom
Multiple R-squared: 0.04211, Adjusted R-squared: 0.02845
F-statistic: 3.083 on 7 and 491 DF, p-value: 0.003445
Value of test-statistic is: -1.7525 1.6091
Critical values for test statistics:
1pct 5pct 10pct
tau2 -3.43 -2.86 -2.57
phi1 6.43 4.59 3.78
Co oznaczają kody istotności (kody znaczące)? Zauważyłem, że niektóre z nich zostały napisane przeciwko: z.lag.1, z.diff.lag.2, z.diff.lag.3 (kod znaczenia „.”) I z.diff.lag.5 („ ** „kod istotności).
Dane wyjściowe dają mi dwie (2) wartości statystyki testowej: -1,7525 i 1,6091. Wiem, że statystyki testu ADF są pierwsze (tj. -1,7525). Jaki jest zatem drugi?
Wreszcie, aby przetestować hipotezę o pierwiastku jednostkowym na poziomie istotności 95%, muszę porównać moją statystykę testową ADF (tj. -1,7525) z wartością krytyczną, którą normalnie otrzymuję z tabeli. Wydaje się, że dane wyjściowe przekazują mi krytyczne wartości. Pytanie jednak brzmi: jaką wartość krytyczną między „tau2” a „phi1” powinienem użyć.
Dziękuję za odpowiedź.
źródło
Odpowiedzi:
Wygląda na to, że twórcy tego konkretnego polecenia R zakładają, że znają oryginalne formuły Dickeya-Fullera, więc nie dostarczyli odpowiedniej dokumentacji dotyczącej interpretacji wartości. Przekonałem się, że Enders był niezwykle pomocnym źródłem (Applied Econometric Time Series 3e, 2010, s. 206-209 - Myślę, że inne edycje też byłyby w porządku). Poniżej wykorzystam dane z pakietu URCA, na przykład rzeczywisty dochód w Danii.
Przydałoby się najpierw opisać 3 różne formuły zastosowane przez Dickeya-Fullera do uzyskania różnych hipotez, ponieważ pasują one do opcji „typ” ur.df. Enders określa, że we wszystkich tych 3 przypadkach zastosowanym spójnym terminem jest gamma, współczynnik dla poprzedniej wartości y, termin opóźnienia. Jeśli gamma = 0, oznacza to pierwiastek jednostkowy (chodzenie losowe, niestacjonarne). Gdy hipoteza zerowa wynosi gamma = 0, jeśli p <0,05, to odrzucamy zerową (na poziomie 95%) i zakładamy, że nie ma pierwiastka podstawowego. Jeśli nie odrzucimy wartości zerowej (p> 0,05), zakładamy, że istnieje root jednostek. Stąd możemy przystąpić do interpretacji tau i phi.
Dla typu = „brak” tau (lub tau1 w danych wyjściowych R) jest hipotezą zerową dla gamma = 0. Na przykładzie dochodu z Danii otrzymuję „Wartość statystyki testowej wynosi 0,7944”, a „Wartości krytyczne dla statystyki testowej są : tau1 -2,6 -1,95 -1,61 Biorąc pod uwagę, że statystyki testowe mieszczą się we wszystkich 3 regionach (1%, 5%, 10%), w których nie odrzucamy wartości zerowej, powinniśmy założyć, że dane są losowym spacerem, tzn. że pierwiastek jest obecny. W tym przypadku tau1 odnosi się do hipotezy gamma = 0. „z.lag1” jest składnikiem gamma, współczynnikiem dla opóźnienia (y (t-1)), który wynosi p = 0,431, którego nie odrzucamy jako znaczące, po prostu sugerując, że gamma nie jest statystycznie znacząca dla tego modelu. Oto wynik z R
Termin phi1 odnosi się do drugiej hipotezy, która jest połączoną hipotezą zerową a0 = gamma = 0. Oznacza to, że OBA wartości są testowane jednocześnie na 0. Jeśli p <0,05, odrzucamy zero i zakładamy, że PRZYMNIEJ jeden z nich jest fałszywy - tj. Jeden lub oba terminy a0 lub gamma nie są równe 0. Brak odrzucenia tego null oznacza, że ZARÓWNO a0 ORAZ gamma = 0, sugerując 1), że gamma = 0, dlatego występuje pierwiastek jednostkowy, ORAZ 2) a0 = 0, więc nie ma terminu znoszenia. Oto wyjście R.
(gdzie a2 (t) jest terminem trendu czasowego) Hipotezy (z Enders p. 208) są następujące: tau: gamma = 0 phi3: gamma = a2 = 0 phi2: a0 = gamma = a2 = 0 Jest to podobne do wyjście R. W tym przypadku statystyki testowe wynoszą -2,4216 2,1927 2,9343 We wszystkich tych przypadkach mieszczą się one w strefach „nie odrzucenia zerowej” (patrz wartości krytyczne poniżej). To, co sugeruje tau3, jak powyżej, to to, że nie odrzucamy zerowej wartości root jednostki, co sugeruje, że root jednostki jest obecny. Brak odrzucenia phi3 implikuje dwie rzeczy: 1) gamma = 0 (root root) ORAZ 2) nie ma terminu trendu czasowego, tj. A2 = 0. Gdybyśmy odrzucili to zero, oznaczałoby to, że jeden lub oba z tych warunków nie były równe 0. Brak odrzucenia phi2 implikuje 3 rzeczy: 1) gamma = 0 ORAZ 2) brak wyrażenia trendu czasowego ORAZ 3) brak wyrażenia dryfującego, tj. = 0, że a0 = 0 i że a2 = 0.
Oto wyjście R.
W powyższym konkretnym przykładzie dla danych d.Aus, ponieważ obie statystyki testowe znajdują się w strefie „nie odrzucenia”, oznacza to, że gamma = 0 ORAZ a0 = 0, co oznacza, że istnieje podstawowa jednostka, ale brak terminu znoszenia.
źródło
Jak już wskazano w połączeniu p, kody istotności są dość standardowe i odpowiadają wartościom p, tj. Istotności statystycznej testu hipotez. Wartość p wynosząca 0,01 oznacza, że wniosek jest prawdziwy w granicach 99% pewności.
Artykuł w Wikipedii na temat Dickeya-Fullera opisuje trzy wersje testu Dickeya-Fullera: „pierwiastek jednostkowy”, „pierwiastek jednostkowy ze znoszeniem” i „pierwiastek jednostkowy ze znoszeniem i trendem deterministycznym”, lub to, o czym jest mowa w
urca
dokumentacja jako odpowiednio typ = „brak”, „dryf” i „trend”.Każdy z tych testów jest coraz bardziej złożoną regresją liniową. We wszystkich znajduje się pierwiastek, ale w dryfie występuje również współczynnik dryftu, a w trendzie występuje również współczynnik trendu. Każdy z tych współczynników ma powiązany poziom istotności. Chociaż znaczenie współczynnika pierwiastka jest najważniejsze i jest głównym celem testu DF, możemy być również zainteresowani tym, czy trend / dryf jest statystycznie istotny. Po majstrowaniu przy różnych trybach i sprawdzaniu, które współczynniki pojawiają się / znikają w testach t, byłem w stanie łatwo zidentyfikować, który współczynnik odpowiada testowi t.
Można je zapisać w następujący sposób (ze strony wiki):
źródło
Uznałem, że odpowiedź Jeramy'ego jest dość łatwa do naśladowania, ale ciągle próbuję poprawnie przejść przez logikę i popełniać błędy. Kodowałem funkcję R, która interpretuje każdy z trzech typów modeli i ostrzega, jeśli występują niespójności lub niejednoznaczne wyniki (nie sądzę, aby kiedykolwiek istniały niespójności, jeśli dobrze rozumiem matematykę ADF, ale nadal uważałem sprawdź, czy funkcja ur.df ma jakieś wady).
Proszę spojrzeć. Chętnie przyjmę komentarze / poprawki / ulepszenia.
https://gist.github.com/hankroark/968fc28b767f1e43b5a33b151b771bf9
źródło
interp_urdf(urdf = ur.df(mtcars$mpg, type = "drift"))
Więcej informacji w notatkach z wykładów Rogera Permana na temat testów root root
Patrz także tabela 4.2 w Enders, Applied Econometric Time Series (4e), która podsumowuje różne hipotezy, do których odnoszą się te statystyki testowe. Treść zgadza się z obrazem podanym powyżej.
źródło
bardzo ciekawy post i odpowiedzi. Mam tylko wątpliwości dotyczące tabeli objaśnionej przez user3096626. Które oprogramowanie raportuje w teście ADF generuje wartości
\tau_{\alpha \mu}
,\tau_{\alpha \tau}
i\tau_{\beta \tau}
? Oczywiście R nieźródło
phi1 phi2 phi3 są równoważne testom F w ramach ADF
źródło