Grałem z niektórymi jednostkowymi testami root w R i nie jestem do końca pewien, co zrobić z parametrem k lag. Użyłem rozszerzonego testu Dickeya Fullera i testu Philippsa Perrona z pakietu terser . Oczywiście domyślny parametr (dla ) zależy tylko od długości serii. Jeśli wybiorę inne wartości K , otrzymam całkiem inne wyniki wrt. odrzucając null:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
plus wynik testu PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Jakieś wskazówki?
r
time-series
trend
hans0l0
źródło
źródło
Odpowiedzi:
Minęło trochę czasu, odkąd spojrzałem na testy ADF, ale pamiętam co najmniej dwie wersje testu ADF.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
Pakiet fUnitRoots ma funkcję o nazwie adfTest (). Myślę, że problem „trendu” jest różnie traktowany w tych pakietach.
Edytuj ------ Na stronie 14 poniższego linku były 4 wersje testu UFOT:
http://math.uncc.edu/~zcai/FinTS.pdf
Jeszcze jeden link. Przeczytaj sekcję 6.3 w następującym linku. Wykonywanie znacznie lepszej pracy niż wyjaśnienie terminu opóźnienia:
http://www.yats.com/doc/cointegration-en.html
Ponadto byłbym ostrożny z każdym modelem sezonowym. O ile nie masz pewności, że występuje sezonowość, unikałbym używania warunków sezonowych. Dlaczego? Wszystko można podzielić na sezonowe, nawet jeśli nie jest. Oto dwa przykłady:
Poniższy wykres pochodzi z powyższej instrukcji wykresu (x.stl). stl () znalazł mały termin sezonowy w białym szumie. Można powiedzieć, że ten termin jest tak mały, że tak naprawdę nie stanowi problemu. Problem polega na tym, że w rzeczywistych danych nie wiesz, czy ten termin jest problemem, czy nie. W poniższym przykładzie zauważ, że seria danych trendów ma segmenty, w których wygląda jak przefiltrowana wersja surowych danych, oraz inne segmenty, w których można uznać, że różnią się znacznie od danych surowych.
źródło
Parametr k jest zestawem opóźnień dodanych do szeregowej korelacji adresu. A w ADF oznacza, że test jest powiększony przez dodanie opóźnień. Wyboru liczby opóźnień w ADF można dokonać na wiele sposobów. Powszechnym sposobem jest rozpoczęcie od dużej liczby opóźnień wybranych a priori i zmniejszenie liczby opóźnień sekwencyjnie, aż najdłuższe opóźnienie stanie się statystycznie znaczące.
Możesz przetestować korelację szeregową w resztkach po zastosowaniu opóźnień w ADF.
źródło