Po dopasowaniu modelu ARMA do szeregów czasowych często sprawdza się resztki za pomocą testu Portmanteau Ljunga-Boxa (między innymi testami). Test Ljunga-Boxa zwraca wartość ap. Ma parametr h , który jest liczbą opóźnień do przetestowania. Niektóre teksty zalecają użycie h = 20; inni zalecają użycie h = ln (n); większość nie mówi, jakiego h użyć.
Zamiast używać pojedynczej wartości dla h , załóżmy, że wykonuję test Ljunga-Boxa dla wszystkich h <50, a następnie wybieram h, która daje minimalną wartość p. Czy to podejście jest rozsądne? Jakie są zalety i wady? (Jedną oczywistą wadą jest wydłużony czas obliczeń, ale nie stanowi to problemu.) Czy jest na to literatura?
Aby nieco rozwinąć ... Jeśli test daje p> 0,05 dla całego h , to oczywiście szeregi czasowe (reszty) przechodzą test. Moje pytanie dotyczy interpretacji testu, jeśli p <0,05 dla niektórych wartości h, a nie dla innych wartości.
źródło
Odpowiedzi:
Odpowiedź zdecydowanie zależy od: Do czego tak naprawdę próbujemy użyć testu ?Q
Powodem tego jest: być mniej lub bardziej pewnym co do wspólnej statystycznej istotności hipotezy zerowej braku autokorelacji aż do opóźnienia (alternatywnie zakładając, że masz coś zbliżonego do słabego białego szumu ) i zbudować model oszczędny , mając tak mało liczba parametrów, jak to możliwe.h
Zwykle dane szeregów czasowych mają naturalny wzorzec sezonowy, więc praktyczną zasadą byłoby ustawienie na dwukrotność tej wartości. Kolejnym jest horyzont prognozowania, jeśli użyjesz modelu do potrzeb prognozowania. Wreszcie, jeśli zauważysz znaczące odstępstwa w późniejszych opóźnieniach, spróbuj pomyśleć o korektach (może to być spowodowane niektórymi efektami sezonowymi lub dane nie zostały skorygowane o wartości odstające).h
Jest to wspólny test istotności , więc jeśli wybór zależy od danych, to dlaczego miałbym się przejmować małymi (okazjonalnymi?) Odjazdami przy dowolnym opóźnieniu mniejszym niż , zakładając, że jest to znacznie mniej niż (moc testu, o którym wspomniałeś). Poszukując prostego, ale odpowiedniego modelu, sugeruję kryteria informacyjne opisane poniżej.h nh h n
Będzie to zależeć od tego, jak daleko to się dzieje. Wady dalekich odejść: więcej parametrów do oszacowania, mniej stopni swobody, gorsza moc predykcyjna modelu.
Spróbuj oszacować model, w tym części MA i \ lub AR w opóźnieniu, w którym następuje odejście ORAZ dodatkowo spójrz na jedno z kryteriów informacyjnych (AIC lub BIC w zależności od wielkości próbki), to da ci więcej informacji na temat tego, który model jest bardziej oszczędny. Mile widziane są również wszelkie ćwiczenia prognostyczne poza próbą.
źródło
Załóżmy, że określamy prosty model AR (1) ze wszystkimi zwykłymi właściwościami,
Oznacz teoretyczną kowariancję terminu błędu jako
Jeśli moglibyśmy zaobserwować termin błędzie, a następnie próbka autokorelacja składnika losowego jest zdefiniowany jako
gdzie
Ale w praktyce nie przestrzegamy terminu błędu. Tak więc autokorelacja próbki związana z wartością błędu zostanie oszacowana przy użyciu reszt z oszacowania, jak
Statystyka Q Box-Pierce (Ljung-Box Q jest tylko asymptotycznie neutralną skalowaną wersją):
Naszym problemem jest dokładnie to, czy można powiedzieć, że ma asymptotycznie rozkład chi-kwadrat (pod zerą braku autokorelacji w składniku błędu) w tym modelu. Aby tak się stało, każdy z √QBP n−−√ρ^j ma taki sam rozkład asymptotycznej jako √n−−√ρ^ (który jest konstruowany przy użyciu prawdziwych błędów, a więc ma pożądane zachowanie asymptotyczne pod wartością zerową).n−−√ρ~
musi być asymptotycznie normalny standardowy. Sposobem na sprawdzenie tego jest sprawdzenie, czy √
Mamy to
gdzie β jest zgodny estymatora. Więcβ^
Zakłada się, że próbka jest stacjonarna i ergodyczna, i zakłada się, że chwile istnieją aż do pożądanego porządku. Ponieważ estymator β jest spójne, to wystarczy na dwie sumy, aby przejść do zera. Podsumowujemyβ^
To daje do zrozumienia ze
Ale to nie gwarantuje automatycznie zbieżny do √n--√ρ^jot n--√ρ~jot (w rozkładzie) (pomyśl, że twierdzenie o ciągłym odwzorowaniu nie ma tutaj zastosowania, ponieważ transformacja zastosowana do zmiennych losowych zależy od). Aby tak się stało, potrzebujemyn
(mianownik tylda lub kapelusz - zbiegnie się w wariancji warunku błędu w obu przypadkach, więc jest neutralny dla naszego problemu).γ0
Mamy
Pytanie brzmi: wykonaj te dwie sumy pomnożone teraz przez , zmień prawdopodobieństwo na zero, aby pozostało √n--√ asymptotycznie?n--√γ^jot= n--√γ~jot
Do drugiej sumy mamy
Ponieważ zbieżny do zmiennej losowej i β jest zgodna, to będzie zbliżać się do zera.[ n--√( β^- β) ] β^
Za pierwszą sumę tutaj też mamy zbieżny do zmiennej losowej, i tak, że mamy[ n--√( β^- β) ]
Pierwsza oczekiwana wartość, wynosi zero przy założeniach standardowego modelu AR (1). Ale druga oczekiwana wartość nie jest , ponieważ zmienna zależna zależy od błędów z przeszłości.mi[ utyt - j - 1]
Więc nie będzie miał taki sam rozkład asymptotycznej jako √n--√ρ^jot . Ale asymptotyczny rozkład tego ostatniego jest normalny Normalny, który prowadzi do rozkładu chi-kwadrat podczas kwadratowania rvn--√ρ~jot
Dlatego dochodzimy do wniosku, że w czystym modelu szeregów czasowych nie można powiedzieć, że statystyka Box-Pierce Q i Ljung-Box Q ma asymptotyczny rozkład chi-kwadrat, więc test traci swoje asymptotyczne uzasadnienie.
Dzieje się tak, ponieważ zmienna po prawej stronie (tutaj opóźnienie zmiennej zależnej) według projektu nie jest ściśle egzogeniczna względem terminu błędu, i stwierdziliśmy, że taka ścisła egzogeniczność jest wymagana, aby statystyki Q BP / LB miały wartość postulowany rozkład asymptotyczny.
W tym przypadku zmienna po prawej stronie jest tylko „z góry określona”, a test Breuscha-Pagana jest wtedy ważny. (pełny zestaw warunków wymaganych do asymptotycznie ważnego testu, patrz Hayashi 2000, s. 146-149).
źródło
Przed wyzerowaniem „prawej” h (która wydaje się być bardziej opinią niż twardą zasadą), upewnij się, że „opóźnienie” jest poprawnie zdefiniowane.
http://www.stat.pitt.edu/stoffer/tsa2/Rissues.htm
Cytując poniższą sekcję Wydanie 4 w powyższym linku:
„.... Wartości p pokazane dla wykresu statystycznego Ljunga-Boxa są niepoprawne, ponieważ stopnie swobody użyte do obliczenia wartości p są opóźnieniem zamiast opóźnienia - (p + q). To znaczy, że stosowana jest procedura NIE bierze pod uwagę faktu, że reszty pochodzą z dopasowanego modelu. I TAK, co najmniej jeden programista z rdzeniem R wie o tym ... ”
Edytuj (01/23/2011): Oto artykuł Burnsa, który może pomóc:
http://lib.stat.cmu.edu/S/Spoetry/Working/ljungbox.pdf
źródło
Wątek „Testowanie autokorelacji: Ljung-Box kontra Breusch-Godfrey” pokazuje, że test Ljung-Box zasadniczo nie ma zastosowania w przypadku modelu autoregresyjnego. Pokazuje również, że zamiast tego należy zastosować test Breusch-Godfrey. Ogranicza to trafność twojego pytania i odpowiedzi (chociaż odpowiedzi mogą zawierać pewne ogólnie dobre punkty).
źródło
Escanciano i Lobato skonstruowali test Portmanteau z automatycznym wyborem opóźnienia opartym na danych w oparciu o test Pierce-Box i jego udoskonalenia (w tym test Ljung-Box).
Istotą ich podejścia jest połączenie kryteriów AIC i BIC --- wspólnych w identyfikacji i szacowaniu modeli ARMA --- w celu wybrania optymalnej liczby opóźnień, które należy zastosować. Na wstępie sugerują, że intuicyjnie `` test przeprowadzony przy użyciu kryterium BIC jest w stanie właściwie kontrolować błąd typu I i jest bardziej wydajny, gdy korelacja szeregowa występuje w pierwszym rzędzie ''. Zamiast tego testy oparte na AIC są silniejsze w porównaniu z szeregową korelacją wyższego rzędu. Ich procedura wybiera zatem wybór opóźnienia typu BIC w przypadku, gdy autokorelacje wydają się małe i występują tylko w niskim rzędzie, a sekcja opóźnienia typu AIC w przeciwnym razie.
Test jest zaimplementowany w
R
pakiecievrtest
(patrz funkcjaAuto.Q
).źródło
Pierwszy ma pochodzić z autorytatywnej książki Boxa, Jenkinsa i Reinsela. Analiza szeregów czasowych: prognozowanie i kontrola. Wydanie trzecie Englewood Cliffs, NJ: Prentice Hall, 1994 .. Jednak oto wszystko, co mówią o opóźnieniach na s. 314:
Nie jest to żaden silny argument ani sugestia, ale ludzie powtarzają to z miejsca na miejsce.
Drugie ustawienie opóźnienia dotyczy Tsay, RS Analysis of Financial Time Series. 2nd Ed. Hoboken, NJ: John Wiley & Sons, Inc., 2005, oto, co napisał na s. 33:
Jest to nieco silniejszy argument, ale nie ma opisu tego, jakie badania przeprowadzono. Więc nie wziąłbym tego za wartość nominalną. Ostrzega także o sezonowości:
Podsumowując, jeśli wystarczy podłączyć opóźnienie do testu i przejść dalej, możesz użyć dowolnego z tych ustawień, i to jest w porządku, ponieważ robi to większość praktyków. Jesteśmy albo leniwi, albo, co bardziej prawdopodobne, nie mamy czasu na takie rzeczy. W przeciwnym razie będziesz musiał przeprowadzić własne badania dotyczące mocy i właściwości statystyki dla serii, z którymi masz do czynienia.
AKTUALIZACJA.
Jednak OP nie wskazał, że robi ARMAX, wręcz przeciwnie, wyraźnie wspomina ARMAX:
Jednym z pierwszych artykułów wskazujących na potencjalny problem z testem LB był Dezhbaksh, Hashem (1990). „ Niewłaściwe stosowanie szeregowych testów korelacyjnych w dynamicznych modelach liniowych ”, Review of Economics and Statistics, 72, 126–132. Oto fragment artykułu:
Jak widać, nie sprzeciwia się on stosowaniu testu LB dla modeli wyłącznie szeregów czasowych, takich jak ARMA. Zobacz także dyskusję w podręczniku do standardowego narzędzia ekonometrycznego EViews:
Tak, należy zachować ostrożność przy modelach ARMAX i teście LB, ale nie można jednoznacznie stwierdzić, że test LB jest zawsze nieprawidłowy dla wszystkich serii autoregresyjnych.
AKTUALIZACJA 2
Odpowiedź Alecosa Papadopoulosa pokazuje, dlaczego test Ljunga-Boxa wymaga ścisłego założenia egzogeniczności . Nie pokazuje tego w swoim poście, ale test Breusch-Gpdfrey (inny test alternatywny) wymaga jedynie słabej egzogeniczności , co oczywiście jest lepsze. To, co Greene, Econometrics, wydanie 7. mówi o różnicach między testami, str. 923:
źródło
... h powinien być jak najmniejszy, aby zachować moc, jaką test LB może mieć w danych okolicznościach. Wraz ze wzrostem h moc spada. Test LB jest strasznie słabym testem; musisz mieć dużo próbek; n musi być ~> 100, aby miało znaczenie. Niestety nigdy nie widziałem lepszego testu. Ale może istnieje. Ktoś wie o jednym?
Paul3nt
źródło
Nie ma poprawnej odpowiedzi na to pytanie, która działałaby we wszystkich sytuacjach, z innych powodów, dla których stwierdzono, że będzie to zależeć od twoich danych.
Oczywiście wszystkie wartości domyślne są błędne, aw niektórych sytuacjach będzie to z pewnością błędne. W wielu sytuacjach może to nie być złe miejsce na rozpoczęcie.
źródło
Pozwól, że zasugeruję ci nasz pakiet R na hwwntest . Zaimplementowano testy szumu białego oparte na Wavelet, które nie wymagają żadnych parametrów strojenia i mają dobrą wielkość statystyczną i moc.
Ponadto niedawno znalazłem „Myśli o teście Ljung-Boxa”, która jest doskonałą dyskusją na ten temat autorstwa Roba Hyndmana.
Aktualizacja: Biorąc pod uwagę alternatywną dyskusję w tym wątku dotyczącą ARMAX, kolejną zachętą do spojrzenia na hwwntest jest dostępność teoretycznej funkcji mocy dla jednego z testów przeciwko alternatywnej hipotezie modelu ARMA (p, q).
źródło