Ile opóźnień użyć w teście Ljung-Boxa szeregu czasowego?

20

Po dopasowaniu modelu ARMA do szeregów czasowych często sprawdza się resztki za pomocą testu Portmanteau Ljunga-Boxa (między innymi testami). Test Ljunga-Boxa zwraca wartość ap. Ma parametr h , który jest liczbą opóźnień do przetestowania. Niektóre teksty zalecają użycie h = 20; inni zalecają użycie h = ln (n); większość nie mówi, jakiego h użyć.

Zamiast używać pojedynczej wartości dla h , załóżmy, że wykonuję test Ljunga-Boxa dla wszystkich h <50, a następnie wybieram h, która daje minimalną wartość p. Czy to podejście jest rozsądne? Jakie są zalety i wady? (Jedną oczywistą wadą jest wydłużony czas obliczeń, ale nie stanowi to problemu.) Czy jest na to literatura?

Aby nieco rozwinąć ... Jeśli test daje p> 0,05 dla całego h , to oczywiście szeregi czasowe (reszty) przechodzą test. Moje pytanie dotyczy interpretacji testu, jeśli p <0,05 dla niektórych wartości h, a nie dla innych wartości.

użytkownik 2875
źródło
1
@ user2875, usunąłem swoją odpowiedź. Faktem jest, że dla dużej test nie jest wiarygodny. Tak więc odpowiedź naprawdę zależy od tego, dla którego , . Ponadto, jaka jest dokładna wartość ? Jeśli obniżymy próg do , czy wynik testu ulegnie zmianie? Osobiście w przypadku sprzecznych hipotez szukam innych wskaźników, czy model jest dobry, czy nie. Jak dobrze pasuje model? Jak model porównuje się do modeli alternatywnych? Czy alternatywny model ma te same problemy? W przypadku jakich innych naruszeń test odrzuca wartość zerową? h p < 0,05 p 0,01hhp<0,05p0,01
mpiktas
1
@mpiktas, Test Ljunga-Boxa opiera się na statystyce, której rozkład jest asymptotycznie (gdy h staje się duży) chi-kwadrat. Gdy h staje się duże w stosunku do n, moc testu spada do 0. Stąd chęć wybrania h wystarczająco dużej, aby rozkład był zbliżony do chi-kwadrat, ale wystarczająco mały, aby mieć użyteczną moc. (Nie wiem, jakie jest ryzyko fałszywie ujemnego wyniku, gdy h jest małe.)
user2875 24.01.11
@ user2875, po raz trzeci zmieniłeś pytanie. Najpierw pytasz o strategię wybierania o najmniejszej wartości, a następnie jak interpretować test, jeśli dla niektórych wartości , a teraz jaki jest optymalny do wyboru. Wszystkie trzy pytania mają różne odpowiedzi, a nawet mogą mieć różne odpowiedzi w zależności od kontekstu konkretnego problemu. P < 0,05 h hhp<0.05hh
mpiktas
@mpiktas, pytania są takie same, tylko różne sposoby patrzenia na to. (Jak wskazano, jeśli p> 0,05 dla wszystkich h, to wiemy, jak interpretować najmniejsze p; gdybyśmy znali optymalne h - nie wiemy - nie bylibyśmy zainteresowani wyborem najmniejszego p.)
user2875

Odpowiedzi:

9

Odpowiedź zdecydowanie zależy od: Do czego tak naprawdę próbujemy użyć testu ?Q

Powodem tego jest: być mniej lub bardziej pewnym co do wspólnej statystycznej istotności hipotezy zerowej braku autokorelacji aż do opóźnienia (alternatywnie zakładając, że masz coś zbliżonego do słabego białego szumu ) i zbudować model oszczędny , mając tak mało liczba parametrów, jak to możliwe.h

Zwykle dane szeregów czasowych mają naturalny wzorzec sezonowy, więc praktyczną zasadą byłoby ustawienie na dwukrotność tej wartości. Kolejnym jest horyzont prognozowania, jeśli użyjesz modelu do potrzeb prognozowania. Wreszcie, jeśli zauważysz znaczące odstępstwa w późniejszych opóźnieniach, spróbuj pomyśleć o korektach (może to być spowodowane niektórymi efektami sezonowymi lub dane nie zostały skorygowane o wartości odstające).h

Zamiast używać pojedynczej wartości dla h, załóżmy, że wykonuję test Ljunga-Boxa dla wszystkich h <50, a następnie wybieram h, która daje minimalną wartość p.

Jest to wspólny test istotności , więc jeśli wybór zależy od danych, to dlaczego miałbym się przejmować małymi (okazjonalnymi?) Odjazdami przy dowolnym opóźnieniu mniejszym niż , zakładając, że jest to znacznie mniej niż (moc testu, o którym wspomniałeś). Poszukując prostego, ale odpowiedniego modelu, sugeruję kryteria informacyjne opisane poniżej.h nhhn

Moje pytanie dotyczy interpretacji testu, jeśli dla niektórych wartości a nie dla innych wartości.godzp<0,05h

Będzie to zależeć od tego, jak daleko to się dzieje. Wady dalekich odejść: więcej parametrów do oszacowania, mniej stopni swobody, gorsza moc predykcyjna modelu.

Spróbuj oszacować model, w tym części MA i \ lub AR w opóźnieniu, w którym następuje odejście ORAZ dodatkowo spójrz na jedno z kryteriów informacyjnych (AIC lub BIC w zależności od wielkości próbki), to da ci więcej informacji na temat tego, który model jest bardziej oszczędny. Mile widziane są również wszelkie ćwiczenia prognostyczne poza próbą.

Dmitrij Celov
źródło
+1, to właśnie próbowałem wyrazić, ale nie byłem w stanie :)
mpiktas
8

Załóżmy, że określamy prosty model AR (1) ze wszystkimi zwykłymi właściwościami,

yt=βyt-1+ut

Oznacz teoretyczną kowariancję terminu błędu jako

γjotmi(utut-jot)

Jeśli moglibyśmy zaobserwować termin błędzie, a następnie próbka autokorelacja składnika losowego jest zdefiniowany jako

ρ~jotγ~jotγ~0

gdzie

γ~j1nt=j+1nututj,j=0,1,2 ...

Ale w praktyce nie przestrzegamy terminu błędu. Tak więc autokorelacja próbki związana z wartością błędu zostanie oszacowana przy użyciu reszt z oszacowania, jak

γ^jot1nt=jot+1nu^tu^t-jot,jot=0,1,2 ...

Statystyka Q Box-Pierce (Ljung-Box Q jest tylko asymptotycznie neutralną skalowaną wersją):

QbP.=njot=1pρ^jot2)=jot=1p[nρ^jot]2)re???χ2)(p)

Naszym problemem jest dokładnie to, czy można powiedzieć, że ma asymptotycznie rozkład chi-kwadrat (pod zerą braku autokorelacji w składniku błędu) w tym modelu. Aby tak się stało, każdy z QBP
musi być asymptotycznie normalny standardowy. Sposobem na sprawdzenie tego jest sprawdzenie, czynρ^j ma taki sam rozkład asymptotycznej jakonρ^ (który jest konstruowany przy użyciu prawdziwych błędów, a więc ma pożądane zachowanie asymptotyczne pod wartością zerową).nρ~

Mamy to

u^t=yt-β^yt-1=ut-(β^-β)yt-1

gdzie β jest zgodny estymatora. Więcβ^

γ^jot1nt=jot+1n[ut-(β^-β)yt-1][ut-jot-(β^-β)yt-jot-1]

=γ~jot-1nt=jot+1n(β^-β)[utyt-jot-1+ut-jotyt-1]+1nt=jot+1n(β^-β)2)yt-1yt-jot-1

Zakłada się, że próbka jest stacjonarna i ergodyczna, i zakłada się, że chwile istnieją aż do pożądanego porządku. Ponieważ estymator β jest spójne, to wystarczy na dwie sumy, aby przejść do zera. Podsumowujemyβ^

γ^jotpγ~jot

To daje do zrozumienia ze

ρ^jotpρ~jotpρjot

Ale to nie gwarantuje automatycznie zbieżny do nρ^jotnρ~jot(w rozkładzie) (pomyśl, że twierdzenie o ciągłym odwzorowaniu nie ma tutaj zastosowania, ponieważ transformacja zastosowana do zmiennych losowych zależy od). Aby tak się stało, potrzebujemyn

nγ^jotrenγ~jot

(mianownik tylda lub kapelusz - zbiegnie się w wariancji warunku błędu w obu przypadkach, więc jest neutralny dla naszego problemu).γ0

Mamy

nγ^jot=nγ~jot-1nt=jot+1nn(β^-β)[utyt-jot-1+ut-jotyt-1]+1nt=jot+1nn(β^-β)2)yt-1yt-jot-1

Pytanie brzmi: wykonaj te dwie sumy pomnożone teraz przez , zmień prawdopodobieństwo na zero, aby pozostałonasymptotycznie?nγ^jot=nγ~jot

Do drugiej sumy mamy

1nt=jot+1nn(β^-β)2)yt-1yt-jot-1=1nt=jot+1n[n(β^-β)][(β^-β)yt-1yt-jot-1]

Ponieważ zbieżny do zmiennej losowej i β jest zgodna, to będzie zbliżać się do zera.[n(β^-β)]β^

Za pierwszą sumę tutaj też mamy zbieżny do zmiennej losowej, i tak, że mamy [n(β^-β)]

1nt=jot+1n[utyt-jot-1+ut-jotyt-1]pmi[utyt-jot-1]+mi[ut-jotyt-1]

Pierwsza oczekiwana wartość, wynosi zero przy założeniach standardowego modelu AR (1). Ale druga oczekiwana wartość nie jest , ponieważ zmienna zależna zależy od błędów z przeszłości.mi[utyt-jot-1]

Więc nie będzie miał taki sam rozkład asymptotycznej jakonρ^jot. Ale asymptotyczny rozkład tego ostatniego jest normalny Normalny, który prowadzi do rozkładu chi-kwadrat podczas kwadratowania rvnρ~jot

Dlatego dochodzimy do wniosku, że w czystym modelu szeregów czasowych nie można powiedzieć, że statystyka Box-Pierce Q i Ljung-Box Q ma asymptotyczny rozkład chi-kwadrat, więc test traci swoje asymptotyczne uzasadnienie.

Dzieje się tak, ponieważ zmienna po prawej stronie (tutaj opóźnienie zmiennej zależnej) według projektu nie jest ściśle egzogeniczna względem terminu błędu, i stwierdziliśmy, że taka ścisła egzogeniczność jest wymagana, aby statystyki Q BP / LB miały wartość postulowany rozkład asymptotyczny.

W tym przypadku zmienna po prawej stronie jest tylko „z góry określona”, a test Breuscha-Pagana jest wtedy ważny. (pełny zestaw warunków wymaganych do asymptotycznie ważnego testu, patrz Hayashi 2000, s. 146-149).

Alecos Papadopoulos
źródło
1
Napisałeś „Ale druga oczekiwana wartość nie jest, ponieważ zmienna zależna zależy od przeszłych błędów”. To się nazywa ścisła egzogeniczność . Zgadzam się, że jest to silne założenie i możesz bez niego zbudować platformę AR (p), używając jedynie słabej egzogeniczności . To jest powód, dla którego test Breuscha-Godfreya jest w pewnym sensie lepszy : jeśli zero jest nieprawdą, BL traci moc. BG opiera się na słabej egzogeniczności. Oba testy nie są dobre dla niektórych popularnych aplikacji ekonometrycznych, patrz np . Prezentacja Staty , str. 4/44.
Aksakal
3
@Aksakal Dzięki za odniesienie. Chodzi o to, że bez ścisłej egzogeniczności Box-Pierce / Ljung-Box nie mają asymptotycznego rozkładu chi-kwadrat, to właśnie pokazuje powyższa matematyka. Słaba egzogeniczność (która utrzymuje się w powyższym modelu) nie jest dla nich wystarczająca. Dokładnie tak mówi prezentacja, do której prowadzi link na str. 3/44.
Alecos Papadopoulos,
2
@AlecosPapadopoulos, niesamowity post !!! Wśród kilku najlepszych, jakie spotkałem tutaj w Cross Validated. Chciałbym tylko, żeby nie zniknęło w tym długim wątku, a wielu użytkowników znajdzie i skorzysta z niego w przyszłości.
Richard Hardy,
3

Przed wyzerowaniem „prawej” h (która wydaje się być bardziej opinią niż twardą zasadą), upewnij się, że „opóźnienie” jest poprawnie zdefiniowane.

http://www.stat.pitt.edu/stoffer/tsa2/Rissues.htm

Cytując poniższą sekcję Wydanie 4 w powyższym linku:

„.... Wartości p pokazane dla wykresu statystycznego Ljunga-Boxa są niepoprawne, ponieważ stopnie swobody użyte do obliczenia wartości p są opóźnieniem zamiast opóźnienia - (p + q). To znaczy, że stosowana jest procedura NIE bierze pod uwagę faktu, że reszty pochodzą z dopasowanego modelu. I TAK, co najmniej jeden programista z rdzeniem R wie o tym ... ”

Edytuj (01/23/2011): Oto artykuł Burnsa, który może pomóc:

http://lib.stat.cmu.edu/S/Spoetry/Working/ljungbox.pdf

rachunek_80
źródło
@ bil_080, OP nie wspomina o R, a strona pomocy dla Box.test w R wspomina o korekcie i ma argument pozwalający na korektę, chociaż trzeba ją podać ręcznie.
mpiktas
@mpiktas, Ups, masz rację. Zakładałem, że to pytanie R. Jeśli chodzi o drugą część komentarza, istnieje kilka pakietów R, które używają statystyk Ljung-Box. Warto więc upewnić się, że użytkownik rozumie, co oznacza „opóźnienie” pakietu.
bill_080
Dzięki - używam R, ale pytanie jest ogólne. Dla bezpieczeństwa przeprowadzałem test z funkcją LjungBox w pakiecie portes, a także Box.test.
user2875
2

Wątek „Testowanie autokorelacji: Ljung-Box kontra Breusch-Godfrey” pokazuje, że test Ljung-Box zasadniczo nie ma zastosowania w przypadku modelu autoregresyjnego. Pokazuje również, że zamiast tego należy zastosować test Breusch-Godfrey. Ogranicza to trafność twojego pytania i odpowiedzi (chociaż odpowiedzi mogą zawierać pewne ogólnie dobre punkty).

Richard Hardy
źródło
Problem z testem LB polega na tym, że modele autoregresyjne mają inne regresory, tj. Modele ARMAX, a nie ARM. OP wyraźnie określa ARMA, a nie ARMAX w pytaniu. Dlatego uważam, że twoja odpowiedź jest nieprawidłowa.
Aksakal
@Aksakal, wyraźnie widzę z odpowiedzi Alecos Papadopoulos (i komentarzy pod nim) w wyżej wspomnianym wątku, że test Ljung-Box nie ma zastosowania w obu przypadkach, tj. Czysty AR / ARMA i ARX ​​/ ARMAX. Dlatego nie mogę się z tobą zgodzić.
Richard Hardy,
Odpowiedź Alecosa Papadopoulosa jest dobra, ale niepełna. Wskazuje na założenie ścisłej egzogeniczności testu Ljunga-Boxa, ale nie wspomina, że ​​jeśli założenie jest w porządku, to można zastosować test LB. Test BG, który on i ja preferujemy w stosunku do LB, opiera się na słabej egzogeniczności. Oczywiście lepiej jest używać testów z ogólnie słabszymi założeniami. Jednak nawet założenia testu BG są zbyt silne w wielu przypadkach.
Aksakal
@Aksakal, Ustawienie tego pytania jest dość określone - uwzględnia reszty z modelu ARMA. Ważną rzeczą jest to, że LB nie działa (jak pokazano wyraźnie w poście Alecos w tym, jak również w cytowanym powyżej wątku), podczas gdy test BG działa. Oczywiście rzeczy mogą się zdarzyć w innych ustawieniach ( nawet założenia testu BG są zbyt silne w wielu przypadkach ) - ale nie o to chodzi w tym wątku. Nie otrzymałem również założenia, które znajduje się w twoim oświadczeniu, jeśli założenie jest w porządku, to test LB jest w porządku . Czy to powinno unieważnić punkt Alecos?
Richard Hardy,
1

Escanciano i Lobato skonstruowali test Portmanteau z automatycznym wyborem opóźnienia opartym na danych w oparciu o test Pierce-Box i jego udoskonalenia (w tym test Ljung-Box).

Istotą ich podejścia jest połączenie kryteriów AIC i BIC --- wspólnych w identyfikacji i szacowaniu modeli ARMA --- w celu wybrania optymalnej liczby opóźnień, które należy zastosować. Na wstępie sugerują, że intuicyjnie `` test przeprowadzony przy użyciu kryterium BIC jest w stanie właściwie kontrolować błąd typu I i jest bardziej wydajny, gdy korelacja szeregowa występuje w pierwszym rzędzie ''. Zamiast tego testy oparte na AIC są silniejsze w porównaniu z szeregową korelacją wyższego rzędu. Ich procedura wybiera zatem wybór opóźnienia typu BIC w przypadku, gdy autokorelacje wydają się małe i występują tylko w niskim rzędzie, a sekcja opóźnienia typu AIC w przeciwnym razie.

Test jest zaimplementowany w Rpakiecie vrtest(patrz funkcja Auto.Q).

Ryogi
źródło
1

min(20,T1)lnTT

Pierwszy ma pochodzić z autorytatywnej książki Boxa, Jenkinsa i Reinsela. Analiza szeregów czasowych: prognozowanie i kontrola. Wydanie trzecie Englewood Cliffs, NJ: Prentice Hall, 1994 .. Jednak oto wszystko, co mówią o opóźnieniach na s. 314: wprowadź opis zdjęcia tutaj

Nie jest to żaden silny argument ani sugestia, ale ludzie powtarzają to z miejsca na miejsce.

Drugie ustawienie opóźnienia dotyczy Tsay, RS Analysis of Financial Time Series. 2nd Ed. Hoboken, NJ: John Wiley & Sons, Inc., 2005, oto, co napisał na s. 33:

Często stosuje się kilka wartości m. Badania symulacyjne sugerują, że wybór m ≈ ln (T) zapewnia lepszą wydajność mocy.

Jest to nieco silniejszy argument, ale nie ma opisu tego, jakie badania przeprowadzono. Więc nie wziąłbym tego za wartość nominalną. Ostrzega także o sezonowości:

Ta ogólna zasada wymaga modyfikacji w analizie sezonowych szeregów czasowych, dla których ważniejsza jest autokorelacja z opóźnieniami w wielokrotnościach sezonowości.

Podsumowując, jeśli wystarczy podłączyć opóźnienie do testu i przejść dalej, możesz użyć dowolnego z tych ustawień, i to jest w porządku, ponieważ robi to większość praktyków. Jesteśmy albo leniwi, albo, co bardziej prawdopodobne, nie mamy czasu na takie rzeczy. W przeciwnym razie będziesz musiał przeprowadzić własne badania dotyczące mocy i właściwości statystyki dla serii, z którymi masz do czynienia.

AKTUALIZACJA.

xt

yt=xtβ+ϕ(L)yt+ut

Jednak OP nie wskazał, że robi ARMAX, wręcz przeciwnie, wyraźnie wspomina ARMAX:

Po dopasowaniu modelu ARMA do szeregów czasowych często sprawdza się pozostałości za pomocą testu Portmanteau Ljunga-Boxa

Jednym z pierwszych artykułów wskazujących na potencjalny problem z testem LB był Dezhbaksh, Hashem (1990). „ Niewłaściwe stosowanie szeregowych testów korelacyjnych w dynamicznych modelach liniowych ”, Review of Economics and Statistics, 72, 126–132. Oto fragment artykułu:

wprowadź opis zdjęcia tutaj

Jak widać, nie sprzeciwia się on stosowaniu testu LB dla modeli wyłącznie szeregów czasowych, takich jak ARMA. Zobacz także dyskusję w podręczniku do standardowego narzędzia ekonometrycznego EViews:

Jeżeli szereg reprezentuje resztki z oszacowania ARIMA, należy dostosować odpowiednie stopnie swobody, aby reprezentowały liczbę autokorelacji pomniejszoną o liczbę uprzednio oszacowanych warunków AR i MA. Należy również zauważyć, że należy zachować ostrożność przy interpretacji wyników testu Ljunga-Boxa zastosowanego do pozostałości ze specyfikacji ARMAX (patrz Dezhbaksh, 1990, dla symulacji dowodów na wyniki skończonej próby testu w tym ustawieniu)

Tak, należy zachować ostrożność przy modelach ARMAX i teście LB, ale nie można jednoznacznie stwierdzić, że test LB jest zawsze nieprawidłowy dla wszystkich serii autoregresyjnych.

AKTUALIZACJA 2

Odpowiedź Alecosa Papadopoulosa pokazuje, dlaczego test Ljunga-Boxa wymaga ścisłego założenia egzogeniczności . Nie pokazuje tego w swoim poście, ale test Breusch-Gpdfrey (inny test alternatywny) wymaga jedynie słabej egzogeniczności , co oczywiście jest lepsze. To, co Greene, Econometrics, wydanie 7. mówi o różnicach między testami, str. 923:

xtεsxt

Aksakal
źródło
Przypuszczam, że zdecydowałeś się odpowiedzieć na pytanie, ponieważ moja ostatnia odpowiedź uderzyła go w górę aktywnych wątków. Co ciekawe, twierdzę, że test jest nieodpowiedni w rozważanym otoczeniu, co sprawia, że ​​cały wątek jest problematyczny, a odpowiedzi w nim szczególnie. Czy uważasz, że dobrą praktyką jest opublikowanie kolejnej odpowiedzi, która ignoruje ten problem, nawet o nim nie wspominając (podobnie jak wszystkie poprzednie odpowiedzi)? A może uważasz, że moja odpowiedź nie ma sensu (co uzasadniałoby opublikowanie odpowiedzi takiej jak Twoja)?
Richard Hardy,
Dziękujemy za aktualizację! Nie jestem ekspertem, ale argumentacja Alecosa Papadopoulosa w Testach na autokorelację: Ljung-Box kontra Breusch-Godfrey” oraz w komentarzach pod jego odpowiedzią sugeruje, że Ljung-Box rzeczywiście nie ma zastosowania do pozostałości z czystego ARiMR (jak również Modele ARMAX). Jeśli sformułowanie jest mylące, sprawdź matematykę, wydaje się być w porządku. Myślę, że jest to bardzo interesujące i ważne pytanie, dlatego naprawdę chciałbym tutaj znaleźć porozumienie między nami wszystkimi.
Richard Hardy,
0

... h powinien być jak najmniejszy, aby zachować moc, jaką test LB może mieć w danych okolicznościach. Wraz ze wzrostem h moc spada. Test LB jest strasznie słabym testem; musisz mieć dużo próbek; n musi być ~> 100, aby miało znaczenie. Niestety nigdy nie widziałem lepszego testu. Ale może istnieje. Ktoś wie o jednym?

Paul3nt


źródło
0

Nie ma poprawnej odpowiedzi na to pytanie, która działałaby we wszystkich sytuacjach, z innych powodów, dla których stwierdzono, że będzie to zależeć od twoich danych.

min(n22,40)

Oczywiście wszystkie wartości domyślne są błędne, aw niektórych sytuacjach będzie to z pewnością błędne. W wielu sytuacjach może to nie być złe miejsce na rozpoczęcie.

Benjamin Mako Hill
źródło
0

Pozwól, że zasugeruję ci nasz pakiet R na hwwntest . Zaimplementowano testy szumu białego oparte na Wavelet, które nie wymagają żadnych parametrów strojenia i mają dobrą wielkość statystyczną i moc.

Ponadto niedawno znalazłem „Myśli o teście Ljung-Boxa”, która jest doskonałą dyskusją na ten temat autorstwa Roba Hyndmana.

Aktualizacja: Biorąc pod uwagę alternatywną dyskusję w tym wątku dotyczącą ARMAX, kolejną zachętą do spojrzenia na hwwntest jest dostępność teoretycznej funkcji mocy dla jednego z testów przeciwko alternatywnej hipotezie modelu ARMA (p, q).

Delyan Savchev
źródło