Materiały do ​​nauki o fałszywej regresji szeregów czasowych

10

„Spodnia regresja” (w kontekście szeregów czasowych) i powiązane terminy, takie jak testy root root, są czymś, o czym dużo słyszałem, ale nigdy nie rozumiałem.

Dlaczego / kiedy intuicyjnie to się dzieje? (Wydaje mi się, że dzieje się to wtedy, gdy twoje dwa szeregi czasowe są zintegrowane, tj. Niektóre liniowe kombinacje tych dwóch są nieruchome, ale nie rozumiem, dlaczego taka integracja powinna prowadzić do fałszywości.) Co robisz, aby tego uniknąć?

Szukam wysokiego poziomu zrozumienia, co kointegracja / testy korzeniowe jednostki / przyczynowość Grangera mają wspólnego z regresją fałszywą (te trzy są terminami, które pamiętam, jakoś były związane z regresją fałszywą, ale nie pamiętam, co dokładnie), więc odpowiedź niestandardowa lub link do referencji, w których mogę dowiedzieć się więcej, byłyby świetne.

raegtin
źródło

Odpowiedzi:

11

Pojęcia te zostały stworzone, aby radzić sobie z regresjami (na przykład korelacją) między szeregami niestacjonarnymi.

Clive Granger jest kluczowym autorem, którego powinieneś przeczytać.

Kointegracja została wprowadzona w 2 etapach:

1 / Granger, C. i P. Newbold (1974): „Spurious Regression in Econometrics”,

W tym artykule autorzy podkreślają, że regresję wśród zmiennych niestacjonarnych należy przeprowadzać jako regresję między zmianami (lub zmianami logarytmicznymi) zmiennych. W przeciwnym razie możesz znaleźć wysoką korelację bez żadnego rzeczywistego znaczenia. (= fałszywa regresja)

2 / Engle, Robert F., Granger, Clive WJ (1987) „Kointegracja i korekcja błędów: reprezentacja, szacowanie i testowanie”, Econometrica, 55 (2), 251–276.

W tym artykule (za który Granger została nagrodzona przez jury Nobla w 2003 r.) Autorzy posunęli się dalej i wprowadzili kointegrację jako metodę badania modelu korekcji błędów, który może istnieć między dwiema niestacjonarnymi zmiennymi.
Zasadniczo rada z 1974 r. Dotycząca regresji zmiany szeregów czasowych może prowadzić do nieokreślonych modeli regresji. Rzeczywiście możesz mieć zmienne, których zmiany są nieskorelowane, ale które są połączone poprzez „model korekcji błędów”.

W związku z tym można uzyskać korelację bez kointegracji i kointegrację bez korelacji. Obie są komplementarne.

Jeśli był tylko jeden artykuł do przeczytania, proponuję zacząć od tego, który jest bardzo dobrym i miłym wstępem:

(Murray 1993) Drunk and her dog

RockScience
źródło
Engle i Granger zostali wspólnie nagrodzeni tą samą nagrodą. Wątpię, by jury Nobla wyraźnie wykluczyło udział Engle'a w analizie kointegracji, więc prawdopodobnie byłoby bezpiecznie powiedzieć, że artykuł pomógł im (nie tylko Granger) w zdobyciu nagrody.
Richard Hardy
12

Zacznijmy od fałszywej regresji. Weź lub wyobraź sobie dwie serie, które są napędzane dominującym trendem czasowym: na przykład populacja USA i konsumpcja w USA czegokolwiek (nie ma znaczenia, o czym myślisz, czy to sody, lukrecji czy gazu). Obie serie będą rosły ze względu na wspólny trend czasowy. Teraz zresetuj zagregowane zużycie dla zagregowanej wielkości populacji i prestiżu, masz świetne dopasowanie. (Możemy to szybko zasymulować również w R.)

Ale to nic nie znaczy. Nie ma związku (jak my, jako projektanci wiemy) - ale model liniowy widzi dopasowanie (w sensie minimalizacji sumy kwadratów), ponieważ obie serie zdarzają się w górę bez związku przyczynowego. Padliśmy ofiarą fałszywej regresji.

To, co można lub należy modelować, to zmiana jednej serii na zmianę drugiej, a może zużycie na mieszkańca, lub ... Wszystkie te zmiany powodują, że zmienne stają się nieruchome, co pomaga złagodzić problem.

Teraz, od 30 000 stóp, korzenie jednostek i kointegracja pomagają w formalnym wnioskowaniu w tych przypadkach, zapewniając rygorystyczne podstawy statystyczne ( publikacje Econometrica i Nobla nie przychodzą łatwo), gdzie żadne nie było dostępne.

Jeśli chodzi o pytanie w dobrych zasobach: to trudne. Przeczytałem dziesiątki książek z serii czasowych, a większość z nich wyróżnia się w matematyce i pozostawia za sobą intuicję. Nie ma nic takiego jak tekst ekonometrii Kennedy'ego dla szeregów czasowych. Może tekst Waltera Endersa jest najbliższy. Spróbuję wymyślić trochę więcej i zaktualizować tutaj.

Inne niż książki, oprogramowanie dla faktycznie robi to jest ważne, a R ma to, czego potrzebujesz. Cena też jest odpowiednia.

Dirk Eddelbuettel
źródło
0

Mówi się, że seria ma pierwiastek główny, jeśli jest niestacjonarna. Kiedy masz, powiedzmy, dwa niestacjonarne procesy zintegrowane z rzędem 1 (seria I (1)) i możesz znaleźć liniową kombinację tych procesów, którą jest I (0), wtedy twoja seria jest zintegrowana. Oznacza to, że ewoluują w nieco podobny sposób. Ten kanał ma kilka ciekawych spostrzeżeń na temat szeregów czasowych, kointegracji, a więc https://www.youtube.com/watch?v=vvTKjm94Ars Jeśli chodzi o książki, bardzo lubię „Teorię i metody ekonometryczne” Davidsona i MacKinnona.

arroba
źródło
1
Dziękujemy za udzielenie odpowiedzi. Nie widzę w tym nic, co rozwiązałoby problem fałszywej regresji. Czy możesz opracować połączenie?
whuber
„Szukam wysokiego poziomu zrozumienia, co kointegracja / testy root root / przyczynowość Grangera mają wspólnego z regresją Spurious (...), więc albo niestandardowa reakcja, albo link do referencji, w których mogę dowiedzieć się więcej, byłyby świetne . ” Obecnie badam również fałszywą regresję i uważam, że powyższe odpowiedzi są lepsze niż to, co mogę zaoferować. Pomyślałem jednak, że dzielenie się referencjami, które mi pomogły, może być interesujące ...
arroba