Dlaczego warto odreagować szeregi czasowe z regresją?

14

To może być dziwne pytanie, ale jako nowicjusz w temacie zastanawiam się, dlaczego używamy regresji, aby zniechęcać szeregi czasowe, jeśli jednym z założeń regresji jest to, że dane powinny zostać uwzględnione, podczas gdy dane, na których stosuje się regresję, są nie iid?

FarrukhJ
źródło
6
Zasadniczo nie jest prawdą, że przyjmujemy założenie, że „dane” to iid
Christoph Hanck
3
Co masz na myśli właśnie przez zniechęcenie ?
Matthew Gunn
6
Nie mam czasu na napisanie właściwą odpowiedź / dokument, ale w ogólnym korelacji seryjny nie stronniczość wyniki regresji liniowej (to zmienia odpowiednie obliczenia błędy standardowe, przedziały ufności, itd.). To sprawia, że ​​klasyczne dwustopniowe podejście (odstraszanie, a następnie analizowanie pod kątem korelacji) jest sensowne. (np. niektóre googling „bezstronnej regresji liniowej korelacji szeregowej prowadzi do fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Ben Bolker
2
Co ważniejsze, OLS estymator współczynnika na liniowego trendu zbiega cały rząd wielkości przyspieszenia (w ilości ) z jego wartością rzeczywistą od stacjonarnych regresorów ( n - 1 / 2 ), co oznacza, że potrafi konsekwentnie oszacować trend, nawet jeśli zaniedbujesz zmienne stacjonarne. Jest to w przeciwieństwie do szacowania efektów zmiennych stacjonarnych jeden po drugim, w których tracisz spójność, jeśli pominiesz zmienne. n3/2n1/2
Richard Hardy,

Odpowiedzi:

15

Zręcznie wyczuwasz, że może istnieć konflikt między klasycznymi założeniami zwykłej regresji liniowej metodą najmniejszych kwadratów a szeregową zależnością zwykle występującą w ustawieniach szeregów czasowych.

Rozważ założenie 1.2 (ścisła egzogeniczność) ekonometrii Fumio Hayashi .

E[ϵiX]=0

To z kolei implikuje , że każda resztkowa ϵ i jest prostopadła do dowolnego regresora x j . Jak zauważa Hayashi, założenie to zostało naruszone w najprostszym modelu autoregresyjnym . [1] Rozważmy proces AR (1):E[ϵixj]=0ϵixj

yt=βyt1+ϵt

Widzimy, że będzie regresorem dla y t + 1 , ale ϵ t nie jest prostopadły do y t (tj. E [ ϵ t y t ] 0 ).ytyt+1ϵtytE[ϵtyt]0

Ponieważ naruszone jest ścisłe założenie egzogeniczności, żaden z argumentów opartych na tym założeniu nie może zostać zastosowany do tego prostego modelu AR (1)!

Mamy więc trudny problem?

Nie, my nie! Szacowanie modeli AR (1) ze zwykłymi najmniejszymi kwadratami jest całkowicie prawidłowe, standardowe zachowanie. Dlaczego nadal może być w porządku?

Duża próbka, asymptotyczne argumenty nie wymagają ścisłej egzogenie. Wystarczającym założeniem (które można zastosować zamiast ścisłej egzogeniczności) jest to, że regresory są z góry określone , że regresory są ortogonalne względem równoczesnego błędu. Pełny argument znajduje się w rozdziale 2 Hayashi.

Bibliografia

[1] Fumio Hayashi, Econometrics (2000), s. 1. 35

[2] Tamże, str. 134

Matthew Gunn
źródło
6

Podstawowe metody regresji typu najmniejszych kwadratów nie zakładają, że wartości y są identyczne. Zakładają, że reszty (tj. Wartość y minus trend prawdziwy) są identyczne

Istnieją inne metody regresji, które przyjmują różne założenia, ale to prawdopodobnie nadmiernie komplikuje tę odpowiedź.

Geoffrey Brent
źródło
5
Założenie, które jest również w oczywisty sposób fałszywe: wystarczy pomyśleć o szeregach czasowych z zarówno trendem liniowym, jak i sezonowością. Pozostałe reszty z regresji liniowej są wyraźnie skorelowane, a więc nie iid.
DeltaIV
3

To dobre pytanie! Problem ten nie jest nawet wspomniany w moich książkach o szeregach czasowych (prawdopodobnie potrzebuję lepszych książek :) Po pierwsze, pamiętaj, że nie musisz zmuszać się do regresji liniowej, aby zniechęcić szeregi czasowe, jeśli seria ma tendencję stochastyczną (pierwiastek jednostkowy )- możesz po prostu wziąć pierwszą różnicę. Ale musisz użyć regresji liniowej, jeśli seria ma trend deterministyczny. W tym przypadku prawdą jest, że reszty nie są identyczne, jak mówisz. Pomyśl tylko o serii, która ma trend liniowy, składniki sezonowe, składniki cykliczne itp. Wszystkie razem - po regresji liniowej reszty są prawie niezależne. Chodzi o to, że nie używasz regresji liniowej do prognozowania lub do tworzenia przedziałów prognoz. To tylko część procedury wnioskowania: nadal musisz zastosować inne metody, aby uzyskać nieskorelowane pozostałości. A zatem regresja liniowa per se nie jest prawidłową procedurą wnioskowania (nie jest poprawnym modelem statystycznym) dla większości szeregów czasowych, procedura obejmująca regresję liniową, ponieważ jednym z jej etapów może być prawidłowy model, jeżeli przyjęty model odpowiada procesowi generowania danych dla szereg czasowy.

DeltaIV
źródło
3
Nie różnicuj, jeśli masz trend deterministyczny - różnicowanie jest odpowiednie tylko dla trendów stochastycznych (pierwiastki jednostkowe). Jeśli rozróżnisz serię bez pierwiastka podstawowego, wprowadzisz w modelu zintegrowany typ średniej ruchomej błędów, co jest nieprzyjemne.
Richard Hardy,
1
Myślę, że masz na myśli różnicę, a nie różnicowanie.
Hong Ooi,
@RichardHardy ciekawe. Co masz na myśli przez „trend stochastyczny”? Masz na myśli cykle? Byyt=β0+β1yt-1+ϵtmasz tendencję stochastyczną lub deterministyczną zgodnie z twoją definicją?
DeltaIV
1
@HongOoi, tak, mój zły, miałem na myśli różnicowanie, a nie różnicowanie. DeltaIV, mówi się, że szereg czasowy ma tendencję stochastyczną, jeśli szereg czasowy jest procesem zintegrowanym (= root-unit). Jest to standardowy termin w literaturze dotyczącej root-unit i kointegracji. Zastanawiam się, czy ma to inne znaczenie w innych dziedzinach literatury. W każdym razie nadmierne różnicowanie (= różnicowanie szeregu czasowego, który nie ma pierwiastka) jest notorycznym zjawiskiem i należy go unikać.
Richard Hardy,
@RichardHardy ok, dzięki. Spróbuję udokumentować się na temat definicji zintegrowanego procesu i pierwiastków. Na początek, czy możesz mi powiedzieć, czy seria, którą zaproponowałem, jest zintegrowana, czy nie? Są pierwiastkami, do których się odwołujesz, pierwiastkami wielomianuy=β0+bmitza1x1?
DeltaIV