To może być dziwne pytanie, ale jako nowicjusz w temacie zastanawiam się, dlaczego używamy regresji, aby zniechęcać szeregi czasowe, jeśli jednym z założeń regresji jest to, że dane powinny zostać uwzględnione, podczas gdy dane, na których stosuje się regresję, są nie iid?
regression
time-series
trend
iid
FarrukhJ
źródło
źródło
Odpowiedzi:
Zręcznie wyczuwasz, że może istnieć konflikt między klasycznymi założeniami zwykłej regresji liniowej metodą najmniejszych kwadratów a szeregową zależnością zwykle występującą w ustawieniach szeregów czasowych.
Rozważ założenie 1.2 (ścisła egzogeniczność) ekonometrii Fumio Hayashi .
To z kolei implikuje , że każda resztkowa ϵ i jest prostopadła do dowolnego regresora x j . Jak zauważa Hayashi, założenie to zostało naruszone w najprostszym modelu autoregresyjnym . [1] Rozważmy proces AR (1):E[ϵixj]=0 ϵi xj
Widzimy, że będzie regresorem dla y t + 1 , ale ϵ t nie jest prostopadły do y t (tj. E [ ϵ t y t ] ≠ 0 ).yt yt+1 ϵt yt E[ϵtyt]≠0
Ponieważ naruszone jest ścisłe założenie egzogeniczności, żaden z argumentów opartych na tym założeniu nie może zostać zastosowany do tego prostego modelu AR (1)!
Mamy więc trudny problem?
Nie, my nie! Szacowanie modeli AR (1) ze zwykłymi najmniejszymi kwadratami jest całkowicie prawidłowe, standardowe zachowanie. Dlaczego nadal może być w porządku?
Duża próbka, asymptotyczne argumenty nie wymagają ścisłej egzogenie. Wystarczającym założeniem (które można zastosować zamiast ścisłej egzogeniczności) jest to, że regresory są z góry określone , że regresory są ortogonalne względem równoczesnego błędu. Pełny argument znajduje się w rozdziale 2 Hayashi.
Bibliografia
[1] Fumio Hayashi, Econometrics (2000), s. 1. 35
[2] Tamże, str. 134
źródło
Podstawowe metody regresji typu najmniejszych kwadratów nie zakładają, że wartości y są identyczne. Zakładają, że reszty (tj. Wartość y minus trend prawdziwy) są identyczne
Istnieją inne metody regresji, które przyjmują różne założenia, ale to prawdopodobnie nadmiernie komplikuje tę odpowiedź.
źródło
To dobre pytanie! Problem ten nie jest nawet wspomniany w moich książkach o szeregach czasowych (prawdopodobnie potrzebuję lepszych książek :) Po pierwsze, pamiętaj, że nie musisz zmuszać się do regresji liniowej, aby zniechęcić szeregi czasowe, jeśli seria ma tendencję stochastyczną (pierwiastek jednostkowy )- możesz po prostu wziąć pierwszą różnicę. Ale musisz użyć regresji liniowej, jeśli seria ma trend deterministyczny. W tym przypadku prawdą jest, że reszty nie są identyczne, jak mówisz. Pomyśl tylko o serii, która ma trend liniowy, składniki sezonowe, składniki cykliczne itp. Wszystkie razem - po regresji liniowej reszty są prawie niezależne. Chodzi o to, że nie używasz regresji liniowej do prognozowania lub do tworzenia przedziałów prognoz. To tylko część procedury wnioskowania: nadal musisz zastosować inne metody, aby uzyskać nieskorelowane pozostałości. A zatem regresja liniowa per se nie jest prawidłową procedurą wnioskowania (nie jest poprawnym modelem statystycznym) dla większości szeregów czasowych, procedura obejmująca regresję liniową, ponieważ jednym z jej etapów może być prawidłowy model, jeżeli przyjęty model odpowiada procesowi generowania danych dla szereg czasowy.
źródło