Regresja z inną częstotliwością

10

Próbuję uruchomić prostą regresję, ale moje zmienne Y są obserwowane z częstotliwością miesięczną, a zmienne x są obserwowane z częstotliwością roczną. Naprawdę docenię wskazówki dotyczące odpowiedniego podejścia, które można zastosować do regresji z różnymi częstotliwościami.

Dziękuję Ci bardzo

magnaJ
źródło
Jeśli uważasz, że związek jest przyczynowy, warto zastanowić się, w jaki sposób dokładnie widzisz X prowadzący do Y - często wtedy wyjaśni potencjalną strategię. W jaki sposób twoja roczna rzecz prowadzi do wyniku twojej miesięcznej sprawy? Czy X jest proxy dla czegoś innego, czy Y naprawdę zależy od rocznego X?
Glen_b

Odpowiedzi:

6

Oto trzy możliwości. W zależności od sytuacji każdy może być odpowiedni.

  1. Agregacja lub dezagregacja czasu.

Jest to być może najprostsze podejście, w którym zamieniasz dane o wysokiej częstotliwości (miesięcznie) na dane roczne, powiedzmy, biorąc sumy, średnie lub wartości na koniec okresu. Dane o niskiej częstotliwości (roczne) można oczywiście przekształcić w dane miesięczne przy użyciu techniki interpolacji; na przykład przy użyciu procedury Chow-Lin. Przydatne może być odwołanie się do tempdisaggpakietu: http://cran.r-project.org/web/packages/tempdisagg/index.html .

  1. Mi (xed) da (ta) s (ampling) (MIDAS).

Regresje Midasa, spopularyzowane przez Erica Ghyselsa, to druga opcja. Istnieją tutaj dwa główne pomysły. Pierwszym z nich jest wyrównanie częstotliwości. Drugim jest walka z przekleństwem wymiarowości poprzez określenie odpowiedniego wielomianu. Nieograniczony model MIDAS jest najprostszy z klasy modeli i można go oszacować za pomocą zwykłych najmniejszych kwadratów. Dalsze szczegóły i sposób implementacji tych modeli przy Rużyciu midasrpakietu można znaleźć tutaj: http://mpiktas.github.io/midasr/ . Aby MATLABzapoznać się ze stroną Ghysels: http://www.unc.edu/~eghysels/ .

  1. Metody filtrowania Kalmana.

Jest to podejście do modelowania w przestrzeni stanów, które polega na traktowaniu danych o niskiej częstotliwości jako zawierających NA i wypełnianiu ich za pomocą filtra Kalmana. To moje osobiste preferencje, ale trudno jest określić właściwy model przestrzeni stanów.

Bardziej szczegółowe spojrzenie na zalety i wady tych metod można znaleźć w Modelach przestrzeni kosmicznej i regresjach MIDAS autorstwa Jennie Bai, Erica Ghysels i Jonathana H. Wrighta (2013).

Graeme Walsh
źródło
W Pythonie jest także implementacja MiDAS: github.com/mikemull/midaspy
Rafael Valero