Jak połączyć prognozy, gdy zmienna odpowiedzi w modelach prognozowania była inna?

9

Wprowadzenie

W połączeniu prognoz jedno z popularnych rozwiązań opiera się na zastosowaniu pewnego kryterium informacyjnego. Biorąc na przykład kryterium oszacowane dla modelu , można obliczyć różnice AIC_j od AIC ^ * = \ min_j {AIC_j}, a następnie RP_j = e ^ {(AIC ^ * - AIC_j) / 2} można interpretować jako względne prawdopodobieństwo, że model j będzie prawdziwy. Wagi są następnie definiowane jakoAICjjAICjAIC=minjAICjRPj=e(AICAICj)/2j

wj=RPjjRPj

Problem

Trudność, którą próbuję przezwyciężyć, polega na tym, że modele są szacowane na różnie przekształcone zmienne odpowiedzi (endogenne). Na przykład niektóre modele oparte są na rocznych stopach wzrostu, inne - na stopach wzrostu z kwartału na kwartał. Zatem wyodrębnione wartości AICj nie są bezpośrednio porównywalne.

Wypróbowane rozwiązanie

Ponieważ liczy się tylko różnica AIC można wziąć AIC modelu podstawowego AIC(na przykład próbowałem wyodrębnić lm(y~-1)model bez żadnych parametrów), który jest niezmienny dla transformacji zmiennych odpowiedzi, a następnie porównać różnice między j tym modelem a model podstawowy AIC . Tutaj jednak wydaje się słabe szczątki punkt - różnica jest dotknięte przez transformację zmiennej odpowiedzi.

Uwagi końcowe

Uwaga: opcja „oszacuj wszystkie modele na tych samych zmiennych odpowiedzi” jest możliwa, ale bardzo czasochłonna. Chciałbym poszukać szybkiego „lekarstwa” przed podjęciem bolesnej decyzji, jeśli nie ma innego sposobu rozwiązania problemu.

Dmitrij Celov
źródło

Odpowiedzi:

1

Myślę, że jedną z najbardziej wiarygodnych metod porównywania modeli jest krzyżowa walidacja błędu poza próbą (np. MAE). Trzeba będzie przekształcić zmienną egzogeniczną dla każdego modelu, aby bezpośrednio porównać jabłka z jabłkami.

Zach
źródło
Alternatywnym sposobem, który pozostawiłem dla jeszcze bardziej czasochłonnego podejścia, jest użycie błędów typu jack-knifed do oszacowania wag podobnych do Batesa i Grangera (1969) oraz powiązanych prac, takich jak kombinacje i obejmowanie Clements i Harvey Forecasts (2007). Słabym punktem podejścia opartego na błędach prognozowanych jest to, że jest ono średnio gorsze niż podejście oparte na informacjach (modelach). Ponieważ uśrednianie bayesowskie jest trudne, próbowałem zastosować prostszą metodę, którą można by pomyśleć o byciu BMA z informacyjnym priorem.
Dmitrij Celov,
Zauważ, że nie chcę ani porównywać i wybierać najlepszego modelu, ani nie szukam metody kombinacji najlepszych prognoz. Po prostu mam problemy z porównywaniem AIC z modeli opartych na różnie przekształconych zmiennych odpowiedzi .
Dmitrij Celov,
1
@Dmitrij Celov: Więc dlaczego porównujesz AIC? Należy pamiętać, że AIC jest asymptotycznie równoważne z pominięciem krzyżowej walidacji, więc podejrzewam, że porównania obu wskaźników byłyby podobne. stats.stackexchange.com/a/587/2817
Zach.
@DmitrijCelov: „Słabym punktem podejścia opartego na błędach prognozy jest to, że jest ono średnio gorsze niż podejście oparte na informacji (modelu)”. Gorszy pod jakim względem? Czy masz na to jakieś cytaty lub wyjaśnienia? Intuicja mówi mi, że to stwierdzenie jest złe, ale intuicja często się myli ...
Zach.
Prawdopodobnie doszedłem do szybkiego wniosku po uwadze w dokumencie roboczym G.Kapitanious i wsp. Kombinacje prognoz i pakiet metod prognoz statystycznych Banku Anglii, gdzie na str. 23 jest napisane, że „... łączenie prognoz na ogół nie zapewni optymalnej prognozy, a łączenie informacji będzie”. Asymptotyczna równoważność nie jest tym, co chciałbym mieć w małych próbkach danych makroekonomicznych, ale proste metody mogą przewyższyć bardziej złożone. Po prostu walidacja krzyżowa jest drugim najlepszym rozwiązaniem, noże podnośnikowe są produkowane w ciągu tygodnia, AIC w ciągu godziny. (Możemy iść na czat)
Dmitrij Celov,