Jestem zdezorientowany co do modelu wektorowej korekcji błędów ( VECM ).
Kontekst techniczny:
VECM oferuje możliwość zastosowania wektorowego modelu autoregresyjnego ( VAR ) do zintegrowanych wielowymiarowych szeregów czasowych. W podręcznikach wymieniają pewne problemy ze stosowaniem VAR do zintegrowanych szeregów czasowych, z których najważniejszym jest tak zwana regresja fałszywa (statystyki t są bardzo znaczące, a R ^ 2 jest wysoki, chociaż nie ma związku między zmiennymi).
Proces szacowania VECM składa się w przybliżeniu z trzech następujących kroków, z których mylący jest dla mnie pierwszy:
Specyfikacja i oszacowanie modelu VAR dla zintegrowanych wielowymiarowych szeregów czasowych
Oblicz testy współczynnika wiarygodności w celu ustalenia liczby relacji kointegracyjnych
Po określeniu liczby kointegracji oszacuj VECM
W pierwszym etapie szacuje się model VAR z odpowiednią liczbą opóźnień (stosując zwykłe kryteria dobroci dopasowania), a następnie sprawdza się, czy reszty odpowiadają założeniom modelu, mianowicie brak seryjnej korelacji i heteroscedastyczności oraz czy reszty są normalnie rozłożone . Tak więc sprawdza się, czy model VAR odpowiednio opisuje wielowymiarowe szeregi czasowe, i przechodzi do dalszych kroków tylko wtedy, gdy to robi.
A teraz moje pytanie: jeśli model VAR dobrze opisuje dane, dlaczego w ogóle potrzebuję VECM ? Jeśli moim celem jest generowanie prognoz , czy nie wystarczy oszacowanie VAR i sprawdzenie założeń, a jeśli są one spełnione, to po prostu skorzystaj z tego modelu?
źródło
Odpowiedzi:
The foremost advantage of VECM is that it has nice interpretation with long term and short term equations.
In theory VECM is just a representation of cointegrated VAR. This representation is courtesy of Granger's representation theorem. So if you have cointegrated VAR it has VECM representation and vice versa.
In practice you need to determine the number of cointegrating relationships. When you fix that number you restrict certain coefficients of VAR model. So advantage of VECM over VAR (which you estimate ignoring VECM) is that the resulting VAR from VECM representation has more efficient coefficient estimates.
źródło
I agree with mpiktas that the greatest interest of a VECM lies in the interpretation of the result, by introducing concepts such as long-term relationship between variables, and the associated concept of error correction, whereas one studies how deviations from the long-run are "corrected". Besides of this, indeed, if your model is correctly specified, the VECM estimates will be more efficient (as a VECM has a restricted VAR representation, while estimating VAR directly would not take this into account).
Jednak jeśli interesuje Cię tylko prognozowanie, jak się wydaje, być może nie jesteś zainteresowany tymi aspektami VECM. Ponadto określenie odpowiedniej rangi integrującej i oszacowanie tych wartości może spowodować niedokładności małych próbek, tak że nawet jeśli prawdziwym modelem był VECM, zastosowanie VAR do prognozowania może być lepsze. Wreszcie pojawia się pytanie o horyzont interesującej Cię prognozy, który wpływa na wybór modelu (niezależnie od tego, który model jest „prawdziwy”). O ile dobrze pamiętam, z literatury wynikają sprzeczne wyniki. Hoffman i Rasche twierdzą, że zalety VECM pojawiają się tylko na długim horyzoncie, ale Christoffersen i Diebold twierdzą, że nie masz nic przeciwko VAR na długi czas ...
Literatura (bez wyraźnego konsensusu) zaczynałaby się od:
Finally, there is thorough treatment (but not very clear in my opinion), discussion of your question in the Handbook of forecasting, chapter 11, Forecasting With Trending Data, Elliott.
źródło
My understanding may be incorrect, but isn't the first step is just fitting a regression between time series using OLS - and it shows you if time series are really cointegrated (if residuals from this regression are stationary). But then cointegration is kind of a long-term relation between time-series and your residuals although stationary may still have some short-term autocorrelation structure that you may exploit to fit a better model and get better predictions and this "long-term + short term" model is VECM. So if you need only long-term relation, you may stop at the first step and use just cointegration relation.
źródło
We can selection time series models based on whether the data are stationary.
źródło
You can't use VAR if the dependent variables are not stationary (that would be spurious regression). To solve for these issues, we have to test if the variables are cointegrated. In this case if we have a variable I(1), or all dependent variables are cointegrated at the same level, you can do VECM.
źródło
What I observed in VAR was that it is used to capture short-run relationship between the variables employed while VECM tests for the long-run relationship. For instance, in a topic where shock is being applied, I think the appropriate estimation technique should be VAR. Meanwhile, when testing through the process of unit root, co-integration, VAR and VECM, if the unit root confirmed that all the variables were I(1) in nature, you can proceed to co-integration and after tested for co-integration and the result confirmed that the variables are cointegrated meaning there is long-run relationship between the variables then you can proceed to VECM but if other wise you go for VAR.
źródło
One description I've found (http://eco.uc3m.es/~jgonzalo/teaching/timeseriesMA/eviewsvar.pdf) says:
Which seems to imply that a VEC is more subtle/flexible than simply using a VAR on first-differenced data.
źródło
If someone pops up here with the same question, here is the answer why one needs VECM instead of VAR. If your data is non stationary (finance data + some macro variables) you cannot forecast with VAR because it assume stationarity thus MLE (or OLS in this case) will produce forecasts that mean revert to quickly. VECM can handle this problem. (differenced series would not help)
źródło
As has been rightly pointed out in the earlier posts , A VECM enables you to use non stationary data ( but cointegrated) for intepretation. This helps retain the relevant information in the data ( which would otherwise get missed on differencing of the same)
źródło