To jest podstawowe pytanie dotyczące modeli Box-Jenkins MA. Jak rozumiem, model MA jest zasadniczo liniową regresję szeregów czasowych wartości przeciwko poprzednich kadencjach błędach . Oznacza to, że obserwacja najpierw regresji na jej poprzednich wartości , a następnie jedno lub więcej wartości są wykorzystywane jako źródła błędu dla modelu MA.
Ale jak obliczane są terminy błędów w modelu ARIMA (0, 0, 2)? Jeśli model MA jest używany bez części autoregresyjnej, a zatem nie ma wartości szacunkowej, to w jaki sposób mogę uzyskać warunek błędu?
regression
time-series
arima
box-jenkins
Robert Kubrick
źródło
źródło
Odpowiedzi:
Oszacowanie modelu MA:
Załóżmy szereg z 100 punktami czasowymi i powiedzmy, że charakteryzuje go model MA (1) bez przecięcia. Następnie model podaje
Termin błędu tutaj nie jest przestrzegany. Aby to uzyskać, Box i in. Analiza szeregów czasowych: Prognozowanie i kontrola (wydanie trzecie) , strona 228 , sugeruje, że składnik błędu jest obliczany rekurencyjnie przez,
Tak więc termin błędu dla to: ε 1 = y 1 + θ ε 0 Teraz nie możemy tego obliczyć bez znajomości wartości θ . Aby to osiągnąć, musimy obliczyć wstępną lub wstępną ocenę modelu, patrz Box i in. wspomnianej książki, Rozdział 6.3.2 strona 202 stwierdza, że:t=1
Zauważ, że jest szacowana autokorelacji. Więcej informacji znajduje się w rozdziale 6.3 - Wstępne oszacowania parametrów , proszę przeczytać o tym. Teraz, zakładając, że otrzymujemy wstępne oszacowanie θ = 0,5 . Następnie ε 1 = y 1 + 0,5 ε 0 Kolejnym problemem jest to, że nie mamy wartości dla ε 0, ponieważ t zaczyna się od 1, więc nie możemy obliczyć ε 1 . Na szczęście istnieją dwie metody uzyskania dwóch,rk θ=0.5
Według Box i in. W sekcji 7.1.3 na stronie 227 wartości można podstawić na zero jako przybliżenie, jeśli n jest umiarkowane lub duże, ta metoda jest prawdopodobieństwem warunkowym. W przeciwnym razie stosuje się Bezwarunkowe Prawdopodobieństwo, w którym wartość ε 0 jest uzyskiwana przez prognozowanie wsteczne, Box i in. polecam tę metodę. Przeczytaj więcej na temat prognozowania wstecznego w rozdziale 7.1.4 na stronie 231 .ε0 n ε0
Po uzyskaniu wstępnych oszacowań i wartości , w końcu możemy przystąpić do rekurencyjnego obliczenia składnika błędu. Ostatnim etapem jest oszacowanie parametru modelu ( 1 ) , pamiętaj, że nie jest to już wstępna ocena.ε0 (1)
Przy szacowaniu parametru wykorzystuję procedurę estymacji nieliniowej, szczególnie algorytm Levenberga-Marquardta, ponieważ modele MA są nieliniowe na jego parametrze.θ
Ogólnie rzecz biorąc, zdecydowanie polecam przeczytanie Box i in. Analiza szeregów czasowych: prognozowanie i kontrola (wydanie trzecie) .
źródło
Model Gaussa MA (q) jest zdefiniowany (nie tylko przez Boxa i Jenkinsa!) Jako więc model MA (q) jest „czystym” modelem błędu, a stopień q określa, jak daleko wstecz korelacja sięga.
źródło
You say "the observationY is first regressed against its previous values Yt−1,...,Yt−n and then one or more Y−Y^ values are used as the error terms for the MA model." What I say is that Y is regressed against two predictor series et−1 and et−2 yielding an error process et which will be uncorrelated for all i=3,4,,,,t .We then have two regression coefficients: θ1 representing the impact of et−1 and θ2 representing the impact of et−2 . Thus et is a white noise random series containing n-2 values. Since we have n-2 estimable relationships we start with the assumption that e1 and e2 are equal to 0.0 . Now for any pair of θ1 and θ2 we can estimate the t-2 residual values. The combination that yields the smallest error sum of squares would then be the best estimates of θ1 and θ2 .
źródło
See my post here for an explanation of how to understand the disturbance terms in a MA series.
You need different estimation techniques to estimate them. This is because you cannot first get the residuals of a linear regression and then include the lagged residual values as explanatory variables because the MA process uses the residuals of the current regression. In your example you are making two regression equations and using residuals from one into the other. This is not what an MA process is. It cannot be estimated with OLS.
źródło