Moja odpowiedź jest tak naprawdę skrótem javlacelle, ale jest za długa na prosty komentarz, ale nie za krótka, aby była bezużyteczna.
Chociaż odpowiedź jvlacelle jest technicznie poprawna na jednym poziomie, „nadmiernie upraszcza”, ponieważ opiera się na pewnych „rzeczach”, które zwykle nigdy nie są prawdziwe. Zakłada się, że nie jest wymagana struktura deterministyczna, taka jak jeden lub więcej trendów czasowych LUB jedno lub więcej przesunięć poziomu lub jeden lub więcej impulsów sezonowych lub jeden lub więcej impulsów jednorazowych. Ponadto zakłada się, że parametry zidentyfikowanego modelu są niezmienne w czasie, a proces błędu leżący u podstaw wstępnie zidentyfikowanego modelu jest również niezmienny w czasie. Ignorowanie któregokolwiek z powyższych jest często (zawsze moim zdaniem!) Przepisem na katastrofę, a ściślej „źle zidentyfikowanym modelem”. Klasycznym tego przykładem jest niepotrzebna transformacja logarytmiczna zaproponowana dla serii linii lotniczych i serii przedstawionych przez OP w jego zmienionym pytaniu. Nie ma potrzeby jakiejkolwiek transformacji logarytmicznej dla jego danych, ponieważ istnieje tylko kilka „niezwykłych” wartości w okresach 198,207,218,219 i 256, które nieleczone powodują fałszywe wrażenie, że istnieje większa wariancja błędu z wyższymi poziomami. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Nieleczone 219 i 256 powodują fałszywe wrażenie, że istnieje wyższa wariancja błędu przy wyższych poziomach. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Nieleczone 219 i 256 powodują fałszywe wrażenie, że istnieje wyższa wariancja błędu przy wyższych poziomach. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń.
Edytowane po opublikowaniu danych:
Rozsądny model został zidentyfikowany przy użyciu strony http://www.autobox.com/cms/, która jest oprogramowaniem zawierającym niektóre z moich wyżej wymienionych pomysłów, które pomogłem opracować. Test Chow dla stałości parametrów sugerował segmentację danych i wykorzystanie 94 ostatnich obserwacji, ponieważ parametry modelu zmieniały się w czasie. Ostatnie 94 wartości dały równanie, przy czym wszystkie współczynniki były znaczące. . Wykres reszt sugeruje rozsądne rozproszenie z następującym ACF sugerującym losowość . Rzeczywisty i oczyszczony wykres jest podświetlony, ponieważ pokazuje subtelne, ALE znaczące wartości odstające. . Wreszcie wykres rzeczywistej, dopasowanej i prognozy podsumowuje naszą pracę WSZYSTKO BEZ PODEJMOWANIA LOGARITHMS. Jest dobrze znane, ale często zapominane, że transformacje mocy są jak narkotyki ... nieuzasadnione użycie może ci zaszkodzić. Na koniec zauważ, że model ma AR (2), ALE nie strukturę AR (1).
Aby wyjaśnić koncepcje, poprzez wizualną kontrolę ACF lub PACF możesz wybrać (nie oszacować) wstępny model ARMA. Po wybraniu modelu można oszacować model, maksymalizując funkcję prawdopodobieństwa, minimalizując sumę kwadratów lub, w przypadku modelu AR, metodą momentów.
Model ARMA można wybrać po kontroli ACF i PACF. Podejście to opiera się na następujących faktach: 1) ACF stacjonarnego procesu AR rzędu p idzie do zera w tempie wykładniczym, podczas gdy PACF staje się zero po opóźnieniu p. 2) W przypadku procesu MA rzędu q teoretyczne ACF i PACF wykazują zachowanie odwrotne (ACF skraca się po opóźnieniu q, a PACF stosunkowo szybko zeruje się).
Zazwyczaj łatwo jest wykryć kolejność modelu AR lub MA. Jednak w przypadku procesów obejmujących zarówno część AR, jak i MA opóźnienie, w którym są one obcinane, może być rozmyte, ponieważ zarówno ACF, jak i PACF rozpadną się do zera.
Jednym ze sposobów postępowania jest dopasowanie najpierw modelu AR lub MA (tego, który wydaje się wyraźniejszy w ACF i PACF) niższego rzędu. Następnie, jeśli istnieje jakaś dalsza struktura, pojawi się w resztkach, więc ACF i PACF reszt są sprawdzane w celu ustalenia, czy konieczne są dodatkowe warunki AR lub MA.
Zwykle będziesz musiał spróbować zdiagnozować więcej niż jeden model. Możesz je również porównać, patrząc na AIC.
ACF i PACF, które opublikowałeś jako pierwszy, sugerowały ARiMR (2,0,0) (0,0,1), to znaczy regularne AR (2) i sezonowe MA (1). Część sezonowa modelu jest określana podobnie jak część regularna, ale z uwzględnieniem opóźnień w sezonowości (np. 12, 24, 36, ... w danych miesięcznych). Jeśli używasz R zaleca się zwiększyć domyślną liczbę opóźnień, które są wyświetlane,
acf(x, lag.max = 60)
.Fabuła, którą teraz wyświetlasz, ujawnia podejrzaną negatywną korelację. Jeśli ta fabuła opiera się na tym samym, co poprzednia fabuła, być może zrobiłeś zbyt wiele różnic. Zobacz także ten post .
Dalsze szczegóły można znaleźć między innymi tutaj: Rozdział 3 w Szeregach czasowych: Teoria i metody autorstwa Petera J. Brockwella i Richarda A. Davisa i tutaj .
źródło
arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))
i wyświetlenia ACF i PACF reszt. Należy również pamiętać o dalszych kwestiach poruszonych przez IrishStat, którymi należy się zająć w analizie.