Dostosowanie sezonowe jest kluczowym etapem wstępnego przetwarzania danych do dalszych badań. Badacz ma jednak wiele opcji rozkładu sezonowego w cyklu trendu. Najczęstszymi (sądząc po liczbie cytowań w literaturze empirycznej) rywalizującymi metodami rozkładu sezonowego są X-11 (12) -ARIMA, Tramo / Seats (oba zaimplementowane w Demetra + ) i 's stl . Dążąc do uniknięcia losowego wyboru wyżej wymienionych technik rozkładu (lub innych prostych metod, takich jak zmienne zmienne sezonowe) chciałbym poznać podstawową strategię, która prowadzi do skutecznego wyboru metody rozkładu sezonowego.
Kilka ważnych pytań (mile widziane są również linki do dyskusji):
- Jakie są podobieństwa i różnice, mocne i słabe strony metod? Czy są jakieś szczególne przypadki, w których jedna metoda jest bardziej preferowana niż inne?
- Czy możesz podać ogólne wskazówki na temat tego, co znajduje się w czarnej skrzynce różnych metod rozkładu?
- Czy istnieją specjalne sztuczki przy wyborze parametrów metod (nie zawsze jestem zadowolony z wartości domyślnych,
stl
na przykład ma wiele parametrów do rozwiązania, czasami wydaje mi się, że po prostu nie wiem, jak wybrać te w odpowiedni sposób). - Czy można zasugerować niektóre (statystyczne) kryteria, że szereg czasowy jest efektywnie dostosowywany sezonowo (analiza korelogramu, gęstość widmowa - kryteria małej próby - solidność?).
time-series
data-transformation
methodology
seasonality
Dmitrij Celov
źródło
źródło
Odpowiedzi:
Jeśli chcesz nauczyć się rozumieć diagnostykę, X12-ARIMA zapewnia mnóstwo diagnostyki, od wykresów (ASCII) do wskaźników praktycznych. Poznanie i zrozumienie diagnostyki jest czymś w rodzaju edukacji dotyczącej szeregów czasowych i dostosowywania sezonowego.
Z drugiej strony, oprogramowanie X12-ARIMA jest kucykiem jednopłatowym, podczas gdy użycie stl w R pozwoliłoby ci robić inne rzeczy i przełączać się na inne metody (rozkład, dlm, itp.), Jeśli chcesz.
Z drugiej strony X12-Arima ułatwia dołączanie zmiennych egzogenicznych i wskazywanie wartości odstających itp.
źródło
.out
plik zawiera strony diagnostyczne, a jeśli przeczytasz instrukcję i włączysz jeszcze kilka, dosłownie będziesz miał strony i strony informacyjne, wykresy ASCII i diagnostykę. Jest bardzo logicznie zorganizowany i ponumerowany, a wszystkie informacje diagnostyczne odnoszą się do części, z której pochodzą dane. Przejście przez te diagnostykę i nauczenie się, co jest konieczne do ich zrozumienia, jest bardzo edukacyjne. Niektóre z diagnostyki mają genialną heurystykę. Nie jest trudno umieścić większość tych informacji w plikach, które można łatwo zaimportować do R w celu manipulowania i prawidłowego tworzenia wykresów.To jest odpowiedź na pytanie 2.
źródło