Narysowałem następujący kod z funkcją stl (Seasonal Decomposition of Time Series by Loess):
plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))
Pokazuje znaczącą zmienność sezonową z losowymi danymi umieszczonymi powyżej w kodzie (funkcja rnorm). Odmiana sygnalizująca jest widoczna za każdym razem, gdy jest uruchamiana, chociaż wzór jest inny. Dwa takie wzory pokazano poniżej:
Jak możemy polegać na funkcji stl na niektórych danych, gdy pokazuje ona zmiany sezonowe. Czy tę sezonową zmienność należy postrzegać w świetle innych parametrów? Dzięki za wgląd.
Kod pochodzi z tej strony: Czy jest to właściwa metoda testowania sezonowości w danych dotyczących liczby samobójstw?
Odpowiedzi:
Rozkład Loess ma na celu wygładzenie szeregu poprzez zastosowanie średnich do danych, tak aby zapadły się w składniki, np. Trend lub sezon, które są interesujące do analizy danych. Ale ta metodologia nie ma na celu przeprowadzenia formalnego testu na obecność sezonowości .
Chociaż w twoim przykładzie
stl
zwracany jest wygładzony wzór okresowości sezonowej, wzór ten nie jest istotny dla wyjaśnienia dynamiki serii. Aby to zobaczyć, możemy porównać wariancję każdego komponentu w odniesieniu do wariancji oryginalnej serii.Widzimy, że to pozostała część wyjaśnia większość wariancji danych (jak można oczekiwać w przypadku procesu białego szumu).
Jeśli weźmiemy szereg z sezonowością, względna wariancja składnika sezonowego jest znacznie bardziej istotna (chociaż nie mamy prostego sposobu na przetestowanie go, ponieważ less nie jest parametryczny).
Względne wariancje wskazują, że sezonowość jest głównym składnikiem wyjaśniającym dynamikę serii.
Nieostrożne spojrzenie na fabułę
stl
może być zwodnicze. Przywołany ładny wzórstl
może przypuszczać, że w danych można zidentyfikować odpowiedni wzorzec sezonowy, ale dokładniejsze przyjrzenie się może ujawnić, że tak nie jest. Jeśli celem jest podjęcie decyzji o występowaniu sezonowości, mniejszy rozkład może być przydatny jako wstępny pogląd, ale należy go uzupełnić innymi narzędziami.źródło
W podobny sposób widziałem wykorzystanie modeli Fouriera do danych niesezonowych, zmuszając strukturę sezonową do dopasowania i wartości prognozy, powodując podobny (wstrzymujący oddech!) Wynik. Dopasowanie założonego modelu daje użytkownikowi to, co narzuca / zakłada, co nie zawsze jest tym, co sugerują / dostarczają dobre analizy.
źródło
stl()
nie opiera się na ideach Fouriera. Chociaż nie widziałem jeszcze nikogo, kto opowiada się za „bezmyślną” analizą, zauważ, że każda dopasowana rodzina modeli może być uznana za narzuconą lub domniemaną. Pytanie brzmi, jak daleko jakakolwiek procedura umożliwia użytkownikom zdawanie sobie sprawy z tego, czy i jak źle działa dla określonego zestawu danych.