Wzrost skorygowany sezonowo z miesiąca na miesiąc z podstawową tygodniową sezonowością

9

Jako hobby poboczne zajmowałem się prognozowaniem szeregów czasowych (w szczególności przy użyciu R).

Dla moich danych mam liczbę odwiedzin dziennie, na każdy dzień sięgający prawie 4 lat. W tych danych są pewne wyraźne wzorce:

  1. Poniedziałek-piątek ma wiele odwiedzin (najwyższe w Pon / Wt), ale drastycznie mniej w soboty i soboty.
  2. Spadają niektóre pory roku (tj. O wiele mniej wizyt wokół świąt amerykańskich, lata wykazują mniejszy wzrost)
  3. Znaczący wzrost z roku na rok

Byłoby miło móc prognozować nadchodzący rok na podstawie tych danych, a także wykorzystać go do sezonowego wzrostu z miesiąca na miesiąc. Najważniejszą rzeczą, która mnie wyrzuca z miesięcznego widoku, jest:

  • Niektóre miesiące będą miały więcej Pon / Wt niż inne miesiące (i to też nie jest konsekwentne przez lata). Dlatego też miesiąc, który przypada na więcej dni powszednich, musi zostać odpowiednio dostosowany.

Odkrywanie tygodni wydaje się również trudne, ponieważ systemy numeracji tygodni zmieniają się z 52-53 w zależności od roku i wydaje się, że tsto nie obsługuje.

Zastanawiam się, czy nie wziąć średniej dla dni powszednich miesiąca, ale wynikowa jednostka jest nieco dziwna (wzrost w średniej liczbie odwiedzin w dni powszednie) i to byłoby odrzucenie danych, które są prawidłowe.

Wydaje mi się, że tego rodzaju dane byłyby powszechne w szeregach czasowych (powiedzmy na przykład, że zużycie energii elektrycznej w budynku biurowym może być coś takiego), ktoś ma jakieś porady, jak to modelować, w szczególności w R?

Dane, z którymi pracuję, są dość proste, zaczynają się tak:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

i trwa do dzisiaj, z ogólną tendencją wzrostu, niektóre spadki w tygodniach świąt w USA i wzrost ogólnie spowalnia w okresie letnim.

Kyle Brandt
źródło
Innym interesującym aspektem danych jest to, że zdarzają się nagłe zdarzenia, które zakłócają ogólny trend wzrostu o okres ~ kilku miesięcy. Jednak w tej chwili, gdy jestem na etapie próbowania właściwego ustawienia sezonowości, ignoruję ten aspekt.
Kyle Brandt
Popraw mnie, jeśli nie używam poprawnie „sezonowości”. Obecnie myślę o tupotie w podanej jednostce czasu. Tak więc „Cotygodniowa sezonowość” oznacza dla mnie „Wzór, który powtarza się co tydzień”.
Kyle Brandt
Hmm, brzmi znajomo (-;
Zobacz odpowiedzi na stats.stackexchange.com/questions/14742/… . Może być punktem wyjścia.
Peter Ellis
Może w centrum tego jest połączenie tygodnia + roku? Wydaje się ts(a nawet msts) nie pasuje do tygodniowego okresu próbkowania z „naturalnym” okresem roku (chyba też nie kalendarze). Albo po prostu nie rozumiem, jak to zrobić ...
Kyle Brandt

Odpowiedzi:

5

Cały czas modeluję takie dane. Musisz się włączyć

  • dzień tygodnia
  • efekty wakacyjne (ołów, współczesne i opóźnienia)
  • specjalne dni miesiąca
  • może piątek przed świętami lub poniedziałek po wakacjach
  • tygodniowe efekty
  • efekty miesięczne
  • Struktura ARIMA do renderowania błędów biały szum;
  • i in. .

Podejście statystyczne nazywa się modelowaniem funkcji przenoszenia z wykrywaniem interwencji. Jeśli chcesz udostępnić swoje dane prywatnie za pośrednictwem [email protected] lub najlepiej za pośrednictwem SE, z przyjemnością przedstawię ci specyfikę ostatecznego modelu i poszerzy twoją zdolność do zrobienia tego samemu, a przynajmniej pomoże ci i inni, aby zrozumieć, co należy zrobić i co można zrobić. W obu przypadkach wyjdziesz mądrzejszy, nie wydając żadnego skarbu, ani monety, ani czasu. Możesz przeczytać niektóre z moich innych odpowiedzi na pytania z serii czasowej, aby dowiedzieć się więcej.

IrishStat
źródło