Jak modelować efekty miesiąc do miesiąca w danych dziennych szeregów czasowych?

11

Mam dwie serie danych dziennych. Jedna z nich to sign-upsdruga terminationssubskrypcja. Chciałbym przewidzieć ten drugi, wykorzystując informacje zawarte w obu zmiennych.

Patrząc na wykres tych serii, oczywiste jest, że zakończenia są skorelowane z wielokrotnością rejestracji sprzed miesięcy. Oznacza to, że skok liczby rejestracji w dniu 10 maja doprowadzi do wzrostu liczby wypowiedzeń w dniach 10 czerwca, 10 lipca i 10 sierpnia i tak dalej, chociaż efekt zanika.

Mam nadzieję uzyskać wskazówkę, które modele mogę zastosować do modelowania tego konkretnego problemu. Wszelkie porady będą mile widziane.

Do tej pory myślałem o modelu VAR, ale nie jestem pewien, jak uwzględnić efekt miesięczny - zastosować naprawdę dużą liczbę opóźnień lub w jakiś sposób dodać składnik sezonowy?

wije
źródło

Odpowiedzi:

1

Jak wygląda wykres CCF dla opóźnień od 29 do 31? Czy kolce są wystarczająco częste, aby się pojawiały? Możesz użyć testu Grangera, aby sprawdzić, które opóźnione wartości są istotne statystycznie.

tmakino
źródło
Tak, na wykresie CCF występują wyraźne skoki w opóźnieniach 28–31, szczególnie 30.
wije
1

Modele na poziomie miesiąca

Powinieneś uchwycić miesięczne różnice w skłonności do zakończenia (powiedzmy, że rejestracje podczas świąt Bożego Narodzenia są bardziej prawdopodobne, że zakończą się niż rejestracje w kwietniu). Powiedzmy, że twoim zwykłym modelem szeregów czasowych jest:

tmirmjanzatjaonst=β1sjasolnupst-1+β2)sjasolnupst-2)+..
. Teraz, jeśli uważasz, że parametryβ1 itp. są specyficzne dla miesiąca, możesz oddziaływać na flagę wskaźnika miesiąca z pozostałymi predyktorami.

W ten sposób twoja nowa forma funkcjonalna będzie

tmirmjanzatjaonst=β1sjasolnupst-1M.onthfalzasolt-1+β2)sjasolnupst-2)M.onthfalzasolt-1+..
Jest to podobne do budowania modeli na poziomie miesiąca, umożliwiając większą elastyczność w wychwytywaniu specyficznych dla miesiąca zmian tendencji do zakończenia
wabbit
źródło