Od dwóch lat prowadzę działalność online, więc mam miesięczne dane dotyczące sprzedaży od około dwóch lat. Na mój biznes na każdy miesiąc z pewnością ma wpływ sezonowa huśtawka (działa lepiej w Boże Narodzenie itp.) I prawdopodobnie kilka innych czynników, których nie jestem świadomy.
W celu lepszego przewidywania przyszłej sprzedaży oraz w celu oceny skuteczności mojej kampanii sprzedażowej lub wpływu nowych konkurentów, chcę być w stanie opracować odpowiedni model szeregów czasowych, aby ekstrapolować moje bieżące dane sprzedażowe na przyszłość. Dzieje się tak, gdy porównując wynik mojej prognozy z faktycznym wynikiem, mogę ilościowo przetestować skuteczność mojej kampanii sprzedażowej lub wpływ konkurencji.
Moje pytanie brzmi: biorąc pod uwagę, że mam dane sprzedaży za 2 lata, czy w każdym razie mogę sformułować model prognozowania szeregów czasowych?
Uwaga: Bardziej interesują mnie koncepcje i teorie tła, niż narzędzia czarnej skrzynki. Mówiąc o narzędziach, mam matematykę, matlaba, R, Excela, arkusz kalkulacyjny Google ... ty to nazywasz.
źródło
Odpowiedzi:
Tak, są na to sposoby. Ludzie zarabiają na życie robiąc takie rzeczy ;-)
Szukasz prognozowania przyczynowego . Przejrzyj ten darmowy podręcznik online dotyczący prognozowania, aby dowiedzieć się o metodologii prognozowania.
Masz dwie kluczowe kwestie, z którymi musisz sobie poradzić: sezonowość (lub bardziej ogólnie, struktura szeregów czasowych, być może z autoregresją) z jednej strony i efekty przyczynowe, takie jak promocje z drugiej strony. Rozdział 8 w powyższym podręczniku dotyczy szeregów czasowych w kontekście ARIMA, podczas gdy rozdział 5 dotyczy efektów przyczynowych.
Na szczęście można rozwiązać oba problemy, obliczając modele ARIMAX (X oznacza „efekty zewnętrzne”, tj. ARIMA z efektami zewnętrznymi) lub regresje z błędami ARIMA. Zobacz blog Roba Hyndmana na temat „Błędu modelu ARIMAX” .
auto.arima()
Funkcji wforecast
pakiecie R pasuje regresji z błędami ARIMA. Przejdźmy przez przykład, w którym biorę standardowy zestaw danych o silnych trendach i sezonowości i dodam „promocje”.Czerwone kropki to promocje. Domyślnie interwały przewidywania są drukowane na szaro. Możesz podać wiele regresorów do swojego modelu za pomocą
xreg
parametru, co powinieneś zrobić, jeśli masz różne rodzaje promocji z różnymi efektami. Eksperymentuj trochę.Poleciłbym przyjrzeć się bardziej szczegółowym danym niż miesięcznym, jeśli je masz, np. Co tydzień. Zwłaszcza oczywiście, jeśli Twoje promocje nie będą trwały przez pełne miesiące. Możesz to zrobić osobno według produktu, szczególnie jeśli promujesz określone produkty lub całe kategorie.
Alternatywą byłoby, biorąc pod uwagę, że bardziej interesujesz się koncepcjami niż kodem, aby spojrzeć na Wygładzanie wykładnicze i zmienić go zgodnie z własnymi potrzebami, dodając elementy promocyjne do standardowych trzech poziomów, sezonów i trendów. Wygładzanie wykładnicze możesz zrobić znacznie więcej niż próbując oszacować maksymalne prawdopodobieństwo modelu ARIMAX, ale wygładzanie może przerodzić się w koszmar księgowości, jeśli masz wiele rodzajów promocji.
źródło
po pierwsze, nie masz dużo danych do zabawy, tylko 24 obserwacje. W twoim przypadku oznacza to, że ledwo masz kilka parametrów do wiarygodnego oszacowania. najbardziej systematycznym sposobem prognozowania jest opracowanie procesu generowania danych (MZD). zakładasz, jaki jest prawdziwy proces sprzedaży, a następnie próbujesz oszacować jego parametry.
w Matlab ten model jest określony jako
arima('ARLags',1,'SARLags',12)
zakłada to, że sprzedaż jest stabilna, tzn. ogólnie nie rośnie.
jeśli uważasz, że Twoja sprzedaż rośnie, masz dwie opcje: losowy spacer (RW) i trend czasowy.
w Matlab RW jest określony za pomocą
arima('D',1,'SARLags',12)
oczywiście są to tylko przykłady różnych MZD. cokolwiek robisz, pamiętaj o liczbie parametrów do oszacowania. z 24 obserwacjami twój model musi być bardzo prosty, maksymalnie 4 parametry (w tym wariancje).
źródło
Oto, co powinieneś zrobić Zrób dwa wykresy:
Spojrzeć na nich. Zanotuj daty specjalnych promocji lub znanych działań konkurencyjnych. „Grudzień” jest zwykle dość oczywisty, ale dodaj notatkę, jeśli pomoże ci to wywołać.
Śmiało i dopasuj model szeregów czasowych - dowolny model (są ich setki). Model może dać ci nieco lepszą prognozę na następny okres (t + 1) niż twój osąd. Przynajmniej podważy twój osąd. Poza kolejnym okresem (t + n, n> 1) każdy model szeregów czasowych jest gównem. † Więc zapomnij o ilościowej ocenie skuteczności kampanii sprzedażowych lub efektów konkurencji. Jeśli porównasz rzeczywistą sprzedaż z prognozami, okaże się, że prognozy są bzdurne. Przewidywanie przyszłości jest trudne i żadna metoda nie zmienia tego podstawowego faktu.
Przydatne będą dwa wykresy. Przestudiuj je przez chwilę, a następnie spędź resztę czasu na wymyślaniu pomysłów na zwiększenie sprzedaży - będzie to o wiele bardziej opłacalne wykorzystanie twojego czasu niż próba dopasowania modelu szeregów czasowych.
† Masz więcej nadziei, jeśli możesz stworzyć model predykcyjny oparty na wiodących wskaźnikach - tzn. Sprzedaż mieszkań w poprzednim miesiącu może być przydatna do przewidywania sprzedaży odcieni okien w bieżącym miesiącu.
źródło