Załóżmy, że mam trochę ponad 20 000 miesięcznych szeregów czasowych od stycznia do 05 grudnia. Każdy z nich reprezentuje globalne dane dotyczące sprzedaży innego produktu. Co jeśli zamiast obliczać prognozy dla każdego z nich, chciałbym skoncentrować się tylko na niewielkiej liczbie produktów, które „faktycznie mają znaczenie”?
Mógłbym uszeregować te produkty według całkowitych rocznych przychodów i skrócić listę za pomocą klasycznego Pareto. Mimo to wydaje mi się, że chociaż nie mają większego wpływu na wyniki finansowe, niektóre produkty są tak łatwe do przewidzenia, że ich pominięcie byłoby złym osądem. Produkt, który w ciągu ostatnich 10 lat sprzedawał 50 $ każdego miesiąca, może nie brzmieć zbyt wiele, ale generowanie prognoz dotyczących przyszłej sprzedaży wymaga tak niewielkiego wysiłku, że równie dobrze mogę to zrobić.
Powiedzmy, że dzielę moje produkty na cztery kategorie: wysokie przychody / łatwe do prognozowania - niskie przychody / łatwe do prognozowania - wysokie przychody / trudne do prognozowania - niskie przychody / trudne do prognozowania.
Myślę, że rozsądne byłoby pozostawienie tylko tych szeregów czasowych należących do czwartej grupy. Ale jak dokładnie mogę ocenić „przewidywalność”?
Współczynnik zmienności wydaje się dobrym punktem wyjścia (pamiętam też jakiś artykuł na ten temat jakiś czas temu). Ale co jeśli moje serie czasowe wykazują sezonowość / przesunięcia poziomów / efekty kalendarza / silne trendy?
Wyobrażam sobie, że moją ocenę powinien opierać wyłącznie na zmienności elementu losowego, a nie na podstawie „surowych” danych. A może coś mi brakuje?
Czy ktoś wcześniej napotkał podobny problem? Jak byście to zrobili?
Jak zawsze każda pomoc jest mile widziana!
Jest to dość powszechny problem w prognozowaniu. Tradycyjnym rozwiązaniem jest obliczanie średnich bezwzględnych błędów procentowych (MAPE) dla każdego elementu. Im niższa wartość MAPE, tym łatwiej jest przewidzieć pozycję.
Jednym z problemów jest to, że wiele serii zawiera wartości zerowe, a następnie MAPE jest niezdefiniowany.
Serie łatwe do prognozowania powinny mieć niskie wartości MASE. Tutaj „łatwa do prognozowania” jest interpretowana w stosunku do sezonowej naiwnej prognozy. W niektórych okolicznościach bardziej sensowne może być zastosowanie alternatywnej miary podstawowej do skalowania wyników.
źródło
Ale może możesz spróbować zastosować miarę MASE zaproponowaną przez Roba do zgrubnego rozdzielenia siatki 20 000 w kilku podgrupach, a następnie zastosować ForeCA do każdej z nich osobno.
źródło
Ta odpowiedź jest bardzo późna, ale dla tych, którzy wciąż szukają odpowiedniej miary przewidywalności dla szeregów czasowych zapotrzebowania na produkt, gorąco polecam przyjrzenie się przybliżonej entropii .
Popyt na produkty ma zwykle bardzo silny składnik sezonowy, co powoduje, że współczynnik zmienności (CV) jest nieodpowiedni. ApEn (m, r) jest w stanie poprawnie to obsłużyć. W moim przypadku, ponieważ moje dane mają tendencję do silnej tygodniowej sezonowości, ustawiłem parametry m = 7 i r = 0,2 * std zgodnie z zaleceniami tutaj .
źródło