Pracuję nad opracowaniem modelu do przewidywania całkowitej sprzedaży produktu. Mam około półtora roku rezerwacji, więc mógłbym przeprowadzić standardową analizę szeregów czasowych. Mam jednak również wiele danych na temat każdej „możliwości” (potencjalnej sprzedaży), która została zamknięta lub utracona. „Możliwości” są realizowane etapami rurociągu, dopóki nie zostaną zamknięte lub utracone; powiązali również dane dotyczące potencjalnego nabywcy, sprzedawcy, historii interakcji, branży, szacowanej wielkości rezerwacji itp.
Moim celem jest ostatecznie przewidzieć całkowitą liczbę rezerwacji, ale chcę uwzględnić wszystkie te informacje o obecnych „możliwościach”, które są prawdziwą „pierwotną przyczyną” rezerwacji.
Jednym z moich pomysłów jest użycie dwóch różnych modeli szeregowo w następujący sposób:
Użyj historycznych „szans”, aby zbudować model, który przewiduje rezerwacje wynikające z indywidualnej „szansy” (prawdopodobnie użyłbym losowych lasów lub nawet zwykłej starej regresji liniowej na tym etapie).
Skorzystaj z modelu od 1, aby przewidzieć szacowane rezerwacje wszystkich „szans” obecnie w przygotowaniu, a następnie zsumuj te szacunki na podstawie miesiąca, w którym każda „szansa” została utworzona.
Użyj modelu szeregów czasowych (być może ARIMA?), Korzystając z 1,5-miesięcznych historycznych danych szeregów czasowych ORAZ przewidywanych (przy użyciu modelu z 1) całkowitych rezerwacji wszystkich „możliwości” utworzonych w tym miesiącu.
To prawda, że opóźnienie w tych możliwościach przekształci się w faktyczne rezerwacje, ale model szeregów czasowych powinien być w stanie poradzić sobie z opóźnieniem.
Jak to brzmi? Dużo czytałem na temat szeregów czasowych i przewidywania sprzedaży, a z tego, co mogę powiedzieć, jest to dość wyjątkowe podejście. Dlatego naprawdę doceniam wszelkie opinie!
źródło
Odpowiedzi:
Możesz skończyć z modelem, który wydaje się pasować do twoich bieżących danych, ale przestanie działać, gdy tylko spróbujesz wygenerować prognozę poza próbą. Rozważ sporządzenie prognozy na 6 miesięcy. Nie masz możliwości dowiedzenia się, jakie będą szanse za sześć miesięcy, więc będziesz musiał stworzyć kolejny zestaw modeli przewidujących każde z danych wejściowych do twojego modelu szans. A kiedy to zrobisz, będziesz mieć wiele modeli zasilających twój główny model, ale do każdego z małych modeli będzie dołączony własny błąd przewidywania, i będą one złożone, ale twój główny model nie będzie wiedzieć o nich, w wyniku czego wszystkie przedziały prognozowania zostaną rażąco obniżone.
źródło