Jak obliczyć błąd prognozy (przedziały ufności) dla bieżących okresów?

Często muszę prognozować przyszłe okresy w miesięcznych seriach danych.

Dostępne są formuły do obliczania przedziału ufności dla alfa dla następnego okresu w szeregu czasowym, ale nigdy nie obejmuje to sposobu traktowania drugiego okresu, trzeciego okresu itp.

Wyobrażam sobie wizualnie, że jeśli jakakolwiek prognoza byłaby wykreślona z górnymi i dolnymi przedziałami ufności, ogólnie te przedziały powinny wykładniczo zwiększać się lub zmniejszać w stosunku do średniej prognozy, ponieważ niepewność jest skumulowaną siłą.

Załóżmy, że miałem sprzedaż jednostkową w kwietniu = 10 maja = 8 czerwca = 11 lipca = 13 i nie ma innych kontekstów, takich jak dane sezonowe lub dane o populacji

Musimy prognozować (choć na ślepo) sierpień, wrzesień, październik.

Jakiej metody byś użył? a co ważniejsze tutaj, jak zmierzysz zaufanie we wrześniu i październiku?

Przepraszam, że dla niektórych ekspertów może to być proste pytanie - szukam daleko w celu uzyskania jasnej odpowiedzi i jestem pewien, że wszyscy amatorzy tacy jak ja chcieliby to zrozumieć.

confidence-interval forecasting Nacięcie
źródło

Odpowiedzi:

Istnieje tak wiele wąskich aspektów obliczania przedziałów predykcji : proces generowania danych i model opisany w tym procesie (model szeregów czasowych, model regresji) są danymi stacjonarnymi (dla tego typu wniosek jest błędny, ponieważ dane stacjonarne nie mają tendencji do działania daleko od jego średniej wartości) lub wybuchowy (w przypadku zintegrowanego procesu zobaczysz coś, co opisałeś). Myślę, że znakomita recenzja Chrisa Chatfielda dotycząca przedziałów prognostycznych odpowie na większość twoich pytań.

W odniesieniu do sprzedaży jednostkowej:

ponieważ masz krótki przedział prognozowania, możesz spróbować przewidzieć przez wygładzanie wykładnicze (w R jest to ets()funkcja od forecast)
inną opcją byłoby modelowanie go jak proces ARIMA (ta sama biblioteka ma auto.arima())
w mikroekonometrii modele regresji są jednak lepsze niż modele teoretyczne, ale w krótkim okresie niekoniecznie pokonują dwa pierwsze

Oba przypadki mają wzory do obliczania przedziałów prognozowania i są omówione we wspomnianym wyżej przeglądzie (zwykle przyjmuje się normalność reszt, ale nie jest to kluczowe założenie).

Dmitrij Celov
źródło

@Nick, jeśli będziesz miał trudności z przeczytaniem artykułu, możesz poprosić o pomoc.

Dmitrij Celov

+1 za pakiet „prognozy”. Nawet jeśli masz własny model wygładzania wykładniczego lub model arima, zawiera on funkcje przewidywania dla obu klas modeli, które zawierają przedziały ufności.

Zach

@Dmitrij Dziękuję. Po twojej odpowiedzi i poznaniu R zacząłem się dopiero o nim uczyć i o funkcjach. Otwiera się o wiele więcej niż cel.

Nick