Czy istnieje wyraźna różnica między prognozami w próbie a pseudo prognozami poza próbą . Oba mają na celu ocenę i porównanie modeli prognozowania.
Czy istnieje wyraźna różnica między prognozami w próbie a pseudo prognozami poza próbą . Oba mają na celu ocenę i porównanie modeli prognozowania.
Załóżmy, że masz dane , gdzie a Twoim celem jest zbudowanie modelu (powiedzmy , ), aby przewidzieć biorąc pod uwagę . Dla konkretności załóżmy, że dane są codzienne, a odpowiada dzisiejszemu.
Analiza w próbie oznacza oszacowanie modelu przy użyciu wszystkich dostępnych danych do T włącznie , a następnie porównanie dopasowanych wartości modelu z rzeczywistymi realizacjami. Jednak wiadomo, że ta procedura rysuje zbyt optymistyczny obraz zdolności prognozowania modelu, ponieważ popularne algorytmy dopasowania (np. Wykorzystujące błąd kwadratu lub kryteria prawdopodobieństwa) zwykle starają się uniknąć dużych błędów prognozowania, a zatem są podatne na nadmierne dopasowanie - pomyłkowy hałas dla sygnału w danych.
Prawdziwą analizą poza próbą byłoby oszacowanie modelu na podstawie danych do dnia dzisiejszego, zbudowanie prognozy wartości jutra , poczekanie do jutra, zapisanie błędu prognozy ponownie oszacuj model, stwórz nową prognozę i tak dalej. Na koniec tego ćwiczenia można by uzyskać próbkę błędów prognozy które byłyby naprawdę poza próbą i dałyby bardzo realistyczny obraz wydajność modelu. e T Y , T + 2 { e T + l } L L = 1
Ponieważ ta procedura jest bardzo czasochłonna, ludzie często uciekają się do analizy „pseudo” lub „symulowanej” poza próbą, co oznacza naśladowanie procedury opisanej w ostatnim akapicie, przy użyciu raczej historycznej daty , raczej niż dzisiejsza data , jako punkt początkowy. Wynikające z tego błędy prognozowania są następnie wykorzystywane do oszacowania zdolności prognozowania modelu poza próbą.T { e t } T t = T 0 + 1
Zauważ, że analiza pseudo poza próbą nie jest jedynym sposobem na oszacowanie wydajności modelu poza próbą. Alternatywy obejmują walidację krzyżową i kryteria informacyjne.
Bardzo dobre omówienie wszystkich tych zagadnień znajduje się w rozdziale 7
http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf