Nie rozumiem, jaka dokładnie jest różnica między prognozami „w próbie” i „poza próbą”? Prognoza w próbie wykorzystuje podzbiór dostępnych danych do prognozowania wartości poza okresem szacowania. Prognoza poza próbą wykorzystuje zamiast tego wszystkie dostępne dane. Czy są one prawidłowe ?
Bardzo dokładnie, czy następująca definicja jest poprawna?
Prognoza wewnątrz próby wykorzystuje podzbiór dostępnych danych do prognozowania wartości poza okresem szacowania i porównania ich z odpowiednimi znanymi lub rzeczywistymi wynikami. Odbywa się to w celu oceny zdolności modelu do prognozowania znanych wartości. Na przykład prognoza wewnątrz próby z lat 1980–2015 może wykorzystywać dane z lat 1980–2012 do oszacowania modelu. Korzystając z tego modelu, prognostyk przewidziałby następnie wartości na lata 2013-2015 i porównał wartości prognozowane z rzeczywistymi znanymi wartościami. Prognoza bez próby wykorzystuje zamiast tego wszystkie dostępne dane w próbie do oszacowania modeli. W poprzednim przykładzie oszacowania przeprowadzonoby w latach 1980–2015, a prognozy rozpoczęłyby się w 2016 r.
źródło
Odpowiedzi:
Przez „próbkę” rozumie się próbkę danych, której używasz do dopasowania modelu.
Po pierwsze - masz próbkę
Po drugie - dopasowujesz model do próbki
Po trzecie - możesz użyć modelu do prognozowania
Jeśli prognozujesz obserwację, która była częścią próbki danych - jest to prognoza wewnątrz próby.
Jeśli prognozujesz obserwację, która nie była częścią próbki danych - jest to prognoza poza próbą.
Pytanie, które musisz sobie zadać, brzmi: czy konkretna obserwacja została zastosowana do dopasowania modelu, czy nie? Jeśli został użyty do dopasowania modelu, prognoza obserwacji jest w próbie. W przeciwnym razie jest poza próbą.
źródło
Załóżmy, że w Twojej próbce masz sekwencję 10 punktów danych. Dane te można podzielić na dwie części - np. Pierwsze 7 punktów danych do oszacowania parametrów modelu i kolejne 3 punkty danych do przetestowania wydajności modelu. Przy użyciu dopasowanego modelu prognozy wykonane dla pierwszych 7 punktów danych będą nazywane prognozą w próbie, a te same dla ostatnich 3 punktów danych zostaną wywołane z prognozy próbki. Jest to takie samo, jak pomysł podzielenia danych na zestaw szkoleniowy i zestaw sprawdzania poprawności.
źródło
Prognoza w próbie to proces formalnej oceny możliwości prognozowania modeli opracowanych przy użyciu zaobserwowanych danych w celu sprawdzenia skuteczności algorytmów w odtwarzaniu danych. Jest to trochę podobne do zestawu szkoleniowego w algorytmie uczenia maszynowego, a próba próbna jest podobna do zestawu testowego.
źródło
Poniższy schemat pomoże ci zrozumieć IN TIME i poza czasem
źródło
W prognozach szeregów czasowych „Insample” oznacza dane pociągu „Outsample” oznacza dane testowe
W szeregach czasowych możemy najpierw prognozować wyniki dla danych „Insample” (tj. Pociągu). Później możemy prognozować wyniki dla danych „outsample” (tj. Testowych).
źródło