Wydaje się, że nie ma standardowego sposobu radzenia sobie z brakującymi danymi w kontekście rodziny modeli wygładzania wykładniczego. W szczególności implementacja R zwana ets w pakiecie prognozy wydaje się brać najdłuższą podsekwencję bez brakujących danych, a książka „Prognozowanie z wygładzaniem wykładniczym” Hyndmana i in. wydaje się wcale nie mówić o brakujących danych.
Chciałbym zrobić coś więcej, jeśli moi użytkownicy wyraźnie mnie o to poproszą (i jeśli brakujące dane nie pojawią się zbyt blisko siebie lub w zbyt wielu okresach, które są dokładnie w jednym sezonie). W szczególności mam na myśli następujące kwestie. Podczas symulacji, gdy ja wystąpienia braku wartości , ja zastąpić bieżący punkt prognozę ~ y t w y t tak, że ε t = 0 . Spowodowałoby to na przykład, że punkt danych nie byłby brany pod uwagę w procesie optymalizacji parametrów.
Czy przy tej metodzie znane są pułapki?
źródło
Odpowiedzi:
Twoje podejście ma sens. Właśnie to zrobiło komercyjne oprogramowanie, z którym byłem związany przez kilka lat.
Twój kontur dotyczy wygładzania jednoskładnikowego (SES), ale oczywiście możesz zastosować to samo traktowanie do trendów lub składników sezonowych. W przypadku sezonowych należy cofnąć pełny cykl sezonowy, podobnie jak w przypadku aktualizacji.
Inną alternatywą byłoby oczywiście po prostu interpolowanie brakujących wartości. Jest to opcja w nowszych wersjach
ets(..., na.action="na.interp")
.Z tego, co niewiele wiem o modelach przestrzeni stanów, nie powinno być zbyt trudne traktowanie po prostu brakujących danych jako niezauważonych. Nie jestem pewien, dlaczego nie zostało to zaimplementowane w
forecast
pakiecie. Szybkie przeszukanie bloga Roba Hyndmana nie przyniosło nic użytecznego.źródło