Biorąc pod uwagę wszystkie dobre właściwości modeli przestrzeni stanów i KF, zastanawiam się - jakie są wady modelowania przestrzeni stanów i używania filtra Kalmana (lub EKF, UKF lub filtra cząstek) do oszacowania? Ponad, powiedzmy, konwencjonalne metodologie, takie jak ARIMA, VAR lub metody ad-hoc / heurystyczne.
Czy trudno je skalibrować? Czy są skomplikowane i trudne do zrozumienia, jak zmiana struktury modelu wpłynie na przewidywania?
Innymi słowy - jakie są zalety konwencjonalnych modeli ARIMA, VAR w porównaniu z modelami przestrzeni stanów?
Mogę myśleć tylko o zaletach modelu przestrzeni stanów:
- Z łatwością radzi sobie z pęknięciami strukturalnymi, przesunięciami, zmiennymi w czasie parametrami niektórych modeli statycznych - po prostu ustaw te parametry w stanach dynamicznych modelu przestrzeni kosmicznej, a model automatycznie dostosuje się do wszelkich zmian parametrów;
- Obsługuje brakujące dane bardzo naturalnie, po prostu wykonaj krok przejścia KF i nie rób kroku aktualizacji;
- Pozwala zmieniać parametry w locie samego modelu przestrzeni stanów (kowariancje szumów i macierze przejścia / obserwacji), więc jeśli twoja obecna obserwacja pochodzi z nieco innego źródła niż inne - możesz łatwo włączyć ją do estymacji bez robienia nic specjalnego;
- Korzystanie z powyższych właściwości pozwala łatwo obsługiwać dane o nieregularnych odstępach: albo zmieniaj model za każdym razem zgodnie z odstępem między obserwacjami, albo używaj regularnych odstępów i traktuj odstępy bez obserwacji jako brakujące dane;
- Pozwala na jednoczesne wykorzystanie danych z różnych źródeł w tym samym modelu w celu oszacowania jednej podstawowej wartości;
- Pozwala to zbudować model z kilku interpretowalnych, nieobserwowalnych komponentów dynamicznych i oszacować je;
- Dowolny model ARIMA może być reprezentowany w formie przestrzeni stanów, ale tylko proste modele w przestrzeni stanów mogą być reprezentowane dokładnie w formie ARIMA.
time-series
arima
kalman-filter
var
Kochede
źródło
źródło
Odpowiedzi:
Oto wstępna lista wad, które udało mi się wyciągnąć z twoich komentarzy. Krytyka i dodatki są mile widziane!
Ogólnie - w porównaniu z ARIMA, modele przestrzeni stanów pozwalają modelować bardziej złożone procesy, mają możliwą do interpretacji strukturę i łatwo radzą sobie z nieprawidłowościami danych; ale za to płacisz ze zwiększoną złożonością modelu, trudniejszą kalibracją, mniejszą wiedzą społeczności.
źródło
Dzięki @IrishStat za kilka bardzo dobrych pytań w komentarzach, odpowiedź na twoje pytania jest zbyt długa, aby opublikować jako komentarz, więc zamieszczam ją jako odpowiedź (niestety nie na oryginalne pytanie w temacie).
Pytania brzmiały: „ Czy wyraźnie identyfikuje zmiany trendu czasowego i zgłasza momenty, w których trend się zmienia? Czy rozróżnia zmiany parametrów i zmiany wariancji błędów i informuje o tym? Czy wykrywa i raportuje określone efekty wyprzedzenia i opóźnienia w pobliżu użytkownika określone predyktory? Czy można określić minimalną liczbę wartości w grupie przed zadeklarowaniem przesunięcia poziomu / trendu czasu lokalnego? Czy rozróżnia się potrzebę przekształceń mocy od deterministycznych punktów w czasie, w których zmienia się wariancja błędu? ”
źródło
Filtr Kalmana jest optymalnym liniowym estymatorem kwadratowym, gdy dynamika stanu i błędy pomiaru są zgodne z tak zwanymi liniowymi założeniami Gaussa ( http://wp.me/p491t5-PS ). Tak długo, jak znasz swoje modele dynamiki i pomiaru i są one zgodne z liniowymi założeniami Gaussa, nie ma lepszego estymatora w klasie liniowych estymatorów kwadratowych. Jednak najczęstszymi przyczynami „nieudanych” aplikacji filtrów Kalmana są:
Niedokładna / niepoprawna znajomość dynamiki stanu i modeli pomiarowych.
Niedokładna inicjalizacja filtra (zapewniająca oszacowanie stanu początkowego i kowariancję niezgodną z rzeczywistym stanem systemu). Można to łatwo obejść za pomocą procedury inicjowania ważonych najmniejszych kwadratów (WLS).
Zawierające pomiary będące statystycznymi „wartościami odstającymi” w odniesieniu do modelu dynamiki systemu. Może to spowodować, że Wzmocnienie Kalmana będzie miało ujemne elementy, co może prowadzić do nie dodatniej półokreślonej macierzy kowariancji po aktualizacji. Można tego uniknąć, stosując algorytmy „bramkowania”, takie jak bramkowanie elipsoidalne, do walidacji pomiaru przed zaktualizowaniem filtra Kalmana o ten pomiar.
Oto niektóre z najczęstszych błędów / problemów, które widziałem podczas pracy z filtrem Kalmana. W przeciwnym razie, jeśli założenia twoich modeli są prawidłowe, filtr Kalmana jest optymalnym estymatorem.
źródło
Możesz odwołać się do doskonałej książki Bayesian prognozowanie i modele dynamiczne (Harrison i West, 1997). Autorzy pokazują, że prawie wszystkie tradycyjne modele szeregów czasowych są szczególnymi przypadkami ogólnego modelu dynamicznego. Podkreślają również zalety. Być może jedną z głównych zalet jest łatwość, z jaką można zintegrować wiele modeli przestrzeni stanów, po prostu rozszerzając wektor stanu. Można na przykład bezproblemowo zintegrować regresory, czynniki sezonowe i komponent autoregresyjny w jednym modelu.
źródło
Dodałbym, że jeśli bezpośrednio użyjesz funkcji Space State, prawdopodobnie będziesz musiał zrozumieć kilka macierzy, które składają się na model, a także ich interakcje i działanie. Bardziej przypomina definiowanie programu niż definiowanie modelu ARIMA. Jeśli pracujesz z dynamicznym modelem przestrzeni stanu, staje się to jeszcze bardziej skomplikowane.
Jeśli używasz pakietu oprogramowania, który ma naprawdę, bardzo fajną funkcję State Space, możesz być w stanie tego uniknąć, ale ogromna większość takich funkcji w pakietach R wymaga w pewnym momencie przeskoczenia do szczegółów.
Moim zdaniem jest to bardzo podobne do statystyki bayesowskiej, której mechanizm wymaga więcej zrozumienia, troski i karmienia niż funkcji częstszych.
W obu przypadkach jest to warte dodatkowych informacji / wiedzy, ale może być barierą dla adopcji.
źródło