Używam filtra Kalmana w bardzo standardowy sposób. System jest reprezentowany przez równanie stanu i równanie obserwacyjne .
Podręczniki uczą, że po zastosowaniu filtru Kalmana i uzyskaniu „prognoz o jeden krok do przodu” (lub „filtrowanego oszacowania”), powinniśmy użyć ich do obliczenia funkcji prawdopodobieństwa:
Moje pytanie brzmi: dlaczego funkcja prawdopodobieństwa jest obliczana przy użyciu „oszacowania filtrowanego” a nie „wygładzonego oszacowania” ? Czy jest lepszym oszacowaniem wektora stanu?
likelihood
kalman-filter
Gustavo Amarante
źródło
źródło
Odpowiedzi:
Aby odpowiedzieć na twoje pytanie: możesz użyć gęstości wygładzania. Ale nie musisz. Odpowiedź Jarle Tufto ma rozkład, którego używasz. Ale są też inni.
Korzystanie z Kalman Recursions
Tutaj oceniasz prawdopodobieństwo jako
Jednak średnie i wariancje nie zawsze w pełni definiują rozkłady prawdopodobieństwa w ogóle. Poniżej znajduje się rozkład, którego używasz, aby przejść z filtrowania dystrybucji do prawdopodobieństw warunkowychf ( y i | y 1 , … , y i - 1 )fa( xi - 1| y1, … , Yi - 1) fa( yja| y1, … , Yi - 1) :
Tutaj to gęstość przejścia stanu ... część modelu, a to gęstość obserwacji ... część modelu ponownie. W swoim pytaniu piszesz je jako if ( y i | x i ) x t + 1 = F x t + v t + 1 y t = H x t + A z t + w tfa( xja| xi - 1) fa( yja| xja) xt + 1= F.xt+ vt + 1 yt= Hxt+ A zt+ wt . To jest to samo.
Gdy pojawi się rozkład predykcji stanu o jeden krok do przodu, jest to obliczanie∫fa( xja| xi - 1) f( xi - 1| y1, … , Yi - 1) dxi - 1 . Po ponownej integracji uzyskujesz (1) całkowicie. Zapisujesz tę gęstość całkowicie w swoim pytaniu, i to jest to samo.
Tutaj używasz tylko rozkładów rozkładów prawdopodobieństwa i założeń dotyczących modelu. To obliczenie prawdopodobieństwa jest dokładnym obliczeniem. Nie ma nic uznaniowego, czego można by użyć, aby zrobić to lepiej lub gorzej.
Korzystanie z algorytmu EM
Według mojej wiedzy nie ma innego sposobu oceny prawdopodobieństwa bezpośrednio w tego rodzaju modelu przestrzeni stanów. Nadal jednak można wykonać oszacowanie maksymalnego prawdopodobieństwa, oceniając inną funkcję: można użyć algorytmu EM. W kroku Oczekiwanie (E-krok) obliczasz f ( y 1 , … , y n , x 1 , … , x n )
Inne rzeczy
Czytałem w miejscach, że EM jest „bardziej stabilnym” sposobem na maksymalizację prawdopodobieństwa, ale tak naprawdę nigdy nie widziałem tego argumentu, ani też nie widziałem w ogóle tego słowa „stabilny”, ale też nie mam pojęcia naprawdę zbadałem to dalej. Żaden z tych algorytmów nie omija lokalnych / globalnych prób maksymalnych. Ja osobiście częściej używam Kalmana po prostu z przyzwyczajenia.
Prawdą jest, że wygładzone szacunki stanu mają zwykle mniejszą wariancję niż filtrowanie, więc myślę, że masz rację, jeśli chodzi o to, ale tak naprawdę nie używasz stanów. Prawdopodobieństwo, które próbujesz zmaksymalizować, nie jest funkcją stanów.
źródło
Ogólnie, według reguły produktu, dokładne prawdopodobieństwo można zapisać Z założenia modelu przestrzeni stanów wynika, że wektor oczekiwań i macierz wariancji każdego uwarunkowane wcześniejszymi obserwacjami można wyrazić jako i
Chociaż oczywiście możesz użyć wygładzonych oszacowań, które faktycznie są lepszymi oszacowaniami nieznanych stanów, nie dałoby to funkcji prawdopodobieństwa. W rezultacie obserwowanej wartości do oszacowania własnej wartości oczekiwanej, więc wydaje się prawdopodobne, że doprowadziłoby to do pewnego błędu w uzyskanych szacunkach.yja
źródło
Myślę, że lepszą odpowiedzią na to, „dlaczego” rozkład wygładzania nie jest używany (zazwyczaj), jest wydajność. Zasadniczo proste jest obliczenie (wygładzenie) marginalnego prawdopodobieństwa w sensie pominięcia w następujący sposób. Usuń obserwację j, uruchom Kalmana bardziej płynnie dla pozostałych danych. Następnie oceń prawdopodobieństwo niewidzialnego y (j). Powtórz to dla wszystkich j. Zsumuj prawdopodobieństwa dziennika. Szybsze wersje tego działają z (losowymi) blokami przetrzymywanych próbek (jak k-fold CV). Zauważ, że ten schemat wymaga bardziej ogólnej implementacji filtru / wygładzacza Kalmana, który może dowolnie pomijać aktualizacje pomiarowe w razie potrzeby. Przełożenie wstecz / wygładzające nie ma dostępu do pomiarów (algorytm RTS i tak) i pozostaje takie samo.
Jeśli szeregi czasowe są „wystarczająco długie”, prawdopodobnie nie ma pożytecznej korzyści z tego, ponieważ prawdopodobieństwo filtrowania „wypala” jego początkowe przemijanie. Ale jeśli zestaw danych jest krótki, bardziej kosztowne może być prawdopodobieństwo wygładzenia. Wygładzacz o ustalonym opóźnieniu może być rozwiązaniem pośrednim.
źródło