Obliczanie prawdopodobieństwa z RMSE

13

Mam model przewidywania trajektorii (x w funkcji czasu) z kilkoma parametrami. W tej chwili obliczam błąd średniej kwadratowej (RMSE) między przewidywaną trajektorią a eksperymentalnie zarejestrowaną trajektorią. Obecnie minimalizuję tę różnicę (RMSE), używając simplex (fminsearch w Matlabie). Chociaż ta metoda działa dobrze, ale chcę porównać kilka różnych modeli, myślę, że muszę obliczyć prawdopodobieństwo, aby móc użyć oszacowania maksymalnego prawdopodobieństwa zamiast minimalizować RMSE (a następnie porównać modele za pomocą AIC lub BIC ). Czy jest jakiś standardowy sposób to zrobić?

Jason
źródło

Odpowiedzi:

20

Błąd pierwiastkowy do kwadratu i prawdopodobieństwo są w rzeczywistości ściśle powiązane. Załóżmy, że masz zestaw danych z i chcesz modelować ich relacje za pomocą modelu . Decydujesz się zminimalizować błąd kwadratowy{xi,zi}f

i(f(xi)zi)2

Czy ten wybór nie jest całkowicie arbitralny? Jasne, że chcesz karać szacunki, które są całkowicie błędne, bardziej niż te, które są prawidłowe. Ale jest bardzo dobry powód, aby użyć błędu kwadratu.

Zapamiętaj gęstość Gaussa: gdzie jest stałą normalizacji, na którą nam obecnie nie zależy. Załóżmy, że twoje docelowe dane są dystrybuowane według Gaussa. Możemy więc zapisać prawdopodobieństwo danych.1Zexp(xμ)22σ2Zz

L=i1Zexp(f(xi)zi)22σ2

Teraz, jeśli weźmiesz logarytm tego ...

logL=i(f(xi)zi)22σ2logZ

... okazuje się, że jest bardzo ściśle związany z wartością skuteczną: jedynymi różnicami są pewne stałe warunki, pierwiastek kwadratowy i mnożenie.

Krótko mówiąc: minimalizacja średniego błędu do kwadratu jest równoznaczna z maksymalizacją prawdopodobieństwa dziennika danych.

bayerj
źródło
Dzięki za jasne wyjaśnienie. Więc jeśli chcę porównać dwa (niewbudowane) modele za pomocą BIC, mogę po prostu porzucić sigma ^ 2 i Z (efektywnie zakładając, że są takie same w różnych modelach) przy obliczaniu prawdopodobieństwa?
Jason
Tak. Oba warunki zależą tylko od , więc możesz je usunąć, jeśli oba są równe. σσ
bayerj
1
Myślę, że w ostatnim kroku powyżej (biorąc dziennik prawdopodobieństwa) wystąpił błąd, powinien on wyglądać następująco: Nie zmienia to „dolnej linii”, ponieważ prawdopodobieństwo dziennika jest liniowo powiązane z RMSE, więc minimalizacja RMSE jest równoważna z minimalizacją prawdopodobieństwa dziennika
logL=i(f(xi)zi)22σ2logZ
Jason
2
Czy brakuje rozkładu ujemnego w rozkładzie Gaussa?
Manoj
1
Czy wniosek nie powinien być odwrotny? Minimalizowanie sumy kwadratów błędów maksymalizuje prawdopodobieństwo dziennika (dla stałej ), a tym samym maksymalizuje prawdopodobieństwo (ponieważ log jest monotoniczny). σ
Tim Goodman,