Większość zasobów na temat prawidłowych reguł punktowania wymienia szereg różnych zasad punktacji, takich jak utrata logów, wynik Briera lub punktacja sferyczna. Często jednak nie udzielają zbyt wielu wskazówek na temat różnic między nimi. (Dowód A: Wikipedia .)
Wybór modelu, który maksymalizuje wynik logarytmiczny, odpowiada wybraniu modelu największej wiarygodności, co wydaje się dobrym argumentem za zastosowaniem oceny logarytmicznej. Czy istnieją podobne uzasadnienia dla punktacji Brier lub sferycznej lub innych zasad punktacji? Dlaczego ktoś miałby używać jednego z nich zamiast logarytmicznej oceny?
Odpowiedzi:
Idealnie więc zawsze odróżniamy dopasowanie modelu od podjęcia decyzji . W metodologii bayesowskiej ocena i wybór modelu powinna zawsze odbywać się z marginalnym prawdopodobieństwem . Następnie używasz modelu do prognozowania probabilistycznego, a funkcja straty mówi ci, jak postępować zgodnie z tymi prognozami.
Niestety w prawdziwym świecie wydajność obliczeniowa często dyktuje, że łączymy wybór modelu i proces decyzyjny, dlatego używamy funkcji straty, aby dopasować nasze modele. Tutaj wkrada się subiektywność przy wyborze modelu, ponieważ musisz zgadnąć, ile kosztują różne rodzaje błędów. Klasycznym przykładem jest diagnostyka raka: przecenianie czyjegoś prawdopodobieństwa raka nie jest dobre, ale niedocenianie go jest znacznie gorsze.
Nawiasem mówiąc, jeśli szukasz wskazówek, jak wybrać regułę punktacji, możesz także poszukać wskazówek dotyczących wyboru funkcji straty lub zaprojektowania funkcji użytecznej, ponieważ uważam, że literatura na te dwa tematy to dużo bardziej obszerny.
źródło