Pracuję w dziedzinie problemów, w której ludzie często zgłaszają ROC-AUC lub AveP (średnia precyzja). Jednak ostatnio znalazłem artykuły, które zamiast tego optymalizują straty logów , podczas gdy jeszcze inni zgłaszają utratę zawiasów .
Rozumiem, w jaki sposób obliczane są te wskaźniki, ale trudno mi zrozumieć kompromisy między nimi i co jest dobre na to, co dokładnie.
Jeśli chodzi o ROC-AUC vs. Precision-Recall, ten wątek omawia, w jaki sposób maksymalizację ROC-AUC można postrzegać jako stosowanie kryteriów optymalizacji strat, które karają „ranking prawdziwego ujemnego co najmniej tak dużego, jak prawdziwego pozytywnego” (zakładając, że wyższy wyniki odpowiadają wynikom pozytywnym). Również ten drugi wątek zapewnia również pomocne omówienie ROC AUC w przeciwieństwie do Precyzyjnie Przywołaj metryk.
Jednak dla jakiego rodzaju problemów preferowana byłaby utrata logów , na przykład ROC-AUC , AveP lub utrata zawiasu ? Co najważniejsze, jakie pytania należy zadać na temat problemu, wybierając między tymi funkcjami strat do klasyfikacji binarnej?
źródło