Rozumiem, że miara f (oparta na precyzji i przywołaniu) jest oszacowaniem dokładności klasyfikatora. Ponadto, gdy mamy niezrównoważony zestaw danych , f-miara jest ważniejsza od dokładności . Mam proste pytanie (które dotyczy bardziej prawidłowej terminologii niż technologii). Mam niezrównoważony zestaw danych i używam miary F w swoich eksperymentach. Mam zamiar napisać artykuł, który NIE jest przeznaczony na konferencję uczenia maszynowego / eksploracji danych. W związku z tym mogę w tym kontekście odnieść się do f-pomiaru jako synonimu. Na przykład, mam współczynnik f 0,82, to czy mogę powiedzieć, że mój klasyfikator osiąga 82% dokładnych prognoz?
11
Odpowiedzi:
Po pierwsze uważam, że „dokładność” bywa nieco myląca, ponieważ odnosi się do różnych rzeczy:
Termin dokładność genowa do oceny systemów lub metod (jestem chemikiem analitycznym) odnosi się do błędu prognoz, tj. Odpowiada na pytanie, jak dobre są prognozy.
Jak wiadomo, istnieje wiele różnych miar wydajności, które odpowiadają różnym aspektom wydajności klasyfikatorów. Jeden z nich nazywa się również dokładnością. Jeśli twój artykuł nie jest przeznaczony dla odbiorców uczących się / klasyfikowanych maszynowo, polecam, aby to rozróżnienie było bardzo jasne. Nawet w przypadku tego bardziej szczegółowego znaczenia dokładności byłbym bardzo wyraźny w kwestii tego, co nazywam dokładnością, ponieważ ponownie może wystąpić kilka sposobów radzenia sobie z nierównowagą klas. Zazwyczaj nierównowaga klas jest ignorowana, co prowadzi do dobrze znanego obliczenia . Możesz jednak również zastosować średnią czułości i swoistości, która sprowadza się do kontrolowania nierównowagi klasy poprzez ważenie swojej średniej.T.P.+ TN.a l l c a s e s
Wynik F jest często wprowadzany jako harmoniczna średnia precyzji i przywołania (lub dodatnia wartość predykcyjna i czułość). W przypadku pytania uważam, że warto to nieco przeliterować i uprościć:
Ostatnie wyrażenie nie jest ułamkiem niczego, co mogę uznać za pewną grupę przypadków testowych. W szczególności spodziewane jest (duże) nakładanie się przypadków PRAWDA i POZYTYWNE. To powstrzymałoby mnie od wyrażania wyniku F jako wartości procentowej, ponieważ tego rodzaju sugeruje pewną liczbę przypadków. Właściwie myślę, że ostrzegłbym czytelnika, że F-score nie ma takiej interpretacji.
źródło
Szybka odpowiedź:
Nie,
F-measure
formuła nie składa się zTN
czynnika i jest przydatna przy wyszukiwaniu problemów (doc) .Tak więc, jest (
F-measure
) prawidłowe podejście do oceny niezrównoważonych zestawów danych lub w przypadku problemów z odzyskiwaniem zamiastaccuracy
iROC
.[ UWAGA ]:
źródło