Natrafiam na współczynnik kości dla podobieństwa objętości ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) i dokładności ( https://en.wikipedia.org/wiki/Accuracy_and_precision ).
Wydaje mi się, że te dwa środki są takie same. jakieś pomysły?
descriptive-statistics
roc
accuracy
precision-recall
auc
RockTheStar
źródło
źródło
Odpowiedzi:
To nie to samo i często są używane w różnych kontekstach. Wynik kostki jest często używany do oceny wydajności metod segmentacji obrazu . Tam możesz opisać jakiś region prawdy gruntowej na obrazie, a następnie stworzyć zautomatyzowany algorytm, aby to zrobić. Sprawdzasz poprawność algorytmu, obliczając wynik kości, który jest miarą tego, jak podobne są obiekty. Jest to więc wielkość nakładania się dwóch segmentacji podzielona przez całkowity rozmiar dwóch obiektów. Przy użyciu tych samych terminów, co przy opisywaniu dokładności, wynik Dice to:Dice score=2⋅number of true positives2⋅number of true positives + number of false positives + number of false negatives
Tak więc liczba prawdziwie pozytywnych, to liczba znaleziona przez twoją metodę, liczba pozytywnych to całkowita liczba pozytywnych, które można znaleźć, a liczba fałszywych pozytywnych to liczba punktów, które są ujemne, które twoja metoda klasyfikuje jako pozytywne.
Wynik w kości jest nie tylko miarą liczby pozytywnych wyników, ale także karany za fałszywe pozytywy znalezione przez metodę, podobnie jak precyzja. więc bardziej przypomina precyzję niż dokładność. Jedyną różnicą jest mianownik, w którym masz całkowitą liczbę dodatnich wartości zamiast tylko dodatnich znalezionych przez metodę. Wynik Dice również wpływa na pozytywne wyniki, których twój algorytm / metoda nie mogła znaleźć.
Edycja: w przypadku segmentacji obrazu, powiedzmy, że masz maskę z prawdą podstawową, nazwijmy maskę tak, jak sugerujesz. Więc maska ma wartości 1 w pikselach, w których jest coś, co próbujesz znaleźć, a w przeciwnym razie zero. Teraz masz algorytm do generowania obrazu / maski , który również musi być obrazem binarnym, tzn. Tworzysz maskę dla swojej segmentacji. A teraz mamy, co następuje:A B
Jeśli robisz to dla publikacji, napisz Dice z dużą literą D, ponieważ nosi ona imię faceta o imieniu Dice.
EDYCJA: Jeśli chodzi o komentarz dotyczący korekty: nie używam tradycyjnej formuły do obliczania współczynnika kości, ale jeśli przetłumaczę to na notację w innej odpowiedzi, staje się:
Co odpowiada tradycyjnej definicji. Wygodniej jest napisać go tak, jak go napisałem, aby podać formułę w kategoriach fałszywych trafień. Odwrotny ukośnik to ustawiony minus.
źródło
Współczynnik kości (znany również jako wskaźnik Kości podobieństwa) jest taki sam jak wynik F1 , ale nie takie same, jak dokładność. Główną różnicą może być fakt, że dokładność uwzględnia prawdziwe negatywy, podczas gdy współczynnik kości i wiele innych miar po prostu traktuje prawdziwe negatywy jako nieciekawe wartości domyślne (patrz Podstawy oceny klasyfikatora, część 1 ).
O ile mogę stwierdzić, współczynnik kości nie jest obliczany w sposób opisany w poprzedniej odpowiedzi , która faktycznie zawiera wzór na indeks Jaccard (znany również jako „przecięcie przez związek” w wizji komputerowej).
Gdzie wektory binarne (o wartości 1 dla elementów wewnątrz grupy, a 0 w przeciwnym razie), jeden oznacza podstawową prawdę, a drugi oznacza wynik klasyfikacji, a jest tylko rozpatrywanymi wszystkimi elementami (binarny wektor 1 tego samego długość). Na przykład(iloczyn wewnętrzny i ) to liczba prawdziwych wyników dodatnich,(iloczyn wewnętrzny dopełniacza i dopełniacza ) to liczba prawdziwych negatywów.A l l | A ⋅ B | A B | ¯ A ⋅ ¯ B | A B.A,B All |A⋅B| A B |A¯¯¯¯⋅B¯¯¯¯| A B
Współczynnik kości i wskaźnik Jaccard są monotonicznie powiązane, a wskaźnik Tversky uogólnia je oba, aby przeczytać więcej na ten temat, zobacz F-score, kości i zestaw Jaccard podobieństwa .
Współczynnik kości jest również średnią harmoniczną czułości i precyzji, aby zobaczyć, dlaczego ma to sens, przeczytaj Dlaczego miara F jest średnią harmoniczną, a nie średnią arytmetyczną miar dokładności i przywołania? .
Aby przeczytać więcej o wielu terminach w tej odpowiedzi i ich relacjach, zobacz Ocena klasyfikatorów binarnych .
źródło