Czy współczynnik kości jest taki sam jak dokładność?

Natrafiam na współczynnik kości dla podobieństwa objętości ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) i dokładności ( https://en.wikipedia.org/wiki/Accuracy_and_precision ).

Wydaje mi się, że te dwa środki są takie same. jakieś pomysły?

descriptive-statistics roc accuracy precision-recall auc RockTheStar
źródło

Zapewnia to wszystkie informacje stats.stackexchange.com/questions/195006/…

rank1

@ rank1 Dzięki. Chcę wyjaśnić: czy to nie jest link do mojego pytania :)

RockTheStar

ooops, ten: ncbi.nlm.nih.gov/pmc/articles/PMC4533825

ranga 1

Odpowiedzi:

To nie to samo i często są używane w różnych kontekstach. Wynik kostki jest często używany do oceny wydajności metod segmentacji obrazu . Tam możesz opisać jakiś region prawdy gruntowej na obrazie, a następnie stworzyć zautomatyzowany algorytm, aby to zrobić. Sprawdzasz poprawność algorytmu, obliczając wynik kości, który jest miarą tego, jak podobne są obiekty. Jest to więc wielkość nakładania się dwóch segmentacji podzielona przez całkowity rozmiar dwóch obiektów. Przy użyciu tych samych terminów, co przy opisywaniu dokładności, wynik Dice to:

Dice score = \frac{2 \cdot number of true positives}{2 \cdot number of true positives + number of false positives + number of false negatives}

$\text{Dice score} = \frac{2\cdot \text{number of true positives}}{2 \cdot \text{number of true positives + number of false positives + number of false negatives}}$ Tak więc liczba prawdziwie pozytywnych, to liczba znaleziona przez twoją metodę, liczba pozytywnych to całkowita liczba pozytywnych, które można znaleźć, a liczba fałszywych pozytywnych to liczba punktów, które są ujemne, które twoja metoda klasyfikuje jako pozytywne.

Wynik w kości jest nie tylko miarą liczby pozytywnych wyników, ale także karany za fałszywe pozytywy znalezione przez metodę, podobnie jak precyzja. więc bardziej przypomina precyzję niż dokładność. Jedyną różnicą jest mianownik, w którym masz całkowitą liczbę dodatnich wartości zamiast tylko dodatnich znalezionych przez metodę. Wynik Dice również wpływa na pozytywne wyniki, których twój algorytm / metoda nie mogła znaleźć.

Edycja: w przypadku segmentacji obrazu, powiedzmy, że masz maskę z prawdą podstawową, nazwijmy maskę tak, jak sugerujesz. Więc maska ma wartości 1 w pikselach, w których jest coś, co próbujesz znaleźć, a w przeciwnym razie zero. Teraz masz algorytm do generowania obrazu / maski , który również musi być obrazem binarnym, tzn. Tworzysz maskę dla swojej segmentacji. A teraz mamy, co następuje: $A$ $B$

Liczba pozytywów to całkowita liczba pikseli o intensywności 1 na zdjęciu $A$
Liczba prawdziwie dodatnich jest całkowita liczba pikseli, które mają wartość 1 zarówno i . Więc to przecięcie regionach tych w i . To jest taka sama jak przy użyciu operatora AND na i . $A$ $B$ $A$ $B$ $A$ $B$
Liczba fałszywych alarmów jest liczba pikseli, które pojawiają się jako 1 w , ale zera w . $B$ $A$

Jeśli robisz to dla publikacji, napisz Dice z dużą literą D, ponieważ nosi ona imię faceta o imieniu Dice.

EDYCJA: Jeśli chodzi o komentarz dotyczący korekty: nie używam tradycyjnej formuły do obliczania współczynnika kości, ale jeśli przetłumaczę to na notację w innej odpowiedzi, staje się:

Dice score = \frac{2 \cdot | A \cap B |}{2 \cdot | A \cap B | + | B ∖ A | + | A ∖ B |}

$\text{Dice score} = \frac{2\cdot|A\cap B|}{2\cdot|A\cap B| + |B\backslash A| + |A\backslash B|}$

Co odpowiada tradycyjnej definicji. Wygodniej jest napisać go tak, jak go napisałem, aby podać formułę w kategoriach fałszywych trafień. Odwrotny ukośnik to ustawiony minus.

Gumeo
źródło

Dziękuję za odpowiedź. Dokładnie do porównania segmentacji obrazu. Tak więc ten wynik kostki jest używany, powiedzmy, daj obraz A i obraz B. Obraz A to podstawa prawdziwa (0 lub 1), a obraz B to moja segmentacja. Więc jaka jest całkowita liczba pozytywów (1), czy liczba 1 w A + liczba 1 w B? Jestem tu trochę zdezorientowany. To samo co fałszywie pozytywne

RockTheStar,

@RockTheStar Zmienię moją odpowiedź, aby uwzględnić segmentację obrazu.

Gumeo,

Świetnie, wielkie dzięki za wyjaśnienie. Jeszcze jedno pytanie uzupełniające. Co z zakresem D? Czy to od 0 do 1?

RockTheStar

Wielkie dzięki! Zaimplementuje to i spojrzy na wynik

RockTheStar

@Gumeo, które możesz chcieć naprawić lub przynajmniej wyjaśnić swoją odpowiedź, zobacz szczegóły w mojej nowej odpowiedzi

dvb

Współczynnik kości (znany również jako wskaźnik Kości podobieństwa) jest taki sam jak wynik F1 , ale nie takie same, jak dokładność. Główną różnicą może być fakt, że dokładność uwzględnia prawdziwe negatywy, podczas gdy współczynnik kości i wiele innych miar po prostu traktuje prawdziwe negatywy jako nieciekawe wartości domyślne (patrz Podstawy oceny klasyfikatora, część 1 ).

O ile mogę stwierdzić, współczynnik kości nie jest obliczany w sposób opisany w poprzedniej odpowiedzi , która faktycznie zawiera wzór na indeks Jaccard (znany również jako „przecięcie przez związek” w wizji komputerowej).

\begin{aligned} D i c e (A, B) & = \frac{2 | A \cdot B |}{| A | + | B |} \\ F 1 (A, B) & = \frac{2}{| A | / | A \cdot B | + | B | / | A \cdot B |} \\ J a c c a r d (A, B) & = \frac{| A \cdot B |}{| m a x (A, B) |} = \frac{| A \cdot B |}{| A | + | B | - | A \cdot B |} \\ A c c u r a c y (A, B) & = \frac{| A \cdot B | + | \bar{A} \cdot \bar{B} |}{| A l l |} \end{aligned}

$\begin{align*} Dice(A,B) &= \frac{2|A\cdot B|}{ |A| + |B| } \\ F1(A,B) &= \frac{2}{|A|/|A \cdot B| + |B|/|A\cdot B|} \\ Jaccard(A,B) &= \frac{|A\cdot B|}{|max(A,B)|} = \frac{|A\cdot B|}{|A|+|B|-|A\cdot B|}\\ Accuracy(A,B) &= \frac{|A\cdot B|+|\overline{A} \cdot \overline{B}|}{|All|} \\ \end{align*}$

Gdzie wektory binarne (o wartości 1 dla elementów wewnątrz grupy, a 0 w przeciwnym razie), jeden oznacza podstawową prawdę, a drugi oznacza wynik klasyfikacji, a jest tylko rozpatrywanymi wszystkimi elementami (binarny wektor 1 tego samego długość). Na przykład(iloczyn wewnętrzny i ) to liczba prawdziwych wyników dodatnich,(iloczyn wewnętrzny dopełniacza i dopełniacza ) to liczba prawdziwych negatywów. $A,B$ $All$ $|A \cdot B|$ $A$ $B$ $|\overline{A} \cdot \overline{B}|$ $A$ $B$

Współczynnik kości i wskaźnik Jaccard są monotonicznie powiązane, a wskaźnik Tversky uogólnia je oba, aby przeczytać więcej na ten temat, zobacz F-score, kości i zestaw Jaccard podobieństwa .

Współczynnik kości jest również średnią harmoniczną czułości i precyzji, aby zobaczyć, dlaczego ma to sens, przeczytaj Dlaczego miara F jest średnią harmoniczną, a nie średnią arytmetyczną miar dokładności i przywołania? .

Aby przeczytać więcej o wielu terminach w tej odpowiedzi i ich relacjach, zobacz Ocena klasyfikatorów binarnych .

dvb
źródło