Według niektórych artykułów, które czytam, powszechnie stosuje się odległość Jeffriesa i Matusity. Ale nie mogłem znaleźć wielu informacji na ten temat, z wyjątkiem poniższej formuły
JMD (x, y) =
Jest podobny do odległości euklidesowej z wyjątkiem pierwiastka kwadratowego
E (x, y) =
Pod względem klasyfikacji odległość JM jest uważana za bardziej niezawodną niż odległość euklidesowa. Czy ktoś może wyjaśnić, dlaczego ta różnica sprawia, że odległość JM jest lepsza?
classification
k-nearest-neighbour
euclidean
romy_ngo
źródło
źródło
Odpowiedzi:
Oto niektóre kluczowe różnice, poprzedzające dłuższe wyjaśnienie poniżej:
Odległość Jeffriesa-Matusity, która wydaje się szczególnie popularna w literaturze teledetekcji, jest transformacją odległości Bhattacharryi (popularnej miary podobieństwa między dwoma rozkładami, oznaczonej tutaj jako ) z zakresu [ 0 , inf ) do ustalonego zakresu [ 0 , √bp , q [ 0 , inf ) :[ 0 , 2-√]
Praktyczną zaletą odległości JM, zgodnie z tym artykułem, jest to, że środek ten „ma tendencję do tłumienia wysokich wartości rozdzielności, jednocześnie przeceniając niskie wartości rozdzielności”.
Odległość Bhattacharryi mierzy odmienność dwóch rozkładów i q w następującym abstrakcyjnym sensie ciągłym: b ( p , q ) = - ln ∫ √p q
Jeśli rozkładypiqsą przechwytywane przez histogramy, reprezentowane przez wektory długości jednostkowej (gdziei-ty element jest znormalizowaną liczbą dlai-tej zNprzedziałów), staje się to:
b(p,q)=-ln N ∑ i = 1 √
źródło