Zalety odległości Jeffries Matusita

11

Według niektórych artykułów, które czytam, powszechnie stosuje się odległość Jeffriesa i Matusity. Ale nie mogłem znaleźć wielu informacji na ten temat, z wyjątkiem poniższej formuły

JMD (x, y) = (xi2yi2)22

Jest podobny do odległości euklidesowej z wyjątkiem pierwiastka kwadratowego

E (x, y) = (xiyi)22

Pod względem klasyfikacji odległość JM jest uważana za bardziej niezawodną niż odległość euklidesowa. Czy ktoś może wyjaśnić, dlaczego ta różnica sprawia, że ​​odległość JM jest lepsza?

romy_ngo
źródło
1
Nie mogę znaleźć wiarygodnego odniesienia, które używa tej formuły dla odległości Jeffries-Matusita. Znane przeze mnie formuły są oparte na macierzach kowariancji dla dwóch klas i wydają się nie mieć związku z podaną tutaj, ale wydaje się, że pod tą nazwą mogą istnieć dwie (lub więcej) różne rzeczy. Czy możesz podać referencję lub (jeszcze lepiej) link? BTW, to i y i liczy się przypadkiem? (Jeśli tak, istnieje naturalna interpretacja twojej formuły.)xjayja
whuber
1
@whuber: Może i y są stać się przez p ( x ) i q ( x )xyp(x)q(x)
user603
@ user603 Tak, myślę, że masz. Teraz ujawniają się związki z rozbieżnościami KL i miarą Battacharyya.
whuber

Odpowiedzi:

14

Oto niektóre kluczowe różnice, poprzedzające dłuższe wyjaśnienie poniżej:

  1. Co najważniejsze: odległość Jeffriesa-Matusity dotyczy raczej rozkładów niż ogólnie wektorów.
  2. Przytoczony powyżej wzór odległości JM dotyczy tylko wektorów reprezentujących dyskretne rozkłady prawdopodobieństwa (tj. Wektorów sumujących się do 1).
  3. W przeciwieństwie do odległości euklidesowej, odległość JM można uogólnić na dowolne rozkłady, dla których można sformułować odległość Bhattacharrya.
  4. Odległość JM ma, poprzez odległość Bhattacharrya, interpretację probabilistyczną.

Odległość Jeffriesa-Matusity, która wydaje się szczególnie popularna w literaturze teledetekcji, jest transformacją odległości Bhattacharryi (popularnej miary podobieństwa między dwoma rozkładami, oznaczonej tutaj jako ) z zakresu [ 0 , inf ) do ustalonego zakresu [ 0 , bp,q[0,inf):[0,2)]

jotM.p,q=2)(1-exp(-b(p,q))

Praktyczną zaletą odległości JM, zgodnie z tym artykułem, jest to, że środek ten „ma tendencję do tłumienia wysokich wartości rozdzielności, jednocześnie przeceniając niskie wartości rozdzielności”.

Odległość Bhattacharryi mierzy odmienność dwóch rozkładów i q w następującym abstrakcyjnym sensie ciągłym: b ( p , q ) = - ln pq Jeśli rozkładypiqsą przechwytywane przez histogramy, reprezentowane przez wektory długości jednostkowej (gdziei-ty element jest znormalizowaną liczbą dlai-tej zNprzedziałów), staje się to: b(p,q)=-ln N i = 1

b(p,q)=-lnp(x)q(x)rex
pqjajaN. W konsekwencji odległość JM dla dwóch histogramów wynosi: JMp,q=
b(p,q)=-lnja=1N.pjaqja
jotM.p,q=2)(1-ja=1N.pjaqja)
japja=1
jotM.p,q=ja=1N.(pja-qja)2)=ja=1N.(pja-2)pjaqja+qja)=2)(1-ja=1N.pjaqja)
rroowwllaanndd
źródło
+1 Bardzo dziękuję za włożenie się i zrobienie tego bardzo dobrze wykonanego wysiłku, aby wyjaśnić sytuację.
whuber