Korzystam z oznacza grupowanie głosów w klastrze. Kiedy porównuję wypowiedź do danych głośników w klastrze, otrzymam (na podstawie odległości euklidesowej) średnie zniekształcenie. Odległość ta może wynosić . Chcę przekonwertować tę odległość na wynik podobieństwa . Proszę o wskazówki, jak to osiągnąć.[ 0 , ∞ ] [ 0 , 1 ]
clustering
k-means
distance
euclidean
Mahomet
źródło
źródło
Możesz także użyć: gdzie jest pożądana funkcja odległości.1edist
dist
źródło
Wygląda na to, że chcesz czegoś podobnego do podobieństwa cosinusowego, które samo w sobie jest wynikiem podobieństwa w interwale jednostkowym. W rzeczywistości istnieje bezpośredni związek między odległością euklidesową a podobieństwem cosinusa!
Zauważ, że
Podczas gdy podobieństwo cosinusa jest gdzie to kąt między a .
Gdy mamy i||x||=||x′||=1,
więc
Z perspektywy obliczeniowej bardziej wydajne może być po prostu obliczenie cosinusa, niż odległości euklidesowej, a następnie wykonanie transformacji.
źródło
Co powiesz na jądro Gaussa ?
Odległośćjest używany w wykładniku. Wartość jądra mieści się w zakresie . Jest jeden parametr strojenia . Zasadniczo, jeśli jest wysokie, będzie bliskie 1 dla dowolnego . Jeśli jest niski, niewielka odległość od do spowoduje, że będzie bliskie 0.∥x−x′∥ [0,1] σ σ K(x,x′) x,x′ σ x x′ K(x,x′)
źródło
Jeśli używasz pomiaru odległości, który naturalnie wynosi od 0 do 1, na przykład odległości Hellingera. Następnie możesz użyć 1 - odległości, aby uzyskać podobieństwo.
źródło