Chcę wiedzieć, co tak naprawdę dzieje się w Hellinger Distance (w prostych słowach). Co więcej, jestem również zainteresowany tym, jakie rodzaje problemów możemy wykorzystać Hellinger Distance? Jakie są zalety korzystania z Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Smith Volka
źródło
źródło
Odpowiedzi:
Odległość Hellingera jest miarą mierzącą różnicę między dwoma rozkładami prawdopodobieństwa. Jest to probabilistyczny analog odległości euklidesowej .
Biorąc pod uwagę dwa rozkłady prawdopodobieństwa, i , odległość Hellingera definiuje się jako:QP Q
Jest to przydatne podczas kwantyfikacji różnicy między dwoma rozkładami prawdopodobieństwa. Na przykład, jeśli oszacujesz dystrybucję dla użytkowników i osób niebędących użytkownikami usługi. Jeśli dla niektórych obiektów odległość Hellingera jest niewielka między tymi grupami, wówczas cechy te nie są statystycznie przydatne do segmentacji.
źródło