Powiedzmy, że definiujemy odległość, która nie jest miarą , między N elementami.
Na podstawie tej odległości stosujemy następnie aglomeracyjne hierarchiczne grupowanie .
Czy możemy zastosować każdy ze znanych algorytmów (połączenie pojedyncze / maksymalne / średnie itp.), Aby uzyskać znaczące wyniki? Lub inaczej: jaki jest problem z ich użyciem, jeśli odległość nie jest metryką?
Odpowiedzi:
Wymagania dotyczące odległości zależą od metody hierarchicznego grupowania. Pojedyncze, kompletne, średnie metody wymagają odległości, aby nie były ujemne i symetryczne. Metody totemów, centroidów i median potrzebują (kwadratowych) euklidesowych (które są nawet węższe definicji niż metryki) odległości, aby uzyskać geometrycznie znaczące wyniki.
(Można sprawdzić, czy jego macierz odległości jest euklidesowa, podwójnie centrując ją [patrz moja odpowiedź tutaj ] i patrząc na wartości własne; jeśli nie znaleziono ujemnych wartości własnych, odległości zbiegają się w przestrzeni euklidesowej.)
źródło
Nie, odległość nie musi być metryką. Może to być na przykład ultrametryczny:
Odległości ultradźwiękowe uzyskane z kolejnych kroków w algorytmie grupowania można przedstawić za pomocą dendrogramów, które mogłeś zobaczyć w tym kontekście.
źródło