Jak odległość Gowera oblicza różnicę między zmiennymi binarnymi?

13

Mam 17 liczbowych i 5 zmiennych binarnych (0-1), z 73 próbkami w moim zbiorze danych. Muszę przeprowadzić analizę skupień. Wiem, że odległość Gowera jest dobrą miarą dla zbiorów danych ze zmiennymi mieszanymi. Nie mogłem jednak zrozumieć, w jaki sposób odległość Gowera oblicza różnicę między zmiennymi binarnymi . Wydaje mi się, że nie różni się od odległości euklidesowej.

Emrah Bilgiç
źródło
Twoje pytanie nie jest całkiem jasne. Czy po prostu pytasz „jak odległość Gowera oblicza różnicę między zmiennymi binarnymi”? Co znaczy „nie ma różnicy niż euklides”?
gung - Przywróć Monikę
1
Dziękuję Ci. Przepraszam, pytam, jak Gower oblicza różnicę między zmiennymi binarnymi. To znaczy, nie mogłem zrozumieć różnic między btw. Euclidean i Gower dla zmiennej binarnej.
Emrah Bilgiç
Czy szukałeś tej strony Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Tak. Odległość euklidesowa wynosi 0, jeśli obie próbki mają tę samą wartość, 1 jeśli nie. Co z Gower?
Emrah Bilgiç
4
@ EmrahBilgiç, metryka Gowera jest podobieństwem, a nie odległością. Staje się „odległością” po odjęciu 1. Przeczytaj pod linkiem powyżej, w jaki sposób przetwarza dane binarne.
ttnphns

Odpowiedzi:

5

A co z atrybutami binarnymi o wartościach „m” i „f” dla „męskich” i „żeńskich”?

Czy zdajesz sobie sprawę, że dla zmiennej dwudzielnej wszystko, co możesz uzyskać, to „to samo” czy „inne”? Kluczowa różnica między odległościami nie występuje, jeśli wartość wynosi 1 lub 0; ale jak wiele zmiennych jest łączonych.

Ma ZAKOŃCZENIE - Anony-Mus
źródło
3

Odległość Gower wykorzystuje Manhattan do obliczania odległości między ciągłymi punktami danych i kości do obliczania odległości między kategorycznymi punktami danych

Sanjeet
źródło