Kiedy stosować ważoną odległość euklidesową i jak określić stosowane masy?

16

Mam zestaw danych, w którym każde dane składa się z różnych miar. Dla każdego pomiaru mam wartość odniesienia. Chciałbym wiedzieć, jak blisko są wszystkie dane do wartości odniesienia.n

Pomyślałem o użyciu ważonej odległości euklidesowej w następujący sposób:

rex,b=(ja=1nwja(xja-bja)2)))1/2)

gdzie

xja jest wartością i-tej miary dla poszczególnych danych

bja jest odpowiednią wartością testu porównawczego dla tej miary.

wja to wartość masy między I dołączę do i-tej miary, z zastrzeżeniem:

0<wja<1 ija=1n1

Jednak na podstawie tego dokumentu dowiedziałem się, że waga do zastosowania jest odwrotnością wariancji i-tej miary. Nie sądzę, aby tego rodzaju waga uwzględniała wagę, jaką przywiązuję do każdego środka.

W związku z tym:

  1. Czy istnieją metody wymyślania zestawu wag, które odzwierciedlają względną ważność pomiaru przez obserwatora, czy może obserwator może przypisać dowolne wartości do wag?

  2. Czy właściwe jest użycie ważonej odległości euklidesowej, aby rozwiązać ten problem?

Sara
źródło

Odpowiedzi:

16

Wagi do standaryzacji

Konfiguracja, którą masz, jest wariantem dystansu Mahalanobisa . Kiedy więc jest odwrotnością wariancji każdego pomiaru, efektywnie umieszczasz wszystkie pomiary w tej samej skali. Oznacza to, że uważasz, że zmiana w każdym z nich jest równie „ważna”, ale że niektóre są mierzone w jednostkach, które nie są od razu porównywalne.w

Waga ważna

Możesz dowolnie umieszczać dowolne wartości jako wagi, w tym miary „ważności” (chociaż możesz chcieć ustandaryzować przed ważeniem wagi, jeśli jednostki miary różnią się).

Przykład może pomóc w wyjaśnieniu problemów: rozważ pomysł oszacowania ideologicznych „odległości” między podmiotami politycznymi. W tej aplikacji i może być pozycje dwóch aktorów na -tej problemu i salience tej kwestii. Na przykładxbjawjabjamoże być pozycją status quo w pewnym wymiarze, od której różnią się pozycje różnych aktorów. W tej aplikacji z pewnością wolałbyś mierzyć, niż twierdzić zarówno istotność, jak i pozycję. Tak czy inaczej, duże wagi sprawią, że różnice w nieistotnych kwestiach będą miały mniejszy wpływ na całkowitą odległość między aktorami, jeśli zostaną obliczone zgodnie z twoim pierwszym równaniem. Zauważ też, że w tej wersji domyślnie nie zakładamy żadnej istotnej kowariancji między pozycjami, co jest dość silnym twierdzeniem.

Skupiając się teraz na pytaniu 2: W aplikacji właśnie opisałem uzasadnienie wagi i odległości uzasadniają teoretyczne założenia gry dotyczące struktur preferencji przechodnich i tym podobne. Są to ostatecznie jedyne powody, dla których „właściwe” jest obliczanie odległości w ten sposób. Bez nich mamy tylko kilka liczb, które są zgodne z nierównością trójkąta.

Wagi jako domyślny pomiar

W przypadku kowariancji pomocne może być pomyślenie o swoim problemie jako o identyfikacji odpowiedniej podprzestrzeni, w której odległości mają sens, przy założeniu, że wiele pomiarów faktycznie mierzysz podobnych rzeczy. Model pomiarowy, np. Analiza czynnikowa, rzutowałby wszystko poprzez kombinację ważoną do wspólnej przestrzeni, w której można by obliczyć odległości. Ale znowu musielibyśmy znać kontekst twoich badań, aby powiedzieć, czy to ma sens.

sprzężonyprior
źródło
dzięki za cenne informacje. ale mam obawy dotyczące sposobu obliczania ciężarów?