Zastanawiam się, czy istnieje jakikolwiek związek między tymi 3 miarami. Nie mogę nawiązać między nimi połączenia, odwołując się do definicji (być może dlatego, że jestem nowy w tych definicjach i mam trudności z ich złapaniem).
Wiem, że zakres podobieństwa cosinus może wynosić od 0 do 1, i że korelacja Pearsona może wynosić od -1 do 1, i nie jestem pewien co do zakresu wyniku Z.
Nie wiem jednak, w jaki sposób pewna wartość podobieństwa kosinusowego może ci coś powiedzieć o korelacji Pearsona lub wyniku Z i na odwrót?
correlation
z-score
cosine-similarity
Jaken Herman
źródło
źródło
Odpowiedzi:
Podobieństwo cosinus dwóch wektorów i b, jest to kąt między nimi cos θ = ⋅ ba b
W wielu aplikacjach, które wykorzystują podobieństwo cosinus, wektory są nieujemne (np. Terminowy wektor częstotliwości dla dokumentu), aw tym przypadku podobieństwo cosinus również będzie nieujemne.
W przypadku wektora wektor „ z- score” zwykle definiuje się jako z = x - ˉ xx z
gdzie ˉ x =1
źródło
\|
często wygląda lepiej niż||
i\lVert ... \rVert
jest najlepszym sposobem na napisanie go.