Jak zmienia się podobieństwo cosinus po transformacji liniowej?

9

Czy istnieje matematyczny związek między:

  • podobieństwo cosinus nazwa dwóch wektorów i orazsim(A,B)AB
  • cosinus podobieństwo z i , niejednorodnie skalowane poprzez danej matrycy ? Tutaj jest daną macierzą diagonalną z nierównymi elementami na przekątnej.sim(MA,MB)ABMM

Próbowałem przejrzeć obliczenia, ale nie mogłem dotrzeć do prostego / interesującego linku (wyrażenia). Zastanawiam się, czy istnieje.


Np. Kąty nie są zachowywane w skalowaniu nierównomiernym, ale jaki jest związek między kątami pierwotnymi a kątami po skalowaniu nierównomiernym? Co można powiedzieć o związku między zbiorem wektorów S1 a innym zbiorem wektorów S2 - gdzie S2 uzyskuje się przez nierównomierne skalowanie S1?

turdus-merula
źródło
@ whuber, dziękuję! Tak, M jest daną macierzą (macierzą skalowania - czyli macierzą diagonalną, bez innych ograniczeń). W pewnym sensie chciałem wiedzieć, co się dzieje (pod względem podobieństwa cosinus dla dowolnej pary wektorów) do przestrzeni wektorowej, która podlega skalowaniu nieliniowemu.
turdus-merula
2
Warto zauważyć, że jeśli wszystkie współczynniki skalowania są nieujemne (jak można by naturalnie założyć), wówczas wszystkie symetryczne macierze o dodatniej wartości dodatniej można uznać za macierze „skalowane”. Szukana relacja jest szeroko stosowana, między innymi , w badaniu i opisie zniekształceń w rzutach mapy. Tam znajdują się centra zainteresowania w maksymalnych i minimalnych kątach na powierzchni ziemi, które byłyby powiązane z dwoma prostopadłymi kierunkami na mapie. Istnieje bezpośredni związek między tymi kątami a stosunkami dwóch czynników skali.
whuber

Odpowiedzi:

8

Ponieważ jest dość ogólne, a zmiana podobieństwa kosinusowego zależy od konkretnych i i ich związku z , nie jest możliwe ustalenie konkretnego wzoru. Istnieją jednak praktycznie obliczalne granice, o ile podobieństwo cosinusa może się zmienić . Można je znaleźć, zwiększając kąt między a biorąc pod uwagę, że podobieństwo cosinus między i jest określoną wartością, powiedzmy (gdzie jest kątem między i ). Odpowiedź mówi nam, ile kątMABMMAMBABcos(2ϕ)2ϕAB2ϕmoże ewentualnie być zginane przez transformacji .M

Obliczenia grożą bałaganem. Niektóre sprytne wybory zapisu, a także pewne wstępne uproszczenia, zmniejszają wysiłek. Okazuje się, że rozwiązanie w dwóch wymiarach ujawnia wszystko, co musimy wiedzieć. Jest to problem możliwy do rozwiązania, zależny tylko od jednej rzeczywistej zmiennej , którą można łatwo rozwiązać za pomocą technik rachunku różniczkowego. Prosty argument geometryczny rozszerza to rozwiązanie na dowolną liczbę wymiarów .θn

Wstęp do matematyki

Z definicji cosinus kąta między dowolnymi dwoma wektorami i uzyskuje się przez znormalizowanie ich do długości jednostkowej i pobranie ich iloczynu. A zatem,AB

AB(AA)(BB)=cos(2ϕ)

i, pisząc , cosinus kąta między obrazami i pod transformacją wynosiΣ=MMABM

(1)(MA)(MB)((MA)(MA))((MB)(MB))=AΣB(AΣA)(BΣB).

Zauważ, że tylko znaczenie w analizie, aΣ nie samoMożemy zatem wykorzystać Singular Value rozpadu (SVD) z uproszczenie problemu. Przypomnijmy, że wyraża to jako iloczyn (od prawej do lewej) macierzy ortogonalnej , macierzy diagonalnej i innej macierzy ortogonalnej :MMMVDU

M=UDV.

Innymi słowy, nie jest podstawą uprzywilejowanych wektorów (kolumny ), w którym działa przez przeskalowanie co osobno przez przekątnej wejściowej od (które będzie wywoływać ), a następnie stosując obrót (lub anty-obrót) do wyniku. Ten końcowy obrót nie zmieni żadnych długości ani kątów, a zatem nie powinien wpływać na . Możesz to zobaczyć formalnie z obliczeniamie1,,enVMeiithDdiUΣ

Σ=MM=(UDV)(UDV)=VD(UU)DV=VD2V.

W związku z tym, aby zbadać możemy dowolnie zastąpić dowolną inną macierzą, która daje te same wartości w . Po zamówieniu taki sposób, aby wielkość zmniejszyła się (i zakładając, że nie jest identycznie zerowe), dobrym wyborem jestΣM(1)eidiMM

M=1d1DV.

Ukośne elementy to(1/d1)D

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

W szczególności wpływ (czy to w postaci oryginalnej, czy zmienionej) na wszystkie kąty jest całkowicie zdeterminowany przez to, żeM

Mei=λiei.

Analiza przypadku specjalnego

Niech . Ponieważ zmiana długości wektorów nie zmienia kąta między nimi, możemy założyć, że i są wektorami jednostkowymi. W płaszczyźnie wszystkie takie wektory mogą być oznaczone kątem, który tworzą z , co pozwala nam pisaćn=2ABe1

A=cos(θϕ)e1+sin(θϕ)e2.

W związku z tym

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(Zobacz rysunek poniżej.)

Zastosowanie jest proste: naprawia pierwsze współrzędne i i mnoży ich drugie współrzędne przez . Dlatego kąt od do wynosiMABλ2MAMB

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

Ponieważ jest funkcją ciągłą, ta różnica kątów jest funkcją ciągłą . W rzeczywistości jest różniczkowalny. To pozwala nam znaleźć skrajne kąty poprzez sprawdzenie zer pochodnej . Ta pochodna jest łatwa do obliczenia: jest to stosunek funkcji trygonometrycznych. Zera mogą występować tylko między zerami jego licznika, więc nie zawracajmy sobie głowy obliczeniem mianownika. OtrzymujemyMθf(θ)

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

Szczególne przypadki , i są łatwe do zrozumienia: odpowiadają sytuacjom, w których ma niższą rangę (a więc zgniata wszystkie wektory do linii); gdzie jest wielokrotnością macierzy tożsamości; i gdzie i są równoległe (stąd kąt między nimi nie może się zmienić, niezależnie od ). Przypadek jest wykluczony przez warunek .λ2=0λ2=1ϕ=0MMABθλ2=1λ20

Oprócz tych szczególnych przypadków, zera występują tylko wtedy, gdy : to znaczy, lub . Oznacza to, że linia wyznaczona przez przecina kąt . Wiemy teraz, że skrajne wartości kąta między i muszą znajdować się wśród wartości , więc obliczmy je:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

Odpowiednie cosinusy to

(2)cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

i

(3)cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

Często wystarczy zrozumieć, jak zniekształca kąty proste. W tym przypadku , co prowadzi do , które możesz podłączyć do poprzednich formuł.M2ϕ=π/2tan(ϕ)=cot(ϕ)=1

Zauważ, że im mniejsze , tym bardziej ekstremalne stają się te kąty i tym większe jest zniekształcenie.λ2

Rysunek przedstawiający cztery konfiguracje

Ta rycina pokazuje cztery konfiguracje wektorów i oddzielonych kątem . Okrąg jednostki i jego eliptyczny obraz pod są cieniowane dla odniesienia (z działaniem równomiernie przeskalowanym, aby ). Nagłówki cyfra wskazuje wartość , środek i . Najbliższe takie i mogą się pojawić po transformacji przez to konfiguracja taka jak ta po lewej zAB2ϕ=π/3MMλ1=1θABABMθ=0. Najbardziej oddalone od siebie mogą być konfiguracje takie jak ta po prawej stronie z . Pokazane są dwie możliwości pośrednie.θ=π/2

Rozwiązanie dla wszystkich wymiarów

Widzieliśmy, jak działa , rozszerzając każdy wymiar o współczynnik . Spowoduje to zniekształcenie sfery jednostkowej w elipsoidę. W określić swoje główne osie. Do są odległości od pochodzenia, wzdłuż tych osi, do elipsoidy. W konsekwencji najmniejsza, , jest najkrótszą odległością (od dowolnego kierunku) od początku do elipsoidy, a największa, , jest najdalszą (od dowolnego kierunku) odległości od początku do elipsoidy.Miλi{A|AA=1}eiλiλnλ1

W większych wymiarach , i znajdują się w dwuwymiarowej podprzestrzeni. odwzorowuje koło jednostki w tej podprzestrzeni na przecięcie elipsoidy z płaszczyzną zawierającą i . To skrzyżowanie, będące liniowym zniekształceniem koła, jest elipsą. Oczywiście największa odległość do tej elipsy wynosi nie więcej niż a najkrótsza odległość nie jest mniejsza niż .n>2ABMMAMBλ1=1λn

Jak zauważyliśmy na końcu poprzedniego rozdziału, najbardziej ekstremalną możliwością jest umieszczenie i w płaszczyźnie zawierającej dwa dla których stosunek odpowiednich jest tak mały, jak to możliwe. Stanie się to na płaszczyźnie . Mamy już rozwiązanie dla tej sprawy.ABeiλie1,en

Wnioski

Ekstremalne podobieństwa cosinusów osiągalne przez zastosowanie do dwóch wektorów mających podobieństwo cosinusów podano w i . Osiąga się to poprzez umieszczenie i pod równymi kątami w kierunku, w którym maksymalnie wydłuża dowolny wektor (taki jak kierunek ) i rozdzielając je w kierunku, w którym minimalnie wydłuża dowolny wektor ( takie jak kierunek ).Mcos(2ϕ)(2)(3)ABΣ=MMe1Σen

Te skrajne mogą być obliczane w odniesieniu do metody SVD .M

Whuber
źródło
To fantastyczna odpowiedź! Dziękuję bardzo za tę szczegółową dyskusję! Uważam, że masz błąd znaku w eqn (3), gdzie powinieneś mieć ogólny znak minus.
LFH
Interesuje mnie przypadek, w którym kąt zbliża się do zera i chciałbym uzyskać nierówność między i . Czy to prawda, że ​​w oparciu o twoje obliczenia po prostu muszę znaleźć najbardziej ekstremalny (to jest najmniejszy) iw tym przypadku asymptotyczną nierówność podaje jak ? 2ϕ2ϕfλn2λnϕf2λn1ϕϕ0
LFH
6

Prawdopodobnie jesteś zainteresowany:

(MA,MB)=AT(MTM)B,

Możesz diagonalizować (lub, jak to nazywacie, PCA), co mówi, że podobieństwo podczas transformacji zachowuje się poprzez rzutowanie na główne składniki, a następnie obliczanie podobieństwa w tej nowej przestrzeni. Aby jeszcze bardziej to , pozwól, aby główne składniki były z wartościami własnymi . NastępnieMTM=UΣUTA,BMA,Buiλi

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

co daje ci:

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

Zauważ, że dzieje się tutaj skalowanie: rozciągają się / kurczą. Gdy są wektorami jednostkowymi i jeśli każdy , to odpowiada rotacji, a otrzymasz: , który jest jest równoważne stwierdzeniu, że produkty wewnętrzne są niezmienne pod rotacją. Zasadniczo kąt pozostaje taki sam, gdy jest transformacją konformalną, co w tym przypadku wymaga, aby był odwracalny, a rozkład biegunowy spełnia z , tj. .λiA,Bλi=1Msim(MA,MB)=sim(A,B)MMMM=OPP=aIMTM=a2I

Alex R.
źródło
1
Twoje wstępne stwierdzenie problemu pomija normalizację wektorów , , i wymaganych do obliczenia podobieństwa cosinus. Nie wydaje się również, aby późniejsza analiza dotyczyła tej normalizacji. Należy zauważyć w szczególności, że podobieństwa cosinus są zachowane, nawet jeśli wszystkie wartości własne są równe pewnej (dodatniej) wartości, która różni się od . To pokazuje, nawet w tym prostym przypadku, że można powiedzieć znacznie więcej. ABMAMB1
whuber
@ whuber: podobieństwo cosinus jest zachowane dokładnie wtedy, gdy jest transformacją konformalną, co w tym przypadku jest równoznaczne z wymaganiem, aby był odwracalny, a , wielokrotność tożsamości. Mówiąc inaczej, rozkład biegunowy spełnia , gdzie . Masz rację o normalizacji, ale wydaje się głupie mówić o cosinus podobieństwa nie znormalizowanych wektorów . MMMTM=a2IMM=OPP=aIA,B
Alex R.
2
Wcale nie głupie! Ponieważ to „podobieństwo” wynika z cosinusa kąta między wektorami, ma sens dla dowolnych dwóch wektorów niezerowych. Co mam na myśli przez „dużo więcej można powiedzieć” jest to, że skuteczne granice kąta między obrazami i mogą być uzyskane w zakresie kąta między i oraz wartości własnych . ABABM
whuber