Rozkład produktów skalarnych dwóch losowych wektorów jednostkowych w wymiarach

27

Jeśli i są dwoma niezależnymi wektorami jednostek losowych w (równomiernie rozmieszczonymi na kuli jednostkowej), jaki jest rozkład ich iloczynu skalarnego (iloczyn skalarny) ?xyRDxy

Wydaje mi się, że gdy szybko rośnie rozkład (?) Staje się normalny z zerową średnią i wariancją malejącą w wyższych wymiarach ale czy istnieje wyraźna formuła dla \ sigma ^ 2 (D) ?D

limDσ2(D)0,
σ2(D)

Aktualizacja

Przeprowadziłem kilka szybkich symulacji. Po pierwsze, generując 10000 par wektorów jednostek losowych dla D=1000 , łatwo zauważyć, że rozkład ich produktów kropkowych jest idealnie gaussowski (w rzeczywistości jest już dość gaussowski dla D=100 ), patrz wykres po lewej stronie. Po drugie, dla każdego D zakresie od 1 do 10000 (z rosnącymi krokami) wygenerowałem 1000 par i obliczyłem wariancję. Działka logarytmiczny pokazany jest po prawej stronie, a jasne jest, że formuła jest bardzo dobrze aproksymować 1/D . Zauważ, że dla D=1 i re=2) ta formuła daje nawet dokładne wyniki (ale nie jestem pewien, co się stanie później).

iloczyny między losowymi wektorami jednostek

ameba mówi Przywróć Monikę
źródło
@KarlOskar: dziękuję, ten link jest bardzo trafny i faktycznie czyni moje pytanie prawie duplikatem, ale nie całkiem. Istnieje więc wyraźna formuła dla która jest funkcją skumulowanego rozkładu produktów kropkowych. Można pobrać pochodną, ​​aby uzyskać plik PDF, a następnie przestudiować limit . Jednak wzór podano w kategoriach funkcji beta i niekompletnych funkcji beta, więc obliczenia prawdopodobnie będą nieprzyjemne. D P.{(x,y)>ϵ}re
ameba mówi Przywróć Monikę
@KarlOskar: z rozkładu równomiernego na sferze jednostkowej w . Aby wygenerować losowy wektor z tego rozkładu, można wygenerować losowy wektor z Gaussa o wariancji jednostkowej, a następnie znormalizować go. Rre
ameba mówi Przywróć Monikę

Odpowiedzi:

30

Ponieważ ( jak dobrze wiadomo ) równomierny rozkład na sferze jednostkowej uzyskuje się przez normalizację rozkładu normalnego zmiennego a iloczynem kropki znormalizowanych wektorów jest ich współczynnik korelacji, odpowiedzi na trzy pytania to: D tS.re-1ret

  1. ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2) ma rozkład Beta .((re-1)/2),(re-1)/2))

  2. Wariancja jest równa (jak spekulowano w pytaniu).1 / Dt1/re

  3. Standaryzowany rozkład zbliża się do normalności w tempieO ( 1tO(1re).


metoda

Dokładny rozkład iloczyn skalarny wektorów jednostkowych można łatwo uzyskać geometrycznie, ponieważ jest składnikiem drugiego wektora w kierunku pierwszego. Ponieważ drugi wektor jest niezależny od pierwszego i jest równomiernie rozmieszczony na kuli jednostkowej, jego komponent w pierwszym kierunku jest rozłożony tak samo, jak dowolna współrzędna kuli. (Zauważ, że rozkład pierwszego wektora nie ma znaczenia.)

Znalezienie gęstości

Pozwalając, że koordynuje się ostatniego, gęstość w jest więc proporcjonalna do obszaru powierzchni do leżenia na wysokości między i w sferze jednostkowej. Ta proporcja występuje w obrębie pasa o wysokości i promieniu który jest w zasadzie stożkiem ściętym zbudowanym z o promieniu wysokości i nachylenia . Skąd prawdopodobieństwo jest proporcjonalne dot t + d t d t t[-1,1]tt+retretS D - 2 1-t2),S.re-2)dt1/1-t2),ret1/1-t2)

(1-t2))re-2)1-t2)ret=(1-t2))(re-3))/2)ret.

Pozostawienie pociąga za sobą . Podstawienie tego do powyższego daje element prawdopodobieństwa do stałej normalizującej:t = 2 u - 1u=(t+1)/2)[0,1]t=2)u-1

fare(u)reu(1-(2)u-1)2))(re-3))/2)re(2)u-1)=2)re-2)(u-u2))(re-3))/2)reu.

Jest natychmiastowe, że ma rozkład Beta , ponieważ (z definicji) jego gęstość jest również proporcjonalna do( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2)((re-1)/2),(re-1)/2))

u(re-1)/2)-1(1-u)(re-1)/2)-1=(u-u2))(re-3))/2)fare(u).

Określenie zachowania granicznego

Informacje o zachowaniu ograniczającym wynikają łatwo z tego za pomocą technik elementarnych: można zintegrować, aby uzyskać stałą proporcjonalności ; można zintegrować (na przykład wykorzystując właściwości funkcji Beta) w celu uzyskania momentów, co pokazuje, że wariancja wynosi i zmniejsza się do (skąd, zgodnie z twierdzeniem Czebyszewa, prawdopodobieństwo koncentruje się w pobliżu ); a następnie rozkład graniczny jest przez uwzględnienie wartości gęstości znormalizowanego rozkładu, proporcjonalnego do dla małych wartościΓ ( nfaretkfD(t)1/DΓ(n2))πΓ(re-12))tkfare(t)1/ret = 0 f D ( t / 0t=0tfare(t/re),t :

log(fare(t/re))=do(re)+re-3)2)log(1-t2)re)=do(re)-(1/2)+3)2)re)t2)+O(t4re)do-12)t2)

gdzie litery reprezentują (log) stałe integracji. Oczywiście szybkość, z jaką zbliża się to do normalności (dla której gęstość logarytmu jest równa ), wynosi- 1do O ( 1-12)t2)O(1re).

Postać

Ten wykres pokazuje gęstości iloczynu dla , w standaryzacji dla wariancji jednostkowej i ich graniczną gęstość. Wartości przy rosną wraz z (od niebieskiego przez czerwony, złoty, a następnie zielony dla standardowej gęstości normalnej). Gęstość dla byłaby nie do odróżnienia od gęstości normalnej przy tej rozdzielczości.0 D D = 1000re=4,6,100rere=1000

Whuber
źródło
4
(+1) Dziękuję bardzo, @whuber, to świetna odpowiedź! Specjalne podziękowania za wspomnienie słowa „frustum”. Zdarza się, że zaakceptowałem inną odpowiedź na kilka minut przed wysłaniem twojej i nie chciałbym jej teraz odrzucać; nadzieję, że rozumiesz. Szkoda, że ​​nie można zaakceptować obu! Nawiasem mówiąc, zauważ bardzo prosty dowód wyrażenia dla wariancji z tej odpowiedzi: można to zobaczyć bezpośrednio, bez bałagania się z funkcjami beta! Wariancja iloczynu kropkowego jest równa wariancji dowolnej współrzędnej kuli (jak napisałeś), a suma wszystkich powinna wynosić , QEDD 11/rere1
amoeba mówi Przywróć Monikę
1
To miła obserwacja na temat wariancji.
whuber
2
@amoeba, ostatnia aktywność również zwróciła moją uwagę tutaj i choć doceniam, że zaakceptowałeś moją odpowiedź, ta jest o wiele pełniejsza. Nie miałbym nic przeciwko, gdybyś się zmienił.
ekvall
1
@ Student001: jest to uczciwy i hojny komentarz. Zmieniłem przyjętą odpowiedź. Znalazłem też jedno twoje i jedno twoje A, aby głosować, aby to naprawić :)
amoeba mówi Przywróć Monikę
1
@mat Rozkład jest równy . To sprawia, że ​​jest to rozkład Beta, który został przeskalowany i przesunięty z przedziału na przedział . 2 U - 1 [ 0 , 1 ] [ - 1 , 1 ]t2)U-1[0,1][-1,1]
whuber
11

Znajdźmy rozkład, a następnie wariancja podąża za standardowymi wynikami. Rozważ produkt wektorowy i napisz go w postaci cosinusowej, tzn. Zauważ, że mamy w którym jest kątem pomiędzy i . W ostatnim kroku użyłem tego dla wszystkich zdarzeń iTeraz rozważmy termin . Oczywiste jest, że ponieważ jest wybierany równomiernie względem powierzchni kuli, nie ma znaczenia, coθ x y A B E P ( A B ) : = E [ E [ χ

P.(xyt)=P.(|x||y|sałataθt)=P.(sałataθt)=miP.(sałataθty),
θxyZAb . x 1P ( cos θ t y ) x y x y y y = [ 1 , 0 , 0 , ] . P ( x y t ) = P ( x 1t )
miP.(ZAb): =mi[mi[χZAb]]=miχZA=P.(ZA).
P.(sałataθty)xyfaktycznie jest tylko kąt między i sprawach. Tak więc termin wewnątrz oczekiwania jest faktycznie stały w funkcji i możemy wlog założyć, żeNastępnie otrzymujemyale ponieważ jest pierwszą współrzędną znormalizowanego wektora gaussowskiego w mamy, że jest gaussowskim z wariancją przez wywołanie asymptotycznego wyniku tego artykułu .xyyy=[1,0,0,].
P.(xyt)=P.(x1t).
x1 x y1 / nRn,xy1/n

Aby uzyskać wyraźny wynik wariancji, użyj faktu, że iloczyn skalarny oznacza zero przez niezależność i, jak pokazano powyżej, rozkłada się jak pierwsza współrzędna . Według tych wyników znalezienie oznacza znalezienie . Zauważmy, że dla konstrukcji więc możemy napisać gdzie ostatnia równość wynika z tego, że współrzędne są identycznie rozmieszczone. , odkryliśmy, żeVar ( x y ) E x 2 1 x x = 1 1 = E x x = E n i = 1 x 2 i = n i = 1 E x 2 i = n E x 2 1 , x Var ( x y ) = = 1 nxVar(xy)mix12)xx=1

1=mixx=mija=1nxja2)=ja=1nmixja2)=nmix12),
xVar(xy)=mix12)=1/n
ekvall
źródło
Dziękuję, ale jestem zdezorientowany: czym dokładnie jest „pożądany wynik” i jak wynika z ostatniego równania? Ostateczny rozkład prawdopodobieństwa powinien zależeć . re
ameba mówi Przywróć Monikę
W rzeczywistości sposób, w jaki wynik wynika z ostatniego równania, jest dokładnie omawiany w wątku math.SE , który znaleziono. Dotyczy dystrybucji beta itp., A zachowanie ograniczające jest (dla mnie) dalekie od oczywistych. Chyba nie powinien być prościej bezpośredni sposób, aby zobaczyć, że . σ2)(re)1/re
ameba mówi Przywróć Monikę
Zależy to od wymiaru, ponieważ , gdzie jest wygenerowanym wektorem gaussowskim. Zaktualizuję odpowiedź później dzisiaj lub jutro. x1=z1|z|-1z
ekvall
Wow, świetnie, twój ostatni link zawiera granicę tego wyrażenia obejmującego odwrotne funkcje beta (które bałam się obliczyć) w trzecim równaniu na stronie 1. Więc uzupełnij rozumowanie: jeśli kula ma promień , wtedy jest (asymptotycznie) dystrybuowany jako . Co oznacza, że dla promienia kuli wariancji jednostka jest -krotnie mniejsza, czyli . Jednak nadal mam obawy: sprawdziłem od 1 do 4, a wydaje się dawać dokładną wariancję, mimo że rozkłady dla D = 1 lub D = 2 są bardzo dalekie od normalnych. Powodem tego powinien być głębszy powód. x1N(0,1)D1/DD1/Drex1N.(0,1)re1/rere1/re
ameba mówi Przywróć Monikę
@amoeba Tak, zaktualizowano o tym dowód.
ekvall
2

Aby odpowiedzieć na pierwszą część pytania, oznacz . Definiują Iloczyn elementami od i oznaczoną tu jako zostaną rozdzielone zgodnie ze wspólnym dystrybucji i . następnie od , Z=X,Y=XjaYja

faZja(zja)=-faZ1,,Zre(z1,,zre)rezja
jathXYZjaXjaYja
faZja(zja)=-faXja,Yja(x,zjax)1|x|rex
Z=Zja
faZ(z)=--faZ1,,Zre(z1,,zre)δ(z-zja)rez1rezre

W drugiej części myślę, że jeśli chcesz powiedzieć coś interesującego o asymptotycznym zachowaniu , musisz przynajmniej założyć niezależność i , a następnie zastosować CLT.σXY

Na przykład, jeśli chcesz założyć, że mają tę samą wartość z i możesz powiedz, że i .{Z1,,Zre}mi[Zja]=μV.[Zja]=σ2) limDσ2(D)=0σ2)(re)=σ2)relimreσ2)(re)=0

Tomek
źródło
Dziękuję, ale jestem zdezorientowany co do drugiej części. i są oczywiście niezależne, dodam to do pytania. Mówisz, że , i to brzmi rozsądnie, ale jakie jest asymptotyczne zachowanie ? Myślę, że ekspresja szukam powinna zależeć wyłącznie od . Nawiasem mówiąc w 2D jeśli się nie mylę, zastanawiam się, czy to prawda w wyższych wymiarach ...YXYV R ( z I ) D V R ( z I ) = 1 / 2σ2)(re)=V.zar(zja)/reV.zar(zja)reV.zar(zja)=1/2)
Amoeba mówi Przywróć Monikę
Czy naprawdę jest możliwe, aby był niezależny, biorąc pod uwagę, że i mają długość jednostkową? X YzjaXY
ekvall
@tom: Przy okazji, to błędne: 2D wynosi 1, to , która jest równa 1/2. Zaktualizowałem moje pytanie o niektóre wyniki symulacji. Wydaje się, że wzór jest poprawna . V a r ( z ) 1 / DV.zar(zja)V.zar(z)1/re
ameba mówi Przywróć Monikę