Jeśli i są dwoma niezależnymi wektorami jednostek losowych w (równomiernie rozmieszczonymi na kuli jednostkowej), jaki jest rozkład ich iloczynu skalarnego (iloczyn skalarny) ?
Wydaje mi się, że gdy szybko rośnie rozkład (?) Staje się normalny z zerową średnią i wariancją malejącą w wyższych wymiarach ale czy istnieje wyraźna formuła dla \ sigma ^ 2 (D) ?
Aktualizacja
Przeprowadziłem kilka szybkich symulacji. Po pierwsze, generując 10000 par wektorów jednostek losowych dla , łatwo zauważyć, że rozkład ich produktów kropkowych jest idealnie gaussowski (w rzeczywistości jest już dość gaussowski dla ), patrz wykres po lewej stronie. Po drugie, dla każdego zakresie od 1 do 10000 (z rosnącymi krokami) wygenerowałem 1000 par i obliczyłem wariancję. Działka logarytmiczny pokazany jest po prawej stronie, a jasne jest, że formuła jest bardzo dobrze aproksymować . Zauważ, że dla i ta formuła daje nawet dokładne wyniki (ale nie jestem pewien, co się stanie później).
źródło
Odpowiedzi:
Ponieważ ( jak dobrze wiadomo ) równomierny rozkład na sferze jednostkowej uzyskuje się przez normalizację rozkładu normalnego zmiennego a iloczynem kropki znormalizowanych wektorów jest ich współczynnik korelacji, odpowiedzi na trzy pytania to: D tS.D - 1 re t
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u = ( t + 1 ) / 2 ma rozkład Beta .( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
Wariancja jest równa (jak spekulowano w pytaniu).1 / Dt 1 / D
Standaryzowany rozkład zbliża się do normalności w tempieO ( 1t O ( 1re) .
metoda
Dokładny rozkład iloczyn skalarny wektorów jednostkowych można łatwo uzyskać geometrycznie, ponieważ jest składnikiem drugiego wektora w kierunku pierwszego. Ponieważ drugi wektor jest niezależny od pierwszego i jest równomiernie rozmieszczony na kuli jednostkowej, jego komponent w pierwszym kierunku jest rozłożony tak samo, jak dowolna współrzędna kuli. (Zauważ, że rozkład pierwszego wektora nie ma znaczenia.)
Znalezienie gęstości
Pozwalając, że koordynuje się ostatniego, gęstość w jest więc proporcjonalna do obszaru powierzchni do leżenia na wysokości między i w sferze jednostkowej. Ta proporcja występuje w obrębie pasa o wysokości i promieniu który jest w zasadzie stożkiem ściętym zbudowanym z o promieniu wysokości i nachylenia . Skąd prawdopodobieństwo jest proporcjonalne dot t + d t d t √t ∈ [ - 1 , 1 ] t t + dt ret S D - 2 √1 - t2)-----√, S.D - 2 dt1/ √1 - t2)-----√, ret 1/1−t2−−−−−√
Pozostawienie pociąga za sobą . Podstawienie tego do powyższego daje element prawdopodobieństwa do stałej normalizującej:t = 2 u - 1u=(t+1)/2∈[0,1] t=2u−1
Jest natychmiastowe, że ma rozkład Beta , ponieważ (z definicji) jego gęstość jest również proporcjonalna do( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u = ( t + 1 ) / 2 ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
Określenie zachowania granicznego
Informacje o zachowaniu ograniczającym wynikają łatwo z tego za pomocą technik elementarnych: można zintegrować, aby uzyskać stałą proporcjonalności ; można zintegrować (na przykład wykorzystując właściwości funkcji Beta) w celu uzyskania momentów, co pokazuje, że wariancja wynosi i zmniejsza się do (skąd, zgodnie z twierdzeniem Czebyszewa, prawdopodobieństwo koncentruje się w pobliżu ); a następnie rozkład graniczny jest przez uwzględnienie wartości gęstości znormalizowanego rozkładu, proporcjonalnego do dla małych wartościΓ ( nfare tkfD(t)1/DΓ ( n2))π√Γ ( D - 12)) tkfare( t ) 1 / D t = 0 f D ( t / √0 t = 0 tfare( t / D--√) , t :
gdzie litery reprezentują (log) stałe integracji. Oczywiście szybkość, z jaką zbliża się to do normalności (dla której gęstość logarytmu jest równa ), wynosi- 1C O ( 1−12t2 O(1D).
Ten wykres pokazuje gęstości iloczynu dla , w standaryzacji dla wariancji jednostkowej i ich graniczną gęstość. Wartości przy rosną wraz z (od niebieskiego przez czerwony, złoty, a następnie zielony dla standardowej gęstości normalnej). Gęstość dla byłaby nie do odróżnienia od gęstości normalnej przy tej rozdzielczości.0 D D = 1000D = 4,6,10 0 D D = 1000
źródło
Znajdźmy rozkład, a następnie wariancja podąża za standardowymi wynikami. Rozważ produkt wektorowy i napisz go w postaci cosinusowej, tzn. Zauważ, że mamy w którym jest kątem pomiędzy i . W ostatnim kroku użyłem tego dla wszystkich zdarzeń iTeraz rozważmy termin . Oczywiste jest, że ponieważ jest wybierany równomiernie względem powierzchni kuli, nie ma znaczenia, coθ x y A B E P ( A ∣ B ) : = E [ E [ χ
Aby uzyskać wyraźny wynik wariancji, użyj faktu, że iloczyn skalarny oznacza zero przez niezależność i, jak pokazano powyżej, rozkłada się jak pierwsza współrzędna . Według tych wyników znalezienie oznacza znalezienie . Zauważmy, że dla konstrukcji więc możemy napisać gdzie ostatnia równość wynika z tego, że współrzędne są identycznie rozmieszczone. , odkryliśmy, żeVar ( x ′ y ) E x 2 1 x ′ x = 1 1 = E x ′ x = E n ∑ i = 1 x 2 i = n ∑ i = 1 E x 2 i = n E x 2 1 , x Var ( x ′ y ) = = 1 nx Var ( x′y) E x2)1 x′x = 1
źródło
Aby odpowiedzieć na pierwszą część pytania, oznacz . Definiują Iloczyn elementami od i oznaczoną tu jako zostaną rozdzielone zgodnie ze wspólnym dystrybucji i . następnie od ,Z= ⟨ X, Y⟩ = ∑ XjaYja
W drugiej części myślę, że jeśli chcesz powiedzieć coś interesującego o asymptotycznym zachowaniu , musisz przynajmniej założyć niezależność i , a następnie zastosować CLT.σ X Y
Na przykład, jeśli chcesz założyć, że mają tę samą wartość z i możesz powiedz, że i .{ Z1, … , Zre} E [ Zja] = μ V [ Zja] = σ2) limD→∞σ2(D)=0σ2)( D ) = σ2)re limD → ∞σ2)( D ) = 0
źródło