Jakie jest minimum we wszystkich rozkładach wektorów jednostkowych wariancji iloczynu wektorów?

10

Usiłuję znaleźć rozkład na losowych wektorów, powiedzmy , na sferze jednowymiarowej (gdzie ), która minimalizuje zastrzeżeniem ograniczenia \ mathbb {E} [x_i ^ Tx_j] = 0 .nx1,,xnkn>kmaxijVar(xiTxj)E[xiTxj]=0

Próbowałem niektórych dystrybucji i prawie wszystkie mają wariancję . Na przykład zarówno rozkład, w którym każda współrzędna każdego jest niezależnie i równomiernie wybierana spośród a także rozkład, w którym każdy jest niezależnym jednorodnym wektorem w sferze jednostkowej wymiarowej ma wariancję .1/kxi{1/k,1/k}xik1/k

Czy to minimalna wariancja między wszystkimi rozkładami?1/k

peng
źródło
Jak mocno jesteś zainteresowany? To znaczy, czy dolna granica 1 / 100k, która działa tylko dla n> 100k, byłaby interesująca, czy nie?
daniello
@ Daniello, czy masz na myśli dolną granicę 1 / ck dla n> ck, gdzie c jest jakieś stałe? Jak to udowodnić?
peng
Coś, czego nie rozumiem w pytaniu: na początku mówisz o rozkładzie wektorów jednostkowych , ale nie o wszystkich rozkładach, o których mówiłeś, że próbujesz generować wektory jednostkowe ... Czy masz na myśli to dla wszystkich , ? xiE[|xi|]=1
daniello
@deniello, chciałem, aby wszystkie wektory były „jednostkami”. Przepraszam, zapomniałem przeprowadzić normalizację na wektorze „Gaussa”, po normalizacji będzie to to samo, co wektor jednolity. Dziękujemy za zwrócenie uwagi na ten błąd.
peng

Odpowiedzi:

8

Przedstawię równoważne, ale prostsze sformułowanie problemu i pokażę dolną granicę ( n / k - 1) / ( n −1). Pokazuję również związek z otwartym problemem w informacji kwantowej. [Edytuj w wersji 3: We wcześniejszych wersjach twierdziłem, że dokładna charakterystyka przypadków, w których osiągnięto dolną granicę pokazaną poniżej, może być trudna, ponieważ analogiczne pytanie w złożonej sprawie obejmuje otwarty problem dotyczący SIC-POVM w informacja kwantowa. Jednak to połączenie z SIC-POVM było nieprawidłowe. Aby uzyskać szczegółowe informacje, zobacz sekcję „Nieprawidłowe połączenie z SIC-POVM w informacjach kwantowych” poniżej.]

Równoważne sformułowanie

Po pierwsze, jak już wskazano w odpowiedzi Daniello, zauważ, że Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Tak więc w pozostałej części odpowiedzi zapominamy o wariancji i zamiast tego minimalizujemy max ij E [( x i T x j ) 2 ].

Następnie, gdy zdecydujemy, że naszym celem jest zminimalizowanie max ij E [( x i T x j ) 2 ], możemy zignorować ograniczenie, że E [ x i T x j ] = 0. Jest tak, ponieważ jeśli mamy losowe wektory jednostkowe x 1 ,…, x n , wówczas możemy negować każdy z nich niezależnie z prawdopodobieństwem 1/2, aby spełnić E [ x i T x j ] = 0 bez zmiany wartości funkcji celu max ij E [( x i T x j) 2 ].

Ponadto, zmiana funkcji celu z max ij E [( x i T x j ) 2 ] na (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] nie zmienia optymalnej wartości. Ta ostatnia jest co najwyżej pierwsza, ponieważ średnia jest co najwyżej maksymalna. Jednak zawsze możemy dokonać wartości E [( x i T x j ) 2 ] dla różnych wyborów ( i , j ) ( ij ) równe przez permutację n wektorów x 1 ,…, x n losowo.

Zatem dla dowolnego n i k optymalna wartość danego problemu jest równa minimum (1 / ( n ( n- 1))) ∑ ij E [( x i T x j ) 2 ] gdzie x 1 , ..., x n są zmiennymi losowymi, które przyjmują wektor jednostkowy w ℝ k jako wartości.

Jednak zgodnie z liniowością oczekiwań ta funkcja celu jest równa wartości oczekiwanej E [(1 / ( n ( n- 1))) ∑ ij ( x i T x j ) 2 ]. Ponieważ minimum jest co najwyżej średnią, nie ma już potrzeby rozważania rozkładów prawdopodobieństwa. Oznacza to, że optymalna wartość powyższego problemu jest równa optymalnej wartości:

Wybierz wektory jednostkowe x 1 ,…, x n ∈ ℝ k, aby zminimalizować (1 / ( n ( n- 1))) ∑ ij ( x i T x j ) 2 .

Dolna granica

Korzystając z tego równoważnego sformułowania, udowodnimy, że optymalna wartość wynosi co najmniej ( n / k - 1) / ( n −1).

Dla 1in , niech X i = x i x i T będzie projektorem rangi 1 odpowiadającym wektorowi jednostkowemu x i . Następnie utrzymuje, że ( x i T x j ) 2 = Tr ( X i X j ).

Niech Y = ∑ i X i . Następnie utrzymuje, że ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .

Nierówność Cauchy'ego-Schwarza oznacza, że ​​Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , a zatem ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 / k - n . Dzieląc przez n ( n- 1), otrzymujemy, że wartość celu wynosi co najmniej ( n / k - 1) / ( n- 1).

W szczególności, gdy n = k +1, odpowiedź Daniello mieści się w współczynniku 2 od wartości optymalnej.

Kiedy można osiągnąć tę dolną granicę?

Osiągnięcie tego dolna granica ( n / k - 1) / ( n -1), co jest równoważne Y = ( n / k ) I . Nie znam dokładnej charakterystyki, kiedy jest osiągalna, ale istnieją następujące wystarczające warunki:

  • Gdy n = k +1, można to osiągnąć, biorąc pod uwagę wektory jednostkowe k +1, które tworzą regularny k -simplex wyśrodkowany na początku, poprawiając się z 2 / ( k ( k +1)) w odpowiedzi Daniello na optymalną 1 / k 2 .
  • Gdy n jest wielokrotnością k , to wyraźnie osiągalne poprzez ustalenie Baza Ortonormalna z ℝ k i przypisanie każdego z wektorów bazowych do n / k o v 1 , ..., v n .
  • Bardziej ogólnie niż ostatni punkt, jeśli jest to osiągalne przy pewnym wyborze k i zarówno n = n 1, jak i n = n 2 , to jest również osiągalne dla tego samego k i n = n 1 + n 2 . W szczególności można to osiągnąć, jeśli n = a k + b, gdzie a i b są liczbami całkowitymi spełniającymi ab ≥0.

Chociaż nie sprawdziłem szczegółów, wydaje się, że każdy sferyczny projekt 2 daje rozwiązanie osiągające tę dolną granicę.

Niepoprawne połączenie z SIC-POVM w informacji kwantowej

We wcześniejszych wersjach stwierdziłem:

Podejrzewam, że odpowiedź na to pytanie jest trudna. Powodem jest to, że jeśli zamiast rozważyć kompleksową przestrzeni wektorowej ℂ k , to pytanie jest związane z otwartym problemem w informacji kwantowej.

Ale ta relacja była niepoprawna. Wyjaśnię dlaczego.

Dokładniej, rozważ następujący problem:

Wybierz wektory jednostkowe x 1 ,…, x n ∈ ℂ k, aby zminimalizować (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

Dolna granica powyżej również obowiązuje w tej złożonej wersji. Rozważ przypadek, w którym n = k 2 w wersji złożonej. Wtedy dolna granica jest równa 1 / ( k +1).

Jak dotąd było to poprawne.

Zestaw wektorów jednostkowych k 2 x 1 ,…, x k 2 ∈ ℂ k osiągających dolną granicę nazywa się SIC-POVM w wymiarze k ,

Ta część była niepoprawna. SIC-POVM to zbiór wektorów jednostkowych k 2 x 1 ,…, x n ∈ ℂ k, dla których | x i * x j | 2 = 1 / ( k +1) dla wszystkich ij . Zauważ, że tutaj wymóg musi posiadać dla wszystkich par ij , nie tylko średnią z wszystkich par ij . W sekcji „Formułowanie ekwiwalentne” wykazaliśmy równoważność między minimalizowaniem maksimum a minimalizowaniem średniej, ale było to możliwe, ponieważ x 1,…, X n były zmiennymi losowymi przyjmującymi wektory jednostkowe. Tutaj x 1 ,…, x n są tylko wektorami jednostkowymi, więc nie możemy użyć tej samej sztuczki.

Tsuyoshi Ito
źródło
5

v1,v2,,vk{1,2,,k+1}xi=xj=v1xtt{i,j}v2,,vkt{1,,k+1}xixi12

E[xaxb]=0xaxb12

Var[xaxb]=E[(xaxb)2](xaxb)2=1{a,b}={i,j}1(k+12)(xaxb)2=0. Zatem mamy to dla każdego , : ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

Moją intuicją jest to, że jest tak źle (jak to tylko możliwe), ale nie mam dowodu. Bardziej interesujące jest to, że ta konstrukcja wydaje się załamać dla n >> k, a także wtedy, gdy muszą być wybrane niezależnie (być może z różnych rozkładów).xi

Daniello
źródło