Usiłuję znaleźć rozkład na losowych wektorów, powiedzmy , na sferze jednowymiarowej (gdzie ), która minimalizuje zastrzeżeniem ograniczenia \ mathbb {E} [x_i ^ Tx_j] = 0 .
Próbowałem niektórych dystrybucji i prawie wszystkie mają wariancję . Na przykład zarówno rozkład, w którym każda współrzędna każdego jest niezależnie i równomiernie wybierana spośród a także rozkład, w którym każdy jest niezależnym jednorodnym wektorem w sferze jednostkowej wymiarowej ma wariancję .
Czy to minimalna wariancja między wszystkimi rozkładami?
Odpowiedzi:
Przedstawię równoważne, ale prostsze sformułowanie problemu i pokażę dolną granicę ( n / k - 1) / ( n −1).
Pokazuję również związek z otwartym problemem w informacji kwantowej.[Edytuj w wersji 3: We wcześniejszych wersjach twierdziłem, że dokładna charakterystyka przypadków, w których osiągnięto dolną granicę pokazaną poniżej, może być trudna, ponieważ analogiczne pytanie w złożonej sprawie obejmuje otwarty problem dotyczący SIC-POVM w informacja kwantowa. Jednak to połączenie z SIC-POVM było nieprawidłowe. Aby uzyskać szczegółowe informacje, zobacz sekcję „Nieprawidłowe połączenie z SIC-POVM w informacjach kwantowych” poniżej.]Równoważne sformułowanie
Po pierwsze, jak już wskazano w odpowiedzi Daniello, zauważ, że Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Tak więc w pozostałej części odpowiedzi zapominamy o wariancji i zamiast tego minimalizujemy max i ≠ j E [( x i T x j ) 2 ].
Następnie, gdy zdecydujemy, że naszym celem jest zminimalizowanie max i ≠ j E [( x i T x j ) 2 ], możemy zignorować ograniczenie, że E [ x i T x j ] = 0. Jest tak, ponieważ jeśli mamy losowe wektory jednostkowe x 1 ,…, x n , wówczas możemy negować każdy z nich niezależnie z prawdopodobieństwem 1/2, aby spełnić E [ x i T x j ] = 0 bez zmiany wartości funkcji celu max i ≠ j E [( x i T x j) 2 ].
Ponadto, zmiana funkcji celu z max i ≠ j E [( x i T x j ) 2 ] na (1 / ( n ( n −1))) ∑ i ≠ j E [( x i T x j ) 2 ] nie zmienia optymalnej wartości. Ta ostatnia jest co najwyżej pierwsza, ponieważ średnia jest co najwyżej maksymalna. Jednak zawsze możemy dokonać wartości E [( x i T x j ) 2 ] dla różnych wyborów ( i , j ) ( i ≠j ) równe przez permutację n wektorów x 1 ,…, x n losowo.
Zatem dla dowolnego n i k optymalna wartość danego problemu jest równa minimum (1 / ( n ( n- 1))) ∑ i ≠ j E [( x i T x j ) 2 ] gdzie x 1 , ..., x n są zmiennymi losowymi, które przyjmują wektor jednostkowy w ℝ k jako wartości.
Jednak zgodnie z liniowością oczekiwań ta funkcja celu jest równa wartości oczekiwanej E [(1 / ( n ( n- 1))) ∑ i ≠ j ( x i T x j ) 2 ]. Ponieważ minimum jest co najwyżej średnią, nie ma już potrzeby rozważania rozkładów prawdopodobieństwa. Oznacza to, że optymalna wartość powyższego problemu jest równa optymalnej wartości:
Dolna granica
Korzystając z tego równoważnego sformułowania, udowodnimy, że optymalna wartość wynosi co najmniej ( n / k - 1) / ( n −1).
Dla 1 ≤ i ≤ n , niech X i = x i x i T będzie projektorem rangi 1 odpowiadającym wektorowi jednostkowemu x i . Następnie utrzymuje, że ( x i T x j ) 2 = Tr ( X i X j ).
Niech Y = ∑ i X i . Następnie utrzymuje, że ∑ i ≠ j Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .
Nierówność Cauchy'ego-Schwarza oznacza, że Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , a zatem ∑ i ≠ j Tr ( X i X j ) = Tr ( Y 2 ) - n ≥ n 2 / k - n . Dzieląc przez n ( n- 1), otrzymujemy, że wartość celu wynosi co najmniej ( n / k - 1) / ( n- 1).
W szczególności, gdy n = k +1, odpowiedź Daniello mieści się w współczynniku 2 od wartości optymalnej.
Kiedy można osiągnąć tę dolną granicę?
Osiągnięcie tego dolna granica ( n / k - 1) / ( n -1), co jest równoważne Y = ( n / k ) I . Nie znam dokładnej charakterystyki, kiedy jest osiągalna, ale istnieją następujące wystarczające warunki:
Chociaż nie sprawdziłem szczegółów, wydaje się, że każdy sferyczny projekt 2 daje rozwiązanie osiągające tę dolną granicę.
Niepoprawne połączenie z SIC-POVM w informacji kwantowej
We wcześniejszych wersjach stwierdziłem:
Ale ta relacja była niepoprawna. Wyjaśnię dlaczego.
Jak dotąd było to poprawne.
Ta część była niepoprawna. SIC-POVM to zbiór wektorów jednostkowych k 2 x 1 ,…, x n ∈ ℂ k, dla których | x i * x j | 2 = 1 / ( k +1) dla wszystkich i ≠ j . Zauważ, że tutaj wymóg musi posiadać dla wszystkich par i ≠ j , nie tylko średnią z wszystkich par i ≠ j . W sekcji „Formułowanie ekwiwalentne” wykazaliśmy równoważność między minimalizowaniem maksimum a minimalizowaniem średniej, ale było to możliwe, ponieważ x 1,…, X n były zmiennymi losowymi przyjmującymi wektory jednostkowe. Tutaj x 1 ,…, x n są tylko wektorami jednostkowymi, więc nie możemy użyć tej samej sztuczki.
źródło
Moją intuicją jest to, że jest tak źle (jak to tylko możliwe), ale nie mam dowodu. Bardziej interesujące jest to, że ta konstrukcja wydaje się załamać dla n >> k, a także wtedy, gdy muszą być wybrane niezależnie (być może z różnych rozkładów).xi
źródło