[Uwaga: uważam, że to pytanie w żaden sposób nie zależy od poprawności lub nieprawidłowości pracy Deolalikar.]
Na blogu Scotta Aaronsona „ Shtetl Optimized” , w dyskusji na temat ostatniej próby Deolalikara przeciwko P vs NP, Leonid Gurvits skomentował :
Próbowałem zrozumieć / przeformułować to podejście i oto moja, być może bardzo minimalistyczna, próba: dyskretne rozkłady probabilistyczne w artykule można traktować jako tensory lub bardzo szczególne wielomianowe wielomiany. Założenia „P = NP” w jakiś sposób dają (wielomian?) Górną granicę rangi tensora. I wreszcie, korzystając ze znanych wyników probabilistycznych, dostaje niepasującą (wykładniczą?) Dolną granicę na tym samym poziomie. Jeśli mam rację, to podejście jest bardzo sprytnym, w pewnym sensie elementarnym, sposobem na popchnięcie poprzednich podejść algebraiczno-geometrycznych.
Pomimo podejrzanych / znanych wad w dowodzie Deolalikara jestem ciekawy:
W jaki sposób rozkłady omówione w pracy Deolalikara można uznać za tensory i w jaki sposób stwierdzenia jego wyników (niezależnie od ich poprawności) przekładają się na stwierdzenia dotyczące rangi tensora?
źródło
Odpowiedzi:
[Czytałem coś, co uważałem za całkowicie niezwiązane, a potem miałem „aha moment”, więc chyba wymyśliłem przynajmniej część odpowiedzi. Nie jestem pewien, czy to właśnie miał na myśli Gurvits, ale ma to dla mnie sens.]
Rozkład zmiennych binarnych n może być postrzegane jako element iloczynu tensora R 2 ⊗ ⋯ ⊗ R 2 (n czynników) (faktycznie powiązana przestrzeń rzutowa, ale przejdziemy do tego). Jeśli mamy oznaczyć elementy podstawą każdej kopii R 2 przez | 0 ⟩ i | 1 ⟩x1,...,xn R2⊗⋯⊗R2 R2 |0⟩ |1⟩ , wówczas podstawa tej przestrzeni iloczynu tensora jest podana przez zestaw wszystkich ciągów n-bitowych. Jeśli mamy element tego iloczynu tensorowego, którego współczynniki wynoszą 1, to możemy zinterpretować współczynnik dowolnego ciągu n-bitowego jako prawdopodobieństwo wystąpienia tego ciągu - stąd rozkład prawdopodobieństwa! Teraz, ponieważ chcemy tylko rozkładów prawdopodobieństwa (współczynniki sumujące się do 1), możemy znormalizować dowolny wektor w produkcie tensorowym, który ma tę właściwość. Biorąc pod uwagę tylko znormalizowane tensory, tak naprawdę bierzemy pod uwagę tylko elementy przestrzeni rzutowej tego produktu tensorowego.
Teraz musimy połączyć rangę tensorową z koncepcją Deolalikara dotyczącą parametryzacji polilogu. Według tej stronie Terry Tao, wydaje się, że pojęcie Deolalikar jest z polylog-parametrizability jest to, że dystrybucja może być "uwzględnione potencjału", jak ľ ( x 1 , . . . , X n ) = Π n i = 1 s I ( x i ; x p a ( i ) ) gdzie pa (i) jest zbiorem zmiennych polylog (n), zdefiniowanych jako „rodzice i” orazμ μ(x1,...,xn)=∏ni=1pi(xi;xpa(i)) to rozkład na x i, który zależy tylko od tych zmiennych nadrzędnych. Ponadto ukierunkowany wykres rodziców powinien być acykliczny.pi(−;xpa(i)) xi
Zacznijmy od bardzo prostego rodzaju dystrybucji. Załóżmy, spełnia μ ( x 1 , . . . , X n ) = Π n i = 1 p ı ( x I ) na jakiś rozkładów P ı (gdzie P i zależy tylko od x I ). To jest oczywiste, z nadzieją, że odpowiednia jest tensor tensor Pozycja 1: ( p 1 ( 0 ) | 0 ⟩ +μ μ(x1,...,xn)=∏ni=1pi(xi) pja pja xja .(p1(0)|0⟩+p1(1)|1⟩)⊗⋯⊗(pn(0)|0⟩+pn(1)|1⟩)
Dla nieco bardziej skomplikowanego rozkładu, załóżmy, że chcemy rozważyć rozkład równomierny na ciągach, gdzie (są one zaprzeczeniem siebie nawzajem) dla wszystkich i . W interpretacji języka Deolalikara przez Tao byłby to rozkład parametryzowalny O ( 1 ) . Następnie Odpowiada tensora ( | 0 ⟩ ⊗ | 1 ⟩ + | 1 ⟩ ⊗ |x2i=1−x2i+1 i O(1) liczbami ( n ) - O (musi być znormalizowany). Jeśli wypiszemy to w całości, zawiera on 2 n / 2 warunki, a więc ma rangę tensorową co najwyżej 2 n / 2 w stosunku do R 2 . Jednak powyżej R 2 ⊗ R 2 ma rangę tensora 1! Uważam, że ten ostatni fakt odpowiada faktowi, że faktoryzację można opisać za pomocą O(|0⟩⊗|1⟩+|1⟩⊗|0⟩)⊗⋯⊗(|0⟩⊗|1⟩+|1⟩⊗|0⟩) 2n/2 2n/2 R2 R2⊗R2 O(n) dla każdej pary sąsiednich bitów, dla każdej z O ( n ) sąsiednich par. Znacząco mniejszy niż 2 n liczb rzeczywistych wymaganych teoretycznie do arbitralnego rozkładu mu na kostce boolowskiej.O(1) O(n) 2n
Nadal mam problemy z sformułowaniem dwóch problemów i chętnie skorzystam z dalszych odpowiedzi na ich temat:
źródło