sieci w odniesieniu do normy cięcia

10

Przeciętna norma ||ZA||do rzeczywistej macierzy ZA=(zaja,jot)Rn×n jest maksimum we wszystkich ja[n],jot[n] ilości |jaja,jotjotzaja,jot|.

Zdefiniuj odległość między dwiema macierzami ZA i b aby mieć wartość redo(ZA,b)=||ZA-b||do

Jaka jest liczność najmniejszej ϵ -sieci przestrzeni metrycznej ([0,1]n×n,redo) ?

tzn. rozmiar najmniejszego podzbioru S.[0,1]n×n taki, że dla wszystkich ZA[0,1]n×n istnieje ZAS. taki, że redo(ZA,ZA)ϵ .

(Edycja: zapomniał wspomnieć, ale ja również zainteresowany „nie właściwego” ϵ -nets z S.R+n×n - to znaczy jeżeli elementy ϵ -net z pozycjami poza [0,1 ], to też jest interesujące.)

Interesują mnie zarówno górne, jak i dolne granice.

Zauważ, że techniki spararyzatora cięcia wymagają ϵ -net dla wyciętych metryk, ale dają coś silniejszego niż potrzebuję - dają ϵ -net, dla którego możesz efektywnie znaleźć punkt close do dowolnej macierzy, po prostu próbkując z tej macierzy. Można sobie wyobrazić, że istnieją znacznie mniejsze sieci dla których nie można po prostu próbkować, znaleźć punkt -close do dowolnej matrycy.ϵϵϵ

Początkowo zadałem to pytanie tutaj na matematycznym przepływie.

Aaron Roth
źródło
Ponieważ norma cięcia A jest większa lub równa wartości bezwzględnej każdego wpisu A, jasne jest, że ε-net musi mieć rozmiar co najmniej (1 / (2ε)) ^ (n ^ 2). Jaka górna granica wynika z techniki cięcia sparyfikatora? (To chyba głupie pytanie, ale nie znam tej techniki.)
Tsuyoshi Ito
Dla pewności zmieniłem pierwszą połowę poprzedniego komentarza w odpowiedź (i dodałem do niej górną granicę). Nadal interesuje mnie górna granica wynikająca z techniki cięcia sparyfikatora.
Tsuyoshi Ito,
Powyższa technika daje macierze z wpisami w zamiast w [ 0 , 1 ] . Zapomniałem wspomnieć o tym w poście, ale interesują mnie również tego rodzaju okładki ϵ . {0,m||ZA||1}[0,1]ϵ
Aaron Roth
Sieć którą otrzymujesz z wyciętej sparsifikacji, tak naprawdę nie leży w [ 0 , 1 ] n × n . Interpretuj macierz jako rozkład prawdopodobieństwa na krawędziach ukierunkowanego wykresu i próbkuj krawędzie m = ˜ O ( n / ϵ 2 ) z tego rozkładu. Obciąż każdą krawędź o | | A | | 1 / m . Za pomocą argumentów wymiaru VC (lub po prostu związku związanego z cięciami) maksymalny błąd addytywny dla dowolnego cięcia będzie wynosił O ( ϵ n 2 )ϵ[0,1]n×nm=O~(n/ϵ2))||ZA||1/mO(ϵn2)). Dlatego oznacza to, że zestaw (odpowiednio skorygowanych) wykresami krawędzie tworzą ε -Net, który nie jest trywialne dla ε > n 3 / 2 . n5/ϵ2)ϵϵ>n3)/2)
Aaron Roth

Odpowiedzi:

8

Oto łatwa ocena. Tutaj nazywamy zbiór SX ε -NET z przestrzeni metrycznej X , gdy dla każdego punktu xX , to istnieje punkt yS takie, że odległość między x i y jest co najwyżej ε . Jeśli chcesz ścisłej nierówności w definicji ε- net, możesz nieznacznie podnieść wartość ε .

Trzyma to || A || ≤ || A || Cn 2 || A || , gdzie || A || oznacza entrywise max-normę z n x n macierzy A .

Łatwo jest zbudować ε -net przestrzeni metrycznej ([0,1] N , d ) o rozmiarze ⌈1 / (2 ε ) ⌉ N i nietrudno wykazać, że ten rozmiar jest minimalny. (Aby pokazać minimalność, rozważ punkty ⌈1 / (2 ε ) ⌉ N, których współrzędne są wielokrotnościami 1 / ⌈1 / (2 ε ) −1⌉ i pokaż, że odległość między dowolnymi dwoma z tych punktów jest większa niż 2 ε .) Ustawiając N = n 2 i łącząc to z wyżej wspomnianym porównaniem normy cięcia i normy maksymalnej, minimalna liczność ε-net w odniesieniu do normy cięcia wynosi co najmniej ⌈1 / (2 ε ) ⌉ n 2, a co najwyżej ⌈ n 2 / (2 ε ) ⌉ n 2 .


Aktualizacja : Jeśli moje obliczenia są prawidłowe, można uzyskać lepszą dolną granicę Ω ( n / ε ) n 2 za pomocą argumentu głośności. Aby to zrobić, potrzebujemy górnej granicy objętości piłki ε w odniesieniu do normy cięcia.

Najpierw rozważymy „normę cięcia” pojedynczego wektora, która jest maksimum między sumą elementów dodatnich a negowaną sumą elementów ujemnych. Nietrudno wykazać, że objętość kulki ε in with n w odniesieniu do tej „normy cięcia” jest równa

εnja{1,,n}1|ja|!1(n-|ja|)!=εnr=0n(nr)1r!(n-r)!

=εnn!r=0n(nr)2)=εnn!(2)nn)=(2)n)!εn(n!)3).

Następnie, ponieważ norma cięcia macierzy n × n A jest większa lub równa normie cięcia każdego rzędu, objętość kuli ε w ℝ n × n jest co najwyżej n- tą potęgą objętości ε -ball in ℝ n . Dlatego rozmiar sieci ε wynoszącej [0,1] n × n musi wynosić co najmniej

(n!)3)n(2)n)!nεn2)=(Ω(nε))n2),

gdzie ostatnia równość jest nudnym obliczeniem, w którym używamy wzoru Stirlinga : ln n ! = n ln n - n + O (log n ).

Tsuyoshi Ito
źródło
W odpowiedzi na edycję (wersja 4) pytania dolna granica podana w tej odpowiedzi ma również zastosowanie do „niewłaściwych” sieci ε.
Tsuyoshi Ito,
Wygląda poprawnie, ładnie zrobione!
Hsien-Chih Chang 31 之
@ Hsien-Chih: Dzięki. Najbardziej podoba mi się zastosowanie współczynników dwumianowych do obliczania objętości kuli ε w ℝ ^ n.
Tsuyoshi Ito
Podejrzewam, że dolną granicę wielkości sieci (równoważnie górną granicę objętości) można poprawić. Zadałem powiązane pytanie dotyczące MathOverflow.
Tsuyoshi Ito