Wymiar VC wielomianów nad tropikalnymi półksiężycami?

14

BPPPpoly (max,+)(max,+)(min,+)(min,+)

Niech będzie na pół wieku. Zerowej wzorzec sekwencji z wielomianów jest podzbiorem , dla których istnieją , a taki sposób, aby dla wszystkich , f i ( x ) = Y IFF ı S . Oznacza to, że wykresy dokładnie tych wielomianów f i z i S muszą trafić w punkt ( x ,RR(f1,,fm)(f1,,fm)mmR[x1,,xn]R[x1,,xn]S{1,,m}S{1,,m}xRnxRnyRyRi=1,,mi=1,,mfi(x)=yiSfiiSy ) R n + 1(x,y)Rn+1 . („Wzór zerowy”, ponieważ warunek f i ( x ) = yfi(x)=y można zastąpić f i ( x ) - y = 0fi(x)y=0 ). Niech Z ( m )Z(m) = maksymalna możliwa liczba wzorów zerowych sekwencji mm wielomiany stopnia co najwyżej dd . Stąd 0 Z ( m ) 2 m0Z(m)2m . Wymiar Vapnik-Chervonenkiswielomianów stopnia dd wynosi V C ( n , d ) : = max { m : Z ( m ) = 2 m }VC(n,d):=max{m:Z(m)=2m} .

Uwaga: Zazwyczaj wymiar VC jest definiowany dla rodziny FF zestawów jako największa liczność | S | |S|z szeregu SS w taki sposób, { F S : C F } = 2 S{FS:FF}=2S . Aby dopasować się do tej ramki, możemy skojarzyć z każdą parą ( x , y ) R n + 1(x,y)Rn+1 zbiór F x , yFx,y wszystkich wielomianów stopnia f d, dla których f (fdx ) = yf(x)=y trzyma. Zatem wymiar VC rodziny FF wszystkich takich zbiorów F x , yFx,y jest dokładnie V C ( n , d )VC(n,d) .

Trywialna górna granica na m = V C ( n , d ) wynosi m n log | R | (potrzebujemy co najmniej 2 m różnych wektorów x R n, aby mieć wszystkie 2 m możliwych wzorów), ale jest to bezużyteczne w nieskończonych półporównaniach. Aby mieć dobre górne granice wymiaru VC, potrzebujemy dobrych górnych granic na Z ( m ) . Ponad polami takie granice są znane.m=VC(n,d)mnlog|R|2mxRn2mZ(m)

Twierdzenie 1: Na dowolnym polu R mamy Z ( m ) ( m d + nRn ) . Z(m)(md+nn)
Podobne górne granice wcześniej udowodnili Milnor , Heintz i Warren ; ich dowody wykorzystują ciężkie techniki z prawdziwej geometrii algebraicznej. Natomiast półstronicowy dowód twierdzenia 1 Ronyai, Babai i Ganapathy (który podajemy poniżej) jest prostym zastosowaniem algebry liniowej.

Szukając małych m spełniających ( m d + nmn ) <2m, otrzymujemy, że VC(n,d)=O(nlogd)utrzymuje się na dowolnympolu. Biorąc pod uwagęBPPvs.P/poly, ważne jest tutaj, że wymiar jestlogarytmicznytylkow stopniud. Jest to ważne, ponieważ obwody wielomianowe mogą obliczać wielomiany o wykładniczym stopniu oraz ponieważ wynik Hausslera w uczeniu się PAC (wniosek 2 na stronie 114(md+nn)<2mVC(n,d)=O(nlogd)BPPPpolydten artykuł ) daje następujące wyniki (przy założeniu, że obwody deterministyczne mogą wykorzystywać większość głosów do wyprowadzania swoich wartości).

Twierdzenie 2: B P PP / p o l y dotyczy obwodów w dowolnym półprzewodniku R , gdzie V C ( n , d ) jest tylko wielomianem w n i log d . BPPP/polyRVC(n,d)nlogd
Zobacz tutaj, jak wynik Hausslera implikuje Twierdzenie 2.

W szczególności, zgodnie z twierdzeniem 1 B P PP / P O l Y posiada na dowolną dziedzinie. (Interesujące jest tutaj tylko pole nieskończone : w przypadku skończonych działają znacznie prostsze argumenty: Chernoff związany jest wtedy.) Ale co z (nieskończonymi) półpierścieniami, które nie są polami, a nawet nie dzwonią? Zmotywowani programowaniem dynamicznym, interesują mnie głównie tropikalne ( maksimum , + ) i ( min , + ) semirings, ale interesujące są również inne semirings „non-field” (nieskończone). Pamiętaj, że ponad ( maksBPPP/poly(max,+)(min,+), + ) semiring, wielomian f ( x ) = a A c a n i = 1 x a i i z A N i c aR , zamienia się w problem maksymalizacji f ( x ) = max a A { c a + a 1 x 1 + a 2 x 2(max,+)f(x)=aAcani=1xaiiANcaR + + a n x n } ; stopień F jest (jak zwykle) maksimum o 1 + + z n na całej w A .f(x)=maxaA {ca+a1x1+a2x2++anxn}fa1++anaA

Pytanie: Czy wymiar VC stopnia wielomianów stopnia d względem wielomianów tropikalnych półwymiarów w n log d ? dnlogd

Przyznaję, że odpowiedź na szybką odpowiedź może być trudna: algebra tropikalna jest raczej „szalona”. Ale może ktoś ma jakieś pomysły, dlaczego (jeśli w ogóle) tropikalne wielomiany mogą wytwarzać więcej zerowych wzorów niż prawdziwe wielomiany? Lub dlaczego „nie powinni”? Lub niektóre powiązane odniesienia.

A może dowód na to, że Babai, Ronyai i Ganapathy (poniżej) można w jakiś sposób „przekręcić” do pracy nad tropikalnymi półksiężycami? Lub nad jakimkolwiek innym nieskończonym półkolem (które nie są polami)?

Dowód twierdzenia 1: Załóżmy, że sekwencja ( f 1 , , f m ) ma p różnych wzorów zerowych i niech v 1 , , v pR n będą świadkami tych wzorów zerowych. Niech S i = { k : f k ( v i ) 0 } będzie wzorem zerowym obserwowanym przez i -ty wektor v i , i rozważmy wielomiany g(f1,,fm)pv1,,vpRnSi={k:fk(vi)0}ivii : = k S i f k . Twierdzimy, że te wielomiany są liniowo niezależne od naszego pola. Twierdzenie to uzupełnia dowód twierdzenia, ponieważ każdy g i ma stopień co najwyżej D : = m d , a wymiar przestrzeni wielomianów stopnia co najwyżej D wynosi ( n + Dgi:=kSifkgiD:=mdDD ) . Aby udowodnić twierdzenie, wystarczy zauważyć, żegi(vj)0wtedy i tylko wtedy, gdySiSj. Załóżmy, że przeciwnie, istnieje nietrywialna zależność liniowa λ1gi(x)++λpgp(x)=0. Niechjbędzie indeksem takim, że| Sj| minimalna wśródSIz(n+DD)gi(vj)0SiSjλ1gi(x)++λpgp(x)=0j|Sj|Siλi0λi0. Substitute vjvj in the relation. While λjgj(vj)0λjgj(vj)0, we have λigi(vj)=0λigi(vj)=0 for all ijij, a contradiction.

Stasys
źródło

Odpowiedzi:

9

I've realized that the answer to my question is - yes: the VC dimension of degree d polynomials on n variables over any tropical semiring is at most a constant times n2log(n+d). This can be shown using Theorem 1 above. See here for details. So, BPP P/poly holds also for tropical circuits and, hence, also for "pure" dynamic programming algorithms.


N.B. (added 25.06.2019) In the mean time, I've resolved the problem completely in this paper. In such a generality, which I haven't even dreamed at the beginning. Tropical case is here just a very, very special case. And even more curiously: by just an appropriate combination of already know (deep in any respect) results of other authors.

What remains else to do in this (BPP vs. P/poly) direction? Besides the decrease of the size of resulting deterministic circuits (an interesting question in itself).

Stasys
źródło