Izometryczne osadzanie L2 w L1

27

Wiadomo, że biorąc pod uwagę podzbiór (to znaczy, biorąc pod uwagę punktów w z odległością euklidesową), możliwe jest osadzenie ich izometrycznie w \ ell ^ {n \ wybierz 2 } _1 .n2dnRd1(n2)

Czy izometria jest obliczalna w (ewentualnie losowym) czasie wielomianowym?

Ponieważ istnieją problemy z precyzją skończoną, dokładne pytanie brzmi:

Biorąc pod uwagę zespół X z n punktów Rd i ϵ>0 , istnieje odwzorowanie f:XR(n2) obliczeniowy (prawdopodobnie, używając przypadkowości), w wielomian czas n oraz logarytmicznych w 1/ϵ , że dla każdego x,yX mamy

||f(x)f(y)||1||xy||2(1+ϵ)||f(x)f(y)||1

(Uwaga: sobie sprawę, że odwzorowanie ze zniekształceniem (1+ϵ) może być z dużym prawdopodobieństwem w czasie wielomian znaleziono n a 1/ϵ przez wystające w O(ϵ2logn) losowe linie, ale nie jestem pewien, czy liczbę wymiarów można konstruktywnie zmniejszyć do (n2) lub nawet O(n2) gdy 1/ϵ jest znacznie większy niż n , i nie wiem, czy tam jest jest wielomianem sposób czas obsługi przypadku, w którym 1/ϵ wykładniczo w n ).

Luca Trevisan
źródło
1
to bardzo miłe pytanie. @Luca, czy podejrzewasz, że może to być trudne? (oczywiście moją pierwszą myślą było przejrzenie „Hamminga spotyka Euclida”, a potem zobaczyłem tożsamość pytającego :)
Suresh Venkat
1
Odniesienie to wydaje się być powiązane: Pjotr ​​Indyk, „Zasady niepewności, ekstraktory i jawne osadzanie l2 w l1”, Proc. STOC'07.
Martin Schwarz,
2
@David: to liczba punktów, poprawiłem miejsce, w którym użyłem dla wymiaru. że punktów w przestrzeni euklidesowej (dowolnego wymiaru) można izometrycznie osadzić w : www-math.mit.edu/~goemans/18409-2006/lec1.pdf, ale raczej nie -konstruktywnie. (Twierdzenie Carathéodory'ego, aby przejść ze skończonego, ale dużego wymiaru do wymiaru z arbitralnie małym błędem, i argumentem zwartości, aby przejść od arbitralnie małego błędu do błędu zerowego.)nnn1(n2)(n2)
Luca Trevisan
1
@Martin: dzięki za odniesienie. Artykuł Piotra dotyczy trudniejszego problemu mapowania wszystkich (nie tylko ustalonego zestawu punktów) na . W przypadku tego problemu uważam, że problemem otwartym jest nawet osiągnięcie konstruktywnie i zniekształceń . (Piotr dostaje i .)2dn1mm=poly(d,1/ϵ)(1+ϵ)m=dO(logd)ϵ=1/d
Luca Trevisan
1
@LucaTrevisan: re: trudność osadzenia w l1, to prawda (wspomniano w rozdziale 1 lub 2 książki Deza i Laurent - myślę, że za pośrednictwem MAX CUT)
Suresh Venkat

Odpowiedzi:

7

Suresh poprosił mnie o połączenie powyższych komentarzy w odpowiedź, więc oto jest. Nie jestem jednak do końca pewien, czy jest to odpowiedź na pierwotne pytanie, ponieważ nie jest oczywiste, jak uczynić go wielomianowym czasem, gdy wymiar wejściowej przestrzeni euklidesowej nie jest stały. Ma przynajmniej tę zaletę, że pozwala uniknąć jakiegokolwiek problemu z dużym jak zadaje oryginalne pytanie, ponieważ nie wymaga żadnego przybliżenia i wygląda na wielomian dla stałej .1/ϵd

Tak czy inaczej: z integralnym geometrii, nie jest standardowym środkiem w zestawach hiperplaszczyzn w -wymiarowej przestrzeni euklidesowej, która jest niezmienna pod euklidesowych kongruencji. Ma właściwość polegającą na tym, że długość dowolnej krzywej ograniczonej długości jest proporcjonalna do miary hiperpłaszczyzn przecinających (z wielokrotnością, co oznacza, że ​​jeśli hiperpłaszczyzna przecina dwa razy, to przyczynia się dwukrotnie do całkowitej miary hiperpłaszczyzn przecinających ). W szczególności, jeśli jest segmentem linii, komplikacja wielokrotności nie powstaje i możemy znormalizować miarę na hiperpłaszczyznach przecinających aby była dokładnie długościądCCCCCCC. (Hiperplany zawierające mają miarę zero, więc nie martw się o nieskończoną wielokrotność.)C

Teraz, mając zestaw n punktów w przestrzeni d-wymiarowej, współrzędną dla każdej z części punktów w dwa podzbiory indukowane przez hiperpłaszczyznę, która nie przechodzi przez żaden z punktów. Podaj punkty po jednej stronie wartości współrzędnej podziału zero, a punkty po drugiej stronie wartości współrzędnej podziału równe miary zbioru hiperpłaszczyzn indukujących ten podział.1

Jeśli i są dowolnymi dwoma z punktów, niech będzie zbiorem hiperpłaszczyzn przecinających odcinek linii , i niech będzie podzbiorami utworzonymi przez każdą możliwą partycję hiperpłaszczyzny, która ma po jednej stronie i po drugiej. Zatem jest rozłącznym związkiem , a różnice współrzędnych między i są tylko miarami podzbiorów . Dlatego odległość między koordynacjami ipqnKpqKiKpqKKipqKi1pq (suma miar ) jest miarą , która jest tylko oryginalną odległością między i .KiK2pq

W przypadku geometrii obliczeniowej pomocny może być alternatywny opis tej samej konstrukcji: użyj dualności rzutowej, aby przekształcić punktów wejściowych w hiperpłaszczyzn i rozdzielić hiperpłaszczyzny na punkty. Całkowa miara geometrii na zestawach hiperpłaszczyzn jest następnie przekształcana w bardziej standardową miarę na zestawach punktów, odległość między i ulega dualizacji do miary podwójnego klina między dwoma hiperpłaszczyznami, a układ hiperpłaszczyzny dzieli ten podwójny klin na mniejsze komórki . Wartość współrzędnych dla punktu jest albo miarą jednej z komórek w układzie (jeśli podwójna hiperpłaszczyzna znajduje się poniżej komórki tej współrzędnej), albo zero (jeśli podwójna hiperpłaszczyzna znajduje się powyżej komórki). Dlatego teżnnpq1 odległość między i jest po prostu sumą miar komórek w podwójnym klinie, która jest taka sama jak miara całego podwójnego klina. Ten podwójny punkt widzenia ułatwia również obliczenie znalezionego w ten sposób wymiaru osadzania: jest to tylko liczba komórek w układzie hiperpłaszczyzny, która wynosi , a dokładniej co najwyżej .pqO(nd)i=0d(ni)

Jak dotąd daje to całkowicie deterministyczne i dokładne osadzenie w . Ale chcieliśmy mniejszego wymiaru, . Tutaj pojawia się komentarz Lucy na temat twierdzenia Carathéodory'ego . Zestaw metryk reprezentowanych przez tworzy stożek wielościenny w przestrzeni wymiarowej wszystkich funkcji od nieuporządkowanych par punktów do liczb rzeczywistych, a powyższy argument geometryczny mówi, że metryka euklidesowa należy do tego stożka. Punkty skrajnych promieni stożka są jednowymiarowe1O(nd)1(n2)1(n2)1pseudometria (w której punkty są podzielone na dwa zestawy, wszystkie odległości w jednym zestawie są zerowe, a wszystkie odległości w poprzek podziału są równe), a Carathéodory mówi, że dowolny punkt w stożku (w tym ten, na którym nam zależy) może być reprezentowane jako wypukła kombinacja punktów na ekstremalnych promieniach, których liczba jest co najwyżej wymiarem otaczającej przestrzeni, . Ale wypukła kombinacja co najwyżej jednowymiarowe metryki to metryka .(n2)(n2)11(n2)

Wreszcie, w jaki sposób możemy faktycznie obliczyć osadzanie wymiarowe? W tym momencie nie mamy tylko punktu w wymiarowy wypukły stożek metryki (metryka odległości, od której zaczęliśmy), ale mamy również zestaw skrajnych punktów (odpowiadające podziałom wejścia na dwa podzbiory indukowane przez hiperpłaszczyzny) tak, że nasza metryka jest wypukłą kombinacją tych skrajnych punktów - dla małego jest to duża poprawa w stosunku do ekstremalnych promieni które stożek ma ogólny. Teraz wszystko, co musimy zrobić, to zastosować chciwy algorytm, który pozbywa się ekstremalnych punktów z naszego zestawu, jeden po drugim, aż tylko(n2)(n2)1O(nd)d2n2(n2)z nich zostało. Na każdym kroku musimy zachować jako niezmienność to, że nasza metryka nadal znajduje się w wypukłym kadłubie pozostałych skrajnych punktów, co jest tylko liniowym problemem wykonalności programowania, a jeśli to zrobimy, Carathéodory zapewni, że zawsze pozostanie zestaw skrajne punkty, których wypukły kadłub zawiera dane wejściowe.(n2)

David Eppstein
źródło