Najgorsza liczba pytań potrzebna do nauczenia się monotonicznego orzeczenia nad zestawem

15

Rozważmy skończoną posetę ponad elementów, a nieznany monotoniczny predykat nad (tj. Dla dowolnego , , jeśli i to ) . Mogę ocenić , podając jeden węzeł i sprawdzając, czy utrzymuje, czy nie. Moim celem jest określenie dokładnie zestawu węzłów tak, że P (x) utrzymuje, przy użyciu jak najmniejszej liczby ocen P(X,)nPXxyXP(x)xyP(y)PxXP(x)xXP(x)Pjak to możliwe. (Mogę wybrać moje zapytania w zależności od odpowiedzi na wszystkie poprzednie zapytania, nie muszę wcześniej planować wszystkich zapytań).

Strategia S over (X,) to funkcja, która mówi mi, jako funkcję zapytań, które uruchomiłem do tej pory i ich odpowiedzi, który węzeł zapytać i który zapewnia to w dowolnym predykacie P , postępując zgodnie ze strategią , Osiągnę stan, w którym znam wartość P we wszystkich węzłach. Bieg czasu r(S,P) z S na predykatu P jest liczbą zapytań muszą znać wartość P na wszystkich węzłach. Najgorszy czas działania S to wr(S)=maxPr(S,P) . Optymalna strategia S jest taka, że wr(S)=minSwr(S) .

Moje pytanie brzmi: jak podać dane wejściowe (X,) , jak mogę określić najgorszy czas działania optymalnych strategii?

[Oczywiste jest, że dla pustego zestawu potrzebnych będzie n zapytań (musimy zapytać o każdy pojedynczy węzeł) i że dla całkowitego zamówienia wokół log2n będą potrzebne zapytania (wyszukiwanie binarne w celu znalezienia granica). Bardziej ogólnym rezultatem jest następująca teoretyczna informacja dolna granica: liczba możliwych wyborów dla predykatu P jest liczbą NX antychain (X,) (ponieważ istnieje odwzorowanie jeden do jednego między predykatami monotonicznymi i antichains interpretowane jako maksymalne elementy P ), więc ponieważ każde zapytanie daje nam jeden bit informacji, potrzebujemy co najmniej log2NXzapytania, z uwzględnieniem dwóch poprzednich przypadków. Czy to jest ściśle związane, czy też są to pewne zestawy, których struktura jest taka, że ​​uczenie się może wymagać asymptotycznie więcej zapytań niż liczby antichains?]

a3nm
źródło
2
Czym różni się to od twojego poprzedniego pytania na ten temat? cstheory.stackexchange.com/questions/14772/…
Suresh Venkat
1
Zgadzam się, jest podobnie, ale interesują mnie tutaj ogólne zestawy, w tym zestawy o małej szerokości, które wcale nie wyglądają jak kompletna sieć. Poza tym nie dbam już o przyrostową złożoność ani nic podobnego, tylko o liczbę zapytań wymaganych w zależności od wyboru zestawu. W tym ustawieniu interpretacja funkcji boolowskiej nie ma zastosowania i wygląda na to, że odpowiedź zależy w jakiś sposób od „struktury” zestawu (być może, jak sugerowałem, liczby antichain). Mam nadzieję, że uzasadnia to osobne pytanie, proszę zamknąć, jeśli się myliłem.
a3nm
1
Do Twojej wiadomości w złożonej literaturze strategie, które zdefiniowałeś, są zwykle nazywane „drzewami decyzyjnymi” i mają standardowe pojęcie wysokości (miary, którą jesteś zainteresowany) i wielkości.
Joshua Grochow
Dzięki, Joshua! Jestem mniej więcej tego świadomy. Pomyślałem, że łatwiej jest używać słownictwa z teorii gier, ale tak, wiem, że strategię można postrzegać jako drzewo.
a3nm
1
(Nie ma problemu. Nawiasem mówiąc, nie tylko wskazałem, że można go postrzegać jako drzewo. Sposób, w jaki go opisałeś, jest rzeczywiście bardzo prosty i jasny, ale zapewniłem ci słowo kluczowe / termin sztuki, który możesz być w stanie wyszukać, oprócz terminu, który prawdopodobnie jest natychmiast znany wielu osobom, które często odwiedzają tę stronę. Pozdrawiam!)
Joshua Grochow

Odpowiedzi:

7

To nie jest pełna odpowiedź, ale jest zbyt długo, aby być komentarzem.

Myślę, że znalazłem przykład, dla którego związany nie jest ciasny.log2NX

Rozważ następujący zestaw. Podstawą jest , a jest mniejsze niż dla wszystkich . Pozostałe pary są nieporównywalne. (Schemat Hassego to cykl).a i b j i , j { 1 , 2 } 4X={a1,a2,b1,b2}aibji,j{1,2}4

Pozwól mi zidentyfikować właściwości monotoniczne ze zdenerwowaniem poety. Ten zestaw ma siedem ustawień: , , , , , , , a ten zestaw ma siedem antichains, ponieważ antichains są w korespondencji jeden-do-jednego z zaburzeniami. Więc dla tego zestawu.{ b 1 } { b 2 } { b 1 , b 2 } { a 1 , b 1 , b 2 } { a 2 , b 1 , b 2 } { a 1 , a 2 , b 1 , b 2 } log 2 N X= log 2 7 {b1}{b2}{b1,b2}{a1,b1,b2}{a2,b1,b2}{a1,a2,b1,b2}log2NX=log27=3

Teraz, argumentując przeciwnika, pokażę, że każda strategia wymaga co najmniej czterech zapytań (więc musi wysłać zapytanie do wszystkich elementów). Naprawmy dowolną strategię.

Jeśli strategia najpierw zapyta , wówczas przeciwnik odpowiada: „ się nie trzyma”. Pozostaje nam pięć możliwości: , , , , . Tak więc, aby ustalić, co się dzieje, potrzebujemy co najmniej więcej zapytań. W sumie potrzebujemy czterech zapytań. Ten sam argument ma zastosowanie, jeśli pierwsze zapytanie to . P ( a 1 ) { b 1 } { b 2 } { b 1 , b 2 } { a 2 , b 1 , b 2 } log 2 5 = 3 a 2a1P(a1){b1}{b2}{b1,b2}{a2,b1,b2}log25=3a2

Jeśli strategia najpierw , wówczas przeciwnik odpowiada „ trzyma”. Następnie mamy pięć możliwości: , , , , . Dlatego potrzebujemy co najmniej trzech dodatkowych zapytań, jak poprzednio. W sumie potrzebujemy czterech zapytań. Ten sam argument ma zastosowanie, gdy pierwsze zapytanie to .b1P(b1){b1}{b1,b2}{a1,b1,b2}{a2,b1,b2}{a1,a2,b1,b2}b2

Jeśli weźmiemy równoległych kopii tego zestawu, to ma on antichains, a zatem proponowane ograniczenie to . Ponieważ jednak każda kopia wymaga czterech zapytań, potrzebujemy co najmniej . Zapytań.k7klog27k=3k4k

Prawdopodobnie istnieje większy zestaw z większą przerwą. Ale ten argument może jedynie poprawić współczynnik.

W tym przypadku problemem jest sytuacja, w której żadne zapytanie nie dzieli równomiernie przestrzeni wyszukiwania. W takim przypadku przeciwnik może zmusić większą połowę do pozostania.

Yoshio Okamoto
źródło
1
Ach, ciekawe. Uogólniając przykład na , jasne jest, że jeśli odpowiedź brzmi: i to nie będziemy tego wiedzieć na pewno, dopóki wszystkie węzły nie zostaną odpytane. Istnieją jednak antichains ( niepustych podzbiorów , idem dla i pusty zbiór), więc granica nie jest ścisła przez czynnik z 2. Dzięki za ten przykład. Jednak tak naprawdę nie widzę, jak / jeśli różnica może być czymś więcej niż czynnikiem multiplikatywnym, lub czy można znaleźć nietrywialną górną granicę, nie mówiąc już o algorytmie dla dokładnej odpowiedzi. X={a1,...,an,b1,...,bn}i,¬P(ai)i,P(bi)2n2n+112n1aibi
a3nm
7

W swoim artykule Każdy zestaw ma element centralny , liniowy i Saksa (Twierdzenie 1), że liczba zapytań potrzebnych do rozwiązania idealnego problemu identyfikacji w zestawie wynosi co najwyżej , gdzie a oznacza liczbę idei . To, co nazywają „ideałem”, jest w rzeczywistości niższym zestawem i istnieje oczywista zależność jeden do jednego między predykatami monotonicznymi a niższym zestawem punktów, w których nie utrzymują, poza ich „problemem identyfikacyjnym” jest identyfikacja poprzez zapytanie węzły tak jak w moim ustawieniu, więc myślę, że zajmują się problemem, który mnie interesuje i żeXK0log2i(X)K0=1/(2log2(1+log25))i(X)Xi(X)=NX.

Tak więc, zgodnie z ich wynikiem, dolna granica teoretycznej informacji jest ścisła do względnie małej stałej multiplikatywnej. To w zasadzie rozwiązuje pytanie o liczbę wymaganych pytań, w funkcji i do stałej multiplikatywnej: jest to między a .NXlog2NXK0log2NX

Linial i Saks cytują osobistą komunikację Shearera, aby powiedzieć, że istnieją znane zamówienia, dla których możemy udowodnić dolną granicę dla niektórych która jest tylko nieco mniejsza niż (jest to w duchu odpowiedzi Yoshio Okamoto, kto: wypróbowałem to podejście dla mniejszej wartości ).K1log2NXK1K0K1

To nie w pełni odpowiada na moje pytanie dotyczące obliczenia liczby pytań wymaganych od , jednak ponieważ obliczenie z jest zakończone # P , mam wrażenie, że nie ma nadziei. (Komentarze na ten temat są mile widziane.) Mimo to ten wynik Linial i Saksa jest pouczający.XNXX

a3nm
źródło
5

Dla logicznej n-kostki (lub, równoważnie, dla zestawu wszystkich podzbiorów zestawu n-elementów), odpowiedź brzmi: podane przez twierdzenia Korobkowa i Jaśla (odpowiednio z 1963 i 1966 r.). Twierdzenie Hansela [1] stwierdza, że ​​nieznanej monotonicznej funkcji boolowskiej (tj. Nieznanego predykatu monotonicznego na tym zestawie) można się nauczyć za pomocą algorytmu deterministycznego co najwyżej zapytań (czyli w najgorszym przypadku zadaje pytania ). Algorytm ten odpowiada dolnej granicy twierdzenia Korobkowa [2], które mówi, że({0,1}n,)(2S,)ϕ(n)=(nn/2)+(nn/2+1)ϕ(n)ϕ(n)1zapytania nie wystarczą. (Tak więc algorytm Hansela jest optymalny w najgorszym przypadku.) Algorytm w obu instrukcjach jest rozumiany jako deterministyczne drzewo decyzyjne.

Logarytm liczby antichains w jest asymptotycznie równy , więc istnieje różnica współczynnika między a optymalną wydajnością algorytmu dla tego zestawu.({0,1}n,)(nn/2)2n/πn/2logNXϕ(n)2(nn/2)

Niestety nie udało mi się znaleźć w Internecie dobrego traktowania algorytmu Jaśla w języku angielskim. Opiera się na lemacie, który dzieli n-kostkę na łańcuchy o specjalnych właściwościach. Niektóre opisy można znaleźć w [3]. Jeśli chodzi o dolną granicę, nie znam żadnego odniesienia do opisu w języku angielskim.ϕ(n)

Ponieważ jestem zaznajomiony z tymi wynikami, mogę zamieścić opis na arXiv, jeśli leczenie w pracy Kovalerchuka nie jest wystarczające.

Jeśli się nie mylę, podjęto próby uogólnienia podejścia Jaśla, przynajmniej do posetu , gdzie to łańcuch , chociaż nie mogę od razu podać żadnego odniesienia. W przypadku boolowskim ludzie badali także pojęcia złożoności inne niż najgorsze w przypadku tego problemu.(Ekn,)(Ek,)0<1<<k1

[1] G. Hansel, Sur le nombre des fonctions booléennes monotones de n zmiennych. CR Acad. Sci. Paris, 262 (20), 1088-1090 (1966)

[2] VK Korobkov. Szacowanie liczby funkcji monotonicznych algebry logiki i złożoności algorytmu do znajdowania zbioru rezolwentów dla dowolnej funkcji monotonicznej algebry logiki. Radziecka matematyka. Doklady 4, 753-756 (1963) (tłumaczenie z rosyjskiego)

[3] B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. Interaktywne uczenie monotonicznych funkcji boolowskich. Information Sciences 94 (1), 87-118 (1996) ( link )

dd1
źródło
Wielkie dzięki za tę szczegółową odpowiedź! Dla logicznego cube, patrz < cstheory.stackexchange.com/q/14772 >. Potrafię czytać po francusku, ale nie mogłem znaleźć artykułu Hansela (powinien być dostępny na Gallica, ale wydaje się, że ten problem nie istnieje). Odpowiednie informacje znalazłem w Sokołowie, NA (1982), „O optymalnej ocenie monotonicznych funkcji logicznych”, ZSRR Comput Math Math Phys, tom 22, nr 2, 207-220 (istnieje tłumaczenie na angielski). Interesują mnie uogólnienia na inne DAG, jeśli możesz znaleźć referencje. Nie wahaj się odpowiedzieć e-mailem (a3nm AT a3nm DOT net), jeśli limit długości stanowi problem. Dzięki jeszcze raz! n
a3nm
Zapraszamy! Niestety nie wiem, jak ograniczyć czas działania algorytmu pod względem wielkości wyjściowej. Przykładowo dowód Korobkowa na dolną granicę nie daje odpowiedzi na to pytanie. Wydaje mi się jednak, że może istnieć odniesienie, które jest nieco istotne. Postaram się znaleźć trochę czasu w weekend i szukać również uogólnień. Jednocześnie nie jestem pewien, czy warto napisać zamknięty angielski opis przypadku Boolean (te dwa twierdzenia) ...
dd1
@ a3nm może przypadek DAG nie był rozważany w literaturze? czy może być trudniejsze niż boolean n-cube zamówiony przez włączenie?
vzn
@vzn Wydaje mi się, że przynajmniej niektóre pytania tutaj są otwarte. Nawet w przypadku łańcucha nie jest od razu jasne, jak uogólnić algorytm Jasela.
dd1
@ a3nm wszystko wydaje się podobne do znajdowania dolnych granic / minimalnych obwodów monotonicznych (rozmiarów), ale do tej pory nie widziałem, żeby było to wyraźnie powiązane ...
dniu
0

[ UWAGA: Poniższy argument nie działa, ale zostawiam go tutaj, aby inni nie popełnili tego samego błędu / na wypadek, gdyby ktoś mógł go naprawić. Problem polega na tym, że wykładnicza dolna granica uczenia się / identyfikowania funkcji monotonicznej, jak poniżej, niekoniecznie jest sprzeczna z algorytmem przyrostowo wielomianowym dla problemu. I ta ostatnia jest równoważna sprawdzeniu wzajemności dualności dwóch funkcji monotonicznych w czasie wieloczłonowym.]

Uważam, że twoje przypuszczenie dotyczące jest ogólnie fałszywe. Jeśli rzeczywiście jest tak , że potrzebne są zapytania log N X , oznacza to dość silną dolną granicę uczenia się funkcji monotonicznych przy użyciu zapytań członkowskich . W szczególności, niech poset X jest logiczna modułu ze zwykłymi kolejności (jeśli chce, X jest PowerSet z { 1 , . . . , N } z jako częściowe kolejności). Liczba M maksymalnych antichains w X spełnia log M =logNXlogNXXX{1,...,n}MX [1]. Jeśli twój pomysł nalogNXjest poprawny, to istnieje predykat monotoniczny naX,który wymaga zasadniczo ( n-1logM=(1+o(1))(n1n/2)logNXXzapytań. W szczególności implikuje to dolną granicę zasadniczo2ndla złożoności dowolnego algorytmu rozwiązującego ten problem.(n1n/2)2n2n

Jednak, jeśli dobrze zrozumiałem [ czego teraz nie wiem ], twój problem jest równoznaczny ze sprawdzeniem wzajemności dualności dwóch funkcji monotonicznych, co można zrobić w quasi-wielomianowym czasie (patrz wprowadzenie do tego artykułu przez Bioch i Ibaraki , które cytują Fredmana i Khachiyana), co jest sprzeczne z czymkolwiek zbliżonym do dolnej granicy .2n

[1] Liviu Ilinca i Jeff Kahn. Liczenie maksymalnych antichains i niezależnych zestawów . arXiv: 1202,4427

Joshua Grochow
źródło
Josh, nie widzę problemu z argumentem mój zrozumienia jest to, że jest otwarty, czy funkcja monotoniczna można się nauczyć w czasie wielomianowym w n i liczby minimalnych elementów. praca Bioch-Ibaraki dotyczy algorytmu przyrostowego wielomianulogNXn
Sasho Nikolov
Ah, dobrze. Nie byłam tego świadoma. (Tak jak powiedziałem, nie jestem ekspertem w tej dziedzinie - moja odpowiedź polegała tylko na sprawdzeniu kilku rzeczy i zebraniu ich razem). Zostawię to tutaj, aby inni mogli to zobaczyć i przynajmniej nie zrobić ten sam błąd / w najlepszym razie zamień go w coś użytecznego.
Joshua Grochow