Rozważmy skończoną posetę ponad elementów, a nieznany monotoniczny predykat nad (tj. Dla dowolnego , , jeśli i to ) . Mogę ocenić , podając jeden węzeł i sprawdzając, czy utrzymuje, czy nie. Moim celem jest określenie dokładnie zestawu węzłów tak, że P (x) utrzymuje, przy użyciu jak najmniejszej liczby ocen Pjak to możliwe. (Mogę wybrać moje zapytania w zależności od odpowiedzi na wszystkie poprzednie zapytania, nie muszę wcześniej planować wszystkich zapytań).
Strategia over to funkcja, która mówi mi, jako funkcję zapytań, które uruchomiłem do tej pory i ich odpowiedzi, który węzeł zapytać i który zapewnia to w dowolnym predykacie , postępując zgodnie ze strategią , Osiągnę stan, w którym znam wartość we wszystkich węzłach. Bieg czasu z na predykatu jest liczbą zapytań muszą znać wartość na wszystkich węzłach. Najgorszy czas działania to . Optymalna strategia jest taka, że .
Moje pytanie brzmi: jak podać dane wejściowe , jak mogę określić najgorszy czas działania optymalnych strategii?
[Oczywiste jest, że dla pustego zestawu potrzebnych będzie zapytań (musimy zapytać o każdy pojedynczy węzeł) i że dla całkowitego zamówienia wokół będą potrzebne zapytania (wyszukiwanie binarne w celu znalezienia granica). Bardziej ogólnym rezultatem jest następująca teoretyczna informacja dolna granica: liczba możliwych wyborów dla predykatu jest liczbą antychain (ponieważ istnieje odwzorowanie jeden do jednego między predykatami monotonicznymi i antichains interpretowane jako maksymalne elementy ), więc ponieważ każde zapytanie daje nam jeden bit informacji, potrzebujemy co najmniej zapytania, z uwzględnieniem dwóch poprzednich przypadków. Czy to jest ściśle związane, czy też są to pewne zestawy, których struktura jest taka, że uczenie się może wymagać asymptotycznie więcej zapytań niż liczby antichains?]
Odpowiedzi:
To nie jest pełna odpowiedź, ale jest zbyt długo, aby być komentarzem.
Myślę, że znalazłem przykład, dla którego związany nie jest ciasny.⌈ log2)N.X⌉
Rozważ następujący zestaw. Podstawą jest , a jest mniejsze niż dla wszystkich . Pozostałe pary są nieporównywalne. (Schemat Hassego to cykl).a i b j i , j ∈ { 1 , 2 } 4X= { a1, a2), b1, b2)} zaja bjot i , j ∈ { 1 , 2 } 4
Pozwól mi zidentyfikować właściwości monotoniczne ze zdenerwowaniem poety. Ten zestaw ma siedem ustawień: , , , , , , , a ten zestaw ma siedem antichains, ponieważ antichains są w korespondencji jeden-do-jednego z zaburzeniami. Więc dla tego zestawu.{ b 1 } { b 2 } { b 1 , b 2 } { a 1 , b 1 , b 2 } { a 2 , b 1 , b 2 } { a 1 , a 2 , b 1 , b 2 } ⌈ log 2 N X ⌉ = ⌈ log 2 7 ⌉∅ { b1} { b2)} { b1, b2)} { a1, b1, b2)} { a2), b1, b2)} { a1, a2), b1, b2)} ⌈log2NX⌉=⌈log27⌉=3
Teraz, argumentując przeciwnika, pokażę, że każda strategia wymaga co najmniej czterech zapytań (więc musi wysłać zapytanie do wszystkich elementów). Naprawmy dowolną strategię.
Jeśli strategia najpierw zapyta , wówczas przeciwnik odpowiada: „ się nie trzyma”. Pozostaje nam pięć możliwości: , , , , . Tak więc, aby ustalić, co się dzieje, potrzebujemy co najmniej więcej zapytań. W sumie potrzebujemy czterech zapytań. Ten sam argument ma zastosowanie, jeśli pierwsze zapytanie to . P ( a 1 ) ∅ { b 1 } { b 2 } { b 1 , b 2 } { a 2 , b 1 , b 2 } ⌈ log 2 5 ⌉ = 3 a 2a1 P(a1) ∅ {b1} {b2} {b1,b2} {a2,b1,b2} ⌈log25⌉=3 a2
Jeśli strategia najpierw , wówczas przeciwnik odpowiada „ trzyma”. Następnie mamy pięć możliwości: , , , , . Dlatego potrzebujemy co najmniej trzech dodatkowych zapytań, jak poprzednio. W sumie potrzebujemy czterech zapytań. Ten sam argument ma zastosowanie, gdy pierwsze zapytanie to .b1 P(b1) {b1} {b1,b2} {a1,b1,b2} {a2,b1,b2} {a1,a2,b1,b2} b2
Jeśli weźmiemy równoległych kopii tego zestawu, to ma on antichains, a zatem proponowane ograniczenie to . Ponieważ jednak każda kopia wymaga czterech zapytań, potrzebujemy co najmniej . Zapytań.k 7k ⌈log27k⌉=3k 4k
Prawdopodobnie istnieje większy zestaw z większą przerwą. Ale ten argument może jedynie poprawić współczynnik.
W tym przypadku problemem jest sytuacja, w której żadne zapytanie nie dzieli równomiernie przestrzeni wyszukiwania. W takim przypadku przeciwnik może zmusić większą połowę do pozostania.
źródło
W swoim artykule Każdy zestaw ma element centralny , liniowy i Saksa (Twierdzenie 1), że liczba zapytań potrzebnych do rozwiązania idealnego problemu identyfikacji w zestawie wynosi co najwyżej , gdzie a oznacza liczbę idei . To, co nazywają „ideałem”, jest w rzeczywistości niższym zestawem i istnieje oczywista zależność jeden do jednego między predykatami monotonicznymi a niższym zestawem punktów, w których nie utrzymują, poza ich „problemem identyfikacyjnym” jest identyfikacja poprzez zapytanie węzły tak jak w moim ustawieniu, więc myślę, że zajmują się problemem, który mnie interesuje i żeX K0log2i(X) K0=1/(2−log2(1+log25)) i(X) X i(X)=NX .
Tak więc, zgodnie z ich wynikiem, dolna granica teoretycznej informacji jest ścisła do względnie małej stałej multiplikatywnej. To w zasadzie rozwiązuje pytanie o liczbę wymaganych pytań, w funkcji i do stałej multiplikatywnej: jest to między a .NX log2NX K0log2NX
Linial i Saks cytują osobistą komunikację Shearera, aby powiedzieć, że istnieją znane zamówienia, dla których możemy udowodnić dolną granicę dla niektórych która jest tylko nieco mniejsza niż (jest to w duchu odpowiedzi Yoshio Okamoto, kto: wypróbowałem to podejście dla mniejszej wartości ).K1log2NX K1 K0 K1
To nie w pełni odpowiada na moje pytanie dotyczące obliczenia liczby pytań wymaganych od , jednak ponieważ obliczenie z jest zakończone # P , mam wrażenie, że nie ma nadziei. (Komentarze na ten temat są mile widziane.) Mimo to ten wynik Linial i Saksa jest pouczający.X NX X
źródło
Dla logicznej n-kostki (lub, równoważnie, dla zestawu wszystkich podzbiorów zestawu n-elementów), odpowiedź brzmi: podane przez twierdzenia Korobkowa i Jaśla (odpowiednio z 1963 i 1966 r.). Twierdzenie Hansela [1] stwierdza, że nieznanej monotonicznej funkcji boolowskiej (tj. Nieznanego predykatu monotonicznego na tym zestawie) można się nauczyć za pomocą algorytmu deterministycznego co najwyżej zapytań (czyli w najgorszym przypadku zadaje pytania ). Algorytm ten odpowiada dolnej granicy twierdzenia Korobkowa [2], które mówi, że({0,1}n,≤) (2S,⊆) ϕ(n)=(n⌊n/2⌋)+(n⌊n/2⌋+1) ϕ(n) ϕ(n)−1 zapytania nie wystarczą. (Tak więc algorytm Hansela jest optymalny w najgorszym przypadku.) Algorytm w obu instrukcjach jest rozumiany jako deterministyczne drzewo decyzyjne.
Logarytm liczby antichains w jest asymptotycznie równy , więc istnieje różnica współczynnika między a optymalną wydajnością algorytmu dla tego zestawu.({0,1}n,≤) (n⌊n/2⌋)∼2n/πn/2−−−−√ logNX ϕ(n)∼2(n⌊n/2⌋)
Niestety nie udało mi się znaleźć w Internecie dobrego traktowania algorytmu Jaśla w języku angielskim. Opiera się na lemacie, który dzieli n-kostkę na łańcuchy o specjalnych właściwościach. Niektóre opisy można znaleźć w [3]. Jeśli chodzi o dolną granicę, nie znam żadnego odniesienia do opisu w języku angielskim.ϕ(n)
Ponieważ jestem zaznajomiony z tymi wynikami, mogę zamieścić opis na arXiv, jeśli leczenie w pracy Kovalerchuka nie jest wystarczające.
Jeśli się nie mylę, podjęto próby uogólnienia podejścia Jaśla, przynajmniej do posetu , gdzie to łańcuch , chociaż nie mogę od razu podać żadnego odniesienia. W przypadku boolowskim ludzie badali także pojęcia złożoności inne niż najgorsze w przypadku tego problemu.(Enk,≤) (Ek,≤) 0<1<…<k−1
[1] G. Hansel, Sur le nombre des fonctions booléennes monotones de n zmiennych. CR Acad. Sci. Paris, 262 (20), 1088-1090 (1966)
[2] VK Korobkov. Szacowanie liczby funkcji monotonicznych algebry logiki i złożoności algorytmu do znajdowania zbioru rezolwentów dla dowolnej funkcji monotonicznej algebry logiki. Radziecka matematyka. Doklady 4, 753-756 (1963) (tłumaczenie z rosyjskiego)
[3] B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. Interaktywne uczenie monotonicznych funkcji boolowskich. Information Sciences 94 (1), 87-118 (1996) ( link )
źródło
[ UWAGA: Poniższy argument nie działa, ale zostawiam go tutaj, aby inni nie popełnili tego samego błędu / na wypadek, gdyby ktoś mógł go naprawić. Problem polega na tym, że wykładnicza dolna granica uczenia się / identyfikowania funkcji monotonicznej, jak poniżej, niekoniecznie jest sprzeczna z algorytmem przyrostowo wielomianowym dla problemu. I ta ostatnia jest równoważna sprawdzeniu wzajemności dualności dwóch funkcji monotonicznych w czasie wieloczłonowym.]
Uważam, że twoje przypuszczenie dotyczące jest ogólnie fałszywe. Jeśli rzeczywiście jest tak , że potrzebne są zapytania log N X , oznacza to dość silną dolną granicę uczenia się funkcji monotonicznych przy użyciu zapytań członkowskich . W szczególności, niech poset X jest logiczna modułu ze zwykłymi kolejności (jeśli chce, X jest PowerSet z { 1 , . . . , N } z ⊆ jako częściowe kolejności). Liczba M maksymalnych antichains w X spełnia log M =logNX logNX X X {1,...,n} ⊆ M X [1]. Jeśli twój pomysł nalogNXjest poprawny, to istnieje predykat monotoniczny naX,który wymaga zasadniczo ( n-1logM=(1+o(1))(n−1⌊n/2⌋) logNX X zapytań. W szczególności implikuje to dolną granicę zasadniczo2ndla złożoności dowolnego algorytmu rozwiązującego ten problem.(n−1n/2)≈2n 2n
Jednak, jeśli dobrze zrozumiałem [ czego teraz nie wiem ], twój problem jest równoznaczny ze sprawdzeniem wzajemności dualności dwóch funkcji monotonicznych, co można zrobić w quasi-wielomianowym czasie (patrz wprowadzenie do tego artykułu przez Bioch i Ibaraki , które cytują Fredmana i Khachiyana), co jest sprzeczne z czymkolwiek zbliżonym do dolnej granicy .2n
[1] Liviu Ilinca i Jeff Kahn. Liczenie maksymalnych antichains i niezależnych zestawów . arXiv: 1202,4427
źródło