Które problemy z SAT są łatwe?

27

Jakie są „łatwe regiony” dla satysfakcji? Innymi słowy, wystarczające warunki, aby niektóre solver SAT mógł znaleźć zadowalające zadanie, pod warunkiem, że istnieje.

Jednym z przykładów jest sytuacja, w której każda klauzula dzieli zmienne z kilkoma innymi klauzulami, ze względu na konstruktywny dowód LLL, czy są jakieś inne wyniki w tym zakresie?

Istnieje spora literatura na temat łatwych regionów dla propagowania przekonań, czy jest coś podobnego do satysfakcji?

Jarosław Bułatow
źródło
2
czy jesteś również zainteresowany losowym przejściem fazy SAT?
Suresh Venkat,
Jak wygląda wystarczający warunek? Peter Shor wspomniał w innym poście, że instancja SAT musi posiadać „losową strukturę”, aby stosunek klauzul do zmiennych był odpowiedni. Zastanawiam się, czy jest to coś, co można zakodować w wystarczających warunkach
Jarosław Bułatow

Odpowiedzi:

33

Chyba znasz klasyczny wynik Schaefera ze STOC'78, ale na wszelki wypadek.

10.1145 / 800133.804350

Schaefer udowodnił, że jeśli SAT jest parametryzowany przez zestaw relacji dozwolonych w każdym przypadku, to istnieje tylko 6 możliwych do prześledzenia przypadków: 2-SAT (tj. Każda klauzula jest binarna), Horn-SAT, dual-Horn-SAT, affine-SAT ( rozwiązania równań liniowych w GF (2), 0-poprawne (relacje spełnione przez przypisanie all-0) i 1-poprawne (relacje spełnione przez przypisanie all-1).

Standa Zivny
źródło
3
Istnieje bardziej aktualny artykuł, który uściśla ten wynik: złożoność problemów satysfakcji: „Udoskonalenie twierdzenia Schaefera” Eric Allender, Michael Bauland, Neil Immerman, Henning Schnoor i Heribert Vollmer
Vinicius dos Santos
1
Dziękuję, oto doi: dx.doi.org/10.1016/j.jcss.2008.11.001
Standa Zivny
Zauważ, że są to problemy z ograniczeniem satysfakcji, a nie SAT (chociaż można je przepisać jako instancje SAT, ale technicznie SAT oznacza CSP z predykatami OR).
MCH
14

Nie jestem pewien, czy tego właśnie szukasz, ale istnieje spora literatura na temat przejścia fazowego 3-SAT.

Monasson, Zecchina, Kirkpatrcik, Selman i Troyansky mieli w naturze artykuł, który mówi o przejściu fazowym losowego k-SAT. Zastosowali parametryzację stosunku klauzul do zmiennych. W przypadku losowego 3-SAT ustalili liczbowo, że punkt przejścia wynosi około 4,3. Powyżej tego punktu losowe instancje 3-SAT są nadmiernie ograniczone i prawie na pewno nie można ich usatysfakcjonować, a poniżej tego punktu problemy są ograniczone i zadowalające (z dużym prawdopodobieństwem). Mertens, Mezard i Zecchina stosują procedury wnękowe do oszacowania punktu przejścia fazowego z wyższym stopniem dokładności.

Daleko od punktu krytycznego, „głupie” algorytmy działają dobrze w zadowalających przypadkach (walk sat itp.). Z tego, co rozumiem, deterministyczne czasy działania solvera rosną wykładniczo na przejściu fazowym lub w jego pobliżu (zobacz tutaj więcej dyskusji?).

Bliski kuzyn propagacji przekonań, Braunstein, Mezard i Zecchina wprowadzili propagację badań, która, jak się uważa, rozwiązuje zadowalające przypadki 3-SAT w milionach zmiennych, nawet bardzo blisko przejścia fazowego. Mezard ma wykład tu na szklanki typu spin (teoria, którą wykorzystał w analizie losowych NP-complete przejść fazowych) i Maneva ma wykład tutaj na propagację badań.

Z drugiej strony nadal wygląda na to, że nasze najlepsze solwery potrzebują wykładniczej ilości czasu na udowodnienie niezadowolenia. Zobacz tutaj , tutaj i tutaj, aby znaleźć dowody / dyskusje na temat wykładniczego charakteru niektórych powszechnych metod dowodzenia niezadowolenia (procedury Davisa-Putnama i metody rozwiązywania).

Trzeba uważać na „łatwość” lub „twardość” przypadkowych problemów z NP-Complete. Wyświetlanie problemu z NP-Complete, przejście fazowe nie daje żadnej gwarancji, gdzie są trudne problemy, a nawet czy w ogóle występują. Na przykład problem cyklu Hamiltoniain na losowych wykresach Erdosa-Renyi jest łatwo możliwy nawet w krytycznym punkcie przejścia lub w jego pobliżu. Problem partycji liczbowej nie wydaje się mieć żadnych algorytmów, które rozwiązywałyby go dobrze w zakresie prawdopodobieństwa 1 lub 0, nie mówiąc już o progu krytycznym. Z tego, co rozumiem, losowe problemy 3-SAT mają algorytmy, które działają dobrze w zadowalających przypadkach prawie na poziomie progu krytycznego lub poniżej niego (propagacja ankiety, spacer, itd.), Ale nie ma wydajnych algorytmów powyżej progu krytycznego, aby udowodnić niezadowolenie.

użytkownik834
źródło
Zastanawiam się, czy którekolwiek z tych „losowych wyników k-SAT” przenoszą się do rzeczywistych instancji SAT, innymi słowy, czy stosunek klauzul do zmiennych jest nadal użytecznym wskaźnikiem twardości
Jarosław Bułatow
1
@ Yaroslav, z mojego doświadczenia wynika, że ​​nie. Wiele rzeczywistych problemów (nawet redukcji) ma (lub wprowadza) tyle struktur, że niweluje losowość, dla której zoptymalizowano wiele solverów. Wygląda na to, że w pewnym momencie możemy w jakiś sposób wyjaśnić tę strukturę i skupić się tylko na części losowości (lub „istocie” losowego problemu), ale nie widzę żadnego ogólnego sposobu na zrobienie tego, ani czy naprawdę znam jakieś przykłady, które stosują tę strategię.
user834,
@ user834: Z mojego doświadczenia zgadzam się. Ponadto, o ile mi wiadomo, nikt nigdy nie wymyślił nawet jakiegoś rodzaju miary losowości, tj. Funkcji która, biorąc pod uwagę wzór CNF , zwraca wartość która jest reprezentatywna dla stopień losowości ma. Oczywiście taki środek byłby jedynie przybliżeniem zgodnym z niektórymi rozsądnymi kryteriami; nie jestem jednak świadomy czegoś takiego: czy wiesz, czy ktoś wcześniej się tym zajmował? F r [ 0 , 1 ] F.R(F)Fr[0,1]F
Giorgio Camerani,
5

Istnieje wiele wystarczających warunków. W pewnym sensie znaczna część teoretycznej CS została poświęcona gromadzeniu tych warunków - stała zdolność do pomiaru parametrów, 2-SAT, losowa 3-SAT o różnych gęstościach itp.

Peter Boothe
źródło
2
To prawda, można wziąć każdy problem X, który łatwo rozwiązać, i powiedzieć, że „każda formuła odpowiadająca problemowi X jest łatwa”. Wydaje mi się, że szukam wystarczających warunków, które byłyby bardziej skuteczne w podsumowaniu łatwego regionu niż „wszystkie problemy znane z P”, bardziej jak to, co robi konstruktywna Lovasz Local Lemma
Jarosław Bułatow
3

jak dotąd w literaturze nie ma szerokiego rozpoznania tej koncepcji, ale wykres klauzulowy problemu SAT (wykres z jednym węzłem na klauzulę i węzły są połączone, jeśli klauzule dzielą zmienne), a także inne powiązane wykresy reprezentacji SAT wydaje się mieć wiele podstawowych wskazówek co do tego, jak średnio będzie trudna instancja.

wykres klauzulowy może być analizowany za pomocą wszelkiego rodzaju algorytmów graficznych, jest pozornie naturalną miarą „struktury” i ma silne powiązania z pomiarem / oszacowaniem twardości, i wydaje się, że badania tej struktury i jej implikacji są wciąż na bardzo wczesnym etapie gradacja. nie jest wykluczone, że badania punktu przejściowego, tradycyjny / dobrze zbadany sposób podejścia do tego pytania, mogą ostatecznie zostać połączone w strukturę grafu klauzulowego (do pewnego stopnia już to ma). innymi słowy, punkt przejściowy w SAT może występować „z powodu” struktury grafu klauzulowego.

oto jedno doskonałe odniesienie w tym zakresie, praca doktorska Herwiga, jest wiele innych.

[1] Rozkładanie problemów związanych z satysfakcją lub Korzystanie z wykresów w celu uzyskania lepszego wglądu w problemy dotyczące satysfakcji , Herwig 2006 (83pp)

vzn
źródło
jest to wykres zależności przy zastosowaniu lokalnego lematu i wariantów Lovasz do satysfakcji. w tym sensie, wykres klauzula została spojrzał na wiele . Shearer charakteryzuje wykresy, dla których utrzymuje się lokalny lemat, a Kolipaka i Szegedy sprawili, że wynik Schaefera był konstruktywny. Jeśli nie wiesz dużo, proszę nie wnioskować, że nikt nie wie!
Sasho Nikolov
podział shaeferów na kilka możliwych do przećwiczenia klas jest wspomniany w odpowiedzi Zivny'ego, ale ta analiza grafu klauzul jest stosunkowo nowsza, głębsza i bardziej dopracowana, a bardziej empiryczna. jeśli chodzi o cytowane cytaty, wydaje się, że nie są często wymieniane w dokumentach dotyczących twardości SAT / badaniach ... istnieje wiele / równolegle powiązanych ze sobą linii zapytań ...
wer
Schaefer był literówką, miałem na myśli Shearera. LLL i jego warianty są głównym narzędziem do ograniczania trudnych wystąpień k-SAT, wyszukiwarka google ujawni mnóstwo referencji. Twierdzenie Shearera pokazuje, które wykresy klauzul gwarantują, że każda instancja SAT z tym wykresem jest koniecznie zadowalająca. Spójrz na tę ankietę, aby uzyskać szczegółowe powiązania z progami twardości, trudnością w tworzeniu twardych instancji, algorytmów itp. Disco.ethz.ch/lectures/fs11/seminar/paper/barbara-3.pdf
Sasho Nikolov
1
ogólna myśl: za każdym razem można powiedzieć coś jest terra incognita istnieje duże prawdopodobieństwo, że jest terra incognita dla ciebie . w każdym razie tego rodzaju komentarze są bezużyteczne, chyba że jesteś uznanym i opublikowanym ekspertem w tej dziedzinie. byłoby lepiej, gdybyś ograniczył swoje odpowiedzi do tego , co wiesz, i pominąłeś komentarze na temat tego, co według ciebie nikt nie wie.
Sasho Nikolov
1
LLL jest jednym z narzędzi do analizy SAT, wynalezionym w 1975 r. I może od tamtej pory udoskonalonymi. jest to przepis na wystarczającą liczbę łatwych lub trudnych przypadków, ale nie jest konieczny . od tego czasu istnieją inne podejścia, które w coraz większym stopniu wypełniają lukę w nowatorski sposób, tj. rozszerzają ją i omijają. musisz pomylić tę odpowiedź z czymś innym, w powyższym pytaniu nie ma użycia terminu „terra incognita” . i zasugeruj, abyś ograniczył się do rzeczywistych pisemnych odpowiedzi i nie spekulował na temat tego, co inni wiedzą lub nie wiedzą =)
dniu
1

Łatwo jest przenieść wszystkie wystąpienia w pobliżu punktu „przejścia” tak daleko od punktu „przejścia”, jak się chce. Ruch obejmuje wielomianowy wysiłek czasu / przestrzeni.

Jeśli instancje daleko od punktu „przejścia” są łatwiejsze do rozwiązania, to te w pobliżu punktu przejścia muszą być równie łatwe do rozwiązania. (Transformacje wielomianowe i wszystko.)

GHR
źródło
możesz opracować, czy masz do tego referencję?
vzn
1

ten ważny artykuł [1] Toby'ego Walsha dotyczy przejścia SAT, mierzonego w stosunku klauzula / zmienna. jednak idzie dalej w pomiarze właściwość o nazwie constrainedness , . jest to szorstka, a może naturalna miara twardości, tak że problemy z ograniczeniami lub ograniczeniami są łatwiejsze niż ograniczenia w krytycznym punkcie pośrednim.κ

znajduje pozorną fraktalną strukturę samopodobieństwa twardych instancji w parametrze ograniczenia, tak że jako solver DP (LL) podczas wyszukiwania ma tendencję do znajdowania podproblemów z tym samym ograniczeniem krytycznym bez względu na to, która zmienna zostanie wybrana obok gałęzi. istnieje dalsza analiza struktury fraktalnej w instancjach SAT (takich jak wymiar Hausdorffa wzorów SAT i związek z twardością) np. [2,3]

inną nieco ze sobą powiązaną linią dochodzenia tutaj jest związek małych wykresów światowych ze (twardą) strukturą SAT np. [4,5]

oczywiście standardowy punkt w tym obszarze dotyczy tego, że bardzo ostateczna odpowiedź na to pytanie byłaby z natury bliska P NP=? , lub że taki dowód byłby (będzie?) najlepszy / bliski - ostateczna odpowiedź na pytanie.

[1] Ostrze noża ograniczającego autorstwa Toby'ego Walsha 1998

[2] SAMODPOWIEDNOŚĆ ZADOWOLONYCH EKSPRESÓW BOOLEJSKICH ODszyfrowanych w kategoriach UKŁADOWYCH SYSTEMÓW FUNKCJI BEZPOŚREDNICH WYKRESU Ni i Wen

[3] Wizualizacja wewnętrznej struktury instancji SAT (raport wstępny) Sinz

[4] Szukaj w małym świecie według Walsha 1999

[5] Modelowanie bardziej realistycznych problemów SAT przez Slater 2002

vzn
źródło
3
Nawiasem mówiąc, to DPLL, a nie DP (LL). Ponadto znacznie nowsze prace nad przejściem fazowym w SAT (patrz na przykład praca Achlioptas).
Vijay D
istnieje algorytm DP, który poprzedza DPLL, który ma podobne zachowanie. drugą odpowiedź przez user834 wymienić głównie SAT punkt przejścia badania wielu pozycjach literatury ale odpowiedź podkreśla inny (ale powiązane ze sobą) Kąt
vzn
1
Znam te algorytmy. Wskazałem tylko standardową konwencję typograficzną, która polega na pisaniu DP, DPLL, DPLL (T) lub DPLL (Join), dla przypadku pierwszego rzędu bez kwantyfikatora. Nikt nie pisze DP (LL) i dodaje zamieszanie do DPLL (T) i DPLL (Dołącz)
Vijay D
DP (LL) oznacza DP + DPLL
dniu