Algorytmy DNA i kompletność NP

21

Jaki jest związek między algorytmami DNA a klasami złożoności określonymi za pomocą maszyn Turinga? Czym są pomiary złożoności, takie jak czas i przestrzeń w algorytmach DNA? Czy można je wykorzystać do rozwiązania problemów związanych z NP-zupełnymi, takich jak TSP, których maszyny von Neumann nie są w stanie rozwiązać w praktyce?

Aadita Mehra
źródło
2
Zadałem
Aaron Sterling

Odpowiedzi:

31

Odpowiedź Soundbite: obliczenia DNA nie zapewniają magicznej różdżki do rozwiązania problemów z NP-zupełnym, chociaż niektórzy szanowani badacze w latach 90. myśleli, że tak się stanie.

Inauguracyjny eksperyment z wykorzystaniem DNA przeprowadzono w laboratorium pod kierunkiem znanego teoretyka liczb Len Adlemana. Adleman rozwiązał mały problem wędrownego sprzedawcy - dobrze znany problem NP-zupełny, a on i inni myśleli przez chwilę, że metoda może się zwiększyć. Adleman opisuje swoje podejście w tym krótkim filmie , który wydaje mi się fascynujący. Problem, który napotkali, polegał na tym, że aby rozwiązać problem niewielkiej wielkości TSP, potrzebowaliby więcej DNA niż wielkości Ziemi. Wymyślili sposób na zaoszczędzenie czasu poprzez zwiększenie ilości pracy wykonanej równolegle, ale to nie znaczyło, że problem TSP wymagał mniej niż wykładnicze zasoby do rozwiązania. Dopiero przesunęli koszt wykładniczy z ilości czasu na ilość materiału fizycznego.

(Istnieje dodatkowe pytanie: jeśli potrzebujesz wykładniczej ilości maszyn do rozwiązania problemu, czy automatycznie potrzebujesz wykładniczej ilości czasu lub przynajmniej wstępnego przetwarzania, aby zbudować maszynę w pierwszej kolejności? Zostawiam ten problem z jednej strony.)

Ten ogólny problem - skrócenie czasu obliczeń kosztem innych zasobów - pojawił się wiele razy w biologicznie inspirowanych modelach obliczeniowych. Strona Wikipedii na temat obliczeń błonowych (abstrakcja komórki biologicznej) mówi, że pewien rodzaj systemu błonowego jest w stanie rozwiązać problemy NP-zupełne w czasie wielomianowym. Działa to, ponieważ system ten pozwala na tworzenie wykładniczo wielu podobiektów w całej błonie w czasie wielomianowym. Cóż ... w jaki sposób wykładnicza ilość surowca dociera ze świata zewnętrznego przez membranę o stałym polu powierzchni? Odpowiedź: nie jest brane pod uwagę. Nie płacą za zasób, który w innym przypadku wymagałby obliczeń.

Wreszcie, aby odpowiedzieć na Anthony Labarre, który odesłał do artykułu pokazującego AHNEP, może rozwiązać problemy NP-zupełne w czasie wielomianowym. Istnieje nawet artykuł pokazujący, że AHNEP mogą rozwiązać 3SAT liniowoczas. AHNEP = Akceptacja hybrydowej sieci procesorów ewolucyjnych. Procesor ewolucyjny to model inspirowany DNA, którego rdzeń ma ciąg, który na każdym etapie można zmienić przez podstawienie, usunięcie lub (co ważne) wstawienie. Ponadto w każdym węźle dostępna jest dowolnie duża liczba ciągów, a na każdym etapie komunikacji wszystkie węzły wysyłają wszystkie swoje prawidłowe ciągi do wszystkich dołączonych węzłów. Zatem bez kosztów czasowych możliwe jest przesyłanie wykładniczej ilości informacji, a dzięki regule wstawiania poszczególne ciągi znaków mogą stać się jeszcze większe w trakcie obliczeń, więc jest to podwójne zawroty głowy.

Jeśli interesują Cię najnowsze prace w dziedzinie biokomputacji, badacze skupiający się na obliczeniach praktycznych w świecie rzeczywistym, mogę zaoferować recenzję książki, którą niedawno napisałem dla SIGACT News, która krótko omawia wiele obszarów.

Aaron Sterling
źródło
@Aaron: Dziękuję! Teraz muszę iść i przeczytać twoją recenzję.
Aadita Mehra
Sam nie mogłem tego lepiej ująć. Dotyczy to również wielu innych technik rozwiązywania problemów inspirowanych biologią, takich jak algorytmy genetyczne i fałdowanie białek.
user834,
6
r>2)solmdo2)
5
(ciąg dalszy) Zatem twoja wykładnicza ilość maszyn ma wykładniczy promień. Ponieważ nie można zasygnalizować szybciej niż światło, sygnał z jednej strony na drugą dociera wykładniczo długo do drugiej strony, więc jeśli wszystkie maszyny przyczynią się do odpowiedzi, nie jest możliwe rozwiązanie problemu w sposób mniejszy niż wykładniczy czas.
Joe Fitzsimons,
@Joe: Dziękuję. :-) Czy byłoby dobrze, gdybym cytował część twoich komentarzy w kolejnym pytaniu? Interesują mnie formalizmy, które wychwytują takie stwierdzenia, jak: „Moc obliczeniowa skaluje się co najwyżej liniowo w masie”. Ile jest złożoności Kołmogorowa na cal kwadratowy itp.
Aaron Sterling
13

To bardzo zależy od twojego modelu.

W rzeczywistości obliczenia DNA są zgodne z (nierelatywistycznymi) prawami fizycznymi, a zatem mogą być symulowane na komputerze kwantowym. Zatem najlepsze, na co możesz liczyć, to to, że rozwiąże ono problemy kompletne w BQP. Jednak w rzeczywistości jest to bardzo mało prawdopodobne (DNA jest dość duże, więc spójność nie jest tak naprawdę problemem), a więc dzięki symulacji prawie na pewno P. Należy jednak zauważyć, że jest to wydajność pod względem liczby użytych atomów, a szczerze mówiąc, atomy są na tyle tanie, że liczba ta jest astronomiczna, co czyni praktyczną symulację probówki pełnej DNA daleko poza sferą tego, co jest obecnie możliwe.

W rezultacie wiele osób decyduje się na pracę z modelami, które aproksymują to, co dzieje się całkiem dobrze w praktyce, ale psują się, gdy są popychane do skrajności. Jednym z przykładów jest abstrakcyjny model kafelkowy, który, jak się okazuje, jest kompletny w NEXP (patrz artykuł Gottesmana i Irani z FOCS w zeszłym roku).

Joe Fitzsimons
źródło
Dziękujemy za inteligentny pomysł, aby postrzegać przetwarzanie DNA jako system fizyczny! Spojrzę na papier, który podlinkowałeś. Dzięki jeszcze raz.
Aadita Mehra,
@Aadita: Nie ma problemu. Mam nadzieję, że jest to przydatne.
Joe Fitzsimons,
1
Model kafelkowy Wanga nie ma na celu modelowania dynamiki fizycznej. Interpretowane jako narzędzie do przewidywania przyszłego stanu układu fizycznego, prawidłowe kafelkowanie Wanga to przewidywanie najbardziej prawdopodobnego stanu układu w równowadze termodynamicznej; tj. najniższa energia. Ale termodynamika nie daje żadnych wskazówek, jak długo system może osiągnąć konwergencję do równowagi; do tego potrzebujesz kinetyki. Wiele układów ma równowagę termodynamiczną, którą osiąga się dopiero po czasie wykładniczym. W przypadku „fizycznej złożoności obliczeniowej” należy stosować kinetykę, a nie termodynamikę; np. model zestawu płytek.
Dave Doty
@Dave: Dzięki za informację. Muszę przyznać, że jestem dość nieświadomy tego obszaru i być może bardzo źle sformułowałem tę część odpowiedzi. Nie zamierzałem twierdzić, że uważano to za model dynamiki.
Joe Fitzsimons,
2

To jest częściowa odpowiedź

Z artykułu w Wikipedii, o którym wspomniałeś, algorytmy molekularnego obliczania DNA, które rozwiązują problemy z NP-zupełnym, nie dowodzą, że problemy z NP-zupełnym można rozwiązać w czasie wielomianowym na maszynach sekwencyjnych (zakładając, że w praktyce oznacza to czas wielomianowy). Obliczenia DNA można uznać za obliczenia równoległe. Wreszcie, z punktu widzenia teorii obliczalności, obliczenia DNA nie są bardziej wydajne niż maszyny Turinga.

Mohammad Al-Turkistany
źródło
1

Ten artykuł może być dla ciebie interesujący - nawiasem mówiąc, byłbym wdzięczny, gdyby ktoś mógł wyjaśnić szokujące stwierdzenie, które stanowi jego tytuł.

Anthony Labarre
źródło
2
Niektóre problemy poza PTIME można rozwiązać za pomocą maszyn równoległych w czasie wielomianowym. Nie jest to paradoksalne, ponieważ PTIME mówi o problemach możliwych do rozwiązania przez określoną klasę maszyn sekwencyjnych w czasie wielomianowym.
Charles Stewart
5
Próbowałem wyjaśnić w zamieszczonej przeze mnie odpowiedzi.
Aaron Sterling