Czym dokładnie jest algorytm?

12

Wiem, że może to zabrzmieć trochę po wyjęciu z pudełka, w rzeczywistości zawsze myślałem w środku, ale ostatnio myślałem, być może dlatego, że informatyka zapewnia dużą swobodę, o sposobach opracowywania programów innych niż te nauczane na uniwersytecie.

Rozważ funkcję silni. Zazwyczaj definiujemy tę funkcję jak

 int fact(int n) 
 { 
 int r = 1; 
 for(int i=2;i<=n;i++) 
 r = r*i; 
 return r; 
 } 

Nazwałbym to algorytmem i nie mam wątpliwości, że jest to właściwy sposób, aby to zrobić. Następnie zastanawiałem się „czy mogę to zrobić w stałym czasie?”, Co doprowadziło do następującego pomysłu: co jeśli miałbym tablicę liczb całkowitych, gdzie tablica [n] mieści silnię n? Po wypełnieniu tej tablicy mogę po prostu zdefiniować fakt jako:

 int fact(int n) 
 { 
 return array[n]; 
 } 

Nadal nie wydaje mi się, aby algorytm ten działał, mimo że zapewnia poprawny wynik i działa w stałym czasie O (1). Czy można to nazwać algorytmem? W przeciwnym razie dlaczego nie? Mógłbym argumentować, że wypełnienie tablicy wymagałoby pewnego działania algorytmu, nawet jeśli byłby w naszym mózgu, abyśmy mogli wypełnić tablicę, ale czy może to być kryterium? Jak formalnie traktować te aspekty?

Zauważ, że to pojęcie można rozszerzyć na dowolną funkcję działającą na liczbach całkowitych niezależnie od liczby argumentów, musiałbym po prostu użyć macierzy, jeśli funkcja miała 2 argumenty lub 3, jeśli funkcja miała 3 argumenty i tak dalej. Czy te rozwiązania nie są używane tylko ze względu na zużycie pamięci?

Poza tym funkcje mogą obejmować również dowolny program z wyjściem, ponieważ mogłem znaleźć sposób na indeksowanie każdego możliwego wyjścia, które program może zapewnić.

Jako kolejny przykład rozważ wspólne użycie tablicy: początkowo przydzielam tablicę o rozmiarze N, a następnie dodam elementy do tablicy, przechowując wartość o indeksie n i zwiększając n o jedną jednostkę. Następnie, jeśli chcę wyszukać elemento, nie mogę pomóc, ale przeprowadzić liniowe wyszukiwanie w tablicy. Jeśli zamiast tego utworzyłem tablicę wielkości, na przykład Integer.MAXVALUE, do przechowywania liczb całkowitych, zainicjowanych zerami, mógłbym zapisać liczbę całkowitą, umieszczając 1 przy jej indeksie. Następnie mógłbym wyszukać jego istnienie w tablicy w czasie O (1). Co jeśli chciałbym móc umieścić wiele jednostek o tym samym numerze? Nie ma problemu, po prostu zwiększę wartość przechowywaną w indeksie liczb całkowitych.

Sortowanie byłoby nieco bardziej skomplikowane, ale mimo to wyszukiwanie i dodawanie można wykonać w czasie O (1).

Devian Dover
źródło
Twoja druga funkcja powinna mieć tablicę jako parametr. W przeciwnym razie zgubisz się w bezwzględnej pułapce stanu niejawnego, co jest przydatne w programowaniu, ale może utrudnić zrozumienie twojego kodu.
jmite
Tak, twój drugi kod można nazwać algorytmem, dla którego dane wejściowe to liczba n, a tablica zawiera wszystkie silnie. W pierwszym kodzie algorytm ma tylko jedno wejście, tj. Liczbę n.
Ankur
Obowiązkowe: nie będę dziś próbował dalej definiować rodzajów materiałów, które, jak rozumiem, powinny być zawarte w tym skróconym opisie [„algorytmie”], i być może nigdy nie uda mi się tego w inteligentny sposób. Ale wiem to, kiedy to widzę, a rzeczy opisane w poniższych postach nie takie.
Patrick87
W związku z tym pytaniem (ale bez bezpośredniej odpowiedzi) warto również przeczytać „Co to jest algorytm?” autor: Yuri Gurevich, Microsoft Research, Raport techniczny MSR-TR-2011-116 research.microsoft.com/pubs/155608/209-3.pdf
godfatherofpolka
Mówisz: „... co jeśli miałbym tablicę liczb całkowitych, gdzie tablica [n] zawiera silnię n? Po wypełnieniu tej tablicy ....”. Jak zamierzasz wypełnić tablicę silnią wszystkich liczb całkowitych? Ta tablica miałaby nieskończony rozmiar i wypełnienie jej zajęłoby nieskończony czas. Dlatego twoje pytanie jest źle postawione.
AP

Odpowiedzi:

9

Nieformalna definicja algorytmu w popularnym podręczniku wygląda mniej więcej tak:

Algorytm to (1) dobrze zdefiniowana procedura obliczeniowa (2), która wymaga pewnej ilości danych wejściowych i (3) generuje dane wyjściowe (4) dla dobrze określonego problemu obliczeniowego.

W pierwszym przypadku zakodowałeś algorytm, w którym: Problem polega na znalezieniu silni (część 4 definicji), podanej int n jako danych wejściowych (część 2 definicji), kod opisuje obliczenia, które należy wykonać (część 1 definicji ), dane wyjściowe są silnią (część 3 definicji).

W drugim przypadku: Problem polega na znalezieniu elementu tablicy w pozycji n (część 4 definicji), podanej n jako dane wejściowe (część 3 definicji), kod opisuje obliczenia, które należy wykonać (część 2 definicji), wyjście to element w pozycji n (część 1 definicji).

Zapisałeś tam silnię, więc daje ci silnię. Jeśli zapisałeś tam kwadraty lub kostki, dostałbyś kwadraty lub kostki, więc nie można powiedzieć, że drugi fragment sam w sobie jest algorytmem do obliczania silni.

A jeśli powiesz, że tablica przeglądająca się wraz z tablicą mającą f (n) w pozycji n jest algorytmem do obliczania f (n), to zaszedłeś tak głęboko, że nie ma już obliczeń poniżej. Dobrze zdefiniowana procedura obliczeniowa powinna być skończoną informacją. Jeśli nieskończona tablica silni jest częścią procedury obliczeniowej, nie ma to zastosowania. To nie byłby algorytm do obliczania silni.

Ranbir
źródło
Prawdziwym problemem z sugestią PO jest to, że opis „dobrze zdefiniowanej procedury obliczeniowej” nie jest skończony. Oczywiście, o ile nie wyjaśnimy, co rozumiemy przez „dobrze zdefiniowaną procedurę obliczeniową”, nie można z góry stwierdzić, czy algorytm PO jest prawidłowy, czy nie. Jest to właściwie „dobrze zdefiniowana procedura obliczeniowa”, biorąc pod uwagę nieskończoną tablicę, więc dlaczego jest to nielegalne? OP może nawet w skończony sposób opisać, jak wypełnić tablicę. Co zatem pójdzie nie tak? Twoja nieformalna definicja nie rozróżnia między obliczeniami hiperkomputerowymi i (Turinga).
Yuval Filmus
Dobrze zdefiniowana procedura obliczeniowa powinna być wyrażona jako skończona informacja. Jeśli nieskończona tablica silni jest jej częścią, nie ma to zastosowania.
Ranbir
2
{(n,n!):nN}
Opis tablicy można wyrazić jako skończoną informację, ale sama tablica nie jest.
Ranbir
Argumentowałbym, że oba przykłady OP są algorytmami i że żadne nie oblicza silni dla wszystkich liczb całkowitych. Ale to chyba tylko wybredne.
Patrick87
5

Mówiąc najogólniej, algorytm to seria kroków do rozwiązania problemu .

W CS powszechnie stosowane / przyjmowane są następujące założenia:

  • Algorytm ma skończony opis i dobrze zdefiniowaną procedurę wykonywania swoich kroków w przypadku wystąpienia dowolnego problemu. (Więcej poniżej.)
  • Wystąpienie problemu podane jako ciąg skończony (sekwencja symboli wejściowych), a dane wyjściowe algorytmu można zakodować jako ciąg skończony.
  • Problem to zbiór wystąpień problemów wraz z możliwymi „poprawnymi” danymi wyjściowymi dla każdego wystąpienia. „Rozwiązywanie” oznacza uzyskanie prawidłowego wyniku.
  • (Zwykle) instancje problemowe mogą być dowolnie duże (istnieje nieskończona liczba możliwych instancji, które musi rozwiązać Twój skończony algorytm).

Przed założeniem CS matematycy mieli te same typy problemów, które zgłaszaliście, i wprowadzili formalne definicje obliczeń, aby rozwiązać te problemy. Tak więc obecnie możemy sformalizować wszystkie powyższe założenia, po prostu mówiąc „algorytm to procedura, którą można zaimplementować na maszynie Turinga” . To prawdopodobnie najlepsza formalna odpowiedź na twoje pytanie.

Zauważ, że teza Church-Turinga mówi, że naszym zdaniem nie ma „potężniejszej” formalizacji algorytmów niż Maszyna Turinga.

Przykład silni wchodzi w inny model obliczeń, zwany obliczeniami nierównomiernymi. Maszyna Turinga jest przykładem jednolitego modelu obliczeniowego: ma pojedynczy, skończony opis i działa na dane wejściowe o dowolnie dużych rozmiarach. Innymi słowy, istnieje baza TM, która rozwiązuje problem dla wszystkich rozmiarów wejściowych.

Teraz możemy zamiast tego rozważyć obliczenia w następujący sposób: Dla każdego rozmiaru wejściowego istnieje TM (lub inne urządzenie obliczeniowe), które rozwiązuje problem. To jest zupełnie inne pytanie. Zauważ, że pojedyncza baza TM nie może przechowywać silni każdej pojedynczej liczby całkowitej, ponieważ baza TM ma skończony opis. Możemy jednak stworzyć TM (lub program w C), który przechowuje silnie wszystkich liczb poniżej 1000. Następnie możemy stworzyć program, który przechowuje silnie wszystkich liczb od 1000 do 10000. I tak dalej.

Te niejednorodne typy obliczeń są zwykle modelowane w teoretycznym CS przez obwody. Rozważasz inną konstrukcję obwodu dla każdego możliwego rozmiaru wejściowego.

Niejednorodne modele obliczeń na ogół nie są uważane za algorytmy , nawet jeśli pasują do mojego pierwszego zdania. Powodem jest to, że nie pasują one do naszych kluczowych założeń: nie mają skończonego opisu, który można wdrożyć, aby rozwiązać „cały” problem dla dowolnego rozmiaru danych wejściowych. Potrzebują raczej coraz większego opisu, gdy problem staje się większy (np. Potrzeba większej tabeli odnośników). Są jednak nadal interesującymi modelami obliczeń.

usul
źródło
Myślę, że twój model obliczeniowy oparty na obwodach jest nieodpowiedni. Jak mówisz, TM ma skończony opis. Ale to nie wyklucza posiadania taśmy pomocniczej, która jest wypełniona tabelaryczną wersją silni. Można nawet zrobić „gorsze” i nadal mieć skończony opis. Ale tak naprawdę wszystko, czego potrzebujesz, to obliczalny opis, który koniecznie jest ostatecznie skończony. Istnieje wiele obliczeniowych ujednoliconych metod definiowania maszyny Turinga z silnikiem tabelarycznym, z których żaden nie jest w stanie faktycznie zwiększyć mocy obliczeniowej TM. Dlatego twój wniosek nie ma zastosowania.
babou
@babou, nie rozumiem o co ci chodzi. Co rozumiesz przez „nieodpowiedni” i który wniosek, który wyciągnąłem, jest fałszywy? Uwagi: Nie wymyśliłem modelu obwodu. Być może nie opisałem tego dobrze. Kluczową kwestią jest to, że dla każdego wejścia dopuszczamy inne urządzenie obliczeniowe (TM lub obwód), co oznacza, że ​​może nie istnieć jednolity algorytm, który generuje wszystkie te urządzenia (dla wszystkich rozmiarów wejściowych), lub innymi słowy, może nie bądź skończonym opisem, który opisuje je wszystkie.
usul
Uznanie tabeli funkcji silnej za obliczenie niejednorodne nie wydaje mi się właściwą drogą. Jest tak naprawdę bardzo jednorodny, do tego stopnia, że ​​jego skończone segmenty mogą być postrzegane jako ciągłe z granicą nieskończoności, która jest całą tabelą. Tak się dzieje z semantyką Scotta. Co więcej, cała tabela może być faktycznie skończona opisana w sposób obliczalny, tak więc sensowne byłoby rozważenie TM z dodatkową taśmą zawierającą wstępnie obliczoną tabelę. Twoja odpowiedź wydaje się sugerować, że wstępnie obliczona tabela nie może być uważana za algorytm.
babou
Dowolna konkretna wstępnie obliczona tabela może być częścią algorytmu, a dla nieskończonej sekwencji coraz większych rozmiarów wstępnie obliczonych tabel możesz wygenerować dowolną z tych rzeczy za pomocą algorytmu. Ale nie uważałbym, że nieskończony zestaw tabel o coraz większym rozmiarze sam w sobie jest algorytmem lub jednolitym obliczeniem, ponieważ ma nieskończony rozmiar.
usul
Nie uważalibyście tego za algorytm. To jest subiektywne. Liczy się wiedza, dlaczego nie powinieneś. I nie ma powodu, żebym widział. Każda koncepcja, która ma sens dla algorytmów, ma w tym przypadku sens. Wszystko, co robi, to abstrahowanie od tworzenia tabeli, choć można to rozliczać osobno. W rzeczywistości jest to kwestia czysto semantyka, ponieważ rozważenie rosnącej sekwencji jako takiej lub zastąpienie jej nieskończoną granicą równa się matematycznie temu samemu. A semantyczne teorie obliczeń uwzględniają takie nieskończone granice, niezależnie od tego, czy zostały wytworzone czy przedstawione.
babou
4

Algorytm to program napisany w C, który powinien działać dla dowolnej długości danych wejściowych (przy założeniu nieskończonej pamięci i nieograniczonych liczb całkowitych). W twoich przykładach, jeśli chcielibyśmy, aby program działał dla wszystkich długości danych wejściowych, wówczas tabela, w której przechowywane są wyniki, byłaby nieskończenie duża; programy w C są zawsze skończone, więc nie można zastosować tego podejścia.

n!n!) można w nim obliczyć znacznie wydajniej w porównaniu do C.

Martwiąc się o rzeczywiste czasy działania na prawdziwym komputerze, powinniśmy być jeszcze bardziej ostrożni, ale niestety zwykle wykracza to poza granice teoretycznej informatyki.


nn!

Jakiego pojęcia algorytmu powinniśmy użyć? Jedną z wyżej wymienionych sugestii jest użycie programów C. Możemy to nazwać obliczeniem C. Obliczenia Turinga są tym, co dostajesz, gdy używasz maszyn Turinga. Okazuje się, że funkcja jest obliczalna dla C tylko wtedy, gdy jest obliczalna dla Turinga. W tym sensie oba te modele obliczeń są równoważne. Rzeczywiście, wiele innych modeli jest równoważnych, na przykład wszystkie powszechnie używane języki programowania (przy założeniu nieskończonej pamięci i zmiennych nieograniczonych).

Mówimy, że język programowania P jest kompletny dla Turinga, to funkcja jest obliczalna dla P tylko wtedy, gdy jest obliczalna dla Turinga. Hipoteza Churcha-Turinga jest nieformalnym stwierdzeniem, że wszystkie rozsądne modele obliczeniowe posiadające skończony opis i zajmujące skończony czas są kompletne. Twój model ma skończony opis, ale nie wymaga skończonego czasu.

Yuval Filmus
źródło
3
lol „Algorytm to program napisany w C ...”?!?
vzn
2
„Algorytm to program napisany w C” ... Dlaczego podajesz język? To nie ma sensu.
wtorek,
1
@ououney Po prostu staram się być konkretny. Twój ulubiony język programowania jest również kompletny w Turingu.
Yuval Filmus
@YuvalFilmus Cóż, nie jesteś konkretny, jesteś zagubiony.
nouney
@ nouney Możesz dodać własną odpowiedź.
Yuval Filmus
4

Ważną częścią wspólnej definicji algorytmu, której brakuje, jest to, że specyfikacja musi być skończona , a rozmiar specyfikacji nie może różnić się w zależności od wielkości danych wejściowych.

Pamięć może być dowolnie duża, podobnie jak dane wejściowe, ale aby być użyteczną definicją algorytmu, przestrzeń kodowa musi być skończona. W przeciwnym razie dostaniesz właśnie zidentyfikowany problem.

O(logA)AO(logn)O(logn!)O(n(logn)2)sn=O(2s)O(2s s2)O(1)

DanielV
źródło
przestrzeń kodowa musi być skończona ”: Czy chcesz powiedzieć, że program Lisp, który wywołuje evalfunkcję w utworzonej właśnie dużej strukturze danych i która reprezentuje wyrażenie lLisp, nie może być uważany za algorytm. Podejrzewam, że znaczna część kodu wyprodukowanego w MIT w XX wieku nie kwalifikuje się jako algorytmy. To tylko nieformalny argument, ale problem formalny polega na tym, co to jest skończona specyfikacja, którą czytasz w zdecydowanie zbyt restrykcyjny sposób.
babou
Jeśli wyrażenie zostało wygenerowane, jest ono skończone. Nie ważne jak duże. Jednak usunięcie ograniczenia skończoności przestrzeni kodowej może być przydatne, może być wykorzystane do udowodnienia niższych granic w środowisku wykonawczym (np. W celu ograniczenia dolnej granicy czasu sortowania listy). Ale prawie każdy interesujący wynik samych algorytmów będzie wymagał skończonej przestrzeni kodowej. Jest to podobne do tego, w jaki sposób wielomiany muszą mieć skończoną liczbę współczynników, ale przydatne są również szeregi mocy.
DanielV
Nie jestem ekspertem od obliczania złożoności (nie moja dziedzina), ale fakt, że masz matematykę lub nie, nie powinien mieć wpływu na to, co jest algorytmem. Chodzi o to, że program Lisp może ciągle zwiększać rozmiar swojego kodu bez żadnych ograniczeń. Wtedy bardziej sensowne może być przeanalizowanie tego jako nieskończonego fragmentu kodu o określonych właściwościach obliczeniowych. Przypadek funkcji tabelarycznej można zobaczyć w tym świetle. Dziwi mnie, że odpowiedzi mają tak ograniczony (miałem już powiedzieć parafialny ) pogląd na to, czym jest algorytm.
babou
3

Kilka uwag, które mogą być pomocne:

Problemy stanowią stwierdzenia dotyczące dopuszczalnych danych wejściowych i odpowiadających im danych wyjściowych. Są tym, co chcemy rozwiązać. Algorytmy są procedurami obliczeniowymi. Możemy powiedzieć, że algorytm jest poprawny w odniesieniu do problemu, jeśli akceptuje dane wejściowe, które są dopuszczalne w odniesieniu do problemu i generuje dane wyjściowe zgodnie z opisem problemu.

Oba twoje przykłady są algorytmami, ponieważ oba są procedurami obliczeniowymi wyraźnie. To, czy algorytmy są poprawne, zależy od tego, jak zdefiniujesz problem i jak interpretujesz reprezentację algorytmu. Niektóre stwierdzenia problemów:

  1. nn!
  2. n>0n!< INT_MAXn!

Niektóre interpretacje pierwszego fragmentu kodu:

  1. Jest to pseudokod, który przypomina C / C ++, z wyjątkiem szczegółów. intnaprawdę oznacza na przykład „dowolną liczbę całkowitą”.
  2. Należy to interpretować tak, jakby to był prawdziwy program C / C ++.

Interpretacja 1 jest poprawna dla instrukcji problemu 1, o ile silnia przyjmuje wartość 1 dla liczb ujemnych (w przeciwnym razie moglibyśmy zmodyfikować instrukcję problemu, aby ograniczyć domenę lub algorytm, aby uwzględnić pożądane zachowanie). Interpretacja 2 jest poprawna dla opisu problemu 2, z tym samym zastrzeżeniem.

arrayarraynn>0n!< INT_MAXn!n<0

nn!232n!264

kknknk+n

Patrick87
źródło
Sądzę, że koncepcja algorytmu wykracza nieco poza ograniczenia wielkości słów w komputerze. Wydaje mi się, że po prostu unikasz problemu.
babou
1

Algorytm to program napisany w języku Turing-complete że provably zatrzymanie na wszystkich ważnych komponentów. Wszystkie standardowe języki programowania są kompletne. Słowo to wywodzi się z europejskiego tłumaczenia imienia al-Khwārizmī, perskiego matematyka, astronoma i geografa, którego prace opierały się na dziele hinduskiego matematyka z VII wieku Brahmagupty, który wprowadził indyjski system liczbowy do świata zachodniego.

Pytanie wydaje się zasadniczo dotyczyć tego, czy tabele wyszukiwania są częściami algorytmów. Absolutnie! W maszynach Turinga tabele mogą być kodowane w tabeli stanów TM. TM może zainicjować taśmę na podstawie skończonej ilości danych przechowywanych w tabeli przejścia. Jednak „algorytmy”, które nie działają na nieskończonych wejściach, tylko na wejściach skończonych, są „trywialnymi” maszynami o skończonym stanie (FSM) .

vzn
źródło
3
Dlaczego musi być w pełnym języku TUring?
babou
1

W skrócie : Algorytm jest konstruktywną częścią konstruktywnego dowodu, że dany problem ma rozwiązanie. Motywacją dla tej definicji jest izomorfizm Curry-Howarda między programami i dowodami, biorąc pod uwagę, że program ma interes tylko wtedy, gdy rozwiązuje problem, ale możliwe do udowodnienia. Ta definicja pozwala na więcej abstrakcji i pozostawia pewne drzwi otwarte w odniesieniu do rodzaju domen, które mogą dotyczyć, na przykład w odniesieniu do właściwości skończoności.

Ostrzeżenie . Próbuję znaleźć odpowiednie formalne podejście do odpowiedzi na pytanie. Myślę, że jest to konieczne, ale wydaje się, że żaden z użytkowników, którzy do tej pory odpowiedzieli (w tym ja, a niektórzy byli mniej lub bardziej wyraźnie na ten temat w innych postach), nie ma odpowiedniego tła do prawidłowego opracowania problemów związanych z konstruktywna matematyka, teoria dowodów, teoria typów i takie wyniki, jak izomorfizm Curry-Howarda między dowodami a programami. Robię, co w mojej mocy, tutaj, z wszelkimi fragmentami wiedzy, które posiadam (jak sądzę), i jestem zbyt świadomy ograniczeń tej odpowiedzi. Mam tylko nadzieję, że dam kilka wskazówek, jak według mnie powinna wyglądać odpowiedź. Jeśli zauważysz jakikolwiek punkt, który jest wyraźnie niewłaściwy formalnie (możliwe do udowodnienia), proszę pozwolić mi teraz w komentarzu - lub przez e-mail.

Określanie niektórych problemów

Standardowym sposobem rozważenia algorytmu jest stwierdzenie, że algorytm jest dowolnym, ściśle określonym programem dla niektórych urządzeń komputerowych , w tym również tych, które nie mają żadnych ograniczeń pamięci. Językiem może być również język maszynowy. W rzeczywistości wystarczy rozważyć wszystkie programy dla kompletnego urządzenia komputerowego Turinga (co oznacza brak ograniczeń pamięci). Może nie dać ci wszystkich prezentacji algorytmów, w tym sensie, że algorytmy muszą być wyrażone w formie zależnej w szczegółach od kontekstu interpretacyjnego, nawet teoretycznego, ponieważ wszystko jest zdefiniowane do pewnego kodowania. Ale ponieważ obliczy wszystko, co należy obliczyć, obejmie jakoś wszystkie algorytmy, aż do kodowania.

π

π, prawdopodobnie w sensie matematycznym prawie wszystkich. Wymagałoby to jednak większej precyzji w definicjach.

Prawdziwe pytanie brzmi więc, jakie są sensowne algorytmy. Odpowiedź jest taka, że ​​znaczącymi algorytmami są te, które rozwiązują problem, obliczając krok po kroku „rozwiązanie”, „odpowiedź” na ten problem. Algorytm jest interesujący, jeśli jest powiązany z problemem, który rozwiązuje.

Biorąc pod uwagę formalny problem, jak uzyskać algorytm, który rozwiązuje problem. Algorytmy są jawne lub niejawne związane z ideą rozwiązania problemu, co można udowodnić. To, czy nasze techniki dowodowe są dokładne, to inna sprawa, ale staramy się przynajmniej przekonać samych siebie. Jeśli ograniczysz się do matematyki konstruktywnej, co jest właściwie tym, co musimy zrobić (i jest to bardzo akceptowalne ograniczenie aksomatyczne dla większości matematyki), sposobem udowodnienia istnienia rozwiązania jest przejście przez etapy sprawdzające, które faktycznie wykazują konstrukcję który reprezentuje rozwiązanie, w tym ewentualnie inne kroki, które potwierdzają jego poprawność.

Wszyscy programiści myślą coś w stylu: jeśli majstruję przy danych w taki i taki sposób, to otrzymuję ten widget, który ma właściwe właściwości ze względu na twierdzenie Sezamu, i przeprowadzając tę ​​transformację zachowującą foo, otrzymuję pożądaną odpowiedź . Ale dowód jest zwykle nieformalny i nie opracowujemy wszystkich szczegółów, co tłumaczy, dlaczego satelita próbował między innymi okrążyć Marsa pod ziemią (między innymi). Rozważamy większość argumentacji, ale w rzeczywistości zachowujemy tylko konstruktywną część, która buduje rozwiązanie, i opisujemy to w języku komputerowym jako algorytm, który rozwiązuje problem.

Interesujące algorytmy (lub programy)

Wszystko to miało na celu wprowadzenie następujących pomysłów, które są przedmiotem wielu aktualnych badań (których nie jestem specjalistą). Pojęcie „ interesującego algorytmu ” stosowane tutaj jest moje, wprowadzone jako nieformalny symbol zastępczy dla dokładniejszych definicji.

Ciekawy algorytm jest konstruktywną częścią konstruktywnego dowodu, że dany problem ma rozwiązanie . Oznacza to, że dowód musi faktycznie wykazywać rozwiązanie, a nie po prostu udowodnić jego istnienie, na przykład przez zaprzeczenie. Aby uzyskać więcej informacji, zobacz Logika intuicyjna i konstruktywizm w matematyce.

Jest to oczywiście bardzo restrykcyjna definicja, która uwzględnia tylko to, co nazwałem interesującymi algorytmami. Dlatego ignoruje prawie wszystkie z nich. Ale podobnie robią wszystkie nasze podręczniki na temat algorytmu. Próbują uczyć tylko niektórych interesujących.

Biorąc pod uwagę wszystkie parametry problemu (dane wejściowe), krok po kroku informuje, jak uzyskać określony wynik. Typowym przykładem jest rozdzielczość równań ( algorytm nazwy faktycznie pochodzi od imienia perskiego matematyka Muhammada ibna Muszy al-Khwārizmiego , który badał rozdzielczość niektórych równań). Części dowodu służą do ustalenia, że ​​niektóre wartości obliczone w algorytmie mają pewne właściwości, ale te części nie muszą być przechowywane w samym algorytmie.

Oczywiście musi się to odbywać w ramach sformalizowanej ramy logicznej, która określa, z czym są obliczane dane, jakie są dozwolone podstawowe kroki obliczeniowe i jakie są używane aksjomaty.

Wracając do silnego przykładu, można go interpretować jako algorytm, choć trywialny. Normalna funkcja silnia odpowiada dowodowi, że biorąc pod uwagę pewną strukturę arytmetyczną i liczbę całkowitą n, istnieje liczba, która jest iloczynem pierwszych n liczb całkowitych. Jest to dość proste, podobnie jak obliczenia czynnikowe. Może być bardziej złożony w przypadku innych funkcji.

Teraz, jeśli zdecydujesz się na zestawienie silni, zakładając, że możesz, co nie jest prawdą dla wszystkich liczb całkowitych (ale może być prawdą dla niektórych skończonych domen wartości), wszystko, co robisz, to uwzględnienie w swoich aksjomatach istnienia silni przez zdefiniowanie za pomocą nowy aksjomat jego wartość dla każdej liczby całkowitej, abyś już nie musiał niczego udowadniać (a więc obliczać).

Ale system aksjomatów ma być skończony (lub przynajmniej skończony). I istnieje nieskończona liczba wartości dla silni, jedna na liczbę całkowitą. Masz więc problem z skończonym systemem aksjomatów, jeśli aksjatyzujesz funkcję nieskończoną, tj. Zdefiniowaną w domenie nieskończonej. Przekłada się to obliczeniowo na fakt, że twoje przyszłe wyszukiwanie tabeli nie może być zaimplementowane dla wszystkich liczb całkowitych. To zabiłoby zwykły wymóg skończoności dla algorytmów (ale czy ma być tak rygorystyczny, jak często jest przedstawiany?).

Możesz zdecydować się na zdefiniowany generator aksjomatów do obsługi wszystkich przypadków. Oznaczałoby to mniej więcej włączenie standardowego programu silniakowego do algorytmu w celu zainicjowania tablicy w razie potrzeby. Nazywa się to zapamiętywaniem przez programistów. Jest to faktycznie najbliższy odpowiednik wstępnie obliczonej tabeli. Można zrozumieć, że ma wstępnie obliczoną tabelę, z wyjątkiem faktu, że tabela jest faktycznie tworzona w leniwym trybie oceny , gdy jest to potrzebne. Ta dyskusja prawdopodobnie wymagałaby nieco bardziej formalnej opieki.

Możesz zdefiniować swoje prymitywne operacje według własnego uznania (w ramach zgodności z formalnym systemem) i przypisać im dowolne koszty wybrane podczas korzystania z algorytmu, aby przeprowadzić analizę złożoności lub wydajności. Ale jeśli konkretne systemy, które faktycznie implementują twój algorytm (na przykład komputer lub mózg) nie są w stanie spełnić tych specyfikacji kosztów, twoja analiza może być interesująca intelektualnie, ale jest bezwartościowa do rzeczywistego wykorzystania w prawdziwym świecie.

21000

Jakie programy są interesujące

Ta dyskusja powinna być lepiej powiązana z wynikami, takimi jak izomorfizm Curry-Howarda między programami i dowód. Jeśli jakikolwiek program jest faktycznie dowodem czegoś, każdy program może być interpretowany jako interesujący program w rozumieniu powyższej definicji.

Jednak, według mojego (ograniczonego) zrozumienia, ten izomorfizm jest ograniczony do programów, które można dobrze pisać w odpowiednim systemie pisania, gdzie typy odpowiadają twierdzeniom teorii aksjomatycznej. Dlatego nie wszystkie programy można zakwalifikować jako interesujące programy. Domyślam się, że w tym sensie algorytm powinien rozwiązać problem.

Prawdopodobnie wyklucza to większość „losowo generowanych” programów.

Jest to również nieco otwarta definicja „interesującego algorytmu”. Każdy program, który można uznać za interesujący, jest zdecydowanie taki, ponieważ istnieje zidentyfikowany system typów, który sprawia, że ​​jest interesujący. Ale program, który do tej pory nie był dostępny do pisania, może stać się do pisania z bardziej zaawansowanym systemem typów, a tym samym stać się interesujący. Mówiąc dokładniej, zawsze było to interesujące, ale z powodu braku wiedzy na temat właściwego systemu typów nie mogliśmy go poznać.

Wiadomo jednak, że nie wszystkie programy można pisać, ponieważ wiadomo, że niektóre wyrażenia lambda, takie jak implementacja kombinatora Y , nie mogą zostać wpisane w systemie typu dźwięku .

Ten widok dotyczy tylko formalności programistycznych, które można bezpośrednio powiązać z jakimś systemem dowodu aksjomatycznego. Nie wiem, jak można ją rozszerzyć na formalizacje obliczeniowe niskiego poziomu, takie jak Maszyna Turinga. Ponieważ jednak algorytm i obliczalność to często gra polegająca na kodowaniu problemów i rozwiązań (pomyśl o arytmetyki zakodowanej w rachunku lambda ), można wziąć pod uwagę, że każde formalnie zdefiniowane obliczenie, które można przedstawić jako kodowanie algorytmu, jest również algorytmem. Takie kodowania prawdopodobnie wykorzystują tylko bardzo niewielką część tego, co można wyrazić w formalizmie niskiego poziomu, takim jak Maszyny Turinga.

Jednym z zainteresowań tego podejścia jest to, że daje ono pojęcie algorytmu, które jest bardziej abstrakcyjne i niezależne od kwestii faktycznego kodowania, „fizycznej reprezentacji” dziedziny obliczeniowej. Można więc na przykład rozważyć domeny z nieskończonymi obiektami, o ile istnieje obliczeniowy sposób ich użycia.

Babou
źródło
2
Nie jest to łatwe spojrzenie na ten problem, choć jest ono fundamentalne. Musiałem uprościć oburzenie i mogłem popełnić błędy. Ale jeśli chcesz głosować, powiedz mi dlaczego.
babou
Tak, nie jestem pewien, co jest z ocenami negatywnymi.
Pseudonim
@Pseudonim W moim przypadku. Myślę, że wiem. Podejrzewa, że ​​jest to stara bitwa między semantystami i algorytmami, zwłaszcza tymi, którzy pracują nad obliczalnością. To jest bitwa między filozofią a biznesem, czym jest i ile kosztuje. Interesują mnie algorytmy, które są „znaczące”. Zmodyfikowałem odpowiednio (ale jestem na krawędzi mojej wiedzy, która wydaje się wciąż lepsza niż większość). Możesz cierpieć z powodu tej samej gettoizacji. - - - Jednak. jasne jest, że w tym subtelnym temacie każdy, kogo opinia jest warta pół centa, nie marzyłby o przegłosowaniu bez odpowiedniego wyjaśnienia.
babou
Po przeczytaniu zarówno pytania, jak i twojej odpowiedzi, kusi mnie, aby głosować za nim, ponieważ nie koncentruje się on wystarczająco na rzeczywistym pytaniu i zawiera zbyt wiele niedokończonych myśli. Ponadto nie sądzę, że „rozwiązanie problemu” jest brakującą częścią definicji algorytmu. Zgadzam się jednak, że „semantyka” nie powinna być ignorowana w definicji algorytmu.
Thomas Klimpel
@ThomasKlimpel Jak powiedziałem, nie jestem wystarczająco ekspertem w prawdziwych sprawach. I dodałem, że nie ma innej odpowiedzi. Tworzenie algorytmów to nie to samo, co rozumienie ich. Świadomość mojej ograniczonej wiedzy, której ukrywanie byłoby nienaukowe, jest źródłem uczucia niedokończonych myśli. Wydaje się, że lepiej jest podkreślić istnienie problemu, niż je zignorować. Odniosłem się do każdego przykładu, bardziej z punktu widzenia semantyki niż algorytmu, ponieważ pytanie to jest pytaniem semantycznym („Co to jest…?”). Czy uważasz, że inne odpowiedzi przynoszą jakiekolwiek formalne zrozumienie. Por. Moje komentarze
babou,
0

W chwili pisania nie ma dobrej formalnej definicji „algorytmu”. Jednak pracują nad tym mądrzy ludzie.

Wiemy, że czymkolwiek jest „algorytm”, znajduje się gdzieś pomiędzy „funkcją matematyczną” a „programem komputerowym”.

Funkcja matematyczna to formalne pojęcie odwzorowania od danych wejściowych do wyników. Na przykład „sort” to odwzorowanie między sekwencją uporządkowanych elementów a sekwencją uporządkowanych elementów tego samego typu, która odwzorowuje każdą sekwencję na jej uporządkowaną sekwencję. Ta funkcja może być zaimplementowana przy użyciu różnych algorytmów (np. Sortowanie według scalania, sortowanie na stosie). Każdy algorytm z kolei można zaimplementować przy użyciu różnych programów (nawet w tym samym języku programowania).

Najlepszym sposobem, w jaki rozumiemy, czym jest „algorytm”, jest to, że jest to pewnego rodzaju klasa równoważności w programach, gdzie dwa programy są równoważne, jeśli robią „zasadniczo to samo”. Wszelkie dwa programy, które implementują ten sam algorytm, muszą obliczać tę samą funkcję, ale odwrotność nie jest prawdą.

Podobnie istnieje klasa równoważności między algorytmami, gdzie dwa algorytmy są równoważne, jeśli obliczają tę samą funkcję matematyczną.

Trudność w tym wszystkim polega na uchwyceniu tego, co rozumiemy przez „zasadniczo to samo”.

Jest kilka oczywistych rzeczy, które powinniśmy uwzględnić. Na przykład dwa programy są zasadniczo takie same, jeśli różnią się tylko zmiennymi nazwami. Większość modeli języków programowania ma natywne pojęcia „równoważności” (np. Redukcja beta i konwersja eta w rachunku lambda), dlatego też powinniśmy je wrzucić.

Niezależnie od wybranej przez nas relacji równoważności daje nam to pewną strukturę. Algorytmy tworzą kategorię, ponieważ są kategorią ilorazową programów. Niektóre interesujące równoważne relacje powodują powstanie interesujących struktur kategorycznych; na przykład kategoria pierwotnych algorytmów rekurencyjnych jest uniwersalnym obiektem w kategorii kategorii. Ilekroć zobaczysz taką interesującą strukturę, wiesz, że ta linia pytań prawdopodobnie będzie przydatna.

Pseudonim
źródło
1
Nie sądzę, aby można było powiedzieć, że nie ma dobrej formalnej definicji algorytmu. Tak było około 100 lat temu.
Juho
1
@Juho Może być tak, że Pseudonim sprawia, że ​​brzmi on zbyt mocno, chociaż stara się złagodzić to stwierdzenie, dodając w szczególności, że sytuacja robi postępy. Myślę jednak, że ma rację w swojej ocenie. Reaguję późno, ponieważ spędziłem nad tym dużo czasu i czuję się prawie tak samo. Ludzie znacznie poprawili swoje zrozumienie, ale cała dyskusja pokazuje, że nie ma prawdziwego konsensusu ... i większość moich wkładów była bardzo niedojrzała, biorąc pod uwagę poziom zaangażowanych osób. Jeśli jest niesprawiedliwy, jak myślisz, kto podał dobrą formalną definicję?
babou
Masz 100% racji. I myślę, że gdyby Turing był żywy lub jakikolwiek inny teoretyk teorii złożoności, w 100% by się z tobą zgodził. Naukowcy muszą porzucić troglodytyzm. To faktycznie przeszkadza w polu. W końcu stanie się tak, gdy tylko umrą. Dzięki Bogu za to.
EnjoysMath
-4

Twoje pytanie i opis nie odnoszą się tak bardzo. Algorytm jest teoretyczny i nie dotyczy żadnego języka programowania. Algorytm to zestaw reguł lub kroków (procedur) mających na celu rozwiązanie problemu. Twój problem można rozwiązać na wiele sposobów lub za pomocą wielu algorytmów.

Twoje drugie rozwiązanie oznacza najpierw obliczenie dużej liczby silni, które początkowo zajmą dużo czasu, a następnie je zapiszą. Zużyje więcej pamięci, ale ostatecznie będzie szybszy, podczas gdy pierwszy nie zużywa pamięci, ale zużywa moc obliczeniową, więc będziesz musiał wybrać w zależności od środowiska.

Elgert
źródło
Tak, absolutnie nie ma związku. Przełomowe rzeczy.
EnjoysMath