Jak działa wyszukiwanie według nowości?

16

W tym artykule autor twierdzi, że kierowanie ewolucją samą nowością (bez wyraźnych celów) może rozwiązać problemy nawet lepiej niż stosowanie wyraźnych celów. Innymi słowy, zastosowanie nowatorskiej miary jako funkcji sprawności dla algorytmu genetycznego działa lepiej niż funkcja sprawności zorientowana na cel. Jak to możliwe?

rcpinto
źródło

Odpowiedzi:

7

Jak wyjaśniono w odpowiedzi na to pytanie AI SE , GA są raczej „satifikatorami” niż „optymalizatorami” i zwykle nie badają „odległych” regionów przestrzeni wyszukiwania. Przeciwnie, populacja ma tendencję do skupiania się w regionach, które są „dość dobre” zgodnie z funkcją fitness.

Przeciwnie, uważam, że myślenie polega na tym, że nowość zapewnia rodzaj dynamicznej sprawności, która ma tendencję do odsuwania populacji od wcześniej odkrytych obszarów.

NietzscheanAI
źródło
6

Wyszukiwanie nowości wybiera „nowe zachowanie” według niektórych zależnych od domeny definicji nowości. Na przykład nowością w dziedzinie rozwiązywania labiryntów może być „różnica badanej trasy”. W końcu zostaną znalezione sieci, które podążają każdą możliwą trasą przez labirynt, a następnie możesz wybrać najszybszą. Działałoby to znacznie lepiej niż naiwny „cel”, taki jak odległość do celu, co z łatwością mogłoby doprowadzić do lokalnych optymów, które nigdy nie rozwiązują labiryntu.

Od porzucenia celów: ewolucja poprzez poszukiwanie nowości (moje podkreślenie):

W wyszukiwaniu nowości zamiast mierzyć ogólny postęp za pomocą tradycyjnej funkcji celu, ewolucja wykorzystuje miarę nowości behawioralnej zwaną miarą nowości. W efekcie poszukiwanie oparte na takiej metodzie wyraźnie wykonuje to, co ewolucja naturalna robi biernie, tzn. Stopniowo gromadzi nowe formy, które wznoszą się po drabinie złożoności.
Na przykład w dwunożnej domenie ruchu pierwsze próby mogą po prostu upaść. Metryka nowości nagradzałaby po prostu upadek w inny sposób, niezależnie od tego, czy jest bliższa obiektywnemu zachowaniu, czy nie. W przeciwieństwie do tego funkcja celu może wyraźnie nagradzać upadek najdalszego, co prawdopodobnie nie prowadzi do ostatecznego celu chodzenia, a tym samym jest przykładem zwodniczego lokalnego optimum. Natomiast w poszukiwaniu nowości zachowuje się zbiór przykładów reprezentujących najbardziej nowatorskie odkrycia. Dalsze wyszukiwanie następnie wyskakuje z tych reprezentatywnych zachowań. Po odkryciu kilku sposobów upadku, jedynym sposobem na nagrodzenie jest znalezienie zachowania, które nie spada od razu . W ten sposób złożoność behawioralna wzrasta od podstaw do góry.W końcu, aby zrobić coś nowego, dwunożny musiałby z powodzeniem przejść pewną odległość, nawet jeśli nie jest to celem .

micimize
źródło