AI: Uczenie się a strategia

16

Mam teorię na temat AI, o której chciałbym napisać „białą księgę”. Różnicą, którą chcę zbadać w AI, jest uczenie się vs. strategowanie. Moje pytanie brzmi: gdzie mogę przeczytać inne materiały na ten temat?

Podam przykład szachowy. Spójrzmy na szachową sztuczną inteligencję jako maksymalne drzewo, w którym schwytanie wrogiej jednostki dodaje wartość tej jednostki do „wyniku ruchu” dla tej decyzji (podobnie utrata elementu odejmuje tę wartość do wyniku). Zdobycie pionka może przynieść 1 punkt, rycerza 4 punkty, wieża 5 punktów itp.

Strategią byłoby AI, aby zastosować te punkty i określić następny ruch; na przykład. biorąc pod uwagę dziesięć możliwych ruchów, wybierz najlepszy (maksymalny wynik) na końcu trzech ruchów.

Nauka polegałaby na stosowaniu obserwacji statystycznych w celu ustalenia tych wartości. Jeśli zagrasz w 100 gier, AI może zdecydować, że zdobycie pionka wynosi 2 punkty, a rycerz jest wart 7 punktów, a wieża jest warta tylko 3 punkty (na podstawie 100 rozgrywek).

Czy to rozróżnienie istnieje już w literaturze, a jeśli tak, to gdzie mogę o nim przeczytać ?

Edycja: Czy ktoś zna grę w szachy (najlepiej z kodem źródłowym), która wykorzystuje to podejście? Może Chess960 @ Home ?

ashes999
źródło
3
Brzmi jak mieszanka teorii gier z „punktami” dostosowanymi do uczenia się opartego na epoce.
spowolnił

Odpowiedzi:

15

To, co nazywasz strategią, zwykle nazywa się wyszukiwaniem w społeczności AI. Obejmuje proste algorytmy, takie jak A * i DFS , oraz metody projektowania heurystycznego dla świadomych wyszukiwań, takich jak A *.

To, co nazywasz uczenie nazywa się uczenie maszynowe , tradycyjnie podzielona na nadzorowanego uczenia się , bez nadzoru uczenia się i uczenia zbrojenia . Prawdopodobnie najważniejszymi obszarami gier są programowanie genetyczne , sieci neuronowe i obsługujące maszyny wektorowe oraz sieci bayesowskie . Ale uczenie maszynowe to ogromna dziedzina i jest to tylko niewielki zestaw narzędzi, które studiuje.

Jeśli naprawdę interesują Cię różne rodzaje sztucznej inteligencji, polecam zakup prawdziwego podręcznika, takiego jak AI: Nowoczesne podejście zamiast czytania Wikipedii.


źródło
1
+1 za nowoczesne podejście. Świetna książka. Chociaż nie zgadzam się z użytecznością sieci neuronowych jako takich w grach (pasek Czarno-Biały).
Ray Dey,
Nie powiedziałem, że są przydatne, po prostu ważne. Zostały one wykorzystane w kilku grach, a wiele technik AI opiera się na nich lub w porównaniu z nimi. W przeciwieństwie do, powiedzmy, technik klastrowania danych, których używam niezwykle często, ale nie sądzę, że widziałem coś bardziej skomplikowanego niż wariacje k-średnich w grach.
To w porządku, zgadzam się, że są to najbardziej odpowiednie obszary do gier, po prostu potrzebują trochę pracy;)
Ray Dey
Istnieje trzecie podejście (również „strategiczne”) o nazwie Expert Systems, w którym w zasadzie znajduje się algorytm oparty na regułach, który może nie wymagać wcale drzew wyszukiwania, a właściwie serię „jeśli-to”.
Ian Schreiber
1
@Ian: Znam systemy ekspertowe, ale nie są to serie „jeśli-to”. W rzeczywistości nowoczesne systemy eksperckie są wdrażane za pomocą narzędzi, które opisałem powyżej - można wykorzystać uczenie maszynowe, aby ocenić możliwe reguły wnioskowania, lub przeszukać je, używając tych reguł do przodu lub wstecz. Być może myślisz o drzewach decyzyjnych, ale nawet one są często tworzone i modyfikowane przez uczenie maszynowe i eksplorują wiele ścieżek za pomocą wyszukiwania.
1

Zdecydowanie powinieneś przeczytać AI o nowoczesnym podejściu . Książka jest trochę droga, ale nie możesz poważnie dyskutować o sztucznej inteligencji, dopóki nie zaczniesz trochę pracy. Również druga edycja jest tak dobra jak trzecia, więc jeśli znajdziesz tańszą drugą edycję, weź ją.

Jeśli naprawdę chcesz zająć się uczeniem maszynowym, książka Dr. Mitchella ma wiele informacji na temat ruchu.

Szkoda, że ​​istnieje tak duża bariera wejścia na naukowców AI. Ale to nie pomoże tobie ani nikomu innemu, jeśli opublikujesz białą księgę, która używa unikalnego (złego) słownictwa i omawia techniki już dobrze znane w środowisku akademickim.

Na polu uczenia się zachowania przeciwnika w celu poprawy własnego ma kilka ważnych pozycji. Dobre filtry spamu właśnie to robią. Powinieneś zajrzeć do Paper Rock Scissors AI. Tym, co czyni PRS wyjątkowym, jest to, że jest on prosty i nie wymaga wyszukiwania (strategia AKA). Jedynym sposobem, w jaki AI może pokonać człowieka, jest poznanie jego preferencji i ich wykorzystanie.

Sprawdź tego bota PRS AI zbudowanego przez NYTimes.

deft_code
źródło
Fajnie, ale nie to, czego szukam. Odpowiedź Joe Wreschniga jest zasadniczo tym, czego chcę - terminologią tego, o co chcę badać / pisać. Poza tym nie jestem wielka w terminologii i badaniach teoretycznych; Wolę napisać bibliotekę wielokrotnego użytku i rozpowszechniać ją, aby ludzie mogli z niej korzystać.
ashes999