Książki o uczeniu się przez zbrojenie

10

Od jakiegoś czasu staram się zrozumieć uczenie się o wzmocnieniu, ale jakoś nie jestem w stanie wyobrazić sobie, jak napisać program do nauki o wzmocnieniu, aby rozwiązać problem związany ze światem sieci. Czy możesz zasugerować mi kilka podręczników, które pomogłyby mi zbudować jasną koncepcję uczenia się przez wzmocnienie?

dziewczyna 101
źródło
Proszę odnieść się do openai również jego dobre miejsce do nauki Wzmocnienie Nauka od pythona w zasadzie
Vineet Kothari

Odpowiedzi:

7

Oto kilka dobrych referencji na temat nauki zbrojenia:

Klasyczny

Sutton RS, Barto AG. Uczenie się przez zbrojenie: wprowadzenie. Cambridge, Mass: A Bradford Book; 1998. 322 s.

Szkic drugiej edycji jest dostępny za darmo: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Rozdział 21:

Russell SJ, Norvig P, Davis E. Sztuczna inteligencja: nowoczesne podejście. Upper Saddle River, NJ: Prentice Hall; 2010 r.

Bardziej techniczny

Szepesvári C. Algorytmy uczenia wzmacniającego. Wykłady syntetyczne na temat sztucznej inteligencji i uczenia maszynowego. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programowanie dynamiczne i optymalna kontrola. 4. edycja Belmont, Mass .: Athena Scientific; 2007. 1270 s. Rozdział 6, tom 2 jest dostępny za darmo: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Aby uzyskać najnowsze zmiany

Wiering M., van Otterlo M., redaktorzy. Nauka wzmocnienia. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Dostępne od: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G., How JP, Reynolds HJD, Thornton JR, i in. Podejmowanie decyzji w warunkach niepewności: teoria i zastosowanie. 1 edycja. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Uczenie się przez wiele agentów

Buşoniu L, Babuška R, Schutter BD. Nauka wzmocnienia przez wielu agentów: przegląd. W: Srinivasan D, Jain LC, redaktorzy. Innowacje w systemach i aplikacjach wieloagentowych - 1. Springer Berlin Heidelberg; 2010 s. 183–221. Dostępne na: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Uczenie maszynowe z wieloma agentami: podejście wzmacniające. Hoboken, New Jersey: Wiley; 2014.

Wideo / Kursy

Proponuję również kurs Davida Silvera w YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

Juan Leni
źródło
7

Istnieje bezpłatny kurs online na temat nauki zbrojenia przez Udacity. Sprawdź: uczenie maszynowe: uczenie się zbrojenia

Sreejithc321
źródło
Warto wspomnieć, że problem światowego gridu jest prezentowany jako część tego kursu.
Neil Slater,
tak, widziałem to, ale niewystarczająco, aby zakodować to samo
girl101
4

Naprawdę podobała mi się Reinforcement Leraning: Wprowadzenie Richarda Suttona. Zapewnia bardzo ładny widok ujednolicający RL, chociaż nie wspomina o najnowszych podejściach (pochodzi z 1998 r.).

Martin Modrák
źródło
tak naprawdę chciałem zobaczyć problem ze światem siatki, który byłby rozwiązywany przez obliczenia na papierze i długopisie, ponieważ pomogłoby mi to zrozumieć pojęcie, chyba że rozumiem pojęcie, którego nie mogę kodować (szczególnie cenię iterację)
dziewczyna101