Od jakiegoś czasu staram się zrozumieć uczenie się o wzmocnieniu, ale jakoś nie jestem w stanie wyobrazić sobie, jak napisać program do nauki o wzmocnieniu, aby rozwiązać problem związany ze światem sieci. Czy możesz zasugerować mi kilka podręczników, które pomogłyby mi zbudować jasną koncepcję uczenia się przez wzmocnienie?
machine-learning
books
reinforcement-learning
dziewczyna 101
źródło
źródło
Odpowiedzi:
Oto kilka dobrych referencji na temat nauki zbrojenia:
Klasyczny
Sutton RS, Barto AG. Uczenie się przez zbrojenie: wprowadzenie. Cambridge, Mass: A Bradford Book; 1998. 322 s.
Szkic drugiej edycji jest dostępny za darmo: http://incompleteideas.net/book/the-book-2nd.html
Russell / Norvig Rozdział 21:
Russell SJ, Norvig P, Davis E. Sztuczna inteligencja: nowoczesne podejście. Upper Saddle River, NJ: Prentice Hall; 2010 r.
Bardziej techniczny
Szepesvári C. Algorytmy uczenia wzmacniającego. Wykłady syntetyczne na temat sztucznej inteligencji i uczenia maszynowego. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html
Bertsekas DP. Programowanie dynamiczne i optymalna kontrola. 4. edycja Belmont, Mass .: Athena Scientific; 2007. 1270 s. Rozdział 6, tom 2 jest dostępny za darmo: http://web.mit.edu/dimitrib/www/dpchapter.pdf
Aby uzyskać najnowsze zmiany
Wiering M., van Otterlo M., redaktorzy. Nauka wzmocnienia. Berlin, Heidelberg: Springer Berlin Heidelberg; 2012 Dostępne od: http://link.springer.com/10.1007/978-3-642-27645-3
Kochenderfer MJ, Amato C, Chowdhary G., How JP, Reynolds HJD, Thornton JR, i in. Podejmowanie decyzji w warunkach niepewności: teoria i zastosowanie. 1 edycja. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.
Uczenie się przez wiele agentów
Buşoniu L, Babuška R, Schutter BD. Nauka wzmocnienia przez wielu agentów: przegląd. W: Srinivasan D, Jain LC, redaktorzy. Innowacje w systemach i aplikacjach wieloagentowych - 1. Springer Berlin Heidelberg; 2010 s. 183–221. Dostępne na: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7
Schwartz HM. Uczenie maszynowe z wieloma agentami: podejście wzmacniające. Hoboken, New Jersey: Wiley; 2014.
Wideo / Kursy
Proponuję również kurs Davida Silvera w YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa
źródło
Istnieje bezpłatny kurs online na temat nauki zbrojenia przez Udacity. Sprawdź: uczenie maszynowe: uczenie się zbrojenia
źródło
Naprawdę podobała mi się Reinforcement Leraning: Wprowadzenie Richarda Suttona. Zapewnia bardzo ładny widok ujednolicający RL, chociaż nie wspomina o najnowszych podejściach (pochodzi z 1998 r.).
źródło
Możesz zapoznać się z moją książką - Hands-On Reinforcement Learning with Python, która wyjaśnia uczenie się od podstaw od zaawansowanego algorytmu uczenia się głębokiego wzmocnienia.
Cały kod wraz z objaśnieniem jest już dostępny w moim repozytorium github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python
źródło