DeepMind twierdzi, że ich głęboka sieć Q (DQN) była w stanie stale dostosowywać swoje zachowanie podczas nauki gry w 49 gier Atari.
Po nauczeniu się wszystkich gier z tą samą siecią neuronową agent był w stanie grać wszystkie jednocześnie na „nadludzkich” poziomach (ilekroć był losowo prezentowany w jednej z gier), czy też może być dobry tylko w jednej grze na raz, ponieważ zmiana wymagało ponownego uczenia się?
Odpowiedzi:
Przełączanie wymagało ponownego uczenia się.
Pamiętaj również, że :
i
źródło
Przełączanie wymaga ponownego uczenia się, sieć nie miała jednego zestawu wag, które pozwoliłyby jej dobrze grać we wszystkie gry. Wynika to z katastrofalnego problemu zapominania.
Jednak ostatnie prace zostały wykonane w celu rozwiązania tego problemu:
„Przezwyciężanie katastrofalnego zapominania w sieciach neuronowych”, 2016
Papier: https://arxiv.org/pdf/1612.00796v1.pdf
źródło