Pytania oznaczone «alphazero»

29
Zrozumienie AlphaZero

Niedawno pojawiła się wiadomość, że zespół badawczy DeepMind firmy Alphabet rozszerzył swój silnik uczenia maszynowego o grę w Shogi i szachy. Najwyraźniej po zaledwie kilku godzinach samodzielnego uczenia się, co oznacza, że ​​gra się przeciwko sobie, biorąc pod uwagę zasady gry, jego wydajność w...

12
Jak AlphaZero uczy się oceniać pozycję, której nigdy nie widział?

W następstwie odpowiedzi na: Zrozumienie AlphaZero Moje pytanie brzmi: w jaki sposób sieć neuronowa „uczy się”, co robić w pozycji, z którą się nie spotkała. Powiedzenie, że rzeczywisty AZ wykonuje MCTS za pomocą obciążników + obciążenia z wyuczonej sieci neuronowej, po prostu przesuwa go o krok...