Pytania oznaczone «reinforcement-learning»

Zestaw dynamicznych strategii, dzięki którym algorytm może poznać strukturę środowiska online poprzez adaptacyjne podejmowanie działań związanych z różnymi nagrodami, tak aby zmaksymalizować zarobione nagrody.

25
Analiza dziennych szeregów czasowych

Próbuję przeprowadzić analizę szeregów czasowych i jestem nowy w tej dziedzinie. Codziennie liczę wydarzenie z lat 2006-2009 i chcę dopasować do niego model szeregów czasowych. Oto postęp, który poczyniłem: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) Otrzymany...

20
Co to jest cykliczne uczenie się zbrojenia

Ostatnio natknąłem się na słowo „Recurrent Reinforcement Learning”. Rozumiem, czym jest „Recurrent Neur Network” i czym jest „Reinforcement Learning”, ale nie mogłem znaleźć wielu informacji na temat tego, czym jest „Recurrent Reinforcement Learning”. Czy ktoś może mi wyjaśnić, czym jest „uczenie...

19
Kiedy wybrać SARSA vs. Q Learning

SARSA i Q Learning to algorytmy uczenia wzmacniającego, które działają w podobny sposób. Najbardziej uderzającą różnicą jest to, że SARSA jest na polisie, podczas gdy Q Learning jest na polisie. Reguły aktualizacji są następujące: Q

14
GAM vs LOESS vs splajny

Kontekst : Chcę, aby narysować linię na wykresie rozrzutu, że nie pojawia się parametryczne, dlatego używam geom_smooth()w ggplotw R. Automatycznie zwraca geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change...