用一个泛化的强化学习算法掌握国际象棋和日本象棋 摘要: 国际象棋游戏在人工智能的历史中是最广泛研究的领域。最强的程序都基于复杂的搜索技术,特定领...

收录了1篇文章 · 2人关注
用一个泛化的强化学习算法掌握国际象棋和日本象棋 摘要: 国际象棋游戏在人工智能的历史中是最广泛研究的领域。最强的程序都基于复杂的搜索技术,特定领...
专题公告
一起做个agent,不仅要exploit更要explore知识的海洋,不断更新自己的state,从环境中获得reward,学习最好的policy,做出你最优的action!当然,不要忘记随时更新你的replay buffer哦~