深度强化学习 - 专题

投稿

深度强化学习

收录了19篇文章 · 23人关注

深度强化学习算法总结
学习 Deep Reinforcement Learning 的过程中，通过阅读经典算法的论文，并在 Pytorch 上实现这些算法，项目在 G...

过去_未来 0 1
如何求强化学习最优解
在一篇文章强化学习与马尔可夫决策中，介绍了使用马尔可夫决策过程对强化学习的过程进行建模。通过建模可以得出，只要求解最优价值函数，即可得到对应的最...

bdqfork 0 0

基于Value的强化学习算法
在文章强化学习与马尔可夫决策中，介绍了使用马尔可夫决策模型对强化学习的过程进行建模，本篇文章将介绍基于这一模型而引出的一些强化学习的经典算法。 ...

bdqfork 0 0
基于Policy的强化学习算法
在文章基于Value的强化学习算法中，介绍了Q-learning和SARSA两种经典的强化学习算法。在本篇文章中，将介绍一下基于Policy的经...

bdqfork 0 0
强化学习与马尔可夫决策
在上一篇文章强化学习的基本概念中，用大白话介绍了强化学习的一些基本概念，尤其是强化学习的基本过程。在了解了强化学习的基本概念之后，在本篇文章...

0.1 bdqfork 0 1
强化学习的基本概念
强化学习是机器学习领域的一个分支，通过不断的与环境交互，不断的积累经验，最后让Agent学会如何在目标环境中取得最高的得分。在本篇文章中，笔者将...

0.2 bdqfork 0 2
增强模型的探索能力-强化学习NoisyNet原理及实现！
增加Agent的探索能力是强化学习中经常遇到的问题，一种常用的方法是采用e-greedy的策略，即以e的概率采取随机的动作，以1-e的概率采取当...

0.3 文哥的学习日记 3 7

深度强化学习（二）：基本原理与结构
一、组成与结构 1.1、基本概念强化学习通常使用马尔可夫决策过程（Markov Decision Process,MDP）来描述，具体而言：机...

0.4 fromeast 0 7
深度强化学习（三）：从Q-Learning到DQN
一、无模型的强化学习在上一节中介绍了基于模型的强化学习方法(动态规划)，其中的前提是知道环境的状态转移概率，但在实际问题中，状态转移的信息往往...

1.1 fromeast 3 19
深度强化学习（四）：DQN的拓展和改进
一、预备工具 1.1、Gym Gym是OpenAI开发的通用强化学习算法测试平台，集成了众多仿真实验环境，开发者可以直接调用写好的环境，而不必考...

0.7 fromeast 0 10