240 投稿
收录了19篇文章 · 23人关注
  • Resize,w 360,h 240
    深度强化学习算法总结

    学习 Deep Reinforcement Learning 的过程中,通过阅读经典算法的论文,并在 Pytorch 上实现这些算法,项目在 G...

  • 如何求强化学习最优解

    在一篇文章强化学习与马尔可夫决策中,介绍了使用马尔可夫决策过程对强化学习的过程进行建模。通过建模可以得出,只要求解最优价值函数,即可得到对应的最...

  • 基于Value的强化学习算法

    在文章强化学习与马尔可夫决策中,介绍了使用马尔可夫决策模型对强化学习的过程进行建模,本篇文章将介绍基于这一模型而引出的一些强化学习的经典算法。 ...

  • 基于Policy的强化学习算法

    在文章基于Value的强化学习算法中,介绍了Q-learning和SARSA两种经典的强化学习算法。在本篇文章中,将介绍一下基于Policy的经...

  • 强化学习与马尔可夫决策

    在上一篇文章 强化学习的基本概念 中,用大白话介绍了强化学习的一些基本概念,尤其是强化学习的基本过程。在了解了强化学习的基本概念之后,在本篇文章...

    0.1 bdqfork 0 1
  • 强化学习的基本概念

    强化学习是机器学习领域的一个分支,通过不断的与环境交互,不断的积累经验,最后让Agent学会如何在目标环境中取得最高的得分。在本篇文章中,笔者将...

    0.2 bdqfork 0 2
  • 增强模型的探索能力-强化学习NoisyNet原理及实现!

    增加Agent的探索能力是强化学习中经常遇到的问题,一种常用的方法是采用e-greedy的策略,即以e的概率采取随机的动作,以1-e的概率采取当...

  • Resize,w 360,h 240
    深度强化学习(二):基本原理与结构

    一、组成与结构 1.1、基本概念 强化学习通常使用马尔可夫决策过程(Markov Decision Process,MDP)来描述,具体而言:机...

  • Resize,w 360,h 240
    深度强化学习(三):从Q-Learning到DQN

    一、无模型的强化学习 在上一节中介绍了基于模型的强化学习方法(动态规划),其中的前提是知道环境的状态转移概率,但在实际问题中,状态转移的信息往往...

    1.1 fromeast 3 19
  • Resize,w 360,h 240
    深度强化学习(四):DQN的拓展和改进

    一、预备工具 1.1、Gym Gym是OpenAI开发的通用强化学习算法测试平台,集成了众多仿真实验环境,开发者可以直接调用写好的环境,而不必考...

    0.7 fromeast 0 10

专题公告

关注深度强化学习方面的应用,定期会写论文总结。