240 发简信
IP属地:吉林
  • 120
    读论文Deterministic Policy Gradient Algorithms

    近期打算把基于策略梯度的增强学习的几篇论文读了,包括DPG、DDPG、TRPO和A3C,希望能对策略梯度的学习有一个促进。 第一篇论文是Deterministic Polic...

  • Python常用库大全

    Python常用库大全,看看有没有你需要的。 环境管理 管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具。pyenv – 简单的 P...