240 发简信
IP属地:广东
  • 120
    强化学习部分基础算法总结(Q-learning DQN PG AC DDPG TD3)

    总结回顾一下近期学习的RL算法,并给部分实现算法整理了流程图、贴了代码。 1. value-based 基于价值的算法 基于价值算法是通过对agent所属的environme...

  • 120
    记一次 Python 接单经历

    技术人,总要用自己的能力获得点收益的。 所以我偶尔在 QQ 群里找点单子做,主要是爬虫和数据处理相关的。 于是我昨天晚上接到了一个单子,是这样的: 客户描述安装某个库失败,附...