240 发简信
IP属地:贵州
  • 120
    Proximal Policy Optimization(PPO)算法原理及实现!

    这两天看了一下李宏毅老师的强化学习课程的前两讲,主要介绍了Policy Gradient算法和Proximal Policy Optimization算法,在此整理总结一下。...

  • 所以,python到底有多大,能一口吞下肥多多吗?

    我的Python之旅

    前言 工作原因,近两年没写文章了,这里我分享几个我最近学习python的时候写的工具 Python之旅 最近两年工作上,我真的是很忙,上一次更新文章还是2018-01-08写...

  • 天秀,,小资产阶级的富足生活~

    我的2019

    看看这个标题,没错,这又是一篇年终总结,上一次写年终总结还是2017年,而2018年直接就跳过没有写。之前的业余时间的确是很多,现在我连休息时间也变少了,所以一年都很难产出一...

  • 120
    我的2019

    看看这个标题,没错,这又是一篇年终总结,上一次写年终总结还是2017年,而2018年直接就跳过没有写。之前的业余时间的确是很多,现在我连休息时间也变少了,所以一年都很难产出一...