飞多多 - 简书

发简信

1
关注
18
粉丝
0
文章
0

字数
0

收获喜欢
3

总资产

IP属地：澳门

文哥的学习日记

Proximal Policy Optimization(PPO)算法原理及实现！
这两天看了一下李宏毅老师的强化学习课程的前两讲，主要介绍了Policy Gradient算法和Proximal Policy Optimization算法，在此整理总结一下。...

139088 11 60
Henry游戏开发

我的2019
看看这个标题，没错，这又是一篇年终总结，上一次写年终总结还是2017年，而2018年直接就跳过没有写。之前的业余时间的确是很多，现在我连休息时间也变少了，所以一年都很难产出一...

1200 3 4 2

暂无个人介绍