写文章
注册
登录
首页
下载App
会员
IT技术
发简信
咨诹善道
1
关注
4
粉丝
1
文章
3518
字数
4
收获喜欢
1
总资产
IP属地:香港
关注的专题/文集/连载 0
喜欢的文章 1
吕鹏_hunhun
读论文Deterministic Policy Gradient Algorithms
近期打算把基于策略梯度的增强学习的几篇论文读了,包括DPG、DDPG、TRPO和A3C,希望能对策略梯度的学习有一个促进。 第一篇论文是Deterministic Polic...
13088
1
18
1
暂无个人介绍
他关注的专题/文集/连载
他喜欢的文章