咨诹善道 - 简书

发简信

1
关注
4
粉丝
1
文章
3518

字数
4

收获喜欢
1

总资产

IP属地：贵州

咨诹善道

读论文Deterministic Policy Gradient Algorithms
近期打算把基于策略梯度的增强学习的几篇论文读了，包括DPG、DDPG、TRPO和A3C，希望能对策略梯度的学习有一个促进。第一篇论文是Deterministic Polic...

吕鹏_hunhun
13165 1 18 1
咨诹善道

吕鹏_hunhun
写了 53382 字，被 109 人关注，获得了 171 个喜欢

咨诹善道

Stanford_cs231n_lecture8：Spatial Localization and Detection
大纲介绍这节课程的主要是接着之前的已经讲过的卷积神经网络，开始进入相关的应用。这里的应用就是从，分类（Classification），定位（Localization）和检测...

1546 0 4
咨诹善道

暂无个人介绍