丰谷数 - 简书

发简信

0
关注
0
粉丝
3
文章
2637

字数
2

收获喜欢

IP属地：江苏

CS294 Lecture 6-Actor Critic
从 "reward to go" 到 Actor Critic 回顾一下REINFORCE算法其中reward to go 为但这个reward...

918 0 0
Natural Gradient 算法简介
Natural Gradient DescentScore functionFisher Information MatrixKL 散度KL 散...

2516 0 2

向量，矩阵，张量求导法则
向量，矩阵，张量求导向量对向量求导向量对矩阵求导矩阵对矩阵求导使用链式法则总结向量，矩阵，张量求导参考：http://cs231n.stan...

1836 0 0

暂无个人介绍