西南交一枝花 - 简书

发简信

西南交一枝花

1
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：广西

Daisy丶

Keras深度强化学习--DPG与DDPG实现
DQN系列算法对连续空间分布的action心有余而力不足，而Policy Gradient系列的算法能够有效的预测连续的动作。在此基础上DPG和DDPG算法被提了出来，并且能...

24457 5 20 1
fromeast

深度强化学习（六）：连续动作空间的问题
一、问题的引入 1.1、连续动作空间在此之前，我们讨论和研究的都是离散的动作空间，而在实际问题中，存在大量的连续空间的问题，比如价格、角度、时间等。对于离散空间的问题，可以...

27827 1 16

暂无个人介绍