11
0
写了 59408 字,被 51 人关注,获得了 105 个喜欢
在2017年的时候,无论是openai或者是deepmind,在深度强化学习领域都取得了重大突破,而能带来这个突破的一个重要因素便是PPO(Proximal Policy O...
写了 207075 字,被 168660 人关注,获得了 1560 个喜欢
写了 0 字,被 14098 人关注,获得了 89 个喜欢
写了 0 字,被 15012 人关注,获得了 57 个喜欢
写了 0 字,被 15005 人关注,获得了 8 个喜欢
写了 0 字,被 18058 人关注,获得了 102 个喜欢
写了 890331 字,被 70773 人关注,获得了 12940 个喜欢
写了 10472906 字,被 211332 人关注,获得了 140970 个喜欢
写了 3689401 字,被 96438 人关注,获得了 14938 个喜欢
写了 2285317 字,被 223137 人关注,获得了 1883 个喜欢
写了 0 字,被 172674 人关注,获得了 0 个喜欢