11
0
写了 56031 字,被 51 人关注,获得了 105 个喜欢
在2017年的时候,无论是openai或者是deepmind,在深度强化学习领域都取得了重大突破,而能带来这个突破的一个重要因素便是PPO(Proximal Policy O...
写了 207075 字,被 130955 人关注,获得了 1532 个喜欢
写了 0 字,被 11008 人关注,获得了 89 个喜欢
写了 0 字,被 11702 人关注,获得了 57 个喜欢
写了 0 字,被 11898 人关注,获得了 8 个喜欢
写了 0 字,被 14029 人关注,获得了 102 个喜欢
写了 889747 字,被 58467 人关注,获得了 11640 个喜欢
写了 10336504 字,被 199150 人关注,获得了 138715 个喜欢
写了 3833372 字,被 78215 人关注,获得了 14329 个喜欢
写了 2340869 字,被 184680 人关注,获得了 1854 个喜欢
写了 0 字,被 134257 人关注,获得了 0 个喜欢