4
0
写了 35323 字,被 1208 人关注,获得了 565 个喜欢
写了 704974 字,被 8153 人关注,获得了 5857 个喜欢
强化学习 元素:actor(我们可以控制,决策我们的行为),Env,Reward(我们不能控制环境)主要方法:model-baed(对Env建模,actor可以理解环境), ...
写了 25693 字,被 55 人关注,获得了 66 个喜欢