240 发简信
IP属地:上海
  • 120
    精简强化学习总结

    强化学习 元素:actor(我们可以控制,决策我们的行为),Env,Reward(我们不能控制环境)主要方法:model-baed(对Env建模,actor可以理解环境), ...