240 发简信
IP属地:内蒙古
  • 120
    Rainbow:整合DQN六种改进的深度强化学习方法!

    在2013年DQN首次被提出后,学者们对其进行了多方面的改进,其中最主要的有六个,分别是:Double-DQN:将动作选择和价值估计分开,避免价值过高估计Dueling-DQ...

  • 120
    0-1背包问题

    问题描述: 0-1背包问题:给定n种物品和一背包。物品 i 的重量似乎 wi,其价值为 vi,背包的容量为 c。问应该如何选择装入背包中的物品,使得装入背包中物品的总价值最大...

  • 120
    Git基本配置

    1、配置git: (1)设置用户名称和登录邮箱 git config --global user.name '用户名称'git config --global user.em...