240 发简信
IP属地:北京
  • 同济数学导图

    refer:https://zhuanlan.zhihu.com/p/40532172

  • 人生不能像做菜

    人生不能像做菜,要等所有的东西都准备好了才下锅 时刻准备, 时时探索

  • 120
    基于tensorflow的最简单的强化学习入门-part1:多臂老虎机问题

    本文翻译自 Simple Reinforcement Learning in Tensorflow: Part 1 - Two-armed Bandit, 作者是 Arthu...