强化学习(Reinforcement Learing),机器学习重要分支,解决连续决策问题。强化学习问题三概念,环境状态(Environment State)、行动(Acti...
IP属地:广东
强化学习(Reinforcement Learing),机器学习重要分支,解决连续决策问题。强化学习问题三概念,环境状态(Environment State)、行动(Acti...
Using Keras and Deep Deterministic Policy Gradient to play TORCS——300行python代码展示DDPG(基于...
Using Keras and Deep Q-Network to Play FlappyBird—— github源码该项目通过卷积神经网络加Q-learning算法,利用...
Tensorflow现状 为什么选择tensorflow呢?不是因为它多么多么屌,而是因为它的设计很符合一个神经网络库,比如说什么图啊,数据流啊,咋一听你可能没有感觉,你想一...
TensorFlow从0到1系列回顾 上一篇 9 “驱魔”之反向传播大法引出了反向传播算法——神经网络的引擎,并在最后窥探了它的全貌。本篇将详细的讨论反向传播各方面的细节。尽...
Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增...
GPU 在HPC领域,GPU比CPU运算速度快是显而易见的。在此简单的调研了一下,如何挑选GPU。 [Tesla K40]Tesla系列是N厂专门为HPC退出的GPU产品,无...