Jaydu - 简书

发简信

Jaydu

2
关注
5
粉丝
9
文章
7210

字数
18

收获喜欢
3

总资产

IP属地：广东

Daisy丶

Keras深度强化学习--A3C实现
A3C算法是Google DeepMind提出的一种基于Actor-Critic的深度强化学习算法。A3C是一种轻量级的异步学习框架，这种框架使用了异步梯度下降来最优化神经网...

11985 0 10
Jaydu

强化学习中on-policy和off-policy方法
什么是策略？一个确定性策略定义了一个从行动空间到状态空间的函数。在实际应用中，一个策略的输出常常是一个概率分布，表示在状态下采取每一个动作的概率。如何学习？一共有两类方...

5884 0 1
Jaydu

强化学习中的model-free和model-based算法
Model-based强化学习通过一个代理（agent）来尝试理解环境，并且建立模型来表示这个代理。这个模型希望学习到两个函数：状态转移函数（transition func...

8398 0 1
Jaydu

Adam优化算法简介
背景介绍在机器学习中，对每一个数据点，我们通过最小化经验风险来从数据中学习，其中是模型的参数。对整个训练集，目标函数即为对应的梯度为然而，当很大的时候，计算个经验风险函数的...

10629 0 2
婉妃

pytorch Code Snippets(pytorch常用代码整理)
本文代码基于PyTorch 1.0版本，需要用到以下包 1. 基础配置检查PyTorch版本更新PyTorch PyTorch将被安装在anaconda3/lib/pyt...

7858 0 13
婉妃

实例详解机器学习如何解决问题
目录机器学习的概述对问题建模准备训练数据抽取特征训练模型优化模型总结前言随着大数据时代的到来，机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学...

6900 0 26