IP属地:台湾
背景:只专注于单个模型可能会忽略一些相关任务中可能提升目标任务的潜在信息,通过进行一定程度的共享不同任务之间的参数,可能会使原任务泛化更好。广义...
强化学习 元素:actor(我们可以控制,决策我们的行为),Env,Reward(我们不能控制环境)主要方法:model-baed(对Env建模...
Unspervised learning主要任务目标是发掘数据潜在有价值的结构,主要分为clustering,dimentionality re...
神经网络构建好,训练不出好的效果怎么办?明明说好的拟合任意函数(一般连续)(为什么?可以参考Neural Network and Deep Le...
David Silver说,AI = RL + DL = Deep Reinforcement Learning他的课程:RL Cource b...
这次给大家介绍一下GAN的generalized framework。其实很多研究都是这样,先找到一个比较直观好理解方法,然后去研究他的框架,发...
为了后面介绍seqGAN + RL的应用,先来介绍一下这个很火的GAN,火到似乎女娲上帝都是“干”出来的...稍提一点背景。统计机器学习中,这个...
Seq2Seq的资料很多,这里就简单介绍下吧。顾名思义,它就是一个sequence来预测另一个sequence的模型,主要是一个encoder-...