RNN-LSTM-GRU-最小GRU

       首先,简单说一下区别:RNN(Recurrent Neural Networks,循环神经网络)不仅学习当前输入的信息,还要依赖之前的信息,如处理由重多词组成的序列。但它并不能很好地处理长的序列。是因为会出现梯度消失和梯度爆炸现象,由此出现了LSTM。LSTM和RNN相同都是利用BPTT传播和随机梯度或者其他优化算法来拟合参数。但是RNN在利用梯度下降算法链式求导时是连乘的形式,而LSTM是相加的形式,这也是最主要的区别。GRU与LSTM相比,少了一个gate,由此就少了一些矩阵乘法,GRU虽与LSTM的效果较近,但却因此在训练中节省了很多时间,在文本类处理中,相比用LSTM,导师更建议用GRU来训练。最小GRU可看最近南大教授的篇论文是用最小GRU来进行计算的,比GRU又少了一个门,这就使计算时间更短了,计算维度降低,占用内存减少。

        下面是梯度消失与梯度爆炸的原因:RNN的梯度是多个激活函数偏导乘积的形式来计算,如果这些激活函数的偏导比较小(小于1)或者为0,那么随时间很容易发生梯度消失;相反,如果这些激活函数的偏导比较大(大于1),那么很有可能就会梯度爆炸。

上式的最后括号内是定义为矩阵的模的上界。因为上式是一个指数函数,如果t-k很大的话(也就是向前看很远的时候),会导致对应的误差项的值增长或缩小的非常快,这样就会导致相应的梯度爆炸梯度消失问题(取决于最后括号内两个数乘积大于1还是小于1)。

例如我们所说的sigmod函数f(x),求导是f(x)*(1-f(x)),又因为我们知道a*b<=((a+b)/2)^2,故可知这是一个小于1/4的值,小于1,如果一直累乘必然会导致梯度消失现象。

RNN的原理:例如:小明是中国人,小明国家的首都是:_____。这时,RNN只需要参考横线前面的词,基本的循环网络、

网上最易懂得结构图:

例如一个简单的RNN内部的结构是:

但,当我们推测如下的:小明很喜欢吃蛋挞,所以小明下班后决定去商店__两个蛋挞。这时,不仅需要参考前面的词,还需要参考后面的词,才能推测出中间横线上的词,最大的概率是买。这就需要双向循环神经网络。如下图:

双向循环神经网络

以及深层双向神经网络:

深层双向神经网络

具体公式实现可参考:https://zybuluo.com/hanbingtao/note/541458

LSTM原理:    这里说一下LSTM的前向运算:LSTM有三个门:遗忘门、输入门、输出门。

遗忘门(forget gate),它决定了上一时刻的单元状态有多少保留到当前时刻;输入门(input gate),它决定了当前时刻网络的输入有多少保存到单元状态。输出门(output gate)来控制单元状态有多少输出到LSTM的当前输出值。

LSTM每个循环的模块内又有4层结构:3个sigmoid层,1个tanh层                                            

遗忘门:sigmod函数,0代表舍弃,1代表保留。

遗忘门:决定丢弃的信息

输入门:决定什么样的新信息被存放在细胞状态中。当前输入的单元状态通过 tanh 进行处理(得到一个在 -1 到 1 之间的值)。

确定更新信息

计算当前时刻的单元状态:它是由上一次的单元状态按元素乘以遗忘门,再用当前输入的单元状态按元素乘以输入门,再将两个积加和产生的,

当前细胞状态

输出门:LSTM最终的输出,是由输出门和单元状态共同确定的:把细胞状态通过 tanh 进行处理(得到一个在 -1 到 1 之间的值)并将它和 sigmoid 门的输出相乘,最终我们仅仅会输出我们确定输出的那部分。

输出信息

可参考:https://www.zybuluo.com/hanbingtao/note/581764

GRU:省略了一个门,而且余下的两个门是z,1-z的关系。

LSTM为什么可以解决梯度消失问题:

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容