「自然语言处理(NLP)论文推送」ACL&&中科院&&微信AI团队 809

来源：AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-8-12

引言

本篇给大家继续介绍中国科学院&&微信AI团队今年入围ACL的两篇文章，这两篇文章都是关于神经网络翻译。其中第一篇主要解释了暴露偏差和过度校正现象，提出了一种新的解决方法并该方法与试图解决该类问题的其他方法进行了对比。第二篇针对神经机器翻译模型，非自回归模型容易产生过翻译和漏翻译错误，作者提出了Reinforce-NAT、FS-decoder来为非自回归模型引入序列信息。

First Blood

TILE: Bridging the Gap between Training and Inference for Neural Machine Translation
Contributor : 中科院&&微信AI团队
Paper: https://arxiv.org/pdf/1906.02448.pdf
Code: None

文章摘要

神经机器翻译(NMT)是根据上下文词预测下一个词的方式，按顺序生成目标词。在训练时，它以标注词作为上下文进行预测，而在推理时，它必须从头开始生成整个序列。这种输入上文的差异会导致方法之间的错误积累。此外，单词级训练要求生成的序列与标注序列严格匹配，这导致对不同但合理的翻译进行过度校正。为此本文提出，在训练过程中，不仅要从标注序列中抽取上下文单词，而且从模型预测的序列中抽取上下文单词，并选择句子级最优的预测序列来解决这些问题。实验结果表明，我们的方法可以在多个数据集上实现显著的改进。

模型方法概要

本文方法首先从预测词中选择oracle词，然后从oracle词和ground truth词中抽取上下文作为样本。同时，在选择oracle单词时，不仅要进行逐词贪婪搜索，还要进行句子层次的评价，例如BLEU，在交叉熵的成对匹配限制下，具有更大的灵活性。在训练开始时，模型以较大的概率选择上下文标注词。随着模型的逐步收敛，越来越多地选择oracle单词作为上下文。这样，训练过程就从一个完全指导的机制转变为一个较少指导的机制。在这种机制下，模型有机会学习处理推理时所犯的错误，也有能力从对替代翻译的过度纠正中恢复过来。在RNN搜索模型和强Transform结构模型上验证了该方法的有效性。

具体模型方法介绍

该模型的主要架构图如下所示：

本方法是将标注词和之前预测的词作为上下文输入。通过训练模型来处理测试期间出现的情况，这可能会减少训练和推理之间的差距。我们将介绍两种选择oracle单词的方法。一种方法是用贪心搜索算法在词级选择oracle单词，另一种方法是在句子级别选择最优oracle序列。句子级oracle提供了n-gram与标注序列进行匹配的操作，因此天生具有从对替代上下文的过度纠正中恢复的能力。为了预测第j个目标词，我们的方法包括以下步骤:
1、在第步选择（单词级别或者句子级别）一个oracle单词。

2、在标注单词 $y_{j-1}^*$ 中进行抽样其概率为p，或者在orcle单词 $y_{j-1}^{oracle}$ 中进行抽样其概率为1-p。
3、使用采样的单词作为 $y_{j−1}$ ，将以下方程

中的替换为，然后执行以下基于注意力的NMT预测。

实验结果

中文翻译成英文任务中不区分大小写的BLEU得分(%)

不同因素对中英翻译的训练损失曲线。

在中英翻译任务中，不同因素对验证集的BLEU评分的变化趋势。

Double Kill

TILE: Retrieving Sequential Information for Non-Autoregressive Neural Machine Translation
Contributor : 中国科学院&&微信AI团队
Paper:https://arxiv.org/pdf/1906.09444.pdf
Code:None

文章摘要

主流的神经机器翻译模型采用自回归的解码机制，即逐词生成翻译结果，翻译延迟较高。非自回归机器翻译对每个词的翻译概率独立建模，因此能并行解码出整个译文，大幅提升翻译速度。然而，非自回归模型在训练时缺乏目标端序列信息的指导，容易产生过翻译和漏翻译的错误。基于此，作者提出了两种方法来为非自回归模型引入序列信息。首先，我们提出了一种基于Reinforce-NAT算法的序列级训练方法来减少方差且保持训练的稳定性。其次，提出了一种新颖的Transformer解码器FS-decoder，将目标序列信息融合到解码器的顶层。

Reinforce-NAT

单词级的目标函数，如交叉损失，集中于在每个位置生成正确的token，这对于没有目标顺序信息的NATs来说是较差的。我们建议NAT模型生成高质量的句子，而不是使用序列级训练算法(cenat)生成正确的单词。其中Reinforce-NAT算法如下所示：

该算法以概率分布p、遍历计数k和采样次数n为输入，步骤t的梯度估计为输出，并将此过程分为遍历和采样两部分。该算法的目标是遍历重要词的梯度，因为它们可以控制梯度估计，并通过一次采样来估计不那么重要的词的梯度。

FS-decoder

FS-decoder将目标序列信息融合到解码器的顶层。该系统由四部分组成:底层、融合层、顶层和softmax层。在解码器中，我们以非自回归的方式并行化底层来为模型加速，以自回归的方式串行化顶层以提高翻译质量。将强制指导算法(Williams and Zipser, 1989)应用于目标嵌入直接馈送到融合层的训练中。在解码过程中，fs -decoder只需要运行顶层自回归。该模型的架构图如下所示：

实验结果

生成质量，解码效率，加速和训练速度结果如下：

top-k对Reinforce-NAT的影响。

翻译性能对比：

在WMT14 En→De的验证集上对不同长度的句子的BLEU评分。

ACED

Attention

更多自然语言处理相关知识，还请关注AINLPer公众号，极品干货即刻送达。

最后编辑于：2020.01.18 00:12:15

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,924评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,781评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,813评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,264评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,273评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,383评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,800评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,482评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,673评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,497评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,545评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,240评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,802评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,866评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,101评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,673评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,245评论 2赞 341

「自然语言处理(NLP)论文推送」ACL&&中科院&&微信AI团队 809

引言

First Blood

文章摘要

模型方法概要

具体模型方法介绍

实验结果

Double Kill

文章摘要

Reinforce-NAT

FS-decoder

实验结果

ACED

Attention

推荐阅读更多精彩内容