「自然语言处理(NLP)论文推送」ACL&&微信AI团队（含源码）808

来源：AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-8-8

引言

本次给大家分享的是今年腾讯微信AI团队入选ACL的两篇文章，第一篇文章主要是针对中文诗歌生成的问题，介绍中文现代诗歌生产的修饰控制编码器，该编码器具有隐喻、拟人化等修辞功能。第二篇文章主要是针对递归神经网络RNNs在全局信息建模上的不足，提出了一种全局上下文增强的深度转换架构（美其名曰：GCDT）。其在NER、Chunking上都得到了比较好的结果。

First Blood

TILE: Rhetorically Controlled Encoder-Decoder for Modern Chinese Poetry Generation
Contributor : WeChat AI（微信AI团队）
Paper: https://www.aclweb.org/anthology/P19-1192
Code: None

文章摘要

为了将修辞学应用到中文汉语诗歌的生成上，本文提出了一种用于现代汉语诗歌生成的修辞控制编码器。我们的模型依赖于一个连续的潜在变量修辞控制器在编码器中捕获各种修辞模式，然后结合基于修辞的混合物，生成现代汉语诗歌。在隐喻、人格化、自动化的评估方面，我们的模型相比于最先进的基线具有很大的优势，并且人工评估显示，我们的模型生成的诗歌在流畅性、连贯性、意义和修辞美学方面都优于基本方法。

本文三大看点

1、提出的第一个同时使用隐喻和拟人产生现代中国诗歌的作品，并且在提高诗歌美学方面具有很强的优势。
2、提出了一种新颖的隐喻和拟人生成模型。
3、大量的实验表明，我们的模型在自动评估和人工评估方面都优于目前的水平

修辞模型介绍

在介绍模型之前，我们首先形式化生成任务。输入是K个用户提供的关键字 $\{w_k\}^{K}_{ k =1}$ 来指定的诗歌主题。期望输出是由n行 $\{L_i\}^{n}_{ i=1}$ 组成的一首诗。因为我们采用sequence-to-sequence框架和生成一个逐行诗,这个任务可以扮演一个文本生成,需要重复一行一行的输出，行与行之间具有连贯性且与主题相关，即要考虑到之前 $i−1$ 行 $L_{1:−1}$ 和主题关键词 $w_{1: K}$ 。为了控制修辞模式，修辞标签r可以作为用户的输入，也可以作为基于上下文的自动预测值。因此，诗歌行生成的任务可以形式化如下：

如上所述，将修辞模型融入到诗句中，需要控制修模型的使用方式以及记忆语境主题信息。为此，我们首先提出了两种条件可变的自编码模型来有效地控制什么时候生成修辞格句子，以及使用哪种修辞格模式。第一个模型是手动控制CVAE模型(MCCVAE)。它接收用户的输入信号作为修辞来生成诗歌中的当前句子，用于用户可控制的诗歌生成任务。第二种模型是自动控制CVAE (ACCVAE)，它自动预测什么时候使用合适的修辞形式，并根据上下文信息生成当前的句子。整体的模型架构如下图所示：

针对上图，作者对手动控制CVAE模型(MCCVAE)、自动控制模型CVAE (ACCVAE)、主题记忆组件、修辞控制编码器做了详细的公式推导和介绍，有兴趣的小伙伴可以下载论文看一下。

主要实验结果

机器评估结果对比：

人工评估结果对比：

实际生产效果对比：

Double Kill

TILE: GCDT: A Global Context Enhanced Deep Transition Architecture
for Sequence Labeling
Contributor : 北京交通大学&&微信AI团队
Paper: https://arxiv.org/pdf/1906.02437.pdf
Code: None

文章摘要

目前最先进的序列标记系统通常基于递归神经网络(RNNs)家族。然而，RNNs连续隐藏状态之间的浅连接和全局信息建模的不足限制了这些模型的潜在性能。在本文中，我们试图解决这些问题，并因此提出了一个全局上下文增强的深度转换架构，用于序列标记GCDT。我们在句中的每个位置加深状态转换路径，并进一步使用从整个句中学习到的全局表示来分配每个标记。在两个标准序列标记任务上的实验表明，在只给出训练数据和单词嵌入(Glove)的情况下，我们的GCDT在CoNLL03 NER任务上取得了91.96 F1的成绩，在CoNLL2000分块任务上取得了95.43 F1的成绩，在相同的设置下，GCDT的表现优于最佳报告结果。此外，通过利用BERT作为一个额外的资源，我们得到了最好的结果，在NER上的结果是93.47 F1以及在Chunking上的结果为97.30 F1。

本篇文章三大看点

1、首先介绍了用于序列标记的深度转换体系结构，并在句子级别使用全局上下文表示(GCDT)进一步增强了它。
2、在NER和Chunking这两个主要任务上，GCDT的性能显著优于以前的系统。此外，通过利用BERT作为额外资源来增强GCDT，我们报告了这两个任务的最新进展。
3、对GCDT中的全局上下文表示、模型复杂性和各种组件的影响进行了详细的研究。

GCDT模型介绍

整体的GCDT结构图如下图所示：

GCDT模型结构图

Token Represention

给定一个句子 $X = {x1,x2，…，XN}$ 使用N个token，我们的模型首先通过连接三个主要嵌入来捕获每个token表示 $x_t$

1、其中字符级嵌入是由卷积神经网络实现的
2、从Glove2初始化的查找表中得到预先训练的词嵌入
3、全局上下文嵌入g是从双向DT中提取。
全局嵌入g是通过全局上下文编码器的所有隐藏状态上的平均池计算得到的(图1中右侧部分)。为简便起见，我们可以将“DT”作为增强门控递归单元(GRU Chung et al.， 2014)，关于DT的更多细节将在下一节中描述。因此g的计算如下:

序列标签编码器

然后，将连接的token嵌入 $x_t$ 输入序列标记编码器中。

序列标签解码器

考虑到这句话中的第t个单词，将序列标记编码器 $h_t$ 的输出以及过去嵌入 $y_{t - 1}$ 的标签的输出输入解码器，然后将解码器 $s_t$ 的输出转换为 $l_t$ ，在标签词汇表上进行最终的softmax。在形式上，将单词 $x_t$ 的标号预测为概率方程。

从上面的过程和结构图可以看出，GCDT首先沿着顺序轴用DT编码全局上下文，用于丰富token表示。在每个时间步，我们使用序列标记解码器联合编码过去的标签信息，而不是求助于CRF。此外，我们使用波束搜索算法来推断测试时标签的最可能序列。

主要实验结果

在CoNLL03上面的结果：

在CoNLL2000 Chunking Task上的结果：

ACED

Attention

更多自然语言处理相关知识，还请关注AINLPer公众号，极品干货即刻送达。

最后编辑于：2020.01.18 00:11:58

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,924评论 5赞 474
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,781评论 2赞 378
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,813评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,264评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,273评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,383评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,800评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,482评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,673评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,497评论 2赞 318
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,545评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,240评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,802评论 3赞 304
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,866评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,101评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,673评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,245评论 2赞 341

「自然语言处理(NLP)论文推送」ACL&&微信AI团队（含源码）808

引言

First Blood

文章摘要

本文三大看点

修辞模型介绍

主要实验结果

Double Kill

文章摘要

本篇文章三大看点

GCDT模型介绍

Token Represention

序列标签编码器

序列标签解码器

主要实验结果

ACED

Attention

推荐阅读更多精彩内容