作者:himon时间:2021.1.6来源: ACL 2017关键词:NLG,Pointer-Generator Networks 1.背景及问...
标签: Jd_Paperweekly来源: ACL 2019关键词:文本匹配,GCN, BERT 1.背景及问题描述 本文目标主要是为了解决长文...
标签: Jd_Paperweekly时间:2020.11.18来源: ACL 2017关键词:文本匹配,Alignment layer 1.背景...
关键词:预训练模型,knowledge-Enhanced PLM, 1.背景及问题描述 通过大数据量训练得到的预训练语言模型,比如BERT、GP...
标签: Jd_Paperweekly 时间:2020.11.05来源: COLING 2020关键词:预训练模型,knowledge-Enhan...
[TOC] 1. 模型蒸馏 1. DistilBERT(2019.10.2) 知识蒸馏的基础原理: 定义两个网络,teacher网络和stude...
一:系统与环境 系统:windows10GPU:NVIDIA GeForce GTX TITAN Xpython: Anaconda, pyth...
火爆的QA系统,现在常采用seq2seq的模型来做,这篇文章是为了优化一个问题。seq2seqm模型通常的回复会是更安全的(safe)、更通用(...
Jaro distance 给定两个文本串,,他们的Joro距离定义为: 求match的字符数:分别来自,的字符,当他们相同或者距离小于,则被认...