1/3 复习 打印资料:https://wws.lanzouo.com/iEdxjy7oeuj 2/3 笔记 笔记:https://wws.lanzouo.com/iFWGr...
1.RNN基础概念和结构 RNN(Recurrent Neural Network)即循环神经网络,用于解决训练样本输入是连续的序列,且序列的长短不一的问题,比如基于时间...
1、简介 NLP:计算机或系统真正理解人类语言并以与人类相同的方式处理它的能力。 难度:理解话中的潜在意图;理解句子中的歧义。 歧义包括:单词、句子、语义中歧义。 2、NLP...
1. 背景知识 1.1 统计语言模型 作用:计算一个句子的概率的概率模型 上述模型的实现过程较为困难,原因:若句子长度为T,语料库对应词典(词汇表)的大小为N,理论上就有N^...
词嵌入(Word Embeding)是指将自然语言中的词转化为计算机所能处理的词的向量或表征。适用于中文分词。 词嵌入的实现是使用Bert模型。 LeakGAN是GAN(生成...
生成的摘要容易存在连续重复出现词、提前终止导致长度短、语句不连贯和与参考文本表述含义不同的问题。 生成对抗网络(GAN):由生成器和判别器组成。生成器负责生成数据,判别器负责...
文本自动摘要按照输出类型分为:抽取式摘要和生成式摘要。 文本摘要根据不同的分类标准可以划分为多种类型。按照数据有无标注,可以分为有监督和无监督两种。 有监督方法要求训练数据是...
自然语言处理就是实现人机间通过自然语言交流。 1、深度学习 核心思想:通过数据驱动的方式,采用一系列的非线性变换,从原始数据中提取由低层到高层、由具体到抽象的特征。 特点:深...