一下子就二月了~时间真的好快 进度条被迅速拉近~也快过年了。我现在虽然有一些粉丝 赞也不少 但我不知道真正还有在看的有多少人 因为最近遇到一些事情 所以想说一下我的本意就是...
一下子就二月了~时间真的好快 进度条被迅速拉近~也快过年了。我现在虽然有一些粉丝 赞也不少 但我不知道真正还有在看的有多少人 因为最近遇到一些事情 所以想说一下我的本意就是...
六月啦~小李又上线啦!夏天到了真的闷热(不想动的借口)哈哈 今天更新的还是论文阅读。(可以发现我最近的更新都是文本到图片的生成 感觉再多看一些 都可以写个这方面的综述了--...
更多干货内容敬请关注「平安寿险PAI」(公众号ID:PAL-AI),文末有本期分享内容资料获取方式。 人机对话作为人机交互系统的核心功能之一,发挥着十分重要的作用。目前,生成...
LDA的全称是Linear Discriminant Analysis(线性判别分析),是一种supervised learning。因为是由Fisher在1936年提出的,...
1. 简介 LDA 是一种基于概率的生成式模型,所以在LDA的过程中会涉及到很多概率的知识,不太熟悉的话建议先学习概率知识。LDA在NLP中应用广泛,主要是用于主题模型(to...
1.算法实现 LDA是生成式概率模型。基本的观点是一个文档由多个隐主题生成,每个主题是由单词的分布式表达。 LDA假设在语料库D中每个文档的生成过程如下: 选择 N ∼ Po...
1.unigram model 在unigram 模型中,每个文档中的单词从单一的多项式分布中独立生成。 2.mixture of unigrams: 将unigram mo...
NLP subword: 1.传统方法 空格token 传统词表示方法无法很好的处理未知或罕见的词汇(OOV问题) 传统词tokenization方法不利于模型学习词缀之间的...
语言建模一直均以分词为最小单位,即词级语言模型。后来研究者尝试在字符级别进行语言建模,提出了数种字符级的语言模型,其中最为成功是Y. Kim and et. al. (201...