嘿嘿,去哪里工作啦
关于共享打印机一些常见问题及对策2022年啦大家新年快乐!!万事顺意!!2022年要毕业了,可能后面更新会少一点~有需要可以私信! 论文送审到结果出来 这段时间一直在倒腾实验室的打印机不是在修打印机就是再学...
嘿嘿,去哪里工作啦
关于共享打印机一些常见问题及对策2022年啦大家新年快乐!!万事顺意!!2022年要毕业了,可能后面更新会少一点~有需要可以私信! 论文送审到结果出来 这段时间一直在倒腾实验室的打印机不是在修打印机就是再学...
停更应该有一年多了,上次发文章还是2021年3月,现在已经快2022年5月了。时间过的真的好快。 疫情也还没结束,又变得严重了,现在人在上海,已经反反复复快要一个月了吧。居家...
visual bert VisualBert 融合了bert 的目标检测系统如fast-rcnn,并且可以用于一系列的视觉和语言任务。 作者提出了两种训练视觉语言模型的预训练...
当一个模型中有成千上万的特征时,这时候应该如何做特征选择呢? 1.尽量使用LR而非XGB 高维稀疏特征lr 的效果会比 gbdt 好每次都根据当前节点最大熵分割来选择变量那么...
转眼就到了2021年了,时间过的好快,2020年过的很快,不知道怎的,一年就过去了,忙东忙西的。也好久没更新了,还有3天就要开始上班了,😂,只能用惨惨惨来形容了,慢慢整理一下...
Random sample consensus 核心思想:把数据分成inliers 和outliers,选用inliers的数据训练模型。是一种非确定性算法 算法细节 选择一...
CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘标准流程"。此KDD[过程模型]于...
一下子就二月了~时间真的好快 进度条被迅速拉近~也快过年了。我现在虽然有一些粉丝 赞也不少 但我不知道真正还有在看的有多少人 因为最近遇到一些事情 所以想说一下我的本意就是...
六月啦~小李又上线啦!夏天到了真的闷热(不想动的借口)哈哈 今天更新的还是论文阅读。(可以发现我最近的更新都是文本到图片的生成 感觉再多看一些 都可以写个这方面的综述了--...
更多干货内容敬请关注「平安寿险PAI」(公众号ID:PAL-AI),文末有本期分享内容资料获取方式。 人机对话作为人机交互系统的核心功能之一,发挥着十分重要的作用。目前,生成...
MITIE 实现底层算法和原理: MITIE在chatbot 框架rasa中被广泛应用,但是rasa和原始的mitie均没有介绍mitie的底层原理是什么。我也是找了很多资料...
在python 有有个神奇的东西,什么样的值可以直接用True 和False 来判断,在if语句中和直接判断有什么区别。 可以看到,直接用2 isTrue 返回的是False...
NLP subword: 1.传统方法 空格token 传统词表示方法无法很好的处理未知或罕见的词汇(OOV问题) 传统词tokenization方法不利于模型学习词缀之间的...
语言建模一直均以分词为最小单位,即词级语言模型。后来研究者尝试在字符级别进行语言建模,提出了数种字符级的语言模型,其中最为成功是Y. Kim and et. al. (201...
1.unigram model 在unigram 模型中,每个文档中的单词从单一的多项式分布中独立生成。 2.mixture of unigrams: 将unigram mo...
1.算法实现 LDA是生成式概率模型。基本的观点是一个文档由多个隐主题生成,每个主题是由单词的分布式表达。 LDA假设在语料库D中每个文档的生成过程如下: 选择 N ∼ Po...
1. 简介 LDA 是一种基于概率的生成式模型,所以在LDA的过程中会涉及到很多概率的知识,不太熟悉的话建议先学习概率知识。LDA在NLP中应用广泛,主要是用于主题模型(to...
LDA的全称是Linear Discriminant Analysis(线性判别分析),是一种supervised learning。因为是由Fisher在1936年提出的,...
我看大部分介绍rnn的文章里面都只画了cell的图,但是这对一个刚入门的人来说是会造成很大的误解,而正确的介绍方法应该先介绍rnn的总体结构,然后再介绍cell的结构。这才有...