停更应该有一年多了,上次发文章还是2021年3月,现在已经快2022年5月了。时间过的真的好快。 疫情也还没结束,又变得严重了,现在人在上海,已...
visual bert VisualBert 融合了bert 的目标检测系统如fast-rcnn,并且可以用于一系列的视觉和语言任务。 作者提出...
当一个模型中有成千上万的特征时,这时候应该如何做特征选择呢? 1.尽量使用LR而非XGB 高维稀疏特征lr 的效果会比 gbdt 好每次都根据当...
转眼就到了2021年了,时间过的好快,2020年过的很快,不知道怎的,一年就过去了,忙东忙西的。也好久没更新了,还有3天就要开始上班了,😂,只能...
Random sample consensus 核心思想:把数据分成inliers 和outliers,选用inliers的数据训练模型。是一种...
CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘标准...
MITIE 实现底层算法和原理: MITIE在chatbot 框架rasa中被广泛应用,但是rasa和原始的mitie均没有介绍mitie的底层...
在python 有有个神奇的东西,什么样的值可以直接用True 和False 来判断,在if语句中和直接判断有什么区别。 可以看到,直接用2 i...
NLP subword: 1.传统方法 空格token 传统词表示方法无法很好的处理未知或罕见的词汇(OOV问题) 传统词tokenizatio...