240 发简信
IP属地:上海
  • Resize,w 360,h 240
    2022 重新出发

    停更应该有一年多了,上次发文章还是2021年3月,现在已经快2022年5月了。时间过的真的好快。 疫情也还没结束,又变得严重了,现在人在上海,已...

  • Resize,w 360,h 240
    [论文解读]Visual bert

    visual bert VisualBert 融合了bert 的目标检测系统如fast-rcnn,并且可以用于一系列的视觉和语言任务。 作者提出...

  • 大规模特征中变量选择和模型使用

    当一个模型中有成千上万的特征时,这时候应该如何做特征选择呢? 1.尽量使用LR而非XGB 高维稀疏特征lr 的效果会比 gbdt 好每次都根据当...

  • 新的一年-2021

    转眼就到了2021年了,时间过的好快,2020年过的很快,不知道怎的,一年就过去了,忙东忙西的。也好久没更新了,还有3天就要开始上班了,😂,只能...

  • Ransac regressor

    Random sample consensus 核心思想:把数据分成inliers 和outliers,选用inliers的数据训练模型。是一种...

  • 数据挖掘项目的标准流程CRISP-DM

    CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘标准...

  • rasa中MitieEntityExtractor 的底层原理细节算法

    MITIE 实现底层算法和原理: MITIE在chatbot 框架rasa中被广泛应用,但是rasa和原始的mitie均没有介绍mitie的底层...

  • python True,False 如何判断,if 中True,False有什么区别

    在python 有有个神奇的东西,什么样的值可以直接用True 和False 来判断,在if语句中和直接判断有什么区别。 可以看到,直接用2 i...

  • NLP 中subword编码方式总结

    NLP subword: 1.传统方法 空格token 传统词表示方法无法很好的处理未知或罕见的词汇(OOV问题) 传统词tokenizatio...