240 发简信
IP属地:甘肃
  • fasttext文本分类与原理

    预备知识 为了更好的理解fastText,我们先来了解一些预备知识。第一个是BoW模型,也叫做词袋模型。BoW模型(Bag of words)应用于自然语言处理、信息检索和图...

  • 120
    XGBoost详解

    Prerequisite: CART回归树 CART回归树是假设树为二叉树,通过不断将特征进行分裂。比如当前树结点是基于第j个特征值进行分裂的,设该特征值小于s的样本划分为左...

  • 120
    各种机器学习算法的应用场景

    主要针对分类器(Classifier)。 没有最好的分类器,只有最合适的分类器。 随机森林平均来说最强,但也只在9.9%的数据集上拿到了第一,优点是鲜有短板。 SVM的平均水...

  • 120
    Xgboost总结-论文阅读和代码解析

    xgboost是一个系统必考题:xgb和gbdt的区别 xgb重新定义了树构建时切割的标准,以及子节点具体的取值一、模型上: 1. 加了正则项(叶子结点的数量和score,s...

  • 120
    Word Embedding&word2vec

    最近新接触文本分类问题,对于我来数第一个问题就是Word Embedding这个词到底是什么意思,因此也就开始学习了相关知识http://licstar.net/archiv...