240 投稿
收录了17篇文章 · 44人关注
  • Resize,w 360,h 240
    从集成学习到GBDT与随机森林

    初步认识GBDT 个人理解:GBDT(Gradient Boosting Decision Tree),梯度提升决策树、再读一遍:梯度,提升,决...

  • TensorFlowOnSpark 源码解析

    前言 这两天琢磨了下spark-deep-learning和spark-sklearn两个项目,但是感觉都不尽人如意。在training时,都需...

    2.0 祝威廉 5 10
  • Resize,w 360,h 240
    机器学习经验总结之XGBoost

    以下内容属于经验总结的建模模块,建模模块目前包括 lasso 和 XGBoost,文章内容属于 XGBoost。 建模 XGBoost 功能介绍...

    0.4 魏立艳 1 18
  • Scikit-learn使用总结

    在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可以解决大部分问题。学习使用sc...

    6.7 Cer_ml 21 288
  • 中文分词项目总结

    1)ICTCLAS 最早的中文开源分词项目之一,由中科院计算所的张华平、刘群所开发,采用C/C++编写,算法基于《基于多层隐马模型的汉语词法分析...

    0.5 MobotStone 1 15 1
  • 交叉验证、留一交叉验证、自助法

    机器学习包括许多算法:线性回归、逻辑回归、决策树、SVM、随机森林、GBDT等等。那么该如何评价某个算法在数据集上的表现呢?这里阐述3个评估方法...

  • 特征工程

    文章主要参考于大神城东(部分认为有问题的地方进行了修改) 1. 特征工程是什么? 数据和特征决定了机器学习的上限,而模型和算法只是逼近了这个上线...

    0.1 jockerMe 0 11
  • Resize,w 360,h 240
    判别分析

    上周介绍了聚类分析,聚类分析可以理解为,从一大堆眼、睛眉、耳朵、皮毛特征中,划分出一类作为猴子,划分出另一类为人,另一类为狗。判别分析则是已经知...

  • Resize,w 360,h 240
    机器学习中的数学:线性判别分析、主成分分析

    如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必...

  • 聚类分析、判别分析、主成分分析、因子分析

    来自:带呀带尾呀(数据小生、数字营销、新媒体) 主成分分析与因子分析的区别 1. 目的不同: 因子分析把诸多变量看成由对每一个变量都有作用的一些...

    0.3 xc10 0 15

专题公告

机器学习算法,作品展示