利用SVD(Singular Value Decomposition),即奇异值分解,我们可以用更小的数据集来表示原始数据集。这样做,其实是去除...
![240](https://upload.jianshu.io/collections/images/365307/%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20170418204603.png?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
利用SVD(Singular Value Decomposition),即奇异值分解,我们可以用更小的数据集来表示原始数据集。这样做,其实是去除...
在体育比赛中,人们面对的原本是百万像素的数据,但是只有球的三维位置才最重要,这就成为降维(dimensionlity reduction)。通常...
上一章介绍了发现频繁项集与关键规则的算法,本章将继续关注发现频繁项集这一任务。我们会深入探索该任务的解决方法,并应用FP-growth算法进行处...
从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联学习。本章将主要介绍Apriori算法来解决问题。 Apriori算法优点:易编码实现...
聚类是一种无监督学习,它将相似的对象归到同一个簇中。他有点像全自动分类。簇识别给出聚类结果的含义。假定一些数据,现在将相似数据归到一起,簇识别会...
本章介绍一个新的叫做CART(分类回归树)的树构建算法。该算法既可以用于分类还可以用于回归,因此非常值得学习。 树回归优点:可以对复杂和非线性的...
Part 1、理论基础 将不同分类器组合起来的方法叫“集成方法”(ensemble method)或者“元算法”(meta-algorithm)...
本章首先介绍线性回归,包括其名称的由来和实现。接下来本章将讨论回归在“欠拟合”的情况下的缩减技术。最后将融合所有技术预测鲍鱼年龄和玩具售价。 线...
元算法是对其他算法进行组合的一种方式。本章首先讨论不同分类器的集成方法,然后主要关注boosting方法及其代表分类器Adaboost。 Ada...
支持向量机优点:泛化错误率低,计算开销不大,结果易于理解缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题适用数据类型:...
专题公告
《机器学习实战》每一章实录