第15章 大数据与MapReduce(代码) MapReduce:分布式计算的框架MapRedece分布式的计算框架,可以将单个计算作业分配给多...
第15章 大数据与MapReduce(代码) MapReduce:分布式计算的框架MapRedece分布式的计算框架,可以将单个计算作业分配给多...
第14章 利用SVD简化数据(代码) SVD的应用图像压缩噪声滤波模式识别生物,物理,经济方面的一些统计模型的处理。SVD优缺点优点:简化数据,...
第13章 利用PCA来简化数据(代码) 降维技术降维的意思是能够用一组个数为d的向量zi来代表个数为D的向量xi所包含的有用信息,其中d<D。假...
第12章 使用FP-growth算法来高效发现频繁项集(代码) FP优点因为 FP-growth 算法只需要对数据集遍历两次,所以速度更快。FP...
第11章 使用Apriori算法进行关联分析(代码) 关联分析关联分析是一种在大规模数据集中寻找有趣关系的任务。这些关系可以有两种形式:频繁项集...
第10章 K-均值聚类算法(代码) K-均值算法的优缺点K-均值是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发...
第九章 树回归(代码) 树回归算法的优缺点优点:可以对复杂和非线性的问题建模.缺点:结果不容易理解.适用数据类型:数值型和标称型. 树回归和分类...
第八章 预测数值型数据:回归(代码) 线性回归算法的优缺点优点:结果容易理解,计算上下不复杂缺点:对非线性问题数据处理不好.使用数据类型:数值型...
第七章 利用AdaBoost元算法提高分类性能(代码) AdaBoost算法的优缺点优点: 泛化错误率低,易编码,可以应用再大部分分类器上,无参...
第六章 支持向量机(代码) SVM算法优缺点优点:泛化错误率低,计算开销不大,结果易解释。缺点:对参数调节和和核函数的选择敏感,原始分类器不加修...
专题公告
本书重要讲述了机器学习算法,并介绍那些使用这些算法的应用和工具,以及如何在实际环境中使用它们.这本书和其他书不同,其他书都是长篇大论讲解机器学习背后的理论知识,这本书恰巧更多讨论如何使用编码实现机器学习算法.