一. 使用sklearn中的数据集做案例 随便的画几条分割线,看看哪个好? 再进一步观察决策边界的面积, 画出阴影 二. 训练SVM 这条线就是...
一. 介绍大体上看,数据挖掘可以视为数据库、机器学习和统计学三者的交叉。简单来说,对数据挖掘而言,数据库提供了数据管理技术,而机器学习和统计学则...
一. Pagerank介绍PageRank算法以前就是Google的网页排序算法。PageRank算法,对每个目标网页进行附上权值,权值大的就靠...
一. 数据预处理:将未加工数据转换成适合分析的形式,包括多数据源的数据融合、数据清洗、维规约等等。 二、为什么要进行预处理:原始数据普遍存在问题...
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法 ...
导入模块查看数据情况, 并绘类别的直方图 预处理, 标准化并去除没用的特征 下采样策略(因为1类别的数据非常少, 所以取少量0类别的数据与之对应...
数据我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以...
补充 : 梯度下降梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度...
导入库并加载泰坦尼克号数据集 观察源数据集发现,age属性中有缺失, 通过计算该属性的均值将缺失处填补,使得数据的数量一致 获取sex的值, 并...