通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个...
通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个...
作者: Christopher Olah (OpenAI)译者:朱小虎 Xiaohu (Neil) Zhu(CSAGI / University AI)原文链接:https:...
本文是深度学习总结系列的第一篇,主要内容是神经网络的基础知识,最初版本翻译自:Feedforward Nets and Conv Nets (lecturer: Dario ...
一. 使用sklearn中的数据集做案例 随便的画几条分割线,看看哪个好? 再进一步观察决策边界的面积, 画出阴影 二. 训练SVM 这条线就是我们希望得到的决策边界啦 观察...
一. 介绍大体上看,数据挖掘可以视为数据库、机器学习和统计学三者的交叉。简单来说,对数据挖掘而言,数据库提供了数据管理技术,而机器学习和统计学则提供了数据分析技术。所以你可以...
一. Pagerank介绍PageRank算法以前就是Google的网页排序算法。PageRank算法,对每个目标网页进行附上权值,权值大的就靠前显示,权值小的就靠后显示。P...
一. 数据预处理:将未加工数据转换成适合分析的形式,包括多数据源的数据融合、数据清洗、维规约等等。 二、为什么要进行预处理:原始数据普遍存在问题,必须加以处理才能用于分析,一...
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法 贝叶斯统计都是以条件概率,联合...
导入模块查看数据情况, 并绘类别的直方图 预处理, 标准化并去除没用的特征 下采样策略(因为1类别的数据非常少, 所以取少量0类别的数据与之对应) 由上可知, 通过下采样之后...
数据我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据,你可以用...
补充 : 梯度下降梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Des...
导入库并加载泰坦尼克号数据集 观察源数据集发现,age属性中有缺失, 通过计算该属性的均值将缺失处填补,使得数据的数量一致 获取sex的值, 并用0和1代表男性和女性 获取e...
Ensemble learning Bagging : 训练多个分类器取平均 Boosting : 从弱学习器开始加强,通过加权来进行训练 Stacking : 聚合多个分类...
一. 决策树(decision tree):是一种基本的分类与回归方法,此处主要讨论分类的决策树。在分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-then的集...
一. K-means实现 读取数据 取出其中四列 使用K-means对X进行分类 根据分类进行排序 计算cluster=3时的平均值 计算cluster=2时的平均值 利用r...
在sklearn库中处理kmeans聚类问题,用到的是sklearn.cluster.KMeans 这个类 案列一 首先我们随机创建一些二维数据作为训练集,观察在不同的k值下...
主要的聚类算法可以划分为如下几类:划分方法、层次方法、基于密度的方法、基于网格的方法以及基于模型的方法。目前,聚类问题的研究不仅仅局限于上述的硬聚类(即每一个数据只能被归为一...