KNN的工作原理 1.计算待分类物体与其他物体之间的距离; 2.统计距离最近的K个邻居; 3.对于K个最近的邻居,他们属于哪个分类多,待分类物体...
贝叶斯公式 朴素贝叶斯 朴素贝叶斯的一个重要假设是:属性是相互独立的。这是一个强硬的假设,但实际情况下,这项技术对于绝大部分的复杂问题仍然非常有...
构造和剪枝 我们在做决策树的时候,会经历两个阶段:构造和剪枝。 构造就是生成一棵完整的决策树。简单来说,构造的过程就是选择什么属性作为节点的过程...
神经网络的结构如下图所示: 其中,代表第层的个激活单元,代表了从第层映射到第层的控制函数的权重矩阵。 如果神经网络在第层有个单元,在层有个单元,...
一、Anaconda简介 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理...
在数据分析之前,我们都需要让数据满足一定的规律,达到规范性的要求,便于进行挖掘。 如果不进行变换的话,要不就是维数过多增加了计算成本,要不就是数...
假设函数h: 引导从训练集x得到y的函数 代价函数: 平方差代价函数是解决线性回归问题最通用的函数。 有m个维度的代价函数用表示 梯度下降: 不...
一、机器学习定义 计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。 例如:邮件系统从人工标记垃圾...
Apply: 利用df.apply(func)的方法可以将函数func应用于DataFrame。 频率统计: df.value_counts()...