KNN的工作原理 1.计算待分类物体与其他物体之间的距离; 2.统计距离最近的K个邻居; 3.对于K个最近的邻居,他们属于哪个分类多,待分类物体就属于哪一类。 (注:K值的具...
KNN的工作原理 1.计算待分类物体与其他物体之间的距离; 2.统计距离最近的K个邻居; 3.对于K个最近的邻居,他们属于哪个分类多,待分类物体就属于哪一类。 (注:K值的具...
贝叶斯公式 朴素贝叶斯 朴素贝叶斯的一个重要假设是:属性是相互独立的。这是一个强硬的假设,但实际情况下,这项技术对于绝大部分的复杂问题仍然非常有效。 假设我们想求在A1、A2...
构造和剪枝 我们在做决策树的时候,会经历两个阶段:构造和剪枝。 构造就是生成一棵完整的决策树。简单来说,构造的过程就是选择什么属性作为节点的过程。 在构造过程中,会存在三种节...
神经网络的结构如下图所示: 其中,代表第层的个激活单元,代表了从第层映射到第层的控制函数的权重矩阵。 如果神经网络在第层有个单元,在层有个单元,则为一个大小的矩阵。 令, 则...
一、Anaconda简介 Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,基于Apac...
在数据分析之前,我们都需要让数据满足一定的规律,达到规范性的要求,便于进行挖掘。 如果不进行变换的话,要不就是维数过多增加了计算成本,要不就是数据过于集中,很难找到数据之间的...
和大多数默默无闻的加班狗一样,在下也是每天除了写代码就是改bug,时常逛逛简书,知乎,csdn。看着一个个大佬发的技术文章,瑟瑟发抖,心里也总是会想有时间也去多看看书提(q...
假设函数h: 引导从训练集x得到y的函数 代价函数: 平方差代价函数是解决线性回归问题最通用的函数。 有m个维度的代价函数用表示 梯度下降: 不同的局部最优解 对于第j个系数...
一、机器学习定义 计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。 例如:邮件系统从人工标记垃圾邮件中学习分类邮件。将邮件根据...
Apply: 利用df.apply(func)的方法可以将函数func应用于DataFrame。 频率统计: df.value_counts() 可以统计df中各元素出现的频...
DataFrame是一个二维的有标签的数据结构,可以拥有不同类型的列。DataFrame可以被看作一张SQL表格,或者Series的字典。 与Series相似,DataFra...
Series是一个一维的带有标记的数组,它可以储存任何类型的数据。 对于Series,它的参数index是一个轴标签的list,对于不同类型的数据,index的类型可能不同:...
一、关于UUID UUID 是 通用唯一识别码(Universally Unique Identifier)的缩写,是一种软件建构的标准,亦为开放软件基金会组织在分布式计算环...
一、关于RQAlpha RQAlpha是一个由米筐科技Ricequant开源的Python算法交易和回测引擎,适合A股市场,是事件驱动的设计。RQAlpha 从数据获取、算法...
参考来源:https://www.cnblogs.com/ArsenalfanInECNU/p/5346751.html 在导入python的package时,使用 . 或者...
1.共享锁:数据库在执行查询操作时会向table添加共享锁,不同的共享锁之间是兼容的,这意味着共享锁不阻止其它session同时读资源。 2.互斥锁:数据库在执行update...
事务:是一系列的数据库操作,是数据库应用的基本逻辑单位。 数据库的特性: 1.原子性:即不可分割性,事务要么全部被执行,要么就全部不被执行。 2.一致性:事务必须使数据库从一...
一、数据库索引的作用 1.唯一性索引可以确保每一行数据的唯一性。 2.索引可以大大加快数据的检索速度。 3.可以加快表与表之间的连接。 4.在使用分组和排序子句进行数据检索时...
一、time.sleep(seconds) 固定等待 import time time.sleep(3) #等待3秒 time.sleep(seconds) seconds参...
一、元素定位简介 八种属性定位页面元素: By.ID By.XPATH By.LINK_TEXT By.PARTIAL_LINK_TEXT By.NAME By.TAG_NA...