编辑模式(Enter键启动)下快捷键: Tab键:代码补全/缩进shift + tab键:提示shift + enter键:运行Ctrl + Z...
1 导入数据,探索数据 输出结果 2 分集,优先探索标签 分训练集和测试集,并做描述性统计 先看标签是否存在问题 3 探索特征,开始处理特征矩阵...
二分类SVC的进阶 1. 二分类SVC中的样本不均衡问题:重要参数class_weight 样本不均衡是指在一组数据集中,标签的一类天生占有很大...
1 概述 支持向量机(SVM,也称为支持向量网络),是机器学习中获得关注最多的算法没有之一。从实际应用来看,在生物科学的尖端研究中,人们使用支持...
1 概述 无监督的算法在训练的时候只需要特征矩阵X,不需要标签。有监督学习是在模型在训练的时候,即需要特征矩阵X,也需要真实标签y。聚类算法又叫...
降维(PCA) PCA能够将原始数据集中重要的数据进行聚集。降维是减少特征的数量,又保留大部分有效信息——将那些带有重复信息的特征合并,并删除那...
特征选择 概念:就是从所有的特征中,选择出有意义,对模型有帮助的特征,以避免必须将所有特征都导入模型去训练的情况。特征选择常用的方法有:过滤法,...
1 python数据类型 Python中有六个标准的数据类型:Number(数字),String(字符串),List(列表),Tuple(元组)...
1. 机器学习中调参的基本思想 调参的目的就是为了提升模型的准确率。在机器学习中,我们用来衡量模型在未知数据上的准确率的指标,叫做泛化误差(Ge...
文集作者