分类模型的评价指标 问题:如何评判两部手机的好坏?1.根据性能评价2.根据外观评价3.根据价格评价 分析:如果对一个事物进行好坏的评价,首先我们一定是在指定场景下,使用符合该...
分类模型的评价指标 问题:如何评判两部手机的好坏?1.根据性能评价2.根据外观评价3.根据价格评价 分析:如果对一个事物进行好坏的评价,首先我们一定是在指定场景下,使用符合该...
逻辑回归 逻辑回归,是一种名为“回归”的线性分类器,其本质是由线性回归变化而来的,一种广泛使用于分类问题中的广义回归算法 其中𝛉0被称为截距(intercept), 𝛉1~𝛉...
IV 概念:IV的全称是Information Value,中文意思是信息价值,或者信息量。 作用:构建分类模型时,对特征进行筛选,挑选特征时 用来衡量自变量(特征)的预测能...
样本类别分布不均衡处理 什么是样本类别分布不均衡? 举例说明,在一组样本中不同类别的样本量差异非常大,比如拥有1000条数据样本的数据集中,有一类样本的分类只占有10条,此时...
朴素贝叶斯算法 概率基础 算法介绍 朴素贝叶斯是一种直接衡量标签和特征之间的概率关系的有监督学习算法,是一种专注分类的算法。朴素贝叶斯的算法根源就是基于概率论和数理统计的贝叶...
回顾 什么是回归问题如果需要处理的标签数据为连续性数据,则该问题为回归问题 什么是线性回归就是在找寻特征数据和标签数据之间的线性关系,可以使用权重系数来表示。权重系数的个数一...
线性回归+回归算法的评价指标 回归问题的判定目标值是连续性的值,而分类问题的目标值是离散型的值。 回归处理的问题为预测:预测房价销售额的预测设定贷款额度总结:上述案例中,可以...
KNN+交叉验证 复习 机器学习概述概念样本 特征工程概念作用特征抽取特征值化one-hotjieba分词特征的预处理归一化标准化特征选择PCA方差过滤 机器学习基础数据集的...
sklearn的数据集 数据集划分 数据集接口介绍 数据集划分 前提:机器学习就是从数据中自动分析获得规律,并利用规律对未知数据进行预测。换句话说,我们的模型一定是要经过样本...
1.特征工程 特征抽取 数据特征的预处理 特征选择 为什么需要特征工程对特征中的相关的噪点数据进行处理的,营造出更纯净的样本集,让模型基于数据更好预测(数据集越纯净则越便于让...
机器学习简介 祖师爷艾伦.图灵,人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天,你不知道对方是人还是机器,如果经过聊天后,你分辨不出谁是人谁是机器则说明这...
谢谢
前端前端 前端:任何与用户直接打交道的操作界面都可以称之为前端比如:电脑界面 手机界面 平板界面 后端:后端类似于幕后操作者(一堆让人头皮发麻的代码),不直接跟用户打交道 HTM...
给小姐姐点赞,学习好认真
综合项目需求 第一部分:数据类型处理 数据加载字段含义:user_id:用户IDorder_dt:购买日期order_product:购买产品的数量order_amount:...
用户对于购买商品的行为分析需求 加载数据:UserBehavior.csv1.数据说明.png 数据量级达到一亿,考虑到电脑性能问题,故随机抽样其中的100万左右数据作为本次...
加载购买商品表的数据购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期 考虑到属性字段,都是一些编号,没办法具体分析,因此去除该...
matplotlib绘图 plt.plot()绘制线性图 绘制单条线形图 绘制多条线形图 设置坐标系的比例plt.figure(figsize=(a,b)) 设置图例lege...
2012美国大选献金项目数据分析 需求 加载数据 查看数据的基本信息 指定数据截取,将如下字段的数据进行提取,其他数据舍弃cand_nm :候选人姓名contbr_nm : ...
pandas高级操作 需要导入的模块 1.替换操作 替换操作可以同步作用于Series和DataFrame中 单值替换普通替换: 替换所有符合要求的元素:to_replace...