seaborn整体风格设置 sns.set() → 整体设置seaborn的主题,调色板,颜色代码等多个样式 sns.set_style() → 切换seaborn图表风格 ...
相关性分析 1、相关性分析是指对多个具备相关关系的变量进行分析,从而衡量变量间的相关程度或密切程度 2、相关性可以应用到所有数据的分析过程中,任何事物之间都是存在一定的联系 ...
柱状图 → plt.plot(kind='bar')/plt.bar() 柱状图:是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件)...
一、数据离散化 1、所谓离散化,就是把无限空间中的有限个体映射到一个有限的空间中。 2、数据离散化大多针对连续数据进行,处理后数据值域分布将从连续属性变为离散属性。 3、数据...
为了创造更多利润、实现数据驱动运营,某CD网站拟对18个月以来的近7万条消费数据进行分析。具体的研究思路如下: 1、数据获取与探索 1.1数据获取 数据来源:CDNow网站的...
一、项目背景 本次练习使用的数据集为美国城市巴尔的摩2016年公务员工资的数据集,将通过数据可视化和数据描述性分析等手段,分析其工资分布情况。 二、数据来源 本次使用的数据集...
谢谢,共勉~😄
python数据分析:小费数据集描述性分析一、项目背景 众所周知,在西方国家的服务行业中,顾客会给服务员一定金额的小费。本次项目研究对象是餐饮行业收集到的小费数据。 二、数据获取 本次项目的数据来源是python第三...
一、数据说明 本次演练的数据集为某企业业务部门的客户数据,将对该数据集进行数据预处理等操作。 二、缺失值判断及处理 从返回信息可知,数据结构为(1000,5),1000条数据...
一、异常值 1.异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称离群点,异常值的分析也称为离群点的分析 2.异常值的处理,先是辨别出哪些是异常值,再根据实际情...
一、缺失值处理 数据缺失主要包括记录缺失和字段信息缺失等情况,其对数据分析会有较大影响,导致结果不确定性更加显著 缺失值处理方法:丢弃 → 删除插补 → 均值、中位数、...
一、读取MySQL数据库 MySQL数据库是开源的关系型数据库,可以通过python与其进行连接。首先需要安装第三方库pymysql → pip install pymysq...
一、什么是JSON文件? JSON数据是一种轻量级得数据交换格式,因起简洁和清晰得层次结构使JSON成为理想的数据交换语言。 二、json文件读取 → pd.read_jso...
一、读取txt文件 → pd.read_table read_table,读取通用分隔符分隔得文件到数据框,返回DataFrame 二、读取csv文件 → pd.read_c...
一、项目背景 众所周知,在西方国家的服务行业中,顾客会给服务员一定金额的小费。本次项目研究对象是餐饮行业收集到的小费数据。 二、数据获取 本次项目的数据来源是python第三...
本次项目运用Python的matplotlib、pandas工具对数据进行可视化分析,并使用Powerpoint工具制作描述性分析报告。 附:数据源https://pan.b...
探索数据分析 作者:Blink 邮箱:592702703@qq.com 爱好:喜欢数据分析、可视化和机器学习,目前研究深度学习中。 可以结团Kaggle或...