pre:数据集导入及说明 包括用户行为数据和用户基本信息数据: 用户行为数据(用户id,行为类型[购买、浏览、收藏、加购],商品id,商品种类,...
一、数据常见的问题 包括但不限于:数据的完整性----例如人的属性中缺少性别、籍贯、年龄等数据的唯一性----例如不同来源的数据出现重复的情况数...
以下资源来源于B站秦路老师《七周成为数据分析师》[https://search.bilibili.com/all?keyword=%E4%B8%...
介绍两种方法 一、使用pymysql创建连接 首先要安装pymysql包 第一步,创建连接 其中,user表示用户名,password表示密码,...
以下资源来源于B站秦路老师《七周成为数据分析师》[https://search.bilibili.com/all?keyword=%E4%B8%...
第三次复习概率论与数理统计,希望理解比之前更深刻。仅代表本人理解,如果错误欢迎指出。 一、大数定理直观地理解是:当样本的容量足够大(或者实验的次...
一、概述 matplotlib是matlab绘图python中的应用。 二、图片和子图 plt绘制的图片都在一个图Figure对象上,绘制时首先...
一、两个基本数据结构 Series和DataFrame。其中Series的一维的,DateFrame是多维的。 二、与Numpy的不同 Nump...
一、基础知识1.numpy数组相比于Python普通数据类型的优点:向量化运算,可以针对整个数组进行运算而不需要写循环。2.数组对象:多维数组对...
文集作者