库的作用的了解 numpy:多用于科学计算中存储和处理大型矩阵,是数据科学实践中最常用的模块 pandas:数据处理模块,之前数据读入,检查重复...
可视化思路 单个变量单个定性变量:柱状图,条形图,饼图,环形图。反映定性变量的各个水平的频数分布或占比单个定量变量:直方图,箱线图。反映数据的分...
1.数据合并 1.1数据合并方法对比 pd.merge:数据横向合并,merge(左表,右表)输入两个数据框,设置on参数就是按照某共同列合并,...
此任务主要是对数据进清洗,包括缺失值、重复值的处理;特征观察与处理:分箱、分类变量的one-hot编码处理。此外还涉及到了从Name中提取Tit...
读入数据 读入少量数据 查看或修改工作目录 读入数据.xlsx数据:pd.read_excel(r"路径",sheet_name)。要注意当有多...
总结 线性回归是有监督学习里最常见也是最简单的一种形式,可以分为一元线性回归和多元线性回归,适用情况为是连续型数据,为任意数据。内容主要分为:基...
1. from···import···与import···as··· from A import b,相当于A.b,即从A包中引入b类/函数。举...
写在前面:纯粹是个人的学习笔记,防丢失用,也都附上了参考网址,如有侵权一定删除。 jupyter notebook的帮助文档 问题1:如何解决p...
PS:非计算机专业,不懂专业术语,不能帮助解决问题,只是提供一个经过多次实验都没有问题的安装办法。 1.下载 关于下载有两个方法:①anacon...