240 发简信
IP属地:广东
  • Resize,w 360,h 240
    TASL05 模型建立和评估

    库的作用的了解 numpy:多用于科学计算中存储和处理大型矩阵,是数据科学实践中最常用的模块 pandas:数据处理模块,之前数据读入,检查重复...

  • Resize,w 360,h 240
    Task04:数据可视化

    可视化思路 单个变量单个定性变量:柱状图,条形图,饼图,环形图。反映定性变量的各个水平的频数分布或占比单个定量变量:直方图,箱线图。反映数据的分...

  • Resize,w 360,h 240
    Task03:数据重构

    1.数据合并 1.1数据合并方法对比 pd.merge:数据横向合并,merge(左表,右表)输入两个数据框,设置on参数就是按照某共同列合并,...

  • Task02:数据清洗及特征处理

    此任务主要是对数据进清洗,包括缺失值、重复值的处理;特征观察与处理:分箱、分类变量的one-hot编码处理。此外还涉及到了从Name中提取Tit...

  • Task01:数据加载及探索性数据分析

    读入数据 读入少量数据 查看或修改工作目录 读入数据.xlsx数据:pd.read_excel(r"路径",sheet_name)。要注意当有多...

  • Resize,w 360,h 240
    线性回归

    总结 线性回归是有监督学习里最常见也是最简单的一种形式,可以分为一元线性回归和多元线性回归,适用情况为是连续型数据,为任意数据。内容主要分为:基...

  • 抽样学习过程中遇到的Python问题

    1. from···import···与import···as··· from A import b,相当于A.b,即从A包中引入b类/函数。举...

  • 关于Jupyter Notebook的一些非常基础的问题的解决

    写在前面:纯粹是个人的学习笔记,防丢失用,也都附上了参考网址,如有侵权一定删除。 jupyter notebook的帮助文档 问题1:如何解决p...

  • Resize,w 360,h 240
    anaconda的安装与环境配置

    PS:非计算机专业,不懂专业术语,不能帮助解决问题,只是提供一个经过多次实验都没有问题的安装办法。 1.下载 关于下载有两个方法:①anacon...