EX1: 读入数据后,使用表达式提取出precsision、model_name、type和time_val。 再横向连接两表,去除重复列,精度保留三位小数。 后面就不知道咋...
EX1: 读入数据后,使用表达式提取出precsision、model_name、type和time_val。 再横向连接两表,去除重复列,精度保留三位小数。 后面就不知道咋...
首先导入需要的包。 接下来读入100行数据,查看数据大致情况。 从图中可以看出,每行数据均有14个字段。 我们读入数据的id,分类和上传时间字段。大致统计一下数据。 我们统计...
今天学习的是时序数据, 1. 时序中的基本对象 概念 单元素类型 数组类型Datatimes Timestamp DatetimeIndexTimedeltas Tiimed...
这章学的是分类。 cat对象 通过cat对象的categories属性能够完成对类别的查询。 有序分类 有序类别和无序类别可以通过 as_unordered 和 reorde...
这一章学习的是文本数据,主要学习的是正则表达式的应用。 正则表达式 我觉得这张表非常有用。 还有这张简写字符集表 文本处理五类操作 拆分:str.split方法,能够把字符串...
这一张学习的是缺失值的统计删除与填充。是咱们进行数据清洗必须要掌握的知识。 1. 缺失信息的统计 缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个...
首先读入2张表 这两张表的证券代码和日期字段不一致,先整成一样的。 最后根据给出的故公式定义下熵函数。将2张表连接起来之后再使用apply调用熵函数计算。 第二题没整出来 随...
今天学习的是第六章连接。其基本概念就是把两张相关的表按照某一个或某一组键连接起来。例如学生期末考试各个科目的成绩表按照 姓名 和 班级 连接成总的成绩表,又例如对企业员工的各...
这章学习的知识我在之前从未接触过,不知道pandas还有这些功能函数。感觉有点抽象。 一、长宽表的变形 1. pivot 长表变宽表 2. melt pivot的逆运算,将宽...
今天学习的是第四章--分组,我觉得是非常重要和有用的pandas知识。这章主要围绕着groubpy函数,介绍了在其之上的agg、transform、apply等函数的应用。教...
今天学习了第三章索引。我觉得比较有用的是loc函数与iloc函数的应用,我之前在做实验时经常用到这2个函数,今天终于系统地学习了下,感觉作者写的很好。相比于上一章,这一章的练...
今天学习的是第二章Pandas基础。有几个函数我觉得挺有用的,记录一下: 唯一值函数unique和nunique、以及value_counts唯一值函数 要观察多个列组合的唯...
今天是Pandas学习的第一天,学习的是预备知识,主要分为Python基础和NumPy基础。 Python基础 这一章 教程介绍的大多我都已经掌握了,就没有细看。 NumPy...
常用算法代码 冒泡排序 稳定性由于在比较过程中,当两个相同大小的元素相邻,只比较大或者小,但不会交换位置。而当两个相等元素距离较远时,也只会把它们交换到相邻的位置。也就是说排...