一共 15 篇随笔,主要是为了记录数据分析过程中的一些小 demo,分享给其他需要的网友,更为了方便以后自己查看,15 篇随笔,每篇内容基本都是...
字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将...
数据转换指的是对数据的过滤、清理以及其他的转换操作。 移除重复数据 DataFrame里经常会出现重复行,DataFrame提供一个duplic...
数据不完整在数据分析的过程中很常见。pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据。pandas使用isnull()和notnul...
层次化索引 层次化索引是你能在一个数组上拥有多个索引,例如: 有点像Excel里的合并单元格对么? 以外层索引的方式选择数据子集: 以内层索引的...
重塑 重塑指的是将数据重新排列,也叫轴向旋转。 DataFrame提供了两个方法: stack: 将数据的列“旋转”为行。 unstack:将数...
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并; pandas.concat()方法:...
pandas 对象拥有一些常用的数学和统计方法。 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行...
矢量化指的是用数组表达式代替循环来操作数组里的每个元素。 通用函数(ufunc函数) NumPy提供的通用函数(既ufunc函数)是一种对nda...
文集作者