一. 概述
在数据处理工作中,经常会遇到一种情况:给出一个日期序列,序列中缺少某几天,我们需要找出缺失的日期,并将其填补出来。
具体看下面这个数据:
观察数据可以发现日期序列中缺了好几天,接下来我们需要对这个序列进行填补。
二.关键函数date_range()
date_range是pandas空间下的函数,主要功能是给定一个开始日期,一个终止日期,按照指定的频率,生成一个日期索引,请注意生成的是一个日期索引!!!!
pandas.date_range(start=None, end=None, periods=None, freq=None, tz=None, normalize=False, name=None, closed=None, **kwargs)
- start : 开始日期:str
- end : 终止日期:str
- periods : 时间长度,如果仅给出开始/终止日期中的一个,可以与该参数搭配使用:int
- freq : 频率:str:'D'/'M'/'Y'等等
- tz : 时区,一般默认即可:str :‘Asia/Hong_Kong’
- name : 生成的日期序列的索引名字:str
- closed : 是否包含开始/终止日期:str:left/right/none
三.填补方法
- 利用date_range()生成一个完整的时间索引
- 利用reindex()重述数据索引(可以补充缺失索引)
看一下源码: