本背景基于智慧交通的流量预测,使用异常数据算法修正异常数据。
数据不清洁对于预测模型影响非常大,甚至要超越模型本身。可以采用全局常量填充,或者使用属性平均值填充,而复杂的可以是用回归、贝叶斯以及决策树等数据清理手段。
因为整个城市的交通网庞大、需要预测的流量值多,用于一场数据修正算法的复杂度不能很大,要尽量小,移动平均值方法就不错,我们可以选择过去三个值得历史数据作为一场数据的替代值来达到数据清洗目的。这里我们使用过去p个时刻的流量值来计算交通流量变量f在任意时刻t的值,表示为:
但是在现实生活中,大车和小车使用该方法一起计算会有偏差,大车需要根据其长度大小经过折算之后才算是最终的交通流量,我们这里将大车折算为1.5倍小车。