1.3.1 描述性时序分析
早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就成为描述性时序分析。古埃及人发现尼罗河泛滥的规律就是依靠这种分析方法。而在天文、物理、海洋学等自然科学领域,这种简单的描述性时序分析方法也常常使人们发现意想不到的规律。
比如根据《史记 货殖列传》记载,早在春秋战国时期,范蠡和计然就提出我国农业生产具有“六岁穰、六岁旱,十二岁一大饥”的自然规律。《越绝书 计倪内经》则描述的更加详细,“太阴三岁处金则穰,三岁处氺则毁,三岁处木则康,三岁处火则旱......天下六岁一穰,六岁一康,凡十二岁一饥”。
用现代汉语来表述就是“木星绕天空运行,运行三年,如果处于金位,则该年为大丰收年;如果处于水位,则该年为大灾年;再运行三年,如果处于木位,则该年为小丰收年,如果处于火位,则该年为小灾年,所以天下平均六年一个大丰收年,六年一个小丰收年,十二年为一个大饥荒”。这是2500多年前,我国对农业生成具有3年一个小波动,12年左右一个大周期的记录,是一个典型的描述性时间序列分析。
描述性时序序列分析方法是人民在认识自然、改造自然的过程中发现的实用方法,对于很多自然现象,只要人们观察时间足够长,就能运描述性时序分析发现蕴含在时间里的自然规律,根据自然规律,做恰当的政策安排,就能有利于社会的发展和进步。
人们没有采取任何复杂的模型或分析方法,仅仅是按照时间序列收集数据,描述和呈现序列的波动,就了解到小麦产量的周期波动特征,产生该周期特征的气候原因以及周期波动对价格的影响。操作简单,直观有效是描述性时间序列分析方法的突出特点。它通常也是人们进行统计时序分析的第一步,通过图示的方法直观的反映出序列的波动特征。
1.3.2 统计时序分析
随着研究领域的不断拓广,人们发现单纯的描述性时序分析有很大的局限性,在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对时序序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的。
为了更准确的估计随机时序发展变化的规律,从20世纪20年代开始,学术界利用数理统计学原理分析时序序列。研究重心从总结表现现象转移到分析序列值内在的相互关系上,由此开辟了一门应用统计学科,时序序列分析。
纵观时间序列分析方法的发展历史可以将时间序列分析方法分为两大类。
一 频域分析方法
频域分析方法也成为频谱分析或谱分析方法
早期的频谱分析方法假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动,借助傅里叶分析从频率的角度揭示时间序列的规律,后来又借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数。20世纪60年代,burg在分析地震信号时提出最大熵谱值估值理论,该理论克服了传统谱分析所有雇的分辨率不高和频率漏泄等缺点,使得谱分析仅以一个新阶段,称之为现代谱分析阶段。
目前谱分析方法主要用于电器工程,信息工程,物理学,天文学,海洋学和气象科学等领域,它是一种非常有用的纵向数据分析方法,但是由于谱分析过程一般都比较复杂,研究人员通常需要很强的数学基础才能熟练使用它,同时它的分析结果也比较抽象,不易于进行直观的解释,所以谱分析方法的使用具有很大的局限性。
二 时域分析法
时域(time domain)分析方法主要是从序列自相关的角度解释时间序列的发展规律。相对于谱分析方法,它具有理论基础扎实、操作步骤规范、分析结果易于解释等有点。目前它已经广泛应用于自然科学和社会科学的各个领域,成为时间序列分析的主流方法。本书就是介绍时域分析方法。
时域分析方法的基本思想是事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在一定的相互关系,而且这种相互关系具有某种统计规律。我们分析的重点就是寻找这种规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型来预测序列未来的走势。
时域分析方法具有相对固定的分析套路,通常都遵循如下分析步骤:
- 第一步:考虑观察值序列的特征
- 第二步:根据序列的特征选择适当拟合模型
- 第三步:根据序列的观察数据确定模型的口径
- 第四步:检验模型,优化模型
- 第五步:利用拟合好的模型来推断序列的其他统计性质或预测序列将来的发展。
时域分析方法的产生最早可以最早追溯到1987年,英国统计学家G.M.JenKins联合出版了 Times Series Ananlysis Forecasting and Control一书。在书中,Box和Jenkins在总结前人的基础上,系统的阐述了对求和自回归移动平均(autoregressive integrated moving average)ARIMA模型的识别、估计、检验及预测的原理和方法。这些知识现在被称为经典的时序序列分析方法,是时域分析的核心方法。为了纪念Box和Jinkens对时间序列的发展的特殊贡献,现在人们也常把ARIMA模型称为Box-Jenkins模型。
Box-Jenkins模型实际上是主要运用于单变量、同方差的线性模型。随着人们对各领域时序序列的深入研究,发现该经典模型在理论和应用上都还存在许多局限性。所以近20年来,统计学家纷纷转向多变量场合、异方差场合和非线性场合的时序序列分析方法的研究,并且取得了突破进展。
异方差
- 美国统计学家、计量经济学家Robert F Engle在1982年提出了自回归条件异方差(ARCH)模型
- Bollerslov在1985年提出了广义自回归条件异方差模型(GARCH)
- Nelson等人又提出了指数广义自回归条件异方差(EGARCH)模型,方差无穷广义自回归条件异方差(IGARCH)和依均值广义自回归条件异方差(GARCH-M)模型
非线性场合
- Granger和Andersen在1987年提出了双线性模型
- Howell Tong与1987年提出门限自回归模型
- Priestley于1980年提出了状态相依模型
- Hamilton于1989年提出了马尔科夫转移模型
- Lewis和Stevens于1991年提出了多元适应回归样条方法
- Carlin于1992年提出了非线性状态空间建模的方法
- Chen和Tsay于1993年提出了非线性可加自回归模型