结构时间序列模型

状态空间模型为时间序列分析提供了一种灵活的方法,尤其是在简化最大似然估计和处理缺失值方面。

结构时间序列模型(structural time series model)

最基本的一元不可观测项模型,具有形式


其中,μt,γt和ωt分别表示不可观测的趋势项、季节项、循环项。et表示不可观测的不规则项。在文献中,通常用非平稳(可能带二重单位根)模型来描述趋势项:


如果σζ=0,则μt服从带漂移β1的随机游走。如果ση=σζ=0,则μt表示确定性的线性趋势。
以下内容2016.5.8更新

·关于季节效应(seasonal effect)
在时间序列分析中,重复出现的模式被称为季节效应。当时间序列由每小时、每天、每月或每季度的观测值构成,则其重复周期为24(小时)、7(天)、12(月)或者4(季度),这就需要注意时间序列所存在的季节效应。
在状态空间框架下,季节效应可应用在局部水平模型或者局部线性趋势模型中增加季节成分来建模。

·关于诊断检验
线性高斯模型的所有显著性检验都基于对三个残差假设的分析。这些残差应当满足如下三个特性,按重要性依次列出:
(1)独立性(independence)
(2)同方差(homoscedasticity)
(3)正态分布(normality)

先从第一个也是最重要的假设开始:独立性。残差的独立性假设可以被Ljung-Box Q统计量查证。

摘录一段解释:

什么是LBQ统计量?

Ljung-Box q 统计量用于检验某个时间段内的一系列观测值是不是随机的独立观测值。如果观测值并非彼此独立,一个观测值可能会在 k 个时间单位后与另一个观测值相关,形成一种称为自相关的关系。自相关会削减基于时间的预测模型(例如时间序列图)的准确性,并导致数据的错误解释。

例如,一家电子公司对电池的月销售量跟踪记录五年。他们想使用这些数据来设计一个时间序列模型,以帮助预测未来的销售额。但是,月销售额可能会受季节趋势影响。例如,当人们为圣诞玩具购买电池时,每年这个时候的销售额都会提升。因此某一年的月销售额观测值可能会与 12 个月后(滞后为 12)的月销售额观测值相关。

在选择时间序列模型之前,他们可以评估月销售额差异的自相关。Ljung-Box Q (LBQ) 统计量将检验最多滞后 k 的自相关等于零的原假设(即,数据值在某一滞后数 — 在本例中为 12 — 之前是随机和独立的)。如果 LBQ 大于特定临界值,则一个或多个滞后的自相关可能显著不同于零,说明在这段时间内各个值并不是独立和随机的。

LBQ 还用于在拟合时间序列模型(例如 ARIMA)后评估假设,以确保残差彼此独立。

Ljung-Box 是一种 Portmanteau 检验,同时也是 Box-Pierce 卡方统计量的修订版。

Q统计量是一般性总括检验,自相关分析图中,用来检查K阶联合自相关系数是否偏离零值。临界值为K阶的卡方分布临界值χ2(K;0.05)。若 Q统计量值大于临界值,则整个前K阶自相关系数估计值偏离于零,意味着独立性的零假设被拒绝。若观测值的Q统计量小于临界值,则独立性的零假设未被拒绝,即没有理由假设残差存在序列相关。

独立性还可以用残差的滞后1阶自相关系数r(1)的值来检验。其临界值为95%的置信区间±2/sqrt(n)。当r(1)值在这个区间内时,则假设成立,反之被拒绝。

第二个重要的假设是残差的同方差假设。

在STAMP中,该假设是由H统计量来检验的。我找了好久资料也没有找到这个所谓的H统计量的来源,可能是自己定义的。姑且先不追根溯源,这个H统计量检验残差的两个相同部分的连续方差是否相等。H(h)的值与F(h,h;0.025)进行比较,若H(h)>1,则当其小于F值时,假设成立,反之被拒绝;若H(h)<1,则利用1/H(h)与F值进行比较。

P.S. F分布临界值可以用EXCEL函数FINV(probability, deg_freedom1, deg_freedom2)计算。

第三个重要的假设是残差为正态分布。

在STAMP中,N统计量检验残差分布的偏度和峰度是否符合正态分布。使用自由度为2的卡方分布来检验。χ2(2;0.05)=5.99,若N小于这个值,则零假设没有被拒绝,反之被拒绝。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,670评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,928评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,926评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,238评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,112评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,138评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,545评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,232评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,496评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,596评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,369评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,226评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,600评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,906评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,185评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,516评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,721评论 2 335

推荐阅读更多精彩内容

  • 本系列第三篇,承接前面的《浅谈机器学习基础》和《浅谈深度学习基础》。 自然语言处理绪论 什么是自然语言处理? 自然...
    我偏笑_NSNirvana阅读 17,456评论 2 68
  • 【概述】 SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧(分类正确性即“分得开”),且样本到超平面...
    sealaes阅读 10,909评论 0 7
  • 早知如此,我宁愿他看不到,什么都看不到。而我,则可以做他一辈子的眼睛,陪他,照顾他一辈子。 可如今,说什么都晚了,...
    般若9阅读 448评论 5 1
  • 穷困的。 到底是心,还是物质? 人常说知足常乐,我现在拥有的,父母的爱,朋友的拥护,爱人的关怀。日子如浮闲的云朵,...
    疯人愿的我也好阅读 240评论 0 1
  • 《杨树湾里有个杨树》 文,陈爱芳 杨树湾里不仅杨树多得远近闻名,更有一个叫杨树的光棍也是声名远播,家喻户晓...
    芊芊细竹陈爱芳阅读 373评论 0 0