




已阅读5页,还剩49页未读, 继续免费阅读
(概率论与数理统计专业论文)基于状态空间模型的时序数据的处理与分析研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学硕士研究生学位论文第l 页 摘要 时间序列分析是统计学中的一个重要分支,是基于随机过程理论和数理统 计学的一种重要方法和应用研究领域时间序列按统计特性可以分为平稳时间 序列和非平稳时间序列两类在实际生活中,我们经常遇到的序列,特别是反映 社会、经济现象的序列,大多数并不平稳,如果能够正确的预测这些序列,就 可以对社会、经济的发展起到很好的控制和指导作用而如果能正确分解这些序 列成季节、循环、趋势、随机等因素的影响,有非常深远的意义因此研究动态 数据的建模与预测具有很重要的现实意义同时是一个具有相当高的实际价值 的应用研究领域。 在阐述时间序列一般建模的基础之上,重点研究了状态空间模型方法,首 先将时间序列转化为状态空间,同时对模型的未知参数进行极大似然估计,然后 采用k a l m a n 滤波对非平稳时间序列进行外推、内插及平滑,计算出每个时刻的 状态向量文章先后介绍了e m 算法,k a l m a n 滤波、k a l m a n 平滑及预测方法并 且在算法e m 程序,k a l m a n 滤波、平滑及预测的程序之上,针对中国c p l 月度数 据编写了这几个程序结合在一起的应用程序,对c p l 月度数据进行了拟合及预 测,效果较好又在此基础上还对中国c p l 月度数据用传统的x - 1 1 - a r i f l a 方法 进行了分析,最后对用状态空间模型方法处理与分析得出的结果和用一般传统 的分解方法处理与分析得出的结果作了个比较,并作出了分析与总结 关键字:状态空间模型;状态空间模型方法;时间序列分析;k a l m a n 滤波; e m 算法;x 一1 卜a r i m a 方法; 西南交通大学硕士研究生学位论文第1 i 页 a b s t r a c t t i m es e r i e sa n a l y s i si sa ni m p o r t a n tm e t h o dt od e a lw i t ha n da n a l y z e d y n a m i cd a t aw h i c hi sb a s e do np r o b a b i l i t ya n ds t a t i s t i c s t i m es e r i e s c a nb ed i v i d e di n t os m o o t ho n e sa n du n s m o o t ho n e sa c c o r d i n gt os t a t i s t i c a l c h a r a c t e r i np r a c t i c em o s to ft h es e r i e sw h i c hw em e e t ,e s p e c i a l l yt h e s e r i e sr e f l e c t i n gs o c i a l a n de c o n o m i cp h e n o m e n aa r eo f t e nu n s m o o t h f o r e c a s t i n gs u c hs e r i e sp r o p e r l yc a nc o n t r o la n ds u p e r v is et h e d e v e l o p m e n to fs o c i e t ya n de c o n o m y a n dt h e ni tw i l lb ef a r r e a c h i n g l y m e a n i n g f u l t oa s s o r tt h e s es e r i e si n t o p a r t s o f s e a s o n , c i r c u l a t i o n ,t r e n d l i n ea n dr a n d o m s of o r e c a s t i n ga n dm o d e l i n go fd y n a m i c d a t aa r ev e r yi m p o r t a n ti nr e a lit ya n da p p ll e dr e s e a r c h b a s e do ng e n e r a lm e t h o d so fb u il dm o l d e l i n gt h i sp a p e rm a i n l ys t u d y s t a t e s p a c em o d e li n gm e t h o d sb a s e do ng e n e r a lm o d elin ga n di n t r o d u c ee m a l g o r i t i m ,k a l m a nf i l t e r i n g - w a v e ,f i l t e r i n g s m o o t h n e s sa n df o r e c a s t i n g m e t h o d s a c c o r d i n gt oc h i n e s ec p im o n t h l yd a t a ,t h ep a p e rp r e s e n t sa n a p p ll e dp r o c e d u r e b a s e do no t h e r p r o c e d u r e s s u c ha s e m ,k a l m a n f il t e r i n g w a v e ,s m o o t h n e s sa n du s e si tt oa n a l y z ea n df o r e c a s tt oo b t a i n b e t t e rr e s u l t st h a nt h eg e n e r a lm e t h o d so fx - 1l a r i m a k e y w o r d s : s t a t e s p a c em o d e l :t h em e t h o d so fs t a t e s p a c em o d e l :t h et i m es e r i e s a n a l y s is :k a l m a nf il t e r i n g w a v e :e ma l g o r it h m 西南交通大学学位论文创新性声明 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所 得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中作了明确的说明。本人完全意识到本声明的法律结果由本人承担。 本学位论文的主要创新点如下: 在e m 算法,k a l m a n 滤波、平滑程序的基础之上,以中国c p l 月度数据为 例编写个应用程序并得出相应的结果,再用x l l a r i m a 季节调整方法对同样的 数据加以处理,最后对两种模型方法分解得出的结果进行分析说明 学位论文作者签名:l 啤闷 日期:知。拿曲 西南交通大学曲南交迥大罕 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密7 j ,在年解密后适用本授权书; 2 不保密囱,使用本授权书。 ( 请在以上方框内打“”) 一翥留舞f 赢醐:加撕f 醐: 西南交通大学硕士研究生学位论文第1 页 1 1 时间序列综述 第1 章绪论 时间序列是指同种现象在不同时间上的相继观察值排列而成的一组数字 序列时间序列的例子随处可见,不论是经济领域中每年的产值、国民收入、股 票的市盈率等,还是社会领域中某一地区的入口数、医院患病者人数、铁路客 流量等,还是自然领域的太阳黑子数、月降水量、河流流量等等,统计学家通常 把一个时间序列看作是一个随机过程的实现,通过对时间序列的分析来理解所 观察到的动态系统、预测将来事件、通过干预来控制将来事件时间序列分析依 赖于将来的统计建模,通过建模,可以对时间序列进行定量的描述,揭示其内在 的规律和特征从线性到非线性,从平稳到非平稳,从单一方程到联立方程,时 间序列的建模逐渐日趋完善 1 2 研究背景及意义 目前研究时间序列较有效的方法- b o x j e n k i n s 建模方法,它是以美国著 名的统计学专家b o x 和英国的j e n k i n s 名字命名的一种时间序列预测方法运用 a r i m a 模型的前提条件是,用作预测的时间序列是平稳序列,对于非平稳序列则 可通过适当地变换( 如差分、取对数) 将它变为平稳序列,再利用a r i m a 模型 进行建模但这种单一函数变换的方法将非平稳转化为平稳的能力有限的,并且 需要一定的技巧早在1 9 6 5 年就推出了著名的x - 1 1 季节调整程序,只是该程序 从研制到定型一直是以经验为基础的,所借助的主要工具是对称滑动平均,另 外,x - i 1 程序在使用中也存在一些不足之处,例如对于不同时间序列的适应性 不够理想,在进行滑动平均时序列两端出现欠值,影响预测和调整效果等六 西南交通大学硕士研究生学位论文第2 页 十年代末在b o x 和j e n k i n s 等人的的推动下时间序列分析的理论和方法得到迅 速发展,t i a o 和h i l l m e r 用随机模型的方法研究了基于a r i m a 模型的季节调整 问题,并找出了与x - 1 l 程序相对应的a r i m a 模型在此基础上加拿大d a g u m 提 出了x - 1 卜a r i 凇程序,该程序将b o x - j e n k i n s 的随机建模方法引入了x 一1 1 程 序,其目的是改进序列端值的拟合预测效果“1 进入七十年代以来,日本统计学 家赤池弘次( a k a i k e ) 1 9 7 9 年提出了季节调整的b a y e s 模型,并以1 9 8 0 年发表 了b a y e s e a 程序,程序的基本思想是将b a y e s 模型及有关理论应用于季节调整, 该程序能灵活地处理贸易日、闰年、丢失数据及野值n ,八十年代初,h a r v e y a c 和k i t a g a w a 等人运用状态空间方法对具有趋势和季节性的时间序列建立状态 空间模型,从而成功地将k a l m a n 滤波引入时间序列分析领域利用状态空间方 法可将时间序列分解为趋势、季节、循环和不规则项四个部分而前面所叙述的 一些方法仅只能将序列分解为趋势、季节、不规则项三部分,而非季节性的周 期变化( 循环项) 包含在趋势部分中,k i t a g a w a 在1 9 8 4 年给出了时间序列状态 空间分解的d e c o m p 程序,利用该方法效果与b a y e s 方法相近,但计算量小于 b a y e s 方法将状态空间方法应用于时间序列分析是当前令人瞩目的发展方向 1 3 基于状态空间模型的时间序列模型发展简介 时间序列数据大多数都是以非平稳形式出现的,而最行之有效的方法就是把 序列分解成趋势、季节、循环、随机等因素结合当前现状,基于状态空间与 k a l m a n 滤波分解时间序列是目前有关时间序列分析的最热门领域,也是统计学 界的前沿话题之一状态空间方法最早是现代控制理论创始人之一r e k a l m a n 于1 9 6 0 年在论文an e wa p p r o a c ht ol i n e a rf i t e r i n ga n dp r e d i c t i o n p r o b l e m 中提出的状态空间方法是一种时域方法,其中引入了状态变量概念, 用状态方程描写动态系统,用量测方程描写量测信息,由状态方程和量测方程 西南交通大学硕士研究生学位论文第3 页 构成状态空间模型啪1 t 9 8 7 年日本的m s a n a oa o k 出版了有关状态空间建模的专著 s t a t es p a c e m o d e l i n go ft i m es e r i e s ,开始了时间序列状态空间分析的新纪元”但是有 关篇幅很少,缺乏系统的理论性对于以状态空间模型为框架的时间序列预测方 法,具有代表性的还有k it a g a w a 、s h u m w a y 以及y o n g p c 等人对此方法的研 究k i t a g a w a ( 1 9 8 4 ) 对时间序列的建模过程采用了向状态空间模型的转化技巧, 但是无法实现对时变过程建模“对于状态空间模型的参数估计,s h u m w a y ( 1 9 8 8 ) 提出针对状态空间模型的参数估计方法一e m 算法 ( e x p e c t a t i o n - - m a x i m i z a t i o n l g o r i t h m ) 协1 y o u n g ( 1 9 9 0 ) 对模型的每一步都实 现了完全递推形式,但是没有给出模型参数的新估计方法状态空间模型的研究 和应用还有待进一步发展 在国内,1 9 9 4 年,顾岚在自己的著作时间序列分析在经济预测中的应用 中提到时间序列的状态空间的研究方法1 9 9 8 年,高紫光、路磊在“非平稳时 间序列的状态空间建模与预测”的文章中给出结合k a l m a n 滤波的状态空间方法 的一些理论介绍忉,2 0 0 0 年,任光和张均动教授正式将现代控制理论的状态空间 技术和时间序列分析相结合的时间序列状态空间技术引入我国他们从离散系 统出发,从空间映射的角度系统地论述了整个建模过程,形成了比较完整和系 统的时间序列的状态空间建模理论,并将该理论应用到实际中2 0 0 1 年,苗敬毅 在“关于状态空间方法中超参数估计的札记”中对状态空间方法中超参数估计 基本思想进行了论述,并对一般文献中未详细证明的部分给出了证明2 “。2 0 0 2 年,于福江、张占海、林一骅在文章“一个稳态k a l m a n 滤波风暴潮数值预报模 式”中用迭代法得到状态向量的稳态k a l m a n 滤波进而得到最优线性校正结果 西南交通大学硕士研究生学位论文第4 页 1 4 问题的提出 近年来,出现了许多以状态空问模型为框架的时间序列预测方法,这种方 法首先将时间序列转化为状态空间,然后采用k a l m a n 滤波对非平稳时间序列进 行外推、内插及平滑,同时还可以利用k a l m a n 滤波对模型的未知参数进行极大 似然估计,k i t a g a w a 、h a r v e y 、y o u n g p c 等都在这方面做出了贡献对于状态空 间方法的建模大都是基于a r i l 4 模型向状态空间模型转化的技巧( k i t a g a w a ) , 无法实现对时变过程建模对于状态空间模型的参数估计外推,虽然对模型的每 一步都实现了完全递推形式,但未给出模型参数估计方法( y o u n gp c ) 汹, 针对这些问题,本文在建模方面采用了k i t a g a w a 关于时间序列空间建模的 方法;在参估计方面采用了e m 算法:从而建立起能够比较确切反映系统特性的 模型 1 5 本文工作及章节安排 本文主要讨论了基于状态空间模型的时间序列分解并以中国c p l 月度数据 为研究对象,涉及k a l m a n 滤波等最优估计理论和参数估计问题对中国c p l 月 度数据相应的状态空间进行了编程,并用k a l m a n 滤波、平滑等方法进行运算全 文具体内容共分六章,概况如下: 第一章:对时间序列进行了概述、阐述了本文研究背景和时间序列分解的研 究现状、对基于状态空间模型的时序发展做了综述,介绍了本文的研究内容及 创新点; 第二章详细介绍了动态数据建模与预测; 第三章详细介绍了状态空间模型、k a l m a n 滤波: 第四章研究了状态空间模型的参数估计,详细介绍了e m 算法; 西南交通大学硕士研究生学位论文第5 页 第五章以中国c p l 月度数据为例,用状态空间方法对其进行了分解:并用 传统的x - i 卜a r i m a 方法对同样的数据作类似的分析,最后从结果出发对比分析 了两种分解方法的利与弊: 第六章对本文工作的总结与展望。 1 6 研究内容及创新点 1 对不完全数据( 定义4 3 1 ) 用适当的状态空间加以描述,并用e m 算法对 参数加以估计; 2 对于估计出的参数,选定适当的初始值和状态空间用k a l m a n 滤波、平滑 求出状态向量 x ,】,并计算每个时刻的估计值; 3 在k a l m a n 滤波程序的基础之上,以中国c p l 月度数据为例编写个应用程 序并得出相应的结果,再用x 一1 l a r i m a 季节调整方法对同样的数据加以处理, 最后对两种模型方法分解得出的结果进行分析说明 西南交通大学硕士研究生学位论文第6 页 2 1 概述 第2 章动态数据建模与预测 时间序列分析是统计学中的个重要分支i 是基于随机过程理论和数理统 计学的一种重要方法和应用研究领域时间序列按其统计特性可分为平稳性序 列和非平稳性序列目前应用最多的是b o x - j e n k i n s 模型建模法,它是由g e p b o x 和英国统计学家g m j e n k i n s 于1 9 7 0 年首次系统提出的b o x j e n k i n s 方 法是一种较为完善的统计预测方法,他们的作用是为实际工作者提供了对时间 序列进行分析、预测,以用对a r m a 模型识别、估计和诊断的系统方法优点在 于如果建立精确的模型后,并确定模型的系数之后,就可以根据有限的数据集 对其发展进行预测,其中对于平稳性时间序列多采用a r m a 模型,对于非平稳性 时间序列模型常通过适当地变换( 如差分、取对数) 将它变为a r m a 模型后再进 行建模,这类模型b o x j e n k i n s 称为a r i m a ( 求和自回归滑动平均模型) 2 2 平稳时间序列模型 2 2 1 数据的预处理 数据的预处理包括缺失值的补充、数据的平稳化及单位根检验详见 1 2 2 2a r 、m a 、a r m a 模型 若序列x 适合线性差分方程 西南交通大学硕士研究生学位论文第7 页 五一仍一1 一仍一2 一一一哆五一。 = 岛一z 冀q l z 墨一2 一一哦乞一。 ( 2 1 ) 其中仍纪称为自回归参数,碍哦为滑动平均参数,整数n ,m 分别称为自 回归阶数及滑动平均阶数 岛】为白噪声序列。 对( 2 1 ) 式可分三种情况讨论: l 、如果z 5 i 哦全为零,则( 2 1 ) 式变为 一仍一1 一仍t - 2 一一哆。2 岛 ( 2 2 ) 此模型称为自回归( a u t o r e g r e s s i v e ) 模型,简称a r 模型川,该模型现在的输 出是现在的输入和过去n 个输出的加权和 2 如果仍纯全为零,则( 2 1 ) 式变为 x ,= 乞一磷乞一。一嘎一:一一一嘿乞一。 ( 2 3 ) 此模型称为滑动平均( m o v i n g - a v e r a g e ) 模型,简称m a 模型幢1 3 、 如果够纯;2 5 ;z 5 | ,不全为零,则( 2 1 ) 式给出的模型称为自回归一 滑动平均( a u t o - r e g r e s s i v em o v i n g - a v e r a g e ) 混合模型,简称a r m a 模型 4 、a r 、m a 、a r m a 是平稳时间序列最主要的参数模型a r 模型的正则方程是 一组线形方程,而m a 和a r m a 模型是非线性方程w o r d 分解定理告诉我们任何有 限方差的a i 孙i a 或m a 平移过程可以用可能是无限阶的a r 模型表达;同样,任何 a i 妯i a 或a r 模型可以用可能是无限阶的m a 模型表达因此,如果在这三个模型中 选一个与信号不匹配的模型,但只要模型的阶足够高,它能够比较好地逼近被 建模的随机过程三种模型中a r 模型具有一系列好的性能,因此,是研究最多 并获得广泛应用的一种模型。 西南交通大学硕士研究生学位论文第8 页 2 2 3 时间序列的自相关和偏自相关函数 对于模型预测,首先要找到与其拟合最好的预测模型,其次模型阶数的确 定和参数的估计也是建模型的关键确定模型类型最重要的工具是序列的自相 关和偏自相关函数 1 自相关函数( a c f ) 构成时间序列的每个序列值t ,小,t 一。之间的简单相关关系称为自相关 自相关程度由自相关系数珞度量,表示时间序列中相隔k 期的观测值之间的相 关程度 n - k ( 一;) ( 一+ 。一;) !:1一 羔( 一;) 2 ( 2 4 ) 其中,n 是样本量,k 为滞后期,;代表样本数据的自身平均值与简单相 关系数一样,自相关系数的取值范围是 一1 ,1 ,并且越接近1 ,自相关程 度越高 2 偏相关函数( p a c f ) 偏自相关是指对于时间序列x ,在给定一,小,一。的条件下,x 。与一t 之 间的条件相关关系。其相关程度用偏自相关系数纯度量,- i 1 1 纯1 纸= 一l 一识1 ,磊一j 产l 七一l 1 一纯- 1 ,: j = 1 ( 2 5 ) 西南交通大学硕士研究生学位论文第9 页 有实际应用中,应该综合考察序列的自相关与偏相关将要考虑问题序列的自 ( 偏自) 相关系数绘制成图,并标出一定的随机区间,称为自( 偏自) 相关分 析图它是对时间序列进行( 偏自) 相关分析的主要工具 2 2 4 模型类型的判别 1 、a r 、m a 、a r m a 三种模型自相关与偏相关函数的特点 ( 1 ) a r ( p ) 模型 a r ( p ) 模型的偏自相关函数为: 纯,= i 哆1 p (26,1= o 。p + 1 _ ,尼 ( z b ,) 也就是说,a r ( p ) 模型的偏自相关函数是p 步截尾的,即当 p 时,的 值为o 这个特点对识别模型类型以及确定阶数p 很有用而a r ( p ) 模型的自相 关函数呈指数或者正弦波衰减,具有拖尾性 ( 2 ) m a ( q ) 模型 m a ( q ) 模型的自相关函数为 = 1 0 - 2 薹b ( k ) b ( 七一m ) = 二鲁车专售错,尼g ( 2 7 , 【0 k g 则m 6 l ( q ) 模型的自相关函数吆在k g 以后全部是0 ,即自相关函数是q 步截尾 的而与a r ( p ) 相反,m h ( q ) 模型的偏自相关函数随着滞后期k 的增加,呈现 指数或者正弦波衰减,趋向于0 ,是拖尾的 ( 3 ) a r m a ( p ,q ) 模型 a r m a ( p ,q ) 模型的自相关函数和偏自相关函数均是拖尾的 西南交通大学硕士研究生学位论文第1 0 页 2 自相关与偏自相关函数确定模型类型 根据以上a r ( p ) 、m a ( q ) 、a r m a ( p ,q ) 序列的自相关和偏自相关函数的统计特 性,可以初步确定模型的类型: 表2 1 通过自相关函数确定模型类型 模型a r ( p )m a ( q ) a r m a ( p ,q )a r i m a ( p ,d ,) 自相关函数拖尾截尾拖尾拖尾( 呈现非指数衰减) 偏相关函数截尾拖尾拖尾拖尾( 呈现非指数衰减) 2 2 5 模型阶数的选择 1 基于目相关及偏相关函数的定阶方法 对于a r m a ( p ,q ) 模型,可以利用其样本的自相关函数 吆) 和样本偏自相关函数 ) 的截尾性判定模型的阶数 具体方法如下: ( 1 )a r 模型, 当艮 p ,纯= 。,对于后 p ,n 充分大,为渐进正态( 。,专 ,故 p 专) = 6 8 妣,或p 专) = 9 5 黝 若对于某正整数,蜘明显地异于零,而十1 + ,+ 2 + 2 ,+ 拟,内十肘均近 似于零,且满足i f 面1( 或i l 丽2 ) 的个数占m 的比例近似的为6 8 3 ( 或9 5 5 ) ,则可以近似的判定 ) 是步截尾,因而初步判定a r 模型的阶 西南交通大学硕士研究生学位论文第11 页 数为n o ,即认为平稳时间序列 薯】为a r ( ) 模型。 ( 2 ) m a 模型 类似,我们可通过计算序列 】,考察其中满足 吆) ,考察其中满足i 吒l 丽1 或者丽2 的个数是否占m 个的6 8 3 或者9 5 5 。即可以近似判定 】是9 0 步截尾,平稳时间序列 誓) 为m a ( g 。) ( 3 ) a r i m a 模型 如果对于序列 ) 和 】来说,均不截尾,即不存在上述的p o g 。,则可 以判定平稳时间序列 只】为a r m a 模型 2 利用信息准则法定阶 提出了几种不同的信息准则确定模型阶次: 最终预测误差( f p e ) 准则| 2 1 : f p e ( k 1 = + ( k + 1 ) pn 一( k + 1 ) ( 1 )a k a i k e 信息准则( a i c ) 心, ,n 、 们 ) _ h + 2 尼 ( 2 8 ) ( 2 9 ) 西南交通大学硕士研究生学位论文第12 页 ( 3 ) b i c 准则函数: b i c ( 栌胁( 刍) ( 2 1 0 ) 式中n 为数据h ( 玎) 的长度,当阶次k 由于1 增加时,上述准则都将在某一 个k 处取得极小值,将此时的k 定为最合适的阶次上述三式仅为阶次的选择提 供了一依据,在实际运用申,基于自相关函数和偏相关函数的定阶方法更为准 确 2 2 6 模型参数的求解 1 a r 模型 在利用a r 模型进行预测时,必须计算出a r 模型的参数q ,a 2 ,绵及白噪声 序列的方差盯2 这些参数的求解算法主要包括自相关法、b u r g 方法、协方差、 改进的协方差法,以及最大似然估计方法等上述方法中,改进的协方差的估计 性能最好,但计算比较复杂;自相关法的计算最为简单,但估计的分辨率相对 较差;b u r g 方法较为通用,计算不太复杂,且具有较好的估计质量 2 m 模型 m a 模型参数的求解方法有三种:( 1 ) 谱分解法;( 2 ) d u r b i n 法( 用高阶的 a r 模型来近似m a 模型) ;( 3 ) 最大似然估计,其中最有效的求解方法是d u r b i n 法 3 a r m a 模型 西南交通大学硕士研究生学位论文第13 页 介绍了a r m a 模型参数的求解的三个步骤: ( 1 ) 利用a r 模型参数算法估计a r 参数q ,a 2 ,a p ; “p “ ( 2 ) 对已知数据h ( 甩) ,用f i r 滤波器彳( z ) = 1 + 吼z “滤波,那么滤波器 x = l 的输出少( 捍) 将近似一个m a ( q ) 过程: ( 3 ) 用d u r b i n 求解m a ( q ) 参数,求出b i 吃,乞,从而实现a r m a ( p ,q ) 模型 的参数估计 2 2 7 平稳时间序列预测 1 a r ( p ) 模型预测 利用n 之前的p 个值对x ( 玎) 作预测,称之为“前向预测”,记为: 一| z ( m ) = p - z 口,( f ) 石( h ,一i ) m = l i = l m - 1“jp - z 口,( f ) 薯( 聊一f ) 一口,( i ) x ( t + m i ) 1 m p ( 2 1 1 ) p f - y 口( f ) ( m i ) m 夕 i = l “ 上标f 表示前向预测( f o r w a r dp r e d i c t i o n ) 誓( m ) 表示在t 时刻m 步 前向预测。利用自相关法、b u r g 算法、协方差、改进的协方差法等方法得到 模型的参数后,就可以进行前向预测,利用预测值递推可依次得到多步预测值 2 m a ( q ) 、a r m a ( p ,q ) 模型预浈9 西南交通大学硕士研究生学位论文第14 页 m a ( q ) 、a r m a ( p ,q ) 的外推预测一般都是将m a ( q ) 、a r m a ( p ,q ) 模型转换为 相应的高阶a r 模型,再a r 模型的预测公式进行外推预测 3 预测误差 预测误差公式为: q ( ,) = + ,一( ,) = j + ,+ 岛十,- l + + 奶一l 岛+ l ( 2 1 2 ) 线性最小方差预测的方差和预测步长,有关,而与预测的时间原点t 无关预测 步长,越大,预测误差的方差也越大,因而预测的准确度就会降低所以一般不 能用a r 、m a 和a r m a 模型作为长期预测模型 2 3 非平稳时间序列模型 a r i m a 模型意为求和自回归滑动平均模型( i n t e r g r a t e da u t o r e g r e s s i v e m o v i n ga v e r a g em o d e l ) ,简记为a r i m a ( p ,d ,q ) ,p ,q 分别为自回归和滑动平均 部分的阶次,d 为差分运算阶次,对于某些非平稳时间序列 y ( 研,其一般形式 为: ( 曰) ( 1 一b ) dy ( f ) = o ( b ) a ( t ) 其中中( b ) = 1 一仍召一一纯曰”,o ( b ) = 1 - o , b - 一巳召” 若将( 1 一口) dj ,( ,) 记为z ( 尹) ,则上式就是a r m a 模型。 ( 2 1 3 ) b o x 发现,可通过差分方法求出增量序列:v y ( t ) = y ( t ) - y ( t - 1 ) ( t = 1 ,2 ,n ) 经过一次差分后,如果此增量序列 w ( f ) 】是平稳的,那么对 西南交通大学硕士研究生学位论文第15 页 跏( 纠建立a r m a 模型,表示为: 缈( 艿) v y ( f ) = 抄( b ) 口( ,) ( 2 1 4 ) 根据差分算子v 与后移算子b 的关系( v = i b ) ,即( 1 - b ) y t = y t - y , - l ,有关 缈( b ) ( 1 一曰) 只= z 5 l ( b ) 口( f ) 即还原得到 少( f ) 】的a r i m a 模型 ( 2 1 5 ) 以上对非平稳时间序列 y ( f ) 作一次差分称为一阶差分将这种思路推广, 当采用一阶差分还不能使 跏( f ) 成为平稳时间序列时,还可采用高阶( d 阶) 差分,以使 v d y ( f ) ) 成为平稳时间序列,再x c v d y ( f ) 】建立a r m a 模型,然后根 据差分算子v 与后移算子b 的关系( v = 卜b ) ,得到非平稳时间序列 y ( f ) 的 a r i m a 模型,这就是a r i m a 模型法的基本思路虽然足够多次的差分运算可以充 分地提取原序列中的非平稳确定性信息,但过度的差分也会造成有用信息的浪 费一般而言,若某时间序列具有线性的趋势,则可以对其进行一次差分而将线 性趋势剔除掉;若某时间序列具有指数的趋势,则可以取对数将指数趋势化为 线性趋势,然后再进行差分以消除线性趋势,接着对差分后的序列拟合a r m a 模 型进行分析与预测,最后再通过差分的反运算得到 y ( f ) ) 预测值 西南交通大学硕士研究生学位论文第16 页 第3 章时间序列模型的状态空间分析与k a im a n 滤波 3 1 概述 在前面一章中,我们讨论了平稳动态数据处理的基本常识,但在现实生活 中,数据的出现大多数是以非平稳形式,这就涉及到了动态数据所构成的时间 序列的分解关于时间序列的分解,p e t e rj b r o c h w e l l r i c h a r da d a v i s 在 其著作t i m es e r i e s :t h e o r ya n dm e t h o d s 中已指出:分解时问序列的目的 旨在估计和抽取确定性成分z ,墨,c f ,以使残量t 即随机项是一平稳过程 进而求得关于随机项的合适概率模型,分析它的性质并连同正,墨和g 达到 拟合和预报的目的实际上,对于时间序列的分解预测问题,主要问题是对前三 项的分离和预测,而随机项即平稳序列的拟合现今理论已相当成熟在文献 1 中简述了几种时问序列分解方法:季节调整的x - 1l 程序,x i i - a r d k a 程序和 b a y e s 方法,这几种方法都是将观测序列分解为趋势、季节、不规则项三个部分, 非白噪声的平稳化通常称为循环项一包含在趋势部分中,没有单独分离出来 在对经济序列进行深入的分析研究时,将周期分离出来是十分必要的而用状态 空间方法对时间序列进行分解就能解决这个问题用状态空间方法对时间序列 进行分解,其效果与b a y e s 方法相仿,但计算量较小,用状态空间方法研究时 间序列,当前正在我国统计学界得到广泛的注意 3 2 时间序列的状态空间描述 一般的,一个时间序列 乃】可以直接或经过函数变换后分解为如下的加法模 西南交通大学硕士研究生学位论文第1 7 页 型或乘法模型形式: 加法模型: = 互+ s + c f + , 乘法模型:m = 互s c , ( 3 2 1 ) ( 3 2 2 ) 其中,( z ) 表长期趋势,( s ) 是季节项,( c f ) 是循环项,( ) 表不规则项, 对于趋势明显为指数增长,且季节波动幅度也随时间增加的序列,一般采用乘 法模型。 用状态空间模型描述( 3 2 1 ) 式所示分解是十分方便的,对于一般定常( 非 时变) 的动态系统,假定其具有n 维量测向量 只) 和1 1 1 维状态向量 一】,量测 向量是通过某些物理手段可以观测到的变量,而状态向量是用来描述系统动态 特征的变量,一般是无法观测到的变量,只有状态向量和量测向量结合起来, 才能对系统的动态特征做完整而充分的描述对于动态的描述是通过下面的状 态空间模型实现的: 状态方程 墨= 似r _ 1 + 心 量澳0 方程 】:= 么墨+ 匕 ( 3 2 3 ) 状态方程描述动态系统的状态从前一时刻到当前时刻的变化规律,而量测 方程描述观测值和系统的状态之间的变化关系巾称为状态转移矩阵,a 为量测 矩阵为简化问题,假定a 和都是不随时间改变的常系数矩阵,状态空间有以 下特点:1 状态空间模型不仅能反映系统内部状态,而且能揭示系统内部状态 与外部的输入和输出变量的联系2 状态空间模型将多个变量时间序列处理为 向量时间序列,这种从变量到向量的转变更适合解决多输入输出变量情况下的 西南交通大学硕士研究生学位论文第18 页 建模问题3 状态空间模型能够用现在和过去的最小心信息形式描述系统的状 态,因此,它不需要大量的历史数据资料,既省时又省力 在状态空间模型( 3 2 3 ) 中,是状态噪声,e w t = 0 ,u 是量测噪声,e v , = o 。 p ,、f q 【哪) _ t o f = 1 t 1 e ( v v ,) = 言二主; ( 3 2 4 ) ( 3 2 5 ) ( 3 2 1 ) 式是我们希望得到的分解形式,结合状态空间模型及噪声的有关特征 知,( 3 2 3 ) 式中的有关量可以分解为组合形式 他00 、 西= l o 中: o f , 彳= ( 彳。44 ) l0 0 m 3 ,墨,、1 x = i 置,j i 置,j f ,、1 一引 ( 3 2 6 ) 下标j = l ,2 ,3 分别对应于趋势项、循环项、季节项下面分别对各项进行讨论。 a ) 趋势项 趋势项z 应满足k 阶差分方程的约束条件 v z = 舌, 专一n ( o ,) ( 3 2 7 ) 西南交通大学硕士研究生学位论文第19 页 其中v 是差分算子,v t = z 一互- l ,一般取尼= 1 或2 ,当k = l 是可得到 互= 互一+ 考,此时西。= ( 1 ) ,a = ( 1 ) ,= 毒 当k = 2 时 互= 2 z 一,一z 一:+ 毒,。= ( 亍苫 ,五,= ( 乏。 ,= ( 丢) c3 2 8 , b ) 循环项 循环项c 应是平稳的,且满足某一a r m a 模型,为参数估计方便,采用充 分高的p 阶自回归模型,即4 r ( p ) 进行拟合 c = q 一。+ 呸q 一2 + + g p + 仍,r l , n ( o ,) ( 3 2 9 对于经济序列一般取p = 1 ,2 或3 ,由前述可得 f ,q i 10 m 2 = i : l f0 特 c )季节项 4 = ( 1 ,0 0 ) w 2 f = ( 3 2 1 0 ) 西南交通大学硕士研究生学位论文第2 0 页 季节项应满足下述差分方程约束: ( + 善b 7 ) d s = ,( 。,) 其中b 是后移算子,b 墨= s - l 是季节周期长度若季节变化较规则,季 节周期的幅值无明显改变,则取一阶季节模型( d = 1 ) ,若观测序列季节周期的幅 值有明显变化时,则采用二阶季节模型( d = 2 ) 。对于一阶季节模型可以写出: 中3 = 墨,= 一11 10 o s s 一。 墨_ + l 一l o 。: 1o , 4 = ( 1 ,0 0 ) w 3 f2 综合前述,只要确定出趋势、循环、季节各项,就可以方便地写出相应的 状态空间模型。例如,k = 2 ,p = 2 ,d = l 时状态方程和量测方程为 x 。= 2一l 1o 嘶 lo - 1 一1 1o o1o 置一l + 舌0研o白o;0 西南交通大学硕士研究生学位论文第2 1 页 y t = ( 1 0 101 0 o ) 置+ v 置= ( zz 一。c fe 一。s s ,+ 。) 若采用月度数据( l = 1 2 ) ,上式中状态向量置的维数= 1 5 ,若采用季度数据( l = 4 ) 则五是m = 7 维向量相应的噪声方差阵为: q = :三 记秒= ( 噻) 是状态空间模型( 3 2 3 ) 的待估计参数,一般称为超参数,分 别是趋势、循环、季节各部分的状态噪声方差,是似合循环项的自回 归模型参数 3 3k aim a n 滤波 前一小节中引入了对时间序列进行状态空间模型描述,我们的目的是要得 到状态向量 置】,如果估计出 置) ,则时间序列 乃】的分解也就完成了 假定状态空间模型的阶数k ,d ,1 3 ( 见( 3 2 7 ) 及( 3 2 9 ) ,( 3 2 11 ) 式) 已选 定,超参数也已确定,那么就可以用k a l m a n 滤波进行计算,求出状态向量 z 】, t = l ,2 ,每个时刻的估计值记: x 弧= e x t y , ,y 3 西南交通大学硕士研究生学位论文第2 2 页 c 州。= e ( 鼍一x , ,) ( 五一知。) 厶,饯 ( 3 3 1 ) k t 3 = e 加一。彳( 彳c ,f f 一。彳+ r ) - 1 l e ,r ,一l = 巾_ l ,- l ,一f + q 1 只,咖= 只,f ,f l k 么e ,咖一】 ( 3 2 ) 西南交通大学硕士研究生学位论文第2 3 页 e = d ,( + 口) 一 d l | l = d 。+ a r 一。y 1 另,= e 办一。+ 彳r 。1 a 乃,i = e f f 一l x , f _ l d t f t = t x t f f 3 4k aim a n 平滑与预测 3 4 1k alm a n 平滑 般,从当前的和过去的观察值x ( 玎) ,x ( n 一1 ) ,x ( n - 2 ) ,估计当前的信 号值少( 刀) = j ( 疗) 称为过滤或滤波;从过去的观察值,估计当前的或将来的信号 值y ( 阳) = s ( 玎+ ) ( 0 ) 称为预测或外推;从过去的观察值,估计过去的信 号值y ( 咒) = s ( 玎一n ) ( n 1 ) 称为平滑或内插。 考虑( 3 2 3 ) 式,基于量测序列m 款,y k ,对状态薯( i k ) 求最优估 计器x 私的问题叫k a l m a n 平滑问题最优平滑器x 班( i k ) 可分类为: ( 1 ) x 枷,i = o ,n 一1 ,n 固定,叫固定区间平滑器; ( 2 ) z 拈,k = i + 1 ,i + 2 ,i 固定,叫固定点平滑器; 堕童奎堕盔兰巫圭堡窒圭堂焦迨銮篁兰兰卫 ( 3 ) 工洲,i = 0 1 ,n 固定,叫固定滞后平滑器。 这里着重指出固定平滑器。 3 4 2k aim a n 外推预测 在纯预测情况下,心= o ,同时,屹可不考虑,于是有递推公式: 舅。预测值为:儿二= 彳二= 4 ,妄上式都是在状态空间模型中预测其 中a 为的量测方程中的量测矩阵,为状态方程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025初级会计高频题库及答案
- 2025初级会计宝藏题库及答案
- 2025江苏中国矿业大学徐海学院招聘饮食管理人员1人考前自测高频考点模拟试题及答案详解参考
- 智能制造生产试题及答案
- 2025年济宁市任城区事业单位公开招聘工作人员(教育类)(125人)模拟试卷及答案详解参考
- 2025贵州省计量测试院第十三届贵州人才博览会引才模拟试卷有完整答案详解
- 成人高考数学历年真题及答案解析
- 成人高考临床真题及答案
- 澳美会计面试题目及答案
- 2025年康复医学病患康复评估考试答案及解析
- 不再举报协议书6篇
- 空管知识培训材料课件
- 四合一检测仪使用课件
- 药物中毒的护理与急救
- 兄弟分户房屋协议书模板
- 学堂在线 大数据系统基础 章节测试答案
- ICU常见体位护理
- JJF(蒙) 058-2023 重点排放单位碳计量审查规范
- 2025年高一的数学知识点大纲
- 2025年平面图形的画法说课教学课件
- 养老院保洁培训课件
评论
0/150
提交评论