




免费预览已结束,剩余56页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四节时间序列数据的预处理,一、动态数据的正态性检验二、动态数据的离群点三、动态数据的缺失值填充四、动态数据的平稳性检验五、动态数据的纯随机性检验,1,时间序列的预处理(续),1.平稳性定义知识回顾,若时间序列有有穷的二阶矩,且Xt满足如下两个条件:,则称该时间序列为平稳序列。,包括严平稳序列和宽平稳序列。,四、平稳性检验,在对实际的时间序列进行建模之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模型的建立。,2.关于非平稳序列的处理,序列的非平稳包括均值非平稳和方差非平稳。均值非平稳序列平稳化的方法:差分变换。方差非平稳序列平稳化的方法:对数变换、平方根变换等。,3.平稳性检验方法,非参数检验法特征根检验法单位根检验法(1)通过时间序列的趋势图来判断(2)通过自相关函数(ACF)判断,图检验方法,非参数检验法:游程检验,一个游程定义为一个具有相同符号的连续串,在它前后相接的是与其不同的符号或完全无符号。例如,观察的结果用加、减标志表示,得到一组这样的记录顺序:+-+-+-+这个样本的观察结果共有7个游程。,(1)什么是游程,(2)游程检验的基本思想,如果符号序列是随机的,那么“+”和“-”将随机出现,因此它的游程数既不会太多,又不会太少;反过来说如果符号序列的游程总数太少或太多,我们就可以认为时间序列存在某种趋势性或周期性。,a.小样本情况零假设H0:加号和减号以随机的方式出现检验方法:取显著性水平(一般取0.05),查单样本游程检验表,得出抽样分布的临界值rL、rU判定:若rLrU或rrL则拒绝零假设,序列是非平稳的。,(3)检验方法,b.大样本情况零假设H0:加号和减号以随机的方式出现检验方法:给定显著性水平(一般取0.05)查标准正态分布表,得出抽样分布的临界值-z,+z。并计算统计量:,判定:若-zz3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。,若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36的自相关系数达到最大(如果数据是按季度采集,则最大自相关系数出现在4,8,12,),并且随着时滞的增加变得较小。,若序列是有趋势的,且具有季节性,其自相关函数特性类似于有趋势序列,但它们是摆动的,对于按月数据,在时滞12,24,36,等处具有峰态;如果时间序列数据是按季节的,则峰出现在时滞4,8,12,等处。,应用举例,例1时序图检验1951年2005年我国居民住院消费价格指数的平稳性例2时序图检验1990年1月1997年12月我国药品总产值序列的平稳性,例1居民住院消费价格指数时序图,平稳序列,例2药品总产值时序图,非平稳序列,(1)选择菜单GraphSequence。,绘制序列图的基本操作,(2)将需绘图的序列变量选入Variables框中。,(3)在TimeAxisLabels框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。(4)在Transform框中指定对变量进行怎样的变化处理。其中Naturallogtransform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonallydifference表示对数据进行季节差分。,(5)单击TimeLines按钮定义序列图中需要特别标注的时间点,给出了无标注(NoreferenceLines)、在某变量变化时标注(Lineateachchangeof)、在某个日期标注(Lineatdate)三项供选择。,(6)单击Format按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。,通过自相关函数(ACF)进一步判断,一个时间序列的样本自相关函数定义为:,可以证明:随着k的增加,样本自相关函数下降且趋于零。,序列的自相关函数(ACF)要么是截尾的,要么是拖尾的。因此我们可以根据这个特性来判断时间序列是否为平稳序列。,从下降速度来看,平稳序列要比非平稳序列快得多。,平稳序列的自相关系数常常表现出截尾,而非平稳序列的自相关系数常常是拖尾的。,应用举例,例3自相关图检验1951年2005年我国居民住院消费价格指数的平稳性例4自相关图检验1990年1月1997年12月我国药品总产值序列的平稳性,例2居民住院消费价格指数自相关图,平稳序列自相关图,例3药品总产值相关图,非平稳序列自相关图,(1)选择菜单GraphTimeSeriesAutocorrelations。,绘制自相关函数图的基本操作,(2)将需绘制的序列变量选入Variables框,(3)在Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partialautocorrelations表示绘制偏自相关函数图。一般可同时绘制两种图形。,(4)单击Options按钮定义相关参数,MaximumNumberofLags表示相关函数值包含的最大滞后期(时间间隔h)。一般选择两个最大周期以上的数据。在StandardErrorMethod框中指定计算相关系数标准差的方法,确定相关函数图形中的置信区间。其中Independencemodel表示假设序列是白噪声的过程;Bartlettsapproximation表示用估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合序列是k-1阶的移动平均过程,且标准差随阶数的增大而增大的情况。,(5)选中Displayautocorrelationatperiodiclags表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项。否则该步可略去。最后就OK了。,五纯随机性检验,(一)纯随机序列的定义(二)纯随机性的性质(三)纯随机性检验,(一)纯随机序列的定义,纯随机序列也称为白噪声序列,它满足如下两条性质,并不是所有平稳序列都值得建模!,纯随机序列无法预测,无法进一步建模!,方差齐性,纯随机性,0,标准正态白噪声序列时序图,(二)白噪声序列的性质,纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性(平稳)根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的,(三)纯随机性检验,1.检验原理2.假设条件3.检验统计量4.判别原则5.应用举例,1.检验原理:Barlett定理,如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布,Bartlett公式若在时趋于零,则在N足够大的情况下其方差为并且,当时,近似于正态分布。,47,自相关系数,协方差函数,自相关函数,2.假设条件,原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性,3.检验统计量,Q统计量(大样本)LB统计量(小样本),4.判别原则,拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,则认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能拒绝序列为纯随机序列的假定,若为白噪声的自相关系数,则在M=0根据统计检验的准则,当时,便可认为为0的可能性是95%,从而接受这一估计,即数据是独立的。,51,或,5.应用举例,例3:标准正态白噪声序列纯随机性检验。例4对19491998年北京市流感发病率序列做白噪声检验。例5对1950年1998年北京市城乡居民医疗保险占比例序列的平稳性与纯随机性进行检验。,例3:标准正态白噪声序列纯随机性检验,样本自相关图,检验结果,由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。,例419491998年北京市流感发病率序列的白噪声检验。,样本自相关图,例4白噪声检验结果,由于P值显著大于显著性水平,所以不能拒绝序列纯随机的原假设。因而可以认为北京市流感发病的变动属于纯随机波动。这说明我们很难根据历史信息预测未来年份的流感发病情况。,例5时序图,例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 适合婴幼儿的全营养辅食配方100例
- 职业卫生管理体系建设与员工健康保护
- 软件企业项目需求分析报告
- 地理专题教学设计:气候带及其影响
- 通信设备安全维护操作手册
- 三年级小学生英语自我介绍范文
- 水利工程项目管理流程优化报告
- 建筑工程施工合同签订及风险防范
- 企业网络安全风险评估手册
- 车祸有后遗症协议书7篇
- 2025年健康管理师试题及答案
- 2026年中考数学压轴题专项练习-四边形中的新定义问题(学生版+名师详解版)
- 乌兹别克语自学课件
- logo安装施工方案
- 四川能投合江电力有限公司员工招聘考试参考题库及答案解析
- 2025年山西省政府采购评审专家考试真题库(带答案)
- 宿管员业务知识培训内容课件
- 安全生产例会会议记录以及会议内容
- 眼视光技术介绍
- DB64T 2146-2025 工矿企业全员安全生产责任制建设指南
- 间歇充气加压用于静脉血栓栓塞症预防的中国专家共识解读
评论
0/150
提交评论