版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时间序列的预处理02本章内容平稳序列的定义0102平稳性检验纯随机性检验0403概率分布概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义实际应用的局限性
在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因导致我们很少直接使用联合概率分布进行时间序列分析特征统计量均值方差自协方差自相关系数平稳时间序列的定义严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。平稳时间序列的统计定义严平稳满足如下条件的序列称为严平稳序列
宽平稳满足如下条件的序列称为宽平稳序列严平稳与宽平稳的关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳平稳时间序列的统计性质常数均值自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关延迟自协方差函数延迟自相关系数自相关系数的性质规范性对称性非负定性
非唯一性
一个平稳时间序列一定唯一决定了它的自相关函数,但一个自相关函数未必唯一对应着一个平稳时间序列。时间序列数据结构的特殊性传统统计分析的数据结构:有限个变量,每个变量有多个观察值时间序列数据结构:可列多个随机变量,而每个变量只有一个样本观察平稳性的重大意义在平稳序列场合,序列的均值等于常数,这意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列。原本每个随机变量的均值(方差,自相关系数)只能依靠唯一的一个样本观察值去估计,现在由于平稳性,每一个统计量都将拥有大量的样本观察值。这极大地减少了随机变量的个数,并增加了待估变量的样本容量。极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度严平稳与宽平稳的关系一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳本章内容平稳序列的定义0102平稳性检验纯随机性检验03序列的平稳性检验检验方法方法一:图检验(本章介绍)时序图检验自相关图检验
方法二:构造检验统计量进行假设检验(第四章介绍)单位根检验平稳性的时序图检验时序图检验原理:平稳时间序列具有常数均值和方差。这意味着平稳序列的时序图应该显示出该序列始终在一个常数值附近波动,而且波动的范围有界的特点。时序图检验技巧如果序列的时序图显示出该序列有明显的趋势性或周期性,那该序列通常就不是平稳序列。根据这个性质,很多非平稳序列,通过查看它的时序图就可以直接识别出来。例2-1趋势序列非平稳绘制1978-2012年我国第三产业占国内生产总值的比例序列的时序图,根据时序图判断该序列的平稳性。该序列时序图清晰显示:序列有明显的递增趋势特征,所以是非平稳序列。周期序列的平稳性具有周期特征的序列平稳性识别是困难的。理论上,如果周期波动的振幅和频率不随时间的变化而变化,通常序列是稳定的。
比如通信领域常用的随机相位信号函数是平稳序列其中:A为振幅,
为频率,
为起始相位。A和
为任意常数,
。如果
,振幅和频率会随着时间变化而变化,那么该序列就是非平稳序列。周期效应的平稳性演示周期序列的平稳性识别无论是图识别方法还是将来要学习的单位根检验方法都无法准确识别出具有周期特征的序列的平稳性。通常具有周期特征的序列,在实务处理上,不严格区分它到底是平稳序列还是非平稳序列,都类似于非平稳序列一样处理——通过差分的方法提取周期特征,然后对差分后的序列建模。所以实务中,如果序列具有显著的周期特征可以视为非平稳序列处理。例2-2绘制1970—1976年加拿大Coppermine地区月度降雨量序列的时序图,根据时序图判断该序列平稳性该序列时序图清晰显示:序列有明显的周期特征,可以视为非平稳序列。例2-3绘制1915-2004年澳大利亚自杀率序列(每10万人自杀人口数)的时序图,根据时序图判断该序列的平稳性。该序列时序图显示:从1915年开始澳大利亚每年的自杀率长期围绕在10万分之3附近波动,而且波动范围长期在10万分之2至10万分之4之间,这呈现出平稳序列的特征。但是看序列的最后20年的波动,自杀率又是一路递减,这是有趋势吗?如果是趋势,这就是非平稳特征。这时,通过时序图判断序列的平稳性有点困难。这时,可以借助序列自相关图的性质进一步辅助识别。自相关图检验自相关图检验自相关图是一个平面二维坐标悬垂线图,横坐标表示延迟时期数,纵坐标表示自相关系数,悬垂线的长度表示自相关系数的大小.自相关图检验技巧在下一章,我们会证明平稳序列通常具有短期相关性.这就是我们利用自相关图进行平稳性判别的标准.该性质用自相关系数来描述就是随着延迟阶数k的增加,平稳序列的自相关系数会很快地衰减向零;而非平稳序列的自相关系数衰减向零的速度通常比较慢。例2.1续绘制1978-2012年我国第三产业占国内生产总值的比例序列的自相关图该序列自相关图呈现出明显的三角对称性,这是有趋势的非平稳序列常见的自相关图特征.根据该序列自相关图我们可以认为该序列非平稳,且可能具有长期趋势这和该序列时序图呈现的单调递增性是一致的.例2.2续绘制1970—1976年加拿大Coppermine地区月度降雨量序列的自相关图该序列自相关图呈现明显的三角函数波动规律.这是具有周期性变化的非平稳序列的一种典型的自相关图特征,而且这种周期性几乎不衰减根据自相关图的长期相关性和余弦变化特征,我们可以认为该序列非平稳且具有稳定的周期变化规律.这和该序列时序图呈现的季节性特征是一致的.例2.3续绘制1915-2004年澳大利亚自杀率序列(每10万人自杀人口数)的自相关图该序列自相关图呈现出明显的倒三角特征,这是具有单调趋势的非平稳序列的典型特征.根据自相关图特征,我们可以认为该序列非平稳,且具有长期趋势.本章内容平稳序列的定义0102平稳性检验纯随机性检验0403纯随机序列纯随机序列的定义:如果序列满足如下两条性质,我们称该序列为纯随机序列,也称为白噪声(WhiteNoise)序列,简记为。容易证明,白噪声序列一定是平稳序列,而且是最简单的平稳序列。例2-4随机产生1000个服从标准正态分布的白噪声序列观察值,并绘制时序图。纯随机序列的性质
纯随机性
各序列值之间没有任何相关关系,即为“没有记忆”的序列
方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的纯随机性检验原理纯随机性检验原理:Barlett定理纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一种方法如果一个序列是纯随机序列,那么它的序列值之间应该没有任何相关关系,即满足这是一种理论上才会出现的理想状况。实际上,由于观察值序列的有限性,纯随机序列的样本自相关系数不会绝对为零。例2-4续(1)绘制例2-7标准正态白噪声序列的样本自相关图。该序列样本自相关图显示:这个纯随机序列没有一个样本自相关系数严格等于零。但这些自相关系数确实都非常小,都在零值附近以一个很小的幅度随机波动。这就提醒我们应该考虑样本自相关系数的分布性质,从统计意义上判断序列的纯随机性质。纯随机性检验原理纯随机性检验原理:Barlett定理Barlett定理如果一个时间序列是纯随机的,得到一个观察期数为的观察值序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布根据Barlett定理,我们可以构造检验统计量来检验序列的纯随机性检验统计量假设条件原假设:延迟期数小于或等于m期的序列值之间相互独立备择假设:延迟期数小于或等于m期的序列值之间有相关性
检验统计量Q统计量LB统计量纯随机性检验的判别原则拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列。接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即可以认为该序列为白噪声序列。
例2-4续(2)计算例2-4中白噪声序列延迟1~12阶的LB统计量的值,并判断该序列的随机性。延迟1-12阶的LB统计量的P值都大于显著性水平(0.05)所以可以判断该序列为纯随机序列检验结果解读由于LB检验统计量的P值显著大于显著性水平α,所以该序列不能拒绝纯随机的原假设。换言之,我们判断该序列为白噪声序列,认为该序列的波动没有任何统计规律可循。还需要解释的一点是,为什么在本例中只检验了前12期延迟的Q统计量就直接判断该序列是白噪声序列呢?为什么不进行全部999期延迟检验呢?一方面是因为,平稳序列通常具有短期相关性,如果序列值之间存在显著的相关关系,通常只存在于延迟时期比较短的序列值之间。所以,如果一个平稳序列短期延迟的序列值之间都不存在显著的相关关系,通常长期延迟之间就更不会存在显著的相关关系了。另一方面是因为,假如一个平稳序列显示出显著的短期相关性,那么该序列就一定不是白噪声序列,我们就可以对序列值之间存在的相关性进行分析。假如此时考虑的延迟时期数太长,反而可能淹没了该序列的短期相关性。因为平稳序列只要延迟时期足够长,自相关系数都会收敛于零。例2-5对1900—1998年全球7级以上地震发生次数序列进行平稳性和纯随机性检验。时序图显示该序列没有明显的趋势和周期.自相关图显示,除了延迟1一4阶的自相关系数在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026广西贵港市退役军人服务中心就业见习基地招聘就业见习人员3人备考题库含答案详解
- 2026年鹿寨县妇幼保健站医护人员招聘笔试模拟试题及答案详解
- 2026国家纳米科学中心陈春英课题组招聘1人备考题库(北京)及参考答案详解一套
- 2026云南迪庆州维西县医共体攀天阁乡分院(攀天阁乡卫生院)护士招聘2人备考题库完整答案详解
- 2026喀什招商发展管理有限公司招聘1人笔试模拟试题及答案详解
- AI技术推动企业协同创新内在机理研究
- 若尔盖县委社会工作部2026年公开招聘社区工作者笔试模拟试题及答案详解
- 2026年常德市结核病医院医护人员招聘笔试备考试题及答案详解
- 2026年大连教育学院附属高级中学教师招聘9人考试参考题库及答案详解
- 2026广西北海市公共资源交易中心招聘编外人员2人笔试模拟试题及答案详解
- 小学六年级下册数学期末测试卷及答案(各地真题)
- 恒风量油烟机油烟逃逸性能技术规范
- GIS操作机构(断路器油压操作机构)的动作原理、维护项目和要求
- 水利水电工程培养方案
- 浙江省建设工程施工现场安全管理台帐(新版)
- 地质调查员(地质灾害方向)职业技能竞赛试题
- 五年级下学期作文范文沪教牛津版(深圳)
- 会阴评估技术及保护会阴的临床实践
- GB/T 39894-2021船舶内装质量评定项目及要求
- GB/T 17492-2019工业用金属丝编织网技术要求和检验
- GB/T 12474-2008空气中可燃气体爆炸极限测定方法
评论
0/150
提交评论