王燕《应用时间序列分析》第一二章 PPT.ppt_第1页
王燕《应用时间序列分析》第一二章 PPT.ppt_第2页
王燕《应用时间序列分析》第一二章 PPT.ppt_第3页
王燕《应用时间序列分析》第一二章 PPT.ppt_第4页
王燕《应用时间序列分析》第一二章 PPT.ppt_第5页
免费预览已结束,剩余51页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章时间序列分析简介,教材介绍,教材:应用时间序列,王燕编著,中国人民大学出版社.应用软件:SAS练习数据库:TimeSeriesDataLibrary,本章结构,最早的时间序列分析,7000年前,古埃及人把尼罗河涨落的情况逐天记录下来,就构成所谓的时间序列.对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律.当天狼星第一次和太阳同时升起的那一天之后,再过两百天左右,尼罗河就开始泛滥,泛滥期将持续七、八十天,洪水过后,土地肥沃,随意播种就会有丰厚的收成.由于掌握了尼罗河泛滥的规律,使得古埃及的农业迅速发展,解放出大批的劳动力去从事非农业生产,从而创建了埃及灿烂的史前文明.,1月1日,6

2、月17日,10月,12月,尼罗河泛滥期,“落泪夜,时间序列的定义,随机序列:按时间顺序排列的一组随机变量观察值序列:随机序列的n个有序观察值,称之为序列长度为n的观察值序列随机序列和观察值序列的关系观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质实现的手段都是通过观察值序列的性质进行推断,案例,我们想研究北京市城镇居民消费支出发展变化规律那么每一年北京市城镇居民的消费支出就构成了一个随机序列我们通过某些方法获得的某些年份的北京市城镇居民的消费支出序列就是一个观察值序列北京市1990年1999年每年消费支出(单位:亿元)1686,1925,2356,3027,3891,4874

3、,5430,5796,6217,6796,北京市城镇居民消费支出序列(单位:亿元),时间序列分析方法,描述性时序分析通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,序列,统计时序分析利用数理统计学的基本原理,分析序列值内在的相关关系,描述性时序分析案例,德国业余天文学家施瓦贝(S.H.Schwabe)发现太阳黑子的活动具有11年左右的周期,描述性时序分析,通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步.局限性:它只能展示非常明显的规律性.而在金融、保险、法律、人

4、口、心理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的.,统计时序分析方法,频域分析方法,时域分析方法,统计时序分析,频域分析方法,原理假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动发展过程早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段特点非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性,时域分析方法,原

5、理事件的发展通常都具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,这种相关关系通常具有某种统计规律.目的寻找出序列值之间相关关系的统计规律,并拟合出适当的数学模型来描述这种规律,进而利用这个拟合模型预测序列未来的走势特点理论基础扎实,操作步骤规范,分析结果易于解释,是时间序列分析的主流方法,时域分析方法的分析步骤,考察观察值序列的特征根据序列的特征选择适当的拟合模型根据序列的观察数据确定模型的口径检验模型,优化模型利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展,时域分析方法的发展过程,启蒙阶段,基础阶段,发展阶段,YuleWalker,BoxJenk

6、ins,EngleGranger,启蒙阶段,G.U.Yule英国数学家.1927年,Yule提出用线性回归方程来模拟一个时间序列,这是最早的AR模型.G.T.Walker英国数学家,天文学家.1931年,Walker利用Yule的分析方法研究了衰减正弦时间序列,得出Yule-Walker方程,基础阶段,G.E.P.Box和G.M.JenkinsGeorgeEP.Box,国际级统计学家,1960年创立威斯康星大学统计系并任该系系主任,他发表过200多篇沦文GwilvmMJenkins已故国际级统计学家.曾于1966年创立了英国兰开斯特大学系统工程系.1970年,Box-Jenkins出版了Tim

7、eSeriesAnalysisForecastingandControl一书,提出了ARIMA模型(BoxJenkins模型)ARIMA模型的:单变量、同方差场合的线性模型,完善阶段,异方差场合RobertF.Engle,1982年,ARCH模型Bollerslov,1985年GARCH模型Nelson等人提出了GARCH模型的多种衍生模型多变量场合C.Granger,1987年提出了协整(co-integration)理论非线性场合汤家豪等,1980年,门限自回归模型,RobertF.Engle,C.Granger,1.4时间序列分析软件,常用软件S-plus,Matlab,Gauss,TS

8、P,Eviews和SAS推荐软件SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS.SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势,本章SAS软件操作指导,SAS操作界面介绍菜单栏,工具栏,窗口创建SAS数据集使用DATA步创建数据集直接导入外部数据文件转换成SAS数据集时间序列数据集的处理间隔函数(intnx)的使用序列变换子集缺失数据插值,第二章时间序列的预处理,本章结构,2.1平稳性检验,特征统计量平稳时间序

9、列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性的检验,概率分布,概率分布的意义随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定时间序列概率分布族的定义实际应用的局限性,特征统计量,均值方差自协方差自相关系数,平稳时间序列的定义,严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳.宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性.它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定.,平稳时间序列的统计定义,满足如下条件的序列称为严平稳序

10、列满足如下条件的序列称为宽平稳序列,严平稳与宽平稳的关系,一般关系严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立特例不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列当序列服从多元正态分布时,宽平稳可以推出严平稳,平稳时间序列的统计性质,常数均值自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关延迟k自协方差函数延迟k自相关系数,自相关系数的性质,规范性对称性非负定性非唯一性,时间序列数据结构的特殊性,传统统计分析的数据结构有限个变量,每个变量有多个观察值时间序列数据结构可列多个随

11、机变量,而每个变量只有一个样本观察值,平稳性的重大意义,在平稳序列场合,序列的均值等于常数,这意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列.原本每个随机变量的均值(/方差/自相关系数)只能依靠唯一的一个样本观察值去估计,现在由于平稳性,每一个统计量都将拥有大量的样本观察值.这极大地减少了随机变量的个数,并增加了待估变量的样本容量.极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度,平稳性的检验(图检验方法),时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特

12、征自相关图检验平稳序列通常具有短期相关性.该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零,例题,例2.1检验1964年1999年中国纱年产量序列的平稳性例2.2检验1962年1月1975年12月平均每头奶牛月产奶量序列的平稳性例2.3检验1949年1998年北京市每年最高气温序列的平稳性,例2.1:中国纱年产量时序图,例2.1自相关图,例2.2:奶牛月产奶量时序图,例2.2自相关图,例2.3:北京市每年最高气温时序图,例2.3自相关图,2.2纯随机性检验,纯随机序列的定义纯随机性的性质纯随机性检验,纯随机序列的定义,纯随机序列也称为白噪声序列,它满足如下两

13、条性质,标准正态白噪声序列时序图,白噪声序列的性质,纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的,纯随机性检验,检验原理假设条件检验统计量判别原则,Barlett定理,如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布,假设条件,原假设:延迟期数小于或等于m期的序列值之间相互独立备择假设:延迟期数小于或等于m期的序列值之间有相关性,检验统计量,Q统计量LB统计量,判别原则,拒绝原假设当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论