时间序列分析及其应用-基于R 课件 第1-4章 时间序列分析概述 -平稳序列的拟合与预测_第1页
时间序列分析及其应用-基于R 课件 第1-4章 时间序列分析概述 -平稳序列的拟合与预测_第2页
时间序列分析及其应用-基于R 课件 第1-4章 时间序列分析概述 -平稳序列的拟合与预测_第3页
时间序列分析及其应用-基于R 课件 第1-4章 时间序列分析概述 -平稳序列的拟合与预测_第4页
时间序列分析及其应用-基于R 课件 第1-4章 时间序列分析概述 -平稳序列的拟合与预测_第5页
已阅读5页,还剩422页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时间序列分析及其应用---基于R(Time

SeriesAnalysisand

ItsApplication

viaR)时间序列分析Time

SeriesAnalysis时间序列分析

及其应用

——基于R丁咏梅◎主编回中国工临出版集团关于我学院网页

研究生网站导师页关于课·

48学时·

+

R实现时间序列分析及其应用-

于R2026/1/13省于

刚丁

a

0

毒学科结构时序分析管理学

计算机经济学

数据科学统计学系统科学数学

信息科学统计统计学是利用概率论建立数学模

型,收集所观察系统的数据,进

行量化的分析、总结,并进而进

行推断和预测的一门大数据技术

学科,为相关决策提供依据和参

考。(MBA

智库)时间序列分析

(TIME

SERIESANALYSIS)是一种处理时间序

列数据或趋势分析的统计技术,

是用有关历史值和相关模式的信

息来预测未来活动的一种分析。时序2022年12月05日已群发2022年12月04日已群发2022年11月21日已群发2022年11月20日已群发2022年11月19日已群发【案例1】中国国际贸题出口值的预测与分析期⑩106

00

0

G0序

展(

)

原②51

00

0

G

0我被时序分析撞了一下腰---第四弹(2020级时序课程项目汇报展)⑩55

00

心1我被时序分析撞了一下腰--第三弹(2020级时序课程项日汇报展)③47001我被时序分析撞了一下腰一第二弹(2020级时序课程项日汇报展)57

00

心101月20日已群发01月19日已群发【案例3】全国新能源汽车月度销售额的时间序列分析⑨49

00凸0【离例2】基于时序建模和极值分析的新能源段票市场探究与预

68

00

60我被时序分析撞了一下膜一首簏(读)2

01

b2我被时序分析擅了一下膜…首篇⑥

72

001G0统计,统计80

cd

0铁打的营盘,新一轮的时序课--小组名单103

00

心0G0如何使用RStudioCloud27

00

△02022年11月13日B

布2022年11月1日已群发2022年09月28日已

发2022年09月27日B

度2022年02月21日E

发2021年12月20日已群发2021年11月25日已群发quantmod

效51

◎0

0

G0时序,你学会了鸣(终结族)⑥79

01

心2G0(2020级时序课程填日汇报展)(2020级时序课程项日汇报展)PAPERS平稳时序分析非平稳时序分析ARIMASARIMAMAGARCHARMAARIMAXECM平稳一元时序经典模型平稳一元时序建模过程非平稳时序随

机性建模非平稳时序确

定性建模序列波动性分析多元时序分析《时间序列分析》的课程设计时序分析的

数理基础时间序列的基本概念、基本分析方法和思路DYMWUST01

时间序列分析概述时间序列分析Time

SeriesAnalysis武漠科技大学理学院CMLIEECFSCIENE,WH

LNIVSITY

CFSCIE

AD

THONMY中国商品服务出口总额(2010-2024)201020122014

2016

2018

2020

2022

2024Reign

fallsAnnual

rainfall

and

assassinations

of

Romanemperors,27BC-476AD3503001AD

100300400500降雨量随处可见的时间序列年份中国商品服务出口总额功能性磁振造影

(fMRI)地球噪音十亿美元国内生产总值一○一比上年增长114367098651510000008320368000001060000040000020000002021分析序列的特性(探究可能的影响因素及其关系)对未来的序列进行预测图5

2021年居民消费价格月度涨跌幅度6.03.01.51.00.6

0.40.0-0.3-3.01

3

4

月5月6月

7

8

月9月为什么要研究时间序列?《中华人民共和国2021年国民经济和社会发展统计公报》0.8

0.70.7

0.1

0.0图12017-2021年国内生产总值及其增长速度201720182019亿

元1400000-0.3-0.210135671200000-0.22.30.40.90.31.31.020201.515国内生产总值1,021,266.8

10.01911,433.2

9.21801,599.68.41691,766

7.61581,932.4

6.81472,098.8

6.012015年

2016年2017年

2018年

2019年

2020年■国内生产总值(亿元)

◆国内生产总值增长率(%)年份国内生产总值(亿元)2021年11436702020年10159862019年986515.22018年919281.12017年832035.92016年746395.12015年688858.22014年643563.12013年592963.22012年5385802011年487940.22010年412119.3·序列长度为n的观察值序列(一般以时间为单位)X1,X2…,Xn如何描述一个时间序列根据观察值序列{x1,x₂…,xn²进行时间序列分析(默认序列是时间的函数)基于“输入、输出对”序列{(x₁,y₁),(x₂,y₂),….

(Xm,Ym)}进行时间序列分析(预测特征和输出之间的一致性关系)时间序列分析(Time

Series

Analysis

)57,960.249,802.42011年2012年2013年

2014年

2015年

2016年2017年2018年

2019年

2020年城镇人口(万人)

音乡村人口(万人)44,120.元7

城镇居民收支情况基

于相

关的

{x1,X2…,xm²

{

y₁y

2

,

X

m万人90,591482,433.674,275.866,11838,156.732,192.726,228.720,264.714,300.72011年2012年2013年

2014年2015年

2016年2017年

2018年2019年2020年◆城镇居民人均可支配收入(元)鲁城镇居民家庭人均消费支出(元)人口数·

随机序列:按时间顺序排列的一组随机变量…

,X1,X₂,

,Xt,

…·观察值序列:随机序列的n个有序观察值,称之为序列长度为n的观察值序列X1,X2,

…,Xn·

随机序列和观察值序列的关系·观察值序列是随机序列的一个实现■研究的目的是想揭示随机时序的性质实现的手段都是通过分析观察值序列的性质,由观察值序列的性质来推断随机序列的性质时间序列的统计定义时间序列分析的方法序列统计时序分析利用数理统计学的基本原理,分析序

列值内在的相关关

系描述性时序分析通过直观的数据比

较或绘图观测,寻

找序列中蕴含的发

展规律幅值频域分析方法时域分析方法时域分析频蜂多频域分析时间序列分析的方法:统计时序分析描述性时

间序列分析国内生产总值1,021,266.8911,433.2801,599.6691,766581,932.4472,098.82017年

2018年

2019年■

国内生产总值(亿元)

国内生产总值增长率(%)时间序列分析的思路统计时间序列分析画图观察拟合曲线7.616.816.01★对民航客运量序列进行预测,设y

为时间t

(

度)时的航运客流量。一个时间序列分析的例子给定y,

如何预测下一个月,甚至下一年

的客流量?2015

20162017

20182019Time图12015.1-2020.8航空客运量时序图Yt+1=f(yt,yt-1,…)+Et10002000500000092020可以尝试建立客运量序列的随机模型(Stochasticmodel),设yt+1=yt+Et·

这里,假设εt

是均值为0互不相关的随机变量(白噪声),则该模型为随机游走(random

walk)

型。·

Yt+1

=8t+Et-1+Et-2+...

定(non-stationary)

列一个时间序列分析的例子:可能的模型年1月;1:

t≥2020

1

月:t

处于6月至10月;

1:t

处于11月至5月1阶4步差分后序列:拟合模型时序图:2016

2017201820192020一个时间序列分析的例子:拟合4000-2000

2000一个时间序列分析的例子:预测预测值:置信度为95%的置信区间:2015201620172018201920202021202220004000

9000

8000另

一个

:新

响铁路运输量序列2012

2014Time10000

15000

20000

25000

350002009-2019年铁路客运量当期值(万人)的序列时序图2016

2018

2020当期值(万人)20102010

2012

2014

2016

2018季节指数图12Index另

一个

:新

响季节效应提取

趋势效应提取0

95100

1.05

1.15序列趋势效应效果图train_fit1$igureTimetrain另一个时间序列分析的例子:预测ForecastsfromARIMA(4,1,3)(0,1,1)[12]10000

15000

20000250003000035000

4000020102012

2014

2016

2018

2020要分析出什么?国内生产总值7.612011年2012年2013年2014年2015年2016年2017年

2018年■

国内生产总值(Z元)周期、趋势

…什么样的序列需要分析?

如何才能使得分析可行?N=151.021,266.820.50689.786581,932447.098800观测样本丰富,模型简单时间序列分析的几个基本问题200

600需要鉴别是否

纯随机序列时间序列一元时间序列

多元时间序列(应用)时间序列分析的主要框架平稳时间序列纯随机性检验N模型拟合(AR、MA、ARMA)卡尔曼滤波协整模型干预模型ARIMA模型GARCH模型非线性模型回归法没有分析

价值随机性时

序分析确定性时

序分析非平稳时间序列ARMAX模型平稳非白噪声平稳白噪声平滑法Y(

)平稳时间序列分析的主要思路模型识别N参数估计模型检验平稳非白噪声序列Y

模型

优化序列预测●考察观察值序列的特征●根据序列的特征选择适当的拟合模型●根据序列的观察数据确定模型的口径●检验模型,优化模型●利用拟合好的模型来推断序列其它的统计性质或预测序列将来的发展(应用)平稳时间序列分析的主要步骤回归对样本有独立性假设,时间序列分析利用数据相关性(惯性)分析预测O二者在某些方面有相似处,如时间序列分析中也会使用最小二乘方法进行参数估计时间序列分析和回归工

程金

融金融学,工程等时间序列分析统计学知识数理统计,随机过程高等数学(微积分,常微分方程),概率论先后课程关系了解时间序列分析的基本思路,代表性建模思想和方法■如何判断序列的稳定性■对于稳定序列如何建模■如何从序列中抽取出关键因素课程目标南

学人工智能学院北京高等教育精品教材北京大学数掌敦掌系列丛书故字恳留谨数应用时间

序列分析大

取热本书涵盖了几乎所有实证宏观经济学研究的时间序列分析工具,在多所全球顶灾大学作为教材使用!本书是“时间序列分析”领域的最经典教材!中

所声B形

标所度以

4T断解

!W二

3时间序列分析发展简史三P

·交清华经济学系列教材高级应用计量经济学AdvancedApplied

Econometrics李子每网忠参考书目

(致谢)时问序刑分析

(Time

SeriesAnalysis35年粮系,5二年E

如相

静时间序列

分析时间序列分析第

(02时间序列分析的发展历程时间序列分析简史和基本数学工具武漠科技大学数学与系统科学学院WUHANUNIVERSITY

OF

SCIENCEANDTECHNOLOGY时间序列分析TimeSeriesAnalysis描述性时间序列分析7000年前,古埃及人从长期的观察中发现,尼罗河的泛滥是有规律的。为了研究尼罗河泛滥的规律,古埃

及人发明了元旦和天的概念。把每天尼罗河水涨落潮

的规律记在竹竿上。这个竹竿上的数据就是历史上最早的时间序列。通过对这个时间序列长期的观察,他们发现元旦之后

再过200天左右,尼罗河开始涨潮,涨潮期大概60天,

落潮期大概60天。洪水过后,土地肥沃,随意播种就

会有丰厚的收成。尼罗河泛滥期1

月1日

6

1

7

1

0月

1

2

月《史记-货殖列传》中记载,公元前500年左右,范蠡认为我国农作物生成存在

“六岁穰,六岁旱,十二岁一大饥”的自

然规律,提出了我国最早稳定粮价的方

法:“平粜法”。范蠡描述性时间序列分析·描述性时间序列分析是时间序列分析方法的萌芽。对于很多自然现象,只要人们观察的时间足够长,就能运用描述性时序分析发现蕴含在时间里的自然规律。280260240220J.Herschel英国天文学家,发现太阳

黑子变少时,地球降雨量也会变少,农业生产会和

太阳黑子有近似的周期么有这个周期,J.Herschel

根据S.H.Schwabe响降雨量,降雨量影响农作物产量的规律·

欧洲人在1500年左右,也发现了农作物生产与价格序列具有12年左右的周期;他们关心的是为什发现的太阳黑子序列规律,揭示了太阳黑子数量影贝弗里奇小麦价格指数序列

太阳黑子序列1820

183018401850186018701830

1860描述性时间序列分析·描述性时间序列分析是时间序列分析方法的萌芽。对于很多自然现象,只要人们观察的时间足够

长,就能运用描述性时序分析发现蕴含在时间里的自然规律。·但序列又是不断在发展变化当中的,从来没有哪个描述性时间序列规律是绝对正确的。怎么看待

描述性统计规律,直接产生了两种不同的统计哲学思想。·统计相关:关注点是How;真实相关:关注点是WhyHoward

G.Funkhouser美国数学家、历史学家;于1927年在《Anoteon

a

tenth

centurygraph》

描述行星轨道的变化"theoldesttimediagram

knownin

the

western

world”说明统计比率相对于时间和空间的稳定性(某个时间或特性出现的频率随着观察次数的增加趋向于一个固定值)通过序列的一阶差分确定“病态年”通过对原始序列的分析,估计人口占比,对未来情况进行预测和估计John

Graunt.

英国经济学家,人口统计学奠基人。1622年出版《Natural

and

Political

Observations

MadeUpon

the

Bills

of

Mortality》(关于死亡公报的自然和政治观察),整理了伦敦教会自1604年起每周一次的死亡公报的庞大数据,并对当时有关人口和死亡的原因提出论断。Xataral

and

PoliticalOBSERVATIONSMentioned

ina

following

IrDEx,and

made

upon

theBillsof

Mortality.By

f0HX

GRAVXT,Cicizen

ofL

ONDON.Wicheferencetothe

Gowriew,Rlgue,Tad,Gm4m,D9en,davrlCngofthe一

Nae,mwrine

Tarha,larnCrvw

pavnLBmiu一L0N

D0N,Priated

by

Th

yu.for7Marnie.?esu

%and

Tn:Dvu,如the

Sgnof

the

tl

sPalfiCharchyard,MDCLx11.早期时间序列相关概念的研究CAPTAINJoBNGAUNTJohn

Norton1902澳大利亚新闻工作者,用一阶差分

对1879-1900纽约钱币市场每周的

结余、储蓄、贷款数据进行研究,

用差分去除序列的“生长元素”(趋势项)Walter

Bagehot1858英国商人,经济学家,担任《经济学人》主编,在期刊的表格中添加数值(商品价格,贷款利率)相对于以前时间的增减变化栏FrancesCave-Browne-Cave1904英国数学家,研究气压序列时引入一阶差分相关性,气压度数表示为y=f(yt-1)+∈早期的差分思想·

1914年《Biomeitrika》(生物统计)分别刊登了Anderson

和Gosset

关于时间序列差分方法的论文,核心观点是只有当变量和时间是线性关

系是,一阶差分方法才有效。·

将随机变量xy

表示成t

的多项式和随机残差x=E₁+bt+ct²+d³+

…y=e₂+bt+ct²+dt³+

…通过进行高阶差分,直到对x;进行n阶差分后得到的相关与进行m+1阶差分后得到的相关相等,则x;高阶差分的相关和残差e₁∈的差分相关相等,

和e₁E2本身的相关相等·Anderson

对变量差分方法的后续发展主要集中于序列分解和识别平稳

时间序列早期的差分思想William

Sealy

Gosset(Student)英国统计学家Oskar

Anderson

俄国/德国数学家19世纪末-20世纪初,是现代时间序列分析方法萌芽期。这个时期产生了两种不同的时序分析方向由外向内的分析视角产生的方法是与确定性因素分解相关的方法现代时间序列分析方法萌芽期由内向外的分析视角产生的方法是时域分析方法·

因素分解方法(Time

Series

Decomposition)由英国统计学家W.M.Persons

于1919年在论文《Indices

of

Business

Conditions》中首次使用。认为所有的序列波动都可以归纳为受到如下四大类

因素的综合影响:·

长期趋势(secularTrends)。序列呈现出明显的长期递增或递减的变化趋势。·循环波动(Cyclicalfluctuations)。序列呈现出从低到高再由高到低的反复循环波动。循环周期可长可短,不

一定是固定的。·季节性变化(Seasonalvariation)。序列呈现出和季节变化相关的稳定周期波动。·

随机波动(Irregularvariation)。除了长期趋势、循环波动和季节性变化之外,其他不能用确定性因素解释的序列波动,都属于随机波动。■假定序列会受到这四个因素中的全部或部分的影响,导致序列一个时间序列都可以用这四个因素的某个函数进行拟合常用模型·加法模型:

x=Tt+G+S+I·

乘法模型:x=T×G×S×1址确定性因素分解方法·

指数平滑预测方法·

简单指数平滑(平稳序列预测)·Holt两参数指数平滑(趋势序列预测)·HoltWinters三参数指数平滑(周期序列预测)·

X11

模型为核心的各种季节调整模型·X11模型是第二次世界大战之后,美国人口普查局委托统计学家进行的基于计算机自动进行的时间序列因素分解方法。

1954年,XO版本面世,随后十多年陆续推出新的改进版本。1965年,推出成熟版本X11。·

1975年,加拿大统计局将ARIMA模型引入X11模型,开发了X11-ARIMA

模型。ARIMA

模型可以对序列进行向后预测扩

充数据,以保证拟合数据的完整性,弥补了中心移动平均方法的缺陷。·

1998年,美国人口普查局开发了X12-ARIMA模型。它的改进是将一些特殊因素作为干预变量引入研究。这些干预变量

包括:特殊节假日、固定季节因素、工作日因素、交易日因素、闰年因素,以及研究人员自行定义的任意自变量。·2006年美国人口普查局再次推出更新版本X13-ARIMA-Seats,

它是在X12-ARIMA

的基础上,增加了seats季节调整方法。确定性因素分解方法的发展时间序列的频域分析方法■

假定任何一种无趋势的时间序列都可以分解为若干

不同频率的周期波动,借助傅里叶变换,用正弦、

余弦之后来逼近某个函数。■

信号(函数)的傅里叶级数表示·无法有效处理序列中的噪声·Schuster发展频域分析方法,创建周期图方法,用

于估计序列的周期,是时间序列频域分析的奠基人ArthurSchuster英国物理学家Joseph

Fourier

法国数学家随机性因素分解方法·

20世纪60年代,J.P.Burg在分析地震信号时提出最大熵谱

估计理论,该理论克服了传统谱分析所固有的分辨率不高

和频率漏泄等缺点,使谱分析方法进入一个新阶段,称为

现代谱分析阶段。·谱分析方法具有很高的数学门槛,且需要的数据量与计算

量都非常大,且计算结果不易进行直观解释。这使得谱分

析方法的使用主要局限在某些特殊领域,比如:地震研究

领域、电子信号领域、医学研究领域、海洋学、天文学、

军事领域等等。■随着电子信息技术的发展,我们获取的数据频率越来越高,

数据量越来越大。传统的时域分析方法受到挑战,谱分析

方法在高频数据场合越来越受到重视和使用。John

Parker

Burg

美国统计学家时域分析方法的萌芽·

1926年,Yule

从随机序列开始,整理出新序列,计算其相关系数,发现相关的分布特别依赖于一阶差分的相关性,而不是序列本身的相关性。·

1927年,Yule在对单摆运动和太阳黑子序列的分析中,形成新观点:很多

时间序列变量不是和时间相关,而是和同一序列中的滞后变量相关,且观

察值的差分也和滞后变量的差分相关。发表论文《On

a

Method

ofInvestigating

Periodicities

in

Disturbed

Series,withSpecial

Reference

to

Wolfer's

Sunspot

Numbers》提出了AR(2),AR(4)模型·

时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。假设

时间的发展拥有惯性,引入统计模型进行刻画。George

UdnyYule

英国统计学家时域分析方法的萌芽·

时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。假设

时间的发展拥有惯性,引入统计模型进行刻画。·Walker

完善了AR(s)模型,于1931年发表论文《OnPeriodicityinSeriesofRelated

Terms》,并用于分析达尔文港口的气压问题(分析气压的周期,

不同地区气压的关联性)·Slutsky探究随机扰动叠加之后模型及其性质,不同于把随机成分看做误差,

Slutsky把随机成分视为扰动,且认为扰动也是数据产生过程中的一个重要

部分,于1927年发表《The

Summation

of

Random

Causes

as

a

Source

ofCyclicalProcesses》,提

出MA(n)模型Gilbert

Thomas

Walker

英国物理学家,统计学家Eugen

Slutsky

苏联统计学家时域分析方法的理论基础·Wold分解定理·

1938年在博士论文《Astudy

in

the

Analysis

of

Stationary

timeSeries》给出平稳随机过程的定义,ARMA

模型·

同时提出了Wold

分解定理,证明任何平稳序列都可以分解为确定性

序列和随机序列之和;Wold

是现代时间序列分析理论的灵魂,是构

造ARMA模型拟合平稳序列的理论基础。·Cramer分解定理·Cramer分解定理(1962年)是Wold分解定理的理论推广,它是非

平稳序列的分解理论,是构造ARIMA

模型的理论基础。HaraldCramer瑞典统计学家和保险精算学家Herman

Wold

瑞典统计学家时域分析方法的核心·

1970年,Box和

Jenkins出版了《TimeSeriesAnalysisForecastingandControl》一书,将前人的

知识进行了系统的梳理和分析,构造了ARIMA

模型,并系统地阐述了ARIMA

模型的识别、估计、检验及

预测的原理及方法。这些知识现在被称为经典时间序列分析方法,是时域分析方法的核心内容。·

为了记念Box和Jenkins对时间序列发展的特殊贡献,

现在人们也常把ARIMA

模型称为Box-Jenkins模型。ARIMA

模型的实质·单变量、同方差场合的线性模型④WILEYTime

Series

AnalysisForecastingandControlFoURTH

EorioGeorgeE.P.BoxGregoryC.ReinselGwilym

Jenkins

英国统计学家George

Box

英国统计学家统计学大师之路乔治·

博克斯回忆录古埃及人分析

述行星轨道的变化

尼罗河涨落周期描

性时间序列分析异

差多

量非

线

性时间序列分析

时域分析扩展EugenSlutsky

Herman

Wold时间序列分析时域分析方法(统计方法)时间序列分析的阶段和流派JohnParkerBurg时间序列分析

频域分析方法OskarAnderson时间序列分析

期H.G.Funkhouser,美国

数学家、历史学家;于

1927年在《Anoteona

tenthcentury

graph》描Udny

Yule

Thomas

WalkerArthurSchusterJohnGraunt范蠡时域分析方法的完善:异方差·

1982年,Engle根据1958年2季度至1977年2季度的数据,研究英国因工资上涨导致通货膨胀问题时,发现在方差齐性的假定下,很容易预测出1977年3季度物价指数的置信区间。但是Engle认为这个置信区间偏小,与实际情况可能不符。·

为刻划通货膨胀率序列的波动性,

Engle构造了ARCH(Autoregressiveconditionalhetero-scedasticity)模型。与无条件方

差比,条件异方差模型能更准确地拟合出序列即期波动的特征。·

之后,有很多人对ARCH模型进行了拓展和衍生。比较重要的拓展模型

是Bollerslov在1986年提出的GARCH

模型。GARCH

的衍生模型数不胜

数,常用的有EGARCH;IGARCH;GARCH-M;TGARCHRobert

F.Engle美国统计学家,提出ARCH模型,

获2003年诺贝尔经济学奖·

1968年,

Granger

发现多元非平稳序列构建回归模型,容易出现伪回归现象。

而且在1974年进行了非平稳序列伪回归的随机模拟试验。模拟检验非常有说服

力地证明在非平稳的场合,回归方程的显著性检验犯第一类错误的概率远远大

于0.05,伪回归显著成立。这导致多元非平稳序列的回归分析困难。·

1970年,

Box&Jenkins

提出ARIMAX

模型,用于多元平稳序列建立回归模型。·

1975年,

Box&Tiao,首次使用干预模型分析经济政策(定性数据)对空气污

染控制所带来的影响。发展出了专门评估特殊事件对序列产生的影响大小的分

析方法,这种方法统称为干预分析。·

1987年,

Granger

提出了协整的概念,不再要求“变量平稳”而只要求其“某

种现行组合”平稳,解决了多变量回归无法判断是否存在伪回归的问题。为多

变量回归彻底松绑。时域分析方法的完善:多元时序(单一回归模型)Granger英国统计学家提出“协整”理论提出多元时序的Granger因果检验2003年诺贝尔经济学奖·SYSLINE

模型(联立线性方程组模型)是1940年代兴起的,是以公认的经济学说为基础,

根据对现实经济中实际数据所作的经验性估算,建立宏观经济体制的数学模型,并用其

分析经济波动和经济政策,预测经济趋势,为政策提供者提供政策决策参考的模型。·Klein-I模型:Klein

以美国1920-1941年的年度宏观经济数据为样本,建立旨在分析美国在两次世界大战之间的经济发展的小型宏观经济模型。该模型非常简单只有3个行

为方程,但是它在宏观计量经济学发展史上占有重要地位。以后的宏观计量经济学模型

大都是在此基础上扩充、改进和发展起来的。以至于萨缪尔森认为“美国的许多模型,

剥到最后,发现都有一个小的Klein

模型”。·Klein-II

模型:二战以后,由于美国经济环境的改变以及美国政府对宏观经济的逐步干

预,Klein-I模型不再适合美国宏观经济现状。所以Klein以1953-1984年美国宏观经济

数据为样本,基于凯恩斯经济学理论,建立了Klein-Ⅱ

模型。时域分析方法的完善:多元时序(多元方程组模型)Lawrence

Klein美国经济学家1980年诺贝尔经济学奖·

1980年,

Sims

研究货币政策及其影响时,提出向量自回归模型

(VAR

模型)。·这种模型采用多方程联立的形式,但它不以严格的经济理论为依据。·

在模型的每一个方程中,内生变量对模型的全部内生变量的滞后项

进行回归,从而估计全部内生变量的动态关系。·VAR

结构简洁明了,预测精度高。还可以进行协整关系分析,脉冲

响应分析和方差分解研究时域分析方法的完善:多元时序(VA

R模型)ChristopherA.Sims美国经济学家2011年诺贝尔经济学奖·

1980年,汤家豪(Howell

Tong),提出门限自回归模型

(Threshold

AutoRegression,TAR),该模型被认为

是解决非线性建模最接近诺贝尔奖的模型。但因为门限自

回归模型至今无法解决阈值的确定问题,离诺奖一步之遥。·非线性领域是目前研究空间最广阔、华人学者出成果最多的领域目前非线性时序分析主攻方向之一是机器学习方法。1997年,

Hochreiter

Schmidhuber

提出的长短记忆模型RNN(Long-Short

Term

Memory,LSTM),是目前

最热的非线性时间序列预测方法时域分析方法的完善:非线性汤家豪(Howell

Tong)

英国统计学家时间序列分析方法图谱X13-ARIMA-seatWintersX12-ARIMAX12HoltX11因素分解GARCH

ARIMAX协整模型VARARIMAARIMA加法模型TARRNN/

LSTMARIMA乘积模型ARIMA·n

维随机变量X=[X₁,X₂,…,Xn]■累积分布函数F(x₁,…,Xn)=P{X₁≤x₁,…,Xn≤xn}■概率密度函数(连续)■概率密度函数(离散)f(x₁,…,Xn)=P{X₁=X₁,…,Xn=xn}多元随机变量·若已知X对Y无法引入新的信息,则fYIx=x(y)=fy(y)即X、Y独立fx,r(x,y)=fx(x)fr(y)因此fx,y(x,y)=frix=x(y)fx(x)·通过互换X,Y可得贝叶斯公式■给定X=x

的条件分布是(fx(x)>0):条件分布·

期望的计算具有线性特性:E[a+bX₁+CX₂]=a+bE[X₁]+cE[X₂]V[X]=E[(X-E[X])²]=E[x²]-(E[X])²·

期望·

连续形式期望和矩■方差为2阶中心距·n阶中心矩·

离散形式·n

矩·随机变量X₁,X₂

的协方差Cov[X₁,X₂]=E[(X₁-E[X₁])(X₂-E[X₂])]=E[X₁X₂]-E[X₁]E[X₂]用于两个随机变量受某一个共同因素影响的程度·方

差V[X]=Cov[X,X]·协方差的性质Cov[aX₁+bX₂,cX₃+dX₄]=acCov[X₁,X₃]+adCov[X₁,X₄]+bcCov[X₂,X₃]+bdCov[X₂,X₄]协方差·相关系数矩阵R=p将Pi;放置到矩阵中∑≥0,R≥0·

期望E[X]=[E[X₁J,E[X₂],….E[Xn]多元随机变量的统计量·

协方差(矩阵)x=V[X]=E[(X-μ)(X-μ)T]·相关系数·协方差矩阵的计算·假设A为n×p矩阵,B为m×q

矩阵,U,V

分别为

p,q维随机变量C[A(X+U),B(Y+V)]=AC[X,Y]BT+AC[X,V]BT+AC[U,Y]BT+AC[U,V]BT且V[AX]=AV[X]ATC[X+U,Y]=C[X,Y]+C[U,Y]·不同维度随机向量·X

(维度为p,

均值为μ)·Y

(维度为q,

均值为v)·之间的协方差∑xx=C[X,Y]=E[(X-μ)(Y-v)T]多元随机变量的统计量·

方差V[X]=C[X,X]·若X,Y独立,则E[Y

IX=x]=E[Y]·E[aIX]=a·E[Y]=E[E[YI

X]]·E[g(X)IX]=g(X)·E[g(X)YIX]=g(X)E[YIX]·E[cX+dZIY]=cE[XIY]+dE[ZIY]·E[g(X)Y]=E[g(X)E[YI

X]]条件期望■条件期望时间序列分析

武漠科技大学数学与系统科学学院

Time

Series

Analysis02

时间序列分析的基础概率分布与特征统计量,时间序列的平稳性、纯随机性检验,

线性差分方程DYM

WUST2.1

随机过程概率分布与特征统计量时间序列的平稳性概念平稳性检验白噪声时间序列的自回归和移动平均线性差分方程第2章主要内容2.1

随机过程----2.1.1

义随机过程是指随着时间变化的随机的过程。更精确地说,随机过

程就是一簇以时间为参考的随机变量Xt。若时间为非负整数集合

{0,1,2,

…}的子集,则称为离散时间过程;若时间是非负实

数集(0,∞)的子集,则称连续时间过程。※一个时间序列就是来自某个随机过程的实现或者样本函数。若

w

为来自某个样本空间Ω的元素,{X(w,t):w∈Ω,t∈T}即为一

随机过程。必考虑一个来自随机过程{X(w,t):t=0,±1,±2,…}的有限随机变

量集{Xt₁,Xt₂,…,Xtn},其n维分布函数定义※Fxt₁,Xt₂,,xtn(x₁,…,Xn)=P(ω:Xt₁≤x₁,Xt₂≤x₂,…,Xtn≤xn)2.1

随机过程---2.1.2矩统

量※对于随机过程{X(w,t)},若固定t,则{X(w)}

即为一随机变

量;若固定w,则{X(t)}

即为一时间序列。如果一个过程

仅取实值,该过程就称为实值过程。对于一个给定的实值过程{Xt:t=0,±1,±2,…},

定义该过程的均值函数μt=E(Xt)※该过程的方差函数为o²=E(Xt-μt)²※Xt₁,Xt₂之间的协方差为*y(t₁,t₂)=E(Xt₁-μt₁)(Xt₂-μt₂)Xt₁,Xt₂之间的相关系数p(t₁,t₂)如果其一维分布函数是时间不变的,即对任意整数t,k和t+k,

均有Fx(x)=Fxt+k(x)称为依分布一阶平稳。类似地,若对于任意整数t₁

,t₂

,k,和

有称为依分布二阶平稳。依分布n阶平稳是指Fxt₁,Xt₂…;Xtn(x₁…,xn)=Fxt₁+k,Xt₂+k,·…,Xtn+k(x1,…,Xn)

对于任意n元组{t₁

,t₁

,…,tn

和整数k成立。若对任意整数n,n=1,2,

,上式均成立,则称该过程n维严平稳随机过程。2.1

随机过程---2.1.3随机过程的平稳性2.1

随机过程---2.1.3随机过程的平稳性※对于一个严平稳过程,分布函数对于所有的t

都是一样的,若

E(|Xt1)<∞,

则均值函数μt=μ,是一个常数。若E(|Xtl²)<∞,则对所有的t,有σ²=σ²,也是一个常数。进一步地,有※γ(t₁,t₂)=γ(t₁+k,t₂+k)※若令t₁=t-k,t₂=t,则※γ(t₁,t₂)=γ(t-k,t)=γ(t,t+k)=Yk,p(t₁

,t₂)=Pk※因此,对于二阶矩有限的严平稳过程,二阶协方差和相关函

数仅依赖于时间间隔k。如果一个过程有直至n阶的混合矩,且矩不随时间变化,则称

该过程是宽平稳的。2.1

随机过程---2.1.3

随机过程的平稳性※当随机过程的分布很难以获得时,过程的平稳性判断难以

进行。尤其对于非独立同分布(i.i.d.)的时间序列,难以

给出其分布函数,尤其时联合分布函数。此时,我们通常

根据过程的矩条件来判断平稳性。如果一个过程有直至n

阶的混合矩,且矩不随时间变化,则称该过程时宽平稳的

,实际中常取n

=2。※因

此,一个二阶宽屏问的过程有常数均值和方差,并且二阶协方差是与时间t无关的常数。※一阶矩和二阶矩有限的严平稳过程也是宽平稳过程,或称

协方差平稳过程。※一个严平稳过程可能没有有限的矩,如独立同分布的柯西

随机变量形成的随机过程,不存在混合矩,故虽然是严平

稳的,但不是任何阶的宽平稳随机过程。考虑下面的时间序列:Xt=Asin(wt+θ)其中,A是均值为0,方差为1的随机变量,θ为服从[一π,π]上的

均匀分布的随机变量,且与A

独立,※E(Xt)=E(Asin(wt+θ))=E(A)E(sin(wt+θ))=0

※E(XtXt+k)=E{A²sin(wt+θ)sin[w(t+k)+θ]}※二阶协方差矩仅与时间差有关,与时间t无关,因此,该过程是宽平稳的。举

例令Xt是一独立的随机变量序列,该序列交替地服从标准正态分布N(0,1)和一个以相等的概率1/2取1或者-1两个值的

离散均匀分布。对于所有t,E(Xt)=0,

以及因此,这个过程是协方差平稳的,但不是严平稳的。如果一个随机过程的联合概率分布是正态分布,它被称为正态或高斯过程,该过程的严平稳和宽平稳等价。举

例随机变量族的统计特性完全由它们的联合分布函数或联合密度

函数决定。作为随机序列的时间序列,其概率分布族定义如下:设{Xt,t∈T}

是一随机时间序列,对任意整数n

及任意t∈T,x₁∈R,称为{X,t∈T}

的n维概率分布函数。显然,时间序列是固定随机事件的一个随机过程。Ft₁,t,…tn(x₁,x₂,…,Xn)≌(2-1)随机过程2.2概率分布与特征统计量时间序列的平稳性概念平稳性检验白噪声时间序列的自回归和移动平均线性差分方程第2章主要内容2.2概率分布与特征统计量随机变量的矩从统计学角度来说,一个随机变量X

的第n

阶矩可以定义为:随机变量的1阶矩叫做均值。随机变量的2阶矩叫做方差。随机变量的3阶矩又称为偏度,它度量了随机变量

分布的非对称程度。随机变量的4阶矩又称峰度,其衡量随机变量分布

的尖峰程度或平坦程度。2

.

2

量低阶样本矩:有用的运算规则:小练习:2

.

2

※均值函数方差函数为标准差函数自协方差函数自相关(系数)函数

(ACF)特别地※自相关函数ACF描述了在同一个随机过程中,相距s-t

个时滞的Xs,Xt

之间的相关性。※除了Xt与Xt+k之间的自相关外,我们考察除去Xt与Xt+k共同

线性以来的干预变量Xt+1,Xt+2,…,X

t+k-1的影响后的相

关,这种条件相关Corr(Xt,Xt+k|Xt+1,Xt+2,…,Xt+k-1)称为偏自相关函数(PartialAutoCorrelation

Function,PACF)

,

其计算表达式为:常

记为中kk,

,EXt=E(XtIXt+1,Xt+2,…,Xt+k-1),

EXt+k=E(Xt+k

|Xt+1,Xt+2,…,Xt+k-1)。特征统计量样本的特征统计量※

如果知道一个随机时间序列的所有可能实现或者多次独立实现

,

则能够计算出序列均值、方差、协方差、自相关系数、偏

自相关系数的精确值。然而,大多数应用中,得到多次实现非

常困难,大多数可利用的时间序列只由单个实现构成,不可能

计算总体统计指标。在接下来的讨论中,我们在优良的统计特

性的检测条件下,使用时间平均来估计均值、自协方差和自相

关函数。※(1)样本均值※对于单个实现,随机过程的均值E(Xt)

的一个自然估计是简单

均值

,

它是n个观测值的时间平均。若考虑这一随机过程是平稳的,记E(Xt)=μ,显然,X是μ的无偏估计量对于任意给定的k,由于样本自协方差函数Yk是总体Yk的渐近无偏估计,因此Yk为均方一致以及该过程是自协方差遍历的一个充分条件是自协方差函数是绝对可和的,即∑

-

。IYkl<∞,

并且※(2)样本自相关函数对于单个实现,可以使用时间序列平均来估计自协方差函数Yk,或者※(3)样本自相关函数※对给定的观测序列X1,X₂,

,Xn,样本自相关函数(ACF)

K=0,1,2,

其中,是序列的样本均值。(4)样本偏自相关函数必样本的偏自相关函数常用Φkk来表示。Durbin(1960)曾给出偏

自相关函数的递推算法:中k+1,j=Φkj-Φk+1,k+1Φk,k+1-j,j=1,2,…,k4+1.随机过程概率分布与特征统计量2.3时间序列的平稳性概念2.4

平稳性检验

白噪声时间序列的自回归和移动平均线性差分方程第2章主要内容平稳性(stationary)

,简单地说就是:系统达到统计平衡状态,其统计特性不随时间推移而变化。※严平稳■严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该

序列才能被认为平稳。※

精确定义※

满足如下条件的序列称为严平稳序列2

.

3

义2.3平稳时间序列的定义※宽平稳■宽平稳是使用序列的特征统计量来定义的一种平稳性。

它认为序列的统计性质主要由它的低阶矩决定,所以只

要保证序列低阶矩平稳(二阶),就能保证序列的主要

性质近似稳定。※满足如下条件的序列称为宽平稳序列1

,设E(U)=E(V)=0,Var(U)=Var(V)=σ²,E(UV)=0,X=Ucos(at)+Vsin(at),w

是不为0的常数,则判断X的平稳性。2,练习:若X为平稳序列,则其线性变换依然为

平稳序列。定

解(

练习

)

一般关系■严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶

矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳

成立特例■不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯

西分布的严平稳序列就不是宽平稳序列■当序列服从多元正态分布时,宽平稳可以推出严平稳※3.严平稳十二阶矩存宽平稳※

4.对于正态分布序

宽严

系平稳时间序列的统计性质※常数均值※常数方差※自协方差函数和自相关函数只依赖于时间的平移

长度(间隔)而与时间的起止点无关※延迟k自协方差函数※延迟k自相关系数※注:平稳序列经过线性变换后依然是平稳的。规

性对

性非

性非

一个平稳时间序列一定唯一决定了它的自相关函

数,但一个自相关函数未必唯一对应着一个平稳

时间序列。自相关系数的性质对

n阶自协方差阵是非负定的,即对任一非零n维向量非负定性在平稳序列场合,序列的均值等于常数,这意味着原本含

有可列多个随机变量的均值序列变成了只含有一个变量的

常数序列。

原本每个随机变量的均值(方差,自相关系数)只能依靠

唯一的一个样本观察值去估计,现在由于平稳性,每一个

统计量都将拥有大量的样本观察值。这极大地减少了随机变量的个数,并增加了待估变量的样本容量。极大地简化了时序分析的难度,同时也提高了对

特征统计量的估计精度平

义注:大多数软件采用后一种来进行计算acvf和acf

(保证正定性)对

有随机过程概率分布与特征统计量时间序列的平稳性概念2

.4平稳性检验白噪声时间序列的自回归和移动平均线性差分方程第2章主要内容

检验方法

方法一:图检验·

时序图检验·

自相关图检验方法二:构造检验统计量进行假设检验·

单位根检验方法三:·PP

检验·KPSS

验2.4平稳性检验时间序列的平稳性检验

方法一:图检验·

时序图检验·

自相关图检验2.4

平稳性检验平稳性的时序图检验

时序图检验■原理:平稳时间序列具有常数均值和方差。这意味

着平稳序列的时序图应该显示出该序列始终在一个

常数值附近波动,而且波动的范围有界、无明显趋

势及周期特征的特点。时序图检验技巧■如果序列的时序图显示出该序列有明显的趋势性或

周期性,那该序列通常就不是平稳序列。根据这个

性质,很多非平稳序列,通过查看它的时序图就可以直接识别出来。平

(

)平

(

)例※电力是国民经济的重要基础工业,是能源行业的中心。

一个国家的工业发展离不开电力事业的发展,随着中

国工业化的发展,中国的用电量也保持持续增长。我

国现在的主要电力供应来源主要包括风电、火电、水

电、光电等几个方面。火电作为我国的主要供电来源,

其发电量占我国发电量的80%,但由于发电的化石能

源的不可再生性,以及火力发电带来的环境污染。所

以进入21世纪以来我国的新能源逐渐得到重视,风电、

光电、水电得到大力发展。收集了2016年5月至2021

年9月我国的火电、水电、光电、风电发电量数据序列,

做出序列图,如图2-1所示。Time

Time图2-12016年5月至2021年9月我国的火电、水电、光电、风电发电量

时间序列图直观上看,风电、火电、光电时间序列随时间演进都呈

现递增趋势,故非平稳;水电序列表现出平稳性。20172018

2019

20202021wind

firewater

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论