多元时间序列数据.ppt_第1页
多元时间序列数据.ppt_第2页
多元时间序列数据.ppt_第3页
多元时间序列数据.ppt_第4页
多元时间序列数据.ppt_第5页
免费预览已结束,剩余44页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元时间序列数据 常用的一元时间序列方法单位根及协整检验VARX模型与状态空间模型 时间序列是指数据按照一定时间间隔收集的一系列数据 时间序列可以是一维或一元的 也就是说只有一个按照时间记录的变量 比如一个气象站点获取的降水量数据 也有些是多维的 即变量是多维向量 比如一个气象站按照同样时间间隔收集的气压 气温 降水量 风力等多个指标 研究时间序列的一个主要目的是做对同样变量的未来值的预测 这就意味着下面的假定必须成立 这个未来值能够完全由同样变量的现在和过去值预测 而不受任何其他变量的影响 这个假定很强 往往不能满足 但人们往往又有意无意地无视这个假定 当然也有加入其他变量的模型 中国通常的时间序列教科书内容的主要部分都是讲的一元时间序列 这是因为其数学推导和结论被研究得比较透彻 比较容易讲 到了高维时间序列 一切都不那么清晰和漂亮 一元时间序列的一些漂亮数学结论和公式很难推广到高维情况 多元时间序列在预测上是否就比一元强些呢 这不见得 时间序列 特别是经济领域的时间序列受到大量其他因素的影响 比如疾病 如SARS 自然灾害 如地震海啸 法律政策的改变 全球的金融危机等等 这些经济特征的时间序列严重受制于那些大的环境因素的变化 而后者是几乎无法用数学方法预料的 常用的一元时间序列方法时间序列的组成和分解 差分及平滑 例7 1货币基数 AMBNS csv 这是在圣路易的美国联邦储备银行发布的货币基数 该数据是月度数据 从1918年1月1日到2012年1月1日 单位是10亿美元 w read csv AMBNS csv w1 ts w 2 start c 1918 1 frequency 12 par mfrow c 1 2 ts plot w1 lines diff w1 lty 3 col 4 w2 ts w1 949 1129 start c 1997 1 frequency 12 ts plot w2 ylim c 0 max w2 lines diff w2 lty 3 col 4 Holt Winters滤波函数 可做指数平滑 b2 HoltWinters w2 gamma FALSE beta FALSE par mfrow c 1 2 plot b2 原序列及拟合曲线图ee2 b2 x b2 fit 1 plot ee2 拟合误差图 data Orange package Ecdat ts plot Orange 1 原始变量点图a stl Orange 1 period 对第一个变量 Orange 1 分解ts plot a time series 1 3 画出分解出来的三部分 Loess方法对橙汁的冰冻橙汁厂家价格做季节趋势分解 ARIMA模型例7 1的货币基数数据 截取货币基数的一部分数据 从1918年1月到2007年12月 试试ARIMA 0 1 8 1 0 0 模型 w0 ts w1 1 1080 start c 1918 1 frequency 12 到2007 12 01854 997b0 arima w0 order c 0 1 6 seasonal list order c 1 0 0 bp72 predict b0 72 plot w2 lines bp72 pre lty 2 tsdiag b0 图7 4 Ljung Box检验的零假设为序列独立 对于某个滞后 B NULL for iin1 30 B c B Box test b0 resi lag i type Ljung Box p value plot B main Ljung Boxtests ylab p value xlab lag pch 16 abline h 05 lty 2 7 3尼罗河 Nile txt 这是是在阿斯旺 Ashwan 所测量的1871 1970年尼罗河的年度流量 data Nile package datasets layout matrix c 1 1 2 3 2 2 byrow TRUE plot Nile acf Nile pacf Nile ar Nile 选择了二阶AR模型rn arima Nile c 2 0 0 利用下面语句来点出尼罗河数据的acf和pacf函数图 图7 6 函数自动根据AIC选择AR模型的阶数 打印出来的结果为 Call arima x Nile order c 2 0 0 Coefficients ar1ar2intercept0 40960 1987919 8397s e 0 09740 099035 6410sigma 2estimatedas20291 loglikelihood 637 98 aic 1283 96用下面语句点出Ljung Box检验的p值 虚线为0 05水平线 残差的acf和pacf函数图 图7 7 看来拟合虽然不是那么完美 但也还过得去 B NULL for iin1 30 B c B Box test rn resi lag i type Ljung Box p value layout matrix c 1 1 2 3 2 2 byrow TRUE plot B main Ljung Boxtests ylab p value xlab lag pch 16 ylim c 0 1 abline h 05 lty 2 acf rn res pacf rn res 结构时间序列模型 一元状态空间模型 测量方程 动态方程 状态方程 data Nile package datasets fit StructTS Nile type level plot Nile lines fitted fit lty 2 同期平滑得到的状态lines tsSmooth fit lty 3 col 4 固定区间平滑得到的状态legend bottomleft lty 1 3 c Nile contemporaneoussmoothing fixed intervalsmoothing par mfrow c 1 2 acf residuals fit pacf residuals fit 单位根及协整检验 单位根及协整检验 一些时间序列可能是相关的 他们在一定时期可能显示出较强的相关性 但是 用它们自己来预测自己的未来或者互相预测 则风险很大 就拿宏观经济时间序列来说 它们都受到经济危机 金融危机 政策变化 政权更迭 天灾人祸疾病等偶然事件 法律和规则的改变以及人们心态改变的影响 而这些无法预料的因素根本无法加入到这几个只包含了若干可测量的时间序列的模型之中 某些短期预测往往不用时间序列也可以猜出来 而长期预测则往往是极端不可靠的 单纯利用时间序列来做出推断 而且还给出 政策建议 不但是不科学的 也是很不负责任的 我们还会遇到不同方法得到的结论不相同的问题 这么多检验方法 这里只介绍几个 产生出不同的结论 原因在于这些方法的数学模型不同 这些模型及假定与事实不符 不仅仅不同方法会造成不同结论 同一个方法的不同角度也会造成不同的结论 比如Engle Granger检验 很可能轮换回归得到的结论就不同 不仅如此 该方法有两个步骤 第二个步骤肯定继承了第一个步骤的误差 最终误差可能达到不可承受的地步 单位根及协整检验 此外 在实际工作者使用这些方法时 往往把 不能拒绝零假设 当成 零假设正确 或 接受零假设 的同义词 这在在逻辑上是完全错误的 在统计上是绝对不允许的 不能拒绝零假设 意味着拒绝的证据不足 并不意味着零假设正确 在拒绝零假设时 至少给出了犯错误的大致概率 即p值 但任何人都给不出 接受零假设 时犯错误的概率 做出结论而又不给出该结论所包含的风险是极端不负责的行为 但实际工作者往往需要在显著性检验中无法拒绝零假设时做出决策 合乎逻辑的说法是 在所有关于模型形式 比如某种线性表示以及对数据的各种假定都成立的前提下 我没有足够证据否定零假设 因此把零假设当成另一个附加的假定 单位根及检验 如果一个时间序列是平稳的 则没有任何预测价值 因为平稳序列的均值不变 任何预测都不会有什么有价值的结果 因此人们只对非平稳序列感兴趣 而对平稳序列的研究 也是因为对于非平稳序列 总希望可以通过差分等方式转换成平稳的 而后者是可以通过数学方式予以解释的 如果由 d 次差分可以将一个非平稳序列转换成平稳的 则称其为 d 阶单整的 记为 I d 换句话说 如果 Delta dX t 为平稳的 则序列 X t 称为有 d 个单位根 随机游走为 I 1 单整的 它有1个单位根 最简单的情况为 这里带有截距 随机游走 例7 2芬兰数据 finland csv 该数据来自JohansenandJuselius 1990 有4个时间序列变量 它们是从1958年第2季度到1984年第3季度的货币供应量M1的对数 lrm1 实际收入的对数 lny 边际利率 lnmr 通货膨胀率 difp 下面就是对于例7 2数据的ADF检验 看其4个变量有没有单位根 library urca data finland attach finland lrm1 df ur df lrm1 lags 5 type trend summary lrm1 df lny df ur df lny lags 5 type trend summary lny df lnmr df ur df lnmr lags 5 type trend summary lnmr df difp df ur df difp lags 5 type trend summary difp df ADF显著性水平为0 1的临界值为 3 13 值越小就越显著 而这4个检验统计量的值分别为 2 2702 1 5932 3 1016 2 7569 因此没有足够证据拒绝零假设 也就是说 没有证据说它们是平稳的 因此假定它们都至少是 I 1 的 为了确定这些系列的单整阶数 再对它们的差分数做ADF单位根检验 零假设是差分序列有单位根 下面是代码 lrm12 diff lrm1 lrm12 df ur df lrm12 lags 5 type trend summary lrm12 df 01显著I 1 lny2 diff lny lny2 df ur df lny2 lags 5 type trend summary lny2 df 05显著I 1 lnmr2 diff lnmr lnmr2 df ur df lnmr2 lags 5 type trend summary lnmr2 df 01显著I 1 difp2 diff difp difp2 df ur df difp2 lags 5 type trend summary difp2 df 01显著I 1 这次 ADF显著性水平为0 01 0 05及0 1的临界值分别为 3 99 3 45 3 13 值越小就越显著 而上述差分的4个检验统计量分别为 4 89 3 7416 6 4769 5 7403 分别在0 01 0 05 0 01 0 05水平上显著 这就拒绝了差分有单位根的零假设 即他们都不大会是 I 2 有可能是 I 1 单整的 协整检验 如果若干时间序的线性组合的单整系数阶数小于其成分的单整阶数 就称这些序列间存在协整 cointegration 那些线性组合系数称为协整向量 cointegratingvector 协整向量个数小于变量数目 协整概念类似于线性代数中的线性相关的概念 一个时间序列向量 只有当它们是协整的 才有同时研究的价值 协整意味着向量分量之间存在长期关系 在短期中 这些向量可能关系不那么显著 各自由不同的动态过程所支配 然而 长远来说 协整把变量绑在一起 对于多元时间序列 带有输入项 哑元 D t 的向量自回归模型 VAR p 为 Egle Granger协整检验 这个检验的思想很简单 先用这些时间序列变量互相做通常最小二乘 OLS 回归 再通过单位根检验它们的残差是否为 I 0 如果是 则这些变量可能存在协整关系 我们通过例7 2来说明 首先对这些系列互相做OLS回归 lrm1 ts lrm1 start c 1958 2 end c 1984 3 frequency 4 lny ts lny start c 1958 2 end c 1984 3 frequency 4 lnmr ts lnmr start c 1958 2 end c 1984 3 frequency 4 difp ts difp start c 1958 2 end c 1984 3 frequency 4 flcons window cbind lrm1 lny lnmr difp start c 1958 2 end c 1984 3 各个变量轮流做因变量 lrm1 eq summary lm lrm1 lny lnmr difp data flcons lrm1 eqlny eq summary lm lny lrm1 lnmr difp data flcons lny eqlnmr eq summary lm lnmr lrm1 lny difp data flcons lnmr eqdifp eq summary lm difp lrm1 lny lnmr data flcons difp eq 下面是残差序列 error lrm1 ts resid lrm1 eq start c 1958 3 end c 1984 3 frequency 4 error lny ts resid lny eq start c 1958 3 end c 1984 3 frequency 4 error lnmr ts resid lnmr eq start c 1958 3 end c 1984 3 frequency 4 error difp ts resid difp eq start c 1958 3 end c 1984 3 frequency 4 通过这些回归的输出 可以看出有些变量之间是有些关系 但由于OLS的检验条件不一定符合 不足为据 必须对残差做进一步研究 下面对这些残差做ADF单位根检验 这里零假设是残差序列存在单位根 即它们之间不存在协整 df lrm1 ur df error lrm1 lags 0 type none summary df lrm1 df lny ur df error lny lags 0 type none summary df lny df lnmr ur df error lnmr lags 0 type none summary df lnmr df difp ur df error difp lags 0 type none summary df difp 这里ADF检验的显著性为0 01 0 05 0 1的临界值分别为 2 58 1 95 1 62 而这四个残差的检验统计量的值为 3 5256 3 904 5 1339 8 7288 都在0 01的水平上显著 这就是说 可以拒绝零假设 而得出结论说残差不存在单位根 为 I 0 序列 因而这些序列之间很可能存在协整关系 有了协整关系 我们希望得到短期的误差修正模型 对于例7 2 它可以是这样的 非矩阵 形式 这些系数可以用简单线性模型估计 lrm12 diff lrm1 lny2 diff lny lnmr2 diff lnmr difp2 diff difp leq2 lag error lrm1 ecm summary lm lrm12 lny2 lnmr2 difp2 leq2 OKecm coef 1 得到ECM系数当然 这些估计是比较粗糙的 但可以看出 最后一项 即误差项的系数为负数 这就是 误差修正 的含义 描述了长期效应收敛的快慢 Pillips Ouliaris协整检验 对于例7 2数据 方差率检验为flcons window cbind lrm1 lny lnmr difp start c 1958 2 end c 1984 3 pu test summary ca po flcons demean const type Pu pu test 1不显著统计量的值为26 0919 而显著性水平为0 1的临界值为39 6949 因此不显著 多元迹检验代码为 pz test summary ca po flcons demean const type Pz pz test 01显著统计量的值为184 3248 而显著性水平为0 01的临界值为153 4504 因此很显著 按照多元迹检验 可能存在协整 而根据方差率检验 没有证据说存在协整 这就产生了矛盾结论 Johansen方法 对于例7 2 使用Johansen方法的迹检验的代码如下 summary ca jo data frame lrm1 lny lnmr difp type trace ecdet const 迹检验程序输出下面检验结果 Valuesofteststatisticandcriticalvaluesoftest test10pct5pct1pctr 3 7 767 529 2412 97r 2 18 9017 8519 9624 60r 1 51 6732 0034 9141 07r 0 95 7849 6553 1260 16按照这个结果 有 r 3 个协整向量 对于例7 2 使用Johansen方法的特征值检验的代码如下 summary ca jo data frame lrm1 lny lnmr difp type eigen ecdet const 特征值检验程序输出下面检验结果 Valuesofteststatisticandcriticalvaluesoftest test10pct5pct1pctr 3 7 767 529 2412 97r 2 11 1513 7515 6720 20r 1 32 7719 7722 0026 81r 0 44 1125 5628 1433 24按照这个结果 有可能有 r 2 个协整向量 VARX模型与状态空间模型 前面一节讨论了单位根检验及协整等问题 其主要目的是要确定这些时间序列之间存在长期的关联关系 但究竟是怎样的关系 则需要用一些模型来拟合数据 本章前面已经介绍了带有输入的向量自回归模型 即VARX模型 本节还要简单介绍状态空间 statespace 模型 然后用这两个模型拟合例7 2的数据 VARX模型拟合 data finland package urca finland VAR finland p 2 type none VAR finland p 2 type const VAR finland p 2 type trend VAR finland p 2 type both VARX模型拟合 使用软件包dse的第一步是把数据变成该软件包的格式 data finland package urca finland数据attach finland library dse 把第一个变量 M1 作为输出 另外三个作为输入 fld TSdata input finland 2 4 output finland 1 把数据标为时间序列 fld tframed fld list start c 1958 2 frequency 4 把变量名标上 似乎无法取代默认名字 Series1 Series2等 seriesNamesInput fld c lny lnmr difp seriesNamesOutput fld lrm1 拟合VARX模型 fld ls estVARXls fld max lag 2 默认max lag 6print fld ls stability fld ls rr checkResiduals fld ls par mfrow c 1 2 acf rr re pacf rr re 输出的拟合矩阵为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论