SAS实验指导-Arch建模要点_第1页
SAS实验指导-Arch建模要点_第2页
SAS实验指导-Arch建模要点_第3页
SAS实验指导-Arch建模要点_第4页
SAS实验指导-Arch建模要点_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、arch建模及sas实现一.arch模型arch模型即自回归条件异方差模型,是金融市场中广泛应用的 一种特殊非线性模型。1982年,r.engle在研究英国通货膨胀率序列 规律时提出arch模型,其核心思想是残差项的条件方差依赖于它 的前期值的大小。1986年,bollerslev在arch模型基础上对方差的 表现形式进行了线性扩展,并形成了更为广泛的garch模型。1 .金融时间序列的异方差性特征金融时间序列,无恒定均值(非平稳性),呈现出阶段性的相对平 稳的同时,往往伴随着出现剧烈的波动性;具有明显的异方差(方差随时间变化而变化)特征:尖峰厚尾:金融资产收益呈现厚尾和在均值处呈现过度波峰;

2、波动丛聚性:金融市场波动往往呈现簇状倾向,即波动的当期水平往往与它最近的前些时期水平存在正相关关系。杠杆效应:指价格大幅度下降后往往会出现同样幅度价格上升的 倾向。因此,传统线性结构模型(以及时间序列模型)并不能很好地解释金融时间序列数据。2 . arch(p)模型考虑k变量的回归模型yt =,对, kxkt , ;t若残差项驾的均值为0,对yt取基于t-1时刻信息的期望:et(yt) = 0 - ixit - hi - kxkt该模型中,yt的无条件方差是固定的。但考虑 yt的条件方差:var(yt |yt)=et(yt - 0- ixt-hi- kxkt)2 : et,t2其中,var(y

3、t |y)表示基于t-1时刻信息集合丫皿的yt的条件方差, 若残差项智存在自回归结构,则yt的条件方差不固定。假设在前p期所有信息的条件下,残差项平方丁服从ar(p)模型: a hip:t(*)其中、为0均值、仃2方差的白噪声序列。则残差项空服从条件正态分 布:% n(0,6+y2+iii+up值)残差项8t的条件方差:var(j =二:=,、;1 iii , p;由两部分组成:(1)常数项0 ; p(2) arch项一一变动信息,前p期的残差平方和 巴驾 id注:未知参数入产1,111,%和不。,乙川,儿利用极大似然估计法估计。方差非负性要求%产1,111产p都非负。为了使驾2协方差平稳,需

4、 进一步要求方程1 - : iz-ih - : pzp = 0的根都位于单位圆外。若 叫都非负,上式等价于a1+lll+c(p1.注:若扰动项的条件方差不存在自相关,则有 = hi = qp = 0, 此时var(2 = % ,即残差的条件方差同方差性情形。3. garch( p,q)模型arch(p)模型在实际应用中,为了得到较好的拟合效果,往往需 要很大的阶数p,从而增加了待估参数个数、引发多重共线性、非限 制估计违背巴非负性要求。1986年,bollerslev将arch(p)模型推广为广义自回归条件异方 差模型garch(p, q):残差%的条件方差表示为pqvar( ;j =二一:不

5、:ii 1由三项组成,(1) )常数项金;(2) arch 项;p(3) garch项一一前q期预测方差工叫吗. i 1注:未知参数用极大似然法估计,通常残差的假设分布有正态分 布、t分布、广义误差分布;该模型也要求巴, pj非负;若要求是平稳pp过程,需要限制z %十 pi 2ti 1检验回归有两个统计量:f统计量一一检验回归系数是否显著为 0.txr2统计量一一lm统计量,其中t为观察值个数,r2为回 归拟合优度,该统计量渐近服从 ”(p)分布。(2) .残差平方相关图残差平方相关图显示残差平方 中序列,直到任意指定的滞后阶 数的自相关函数(ac)和偏自相关函数(pac),并计算相应滞后阶

6、 数的qlb统计量。若不存在arch效应,则任意滞后阶数的自相关 函数(ac)和偏自相关函数(pac)都近似为0.5. garch-m 模型一般风险越大,预期收益越大。在回归模型中加入一项“利用条 件方差表示的预期风险”2yt 二 x . ;tpq22:2;t = , 1”: i ;t“ jti 1i 1称为garch-m模型。另外,还有非对称冲击模型:tarch、egarch、parch等(略)。2 .sas 实现-proc autoreg 过程sas中的autoreg过程,是用于估计和预测误差项自相关 或异方差的时间序列数据的线性回归模型。自回归误差模型被用来校正自相关系数和广义自回归条件

7、 异方差模型 garch,弁且其变体如广义的 arch (garch)、 方差无穷的 garch (igarch)、指数的 garch (egarch) 和依均值的garch (garch-m )被用于异方差的建模和校正。 自回归过程autoreg可以拟合任意阶的自回归误差模型,弁且可以拟合子集自回归模型。为了诊断自相关性,过程产生广义durbin-watson (dw)统 计量和其边缘概率。普通回归分析假定误差方差对于所有观察是 相同的,但当误差方差不相同时,数据被称为异方差,此时普通 最小二乘法估计不是有效的,同时也影响预测值置信区间的精确 性。autoreg过程能检验异方差,弁且提供 g

8、arch模型族来估 计和校正数据易变性。对于带有自相关扰动和随时间变化的条件 异方差模型,过程输出条件均值和条件方差的预测值。基本语法:proc autoreg data啜据集 可选项 ;model因变量=独立回归变量列表/选项列表;output out=数据集 选项列表;by变量;说明:1. proc autoreg语句可选项outest=数据集把估计参数输出到指定数据集;covout把估计参数的协方差阵输出到。仇6$1=指定数据集;该选项只有在指定了 outest=选项后才有效.2. model 语句center数一通过减去均值,中心化因变量弁且取消模型的均值参数;noint取消模型的均值

9、参数;nlag =数值| (数值列表)数一指定自回归误差的阶或者自 回归误差的时间间隔的子集。例如,nlag=3与nlag=(1 2 3) 作用相同,但与nlag=(1 3)等不同;garch=(q=数值,p=数值,type=选择值,mean, noint, tr)一指 定广义条件异方差garch模型的类型。例如,定义garch(2,1)回归模型:model y=x1 x2 / garch=(q=2, p=1);注意:sas系统的自回归参数符号 q和p与前文所述公式中 的符号p和q正好相反。定义 garch-m(1,1)回归模型:model y=x1 x2 / garch=(q=2,p=1,m

10、ean);type=选择值 指定 garch模型的类型:默认为 noineq 表示无约束 garch模型;nonneg表示非负约束 garch 模型;stn表示约束garch模型系数的和小于1; integ表 示igarch模型;exp表示egarch模型;noint取消条件异方差模型中的均值参数;trgarch模型的估计使用信赖区域方法,缺省值为对 偶拟牛顿法;archtest要求用portmantea q检验统计量和engle的拉格朗日乘子lm检验是否存在条件异方差情况,即是否 有arch效应;coef输出前几条观察的变换系数;corrb输出参数估计的估计相关系数;covb输出参数估计的估

11、计协方差;dw=n输出直到n阶的dw 统计量,默认 n=1;dwprob输出dw统计量的p值,当误差自由度大于300时dwprob选项被忽略;ginv输出yule-walker解的自协方差的 toeplitz矩阵的逆;itprint输出每步迭代的目标函数和参数估计;lagdetp输出dw t统计量,它用于检验存在时滞因变 量时残差的自相关性;lagdep=回归变量输出 dw h统计量,它用于检验一阶自相关性;partial输出偏自相关;backstep去掉非显著自0归参数,参数按最小显著性的次序被去掉;slstay=数值指定被backstep选项使用的显著水平,默认为0.05;converge

12、=数值指定在迭代自回归参数估计时参数的变化量的最大绝对值小于此数值,那么认为收敛,默认为 0.001;maxiter=数值指定允许迭代白最大次数,默认为 50;method=ml | ols | yw | ityw指定估计的方法,分别为:最大似然估计、无条件最小二乘法、yule-walker估计、迭代yule-walker估计;nomiss数一使用没有缺失值的第一个连贯时间序列数据 集,进行模型拟合估计。否则,跳过数据集开始的任何 缺失值,使用独立回归变量和因变量都不带缺失值的所 有数据。请特别注意,为了保持时间序列中正确的时间 间隔,必须要增加时间刻度值,这样就会产生因变量缺 失值的观察。当

13、因变量缺失时,过程可以产生预测值。如果缺失值很多,则应使用 ml估计。3. output 语句out=数据集一一指定包含预测值和变换值的输出数据集;alphacli=数值一一设置时间序列预测值置信区间的显著 水平,默认为0.05;alphaclm=数值一一设置模型结构部分预测值置信区间 的显著水平,缺省值为0.05;cev=数量一一把条件误差方差写入到输出数据集的指 定变量中,仅garch模型被估计时才使用; cpev=变量把条件预测误差方差写入到输出数据 集的指定变量中,仅 garch模型被估计时才使用; constant=变量把被变换的均值写入到输出数据集的指定变量中;lcl=变量一一把预

14、测值的置信下限写入到输出数据集 的指定变量中;ucl=变量把预测值的置信上限写入到输出数据集 的指定变量中;lclm=变量一一把模型结构部分预测值的置信下限写 入到输出数据集的指定变量中;uclm=变量把模型结构部分预测值的置信上限写入到输出数据集的指定变量中;p变变量把预测值写入到输出数据集的指定变量中;rm变变量把来自模型结构部分预测的残差写入到输出数据集的指定变量中;transform=变量把被变换的变量写入到输出数据集的指定变量中。3 .例子对模拟方法生成的时间趋势加二阶自回归误差模型的时间序列数据,用proc autoreg过程进行分析和建模,以便于比 较和判断各种求解模型和运算结果

15、的好坏。模型:= 10 + 0.5/ + 8tat 弋l3ei 0.5 s t2 + qat wn(0,22)(一)按照模拟模型生成数据集代码:data randar;e1=0;e11=0;do t=- 10 to 36;e=1.3 *e1- 0.5 *e11+ 2*rannor( 12346 );x=10+0.5 *t+e;e11=e1;e1=e;if t 0 thenoutput ;end;un ;obs12345678910111213141516171819202122232425262728proc print data =randar;un ;运行结果:e1 e11-2.73816

16、 -4.991860.03674 -2.738160.66356 0.03674-0.862330.66356-4.30165 -0.86233-3.88957 -4.30165-3.56635 -3.88957-3.68908 -3.56635-2.50263 -3.68908te x1 -2.738167.76182 0.03674 11.03673 0.66356 12.16364 -0.86233 11.13775 -4.301658.19846 -3.889579.11047 -3.566359.93378 -3.68908 10.31099 -2.50263 11.9974-1.8

17、0957 -2.50263 10 -1.80957 13.1904-0.14763 -1.80957 11 -0.14763 15.35241.78537 -0.14763 121.7853717.78544.090111.78537 134.0901120.59013.54577 4.09011 143.5457720.5458-0.929953.54577 15 -0.92995 16.5701-3.39550 -0.92995 16 -3.39550 14.6045-4.57207 -3.39550 17 -4.57207 13.9279-4.02602 -4.57207 18 -4.0

18、2602 14.9740 -3.75333 -4.02602 19 -3.75333 15.7467-1.73776 -3.75333 20 -1.73776 18.2622-1.42859 -1.73776 21 -1.42859 19.0714-0.98120 -1.42859 22 -0.98120 20.0188-1.48741 -0.98120 23 -1.48741 20.0126-4.41515 -1.48741 24 -4.41515 17.5848-4.14229 -4.41515 25 -4.14229 18.3577-5.57633 -4.14229 26 -5.5763

19、3 17.4237-5.55633 -5.57633 27 -5.55633 17.9437-4.17604 -5.55633 28 -4.17604 19.8240obs el e11 te x29 -2.45303 -4.17604 29 -2.45303 22.047030 -0.32189 -2.45303 30 -0.32189 24.678131 -0.24246 -0.32189 31 -0.24246 25.257532 1.61987 -0.24246 321.61987 27.619933 2.26259 1.61987 332.26259 28.762634 0.4854

20、0 2.26259 340.48540 27.485435 -1.115700.48540 35 -1.11570 26.384336 -2.95901 -1.11570 36 -2.95901 25.0410变量e对应/e1对应 一e2对应一表达式2*rannor(12346),将生成独立同分布均值为0,标准差为 2的正态分布随机数,对应于公式中均值为 0,方差为22的白噪声误 差序列。do循环从t=10开始而不是直接从t=1开始的原因,是让模拟 生成的二阶自回归误差序列 有一段时间(t= 10到0)进行初始化, 以便到达稳定的随机序列值。(二)普通最小二乘法回归模型代码:proc auto

21、reg data =randar plots(only) = fitplot;普通最小二乘法估计sse214.953429 dfe34普通最小二乘法估计mse6.32216均方根误差2.51439sbc173.659101aic170.492063mae2.01903356aicc170.855699mape12.5270666hqc171.597444durbin-watson0.4752回归r方0.8200总r方0.8200参数估计值变量自由度情计值标准误差t 值近似pr |t|intercept18.23080.85599.62.0001t10.50210.0403 12.45.0001

22、autoregsdla d.f di d.fasdo3d0如未阻-d. isd.科家军州计的台谬断:x口10z030观测观测36睁se在m2t5陵型自由度2普通最小二乘回归基于统计假设:误差相互对立。然而,时间序列数据,普通回归后的残差常常是相关的。这将导致:第一,对于参数的显著性和置信限的统计检验将不正 确;第二,回归系数的估计不象考虑到自相关性时的估计一样有效; 第三,由于回归残差不独立,它们包含可用来改进预测值的信息。由于这些原因,所以对时间序列数据不使用普通回归 proc reg过 程而使用带自回归误差的回归 pro autoreg过程。model语句中指定回 归模型,没有可选项,是要

23、求利用普通最小二乘法做x对t的回归。为便于对比,绘制了散点图和线性回归趋势线。回归r2是对回归模型的r2,总r2是包括自回归误差在内的整体 模型的r2.现在还无自回归误差模型,故两个 r2相等。估计模型为:ols: xt =8.2308+ 0.5021t + %var(t) = 6.32216该模型较合理地接近真实值,但是误差方差估计 6.32216远大于真实 值4。误差方差估计值远大于真实值(通过对模型的残差作自相关性 检验来判断和识别),说明模型还有信息没有提取。(三)检验模型的自相关系数在实际问题中,需要检验自相关性是否存在,以及存在几阶自相 关。durbin-watson检验是广泛使用

24、的自相关性的检验方法。选项 dw=4和dwprob是要求过程进行1到4阶的ols残差中自相关性durbin-watson检验,并要求输出durbin-watson统计量的边缘显著水平p值。注意:对于季节性时间序列数据,自相关性检验应该至少检验与季节性阶一样大的阶。例如,对于月度数据至少应取dw=12。代码:proc autoreg data =randar;model x=t / dw=4 dwprob ;run ;运行结果及说明:durbin-watson 统计量 顺序 dw pr dw10.4752.00011.000021.29350.01370.986332.06940.65450.345542.55440.98180.0182note: prdw is the p-value for testing negative autocorrelation.参数估计值变量自由度借计值标准误差t 值近似pr |t|intercept1 8.23080.85599.62.0001t1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论