




已阅读5页,还剩22页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 近年来,金融行业的发展带动了数学与统计学方法在金融模型中的应用。在 金融资产中,对收益率波动性的关注也呈现上升的趋势。对于波动性的建模问 题,已提出了很多不同的模型,其中最具代表性的是由e n g l e 于1 9 8 2 年开创性 提出的自回归条件异方差( a u t o r e g r e s s i v ec o n d i t i o n a l 九e 亡e r d s c e d o s 悦反) 模型, 简称4 冗g 旧模型。在这之后的二十多年时间里,a 冗c 日模型的各种变化形式 及各方面的应用成果不断涌现,成为现代经济计量学飞速发展的一个重要领域。 对于a r c h 模型的定阶问题也有相当多的讨论,出现了一些对于模型参数的估 计算法,比如禁忌一递阶遗传算法。但是对于模型定阶的问题,在现实生活中, 我们需要模型回归的非零参数尽可能少一些,并且这些非零参数对响应变量的 影响要尽可能的大。现有的模型定阶和参数回归方法并不能满足这个要求。而 l a s s o 方法在这个问题上有很大的应用优势。本文主要讨论如何运用l a s s o ( f 1 p e n a l i z e dr e g r e s s i o n ) 方法来对a 兄c 日模型进行定阶的问题。本文首先在残差正 态性假设的基础上得到a r c 日模型和a r 模型之间的关系,使得对于a 冗c 日模型 的参数估计问题可以用a r 模型的极大似然估计方法得出。这样可以使用l a s s o 方 法,并且通过模拟得出用l a s s o 方法进行定阶有比较好的稳定性,并且准确率也 较高。还选取了金融时间序列,对其收益率序列分别用传统的a r c h 参数估计方 法和l a s s o 方法来确定其滞后期,并进行对比,得出l a s s o 方法对于确定金融时间 序列的滞后期有一定的帮助。 关键词:a r c h 模型,极大似然估计,l a s s o ,m o n t ec a r l o a b s t r a c t a b s t r a c t d u r i n gr e c e n ty e a r s ,t h ep r o g r e s so ff i n a n c i a lm a r k e t sm a d e t h eu s eo fm a t h e m a t - i c a la n ds t a t i s t i c a lt o o l sf o r w a r dq u i c k l y a m o n gt h ef i n a n c i a la s s e t s ,m u c ha r e n f i o ni s p a i do nt h ev o l a t i l i t yo fy i e l dr a t e w i t hr e s p e c tt ob u i l d i n gm a t h e m a t i c a lm o d e l sf o r t h ev o l a t i l i t y , m a n yd i f f e r e n tm o d e l sw e r eb r o u g h tu pc o n s e q u e n t l y t h em o s tp r e v e n t a t i v eo n ei st h ea u t o r e g r e s s i v ec o n d i t i o n a lh e t e r o s c e d a t i c y ( a r c 日) m o d e l ,w h i c hw a s b r o u g h tu p b ye n g l ei n19 8 2 a f t e rt h a t ,f o rm o r et h a n2 0y e a r s ,d i f f e r e n tv a r i a t i e sa n d a p p l i c a t i o no fa r c h w e r es h o w nu p ,a n di tb e c a m eav e r yi m p o r t a n tp a r to fm o d e m e c o n o m e t r i c s t h e r ea r em a n yo t h e rd i s c u s s i o n sa n dc o m p u t a t i o nm e t h o d sf o ra r c h , s u c ha sb h ha n dg e n e t i ca l g o r i t h m ( h o l l a n d ) t h i sa r t i c l ef o c u s e so nt h ea p p l i c a t i o n o fl a s s oa b o u ta r c h l a s s oi sc o m p a r e dw i t ht h et r a d i t i o n a lr e g r e s s i o nm e t h o do f a r c ht os h o wt h ea d v a n t a g eo fl a s s o t h er e l a t i o n s h i pb e t w e e na r c hm o d e la n d a rm o d e li sa n a l y z e db a s e do nt h er e s i d u a l sn o r m a la s s u m p t i o n a n dt h i sr e l a t i o n - s h i pl e a d st ot h eo u t c o m et h a tt h ep a r a m e t e r so fa r c h m o d e lc a nb ee s t i m a t e db y t h el i k e l i h o o de s t i m a t i o no fa rm o d e l t h e nw es i m u l a t eb yu s i n gl a s s oa n dk n o w t h a tl a s s oh a sg o o dr o b u s t n e s s w eu s et h ef i n a n c i a lt i m es e r i e st oc o m p a r et h et r a d i t i o n a le s t i m a t i o nm e t h o d sa n dl a s s o t h ec o m p a r i s o ns h o w st h a tl a s s oh a si t su s ei n d e t e r m i n i n gt h el a gt i m e so ft h ea r c h m o d e l k e yw o r d s :a r c h ,m a x i m u mz i k e l i h o o de s t i m a t i o n ,l a s s o ,m o n t ec a r l o 前言 前言 时间序列分析方法由b o xa n dj e n k i n s ( 1 9 7 6 ) 年提出。时间序列,是指观察或 记录到的一组按时间顺序排列的数据,即随机过程的一次实现。时间序列模型不 同于一般的经济计量模型的两个特点是:( 1 ) 该建模方法不以经济理论为依据,而 是依据变量本身的变化规律,利用外推机制描述时间序列的变化;( 2 ) 明确考虑时 间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过别的方法如差 分等将其转换成平稳的时间序列,而后再考虑其建模问题。 a r c h ( a u t o r e g r e s s i v ec o n d i t i o n a lh e t e r o s c e d a s t i c i y ) 作为一种新发展起来的 模型,最早由e n g l e ( 1 9 8 2 ) 提出,以考虑金融时间序列的波动性问题,主要解决 最初时间序列的同方差假设问题。金融时间序列有非常明显的波动性问题,比如 在剧烈的波动之后也很有可能跟随大的波动,这样也就违背了同方差的假设性问 题。a r c h 模型也就被引入以探讨金融时间序列的波动性问题。相应也涌现出 了一类a 兄c 日族模型。 对于时间序列的定阶问题,前人已经做了很多的分析,也出现了一些很好的 方法。而面对庞杂数据的预测问题时,我们通常希望预测方程中的非零成分尽可 能少,并且这些非零成分对于响应变量的影响也要尽可能的大。而对于这样的一 类问题,l a s s o ( 2 1 p e n a l i z e dr e g r e s s i o n ) 方法是很适用的。 本文共分为六部分,在第一部分对l a s s o 方法进行了回顾,其中包括最小二 乘估计以及其表达式$ l l a s s o 的估计表达式,并且归纳了l a s s o 定阶中的三个截 取准贝j j - - a i c ,b i c 和g 。在本文对模型参数的选取过程中,q 准则将作为定阶 的标准。在第二部分,我们对a r c 日模型进行讨论。在一定的假设下,我们得 出了a r c h ( q ) 模型和a r ( q ) 模型之间的关系,并且使用最大似然方法对a 兄c 日 模型的参数进行估计,以为l a s s o 估计做好准备。在第三部分,对l a s s o 方法的 准确性进行了模拟,得到l a s s o 估计有比较好的稳定性和准确率,所以可以在实 际中应用。在第四部分,主要对得出的l a s s o 估计给出其一致性和相合性的证明, 以证明该估计的优良性。在第五部分,进行了实证研究,对上海证券综合指数进 行了实证考察,分别比较了用l a s s o 方法和由传统回归估计的方法得出a 冗c 日定 阶的结果,比较得出l a s s o 估计在对于金融时间序列的定阶问题上有一定的适用 性。 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名:许之鸹 i , 嶙年;月) t 日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均己在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:z 争之鹤 u 础厂年堋 厂日 南开大学学位论文电子版授权使用协议 ( 请将此协议书装订于论文首页) 论文2 够勿7 i 兄存屏脚艰嗖受聊甲励应闻 系本人在 南开大学工作和学 - j 期问创作完成的作品,并已通过论文答辩。 本人系本作品的唯一作者( 第一作者) ,即著作权人。现本人同意将本作品收 录于“南开大学博硕士学位论文全文数据库”。本人承诺:已提交的学位论文电子 版与印刷版论文的内容一致,如因不同而引起学术声誉上的损失由本人自负。 本人完全了解直五态堂图盘焦羞王堡在:僮旦堂焦途塞的管理左这! 同意 南开大学图书馆在下述范围内免费使用本人作品的电子版: 本作品呈交当年,在校园网上提供论文目录检索、文摘浏览以及论文全文部分 浏览服务( 论文前1 6 页) 。公开级学位论文全文电子版于提交1 年后,在校园网上允 许读者浏览并下载全文。 注:本协议书对于“非公开学位论文在保密期限过后同样适用。 院系所名称:旋髫研璧,考院 作者签名: 呼吏赫 学马嘲鹚加。 日期:呵年f 月7 日 第一章l a s s o 的简单回顾 备。 第一章l a s s o 的简单回顾 本章主要对l a s s o 的定义做一个回顾,为后面的进一步研究和应用做好准 1 1 最小二乘估计 p 考虑线性回归模型犰= 岛+ 鼠,岛一n ( o ,( t 2 ) ,且岛独立。有观测数 j = l 据( x i ,犰) ,i = 1 ,2 ,这里x i = ( x i l ,x i 2 ,z 咖) t ,y i 是第i 个观测值相应 的响应变量。最小二乘法就是计算使得残差平方和最小的p = ( 伪,岛) t 的值, 即: 口= a r gn 吾n 娄( 轨一壹j = l 岛z 巧) 2 ) 。 最小二乘估计有很多好的性质,但是仍存在一些不足:一是预测精度的问题, 虽然最小二乘估计的偏差较小,但是其方差可能很大:二是模型的可解释性问题。 在进行大量的预测时,我们希望口中非零分量的个数少一些,同时每个非零分量 对响应变量的影响要相对大一些,为了预测准确,我们希望某些回归参数能减小 到0 ,虽然这样会产生适当的偏差,但却能减小预测方差,同时也减少变量,可 惜的是传统的最小二乘估计并不能做到上述的要求。子集选择( s u b s e ts e l e c t i o n ) 和岭回归( r i d g er e g r e s s i o n ) 对最t j 、- - 乘估计做了改进,但是他们也有各自的缺 点。子集选择虽然使模型可解释,但由于选择过程为离散过程,所以数据的小变 动会引起选择模型的改变,也就降低了预测的准确性。岭回归是个连续性的方法, 它缩小了回归系数,而且没有简单的抛弃掉哪个变量,模型比较稳定,但是正是 由于它不能将任一相关系数设置为0 ,这使得模型中变量过多,模型的可解释性 不好。t i b s h i r a n i ( 1 9 9 6 ) 提出了l a s s o 方法,将回归系数进行压缩并且使得某些回 归系数变成0 ,所以它保留了子集选择和岭回归的优点。 第一章l a s s o 的简单回顾 1 2l a s s o 方法 d t i b s h i r a n i ( 1 9 9 6 ) 提出了在回归系数绝对值的和i 岛i t 条件下最小化残 j = l d 差平方和,即最小化加了系数惩罚项的残差平方和l iy x p1 1 2 + p 岛的方法。 仍使用上面的记号,我们假设观测值彼此独立,或者响应变量耽在观测值给 定的情况下独立,即玑关于条件独立,同时假设既f 是标准化后的数据。令 p = ( 历,仍,体) ,l a s s o 估计可以表示为: f 1 ) = a r g 毋 * 一蚤p 黼肛驴p g 其中t 0 ,是调和参数。调和参数t 的控制使回归系数总体变小。令t o = i 鳄i ,t t o ( 其中钟,钾,僻是回归参数的最小二乘估计) ,这样就会使一 些回归系数缩小并趋于0 ,一些系数甚至就等于0 。另外,这样可以使得变量集中, 不仅使得一些变量的作用减小,而且起作用的变量个数也会相应的减少。实际上, 我们选择调和参数t 使得l a s s o 中非零参数的个数不超过m i n ( p ,n ) 个,这对我 们解决p n 的问题很有用。 对于l a s s o 的计算,主要集中在调和参数t 的确定和解二次规划的问题。确 定调和参数t 的方法有交叉验证,广义交叉验证等。t i b s h i r a n i ( 1 9 9 6 ) 在对调和参 数t 的确定上做了很详尽的阐述。而对于二次规划的问题,绝对值的存在在这里 产生了一定的难度。这里我们可以利用i 传l = 付+ 阿来处理,其中 j = lj = l j = i i 岛i = 譬三名:岔三吕。此时变量个数增加到印个,约束条件变成印+ 1 个线性约束。我们还可以用另外一种简单实用的方法来考虑这个问题。令瓯为 ( q - 1 ,士1 ,士1 ) 形式的p 维向量,当i = 1 ,2 ,2 p 时,也取遍所有的可能。此 时有: t 营g t , 这里g 是一个2 pxp 的矩阵,它的行取遍也。这样我们把带绝对值的不等式约束 化成了简单的线性约束,但是也相应出现了新的问题,2 p 是个很大的数,这样会 2 房 p 触 第一章l a s s o 的简单回顾 h a n s e n ( 1 9 7 4 ) 7 1 入顺序不等式约束,可以给出上面的可行解,具体程序如下: 1 取出最小二乘估计的符号,记为国( 瓯= s i 卵( 伊) ,伊为最小二乘估计) ,并令 e = z ) ; 2 计算p = a r gn 碧n 娄( 犰一;p 岛z 巧) 2 ) s 亡g t ,这里g = 翠; 3 验证pi 岛i t 是否成立,如成立,则停止,p 即为所求,否则进行下一步; 4 添加j 到e 中,其中妨= s i 9 礼( 孱) ,g = ( 瓯,如) t ,重复2 ,3 步。 这个过程在有限步内必收敛,因为每一步在集合e 中添加一个元素,所有元素个 1 3 a ,c 、b ,c 和( 乙准则 当产生过拟合问题以及当拟合模型参数的个数增加时,通常需要强加一罚项 而避免过拟合的问题。a k a i k e ( 1 9 6 9 ) 提出了最小化最终预测误差( f i n a lp r e d i c t i o n e r r o r ,f p e ) 方法。f p e 是关于过程的一个独立现实的一步预报均方误差的估 计。如果我们对数据用阶数p 逐次增加的自回归模型拟合,则白噪声方差的极大 似然估计一般随着p 增加而减少,但是随着拟合模型参数继续估计,估计误差将 使f p e 值增加。因此,根据f p e 准则,应选f p e 达到最小的p 做为拟合模型 的阶。 对于模型选择,a k a i k e ( 1 9 7 3 ) 的信息准则a ,c 是适用性更广泛的准则。a j c 旨在逼近响应与真模型的拟合模型的k u l l b a c k - l e i b e r 指标的无偏估计。a ,c 定义 如下: a i c ( q ) = - 2l n ( 极大似然函数) + 2 9 。 模拟研究结果( j o n e s ( 1 9 7 5 ) ,s h i b a t a ( 1 9 7 6 ) ) 表明如果对数据拟合自回归模型, 则a i c 有使p 估计过高的倾向。b i c 是另一种定阶准则,b i c 旨在克服a ,c 过 拟合的缺点,b i c 准则函数定义如下: b i c ( q ) = 一2 i n ( 极大似然函数) - t - q l o g ( n ) 。 3 第一章l a s s o 的简单回顾 在l a s s o 中一个很好的适用性是可以用一个简单的q 准则来确定阶数其 中: q :( 刍) n ( 觑一或) 2 一礼+ 2 尼, 其中k 是回归的阶数,盯2 是残差平方和。在本文中,我们主要选择q 准则来确 定对变量的选择问题。 4 第二章a r c 日模型 第二章a r c 日模型 金融时间序列的一个显著特点是存在条件异方差,e n g l e ( 1 9 8 2 ) 提出自回归 条件异方差( a r c h ) 模型来刻画时间序列的条件二阶矩性质,通过条件异方差的 变化来刻画波动的时变性及集群性。a r c 日模型由于具有明确的经济涵义,准 确刻画市场波动,一经提出便得到了经济学家们的广泛重视并迅速应用到金融 研究的诸多领域。在二十多年的时间里,a r c 日模型的各种衍生形式以及各种 应用研究成果不断涌现,并成为现代经济计量学飞速发展的一个重要领域。在众 多的单变量a r c h 类模型中,最基本也是最常见的几种模型为e n g l e ( 1 9 8 2 ) 提出 的a 兄c 日模型,b o l l e r s l e v ( 1 9 8 6 ) 提出的g a r c h 模型及其扩展,e n g l e 和b o l l e r s l e v ( 1 9 8 6 ) 提出的单整g a r c h 且p l g a r c 日模型,n e l s o n ( 1 9 8 9 ) 提出的e g a r c h 模 型等。随后也推进了对a r c h 族模型的研究。b o l l e r s l e v 和e n g l e ( 1 9 9 3 ) ,b o i l e r - s l e v 和m i k k e l s e n ( 1 9 9 6 ) ,e n g l e 和p a t t o n ( 2 0 0 1 ) 着重对g a r c h ( 1 ,1 ) 模型进行研 究,指出其模型参数之和随着样本时间间隔的增加而越发接近于1 。随后j e n s e n 和 r a b b e k ( 2 0 0 4 ) ,f r a n c q 和z a k o i a n ( 2 0 0 4 ) 在其文章中指出g a r c h 模型的参数和 接近1 ,并且可以超过l 。这些结果都对a r c 日类模型的参数估计提供了一定的参 考。 在传统经济计量学模型基础上,e n g l e ( 1 9 8 2 ) 弓i 入条件方差来分析方差的变 化,规定条件方差也是g 期滞后扰动平方 1 1 ,0 2 ,0 口) 的线性函数,则有: y t2 肌十瓦, = 动。, v t i i d , e ( v t ) = 0 ,e ( v 2 t ) = 1 , g k = a o + e 乙 ( 1 ) 为了保证条件方差是正数,要求q o 0 ,0 ,j = 1 ,q ; ( 2 ) 为了保证 ) 平稳,要求乜1 + + , 再计算卜妻 令e r r o r ( u ) = k 叫) 2 的值,并记为嵋,z = g + 1 ,。 讲,i o = a r g m i n l 一 i 一 s t 蚓t , d = o 或者 1 口 瓯= a r gm a ,x 一言 ( q 一肛) t e _ 1 ( 口一p ) 一l o gi 吣s 蚓亡, a么j 。 j 2 u 这里一j ( q p ) t e - 1 ( a - z ) - - l o gl i 】是把q 看作服从( p ,) 分布的随机变量时q 的 对数密度,令 口 1 舰= al 乏二i o 。i 亡) ,z ( a ) = 一专 ( a p ) t 一1 ( a p ) 一1 0 9i i 。 j = o 一 于是在给定亡的条件下,求a 就化成:也= a r g 口m 朋a x 。( a ) 。 给定t 时,m o n t ec a r l o 计算方法的程序如下: 1 为了保证模拟的精确性,从n ( z ,) 中随机抽取m = 1 0 0 0 0 0 0 个样本,令这些 样本为历,邑,其中历= ( ,历j ,) t ,j = 1 ,2 ,m 。 2 令叼= 勿i i i t ,j = 1 ,2 ,m ) ,找出z = a r gm a x z q 叼z ( 历) 。 3 把q 砌= ( 乜拦q 犯口岁,a 。o l d ) 作为起点,继续寻找最优解。可以分为以下 的口4 - 1 步进行执行。 第。步:固定a 0 2 d ,q 尹,a o 。l d ,找出最优解q 3 删,满足 懈删,q 辑q 产) - 口黔“_ o ,l d ,口;l d o 。d ) 9 、,1、九 + 脚 口艺 一 飞 芒; p 一 广 砚 掣 一 第二章a r c 日模型 艿其 - 1 l a n 反e d w ) = ( q o ,卅d ,q ,q d f d ) ,此时,q 掣,口多d ,q 乎d 已知,q o 是未知 的。 第i 步:固定q 子删,l o l 扣n e t l ,1 ,“o c 件o l d l ,c t q o l d ,找出口? 8 叫满足 2 ( 簖删,q 嚣,o q ,q 嚣,o c 。o l d ) = q 黔2 ( 略洲,q 搿,q 嚣,o l d ) 其中r u n e s l ) = ( q 孑e 叫,口搿,0 4 ,。o e l o + l d l ,a 乎d ) t ,此时口子e 硼,o l 。n e w ,u o c t o + i d l ,q 孑d 已 知,o t 是未知的。 这里i = 0 ,1 ,q 。 当满足一定条件时,程序停止,我们可以利用新旧两个解的误差设置令程序 停止的条件,比如可以设置成,若i q 0 ,纪一乜孑删i 1 0 ,则得到q 的解a t = ( q 子e 伽,q e ,q 呈鲫,口;8 叫) t ,否则,令a 扰d = ( a 子e 叫,q ? 8 伽,a 孑e 伽,口孑8 伽) t ,再重 复3 中的q + 1 个步骤,直到新旧两个解之间的误差值满足我们假设的条件为止。 1 0 第三章数据模拟 第三章数据模拟 本章我们利用计算机模拟对l a s s o 定阶方法的优良性进行验证。由上面的讨 论,我们知道如果岛服从a r c h ( q ) 过_ 程,则;是服从a r ( q ) j 2 f _ 程的,所以我们可以 用a r ( q ) 模型的阶数去确定相应a r c h 模型的阶数。这里我们主要考虑a r ( 5 ) 的 5 , 模拟定阶问题。模型为五= 咖五o + 已,邑一( 伽,碚) ,t = 1 ,2 ,m 。回 j = l 归系数值为= ( 咖1 ,咖2 ,九,九,s ) t ,且伽= 0 ,萌= 1 。令 耻r 钟鑫九 0 1 西1 钟+ 咖2 0 0 1 西1 掰+ 2 1 也+ 3 镑2 + 镑+ 机错+ 2 矽1 矽2 + 3 钟+ 2 0 0 00l 0 0l 10 i 1 1 再令b = 萌b 1 b ,( x 1 ,x 2 ,x 5 ) 一( 伽,b ) 。首先我们从正态分布( 肛o ,b ) 模 拟出五,恐,五,拖,再根据公式x t = 咖x t 一歹+ 已模拟出拖,曷,。 最后对得到的数据进行l a s s o 定阶模拟,其中运用g 准则来确定变量选择的个数。 下表为模拟的结果,其中咖的真值为( 0 4 ,0 4 ,0 ,0 ,0 3 ) t 。正确率被定义为模拟阶数 正确占模拟次数的百分比。进行的l a s s o 模拟是在r 软件环境下进行,参考了i c l m ( 2 0 0 5 a ,2 0 0 5 b ) 的l a s s o 软件包。 参数真值西样本量m模拟次数正确次数 正确率 1 5 01 0 0 07 8 97 8 9 1 5 05 0 03 9 27 8 4 ( 0 4 ,0 4 ,0 ,0 ,o 3 ) t 1 0 01 0 0 07 7 67 7 6 1 0 05 0 03 9 47 8 8 5 01 0 0 06 7 36 7 3 5 0 5 0 03 3 86 7 6 从上面的表格可以得出,模拟的正确率基本能达n 7 5 左右,样本量对正确 率确实有一定的影响,但是只要保证模拟次数足够高,正确率也是能保证的。这 里,模拟的正确率指的是对阶数的模拟是否正确。可见,我们总是希望样本量越 多越好,而且用q 准则进行的阶数截断也达到了很高的正确率。 第四章估计的优良性 第四章估计的优良性 本章我们主要讨论上面通过l a s s o 方法给出的a r c h 模型的定阶以及参数估 计的渐进性。同l a s s o 运用在线性模型中的渐进性质类似,也就是说,理想的情况 是当一0 0 时,a r c h ( q ) 模型的阶数q 是满足这样一个条件:口_ q g ( n _ 。) , 这在通常情况下很难满足。所以我们适当放宽条件,假设q 是固定的,我们令一 o o ,也就是说对于模型而言,变量的个数是固定的,但是样本量是趋于无穷大的。 我们下面分别来讨论之前得到的估计的相合性和渐进性。 4 1 相合性 由第二章的讨论,我们得出的估计是: a ,= a r g z 甚n 。妻。( z t q 。一骞。z t 一歹) 2 ) 根据k u h n t u c k e r 定理我们可以将上式变为 a ( 。) = a r g z 嚷n 。妻。( z t q 。一;q 。z t 。) 2 + 入骞1 1 ) , 其中入为l 。夕r n n 9 e 惩罚项,它只与有关。对于模型的估计,我们令咒= ( 三三:) , ,d n 孙c 沪南。n 。0 一妻嘴一,) 2 + q一 i l ,并且当o l = q ( o ) 时,纨( q ) 达到其最小值。 j = o 延用上面的记号,可以得到 扩k 盯g 哩n 1 2 黝2 + 惫喜 扎 一 口御 s 醒 咒。 耐 南 0 1 g 口口;口 = 止叫 a 入一 。 咐 志 第四章估计的优良性 定理4 1 如果l i md = d ,d 是一个非负定矩阵, v o o n q m a x ,霹五一0 , 口+ 1 t n 。 一,入) 白l a n g r a n g e 惩罚项,l i 。m 嘉= 知,则a ( 0 ) 一缸g m i n ( z ) ,这 g 里z ( q ) = ( 乜一) t d ( q 一) + 入o i 哟i ,且如果h d ( ) ,贝1 a r gm i n ( z ) = 瓦甜是相合估计。其中= ( 蓁) 为满勋t = 咖+ 杰钆一歹的任意一个向 证明参照k n i g h t 和f u ( 2 0 0 0 ) 中关于l a s s o 估计相关文章中的证明方法。对 :! i :a r c h ( q ) 模型的l a s s o 估计,惩罚最小二乘估计为a ( o ) 。令 z no r 、= n q n t = q + 1一霹妒+ 惫妾 其中兢:口。+ q 既一j + 吼,并且仇服从正态分布( o ,盯2 ) 。将钆:a 。+ 壹叫+ j = lj = l 吼代入孙( 口) 中有 知( o l ) = n q 志。萎。 o + ; n q n q n q 啪叫+ 仇一霹a ) 2 + 惫 e+n(xtt=q1n 霹叶群+ 惫善l 哟+ 1 f = 0 蜘e + n x t ( 1珏怕】2 + 惫萎旧 t = 口+ 1 j = 0 ( 一口) t 五叉( 一o l ) + = ( 一q ) r d ( 一o t ) + 2 n q 2 n q t = q + l g l 哟 j = o ( 刊t 咒吼+ 惫 n、 q t = 萎q1 ( 社妒k 仇+ 惫j = o 蚓。 + 1 q i 哟 j = o 由于d _ d ,五和叩t 相互独立,贝o z n ( a ) _ z ( a ) + 盯2 。知( q ) 是凸的,所 以对于任意的紧集k ,有s u p a ki 孙( q ) 一z ( a ) 一仃2 l _ o ,并且a = o q ( 1 ) ,故 有a r gm i n ( z n ) _ 口a r gm i n ( z ) 。 如果入= d ( ) ,则a o = 0 ,z ( a ) = ( 口一) t d ( q 一) ,从而a r g m i n ( z ) = , 即& ( o ) 是相合估计。 口 1 3 第四章估计的优良性 4 2 渐进正态性 这一节,我们主要考虑估计的渐进正态性,其中的记号和定理1 一样。 定理4 2 如果l i md = d ,其中d 为非负定矩阵, v + o o n q m a x ,瑶x t _ 0 , 口+ 1 t n 。 n - - , o o ,l i 。m 了窘与= 知。,其中入是l a g r a n g e 惩罚项,则 、7 两( a ( o ) 一) 一da r g m i n ( v ) 。其中 y ( u ) :一2 u t w + u t d 钆+ 知壹_ s i 9 佗( 哟) 厶哟0 ) + i 呦i h :。) ) ,。n ( o , a 2 d ) 。 j - - 0 证明a r c h ( q ) 模型的l a s s o 估计的惩罚最小二乘估计为a ( o ) 。参, 照k n i g h t 和f u ( 2 0 0 0 ) 在关于l a s s o 估计的相关证明方法。定义: ( “) n t = q + 1 ( t j t - - u t x d n v 嘶- q ) 。一谚 + h q j = o i + 两i l 哟| , 其中乱= ( u 0 ,u l ,t 2 2 ,u q ) 。当让= 嘶( a ( o ) 一) 时,( u ) 达到最小值。 首先 ( 仇一u r x d 嘶) 2 一谚】_ d 一2 矿+ 1 2 t d u 。另外 t = q + 1 口 入歹= o q 1 q j + u d s q r t n q l - i 哟1 _ 知 u j s i g n ( a j ) i ( q j o ) + i l ,( = o ) 】, j = o 所以可以得到( 钆) _ dv ( 1 2 ) 。因为是凸的,并r v 有唯一的最小值点,则 有a r g m i n ( v n ) = 眄( a ( o ) 一) _ da r g m i n ( v ) ,即证明了a 是渐进正态的。 口 1 4 第五章实证研究 第五章实证研究 本章主要对上海证券交易所综合股票指数的日收益率运用l a s s o 定阶方法建 模。文中所用的数据为上海证券交易所综合股票指数的日收盘价,样本的取值区 间是从1 9 9 0 年1 2 月1 9 日到2 0 0 9 年3 月1 3 日,共4 4 5 3 个数据,来自于大智慧软件。因 为数据是日收盘价,应先计算收益率序列。假设日收盘价序列为f 仇】l ,通过下面的 式子定义收益序列_ 亿) :r t = i n ( : ) 。然后我们对得到的收益率序列用l a s s o 方 法进行模型定阶,表2 是我们对不同滞后期得到的定阶结果。 pg 截断准则对应的步数选进的滞后期 54 ( 2 ,3 ,4 ,1 ) 1 03 ( 2 ,3 ,4 ) 1 23 ( 2 ,3 ,4 ) 1 43 ( 2 ,3 ,4 ) 1 6 3 ( 2 ,3 ,4 ) 1 8 3 ( 2 ,3 ,4 ) 2 03 ( 2 ,3 ,4 ) 模型a l cb i c 系数 a r c h ( 1 ) - 2 0 9 5 9 5 9- 2 0 9 4 0 3 9 a r c h ( 1 1 = o 8 1 4 8 a r c h ( 2 ) - 2 1 6 7 5 。2 92 1 6 4 9 6 8 a r c h ( 1 1 = 0 3 7 3 1 a r c h ( 2 1 = o 4 6 6 6 a r c h ( 1 1 = 0 3 1 2 1 a r c h ( 3 ) - 2 2 0 1 1 7- 2 1 9 7 9 7 a r c h ( 2 1 = o 3 2 4 4 a r c h ( 3 1 = 0 3 1 8 8 a r c h ( 1 1 = 0 。3 1 4 2 a r c h ( 4 ) - 2 2 4 1 6 8 8- 2 2 3 7 8 4 8 a r c h ( 2 1 = o 3 1 5 4 a r c h ( 3 ) = o 3 0 5 8 a r c h ( 4 1 = o 3 9 0 6 a r c h ( 1 ) = o 3 0 6 8 a r c h ( 2 1 = 0 3 0 7 5 a r c h ( 5 ) - 2 2 3 0 5 7 6- 2 2 1 6 8 5 a r c h ( 3 1 = 0 3 1 2 4 a r c h ( 4 1 = o 3 1 2 2 a r c h ( 5 1 = o 3 0 2 3 1 5 第五章实证研究 从表2 ,可以看出,在考虑上海证券交易所综合股票指数日收益率序列的 a r c h ( q ) 模型时,通过l a s s o 法可以选择其滞后期为4 期。此外,对于选择出的 滞后期也可以进行估计计算,得到的结果为a r c h ( 2 ) = o 3 2 6 8 ,a r c h ( 3 ) = o 3 1 2 2 ,a r c h ( 4 1 = o 3 8 7 6 。 另外,我们可以通过r 编程用传统的方法估计a r c h 模型。通过编程得到结 果如表3 。从表3 中可以看出,通过对a i c 和b i c 准则的判断,a r c h ( 4 ) 是最优的 选择,这和我们通过l a s s o 法得到的滞后期选择结果是相同的,但是对于选择的变 量,两种方法得到的结果是不相同的,l a s s o 定阶排除了滞后第一期的变量,而对 于我们直接估计的a r c h 模型来说,滞后前四期的变量则全部选进。由l a s s o 法 确定的a r c 日模型为下式 s t = 也仇,v t i i d ,e ( v t ) = 0 ,e ( u ;) = 1 , 也= 0 3 2 6 8 e 2 2 + 0 3 1 2 2 2 3 + 0 3 8 7 6 e ;_ 4 。 由传统参数估计得到的a r c h ( 4 ) 模型为 岛= 仇,v t i i d ,e ( v t ) = 0 ,e ( v y ) = 1 , h t = o 3 1 4 2 e 乙1 + 0 3 1 5 4 一2 + 0 3 0 5 8 e 2 3 + o 3 9 0 6 s t 2 _ 4 。 从上面两个模型中可以知道,两个方法得出的滞后阶数都是一样,只是l a s s o 法 并未将滞后一期选入模型中,对于参数的估计,两种方法得出的结果都很接近, 从而可见l a s s o 法对于a r c h 模型的定阶和参数估计都有一定的适用性。 1 6 第六章结论 第六章结论 对于a r c h 模型的定阶问题,前人已经做了很多的工作,无论是参数的估 计还是定阶方法,并且也都已经有很好的统计性质。本文将l a s s o 方法应用到 对a r c h ( q ) 模型的定阶问题中。因为当进行大量数据预测的时候,我们希望在 得到的模型中非零的成分尽量少一些,并且这些非零成分尽可能的对响应变量 有较大的影响。相对于传统的变量筛选方法,l a s s o 方法在这个方面有比较好 的优势。本文通过分别对a r c 日和l a s s o 方法的回顾和探讨。首先在对残差进 行正态性假设的基础上,我们可以得到a r c 日模型和a r 模型之间的关系,使得 对于a r c 日模型的参数估计问题可以用a r 模型的极大似然估计方法得出。这样 可以使用l a s s o 方法,并且通过模拟得出用l a s s o 方法进行定阶有比较好的稳定 性,并且准确率也较高。还选取了金融时间序列,对其收益率序列分别用传统 的a 冗c 日参数估计方法和l a s s o 方法来确定其滞后期,并进行对比,得出l a s s o 方 法对于确定金融时间序列的滞后期有一定的帮助。本文只对最早的a r c h 模型进 行了讨论,目前已经涌现出了很多新的a r c 日模型,被称为a r c 日类模型,比 如g a 冗c 日,t g a r c 日等。l a s s o 方法在这些模型中的应用也值得做进一步的探 讨。 1 7 致谢 致谢 在本文的写作过程中,我遇到很多的困难,无论是学术上的问题还是情绪的 问题。在此要非常感谢一路一直给予我很多学术上帮助和支持的刘民千导师。在 导师一遍又一遍的耐心修改和指导下,自己才完成了这篇文章。也非常感谢自己 最亲近的两位朋友兄弟的支持,鼓励和无私的帮助。也非常感谢自己父母的关心。 1 8 参考文献 参考文献 【1 】e n g l e ,r e ( 19 8 2 ) a u t o r e g r e s s i v ec o n d i t i o n a lh e t e r o s c e d a s t i c i t yw i t h e s t i m a t e s o ft h ev a r i a n c eo fu n i t e dk i n g d o mi n f l a t i o n e c o n o m e t r i c a , 5 0 ( 4 ) 9 8 7 - 1 0 0 7 2 】b o x ,g e p ,j e n k i n s
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年烟草职业技能鉴定检测卷及参考答案详解(满分必刷)
- 2024-2025学年中医执业医师测试卷(考点梳理)附答案详解
- 2024自考专业(电子商务)经典例题带答案详解(考试直接用)
- 2025年度赛事安保合同:赛事保安服务协议
- 2025电力工程勘察设计合同示本
- 2023年度银行招聘高频难、易错点题(网校专用)附答案详解
- 2025美容化妆人员考前冲刺练习试题含完整答案详解【夺冠系列】
- 高校教师资格证之《高等教育法规》每日一练附参考答案详解(能力提升)
- 2025医学检验(士)每日一练试卷含答案详解【培优B卷】
- 2025年郑州城建职业学院单招《职业适应性测试》考前冲刺练习题附完整答案详解【易错题】
- 公司收取管理费协议书范本
- JTS-165-6-2008滚装码头设计规范-PDF解密
- 设备维修与保养(课件)
- 《电力行业数字化审计平台功能构件与技术要求》
- 医院培训课件:《和谐医患关系的建构与医疗纠纷的应对》
- 《肺癌基础知识课件》
- 水泥行业发展的现状分析
- 会计继续教育《政府会计准则制度》专题题库及答案
- 安全生产应急处置卡模板(常见事故)
- 学校食堂食材配送服务方案(肉类、粮油米面、蔬菜水果类)
- 高级钳工培训计划
评论
0/150
提交评论