(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf_第1页
(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf_第2页
(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf_第3页
(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf_第4页
(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(管理科学与工程专业论文)基于ARMAGARCH模型的时序数据挖掘研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

合肥工业大学 本论文经答辩委员会全体委员审查,确认符合合肥工业大学硕士 学位论文质量要求。 勉r - 7 辩委员会签名:( 工作单位、职称) 主席:夕哆历 故芬当么学院翻锻僭 委员: 栖嚷喙 亨苡 么让 座扭地太豢 亏舻熏z 乒 撇 乏1 弓寻无量 导师:毛、砻耽名忍沙以章别招援 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得 盒壁王些盔堂 或其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。 学位论文作者签字 签字日期:加1 1 7 年艿月夕日 学位论文版权使用授权书 本学位论文作者完全了解 盒目墨王些态堂 有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人 授权 盒墼王些盔堂可以将学位论文的全部或部分论文内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位敝者躲翻、 签字日期乡幻年岁月乡日 学位论文作者毕业后去向: 工作单位: 通讯地址: 翮虢砺比 签字日期。力吖年伊3 日 电话: 邮编: 基于a r m a g a r c h 模型的时序数据挖掘研究 摘要 本文介绍了a r m a 模型、条件异方差模型和a r m a g a r c h 模型等基于 模型的时序数据挖掘方法。利用时序图、直方图、q q 图、自相关图和异方差 检验对e c g 信号序列进行了特征分析,得出e c g 信号序列具有非正态性和 a r c h 效应。 介绍了基于a r m a g a r c h 模型的时序聚类的不相似测度,并利用 a r m a g a r c h 模型对e c g 信号进行了特征提取,将a r m a g a r c h 模型的 系数作为e c g 信号的特征指标,从而对e c g 信号进行聚类,结果表明,基于 g a r c h 模型系数聚类效果优于其它方法。 最后,对基于a r m a g a r c h 模型的e c g 信号的特征指标进行了变量筛 选,并利用贝叶斯分类法对e c g 信号进行了分类研究,结果表明 a r m a g a r c h 模型较为准确地刻画了e c g 信号的特征。 关键词:时序数据挖掘a r m a g a r c h 模型e c g 信号聚类贝叶斯分类 t i m es e r i e sd a t a 。 r e s e a r c hb a s e doilli m es e r l e si l a t am m m gr e s e a r ca s e0 i l a r m a g a r c hm o d e l a b s t r a c t i nt h i sp a p e r ,t i m es e r i e sd a t am i n i n gm e t h o db a s e do nm o d e l s ,s u c ha sa r m a m o d e l ,c o n d i t i o n a lh e t e r o s c e d a s t i c i t ym o d e la n da r m a g a r c hm o d e l w e o b t a i nt h r o u g hc h a r a c t e r i s t i ca n a l y s i su s i n gt i m es e r i e sp l o t ,h i s t o g r a mp l o t ,q q p l o t ,a u t o c o r r e l a t i o np l o ta n dh e t e r o s c e d a s t i c i t yt e s tt h a te c gs i g n a ls e r i e sh a v e n o n n o r m a l i t ya n da r c he f f e c t t h ed i s s i m i l a rm e a s u r eo ft i m es e r i e sc l u s t e rf o ra r m a - g a r c hm o d e li s p r o p o s e d w ep r e s e n tf e a t u r ee x t r a c t i o no fe c gs i g n a lb a s e do na r m a - g a r c h m o d e l s c o e f f i c i e n to fa r m a g a r c hm o d e li sr e g a r d e sa sc h a r a c t e r i s t i co fe c g a n de c gs i g n a ls e r i e sa r ec l u s t e r e d i ti ss e e nf r o mc l u s t e re f f e c t i v e n e s st h a tt h e c l u s t e rm e t h o db a s e do ng a r c h m o d e lc o e f f i c i e n ti sb e t t e rt h a no t h e rm e t h o d i nt h ee n d c h a r a c t e r i s t i cv a r i a b l e so fe c gs i g n a lb a s e do na r m a - g a r c h m o d e la r es e l e c t e d e c gs i g n a ls e r i e sa r ec l a s s i f i e du s i n gb a y e s i a nc l a s s i f i c a t i o n i ti ss e e nt h r o u g hc l a s s i f i c a t i o ne f f e c to fe c gs i g n a lt h a tt h ec h a r a c t e r i s t i c e x t r a c t i o no fe c gs i g n a lb a s e do na r m a g a r c hm o d e l si se f f e c t i v ea n d e f f i c i e n t k e y w o r d s :t i m e s e r i e sd a t am i n i n g ;a r m a g a r c hm o d e l ;e c gs i g n a l ; c l u s t e r i n g ;b a y e s i a nc l a s s i f i c a t i o n 1 i 致谢 时光匆匆,总是来不及感伤,却又到离别时,但是一切的感伤始终抵挡不 住离别的脚步,就像人们无法留住逝去的时光一样。三年的硕士学习生活将随 毕业论文的答辩而将画上一个圆满的句号。在这里,要衷心感谢各位老师、朋 友、同学的帮助和支持。 论文是在导师毛雪岷老师的悉心指导下完成的,在论文的选题和研究方向 上给出了宝贵的建议,在此表示我最忠心的感谢和真诚的祝福。 还有感谢身边朋友在学习上的帮助和生活上的关心照顾,最后,最真心的 感谢我的父母,你们的辛劳付出,才有我今天的成绩。 作者:李琼 2 0 11 年0 4 月0 5 日 第一章 1 1 1 2 1 3 第二章 2 1 2 2 2 3 第三章 3 1 3 2 3 3 3 4 第四章 4 1 4 2 4 3 目录 绪论1 数据挖掘1 时间序列数据挖掘2 本文的主要工作3 基于模型的时序数据挖掘方法4 a r m a 模型4 2 1 1a r m a 模型简介4 2 1 2a r m a 模型的格林函数与逆函数5 2 1 3a r m a 模型的最大似然估计7 2 1 4a r m a 模型的自相关函数和偏自相关函数7 2 1 5a r m a 模型的预测8 2 1 6a r i m a 模型9 条件异方差模型9 2 2 1a r c h 模型9 2 2 2g a r c h 模型9 a r m a g a r c h 模型10 2 3 1a r m a g a r c h 模型的参数估计1 0 2 3 2a r m a g a r c h 模型的建模步骤1 1 e c g 信号序列的特征分析1 3 e c g 信号序列图1 3 e c g 信号序列的分布特征1 4 e c g 信号序列的s a c f 和s p a c f 15 e c g 信号序列的异方差检验1 7 时序数据挖掘在e c g 信号聚类中的应用2 0 相似测度2 1 4 1 1 欧几里德距离、根均方距离和m i k o w s k i 距离2 l 4 1 2 皮尔逊相关系数2l 4 1 3 时间序列距离2 1 4 1 4 动态时间弯曲距离2 l 4 1 5 基于两个时间序列互相关函数的相似性指数2 3 离差平方和聚类法2 3 时间序列聚类评价标准2 4 i v 4 3 1 基于已知真值的标准2 4 4 3 2 基于未知真值的标准一2 4 4 4 基于a r i m a 模型的时间序列聚类算法2 5 4 4 1a r 距离2 5 4 4 2 基于a r i m a 模型的时间序列聚类一2 6 4 5 基于a r m a g a r c h 模型的时间序列聚类算法2 7 4 5 1a r m a g a r c h 距离2 7 4 5 2 基于a r m a g a r c h 的时间序列聚类2 8 4 6e c g 信号的时间序列聚类2 8 4 6 1e c g 信号的特征提取2 8 4 6 2e c g 信号的聚类分析3 2 第五章贝叶斯分类在e c g 信号分类中的应用3 5 5 1 贝叶斯分类3 5 5 1 1 基本概念3 5 5 1 2 贝叶斯分类方法3 7 5 1 3 贝叶斯分类准则3 7 5 2 贝叶斯分类在e c g 信号分类中的应用3 9 5 2 1e c g 信号的特征提取3 9 5 2 2e c g 信号的贝叶斯分类4 0 第六章结论与展望4 3 参考文献4 4 攻读硕士学位期间发表的论文4 8 v 插图清单 图1 1 数据挖掘流程图一2 图3 1 正常窦性心律( n s r ) 的e c g 信号序列图1 4 图3 2 心室早期收缩( p v c ) 的e c g 信号序列图1 4 图3 3e c g 信号序列的直方图15 图3 4e c g 信号序列的q q 图1 5 图3 5 正常窦性心律e c g 信号的s a c f 和s p a c f 图1 6 图3 6 心室早期收缩e c g 信号的s a c f 和s p a c f 图1 6 图3 7e c g 信号的残差序列的s a c f 图1 7 图3 8e c g 信号的平方残差序列的s a c f 图1 8 图4 1e c g 信号的离差平方和聚类法树形图3 3 图4 2 基于g a r c h 系数的e c g 信号聚类法树形图一3 4 v i 表格清单 表3 1e c g 信号的描述性统计量1 5 表3 2e c g 信号的残差序列的异方差检验1 8 表4 1a r m a g a r c h 模型的参数估计结果2 8 表4 2e c g 信号的聚类分析结果3 2 表5 1 变量指标的逐步筛选概括一4 0 表5 2 贝叶斯分类的回判结果一4 l v i l 第一章绪论 随着信息技术和数据存储技术的迅速发展,大量的数据充斥着我们的电脑 和网络。人们往往要投入大量的资源去收集和存储这些数据,但是随着存贮的 数据越来越多,导致“数据泛滥,知识贫乏 的现象。通常情况下,这些数据 量很大且数据间的结构复杂,可以用到的只是其中很少的一部分。那么如何对 这些海量数据进行有效的分析,从这些海量数据中发现有用的知识,并利用这 些知识的能力显得越来越重要。由此,数据挖掘( d a t am i n i n g ) 技术应运而生, 并且得到了迅速发展。 数据挖掘的基本任务就是进行对数据进行分类、回归、聚类、变化和偏差 检测,它是计算机行业中发展最快的研究领域之一。数据挖掘涉及到计算机科 学、统计学、人工智能、统计机器学习、数据库管理等诸多学科和领域。数据 挖掘技术如今广泛应用于零售、医疗、制造、保险、通信、运输等领域。 1 1 数据挖掘 在提出数据挖掘的概念之前,就要首先介绍知识发现( k n o w l e d g ed i s c o v e r y i nd a t a b a s e ,k d d ) 。知识发现定义为识别出存在于数据库中的有效的、新颖的、 具有潜在价值的并最终可理解的模式的非平凡过程。它综合了统计学、模式识 别、人工智能、数据库等多学科特点的技术。f a y y a d 定义为“k d d 是从数据集 中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。” 1 9 9 6 年“知识发现9 6 国际会议上,f a y y a d 等指出:知识发现是从数据库发现 知识的全部过程,而数据挖掘是此全部过程的一个特定的关键的步骤。 知识发现的一般过程i l ,2j ( 具体参见图1 1 ) 为: l 、数据选择选择有用且与分析任务相关的数据。 2 、数据预处理消除噪音或不一致数据。 3 、数据变换数据变换或统一成适合挖掘的形式:对于数值型的数据, 一般进行中心变换、标准化变换、对数变化、极差变化等。 4 、数据挖掘使用智能方法提取数据模式。 5 、模式评估根据某种兴趣度度量,识别提供知识的真正有趣的模式。 6 、知识表示使用可视化和知识表示技术,向用户提供挖掘的知识。 数据挖掘是一个多学科交叉的研究领域,利用统计学( s t a t i s t i c s ) 、机器学 习( m a c h i n el e a r n i n g ) 、数据库( d a t a b a s e ) 技术、软计算方法技术等各个学科领域 的先进技术对大量数据进行分析处理,从中提取出隐含的、事先未知的和有价 值的知识,为人们的决策分析提供更高层次的技术支持。一个比较公认的定义: 从大量的、不完全的、有噪声的、模糊的、随机的大量数据中,提取隐含的、 事前未知的而潜在有用的信息和知识的过程,又称为数据库的知识发现过程。 发现的知识表示为规贝1 j ( r u l e s ) 、规律( r e g u l a r i t i e s ) 、概念( c o n c e p t s ) 、和模式 ( p a t t e r n s ) 等形式。 数据挖掘的方法主要有:机器学习方法、统计方法、聚类分析方法、粗糙 集、决策树、神经网络、遗传算法等。其中神经网络和遗传算法是智能优化算 法,它们的算法原理是建立在仿生学的基础上,这些智能优化算法很通用,但 是一般只能得到次优解,经常用来解决一些高复杂的非线性问题【2 j 。 图卜l 数据挖捌流程图 1 2 时间序列数据挖掘 时间序列数据是一种常见而重要的数据形式,目前时间序列数据挖掘技术 研究已成为数据挖掘研究的一个重要分支和研究热点,其理论成果已广泛应用 于生物、医学、天文、金融、气象、商业等诸多领域。必须指出,不同数据库 系统需要采用不同的数据挖掘技术。时间序列数据库是指由包含一些随时间变 化的序列值构成属性的数据库。时间序列的模型分析法和数据挖掘方法有很多 共性和联系。主要体现在:( 1 ) 共同的研究对象时间序列数据;( 2 ) 共同的思 想基础都认为时间序列蕴含( 体现) 着数据库系统的历史行为和特征;( 3 ) 共同的目的从数据库中找出统计规律性和特征,进而对客观事物进行描述 或预测;( 4 ) 一些共同的方法统计理论和方法。时间序列数据挖掘技术是一 个刚刚兴起不久的数据挖掘研究的热点领域。 时间序列数据挖掘方面的相关研究非常广泛,将数据挖掘的各种方法应用 到时间序列数据挖掘中,主要包括时问序列匹配【3 j 、相似性查找【4 1 、时间序列 分割1 5 1 、降维【6 1 、分类【7 1 、聚类分析 8 , 1 0 , 1 2 】、关联与序列分析【9 1 、异常检测以 及预测i i 等。 2 1 3 本文的主要工作 时间序列分析的模型方法与数据挖掘之间联系紧密,研究时间序列模型对 数据挖掘的研究具有非常重要的现实意义。 第二章介绍了a r m a 模型、g a r c h 模型以及a r m a g a r c h 模型【l 引,给出 了a r m a 的参数估计、自相关函数和偏自相关函数等性质,给出a r m a g a r c h 模型的建模一般步骤,并结合m a t l a b 软件给出a r m a 。g a r c h 模型的数值计 算方法,【14 1 。 近年来,随着大型医院信息管理系统的发展,有关病人和疾病数据日益增 多,对临床和检查数据进行数据挖掘逐渐成为热点。如应用数据挖掘技术在心 电图中寻找并定位心肌梗塞的主要特征,应用数据挖掘技术对重症监护( i c u ) 病房的微生物学进行数据分析,研究感染和抗药性模式的变化规律等。鉴于此, 本文利用时间序列数据挖掘技术对心电序列( e c g ) 进行了初步研究。 第三章,主要利用时序图、自相关函数图、直方图和q q 图 is l 研究了心电 序y i j ( e c g ) 的统计特征,得到e c g 信号序列具有非正态性、波动聚集性和a r c h 效应等特征,因此本文建议使用a r m a g a r c h 模型对e c g 信号进行拟合,从 而提取e c g 信号的序列特征。 第四章,介绍了时间序列聚类的距离测度、提出了基于a r m a g a r c h 模 型的时间序列聚类法,并利用基于a r m a g a r c h 模型的的特征提取结合离差 平方和法对e c g 信号进行了聚类研究。 第五章,首先对数据挖掘的常用方法贝叶斯分类方法进行了深入研究,其 次对基于a r m a g a r c h 模型的e c g 信号序列的特征提取后的指标进行了变量 筛选,再对筛选后的变量指标进行了贝叶斯分类,结果表明,贝叶斯分类法效 果较优,进而说明a r m a g a r c h 模型能较好地刻画e c g 信号的特征。 第二章基于模型的时序数据挖掘方法 1 9 7 0 年b o x 和j e n k i n s 的时间序列分析:预测与控制中提出了a r i m a 模 型【l3 1 及其建模方法,标志着时间序列分析研究进入了参数模型时代。 e n g l e ( 1 9 8 2 ) 开创性地提出了自回归条件异方差模型4 1 ,记为a r c h 模型,标志 着时间序列分析研究进入了现代时间序列分析时代;b o l l e r s l e v ( 19 8 6 ) 对a r c h 模型进行了推广建立了广义自回归条件异方差模型【l5 。,记为g a r c h 模型; n e l s o n ( 19 9 1 ) 考虑到金融信息的非对称性提出了指数广义自回归条件异方差模 型i l 引,记为e g a r c h 模型;z a k o i a n ( 19 9 4 ) 拓展了g a r c h 模型得到了门限 g a r c h 模型i l ,记为t a r c h 模型;w a n g 和f a w s o n ( 2 0 0 1 ) 提出了可变参数 g a r c h 模型【l 引并将其应用于汇率研究中;潘贵豪等( 2 0 lo ) 利用a r m a g a r c h 模型【1 9 j 对黄金价格进行了实证分析;王维强等( 2 0 l0 ) 提出了a r m a t s g a r c h 有限混合模型1 2 引并对洛杉矶交通流量进行了预测研究。 本章的其余内容安排如下:第二节,a r m a 模型,主要介绍a r m a 模型、 a r m a 模型的格林函数和逆函数、a r m a 模型的最大似然估计、a r m a 模型 的自相关函数( a c f ) 和偏自相关函数( p a c f ) 、a r i m a 模型;第三节,条件异方 差模型,主要介绍了a r c h 模型、g a r c h 模型及其a r m a g a r c h 模型,并 建议了a r m a g a r c h 模型的建模步骤。 2 1a r m a 模型 2 1 1a r m a 模型简介 对于平稳时间序列的建模,研究人员提出了“参数化”模型【1 3 】,该模型是 根据时间序列的观测值 置,f = o ,l , 构造一个带有参数的数学模型,使这种 “参数化 模型既能反映产生时间序列x 的动态系统的规律性,为时间序列分 析的预报、控制和特征提取提供了依据。实际中常用的平稳时间序列模型包括: 自回归模型( a r 模型) 、移动平均模型( m a 模型) 和自回归移动平均模型( a r m a 模型) 。a r 模型和m a 模型可视为a r m a 模型的特例。 定义2 1 零均值时间序列 五,t = o ,1 , 可表示为如下数学形式 工一仍置一l 一一9 p 。一一p = s ,一q s ,一l 一一吱s 卜q , ( 2 1 ) 其中9 ,( 1 ,p ) 和0 j ( 1 j q ) 为实数,为白噪声过程,即s ,w n ( o ,仃2 ) 。( 2 1 ) 式 称为p 阶自回归g 阶移动平均模型,记为a r m a ( p ,q ) 模型。当q = 0 时,( 2 1 ) 式称为 p 阶自回归模型,记为a r ( p ) 模型,当p = 0 ,( 2 1 ) 式g 阶移动平均模型,记为m a ( q ) 模型。 引入后移算子b ,( 2 1 ) 式可表示为 4 9 ( b ) 置= o ( b ) e , ( 2 2 ) 其中9 ( b ) = 1 一妒l b 一b p ,臼( b ) = 1 一o i b 一o q b 9 ,并假定多项式妒( b ) 与臼( b ) 互 素。 定义2 2 如果模型的自回归部分的参数满足平稳性条件,即妒( b ) = 0 的根全部 在b 平面单位圆外,则可表示为s ( j f = o ,1 ,2 ,) 的线性组合,称为传递形式,即 五= 妒叫( b ) o ( b ) c , ( 2 3 ) 记h ( b ) = 缈。1 ( b ) p ( b ) ,并称h ( b ) 为传递函数。 定义2 3 如果模型的移动平均部分的参数满足可逆性条件,即o ( b ) = 0 的根全部 在b 平面单位圆外,则g ,可表示为墨一,( j f = o ,1 ,2 ,) 的线性组合,称为逆转形式,即 s ,= 0 叫( b ) 9 ( b ) 置 ( 2 4 ) 记- 1 ( b ) = 妒( b ) 9 - 1 ( b ) ,并称- 1 ( b ) 为逆函数。 2 1 2a r m a 模型的格林函数与逆函数 a r m a 模型是基于观测时间序列 z ) 的随机差分方程,该模型揭示了动态 数据的统计特性。a r m a 模型的格林函数和逆函数描述了时序系统特性,而自 协方差函数和偏相关函数描述了时间序列的统计特性。 研究a r m a 模型特性的目的,一方面,该模型是实际应用的理论基础;另 一方面,该模型又进行时间序列分析的必要准备。 l 、格林函数 从系统分析的角度,a r m a ( p ,q ) 模型可视为产生时间序列 z ) 的某个随机差分 方程。 定义2 4 若传递函数日( b ) 可以表示为 日( b ) = 妒_ ( b ) p ( b ) = g j b ( g 0 = 1 ) , ( 2 5 ) j = 0 则系数序列g ,( = 0 ,l ,2 ,) 称为a r m a ( p ,g ) 模型的格林函数。于是( 2 2 ) 式的平稳 解可以表示为 置= q 口f = q q 一( g 0 = 1 ) j = 0j = 0 由此可见,系统输出过程 置) 可表示为序列 q 与输入过程矗 的“卷积和”。 因此,格林函数 g ,) 相当于动态系统的单位脉冲响应函数, g ,) 刻画了系统的动态特 性。 如果己知妒,( 1 p ) 和p ( 1 j g ) ,可计算出g ,( = o ,1 ,2 ,) 。由定义可得 9 。1 ( b ) 臼( b ) = g ;b , 于是 1 一1 9 l b 一0 2 8 2 一o b 9 = ( 1 - t p l b - t p :b 2 ( p p b p ) ( g o + g i b + g 2 8 2 + ) 由比较系数法,得到格林函数 g , 的计算公式如下 g l = 仍g o q , g 2 = 幌g 1 + 仍g o q , g 3 = t p l g 2 + 仍g l + 仍g o 一岛, ; 当_ m a x ( p ,q + 1 ) 时,有 q 一妒。q 一。一t p 2 q z 一q 一卢= 0 特别地,对于i r ( p ) 模型,显然格林函数 g ,) 满足方程 g 一仍q 一。一仍q 一:一一g p = 0 ( , p ) 对于m a ( q ) 模型,格林函数 g , 为 g 1 = - 0 1 ,g 2 = 一0 2 ,q = 一巳,q = 0 ( g ) 容易看出,m a ( q ) 模型的格林函数 g ) 具有“截尾”性质,而a r ( p ) 模型和 a r m a ( p ,g ) 模型的格林函数 g ,) 均具有“拖尾”性质。 2 、逆函数 如果( 2 2 ) 式满足可逆条件,即日( b ) = 0 的根全部在b 平面单位圆外或臼一( b ) 存在, 则( 2 2 ) 式是可逆的。 定义2 5 若逆函数日一( b ) 可以表示为 一1 ( b ) = p 一1 ( b ) 妒( b ) = ( - 6 ) b 7 ( i o = 1 ) , j = o 则系统序列6 ( j = o ,l ,2 ,) 称为a r m a ( p ,g ) 模型的逆函数,其计算公式为 厶= 一1 ,厶= 0 , i o + 吼, 厶= q + a 2 厶+ 9 2 , 1 3 = e 1 2 + e 2 i i 七9 3 i o 七( p 3 , i 当, g 时,a r m a ( p ,留) 模型( g p ) ,逆函数满足如下 l q l 一,一o d , 一z 一o j , 一叮2 0 特别地,m h ( q ) 模型的逆函数,满足 p ( b ) l = 0 ( = o ,l ,2 ,) 而i r ( p ) 模型的逆函数,为 = 竹,l = ( p 2 ,i p = t p p ,= 0 ( p ) 容易看出,h r ( p ) 模型的逆函数 , 具有“截尾”性质,而m a ( q ) 模型和 a r m a ( p ,g ) 模型的逆函数 , 均具有“拖尾”性质。 6 2 1 3a r m a 模型的最大似然估计 对于零均值平稳a r m a ( p ,q ) 模型 五一q o l x , 一l 一一置一,= s ,一1 9 l ,- l 一一巳卜g , ( 2 5 ) 其中 ,) 是独立同分布服从( o ,仃2 ) 的白噪声过程,则= ( q ,:,s 。) 7 的联合密度函 数由下式给出 p 引咖2 ,= ( 2 舾2 ) 2 e x p ( 告豁) , 其中妒= ( 吼,妒p ) 7 ,9 = ( b ,o q ) r 。 将( 2 5 ) 式改写为 q = 置一仍置一l 一一叩+ 0 1 c t l + + o q s , 叫 ( 2 6 ) 我们可以写出参数( 妒,0 ,仃2 ) 的似然函数。 令x = ( 墨,以) 7 ,并假设z = ( 五一p ,oo ,x ,k ) 7 和& = ( s 。- g ,s 小岛) 7 已知, 则条件对数似然函数为 h l 撕以仃2 卜三n1 n ( 2 舾2 ) 一等, ( 2 7 ) 其中 ( 9 ,9 ) = s ? ( 妒,0x ,& ,x ) ( 2 8 ) 是条件平方和函数。对( 2 7 ) 式进行极大化得到的量( ;,舀) 称为条件最大似然估计。对 于( 2 5 ) 式中的模型,可假设s p = s p 一。= = s p 小。= 0 ,并利用( 2 6 ) 式在f ( p + 1 ) 的情况 下计算8 ,。于是( 2 8 ) 式中的条件平方和函数即为 & ( 妒,臼) = s ? ( 9 , 0 x ) ( 2 9 ) 在得到参数估计( ;,谷) 后,仃2 的估计值县2 可经下式计算 县:幽 d 1 其中,自由度d f 的数值等于和式& ( ;,蚕) 中的项数减去被估计参数的个数。若用( 2 9 ) 式计算平方和,那么d 厂= ( n - p ) 一( p + g + 1 ) = 力一( 2 p + q + 1 ) 。 2 1 4a r m a 模型的自相关函数和偏自相关函数 为了获得自协方差函数,将( 2 1 ) 式改写 置= 妒l z l + + 9 p 置一p + q 1 9 l q l 一一o q e 卜口, 两边同时乘以五一。得到 x t k x t = 9 、x t k x | + + pp x t k x 【_ p + x t r k t 一8 i x l t 一一9 q x t 一芦t q , 两边取期望,可得a r m a ( p ,q ) 模型的k 阶自协方差函数为 7 t = 9 l y 女一l + + 妒p y i p + e ( 五一t s f ) 一q e ( z t s r - 1 ) 一一o q e ( x , 一t 卜q ) 注意到e ( z i t 一,) = 0 ,七 ,所以 y t = 仍y 一l + + 9 p y i p ,七( g + 1 ) 因此a r m a ( p ,q ) 模型的k 阶自相关函数( a c f ) 为 p 女= 6 p i p 一l + + 9 p p k p ,后( q + 1 ) 容易看出a r m a ( p ,g ) 模型的自相关函数在滞后g 期之后拖尾,仅依赖于模型中的自 回归参数。 a r m a ( p ,q ) 模型的偏自相关函数( p a c f ) 呈指数衰减或阻尼正弦波动的混合,具 体依赖于q a ( b ) = 0 和o ( b ) = 0 的根的特性。a r ( p ) 模型具有自相关函数拖尾和偏自相 关函数截尾的特征,而m a ( g ) 模型具有自相关函数截尾和偏自相关函数拖尾的特征。 2 1 5a r m a 模型的预测 假定在t = 刀时刻有观测值咒,咒_ p 以珈,将估计参数和最佳模型阶数代入( 2 1 ) 式,则向前,步的未来值五+ ,的最小均方误差预测对。( ,) 为 舛n ( ,) = q s 。+ q + l 川+ g ,+ 2 s 柚+ 利用 置+ - g :f l t + , 以及 酢州“- = 蹦 于是,有 e ( 以+ ,i 瓦,以- l ,) = g , e 。+ g + l s 川+ g f + 2 s n 2 + , 所以由以+ ,的条件期望可以得到其最小均方误差预测为 ( ,) = ( 以+ ,i 以,以小) 劈。( ,) 通常被称为以+ ,在预报初始时刻刀的向前,步预报。预测误差的方差为 i - 1 v a r ( e ( 1 ) ) = o r 2 q j = o 2 1 6a r i m a 模型 若差分序列 ( 1 一b ) d 互 服从a 妯i a ( p ,g ) 模型,于是有 妒( 召) ( 1 一b ) d 置= 0 0 + 9 ( b ) s ,( 2 1 0 ) 其中,自回归多项式妒( 曰) = ( 1 6 p l b _ 妒p b p ) 和移动平均多项式8 ( b ) = o - o , b 一9 ,伊) 没有公共因式。参数皖对d = 0 和d 0 起不同的作用。当d = 0 时,该模型 是平稳的,o o 与该模型的均值有关,即o o = m ( 1 一仍一妒。) 。当d 1 时,o o 称为确 定性趋势项,在模型中吼常忽略不计。 将( 2 1 0 ) 式中得到的齐次非平稳模型称为( p ,d ,q ) 阶求和自回归移动平均模型,记 为a r i m a ( p ,d ,g ) 模型。当d = 0 时,称为a r m a ( p ,q ) 模型。当p = 0 时,称为求和 移动平均模型,记为i m a ( d ,g ) 模型。 2 2 条件异方差模型 2 2 1a r c h 模型 a r c h 模型描述了在前t - 1 期的信息集合甲h = 乃,一书只印印) 给定的条件 下随机误差项s ,的分布。e n g l e ( 1 9 8 2 ) 提出的a r c h 模型表述如下 s ,l 甲f - l 口n ( 0 ,a ? ) ,( 2 1 1 ) 仃? - - - - 0 。+ a ,三, ( 2 1 2 ) i = l 其中a o 0 ,a 。0 ,江1 ,2 ,g ,以确保条件标准o t 0 。 在a r c h 回归模型中,s ,的条件方差是滞后误差项( 不考虑其符号) 的增函数,因 此,较大( 小) 的误差后面一般紧接着较大( 小) 的误差。回归阶数9 决定了冲击的影响存 留于后续误差项方差中的时间长度,g 值越大,波动持续的时间也就越长。 2 2 2g a r c h 模型 为了充分地描述资产收益率的波动率过程,b o l l e r s l e v ( 1 9 8 6 ) 提出了一个有 用的推广形式,称为广义自回归条件异方差模型( g a r c h 模型) 。对残差序列s ,服从 条件异方差模型 s ,= 仃,z t ,仃,2 = a 。+ z - ,s 三,+ 色a 三 ( 2 1 3 ) t = l j = l 其中 z ,) 是一个独立同分布的随机变量序列,均值为0 ,方差为l ,a 。 0 ,a 。0 , 色o ,i = l ,2 ,p ,= 1 ,2 ,g ,a ,+ 色 1 ,称s ,服从g a r c h ( 弘g ) 模型。 9 对a ,+ 色 3 一=-;-一) 【e ( q 2 ) 】21 一( a l + 卢1 ) 2 2 a 1 2 从而,与a r c h 模型类似,g a r c h ( 1 ,1 ) 模型的分布尾部比正态分布尾部 厚。 第三,此模型提供了一个可用于描述波动率演变的简单的参数函数。 若( 2 13 ) 式的g a r c h 模型表达式中的自回归多项式有个单位根,则可得 到一个i g a r c h 模型。因此,i g a r c h 模型就是具有单位根的g a r c h 模型。 类似于a r i m a 模型,i g a r c h 模型主要特点是过去波动的平方对s 。2 的影响是持久 的。 在实际应用中,最常用的i g a r c h ( 1 ,1 ) 模型可写成 s f = 仃,t ,o t 2 = o t o + a l 二l + ( 1 一a 1 ) 仃左1 2 3a r m a g a r c h 模型 将a r m a 模型作为条件均值模型和g a r c h 模型作为条件方差模型,即得到 a r m a g a r c h 模型,具体定义如下。 定义2 6 对于时间序列 墨 ,若其均值方程为 x t = p t x t _ - i - - - + 9 p x t p + 一e 芦 一一e q f q , 而其残差序列矗) 服从g a r c h 模型,即其条件方差模型为 po q = 仃,乙,仃,2 = a o + a ,s 三,+ 色仃三j , ,= l j = l 则称序列 x 服从a r m a ( p ,g ) 一g a r c h ( p ,q ) 模型,简记为a r m a - g a r c h 模型。 2 3 1a r m a g a r c h 模型的参数估计 一旦a r m a g a r c h 模型的具体形式确定好了,可采用最大似然估计对模 型进行参数估计,通常将模型表述为回归模型: 1 0 1 一o , b 一一o 置2i毒希(2141 bb ) 一妒l 一一9 口p 。 其中, s ,= o tz t , ( 2 1 5 ) 砰= a o + a l 仃三l + + a j p 仃三尸+ 卢l 吐l + + 几年d , ( 2 1 6 ) 其中,互独立同分布于标准正态分布n ( 0 ,1 ) ,且与以前各期q 的随机变量相互独 立。 令x = ( x i ,鼍) ,x o 为事先预定用来计算( 2 1 4 ) 式中s ,= 1 ,, 的初始值。 类似于a r m a 模型的参数估计可采用最大化下面的条件最大似然函数获得参数的最 大似然估计 撕a 邮m 础圳= n t = l ( 2 舾玎;唧( _ 豺 亿 这里仃? 由( 2 1 6 ) 式给出,s ,由( 2 1 4 ) 式给出,其中妒= ( ,) 7 1 ,0 = ( q ,o q ) r , a = ( 倪。,a p ) 7 ,卢= ( 卢l ,一,岛) r a r m a g a r c h 模型的参数估计可采用m a t l a b 软件,在m a t l a b 软件 中,g a r c h s e t 程序可以规定模型的形式,g a r c h f i t 程序可以获得模型的估计值、 误差对数似然值等信息,具体参见文献 2 1 】。 2 3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论