(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf_第1页
(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf_第2页
(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf_第3页
(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf_第4页
(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(统计学专业论文)基于小波分析和神经网络的金融时间序列预测研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 小波分析以其良好的时频局域化特性,受到众多科学家和工程人员的青睐, 在图像处理、模式识别、地质勘探、医学成像诊断、数值计算等各个方面都有不 俗地表现。近年来,小波分析开始被引入经济与金融领域,作为处理经济金融时 间序列数据的工具。 金融时间序列是经济与金融领域中最重要的数据,包括债券、汇率、股票价 格和金融期货价格等等,对这类数据进行分析、预测是整个经济和金融活动的重 要工作。 本文以金融时间序列为研究对象,采用小波分析和神经网络相结合的组合模 型对其进行分析和预测,并使用上证综合指数进行建模和预测,取得了良好的建 模效果。 本文首先从金融时间序列分析的理论发展过程对论文的选题依据进行了说 明,对时间序列研究的发展历史做出了回顾,总结出研究时间序列的两大类方法: 计量模型法和数据挖掘法,并讨论了两种方法各自的优势和劣势。然后简要介绍 了数据挖掘的原理,紧接着着重介绍了神经网络的理论基础以及在使用神经网络 进行建模过程中要注意的问题。 接下来对小波理论进行了介绍,讨论了连续小波、离散小波的特点和各自的 使用场合。并给出了常见小波函数的性质和特征,以及离散小波分析中的常用算 法:m a l l a t 算法和多孔算法。 最后使用上证综合指数进行建模:首先利用小波变换对是上证综合指数进行 分解,得到尺度变换序列和各级小波变换序列,然后对尺度变换序列使用a r m a 模型进行拟合,对小波变换序列使用神经网络进行拟合,最后用小波重建技术将 各个模型的结果加总。我们使用这个模型对上证综合指数进行了预测,并和普通 b p 神经网络模型的预测结果进行比较,取得了良好的预测效果。 关键词 小波分析; 神经网络;金融时间序列 a b s t r a c t w a v e l e ta n a l y s i sh a sb e e ng r e a t l yv a l u e db yn u m e r o u ss c i e n t i s t sa n de n g i n e e r s f o ri t s t i m e f r e q u e n c y l o c a l i z e df e a t u r e sa n db e e nw i d e l ya p p l i e di ni m a g e p r o c e s s i n g ,i d e n t i f i c a t i o no fp a r e m ,g e o l o g i c a le x p l o r a t i o n ,m e d i c a li m a g i n g d i a g n o s i sa n dn u m e r i c a lc a l c u l a t i o n i th a sb e g u nt ob eu s e di nt h ef i e l do fe c o n o m y a n df i n a n c et od e a lw i t ht h ed a t ao ft i m es e r i e s f i n a n c i a lt i m es e r i e si sap r i m a r yd a t at y p ei nt h ea p p l i c a t i o no ff i n a n c i a la r e a a n a l y z i n gp r e d i c t i n ga n dc o n t r o l l i n go fs u c hl 【i n do fd a t ai st h eb a s i cw o r ko ft h e e c o n o m i ca n df i n a n c i a la c t i v i t y f i n a n c i a lt i m es e r i e si sc o m p o s e do fb o n dp r o f i t , f o r e i g ne x c h a n g er a t e ,s t o c kp r i c e ,f u t u r e sp r i c e l e s s i nt h i sp a p e r , f i n a n c i a lt i m es e r i e si sc h o s e nt ob es t u d i e db yu s i n gt h em o d e lt h a t c o m b i n e sw a v e l e tt h e o r ya n dn e u r a ln e t w o r k t h e nw eu s et h es h a n g h a ic o m p o s i t e i n d e xt ot r a i nt h em o d e la n df o r e c a s tt h er e t u r no fi n d e x f i r s t l yt h ep r i m a r yd e v e l o p i n gp r o c e d u r eo ff i n a n c i a lt i m es e r i e sa n a l y s i sm e t h o d i si n t r o d u c e d ,a n de x p l a i n sw h yt h i sr e s e a r c ht o p i ci sc h o s e n w ed i v i d et h er e s e a r c h m e t h o do ft i m es e r i e si n t ot w oc a t e g o r i e s :e c o n o m e t r i c sm o d e l i n g ,d a t am i n i n g t h e nt h ea d v a n t a g ea n dd i s a d v a n t a g eo f e a c hm e t h o da r ed i s c u s s e d a f t e rc o m p a r i n g w ef o c u so nt h ed a t am i n i n gm e t h o da n dg i v ead e t a i l e di l l u s t r a t i o no fn e u r a l n e t w o r k t h e nt h ew a v e l e ta n a l y s i st h e o r yi sd i s c u s s e d t h ed e f i n i t i o n so fc o n t i n u o u s w a v e l e t t r a n s f o r m ( c w t ) ,d i s c r e t e w a v e l e tt r a n s f o r m ( d w d , a n d m u l t i r e s o l u t i o na n a l y s i s ( m r a ) a r eo f f e r e d a f t e rt h i st h ec h a r a c t e r so fd i f f e r e n t w a v e l e tf u n c t i o n sa r ed i s c u s s e d a tl a s tt w ok i n d so fa l g o r i t h m sf o rw a v e l e tt r a n s f o r m ( m a l l a t ,a t r o u s ) a r ec o m p a r e d a tl a s tw eu s et h es h a n g h a ic o m p o s i t ei n d e xt ot r a i na n dt e s tt h em o d e l t h ei n d e xi sd e c o m p o s e di n t os e v e r a ll e v e l su s i n gw a v e l e tt r a n s f o r mt h e nt h e d e c o m p o s e ds e r i e sa r et r a i n e da n df o r e c a s t e di n d e p e n d e n t l y a tl a s tw eu s e w a v e l e tr e c o n s t r u c t i o nt ob u i l dt h ef o r e c a s to ft h eo r i g i n a lr e t u r ns e r i e s b y c o m p a r i n gw i t ht h eo r d i n a r yb pn n w ef i n dt h em o d e li n t r o d u c e di nt h i sp a p e r a c h i e v e dg o o dr e s u l t s k e yw o r d s :w a v e l e ta n a l y s i s ;n e u r a ln e t w o r k ;f i n a n c i a lt i m es e r i e s 厦门大学学位论文原创性声明 本人呈交的学位论文是本人在导师指导下,独立完成的研究成 果。本人在论文写作中参考其他个人或集体已经发表的研究成果,均 在文中以适当方式明确标明,并符合法律规范和厦门大学研究生学 术活动规范( 试行) 。 另外,该学位论文为() 课题( 组) 的研究成果,获得() 课题( 组) 经费或实验室的 资助,在() 实验室完成。( 请在以上括号内填写课 题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特 别声明。) 喀 、7竹厂t 阴r 垆 之艺多 f 厂 , x 一3 名 : 釜 年 人 汐 明 声 厦门大学学位论文著作权使用声明 本人同意厦门大学根据中华人民共和国学位条例暂行实施办 法等规定保留和使用此学位论文,并向主管部门或其指定机构送交 学位论文( 包括纸质版和电子版) ,允许学位论文进入厦门大学图书 馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国 博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和 摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。 本学位论文属于: j () 1 经厦门大学保密委员会审查核定的保密学位论文, 于年月日解密,解密后适用上述授权。 () 2 不保密,适用上述授权。 ( 请在以上相应括号内打“”或填上相应内容。保密学位论文 应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密 委员会审定的学位论文均为公开学位论文。此声明栏不填写的,默认 为公开学位论文,均适用上述授权。) 啵 d汐 久。日 _l ) 名 寻雠珀 人 年 明1 触 d 第一章绪论 1 1 选题背景与研究意义 第一章绪论 金融市场是国家经济运行的核心,探求金融市场的变化规律,从而进行有效 的金融管理以提高金融投资效率,这是各国政府与投资机构孜孜以求的目标。金 融时间序列是经济与金融领域中最重要的数据,对这类数据进行分析、预测和控 制是整个经济和金融活动的重要工作。金融时间序列包括债券、利率、汇率、股 票价格和金融期货价格等等,从宏观的角度出发,它也可以包括投资、收入和消 费等宏观经济数据。取自相同时间段的多种金融时间序列,构成多元( 维) 金融 时间序列。证券市场一直是金融市场的主体,扮演着重要的角色。特别是在我国 经济与世界经济相互融合程度越来越高,金融业面临着更大的发展机遇和挑战的 今天,以及在全球金融创新活动日新月异、各国金融市场联动效应不断增强的国 际背景下,对金融市场本质规律的认识和把握更直接关系到金融市场的稳定、高 效与安全。然而金融市场是一个受多种因素影响的、庞大的系统,具有非常复杂 的运动规律,要深刻理解其内在结构是一件非常艰难的事情,仅仅从定性的角度 进行分析很难达到深刻理解的目标。金融时间序列数据作为金融市场综合的外在 表现形式,“本质决定现象,现象反映本质 ,因此金融时间序列中必定蕴含了 金融系统的许多客观规律信息。从中寻找出各种信息,更好地认识、掌握、并利 用其规律无疑对金融投融资预测、决策与风险管理活动具有特别重要的意义。 传统的金融时间序列分析方法主要包括基本分析、技术分析以及各种模型法 等。基本分析主要通过对影响证券市场供求关系的基本因素进行分析,从而判断 股票价格的走势。技术分析则通过对历史数据进行一些简单的计算,得到相关的 技术指标和图表,从而判断序列未来的变化趋势。模型法是目前对时间序列进行 深层次分析和刻画的主要方法,一些经典的时间序列分析模型如a r m a 、a r c h 和 g a r c h 等已被广泛应用于自然和社会科学领域。如美国经济学家e n g l e 就因其 于1 9 8 2 年针对金融时间序列所提出的a r c h 模型而荣获2 0 0 3 年度诺贝尔经济 学奖。 基于小波分析和神经网络的金融时间序列预测研究 传统方法多以统计学基本理论为基础,通过一些构造好的模型来进行分析, 需要较高的模型构建技巧,并且以一些假设作为前提,如平稳性假设、正态分布假 设等。然而金融时间序列序列十分复杂,具有海量、高维、动态变化迅速、信噪 比低、非平稳、非正态、非线性、要求快速响应等特点。所以传统的分析方法并 不能很好地满足金融领域中时间序列分析的需求。另外,传统分析方法无法处理 大规模的数据集,且很难主动发现金融数据中隐藏的规律。 针对传统分析方法局限,很多学者将以往多用于静态数据的数据挖掘技术引 入时间序列的分析中。数据挖掘是指寻找隐藏在数据中的信息( 如趋势、特征及 相关性) 的过程,也就是从数据中发掘信息和知识k d d ( k n o w l e d g ed i s c o v e r yi n d a t a b a s e ) 。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经 网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数据挖掘有非常广泛 的应用,如:针对生物医学和d n a 数据分析的数据挖掘;零售业的数据挖掘;电 信业的数据挖掘等。 采用数据挖掘来对金融时间序列数据进行分析,以数据为驱动,可不基于任 何假设,并可以处理大规模的数据集,由计算机自动快速地发现一些隐藏的、有价 值的规律。由于金融领域的时间序列具有一定的特殊性,因此可将数据挖掘方法、 传统的时间序列分析模型、以及其他研究领域里的一些方法相结合形成混合挖掘 方法,以针对金融领域某个特定的分析任务,从而使模型更适合数据本身的性质, 使建模更具有针对性。 小波变换作为一种数学理论和方法在科学技术界引起了越来越多的关注和 重视。1 9 8 8 年,m a l l a t 提出多分辩分析的概念,使小波具有带通滤波的特性,因 此可利用小波分解和重构的方法滤波降噪;1 9 9 2 年m a l l a t 又提出奇异性检测的 理论,证明了信号和噪声在不同尺度上具有不同的统计特征,从而可利用其实现 信噪分离。后来,d o n o h o 等提出非线性小波变换阈值法去噪,并得到广泛的应 用。由于对金融时间序列去噪的好坏往往关系到后续进一步处理和分析的成败, 因而引入小波变换对其去噪处理是很有意义的。所以在数据挖掘中引入小波理论 既可以作为一种预处理数据的工具,也能通过小波独特的在不同尺度上分解序列 的能力,可以将时间序列分解为特性各异的不同组成部分,再根据各部分的特性 分别级使用不同的方法进行数据挖掘建模,从而能有效提高数据挖掘的效率。 2 第一章绪论 基于以上考虑,本文尝试将小波理论引入时间序列的建模中,利用小波理论 将上证综合指数对数收益率在不同尺度上进行分解,然后将小波变换序列和尺度 变化序列分别使用数据挖掘中的神经网络方法和传统模型法中的a r m a 模型进行 建模并预测。最后使用小波重建技术将各个序列的预测值进行重建得到原对数收 益率序列的预测值并评价预测优度。 1 2 文献综述 本文把时间序列分析的方法分为两大类:模型法和数据挖掘方法,通过引入 小波理论将二者结合起对金融时间序列进行预测,文献综述主要从以下三个方面 进行,首先介绍了传统计量模型的国内外研究现状,其次介绍了数据挖掘方法在 时间序列研究中的成果,最后综述了小波分析的发展并指出小波理论给以上两种 时间序列分析方法所带来的进步。 1 2 1 时间序列计量方法的国内外研究现状 1 9 2 7 年,英国统计学家g u y u l e 提出自回归( a u t o r e g r e s s i v e ,a r ) 模型。 不久之后,英国数学家、天文学家g t w a l k e r 在分析印度大气规律时使用了移 动平均( m o v i n ga v e r a g e ,m a ) 模型和自回归移动平均( a u t or e g r e s s i v em o v i n g a v e r a g e ,a r m a ) 模型。这些模型奠定了时间序列计量分析的基础。1 9 7 0 年,美 国统计学家b o x 和英国统计学家j e n k i n s 联合出版了t i m es e r i e sa n a l y s i s : f o r e c a s t i n ga n dc o n t r o l 一书。在书中,b o x 和j e n k i n s 在总结前人研究成 果的基础上,系统地阐述了对差分自回归移动平均( a u t o r e g r e s s i v ei n t e g r a t e d m o v i n ga v e r a g e ,a r i m a ) 模型的识别、估计、检验及预测的原理及方法。这些知 识现在被称为经典时间序列分析方法。 b o x - j e n k i n s 模型实际上是主要运用于单变量、同方差的线性模型。随着人 们对各个领域时间序列的深入研究,发现该经典模型在理论和应用上都还存在着 许多局限性。所以近2 0 年来,统计学家纷纷转向适用于多变量、异方差和非线 性的时间序列分析方法的研究,并取得了突破性的进展。在异方差方面,美国统 计学家、计量经济学家r o b e r te n g l e 在1 9 8 2 年提出了自回归条件异方差( a r c h ) 3 基于小波分析和神经网络的金融时间序列预测研究 模型,用来对英国通货膨胀率进行建模。为了进一步放宽a r c h 模型的约束条件, b o l l e r s l o v 在1 9 8 6 年提出了广义自回归条件异方差( g a r c h ) 模型。随后n e l s o n 等人又提出了指数广义自回归条件异方差模型( e g a r c h ) 模型、方差无穷广义自回 归条件异方差模型( i g a r c h ) 和依均值广义自回归条件异方差( g a r c h m ) 等限制条 件更为宽松的异方差模型。这些异方差模型是对经典的a r i m a 模型很好的补充。 与传统的同方差模型相比,这些模型更准确地刻画了金融市场风险的变化过程, 因此a r c h 模型及其衍生出的一系列拓展模型在计量经济学领域有着广泛的应 用。 在多变量模型方面,b o x 和3 e n k i n s 在t i m es e r i e sa n a l y s i s :f o r e c a s t i n g a n dc o n t r o l 一书中研究过平稳多变量序列的建模,b o x 和t i a o 在1 9 7 0 年左 右讨论过带干扰变量的时间序列分析。这些研究实际上是把对随机事件的横向研 究和纵向研究有机结合在一起,提高了对随机事件分析和预测的精度。1 9 8 7 年, 英国统计学家、计量经济学家c g r a n g e r 提出了协整( c o i n t e g r a t i o n ) 理论,进 一步为多变量时间序列建模松绑。有了协整的概念之后,在多变量时间序列建模 过程中,“变量是平稳的”不再是必须条件了,而只要求它们的某种线性组合平 稳。协整观念的提出极大地促进了多变量时间序列分析方法的发展。 1 2 2 数据挖掘方法在时间序列研究中应用的现状 数据挖掘作为近年来飞速发展的一种重要的人工智能技术,广泛应用到了各 个科学领域,其方法包括神经网络、支持向量机、模糊理论等。 在时间序列分析中应用的最多的是神经网络,神经网络具有强大的泛化能 力,以及自适应、自学习和纠错性能力。自从l a p e d e s 等发表了将神经网络用于 股票预测的文章以来,国外利用神经网络对股票价格进行预测的文献层出不穷。 国内一些学者也开始利用神经网络对中国股票价格或者汇率等金融时间序列进 行预测。杨忻和马洪波n 1 用神经网络预测马克美元汇率,研究结果证明神经网 络优于随机游走模型。冯旖妮如利用进化遗传神经网络,对上海股票指数的风险 测度模型进行预测,取得良好的效果。林香口1 建立了一个改进的进化遗传- - b p 神 经网络方法,在长期预测和模型的稳定性上,取得了比较好的效果。 支持向量机( s u p p o r tv e c t o rm a c h i n e s ,s ) 将一个在原始空间不线性可 4 第一章绪论 分的集合先映射到一个高维的特征空间,在高维的特征空间进行线性分离,接下 来将结果再反映射到原来的空间。陈为民,马超群h 1 阐述了支持向量机的原理及 其方法的发展,指出了其在金融方面的应用方向和前景。周万隆聆1 在分析神经网 络收敛速度慢、结构参数确定无理论依据、存在局部极小值等缺点的基础上,分 析了s v m 的关键优势一结构风险最小化,并将s v m 应用于股票价格的短期预测。 李立辉,田翔嵋1 介绍了支持向量回归的建模原理及常用损失函数,对金融时间序 列进行单步预测和多步预测的建模。 模糊模型本质上就是一种非线性模型,利于表达复杂系统的动态特性,具有 逼近任何非线性映射的能力。采用模糊模型进行预测,主要是依据专家经验以及 统计方法建立模糊模型进行预测。殷洪才h 1 等人利用模糊神经网络中的高木一关 野模型,对所预测的股票进行预测,结果比普通的神经网络效果更好。高振坤陋1 提出了一种基于可解释性模糊模型的股票指数收益率的预测方法,对深圳成分指 数股票收益率建立了模糊聚类模型,在预测过程中取得了良好效果。 1 2 3 小波理论以及应用 小波理论的思想源于信号分析中的伸缩与平移,其本质是一调和分析方法, 是f o u r i e r 分析发展史上的一个“里程碑”。小波分析理论及其方法的形成和应 用在科学技术界引起了一场轩然大波并成蔓延之势。小波分析的研究和应用热潮 始于2 0 世纪8 0 年代,1 9 8 3 年法国工程师m o r l e t 在分析地震波的局部特性时, 为解决g a b o r 变换在高频条件下不能很好地收集信息能量的问题,引入了小波概 念,将g a b o r 变换中的g a u s s i a n 函数进行伸缩和平移,这就是m o r l e t 小波阳1 。 小波理论从诞生的那天起就注定它是一门应用性很强的学科,其应用范围十分广 泛,尤其在时间序列预测方面具有很大的优势。吴学森、王洁贞、吴学森n 町使用 m e y e r 小波对序列作3 层分解,分离出时间序列中的趋势项、周期项和随机项, 建立季节性趋势时间序列预测模型,提高预测精度,并与b o x - j e n k i n s 模型 ( a r i m a ) 进行比较,验证了该方法是可行的。郭秀花,林济南等n 探讨了季节性 时间序列的预测模型,把季节性时间序列分为季节性水平和趋势两种时间序列, 对于季节性水平序列直接用小波分析进行预测,对于季节性趋势时间序列,先建 立非线性加权拟合模型,并把它用阈值小波包进行3 级分解和重构,从而建立外 5 基于小波分析和神经网络的金融时间序列预测研究 推预测模型。 小波变换具有时频局部特性和变焦特性,而神经网络具有自学习、自适应、 容错性、泛化能力及鲁棒性,把小波分析和神经网络相结合而形成的小波网络, 在处理非线性函数的逼近上有独到之处,越来越受到重视。目前,小波分析和神 经网络的结合主要有松散型结合和紧凑型结合两种n2 ,前者把小波分析作为神经 网络的前置处理手段,为神经网络提供输入特征向量;后者把小波分析和神经网 络直接融合,用小波函数或尺度函数直接作为神经元的激励函数。我们通常所说 的小波网络指的是后一种形式。丁晓牧等( 2 0 0 3 ) n 3 1 研究了小波神经网络建立的动 态测量误差预测模型,并通过误差修正,提高动态测量精度,避免了传统神经网 络需要人为干预以及网络结构参数的不足的问题,并对大轴圆度误差测量过程中 的动态测量数据进行实例分析,结果表明,该模型预测精度高,具有重要的应用 价值。樊智等( 2 0 0 5 ) n 盯利用小波神经网络逼近非线性协整函数模型,并给出训练 小波神经网络的变尺度算法,以更好地刻画多个时间序列之间的均衡关系。 1 3 研究内容和论文结构 本文分为五个章节,各章节安排如下: 第一章是绪论,介绍了本文的研究背景和实际意义,综述了目前国内外关于 金融时间序列和小波分析的研究成果。 第二章介绍了传统计量模型法和数据挖掘方法,讨论了两种方法的区别和联 系。 第三章简要介绍了数据挖掘的基本概念,并紧接着详细介绍了本文建模需要 使用的神经网络。 第四章给出了小波分析的原理。从小波基本概念、连续小波变换、离散小波 变换、多分辩分析理论、小波分析算法等方面对小波理论作了简要论述。 第五章对上证综合指数进行建模并预测,模型结合了小波分析,神经网络和 a r m a 模型,并将以上模型预测结果和单纯利用b p 神经网络进行建模的预测结果 进行比较,证实了本文介绍方法的优越性。 第六章是本文的总结,指出了论文的创新之处,并讨论了论文的不足部分以 及今后进一步发展的方向。 6 第二章金融时间序列研究概述 第二章金融时间序列研究概述 2 1 时间序列基础 2 1 1 时间序列的概念 从纵向看,时间序列是指自然科学或社会科学中的某一变量或指标的数值或 观测值,是按照其出现时间的先后次序,以相同或不同的间隔时间排列的一组数 值。它是某一现象或若干现象在不同时刻上的状态所形成的数据,反应的是现象 的发展变化规律。从横向看,时间序列也可以是若干相关现象在某一时间点上所 处的状态按一定顺序排序的一组数据,反映的是一定时间、地点条件下各相关现 象之间存在的内在数值联系。因此,从系统的意义上看,时间序列就是某一系统 在不同时间( 地点、条件等) 的响应n 副。 根据所研究的依据不同,时间序列有不同的分类: 1 按研究的对象的多少分,有单变量时间序列和多变量时间序列。如果时间 序列建模研究的对象是一个变量,如某个国家的国内生产总值,即为单变量时间 序列。如果所研究的对象是多个变量,如按年、月顺序排列的气温、气压、雨量 数据,则为多变量时间序列。多变量时间序列不仅描述了各个变量的变化规律, 而且还揭示了各变量间相互依存关系的动态规律性。 2 按时间的连续性可将时间序列分为离散时间序列和连续时间序列。如果某 一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时 间序列。如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列 就是一个连续时间序列。 3 按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。如果一个 时间序列的概率分布与时间t 无关,则称该序列为严格的( 狭义的) 平稳时间序 列。如果序列的一、二阶矩存在,而且对任意时刻t 满足: ( 1 ) 均值为常数; ( 2 ) 协方差为时间间隔r 的函数: 7 基于小波分析和神经网络的金融时间序列预测研究 则称该序列为宽平稳时间序列,也叫广义平稳时间序列。反之,不具有平稳 性即序列均值或协方差与时间有关的序列称为非平稳序列。 4 按序列的分布规律来分,有高斯型( g a u s s i a n ) 时间序列和非高斯型 ( n o n g a u s s i a n ) 时间序列。服从高斯分布( 正态分布) 的时间序列叫做高斯型时间 序列,否则叫做非高斯型时间序列。对于一些非高斯序列,往往可以通过适当的 变换,可近似地看成是高斯型时间序列。 2 1 2 金融时间序列的特征 金融时间序列特指各种不同金融产品的时间序列,比如汇率、基金、股票价 格等。金融时间序列是一种特殊的时间序列,它与金融市场和人类的各种经济活 动紧密相关,与其它的时间序列相比,金融时间序列具有以下特征: 1 信噪比低、信噪难以有效分离 金融时间序列的波动性一般比较强,即使市场没有任何新的信息到来,往往 也表现出随机波动特性,因而对这种波动可以将其看作“噪声 信号。“噪声” 的存在一方面会淡化原非线性动力系统的各种周期特性,即降低确定性的显著 性,另一方面又可能提供一些“虚假周期”,从而严重影响预测的效果。因此在 对金融时间序列进行分析和预测之前,有必要先对其进行去噪处理。然而金融时 间序列本质上具有非平稳、非线性、信噪比低的特点,采用传统的去噪方法存在 很多不足。小波变换是近年来崛起的联合时频分析中应用最为成功的一种方法, 可以有效减低和抑止外部噪声,特别是测量噪声;但对于内部噪声则存在诸多问 题。因此金融时间序列中的噪声检测和去除问题仍然有待解决。 2 具有显著的非平稳特性 金融市场是一个由自然、社会、心理、政治、经济等很多因素作用的复杂系 统。因而作为其外在表现的金融时间序列具有非平稳、非线性、信噪比低等一些 不同于许多其它一般时间序列的特性,其中非平稳性是最为显著的特征之一。随 机过程的平稳性是指其统计特性不随时间而变化,一般是指一种广义平稳性,即 过程的一阶矩( 期望值) 和二阶矩( 协方差) 与时间起点无关。平稳性条件是许多时 间序列模型建模的基础条件。但由于影响金融市场的政治、经济、文化环境等随 时间的变迁,金融时间序列的一阶矩,二阶矩不可能维持不变,因而通常表现为 8 第二章金融时间序列研究概述 明显的非平稳性。如上证指数从2 0 0 5 年6 月3 日的1 0 1 3 6 4 点上升至2 0 0 7 年 1 0 月1 6 日的6 0 9 2 0 6 ,在仅仅两年内升幅为6 倍,而在从2 0 0 7 年1 0 月1 6 日至 2 0 0 8 年1 0 月2 7 日这短短的一年时间内,上证指数又飞流直下,跌至1 7 2 3 3 5 点,跌幅达7 2 。因而具有非常明显的不平稳性。 3 丰富的潜在周期特性 金融时间序列是人类在金融市场活动的结果,与人类活动的各种周期紧密相 关。因此在金融时间序列中隐含着多种多样的可见或者不可见的金融周期,如“周 末效应 或者“日历效应”等。这些周期特性在很大程度上会影响金融时间序列 的分析和预测。 4 样本数据少且维数高 金融时间序列的长度受到人类收集数据手段的限制,通常数据量较少,如对 我国的证券市场而言,平均每年可以产生以日为单位的抽样点2 2 5 个,1 0 年累 计产生的抽样点也只有2 2 5 0 个。但是由于金融市场这个复杂的系统在多个方面 影响着人类的生活,不同的研究学者可以根据自己的需要选择不同的观察点来收 集自己感兴趣的时间序列,如证券指数就有开盘、最高、最低、收盘、成交量、 成交额、5 日移动平均、1 0 日移动平均、2 0 日移动平均、3 0 日移动平均、指数 化移动平均等等,金融时间序列具有明显的高维特征。 2 2 时间序列分析概述 时间序列预测技术按建模数据情况,预测方法可分为全局预测、局部预测和 自适应预测;按照选择的预测量形式划分,有向量预测模式和模型预测模式;按 照预测因子的多少划分,可分为单变量预测模式和多变量预测模式;按照预测步 数的多少,可分为单步预测和多步预测等等。总的来说,时间序列的分析理论可 分为以下两个大的类别。 2 2 1 时间序列的经典模型分析法 传统的时间序列分析模型可以分为确定性时序模型和随机时序模型,并借助 外推原则来推测未来。 9 基于小波分析和神经网络的金融时间序列预测研究 2 2 1 1 确定性模型 时间序列的变化形式受趋势因素、季节变化因素、循环变化因素与不规则因 素等四种因素叠加或耦合而成。并认为不规则变动项可以消除,因而时间序列分 析的目的就是设法消除不规则项,拟合确定型的趋势。常见的模型有: ( 1 ) 加法模型: = z + 墨+ g + 墨; ( 2 ) 乘法模型:y t = z s q r ; ( 3 ) 混合模型,如:乃= 互s + 足,乃= z + s r g 等。 并应用移动平均、指数平滑、分解方法、季节系数法来测定各个部分: 1 移动平均法,这是预测技术中的一种古老方法。它对一组给定的历史数 据,计算其平均值,并将这一平均值作为下一时期的预测值。移动平均分为移动 算术平均与移动几何平均,以及移动加权平均。这种方法非常简单但其预测精度 是比较低的。 2 分解方法。这也是一种历史悠久的方法,它的基本思想是将预测数据分解 为季节因子、趋势因子、循环因子和误差或随机因子。这种方法单独使用效果并 不好,但是它作为识别数据特性的一种方法,仍然有其深刻的影响力。目前的一 些调整方法可视为是在其思想上的延伸。 3 指数平滑方法。这种方法是一种较为实用的方法。最具代表性的是 h o l t - w i n t e r s 的线性趋势平滑模型。它分为一次指数平滑、二次指数平滑与多 次指数平滑。平滑方法是一种低费用、简单和不精致的方法,但其预测精度却可 以与许多精致的、更具统计基础的方法相比拟。 4 季节系数法。周期性演变的活动是常见的事情,随着季节变化而发生的 周期性的需求变化就是代表。例如水果、蔬菜、四季服装、啤酒、冷饮的销售量、 火车乘客、旅游观光的人数等。反映在时间序列资料上,统计数据呈现明显的有 规律的季节变动。季节系数法就是根据这一规律进行预测的方法。在实际预测时, 要用季节系数修正没有考虑季节影响的预测值。 1 0 第二章金融时间序列研究概述 2 2 1 2 随机性模型 人们通过用随机理论考察时间序列发现,由许多偶然因素共同作用引起的不 规则变动其实并非完全杂乱无章,而是具有一定的规律性。于是根据随机理论来 建模引起广大学者的重视。随着1 9 7 0 年b o x 和j e n k i n s 的t i m es e r i e sa n a l y s i s : f o r e c a s t i n ga n dc o n t r o l 的问世,随机时间序列模型成为研究和应用的热点。 如a r m a 、a r i m a 、a r c h 、g a r c h 、s v 等都是一些得到广泛应用的随机时间序列模 型,这些模型一般基于这样的思路:人们首先通过实践观察,发现时间序列的一 些客观现象,获得感性认识,然后根据有关经济理论,提出一些合理的假设条件, 在有关数学理论( 主要是概率统计) 基础上,通过演绎推理,得到符合时间序列 发展变化的理论模型,再根据实际数据,通过检验,判断实际数据是否满足模型 成立的条件,若模型成立,则根据参数估计得到实际模型。最后用该模型描述事 物的变化规律,并对事物进行预测和控制。其过程如图2 1 所示: 2 2 2 时间序列数据挖掘 图2 - 1 :模型法逻辑思路 时间序列挖掘是兴起不久的数据挖掘研究的一个热点领域。目前的研究主要 集中在时间序列中相似序列查找、频繁模式发现、关联模式发现、多粒度结构模 式发现、周期模式发现以及异常数据挖掘等方面。李斌n 6 1 给出了时间序列挖掘的 一些典型方法,即通过对序列先进行分割、抽取各个子序列的特征,根据这些特 1 1 基于小波分析和神经网络的金融时间序列预测研究 征进行聚类,得到少数几个模式,将模式进行符号替换,然后采用序贯模式发 现算法实现关联规则的发现。这种挖掘方法可以发现类似这样的关联规则“i b m 公司的股价大幅上涨后两三天,o r a c l e 公司的股价也会随之上升 。显然这也是 非常有意义的特征规律。挖掘方法对时间序列进行分析的基本思路是这样的:针 对实际的大量序列数据,根据应用目的,选用相应的挖掘工具,从序列数据中 发现隐含的规则( 又常称为模型、模式或知识) 。再以这些规律对序列未来的变化 进行预测或描述。如图2 2 所示: 图2 - 2 :挖掘方法的一般思路 预测 特征描述 实现数据挖掘的方法很多,它以一种非常开放性的思维,大量综合应用 统计学、决策树、模糊理论、神经网络,粗糙集以及统计学习理论如支持向量机 等等,从各个角度、各个层面去挖掘信息。尽管各种挖掘方法从数据中寻找模式 的方式各种各样,但归根结底,它是直接以数据驱动的,因此其建模过程本质 上是一个依靠挖掘工具来进行的归纳推理过程。比如神经网络的学习过程本质上 就是一个归纳过程。由于是一个归纳过程,因此只要数据中的某种模式达到设定 的置信度、兴趣度、支持度阈值要求,就会以规则的形式输出。因此,挖掘方法 可能建立的实际模型有很多个,它们分别反映了序列某些方面的特征。 2 - 3 传统模型与数据挖掘的比较 尽管经典模型分析法和挖掘方法都基于时间序列蕴含着系统的历史行为和 特征信息的观点,因而二者的目的都是通过对序列数据进行分析以找出系统的 内在特性和发展规律,尽可能地从中提取出所需信息,但如前所述,二者所基 第二章金融时间序列研究概述 于的方法和思路是明显不同的,因而它们所找出的规律形式以及效果也就存在 很大差异。 模型法中理论模型的建立是在数学理论和假设基础上通过演绎推理的方法 建立起来的。实际模型的参数求解都基于坚实的数学基础,因此只要假设合理, 所得出的结论肯定是合理的。模型法具有逻辑的美感,尤其是模型的形式通常是 一个或一组数学方程。这不但具有表达的简洁性,另外可解释性、可理解性也都 很好,尤其重要的是它为进一步地处理、推导和应用提供了极大的方便。然而, 如果所提出的假设不合理,那么模型法将会严重失真。例如很多金融计量模型, 常常基于平稳性假设、正态分布假设、线性假设等,但实际上金融时间序列具有 信噪比低、非平稳、非正态、非线性的特点。另外,模型的构建也存在困难。如 前所述,模型法依靠学者们通过对现实系统进行大量的观察实践,再将发现结 果以理论模型形式表达出来。因此,如果缺乏对系统的足够的认识以及良好的建 模技巧,是很难构建出一个好的模型来的。再者,模型法还有一个缺点,即模型 反映的是序列的总体上的特征,对序列中隐含的一些局部、细节的特征是很难表 现出来的。 挖掘方法总的来说是基于归纳推理的思维。“规则 之所以被发现是因为有 足够多的数据支持它,因此它缺乏严格的理论基础,而更多的是“经验 基础,更 何况由于各种干扰因素的影响,数据中确实会存在“假”规则。因此它发现的“规 则”一般还需通过其它手段进行验证。不过,它能发现“新 知识这一点是非常 重要的。再者挖掘方法是基于数据的,因此它对数据样本的数量和质量要求也比 较高。“垃圾进垃圾出是信息领域的经典格言。随着时间的变化,时间序列的 内部特征也会发生一些变化,基于历史数据的模型可能并不适应现在的数据, 因此动态更新挖掘出来的模型是必须的,幸运的是,有了挖掘工具做到这一点 还是比较容易的。 综上所述,可对二者的优缺点总结如表2 1 所示。 1 3 基于小波分析和神经网络的金融时间序列预测研究 表2 - 1 模型法和数据挖掘法的比较 主要优点主要缺点 模1 有坚实的数学理论基础1 只能刻画系统的整体特征 型2 建立在演绎推理基础上,具和规律 法有较严密的逻辑性2 模型构建需要很强的技巧 3 一般以数学方程形式出现,性 能给出精确结果3 对假设条件依赖性强,实 4 研究较为深入,已得到广泛际情况有时很难满足 认可 挖1 能发现反映系统局部特征和1 规则的筛选比较困难,经 掘规律的模型验起着举足轻重的作用 法2 能发现“新 的知识2 建立在归纳推理基础上, 3 常常可撇开一些苛刻的假设逻辑性不强,得出的规则还需验证 条件3 模型难以用数学方程表达, 4 比较容易获得很多规则,反有的甚至是黑盒子,可理解性不强 映系统多方面的特征,并能及时更4 模型具有时效性,需要动 新态更新 5 一般用户容易使用,可自助5 正处于研究探索阶段,普 地寻找所需模型及认识还需假以时日 资料来源:金融时间序列的数据挖掘技术与经典统计模型的比较n 刀 1 4 第三章神经网络 第三章神经网络 海量信息是当今信息社会的特征。但是由于缺乏挖掘数据背后隐藏的知识的 手段,导致了“数据丰富但知识贫乏 的现象,使得人们产生对海量数据分析工 具的强烈需求。在这个背景下,数据挖掘作为高级的数据分析工具,就成为了分 析海量数据的一个有效的方法。本章首先简要介绍一下数据挖掘的基本原理,然 后详细介绍了数据挖掘中的神经网络方法的原理和算法。 3 1 数据挖掘概述 3 1 1 基本概念 许多人把数据挖掘视为另一个常用的术语一数据库中的知识发现 ( k n o w l e d g ed i s c o v e r yf r o md a t a b a s e ,简称k d d ) 的同义词。事实上据挖掘 与知识发现之间是相互区别而又互相联系的两个概念,具体而言,数据挖掘是知 识发现过程的一个阶段n 射。 整个知识发现过程由以下步骤组成:1 目标定义;2 数据获取;3 数据 预处理;4 数据转换;5 数据挖掘;6 解释和评估;7 知识表示。 以上七个步骤中间的前四个可以看作是为数据挖掘所做的准备工作,而后两 个步骤则可以看成是对第五步所进行的挖掘工作做的升华,通过主观分析机器所 得出的结果是否有趣,并用形象的方法把知识展现出来。具体由图3 一l 表现。 3 1 2 数据挖掘的功能 数据挖掘功能用于指定数据挖掘任务要找的模式类型。一般而言,数据挖掘 任务可以分两类:描述和预测。描述性挖掘任务描述数据库中数据的一般性质。 预测性挖掘任务对当前数据进行推断,以做出预测“町。下面将介绍数据挖掘可实 现的6 方面功能,需要指出的时,这六方面功能并不是相互独立的,有的数据挖 掘项目,你很难将其归属与哪个具体方面。如分析信用卡欺诈,一面可以说是异 常检测问题,另一方面也可以说是分类问题。 1 s 基于小波分析和神经网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论