




已阅读5页,还剩54页未读, 继续免费阅读
(统计学专业论文)基于改进BP神经网络的上证指数预测.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容摘要 内容摘要 证券市场作为现代经济重要的组成部分,如何能够准确地分析和预测市场走 势一直受到人们的关注。建立一个准确度比较高的股市预测模型对于金融投资及 宏观经济调控等都具有重大的实用价值。 随着证券市场混沌和分形理论的逐步确立,人们开始利用神经网络对证券市 场的变动加以预测。神经网络是一种重要的人工智能技术,在应用上已经迅速扩 展到包括金融时序分析在内的许多重要领域中。本文证明了我国上证指数长期以 来存在的分形特征,指出了使用神经网络对其走势进行预测的可行性。同时,试 图使用基于b p ( b a c kp r o p a g a t i o n ) 算法的神经网络进行预测。 b p 神经网络是一种被广泛运用的神经网络。它的核心是b p 算法,一种对于多 个基本子系统构成的大系统进行微商计算的严格而有效的方法;结构简单,算法 成熟。但是b p 算法本身也存在学习速度慢,容易陷入局部极小值等的缺陷。在近 年来我国一些使用b p 算法以及其他类型算法的神经网络进行证券走势预测的研 究中,都存在着预测结果精度不高,预测的时间跨度短等众多不足。 本文的作者在基于传统的b p 算法的三层向前神经网络的基础上,对原有的预 测方法做出了一些改进,引入了遗传算法,训练噪声等;使用了多个神经网络集 成进行加权计算的方法建立改进的预测模型,并尝试以指数变动代替传统的以时 间变动为序列的预测模式进行预测。最后,利用该改进模型对上海证券交易所上 证指数进行了长程模拟预测。预测结果与传统相比,在预测精度上有了一定的提 高;长程连续预测时,能够在提高预测周期的基础上显著降低预测误差,并且提 高预测序列与实际序列的相似形。 本文重点介绍了分形市场、使用神经网络预测的理论基础、b p 神经网络模型 以及使用g a 算法、多神经网络集成等对其进行改进的具体方法。文章最后对上证 指数进行了模拟预测,并对结果做出了分析,指出t n 用神经网络进行预测存在 的一些缺陷和不足。 关键词:指数预测;神经网络;b p 算法;集成网络 a b s t r a c t a b s t r a c t a sa ni n v e s t m e n tr e g i o no fh i g hr i s ka n dh i g hp r o f i t ,s t o c km a r k e ta l w a y s a t t r a c t sm a n ya t t e n t i o n s h o wt oo b t a i np r o f i t t h r o u g ha n a l y z i n ga n d f o r e c a s t i n gt h es h a r ep r i c ea c c u r a t e l yk e e p sb e i n gah o tt o p i ci nb o t h a c a d e m i cf i e l da n dp r a c t i c e w i t ht h ed e v e l o p i n go ff r a c t a lm a r k e th y p o t h e s i s ( f m h ) t h e o r y ,p e o p l e h a v et r i e dt of o r e c a s tt h ec h a n g eo ft h es t o c km a r k e t t h en e u r a ln e t w o r k i sa ni m p o r t a n tt e c h n o l o g yi nt h ef i e l do fa i ,w h i c hh a sb e e ng r e a t a c h i e v e m e n ti nt w oa c a d e m i cf i e l d sw i t ht h eh e l po fn e u r a ln e t w o r k ,t h e a p p r o x i m a t i n ga b i l i t yo fr a n d o mc o n t i n u o u sm a p sb yn e u r a ln e t w o r ka n dt h e a n a l y s i s o ft h e s t a b i l i t yo fad y n a m i cn e t w o r k i na d d i t i o n ,t h e a p p l i c a t i o no fn e u t r a ln e t w o r kh a sb e e ne x p e n d e di n t om a n ya r e a s ,f o r e x a m p l e ,p a t t e r ni d e n t i f i c a t i o n ,p r o c e s s i n g ,c o n t r o la n di m p r o v e m e n to f p i c t u r e s , i d e n t i f i c a t i o no fr e c e i v e dc a l l si nt h ea t mn e t w o r ka n ds oo n b p ( b a c kp r o p a g a t i o n ) i san e u r a ln e t w o r kw h i c hi sa d o p t e dw i d e l y t h e c o r ei s t h eb pa r i t h m e t i cas t r i c ta n de f f e c t i v em e t h o dt od e r i v a t i v e p r o b l e mf o rs y s t e mb a s e do i lm u l t i s u b s y s t e m ,s u c ham e t h o dh a ss i m p l e c o n f i g u r a t i o na n dm a t u r ea r i t h m e t i c c o m p a r e dw i t ht h et r a d i t i o n a l s t a t i s t i c a lr e g r e s sm e t h o d ,b pn e t w o r kc a nb eu s e dn o to n l yt os t u d yt h e e x a m p l eo ft r a i n i n gs e t ,b u ta l s oa b s t r a c ts o m eg e n e r a lt h e o r i e sa n dr u l e s i th a ss t r o n gc h a r a c t e r i s t i c so fa p p r o x i m a t i o no fn o n - l i n e a rf u n c t i o n s , w h i c hi sm u c ha p p r o p r i a t ef o rs h o r t r a n g ef o r e c a s to fs t o c ki n d e x b u tb pa l g o r i t h m sa s t r i n g e n c yisn o tg o o de n o u g ha n de a s il yt r a p p e d i nl o c a lm i n i m u m t h er e s u l to fs o m ef o r e c a s t i n gb a s eo na n ni si n a c c u r a t e a n dl o s ti nal o n g r a n g ee a s il y t h i sa r t i c l et r i e st os e e kn e t w o r k s e n s e m b l eb a s e do nb pa l g o r i t h m ,a s s o c i a t i n gw i t hg aa l g o r i t h m ,f o rs t o c k i n d e xf o r e c a s t i n g m e a n w h i l et h i s i m p r o v e db pn e t w o r kd o e sm a k es o m e i m p r m 7 e m e n tt ot h eo r i g i n a lf o r e c a s tm e t h o da c c o r d i n gt ot h el i m i t a t i o n 2 a b s t r a c t a n dd is a d v a n t a g eo ft h eb pn e t w o r k c o m p a r e dw it h t h ef o r e c a s tin gm a d e b yo t h e ra n nm o d e l s ,i tt u r n so u tt h a ts u c hi m p r o v e m e n t sr e s u l ti nb e t t e r p r e c i s i o na n dal o n g r a n g ef o r e c a s t i n ga h i l i t y t h i sa r t i c l ei n t r o d u c e st h ef u n d a m e n t a lo fa m f o r e c a s t i n g ,b p b a s e d n e u r a ln e t w o r k sa i d e db yg aa l g o r i t h ma n dc o o p e r a t i n gn e t w o r ke n s e m b l e t h e nt h e r ei ss o m ea n a l y s i sa n dc o n s i d e r a t i o nw i t ht h r e et i m e sf o r e c a s t i n g b yt h en e wm o d e l a tt h el a s t ,t h ea u t h o rw o u l dp o i n to u tt h el i m i t a t i o n o ft h ea n nm e t h o dw h i c hc a nn o tb ei m p r o v e d k e y w o r d s :s t o c ki n d e xf o r e c a s t i n g ;n e u r a ln e t w o r k s :b pa r i t h m e t i c n e t w o r ke n s e m b l e 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成果。 本人在论文写作中参考的其他个人或集体的研究成果,均在文中以明 确方式标明。本人依法享有和承担由此论文产生的权利和责任。 声明人( 签名) :曹名5 荔 驴年3 月一日 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦门大 学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电 子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入学 校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检索, 有权将学位论文的标题和摘要汇编出版。保密的学位论文在解密后适 用本规定。 本学位论文属于 1 、保密() ,在年解密后适用本授权书。 2 、不保密( ) ( 请在以上相应括号内打“”) 作者签名:铂轰孤日期:,年弓月吖日 导师签名:日期:年月 日 前言 前言 从股市诞生一百多年以来,不断有人用各种方式研究股市运行的规律,人们 希望能从复杂多变的股市中找到个规律来预测股市未来的发展,从而通过证券 交易获得最大的投资净效用。另一方面,随着证券市场的飞速发展,证券市场与 经济发展的关系越来越密切,证券市场在成为世界公认的经济晴雨表的同时,也 对经济的发展产生着发作用。因此预测股票市场的变化趋势更对经济发展的管理 和调控有着重要的参考作用。 如何能够准确分析和预测股票价格? 各种股票价格分析预测和方法应运而 生,如何建立一个成功率比较高的预测理论和模型是多年来许多学者一直研究的 内容。国外的研究者先后提出了一系列的定价理论和投资组合模型如马柯威茨的 投资组合理论夏普等人的c a p m 理论以及罗斯的a p t 理论等。然而投资者们发现, 虽然这些理论极大地开阔和提高了投资者的思想理念及其对风险和收益的辨证 理解但对实际操作却缺乏明确的指导作用。 随着近年来人工智能方法研究的发展以及证券市场些特性逐渐被人所揭 示,一些新的预测方式开始浮出水面。神经网络由于其在分析和预测时间序列 方面的独到优势,逐渐成为构建证券预测模型的有力工具。 我国证券市场自9 0 年代初期成立以来,虽然经历的时间只有短短1 5 年。经 过1 5 年的努力,中国证券市场取得了巨大的成就,当前深圳、上海两家证券交 易所总市值达到4 万多亿元,已经有1 3 0 0 多家的上市公司,7 0 0 0 多万名投资者。 对我国证券市场走势的预测同样有着重要的意思。 上海证券交易所编制的上证综合指数,该指数以1 9 9 0 年1 2 月1 9 日为基日, 以该日所有股票的市价总值为基期,基期指数定为1 0 0 点,自1 9 9 1 年7 月1 5 日起正式发布。上证指数将上海交易所流通股票的总市值的变动以指数的形式表 示出来,易于计算。上证指数的变化情况准确的反映着证券市场的波动情况。对 于上证指数的预测工作不但能够帮助资本市场的投资者对后市发展进行分析获 取收益,对分析和微调我国经济发展方向也有着重要的参考价值。 本文意在研究股票市场的一些基本的特点,通过尝试利用多个神经网络集成 前言 的方法对上证指数的变化趋势进行了预测,探索为预测我国证券市场指数的变动 提供了一种具有一定准确性与可操作性的实用预测模型。 第一章股票市场的分形特征 第一章股票市场的分形特征 第一节股票市场的分形特征 一、传统的有效市场假说 美国经济学f a m a ,1 9 6 5 在其经典文献中首次提出了有效市场假说 ( e f f i c i e n tm a r k e th y p o t h e s i s ,e m h ) ,他认为投资者对市场信息会做出合理的 反应,应该将市场信息与股票价格相结合。在e m h 假说里,市场是一个鞅,或者 是“公平博弈”,即信息不能被用来在市场上获利。“如果在一个证券市场中, 价格完全反映了所有可获得的信息,那么就称这样的市场为有效市场”。 经济学家r o b e r t s 根据信息集的不同内涵,区别了三个层次的市场效率,即 弱型效率、半强型效率、强型效率。这种分类法因被f a m a 确定而成为经典。 信息集分为三类:( 1 ) 历史价格信息,通常指证券过去的价格和成交量;( 2 ) 所有可公开得至i 的信息,包括盈利报告、年度财务报告、财务分析人员公布的盈 利预测和公司发布的新闻、公告等;( 3 ) 所有可知的信息,包括不为投资大众所 了解的内幕信息。与这三类信息相对应,有效率的市场可分为弱型效率、半强型 效率、强型效率。 弱型效率( w e a k f o r me f f i c i e n c y ) 认为价格反映了包含在历史价格序列中 的所有信息,投资者不能通过分析历史价格获得超常收益,这意味着技术分析无 效。弱型效率是证券市场效率的最低程度。 半强型效率( s e m i s t r o n g f o r me f f i c i e n c y ) 认为如果市场达到半强型有效, 则分析资产负债表、损益表、宣布股利的变化或股票拆细和其它任何有关公司的 公开信息不能获得超常收益,这意味着基础分析无效。半强型效率是证券市场效 率的中间状态,证券价格已充分、及时地反映了公开的信息。 第一章股票市场的分形特征 强型效率( s t r o n g f o r me f f i c i e n c y ) 认为市场参与者知道的有关公司所有 的信息都已充分反映在股价当中,即使那些拥有优越信息的人也无法获得超常收 益。强型效率是市场效率的最高程度,它包含了弱型效率和半强型效率。 如果市场是有效的,就意味着即使是专业投资人也无法打败市场,那么实际 上就否定了积极管理的投资理念。相反,如果市场是无效的,那么投资者和投资 机构就可以通过构造组合,创造超过市场的收益。 市场有效性假说是理性预期学派理论的重要基础,它是数量化资本市场理论 的基础,现代经典的资本市场理论以及证券技术分析方法很多都是从e m h 假说上 发展起来的。 进入上世纪8 0 年代以来,在探寻一般均衡定价模型进展不大的情况下,人 们开始将定价理论的研究方向转向注重市场信息的考察。经过实证检验,邦德特 和塞勒( b o n d ta n dt h e l e r ,1 9 8 5 ) 发现股市存在投资者有时对某些消息反应过度 ( o v e r r e a c t ) ,而杰格蒂什( j e g a d e e s h ,1 9 9 0 ) 、莱曼( l e h m a n n ,1 9 9 0 ) 等则发现 了股价短期滞后反应现象,由此,杰格蒂什和迪特曼( t i t m a n ,1 9 9 3 ) 认为投资者 对有关公司长远发展的消息往往有过度的反应,而对只影响短期收益的消息则反 应不足,关于这一点仍然存在着争论。尽管如此,信息与股价之间应存在着某种 关系得到了经济学家们的认同。并且,弗伦奇和罗尔( r o l l ) 的实证研究证明了股 价波动幅度与可获得信息量之问存在着良好的正相关关系。 然而,e m h 假说同样存在着明显的缺陷:一是对信息的反应,并非以因果关 系的形式呈现。由于信息的分布是狭峰态的,因而价格变化的分布也应该是狭峰 态的,从而人们对信息的做出的反应是非线形的,一旦信息水平达到了某个临界 值,人们才会对所忽略的信息做出反应,并直接达到临界值。二是e m i 假说没有 涉及到市场的流动性问题。一个稳定的市场有e m h 描述的有效市场并不相同,一 个稳定的市场是一个富有流动性的市场。如果市场富有流动性,那么可以认为价 格是接近公平的,然而市场不是一直富有流动性的。三是市场的有效性并不定 意味着随即游走,但随即游走的确意味着是市场是有效的。四是市场的有效性检 验,对市场的有效性检验仍然停留在最初的随即游走模型上,然而满足随机游走 模型只能看作是市场有效性的充分条件而不是必要条件。不满足随机游走模型的 4 第一章股票市场的分形特征 市场不一定就是无效的。五是有关效应的问题,股票收益的季节性,大小效应等 都不利于e m h 假说。 上世纪8 0 年代以来的许多相关的统计检验也出现了与有效市场理论假设相 冲突的股价异常现象,即证券市场异象。出现了任何一种股票或其组合的平均超 常收益率不为零的证券市场异象,并且诸如价值异象、时间效应、规模效应、公 告效应、处置效应等异常现象在金融市场上频繁出现,运用e m h 理论却很难解释。 以m a n d d l b o r o t 为代表的一些学者对e 删理论提出了质疑,他们认为资本市 场的收益率并不服从正态分布,其分布具有尖峰、厚尾等的特征,实际上是服从 稳定帕累托分布的。在这类分布中,方差是无定义或者无限的,在一定的条件下 它对应与分数布朗运动,具有自相似、长期相关、统计相关等特性。因此传统的 资本市场方法无法准确的反映市场的。 二、分形市场的假说( f 埘h ) 面对e m h 理论的种种不足,金融学家们开始尝试利用非线性方法与混沌思想 来理解股票市场行为,并开始探索的描述市场特性的假说。2 0 世纪8 0 年代初, 美国经济学家s t u t z e r 最先将新兴的混沌理论和方法用于分析宏观经济中非规 则增长和经济增长中显现的混沌等问题。之后不久,国外经济学家们便开始运用 混沌理论,研究和探讨包括财政、金融在内的经济和管理方面的问题,特别是有 关证券市场股价指数、汇率变化方面的研究格外引人注目。金融证券市场越来越 多的混沌特征被逐步揭示了出来。 分形原理作为混沌研究的重要组成,近年来取得了很大进展。1 9 9 6 年e d g a r e p e t e r s 在( c h a o sa n do r d e ri nt h ec a p i t a lm a r k e t s 一书里提出了分形 市场的假说( f r a c t a lm a r k e th y p o t h e s i s ,f m h ) ,将分形理论用于资本市场,并 且成功的建立了标准普尔5 0 0 家公司股票日、周、月、年之间的牧益曲线的自相 似性。 分形是2 0 世纪7 0 年代后发展起来的- - f 7 新兴的复杂科学,它研究的是一种 特殊的复杂系统“自相似”系统,即在不同标度下存在相同或相似特征的系 。伍恒煜,林详“金融市场非线形:混沌与分形”,“商业研究”,2 0 0 3 年第7 期 笫一章股票市场的分形特征 统。分形的一个独特性质是,它们不具有通常情况下用于测量的特征标度,并且 具有特殊的特征量,是介于整数维之间的分数维。著名的海岸线测量就是分形的 一个例子。人们发现在测量海岸线长度时,所测长度取决于用来测量的尺子长度, 尺子越短,所测的实际长度就越长。其原因是所用的尺子越短,系统内部相似的 细微结构就越多地被揭示出来。 在金融市场上,我们也观察到类似的分形结构。价格序列在日、周、月的轨 迹具有相似性,我们无法确切地将它们分辨开来。基于这一观察,以及金融市场 分形性质的不断发现,p e t e r s 提出的分形市场假说,即金融市场本质上是一个复 杂系统,而分形是描绘这一系统的有力工具。依据最近的研究进展,我们对这一 假说提出部分修正:即金融市场事实上是有界的分形系统。有界分形,指的是市 场的分形性质是有界的,金融市场上并不存在无限尺度上的自相似特征。 分形市场是指市场是内在波动的,不存在一个静态的均衡,同时向投资者提 供了一个稳定性和流动性的环境。这里的稳定不是均衡,而是相对市场的崩溃而 言的。不同于有效市场假说,分形市场理论认为,信息依照投资者的投资偏好而 被评估。因为具有不同的投资偏好的投资人对信息的评估是不同的,所以信息的 传播也是不均衡的。市场价格不可能每一次都反映出所有相关的信息,而只是反 映出投资入偏好的那部分信息。这样的结果就是市场的强烈波动被吸收而呈现出 稳定发展的形态。f m h 理论认为市场价格是保持流动和稳定性的结果,而不是e m h 认为的博弈的结果,价格不能线形的反映出所有的信息,价格的变化不是相互独 立的。在分形市场上是不存在理性人的假设,投资人的决策依赖于历史的经验。 证券价格具有一定周期的长期记忆性。只有在市场面临突发的重大事件,大部分 投资者对信息的观点相同的时候,才会破坏这样的稳定性,造成突然的暴涨和暴 跌行情。 分形市场假说主要考察金融市场上存在的长程相关( l o n g r a n g e d e p e n d e n c e 或l o n gm e m o r y ) 和标度行为( s c a l i n gb e h a v i o r ) 。通过全毅的观念 和工具,它为揭示金融市场可能存在的内在结构提供了新的洞察力。 第一章股票市场的分形特征 分形市场假说强调了流动性的影响已经基于投资者行为之上的投资偏好。分 形市场假说的目的是给研究者一个符合实际观测到的投资人行为和市场价格运 动的模型。 f m h 的主要内容包含了以下5 个方面: ( 1 ) 市场由众多投资者组成,他们具有不同的投资时间尺度,如长线的或者 短线的,这使他们有着不同的投资行为。 ( 2 ) 信息对于投资时间尺度不同的投资人的影响是不同的,短线的投资者投 资行为主要是频繁的交易,因此他们比较关注技术分析信息,而基本面的信息经 常被忽略。长线的投资者则认为技术面的分析的信息不能用于长期的投资决策, 只有对证券的内在价值进行评估才能获得长期的投资收益。 ( 3 ) 市场的稳定在于市场的流动性的保持,而要作到这点需要大量的具有不 同的时间投资尺度的投资人的存在。在证券市场上,正是因为具有大量不同投资 时间尺度的投资者的存在,才使得市场稳定而具有活力。当所有投资人的尺度如 果趋向一致的时候,市场的稳定必然被破坏。 ( 4 ) 基于以上特点,证券市场的价格是长线基本面分析和短线技术分析共同 作用的结果。一般来说短期的价格比长期的价格变化更具有易变性。市场发展的 内在趋势反映了投资者期望收益的变化,并受到整个经济大环境的影响。短期交 易行为更多的是从众行为的结果,因此市场的短期倾向与市场的长期趋势并无内 在的一致性。 ( 5 ) 如果证券与经济循环没有关系,那么就不存在长期的趋势。交易、流动 性和短期信息将在市场里起到决定性的作用。 f m h 和e m h 理论的不同在于,分形市场假说认为资产的价格并非纯粹的随机 运动,而是服从一定的规律分布,是由价格决定系统的混沌性质所引起的。f m h 理论强调信息对不同投资时间尺度的投资者所产生的影响是不同的,信息传播是 不均衡的,价格变化不是独立的。 。陈永忠“分形市场假说下的风险度量”,经济师2 0 0 4 ,8 :7 第一章股票市场的分形特征 第二节分形市场的判断 一、分形市场的常用判断方法 那么怎么判断一个市场是不是存在分形特征呢,要描述一个系统的分形特 征,经常被采用的方法包括: ( 1 ) 相关维。相关维指标的作用在于用来判断对象系统的行为是否混沌的, 说明了为描述该系统所需要的最多独立变量数,独立变量的个数某种程度上反映 了系统方程的复杂程度,但不能完全反映系统结果的复杂程度。 ( 2 ) 李雅普诺夫指数。利用李雅普诺夫指数可以判断对象系统的行为是否混 沌的:该指数还说明了该系统的动力行为在某个方向上是指数发散或收敛的。李 雅普诺夫定量地给出了系统在某个方向上发散的速度,因此从最大李雅普诺夫指 数我们可以知道系统包含的信息损失的最大速度,最大李雅普诺夫指数的倒数就 给出了对象系统的最大可预报时间。 ( 3 ) k o l m o g r o v 熵。到目前为止,k o l m o g r o v 熵仅被用于判断数据结构中的混 沌性质。 ( 4 ) h u r s t 指数。h u r s t 指数说明了时间序列的持续性行为。大于0 5 的h u r s t 指数表明序列是持续性的;小于0 5 则序列是反持续性的。h u r s t 指数还反映出时 间序列的分形特征,从时间尺度上看,h u r s t 指数越是靠近0 5 ,序列的结构越复 杂,其时间曲线越是曲折。 二、使用法计算h r s t 指数 用分析法计算h u t s t 指数的方法是种常用的,用来检验系统是否具 有分形特征的办法,具有简单易行的特点。 这种方法是h u r s t 长期研究尼罗河的流量变化后提出的。在多年的水文数据 中,他发现数据不服从布朗运动及正态分布的特性。为了合理控制水库的泄水量 使其保持不枯不溢的理想状态,h u r s t 钡r j 算了水库蓄水量随时间在平均水平附近 。p e t e r see ”f r a c t a l ;s a r k e ta n a l y s js :a p p l y i n gc h a o st h e o r yt o n v e s t m e n ta n d e c o n o m i c s ” m f o h nw il e y & s o n s n cn e w y o r k1 9 9 4 s 第一章股票市场的分形特征 波动的范围。h u r s t j h j 这个变动范围除以观祭值的标准差得剑一个无量剩的量, 使不同的序列具有可比性。这种分析称为重标极差法( r e s c a l e dr a n g e ) ,也称 法。r 是一个时间序列中”个数据偏离其均值的累加值的极差,称为”个数据的 极差,表示时间序列最大的变化范围;s 。是时间序列的标准差,表示偏离均值 n 的程度,是分散程度的测度。 形表示极差的大小重用s 。来衡量,这就是重标 极差法的名字的由来。 法可以用于统计分析可用来研究一大类问题,对于方差发散或有长期 记忆作用的随机过程都适用。下面是法分析的具体过程。 考虑一个收益率序列y 。,y ,_ y 。 偏离均值的累积和为: 置,。= ( y ,一t n 。) 其中,z 。是力期的累积偏差,m 。是门期的平均值a 个数据的极差就是式( 1 ) 最大和最小值之差 兄= m 。a :x 。 x , ,。j _ m i n x t ,。 其中,r 。是z 的极差。 为了比较不同类型的时间序列,用极差除以标准差( 即重标极差) 得到: = m o s i a x ;n 虮i = 1 一- 。) 一热私 其中,s 。= i1 h ( y i l = 1 重标极差应该随时间而增加。 h u r s t 建立了以下关系: m 濉 1 第一章股票市场的分形特征 聪:口”h ) 其中,d 为常数。 ( 4 ) 如果序列是一个随机序列,日应该等于0 5 ,即累积离差的极差应该随时间 的平方根增加。一般地,日不等于o 5 ,可这样求出: 对等式( 4 ) 两边先取对数得: 勘j = 日l n n + ( 5 ) 因此可画出1 1 1 ) 和1 nt 的双对数图,做二元回归拟合。 所得函数的斜率就给出了h u r s t 指数的一个估计,截距就是1 n 0 ) 的一个估 计。 其中h 即是h u r s t 指数,c 为相关系数。 当h = o 5 时,过去和未来增量间的相关系数为0 ,表明现在不影响未来。这 说明增量过程是一个独立的随机过程,布朗运动是其特殊情况。 当h 0 5 时,为分数布朗运动。此时,增量之间不再相互独立。但是这个 过程与马尔科夫过程所具有的短期记忆行为不同,分数布朗运动的记忆作用是长 期的。( 而且长期记忆只与h u r s t 指数的大小有关,没有标度性,因此它具有分 形的特征) 日值指示了这种长期记忆作用的特性。 ( 1 ) o 5 ( h ( 1 ,有持久性效应。表明过去一直增长意味着未来这种趋势将继续 下去,而且对任意大的时间t 都是如此。反之,过去的减少趋势就平均而言,意 味着未来的连续减少。h 越接近1 ,趋势越明显;日越接近0 5 ,逐渐趋于随机 性。这种长期记忆作用使得随机过程呈现一定的趋势,增量间有一定的正相关性。 绝大多数资本市场都是具有符合持久性的时间序列特征。 ( 2 ) 0 ( h ( 0 5 ,增量间是负相关的,称为反持久性效应( a n t i p e r s i s t e n t ) 。 如果过去是增长的,则下一对刻下降的可能性更大;反之,过去是下降的,则下 一时刻上升的可能性更大。反持久性效应的强度取决于日接近o 的程度。越接 第一章股票市场的分形特征 近0 ,负相关性越强。 我们知道,证券的指数、价格等都可以看作是一个时间厣列,因此可以用以 上的办法计算h h u r s t 值,如果计算出的h u r s t 值大于0 5 ,就可以说明系统是存 在着分形的特征。 三、上证指数序列的h u r s t 值的计算 我们使用法来验证我国上海证券交易所1 9 9 7 年5 月以来的上证指数收 盘值是否具有分形特征。 选取的时间区间1 9 9 7 年5 月1 4 日到2 0 0 5 年8 月2 3 日作为研究的时间段, 在这段时间内共有正好2 0 0 0 个交易日数据。 法分析步骤: ( 1 ) 首先对2 0 0 0 个收盘数据序列进行处理,设f 日的收盘数据为只,计算只的 对数收益率: r ,= l i l 化) 一i n ( e , 一。) ( 6 ) 为了去掉对数收益率自身的线性相关性,我们对r ,j 彳亍a r ( 1 ) 的自回归得到 其残差序列: x ,= 曩一0 + 妇。) ( 7 ) 其中,口和6 是回归模型a r ( i ) 的系数, 置 为残差序列,经过回归计算,有: a = - 0 0 1 4 7 ,b = 0 0 0 1 ( 2 ) 选取时间增量n 。对于确定的n 和1 9 9 9 个值的( x + ) 序列,我们可以得到 1 9 9 9 h 】个的时间段,在每个时间段我们都可以计算出对应的r 与,为此可 啪j 1 9 9 9 n 】个的,我们对这一系列值求其平均值作为在时间增量为n 时的估计值a 我们这里将n 的起始取值定为5 ,即1 个交易周。 第一章股票市场的分形特征 ( 3 ) 对所得到的结果,f f f n = 5 ,6 1 0 0 0 的取值区域分别做1 n 似s ) 。对1 1 1 0 ) 的 回归,取l i l g ) 的参数估计作为h 的估计。 我们令函数,g ) 为;,( 1 n g ) ) = l n ( r s ) 。,则可以得到下图l : 图l :函数,o ) ) = l n ( r s ) 。 ( 4 ) 计_ 2 ( ) 。i ,_ 的统计量同样也可以用来很好地估计非线性系统 长期记忆过程的长度。观察序列如下图2 所示,在力习卿寸出现明显的从上 升趋势转为了下降趋势,根据这个现象,可以判断,当n 为3 0 8 的时候,该点是一 序列长期记忆的消失点矗嘲 对弱7 侣瓣这个区域做一次回归,计算h u r s t 指数, 得到胆n6 0 8 。 第一章股票市场的分形特征 图2 :函数厂( k ) = ( ) 。石 四、计算的结果分析 通过上面的计算,我们得到h = o 6 0 8 ,由于计算所跨越的时间长度比较长, 所以这个值稍微小于国外的一些证券市场利用聪法计算出的h u r s t 指数值, ,u 并不代表我国的市场成熟度比国外市场来的更佳。一般的,系统的分形维数为 2 h ,由此可见上海指数从1 9 9 7 年5 月1 4i e i 以来的指数序列是具有分形特征和持 续性的,上证指数的时间序列的确存在着混沌现象。所以,我们可以证明上证指 数并不是随机变化的,而是一个存在着有偏的随机游走,它不完全属于e g k l 理论 分析的有效市场,其指数序列是在一定时期内相关的。 既然上证指数具有分形市场的特点,那么我们是否能够在此基础上对其走势 进行分析和预测呢? 第一章股票市场的分形特征 第三节常用的混沌时间序列分析预测方法 由于混沌时间序列不是完全的随机游走,而是有偏的,所以我们可以利用这 个特点对混沌时间序列进行预测。 一、传统的时序预测法 通常的做法是根据实际问题正确地建立描述系统的动态数学模型,然后求解 这个数学模型,最后反过来根据计算结果进行预测,传统的预测方法主要有动力 学方法和数理统计方法,这些方法的共同特点是先建立数据序列的主观模型,然 后根据主观模型进行计算和预测。常用的建立模型的方法主要有两种:一是时间 序列关系模型,在这类的模型中被预测的对象的演变过程为一时间的函数;另一 种是结构关系模型,这类模型的特点是,被预测的事物与其影响因素之间在一定 的时间内保持着某种固定的函数结构关系。 混沌时间序列预测的常用方法:全域法、局域法、加权零阶局域法、加权一 阶局域法、基本李雅普诺夫指数的时间序列预测方法等。 时间序列关系模型与结构关系模型一般对被预测对象都有具体而且严格的 要求,这就要求我们在做预测之前必须对被预测对象做深入系统的分析。只有在 确认某类预测模型的前提条件得到满足的情况下,才可以使用该模型进行预测, 否则预测结果是不可靠的。股票市场作为现实经济运行状况的直接体现,其影响 因素如g d p 、增长率、汇率及国内外政治形势等时常发生较大的变动,所以要确 定和修改模型的结构确非易事。另一方面,一般计量统计的时间序列模型很难处 理高度非线性的问题,而实际上股票市场与其影响因素之间存在着复杂的非线性 关系。已有大量的实际数据表明,股票市场是个具有混沌现象的非线性动力系 统。 随着混沌科学的发展,使得可以不必事先建立主观模型,而直接根据数据序 列本身所计算出来的客观规律( 如李雅普诺夫指数等) 进行预测,这样可以避免预 测的人为主观性,提高了预测的精度和可信度。 4 第一章股票市场的分形特征 二、使用神经网络预测时序 近年来,由于计算机与人工智能技术的飞速发展,为股票市场建模预测中新 技术新方法的应用提供了有利的条件。人工神经网络( a r t i f i c i a ln e u r a l n e t w o r k ,简称a n n ) 是由大量简单的处理单元神经元按照某种方式联结而成 的自适应的非线性系统。它的每一个神经元的结构和功能都很简单,其工作是“集 体”进行的,它没有运算器、存储器、控制器,其信息是存储在神经元之间的联 结上的,它是一种模仿人脑的神经系统结构和功能的物理可实现系统。 因为人工神经网络广泛的适应能力、学习能力和映射能力,在多变量非线性 系统的建模方面取得了惊人的成就,成为新兴的预测时间序列的方法。人工神经 网络模型具有巨量并行性、存储分布性、结构可变性、高度非线性、自学习性和 自组织等特点,而且可以逼近任何连续函数,目前广泛应用神经网络作为非线性 函数逼近模型。a n n 的最大优点是不需依赖于模型,所以非常适合用于股票市场 的预测。因为股票股市的建模与预测所处理的信息量往往十分庞大,对算法有很 高的要求。它的非线性动力学特性非常复杂,所以一般传统的方法对于股市的预 测往往难如人意。 基于以上的原因,我们可以选取了人工神经网络作为预测上证指数的工具。 第四节基于神经网络的证券指数预测研究的简述 一、目前部分模型对上证指数预测的结果 近年来,在利用神经网络预测证券指数方面,一些人已经做了不少有益的尝 试,取得了一些成果。 其中,上海工程技术大学的郝勇在为上海市社会科学基金项目运用神经网 络技术研究上海证券股票价格分类指数的波动规律所做的研究中,使用t b p 的原型算法对上证指数的走势做了多个时间跨度为单目的预测,得到了平均相对 误差为1 8 一2 5 的结果。 厦门大学的雷震在2 0 0 2 年,用改进过的b p 神经网络对上证指数的走势做了短 第一章股票市场的分形特征 程预测,在预测时间跨度为单日,连续预测次数为1 0 次的条件下,得到结果为相 对误差为2 6 1 ,预测数据与真实数据的相关性为0 5 6 :其模型在预测时间跨度 为两日,连续短程预n l o 天的条件下,得到的相对误差为4 8 7 ,但是预测数据 与真实指数之间的相关性则迅速劣化到只有0 1 3 。 天津大学的马军海等人则使用了算法更为复杂的小波神经网络算法对多只 上海交易所上市股票做了时间跨度从1 到3 日的预测。其中,当预测时间跨度为 1 日时,得到的相对误差不超过2 5 ;当预测的时间跨度提高到3 日时,相对误 差则迅速放大到1 0 以上。 二、现有模型存在的不足 从上文所提到的相关研究成果来看,使用神经网络进行时序分析的方法已经 被不少人所认可。目前,利用神经网络对股票指数预测所涉及的算法主要有b p 算法、r b f 算法、小波算法等。从以上面列举的几个预测结果分析,总的来说, 在预测精度上都能够把误差控制在一定的精度范围内。但是,上述几个预测的结 果都存在着相同的问题,那就是:预测基本停留在时间跨度为单个交易日的短程 预测上,一旦预测的时间跨度稍微拉长之后,预测结果的平均相对误差就明显放 大了,而且预测结果的序列与实际指数序列的相关性也大大减弱。这样的预测结 果对于长期长程的指数预测来说是很不理想的。对于实际应用来说,能起到的帮 助也比较小。 目前被采用的各种神经网络算法各有优劣,其中b p 算法虽然收敛速度比较 慢,稳定性也不足,但是它是一个成熟的算法,具有简单、可塑性强等优点。我 们可以比较容易地通过对b p 算法的改进来克服其本身固有的缺陷,以期获得更 好的预测效果。尤其是在用于时间跨度比较长的预测中;力图提高其预测的准确 度以及预测结果序列与实际序列的相关性。 1 6 第二章利用神经网络对具有分形特征的时间数列进行预测 第二章利用神经网络对具有分形特征的时间数列进行预测 第一节神经网络的基本原理 一、人工神经网络的历史 2 0 世纪5 0 年代末f r o s e n b l a t t 提出了著名的感知机p e r c e p t r o n 模型。这是 第一个完整的神经网络。这个模型由阈值单元构成,初步具备了诸如并行处理分 布存储和学习等神经网络的一些基本特征,从而确立了从系统的角度研究神经网 络的基础。1 9 6 0 年b w i n d r o w 和m e h o f f 提出了自适应线性单元a d a l i n e 网络, 它可用于自适应滤波预测和模式识别。从2 0 世纪5 0 年代末f u 6 0 年代初,神经 网络的研究受到人们的重视研究工作进入了一个高潮。芬兰学者t k o h o n e n 提出 的自组织影射理论,美国s a g r o s s b e r g 提出的自适应共振理论,日本学者福岛 邦彦k f u k u s h i m a 提出了认知机n e o c o g n i t r o n 模型等研究成果对以后神经网络的 研究和发展都产生了重要影响。 进入2 0 世纪9 0 年代神经网络的研究又引起了众多学科领域学者的关注,并很 快形成了热潮。其主要原因是,以逻辑推理为基础的人工智能理论和y o n n e u m a n n 计算机在处理诸如视觉、听觉、形象思维联想记忆和运动控制等智能信息处理问 题上受到了挫折。具有并行和分布机制的神经网络本身的研究成果,以及脑科学 和神经科学研究成果的推动作用,以及v l s i 技术和光电技术的发展为神经网络的 实现提供了物质基础。由于以上原因使人们产生了一个共识,即神经网络可能成 为未来智能机的良好模式。 1 9 8 2 年,美国加州理工学院生物物理学家j j h o p f i e l d 提出了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能开关什么协议书好
- 金属网制作工多工种协调能力考核试卷及答案
- 机械产品检验员岗位安全技术规程
- 公司精细木工现场作业技术规程
- 公司油母页岩供料工岗位职业健康、安全、环保技术规程
- 2026届太原市数学九上期末质量检测试题含解析
- 管理心理学精要
- 2026届四川省成都东辰国际学校九年级数学第一学期期末综合测试模拟试题含解析
- 山西省吕梁市名校2026届数学八上期末预测试题含解析
- 代谢综合征的中医治疗
- 三年级数学计算题专项练习及答案集锦
- 2025邮政储蓄银行四川省分行社会招聘考试参考试题及答案解析
- 足球场的运营可行性方案
- GB/T 2881-2023工业硅
- 经济统计学课件
- 有限合伙份额质押合同完整版(包含质押登记公证手续)
- GB/T 43299-2023机动车玻璃电加热性能试验方法
- 马工程经济法学教学
- 肠道微生态与人体健康
- “情景教学法”是小学英语教学的最有效方法
- 房屋卫生间闭水实验情况确认单
评论
0/150
提交评论