(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf_第1页
(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf_第2页
(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf_第3页
(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf_第4页
(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(管理科学与工程专业论文)神经网络在股票市场预测中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东师范大学硬士学位论文 摘要 股票市场作为一个高风险商收益的投资领域,其运作是一个复杂的非线性的 系统,容易受到多方面的影响。但是股票市场的价格走势实质上是一种复杂时序 函数,因此是可以预测的。 人工神经网络是一个非线性的动态系统,可在任意精度内实现变量间的非线 性关系的映像,具备解决非线性问题能力、网络学习能力和系统拟合能力,能够 满足经济预测要求,使系统具有处理非线性、不确定性问题的能力,从而提高预 测精度。利用人工神经网络的非线性及动态的特点,通过调节连接权值可以任意 精度逼近任何连续函数,因此也可以逼近证券价格随时间变换这种函数。从而对 股票市场的交易模式进行模仿和学习。 本文即在相关经济理论指导下。分析了股票市场系统的特点,根据其非线性、 不确定性等特点,运用人工神经网络理论,构建了股票价格预测模型体系,提出 了基于遗传算法的神经网络和基于粒子群算法的神经网络的系统建模方法,提高 系统预测准确度,并对实验结果进行了比较。 本文的第一章介绍了预测、预测的研究背景,国内外研究的状况,预测的方 法,神经网络的发展与其在经济领域中的应用,评价预测效果的几项误差指标等; 第二章提出了神经网络的结构、算法,以及b p 网络收敛速度慢,不易收敛到全 局最小,泛化能力差等问题;第三章用具体的时间序列数据为例来研究了b p 神 经网络的逼近能力,第四章利用基于遗传算法的神经网络对股票市场的数据进行 了优化,对逼近的结果进行了比较。第五章利用基于粒子群算法的神经网络对股 票市场进行预测,并对结果进行比较。 本论文总结了前人研究成果,针对前人研究的不足,提出了作者自己的观点 和想法,并把它们付诸实践,力求为我国进行基于神经网络的股票市场预测提供 有效的手段,为推广人工神经网络技术做出努力。 关键词:预测;非线性;人工神经网络:遗传算法;粒子群算法 山东师范大学硕 ? 学位论文 a b s t r a c t f o r e c a s ti sn e c e s s a r i l ya ni m p o r t a n tl i n ki ns c i e n t i f i cm a n a g e m e n ta n d p r e m i s eb e f o r e p o l i c y - m a k i n ga n dl a y o u t i ti sn e c e s s a r yt of o r e c o s ta n da n a l y z ee v o l u t i o n 缸e n do f s o m es y s t e m o n eo ft h ec u r r e n tf o r e c a s tm e t h o d si st i m es e r i e sf o r e c a s tw h i c h c o n s t r u c t sm o d e l sa c c o r d i n gt ot h eh i s t o r i c a ld a t ab e f o r eu s i n gi tt of o r e c a s tt h ef u t u r e a r t i f i c i a ln e u r a ln e t w o r ki s 姐e m b r a n c h r a e mo fa r t i f i c i a li n t e l l i g e n t , o r i g i n a t e di n 1 9 4 0 sa n di sw i d e l ya p p l i e dt om a n yf i e l d sn o w n e u r a ln e t w o r kc a l l as t u d ya n d r e s e r v ep r e v e n i e n ti n f o r m a t i o na n dk n o w l e d g e ,w h i c hi st h et h e o r e t i c a lb a s i sw h e n u s e dt of o r e c a s tt h ef u t u r e a sf o rn o n l i n e a rt i m es e r i e sf o r e c a s t , n e u r a ln e t w o r ki s m o r ee f f i c i e n ta n dp r e c i s et h a nm a t h e m a t i c a lm o d e l s a r t i f i c i a ln e u r a ln e t w o r ki san o n l i n e a rd y n a m i cs y s t e m , w h i c hc a nr e a l i z et h e r e f l e c t i o no fn o n l i n e a rr e l a t i o n sa m o n gc o n s t a n t s 嘶n l i nt h er a n g eo fa n ya c c u r a c y , c a p a b l eo fs o l v i n gn o n l i n e a rp r o b l e m s , l e a r n i n gn e t w o r kt e c h n o l o g ya n di n t e g r a t i n g s y s t e m s i ti sa b l et os a t i s f yt h en e e d sf o rt h ep r e d i c t i o no fe c o n o m yi n d e x , e n a b l i n g t h es y s t e mt os o l v et h en o n l i n e a ra n du n f i x e dp r o b l e m s ,a n dh e n c ei m p r o v i n gt h e a c c u r a c yo fp r e d i c t i o n i nt h i sp a p e r , u n d e rt h eg u i d a n c eo fe c o n o m i ct h e o r y , w e a n a l y z et h ec h a r a c t e r i s t i c so fe c o n o m ys y s t e m ,b a s e do nt h en o n l i n e a ra n du n f i x e d f e a t u r e so fe c o n o m ys y s t e m , t h et h e o r yo na r t i f i c i a ln e u r a ln e t w o r ki sa p p l i e dt o c o n s t r u c tt h em o d e l i n gs y s t e mo fe c o n o m yp r e d i c t i o n t h e nt h em o d e l i n gm e t h o dt o c o m b i n et h em u l t ie v o l u t i o n a r yc o m p u t a t i o na n dn e u r a ln e t w o r kh a sb e e np u t f o r w o r c l s ,w h i c hi m p r o v e st h ea c c u r a c yo f t h es y s t e mp r o d i c t i o m i nt h i sp a p e r , d e f i n i t i o n , b a c k g r o u n d , s i g n i f i c a n c e ,s e v e r a lr e s e a r c hs i t u a t i o no f f o r e c a s ta n d5 0 m eu s u a lf o r e c a s tm e t h o d sw e r ec o m m e n t e di nc h a p t e r1 ,a l s of i v e e l y o rt a r g e t si no r d e rt oe v a l u a t ef o r e c a s tp r e c i s i o nw e r ei n t r o d u c e di nc h a p t e r1 c h a p t e r2s u m m a r i z e db a s i cs 灯u c t u r e s ,a l g o r i t h m sa n ds o m eb pn e t w o r k se x i s t i n g p r o b l e m s ,s u c ha sc o n v e r g e n c er a t e , t h eg l o b a lc o n v e r g e n c ea n dg e n e r a l i z a t i o n i n c h a p t e r3 ,i n s t a n c e sw c r eu s e dt or e s e a r c ho p t i m i z e db yb pn e u r a ln e t w o r k s i n c h a p t e r4 e x p e r i e n c ed a t aw e 托w o r k e db yn e u r a ln e t w o r k sb a s e do ng e n e t i c 4 山东师范人学硕t 学位论文 a l g o r i t h m ,a n dt h er e s u l t sw e r ec o m p a r e d a l s o ,i ne h a p t c r5 ,t h en e u r a ln e t w o r k s b a s e do np a r t i c l es w a r mo p t i m i z a t i o na l g o r i t h mf o r e c a s tt h ed a t aa n dt h er e s u l t sw e r e r e c o r d e da n dc o m p a r e d p r e d e c e s s o r s r e s e a r c hf i u i ti ss u m m e du pi nt h i sp a p e r , a n dp r o p o s e st h ec o n c e p t a n dt h eo p i n i o no f w r i t e rs e l f a i m e da lt h ed e f e c t , a n dt h r o w i n gt h e mi n t ot h ep r a c t i c e a n dd o e so n e sb e s tt os u p p l yv a l i dm e a s u r ef o rs t o c km a r k e tf o r e c a s t i n gb a s e do n a r t i f i c i a ln e u r a ln e t w o r k s ,a n dm a k i n gg r e a te f f o r t si nt h ei n t e r e s to fs p r e a d i n gt h e a r t i f i c i a ln e u r a ln e t w o r k t e c h n i q u e k e yw o r d s :f o r e c a s t ;t u n es e r i e s ;a r t i f i c i a ln e u r a ln e t w o r k s ;n u m e r i c a lv a l u e p r e p r o c e s s i n g le v o l u t i o n a r yc o m p u t a t i o n s 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得( 注:如没有其他需要特别声 明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 创码 导师签字: 学位论文版权使用授权书 冢8 碉 l 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权堂 监可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者躲州 导师签字: 泛f 7 嘲鸟 签字e t 期:2 0 0 年月日签字e t 期:2 0 0年月日 山东师范大学硕士学位论文 1 1 课题的研究背景 第1 章绪论 预测作为一种探索未来的活动在古代已经出现“预测”一词是来自古希腊 的术语,我国也有两句古语:“凡事预则立,不预则废”,“人无远虑,必有近忧”, 这充分说明人类很早就己意识到预测的重要性。古代的预测仅是一种艺术,主要 依靠预言家的经验估计和直观判断,有时也借助于先兆、推测和某些技术根据。 但作为一门科学的预测学,直至科学技术高度发达的2 0 世纪才产生。预测是综 合研究事物内在联系延续与突变的过程的- - n 学科l l l 。这个过程实际上是在掌握 相关信息的基础上,从过去和现在已知的情况出发,综合运用哲学、社会学、经 济学、统计学、数学、计算机、工程技术及经验分析等定性定量的方法,研究事 物未来发展及其运行规律,并对其各要素的变动趋势做出估计、描述与分析1 2 1 1 甜。 管理与决策活动中往往也需要对大量的数据进行分析,在经济、工程、自然科学 和社会科学等领域的实际工作者和研究人员,都不可避免地要和一系列的历史观 察、统计数据打交道,我们把按时间顺序产生和排列的观察数据序列称为时间序 列。而对时间序列进行预测则成为一个具有相当实际价值的应用研究领域。股票 市场作为高风险高收益的投资领域,一直倍受投资者的关注,国外的研究者也先 后提出了一系列的定价理论和投资组合模型,如马柯威茨的投资组合理论,夏普 等人的c a p m ,以及罗斯的a p t 。然而,投资者们发现,虽然这些理论极大地开 阔和提高了投资者的思想理念及其对风险和收益的辨证理解,但对实际操作却缺 乏明确的指导例如a p t 模型给出了风险资产回报率与套利组合回报率之间的相 互关系,但对于如何寻找满意的套利组合却没有明确的方案。随后的研究者将计 量统计方法应用于股市建模,如多元回归、a r m a 以及g a r c h 等时间序列预测 模型。 从预测方法本身而言,股票价格预测模型可以分为两类,即定性预测模型和 定量预测模型。定性预测模型中以d e l p h i 法为代表,其在股票市场也有相近的用 法,如投资者在媒体上听各类股评家及机构对后市的预测,对投资者而言就相当 于作了一个d e l p h i 法的调查。定量预测模型中又可分为因果回归预测模型、时间 序列预测模型、非线性动力学预测模型、以时间序列驱动的各类人工智能技术预 山东师范人学颂i 二学位论文 测模型及智能预测支持系统等。其中时间序列预测模型、非线性决定性预测模型 以及以时间序列驱动的各类人工智能技术预测模型及智能预测支持系统等在股 票市场上最为常用。 从股票市场价格行为的特定对象而言,股票价格预测模型又可分为基本面预 测模型与技术面预测模型。基本面预测模型是指建立公司的股价与基本面因素如 利润、现金流、账面价值与市场价值比、公司规模等之间的因果关系预测模型。 这种预测模型基于因果辩证关系的哲学思想,认为事件之间总是存在着某种因果 关系。因此,要想知道结果的变化就得从原因变化入手,并且建立两者之间的联 系方程据此进行预测。技术面预测模型是指从历史的股价或成交量以及两者之 间的关系来预测未来股价的变化。主要有时问序列预测模型、非线性动力学预测 模型、以时间序列为驱动的人工智能技术以及智能预测支持系统等,具体如下所 述。 1 时间序列预测模型 时间序列是指按时间顺序排列的预测数据集。可分为单变量时间序列和多变 量时间序列两种。时间序列预测模型的基本思想是事物发展本身存在着一个延续 的发展过程,正确地识别这种发展模式可以用来预测事物未来的变化途径。在预 测时,依据表示事物状态的主要变量的历史数据,用统计学方法或系统辨识的方 法建立起描述事物迄今为止的变化规律的数学模型,并以此来推测未来。以单变 量时间序列为例,设x 是变量的当前值,则预测模型应为 x ( t ) = f ( x ( t - 1 ) , x ( t - 2 ) ,) ( ( t m ) )( 1 - 1 ) 时间序列预测模型还可分传统时间序列预测模型与现代时间序列预测模型。 传统时间序列预测模型有移动平均与分解模型、指数平滑模型等;现代时间序列 预钡9 模型则包括a r i m a 模型族、a r f i m a 模型、a r c h g a r c h 族、s v 模型等。 这类方法在中国股票市场预测问题研究中的应用也比较多。 2 非线性决定性预测模型 非线性决定性预测模型的建模方式亦是从时间序列中重构系统,但其预测思 想与时间序列预测模型截然不同。时间序列预测模型假设序列只具有线性相关的 随机序列,对未来的预测是根据相关性进行外推。而非线性决定性预测模型则认 为时序是由决定性动力学方程产生,下一时刻系统的状态是前一时刻的函数,因 2 山东师范大学硕l 学位论文 此只要找到这个函数,预测就能实现。由于观察值常常是系统的状态变量的时序 值,因此,预测的首要任务就是从时间序列中重构出系统动力学方程。近年来这 种预测方法在金融时问序列预侧上有不少应用,尤其是对汇率时序的预测。 3 神经网络预测模型 神经网络由于能够拟合任意的非线性曲线,并且具有较好的泛化能力,因此 自从它被引入到预测方法中,就一直是预测模型中一颗耀眼的星星。神经网络预 测模型的思想是在给定的预侧精度下通过给定的训练样本进行机器训练,建立输 出与输入之间的函数关系,即为预测方程。m a t s u b a 率先将神经网络引入股票市 场的价格预测上。 4 k 阶近邻预测模型( k - n e a r e s tn e i g h b o r ) 采用k 阶近邻预测模型进行预测是基于这样的基本思想,即历史在某种程度 上会重演。其具体做法为:把最后一些数据点作为参考集,它的长度定义为窗口 尺寸。把去掉最后一个数据时间序列称为截短时间序列( s h o r t e n e dd a t as 两c s ) 。为 了预测时序的下一点值,首先拿参考集与截短时序中同样长度的第一组数据集一 一称为侯选集进行比较,并计算出误差。然后,把侯选集向后平移一位,并与参 考集进行比较,得出第二个误差值,以此类推。接着把误差分类,这样就会得到 k 个误差最小的侯选集。最后把每个最小误差的侯选集后面的一个数据取到一 起,共有k 个数据点取其平均值即为最后预测值。 到目前为止,这种方法在股票市场预测中的应用还不多见。 5 智能化预测支持系统 预测支持系统是将计算机技术、人工智能技术与预m 技术相结合,能帮助人 们进行预测的软件系统。到目前为止,人们对预测支持系统进行了大量的研究并 取得了一些成就,智能化预测支持系统就是其中之一。智能化预测支持系统由智 能化问题定义、智能化模型选择、智能化预测结果调整三大智能子系统构成,并 可在系统中引入案例推理的方法来帮助完成问题定义,模型选择和结果调整通 用的智能化预测支持系统已经研制出来 时间序列关系模型与结构关系模型一般对被预测对象都有具体而且严格的 要求。这就要求我们在做预测之前,必须对被预测对象做深入系统的分析。只有 在确认某类预测模型的前提条件得到满足的情况下,才可以使用该模型进行预 山东师范大学硕j :学位论文 测,否则预测结果是不可靠的。股票市场作为现实经济运行状况的直接体现。其 影响因素如g d p 增长率、汇率及国内外政治形势等时常发生较大的变动,所以要 确定和修改模型的结构确非易事。另一方面,一般计量统计的时间序列模型很难 处理高度非线性的问题,而实际上股票市场与其影响因素之间存在着复杂的非线 性关系已有大量的实际数据表明,股票市场是一个具有混沌现象的非线性动力 系统。基于以上分析并考虑到传统模型的缺陷,本文采用神经网络这一处理工具 对股票市场进行预测分析,以期进一步拓展神经网络方法在股票市场上的应用。 1 2 国内外研究动态 计算智能技术的发展让研究者找到了新的问题解决思路,神经网络和进化计 算逐渐成为研究热点并不乏成功应用的例子,但由于其自身算法的一些缺陷,还 在不断完善和发展之中。在7 0 年代和8 0 年代对各种时间序列预测模型进行了大 量的实证研究,将预测目标的历史资料按照时间的顺序捧列成为时间序列,然后 分析它随时间的变化趋势,外推预测目标的未来值。这样,就把影响预测目标变 化的一切因素由“时间”综合描述。近年来时间序列研究的最新动态主要表现在 以下几个方面:对传统方法的改进,谱密度分析,小波分析和神经网络等方法越 来越受重视。由于时间序列预测是一种外推预测方法,它需要先对给定数据集建 立一个模型,然后利用该模型,对数据进行外推,所以当预测时间序列的将来值 时,必然要进行外推。因此,通常预测对将来的依赖就像它对过去的依赖一样, 我们应该根据新的信息,随时修正我们的结果,最好是根据不同的先验知识或条 件假设,得到一些不同的预测值,然后对这些结果进行分析。当然,当数据性质 突然发生交化或原来的结构遭到破坏时,短期预测可能会出现可怕的错误。相对 于传统方法,神经网络和进化计算的方法在这方面表现要好得多。 1 9 8 7 年l a p e d e s 等人首先应用神经网络进行预测,他们用非线性神经网络 对由计算机生成的时间序列仿真资料进行了学习和预测。由于人工神经网络是由 简单单元构成,具有良好的非线性品质,灵活有效的学习方式,对非线性系统具 有较强的模拟能力,所以,一经提出,人工神经网络预测方法就受到了高度的重 视。随后,w e r b o s 、v a r f i s 分别对实际的经济时间序列资料进行了预测研究。 w e i g e n d 等人将神经网络与回归方法作了比较,表明了神经网络预测优于统计预 4 山东师范夫学硕上学位论文 测。1 9 9 1 年,m a t s u b a 等人发表了有关应用神经网络进行股票预测的文章。 c h a k r a b o r t y 等人关于神经网络多变量时间序列预测的文章中,用简单的神经网络 模型进行了预测,结果比统计学方法好得多。基于树型结构的遗传编程( g e n e t i c p r o g r a m m i n g , g p ) s t 5 2 1 ,s 觚t i n i 等人关于预测领域的文章中也取得了很好的效 果,基因表达式编程( g e n ee x p r e s s i o np r o g r a m m i n g ,g e p ) 在结合了遗传算法 ( g e n e t i ca l g o r i t h m ,g a ) 和遗传编程( g e n ep r o g r a 咖i n g ,g p ) 思想的基础上正 式提出来的,它融合了遗传算法和遗传编程的优点,在表现形式上,g e p 继承了 遗传算法的定长线性编码简单快捷的特点和遗传编程的树型结构灵活多能的特 点,已有的研究成果表明在预测等方面都取得了比传统算法更好的结果;同时, 柔性神经树( f l e x i b l en e u r a lt r e e ,e q t ) 咖模型,凭借其较强的函数逼近能 力逐渐得到广泛应用,已有的研究成果表明在预测等方面取得了比其他算法更好 的结果。在优化算法上,遗传算法( g e n e t i ca l g o f i t h m ,g a ) ,免疫算法( i m m e n e p r o g r a m m i n g , i p ) ,粒子群优化算法( p a n i c l es w a r mo p t i m i z a t i o n , p s o ) ,禁忌搜 索算法( t a b us e a r c h ,t s ) 等。由于其不同的优化方法,在优化不同的结构时,也 会取得各自不同的效果。我们把神经网络结构与多种不同的优化算法进行了结合 并对结果进行比较。 嚣 1 3 常见几种预测法 人类的预测活动发展至今已有数千年的历史,有预测活动,就存在预测方法 的选择问题,预测方法多种多样,广义上可以分为定性预测和定量预测【6 】。 t 3 1 定性预测 定性预测指预测者利用以往的经验,凭借直觉做出的预感和猜测,其结果的 准确与否取决于预测者的知识和经验,带有较大的主观性,它主要包括专家调查 法、主观概率法、交叉影响法等,其中较为普遍采用的是美国兰德( r a n d ) 公司 于1 9 “年创造的德尔菲( d c l p h i ) 预测法,这是一种专家集体预测法,其在长 期预测中有着较好的效果。这种方法最后采用经典的统计方法处理专家们的意 见,专家意见的概率分布符合或接近正态分布。通常用于对社会和经济等领域内 山东师范大学硕l 学位论文 的一些大型复杂系统,以及一些关于未来发展趋势的长期预测在人们尚未完全 认识系统的运动规律之前,常使用定性预测方法。 1 3 2 定量预测 定量预测则是指将预测信息( 数据) ,按一定的数学模型,进行形式化的计 算,从而求出预测结果。由于定量预测通过建立数学或统计模型,利用模型对于 历史数据的拟合性来反映系统运行的规律性,并以此为基础预测今后的发展趋 势,因而在整个预测跨度区间内,系统的运行相对于既定的模型不发生大的结构 性变动是预测成功的先决条件。当预测时限较短,各种经济的、社会的、政治的、 技术的等等因素变化不大时,这时定量预测的准确性较高。常见预测方法有t 滑动平均法 用过去几期的平均值作为下一期的预测值。数学模型是: = ( s 卜l + 善。一2 + + 3 t - n ) n ( 1 - 2 ) 式中,s i 为t 时期的预测值,s 。l ,s 卜n 分别为t 1 时期,。t - n 时期的实 际值,n 是求平均值时所取实际值的个数。 指数平滑法 指数平滑法【7 】以滑动平均法为基础,分为一次平滑,二次平滑,三次平滑。 ( 1 ) 一次平滑,数学模型为: j j l = c z _ + ( 1 一口、j e t - 1 i( 1 - 3 ) 一d i ( i ) = s 盘 ( 1 - 4 ) 卧1 为t 时段指数平滑平均数( 右上角( 1 ) 表示一次平滑。下同) ,o ( o ,1 ) 为指数 平滑系数,两为t 时段的实际观察值,d ”i ( 1 为t + l 时段的预测值 6 山东师范大学碗l 学位论文 ( 2 ) 二次平滑,考虑预测是线性趋势时,数学模型为 s j 2 = c 嚣? + ( 1 一口) s 瘩 ( 1 - 5 ) a ,= 2 j j ”一s :2 ( 1 - 6 ) e = 口( j j “一砧) o - a ) ( 1 7 ) 科0 = 4 + e ( 1 8 ) 回归分析法 回归分析法又叫因果分析法【7 ) 1 1 1 ,即认为一个系统的发展演变主要由一个或 决定,通过观察这些因素的变化,来分析整个系统的演变和发展。其基本思想是: 虽然自变量和因变量之间没有严格的确定性的函数关系,但可设法找出最能代表 它们之间近似关系的数学模型即回归方程式,然后根据回归方程式计算所要求的 预测值。主要有一元回归和多元回归 一元回归法认为自变量和因变量之间是线性关系,设y = a + b x ,其中y 为预测目 标,x 为影响因素。据采集到的数据x i 、y i ,据最小二乘法,可求得: | , a 每一乃( 1 - 9 ) d d 拂嵯杠t 其中,;= 二1 。x ,歹= 丢只代入a , 由此还可推广到多元回归。 ( 1 - 1 m b 可求得回归估计值y 。 除此以外,常用的还有灰色预测法、b o x - j e n k i n s 方法、马尔可夫预测法、 投入产出法【3 1 等。 1 4 神经网络的发展及其在经济领域中的应用 人工神经网络就是指为了模拟生物大脑的结构和功能而构成的一种信息处 理系统或计算机。它是由大量类似于神经元的处理单元互相联接而成的非线性复 杂网络系统。它在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神 7 山东师范大学硕j 。学位论文 经网络处理、记忆信息的方式完成人脑那样的信息处理功能。神经网络的结构是 由基本处理单元及其互连方法决定的。 人工神经网络的研究始于2 0 世纪4 0 年代,经历了由兴起到衰退、又由衰 退到兴盛的曲折发展过程,这一发展过程大致可以分为以下四个阶段。 1 初始发展阶段( 2 0 世纪5 0 6 0 年代) 1 9 4 3 年心理学家w s m c c u l l o c h 和数学家w p i t t s 在研究生物神经元的 基础上提出了一种简单的人工神经元模型,即后来的m p 模型。在该模型中, 神经元的活动表现为兴奋和抑制两个状态虽然m p 模型过于简单。只能完成 一些简单的逻辑运算,但它的出现开创了神经网络研究的先河,为以后的研究提 供了依据。 2 低潮时期( 2 0 世纪6 0 7 0 年代) 由于受当时神经网络的理论研究水平所限及应用前景不明朗,加之受冯诺依 曼型计算机大发展的冲击等因素的影响,神经网络研究陷入了低谷。 3 复兴时期( 2 0 世纪8 0 年代) 美国加州理工学院生物物理学家j o h n j h o p p i e l d 教授在1 9 8 2 年和1 9 8 4 年先 后发表了两篇十分重要的论文,提出了h o p p i e l d 神经网络模型,引入能量函数 概念,这一成果的取得使得神经网络的研究取得了突破性进展,从而掀起了神经 网络研究的热潮。 4 发展高潮期 2 0 世纪8 0 年代中期以来,神经网络的应用研究取得了很大成绩,涉及面 非常广泛。为了适应人工神经网络的发展,1 9 8 7 年6 月在美国加州举行了第一 届神经网络国际会议,有一千多名学者参加,并成立了国际神经网络学会,后来 确定每年召开两次国际联合神经网络大会。进入9 0 年代后,随着i e e e 神经 网络会刊的问世,各种论文专著逐年增加,全世晃范围内逐步形成了研究神经网 络前所未有的新高潮。 我国学术界大约在8 0 年代中期关注神经网络领域,有一些科学家起到先导 作用,如中科院生物物理所科学家汪云九、齐翔林和姚国正等。1 9 8 9 年召开了 全国一个非正式神经网络会议,1 9 9 0 年我国的8 个学会联合在北京召开了神经 网络首届学术大会,这是我国神经网络发展以及走向世界的良好开端。我国“8 6 3 ” 3 山东师范人学硕| 。学位论文 高技术研究计划和“攀登”计划于1 9 9 0 年批准了人工神经网络的3 项课题 自然科学基金和国防科技预研基金也把神经网络的研究列入选题指南,许多全国 性学术年会和一些学术刊物把神经网络理论及其应用方面的论文列为重要,为神 经网络在我国发展创造了良好的条件。 实际上,股票市场作为高风险高收益的投资领域,一直倍受投资者的关注, 国外的研究者也先后提出了一系列的定价理论和投资组合模型,如马柯威茨的投 资组合理论,夏普等人的c a p m ,以及罗斯的a p t 。然而,投资者们发现,虽然 这些理论极大地开阔和提高了投资者的思想理念及其对风险和收益的辨证理解, 但对实际操作却缺乏明确的指导。例如a p t 模型给出了风险资产回报率与套利组 合回报率之间的相互关系,但对于如何寻找满意的套利组合却没有明确的方案。 随后的研究者将计量统计方法应用于股市建模,如多元回归、a r m a 以及g a r c h 等时间序列预测模型。综观以往的预测模型,我们大致可以将它们分为如下两类: 1 时间序列关系模型,在这类的模型中,被预测的对象的演变过程为一时间的 函数。 2 结构关系模型,这类模型的特点是,被预测的事物与其影响因素之间在一定 的时间内保持着某种固定的函数结构关系。 时间序列关系模型与结构关系模型一般对被预测对象都有具体而且严格的要求。 这就要求我们在做预测之前,必须对被预测对象做深入系统的分析。只有在确认 某类预测模型的前提条件得到满足的情况下,才可以使用该模型进行预测,否则 预测结果是不可靠的。股票市场作为现实经济运行状况的直接体现,其影响因素 如g d p 增长率,汇率及国内外政治形势等时常发生较大的变动,所以要确定和 修改模型的结构确非易事另一方面,一般计量统计的时间序列模型很难处理高 度非线性的问题,而实际上股票市场与其影响因素之间存在着复杂的非线性关 系。己有大量的实际数据表明,股票市场是一个具有混沌现象的非线性动力系统。 面对自然和社会经济现象中大量存在的非线性、非平稳的复杂动力系统问题,传 统的统计学预测方法解决这类问题效果欠佳。经济学家一直致力于研究股票市场 价格的变化,希望能从中找出一些规律,避免诸如股灾这种大的股市波动,从而保 持经济稳定。股票市场是一个复杂的非线性系统,同时受多种因素的交互影响, 对于股票未来价格的精确预测是非常困难的。股市预测被认为是当前时间序列预 9 山东师范人学硕 学位论文 测中最富挑战性的应用之一,受到了广泛关注。 以神经网络为代表的智能计算方法中,单个神经元有较简单却又反映非线性 本质特征的非线性核,通过这些基本的非线性核自组织复合,使其能够重建任意 的非线性连续函数。通过学习这一归纳过程,使得网络学习到序列的内在规 律,并用其较好的推广能力对未来进行预测。使用神经网络方法避免了繁琐的常 规建模过程,且神经网络模型有良好的适应和自学习能力、较强的抗干扰能力。 这使得神经网络在时间序列预测中颇受关注。自从1 9 8 7 年l a p e d e s 和f a t h e r 首 先应用神经网络进行预测以来,神经网络预测时闻序歹l j 方法受到重视。目前,己 有多种不同形式的神经网络被用于工业,经济等的预测中。研究结果表明,神经 网络用于预测效果较好,为一类高度非线性动态关系的时间序列预测提供了一条 有效途径。 基于以上分析并考虑到传统模型的缺陷,本文采用神经网络这一处理工具对 中国的股票市场进行预测分析,以期进一步拓展神经网络方法在股票市场上的应 用。 1 4 1 神经元及其特性 连接机制结构的基本处理单元与神经生理学模拟往往称为神经元。神经元是 神经网络操作的基本信息处理单位,每个构造起网络的神经元模型模拟一个生物 神经元,如图2 1 所示,它是人工神经网络的设计基础,具有三个基本要素: 一 图1 1 神经元模型 1 ) 突触或连接链:每一个都由其权值或强度作为特征,连接强度由各连接上的 权值表示。权值为正表示激活,为负表示抑制。 2 1 加法器:用于求输入信号被神经元的相应突触加权的和。 3 1 激活函数:用来限制神经元输出振幅,它将输出信号限制到允许范围之内的 一定值。通常,一个神经元输出的正常幅度范围可写成单位闭区间f o ,l 】或i - l , l 】 1 0 山东师范人学硕士学位论文 神经元模型也包括一个外部偏置,记为0 。偏置的作用是根据其为正或为 负。相应也增加或降低激活函数的网络输入 该神经元单元由多个输入,i _ l ,2 ,n 和一个输出y j 组成。中间状态由输入信号 的权和表示,而输出为: y j = ,【一够j i = i 其中, o j 为神经元单元的偏置( 阈值) ,i 为连接权系数( 对于激发状态,、 】:i i 取 正值,对于抑制状态,啊i 取负值) ,n 为输入信号数目,y i 为神经元输出,t 为 时间,f c ) 为输出变换函数,也称激发或激励函数。 q 4 2 激励函数 激励函数f ( ) ( a c t i v a t i o nf u n c t i o n ) ,其作用是是模拟生物神经元所具有的 非线性转移特性,用来限制神经元输出振幅。常用的激励函数; 1 ) 阈值函数 似,= 嚣意 如图1 2 ( a ) 所示 2 1 分段函数 “x ) = lx 2 1 圭( 1 + 曲一l x l ( 3 ) 0 x s - 1 一种常规的s 形函数如图1 删示,为:厂( 善) = r 告 o ( 1 【x f l 山东师范大学硕士学位论文 ,( 力 0 而 ( a ) - ,( 力 ( 砷 图1 2 激励函数 ji 1 f 0净 、 另一种是常用双曲正切函数如图1 2 ( c ) 所示,厂( d = 等1 坟x ) 学习速率渐小法 1 9 9 0 年由d a r k e nc h r i s t i a n 和m o o d yj o h n 提出的在训练期间减小学习速率p q 的方法。它适用于每个训练模式更新的b p 网络,因为人们知道开始学习时, 学习速率比较大,有利于加快学习速度,而快到极值点时,学习速率减小有利于 收敛。他们给出的学习速率变化规则为: 刁( 疗) = 叩( o ) “1 + ( 玎,) ) 常值参数r 能够被用于调节相对于整个训练周期的学习速率( 进度裹) 。在前r 学 习步之后,学习速率被这个更新规则减半。通过在训练期间用实行减小的学习速 率,大值和小值的优点能够通过对r 选合适的值被结合在一起,遗憾的是好的r , 只能够通过试凑寻找到。 ( 2 ) 自适应学习速率【3 1 l 1 9 8 9 年和1 9 9 0 年r s a l o m o n 用一种简单的进化策略来调节学习速率。其基本 指导思想是:在学习收敛的情况下,增大q ,以缩短学习时间;而当r l 偏大致使 全局误差不能收敛时,要及时减小i i ,直到收敛为止。 2 。4 2 附加动量法 当用b p 算法训练网络时,f i 越大,权重改变越大,但是,如果权重改变 过大,学习过程中会出现振荡而不收敛,权重过小,可能使网络不能收敛到全局 最小。为了避免这一现象,可采用附加动量项的方法 3 2 1 ,其具体做法是:将上一 山东师范人学硕e 学位论文 次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上,以作为本次 的实际权值调整量,即: ,( 一) = 一叩v e ( ,1 ) + a a w ( n 1 ) 式中n 为动量系数,通常o a 0 9 。 2 5b p 神经网络的泛化能力 学习不是简单的记忆已学过的输入,而是通过训练样本学习隐含在样本中的 有关系统本身的内在规律性,从而对未出现在训练集中的输入也能给出正确反 应。泛化( g e n e r a l i z a t i o n ) 能力( 推广能力) 是指经训练( t r a i n ) 后的网络对同一样本 集中非训练样本仍能给出正确的输入输出关系的能力田,一个“过度拟合” ( o v e m t t i n g ) 的神经网络虽然会对训练样本集达到好的拟合,但对于一个新的输入 样本却会产生与目标输出矢量差别较大的输出。在应用神经网络进行预测时,我 们的目的是使神经网络不仅能对己训练过的样本有好的拟合性,更重要的是当输 入新样本时,其输出的预测值与真实的观察值之间的误差要尽可能的小,即既能 拟合训练样本,又能对新数据进行预测。神经网络的泛化能力是人们最关心的问 题,没有泛化能力的神经网络是没有价值的由于泛化问题的重要性,它己经成 为近年来国际上十分关注的理论问题,也引起了国内一些学者的注意【3 ”目前, 已经出现了一些提高神经网络的泛化能力的算法。口习 山东i 1 1 i 范人学硕i :学位论文 预测 第3 章基于b p 神经网络的股票市场 神经网络具有并行处理、自适应、自组织、联想;己忆及容错和鲁捧性等特点。 任何一个时间序列都可以看成是一个由非线性机制确定的输入输出系统,神经网 络理论中的k o t m o g o r o v 连续性定理1 4 ,从数学上保证了神经网络用于时间序 列预测的可行性。用神经网络对时间序列预测,容许数据中带有较强的噪声,这 是其它方法所不能比拟的。 总的来说,人工神经网络是一个具有高度非线性时间动力系统。较其他预测 方法而言,神经网络能从数据样本中自动地学习以前的经验而无需繁复的查询和 表述过程,并自动地逼近那些最佳刻画了样本数据规律的函数,而不论这些函数 具有怎样的形式,且所考虑的系统表现的函数形式越复杂,非线性程度越高,神 经网络这种特性的作用就越明显。 3 1 基于b p 神经网络的预测 采用b p 神经网络用于非线性时间序列预测的特点是:学习过程由信号的 正向传播与误差的逆向传播两个过程组成,它较好地揭示了非线性时间序列的内 在相关性,信息损失较少,易于达到预测目的。又由于预测中,所有的信息均来 自单一的序列,所以在应用中一般使用反向传播方向来进行有记忆地训练和预 测,可以较好地揭示非线性时间序列在时延状态空问中的相关性,从而达到预测 目的。 神经网络用于时间序列预测,是指利用神经网络去逼近一个时间序列或者一 个时间序列的变形,可用时间序列的前m 个值( ) ( ( t o , x 0 - 2 ) ,) ( ( c - m ) ) 去预测 下s 个值x ( t ) ,x ”1 ) ,, x ( t + s - 1 ) 。具体说来,就是用一个结构为:m 巾s 的神经 网络来拟合或逼近函数: t ( ) ( ( t ) ,) ( ( t + 1 ) ,x ( t + s - i ) ) - 2 f ( x ( t - 1 )

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论