(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf_第1页
(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf_第2页
(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf_第3页
(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf_第4页
(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(计算机应用技术专业论文)基于神经网络的绩优股票走势分析系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着经济的发展和人们投资意识的增强,股票己成为现代人生活中的 一个重要的组成部分。投资收益与风险往往是成正比的,为了趋利避害, 投资者们一直在寻找有效的股票分析方法和工具。因此,股市内在规律的 研究具有极其重要的理论意义和应用价值。 本文就应用神经网络技术来预测股票走势,提供股票操作支持的这一 课题进行了深入的探索和研究。设计和实现了个基于神经网络的股票预 测系统。首先,对目前所采用的股票预测研究方法作了简要介绍,给出了 现存各类股票分析方法的优缺点。然后,对多层前馈神经网络和遗传算法 作了详细的描述,指出了神经网络在实际应用中存在的问题,利用改进的 神经网络分类器方法,提高了神经网络的收敛速度和可信度。在此基础上, 提出了一种基于多神经网络集成的股票走势类型预测方法,应用在股票分 析和股价走势预测的方法,将改进的神经网络分类器应用于多神经网络集 成的股票走势类型预测方法中,从而根据系统输出结果进行股票操作决策 支持,并且更进一步提高了系统的预测精度。 本文分别对神经网络算法的选取,预测模型的建立,系统结构的设计 以及系统功能的实现作了详细的阐述。并采用s u a lc + + 6 0 与m a t l a b6 5 开发了一个基于神经网络的股票走势类型预测的绩优股票预测平台,实现 了一个具有较高可信度的股票预测系统雏形。 关键词股票走势;神经网络;遗传算法;分类;可信度 燕山大学工学硕士学位论文 a b s t r a c t w i t ht h ee c o n o m i cg r o w t ha n dt h ec o n v e r s i o no fp e o p l e si n v e s t m e n t c o n s c i o u s n e s s t h es t o c kh a sb e c o m e 锄i m p o r t a n tp a r to fp e o p l e 。sl i f ei n m o d e mt i m e t h eg o o dp r o c e e d sa r eb a s e do nt h eh i 曲r i s ko ff a i l u r e i no r d e r t og a i l lg o o dp r o c e e d s 、:l ,i ml o wr i s k , i n v e s t o r sa l w a y sw a n tt ol o o kf o re f f e c t i v e a n a l y t i cm e t h o d sa n dt o o l s t h e r e f o r et h es t u d ya n dp r e d i c t i o no f d i s c i p l i n a r i a n i ns t o c km a r k e th a v eg r e a tt h e o r e t i c a ls i g n i f i c a n c ea n da p p l i c a b l ev a l u e t h ea p p l i c a t i o no f n e u r a ln e t w o r k st of o r e c a s tt h es t o c kt e n d e n c y p r o v i d e o p e r a t i o n a ls u p p o r tt ot h es t o c kt h i st o p i cc o n d u c t e di n d e p t he x p l o r a t i o na n d r e s e a r c hi s p r o p o s e d i nt h ep a p e r d e s i g na n di m p l e m e n t a t i o no fas t o c k f o r e c a s t i n gs y s t e mb a s e do nn e u r a ln e t w o r k f i r s t l y ,ab r i e f i n t r o d u c t i o na b o u t w i d e l ya d o p t e df o r e c a s t i n gm e t h o d si sp r o p o s e da n dt h e i ra d v a n t a g e sa n d d i s a d v a n t a g e sa r ea n a l y z e di nt h ep a p e r t h e n , ap a r t i c u l a rd e s c r i p t i o na b o u t m u l t i l a y e rf e e d f o r w a r dn e u r a ln e t w o r k sa n dg e n e t i ca l g o r i t h ma r ep r o v i d e d t h ep r a c t i c a la p p l i c a t i o no fn e u r a ln e t w o r kc l a s s i f i c a t i o nm e t h o da r ep o i n t e d o u tt oo p t i m i z en e u r a ln e t w o r k si no r d e rt oi m p r o v et h es y s t e m sp r e c i s i o na n d r e l i a b i l i t y b a s e do ni t , ab a s e do nm u l t i - n e u r a ln e t w o r ki n t e g r a t i o ns t o c k t e n d e n c yt y p e f o r e c a s tm e t h o df o rp r e d i c t i o no fs t o c ka n a l y s i sa n ds t o c k m o v e m e n t sa r ep r o p o s e du s e di m p r o v et h en e u r a ln e t w o r kc l a s s i f i c a t i o na p p l y i nt h em u l t i - n e u r a ln e t w o r ki n t e g r a t i o ns t o c kt e n d e n c yt y p ef o r e c a s tm e t h o d t or e a l i z e dt h eo p e r a t i o nf o rs t o c kd e c i s i o ns u p p o r ta c c o r d i n gt ot h er e s u l t so f s t o c ka n dt h ef u r t h e ri n c r e a s e dt h es y s t e mf o r e c a s tp r e c i s i o n ab a s i cm o d e lo fs t o c kf o r e c a s t i n gs y s t e mi si m p l e m e n t e di nt h ep a p e r t h ea l g o r i t h ms e l e c t i n g ,d e c i s i o ns u p p o r tm o d e lb u i l d i n g ,s t r u c t u r ed e s i g n i n g a n df u n c t i o na c h i e v i n ga r ea n a l y s e d a ne x c e l l e n ts t o c kf o r e c a s t i n gp l a t f o r m b a s e do nn e u r a ln e t w o r kc l a s s i f i c a t i o nw i m s u a lc + + 6 0a n dm a t l a b6 5i s a b s t r a c t d e v e l o p e da n dah i e , h e rr e l i a b i l i t yo ft h ee m b r y o n i cs t o c kf o r e c a s t i n gs y s t e mi s a c h i e v e d k e y w o r d ss t o c kt e n d e n c y ;n e u r a ln e t w o r k s ;g e n e t i ca l g o r i t h m ;c l a s s i f i c a t i o n ; r e l i a b i l i t y 1 1 1 燕山大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文基于神经网络的绩优股 票走势分析系统研究,是本人在导师指导下,在燕山大学攻读硕士学位期 间独立进行研究工作所取得的成果。据本人所知,论文中除已注明部分外 不包含他人已发表或撰写过的研究成果。对本文的研究工作做出重要贡献 的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由 本人承担。 作者签字腹、酽锄易 日期:弘7 年中月日 燕山大学硕士学位论文使用授权书 基于神经网络的绩优股票走势分析系统研究系本人在燕山大学攻 读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归 燕山大学所有,本人如需发表将署名燕山大学为第一完成单位及相关人员。 本人完全了解燕山大学关于保存、使用学位论文的规定,同意学校保留并 向有关部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人 授权燕山大学,可以采用影印、缩印或其他复制手段保存论文,可以公布 论文的全部或部分内容。 保密口,在年解密后适用本授权书。 本学位论文属于 不保密区 名:犟弓绎 作者签名:钕7 怍 ,l l 聊躲啡彩 日期:办一年彩月扣日 日期:舯月纠筘 第l 章绪论 第1 章绪论 1 1 股票研究的背景及意义 股票市场是经济的“晴雨表”和“报警器”,其作用不仅被政府所重视, 更受到广大投资者的关注。对股票投资者来说,未来股价变化趋势预测越 准确,对利润的获取及风险的规避就越有把握。对国家的经济发展和金融 建设而言,股票预测研究同样具有重要作用。因此对股票内在性质及预测 的研究具有重大的理论意义和诱人的应用前景。 截至至t j 2 0 0 4 年l o 月,中国境内的上市公司已达13 8 7 家,总股本己经达 n 71 3 4 9 8 亿股,市场融资总额己达1 13 1 4 0 8 亿元,在美国股市中,这一过 程却经历了将近1 0 0 年时间。然而进入2 1 世纪以后的中国股市,几乎一直在 危机的状态运行。随着时间的推移,危机正在呈现出逐步扩散的态势和日 益加深的走势。从总体上来说,中国股市现阶段的生存危机是一种复合危 机,是由多种因素组合并且具有多重影响的深层次制度危机。正可谓“冰 冻三尺非一日之寒”,中国股市的基本制度缺陷在长时期中被忽视、被容忍、 被放纵,使得市场中的消极因素日益累积、相互交织,积极因素不断削弱、 相互掣肘,以至于最终演化为危及股市根基的全面生存危机。 股票市场的发展为中国的经济体制改革注入了巨大的活力,并且成为 中国经济高速成长的重要的动力源泉。股市在现代市场经济中具有不可忽 视、不能轻视和无法替代的地位与作用,特别是在我们这样一个处于体制 转轨时期的国家与经济来说,就更是如此。没有好的股市就不可能有好的 银行,没有好的银行就不可能有好的金融,没有好的金融就不可能有好的 经济。 总之,股票市场作为社会主义市场经济的重要组成部分。为我国的经 济发展发挥着重要的作用。研究股票的预测能够指导投资者进行有益的投 资,不仅可以为个人提供利润,更可以为国家经济的发展做出贡献。 燕山大学工学硕士学位论文 1 2 股票投资方法及股票预测研究现状 本节中详细地介绍了常用的股票投资的方法,并对股票预测研究现状 作了简要的描述。 1 2 1 常用股票投资分析方法 股市分析方法是分析和预测股价变动方向和趋势的方法,可分为:基 本分析法、技术分析法和组合分析法三大类。 基本分析是对上市公司的经营业绩、财务状况,以及影响上市公司生 产经营的客观社会经济环境等要素进行分析,通过分析影响股票价格的基 本条件和决定因素,判断和预测其发展趋势。基本预测主要包括宏观经济 运行分析、行业分析和公司分析三个层次。基本分析能够比较全面地把握 证券价格的基本走势,并且应用起来比较简单。但是基本分析对市场的反 应比较迟钝,因此对市场的短线操作缺乏指导意义;它对市场预测的精确 度不如技术分析,特别是在中国这样一个不成熟的股票市场,股民对统计 资料和市场消息的获取上具有明显的滞后性,对统计数据的整理、归纳需 要较高的分析能力和专业技巧,对普通散户投资者而言,要想熟练的利用 基本分析法指导日常操作还是比较难的。 技术分析是利用统计学、数学的方法分析股票价格的运动规律,把握 股票价格的过去变动情况来推测其未来趋势。相对基本分析而言,技术分 析具有一定的优点。 ( 1 ) 技术分析方法简单方便、易学易懂,在电脑及软件发达的今天容易 被人们接受。 ( 2 ) 技术分析是一种理性分析结论比较客观,图表上显示的各种买卖讯 号,不可能因主观意愿而改变,使人们在瞬息万变的股票市场保持客观冷 静的态度。 ( 3 ) 技术分析以多种图表、指标为手段,有具体的形象可供参考,有一 定的标准可供遵循,并可进行多重对比分析,有利于从整体上把握市场。 技术分析也同样存在局限性。 2 第1 章绪论 ( 1 ) 技术指标讯号的出现往往“滞后”,因为并非技术分析描述出市场 走势,而是市场走势给技术分析提示,如果投资者根据某些滞后的讯号采 取行动,往往会错失良机。 ( 2 ) 市场经常出现短期“背离走势”,甚至时有“走势陷阱”出现,令 投资者对此产生不信任甚至上当受骗。 ( 3 ) 技术分析不可能正确预测每次波动的最高点与最低点,同时对具体 时间也无法给予明确信号。 组合分析法则是将基本分析法和技术分析法二者结合起来的一种方 法。在中国股票市场上进行股票投资,在运用技术分析指导市场的同时, 不应忽视对基本因素的分析,特别是中长线投资者,应将基本分析与技术 分析结合起来,完全不理会基本面,也是片面的。 在入市时机的选择问题上,基础分析从当前的宏观经济状况及上市公 司的财务状况给出大势的基本面分析,技术分析则可在合理价位的判断方 面给出投资决策的参考,而挑选盈利的股票组合则非组合分析莫属。 目前,一般投资者看到的,以及股票市场预测专家所运用的大多是这 三种分析工具。这三种分析方法不需要高深的理论和文化水平,因此被投 资大众看中并运用到投资决策中。但是,真正研究股市的学者决不限于用 这些分析方法。 1 2 2 股票预测研究现状 自股票出现以来,股票预测便受到学术界的广泛关注与积极研究,国 内外许多学者对其进行了硪究,提出了许多预测分析方法。 ( 1 ) 时间序列分析法时间序列分析法【l 翔是通过建立股价与综合指数 的时间序列辨识模型,如传统的随机游走模型( r 啪,自回归移动平均模型 ( a r m a ) ,其次非平稳模型( a l m 讧a ) 等来预测未来股价变化。它包括两种 类型:单变量与多变量。单变量模型对于短期预测具有良好的效果,但需 要大量数据,并且模型结构与参数的选取是非常复杂的过程;多变量模型 例如:r e g r e s s i o n a n a l y s i s 。总之,此种分析方法只适用于短期预测,当预 测周期变长,其准确性急剧下降。 燕山大学工学硕士学位论文 ( 2 ) 人工智能方法近年来的研究热点,自2 0 世纪9 0 年代初至今,人工 智能得到了很大的发展,特别是神经网络的研究取得了划时代的发展,并 且应用于各个领域。在金融领域,以欧美为中心,很多学者开展了神经网 络的研究与应用。t k i m o t o ,k a s a k a w a 3 4 j 等人于1 9 9 0 年开发t t o k y os t o e l 0 5 。使用这种策略可以使得在搜索初期时在较大范 围内产生新个体,在搜索后期不至于过多地破坏好的个体。 当两个父代染色体长度不一致时,随机地补上相应长度的数值域,然 后进行自适应凸交叉操作。交叉后隐层节点数根据四舍五入法则取整,并 由其确定相应长度的权值域,使得网络权值的数量与网络结构相符。 变异算子采用动态变异算子进行变异。父代染色体为x 则子代染色体 为: x = x + a ( t ,1 一翼)或x = x 一o ,x + 1 ) ( 3 4 ) o ,”随代数t 增加丽趋于0 ,其形式如下: t a ( t ,y ) = y ,( 1 一圭) 6( 3 5 ) 式中,y 是x 的最大变化范围,r 是0 到1 之间的值,r 为最大代数,b 为 参数。函数( f ,y ) 返回。州之间的一个值,并且o ,y ) 随t 增加而趋于o o 是代数) 。函数的这个性质使得初始迭代时,搜索均匀分布在整个空问,而 燕山大学工学硕士学位论文 到后期则分布在局部范围内,不至于破坏后期产生的优良个体。变异算子 对个体的所有权值部分作变异,而不对个体的隐层节点数部分进行变异。 经变异后,染色体的长度随网络结构的变化而发生改变,在染色体的 尾部进行插入或删除操作,使之与相应的网络结构相符。插入的权值为随 机产生的实数。 选择函数采用交叉和变异并行处理的方式,即将交叉、变异算子分别 对父代个体进行操作,产生交叉子代和变异子代,然后采用两两竞争策略, 在交叉子代、变异子代和父代较优个体库中选出较优个体形成新的子代种 群。这样,既充分保留了父代个体好的基因类型,保持了交叉寻优的速度, 又降低了变异算子的破坏力,同时保证种群多样性,进而提高g a 的寻优 性能。然后,将新的子代种群的适应度从大到小排序,再执行适应度比例 选择。这样既有利于进化后期保持群体多样性,又避免选择概率与适应度 偏离的问题。如果误差满足精度要求或者超过给定的迭代次数则结束,所 得个体即为所求,它表示一个具有最佳权值分布、性能最优的三层前向网 络模型。 3 2 2 优化的神经网络的基本步骤 系统中使用的改进遗传算法优化的神经网络( g h n n ) 的基本步骤。 第一,根据编码方案及初始种群选择策略生成一定大小的初始种群。 第二,将由码串表示的每个个体反编码为相应的三层前向神经网络, 用所有训练样本对群中个体所代表的神经网络进行前向计算,获得每个个 体对应的输出,再根据样本的期望输出计算出整个样本集的均方误差,根 据式( 4 4 ) 确定出个体适应度值。 第三,根据适应度值采用轮盘赌选择策略,从当前代中选择较优个体 根据式( 3 2 ) 、( 3 3 ) 、( 3 4 ) ,分别对其进行交叉变异操作产生交叉变异子代, 再根据选择算子确定下一代种群。 第四,重复第二、第三,直到种群中适应度最大的个体的性能指标e s , 其中s 为期望的网络性能指标,则该个体即为所求。它表示一个具有最佳权 值分布、性能最优的前向网络模型。 第3 章股市预测及股票走势分类 3 3 股票走势分类识别方法的选用 把股票走势划分为不同的类型,利用神经网络的分类能力,对股票的 走势进行分类识别。在识别系统中,分类器通过其拓扑结构和内置参数在 股票走势的特征定义了一组教师信号,利用这组教师信号将股票走势划分 为不同的类,然后利用神经网络对股票走势迸行分类预测,从而达到分类 的目的。由于股票走势的特征分布十分复杂,目前还没有找到完全可分的 股票走势特征映射。 3 3 1 分类器概述 ( 1 ) 基于距离的分类器距离分类器作为一种直观有效的分类方法,在 实际应用中受到广泛重视,尤其在高维多类型问题,使用聚类等分类方法 存在计算量巨大、难以保证算法收敛等问题,距离分类器更显示出它的优 越性。 ( 2 ) 模糊识别分类器类型识别中广为运用的统计方法与人脑识别相 比,差别很大,且在分类上十分复杂,需要描述的特征过多的情况下,其 效果不能令人满意。模糊数学的显著特点是它能更自然更直接的表达人类 习惯使用的逻辑含义,很适用于直接的或高层的知识表示,因此,模糊概 念的类型识别已成为智能科学前沿领域的有效工具之一。 ( 3 ) 人工神经网络分类器( a n n 分类器)人工神经网络是仿生学的产 物,它由神经元结构模型、网络连接模型、网络学习算法等几个要素组成, 通过网络节点阃的连接来存储信息并完成分类计算。从网络的结构划分, 人工神经网络有许多不同的种类,如感知器、b p 网、k o h o n e n 网、h o p f i e l d 网、s o f m 网以及a r t 等等。 人工神经网络由于其良好的容错性、自适应及模仿人脑智能等方面的 能力,使基于神经网络的识别方法可以处理一些环境信息十分复杂,背景 知识不清楚,推理规则不明确的问题,而这些正是股票走势识别所需要的。 目前,神经网络已在类型识别领域得到了广泛应用,其中b p 网络是当前 应用最为广泛的一种神经网络。神经网络分类器的输入就是所提取的股票 燕山大学工学硕士学位论文 市场的数据,输出则是一个衡量股票走势的数值。由于股票市场环境复杂, 如果直接将人工神经网络理论用于股票走势的分类预测,则输出的将会可 信度很低,所以采用分类器集成的思想,设计多个神经网络进行分类。为 了解决b p 网络收敛速度慢、容易陷入局部最小点等不足,将遗传算法( g a ) 同b p 算法结合,通过g a 优化b p 网络的权值和结构,使识别达到近似最 优。由于遗传算法采用全局优化策略,将b p 网络同g a 算法结合可兼有 神经网络的强学习性和鲁棒性和g a 算法的快速、强全局随机搜索能力。 ( 4 ) 支持向量基分类器支持向量机( s u p p o r tv e c t o rm a c h i n e ,简称 s v m ) 是目前机器学习界的研究热点,它的理论基础来自于v a p m k 等提出 的统计学习理论。s v m 专门针对有限样本情况,得到的是全局最优解,解 决了在b p 算法中无法避免的局部极值问题【2 8 】。 本文采用人工神经网络分类器( a n n 分类器) ,把股票走势划分为不同 的类型,使用历史数据对这个分类器进行训练,通过训练的网络就可以用 来对未来的股票走势进行预测。 3 3 2 多分类器的集成 多年的研究结果表明,基于单个分类器不能从根本上提高系统性能, 应依靠多个分类器的识别结果进行集成。综合集成方法论( m e t a s y n t h e s i s ) 是为了解决开放的复杂巨系统问题而提出的,它为人工智能,特别是类型 识别领域的研究注入了新的活力 3 2 1 。 在进行分类器集成时,通常采用的方法有线性模型和神经网络模型。 根据集成结构的不同,多分类器集成可分为三大类: ( 1 ) 层叠式集成( c a s c a d i n g ,多个集成判决) ; ( 2 ) 级联集成( h i e r a r c h i c a l ,树状) : ( 3 ) 并行集成( p a r a l l e l ) 。 运用这三种基本的结构,可以建立相当复杂的分类器集成系统 3 3 , 3 4 1 。 在并行结构中,所有的分类器将独立地使用,它们的结果由集成判决 器来集成判决。大多数的集成方法是属于这一类的。常用的并行分类器集 成方法有择多判决法( 投票法、计分法等) 、概率法、贝叶斯估计、d s 证 第3 章股市预测及股票走势分类 据推理法、模糊推理法以及将分类结果作为一种新的输入特征的神经网络 组合方法等等。 3 3 3 股票走势分类方法 股价在每个交易日内瞬息变化,预测这种瞬时变化是十分困难的,也 无多大意义。通过大量的研究,证明预测未来某个时间的股票价格也是很 困难的,结果误差较大,没有进行股票操作的意义。本文考虑将股价在一 段时间内的走向作为一个类型并进行分类处理。根据股票价格的走势,把 股票价格走势分为以下4 种类型如图3 1 所示。 图3 - 1 股票走势分类 f i g u r e3 - 1c l a s s i f i c a t i o no f t h es t o c k t r e n d 首先,确定网络训练教师信号的值,网络根据教师信号的值,通过学 习确定网络的最佳的参数。 a 类:上升拐点( 买点) :教师信号为:0 0 5 : b 类:上升:教师信号为:o 2 ; c 类:下降拐点( 卖点) :教师信号为:o 9 5 ; d 类:下降:教师信号为:o g 。 燕山大学工学硕士学位论文 重点是确定上升拐点和下降拐点,只要能够确定这两个点就可以对这 支股票进行适当的操作,所以,这两种股票走势类型教师信号的选取在输 出信号范围的两端起加强作用。 首先,使用一般的股票预测方法,应用b p 神经网络进行股票预测训 练,确定神经网络权值及神经网络结构,再运用改进的神经网络方法进行 训练,比较两种方法的优劣。然后,运用对股票走势进行分类的方法,进 行神经网络的训练和预测,验证其可行性。再对股票走势分类方法进行改 进,并使用改进的股票走势分类方法进行股票走势预测。最后,选取改进 的股票走势分类方法和一般的股票预测方法,分别对真实的股市走势进行 预测,根据它们的预测结果,进行综合分析和评价,得到一个可信度较高 的结果,进而根据得到的结果对这只股票进行适当的操作。 3 4 本章小结 本章提出了股市所具有的特点以及给股票走势预测带来的困难。首先, 因为它很难从数学的角度建立股票市场运作的模型,而神经网络所具有的 一系列特点显示了它能够提供一条用来进行股市预测的新路。然后,对所 遇到的问题作了详尽的分析。进而提出了使用遗传算法对神经网络进行优 化的方法。最后,本文提出了利用神经网络分类器方法对分类后的股票走 势进行预测的方法,利用神经网络对股票走势的类型进行学习,提高了网 络的收敛速度和系统预测可信度。 第4 章系统设计与实现 4 1 前期准备 第4 章系统设计与实现 前期准备主要是对系统的需求分析,开发工具的选取以及算法的选取 做详细的论述。 4 1 1 系统需求分析 股票市场是一个极其复杂的动力学系统。高噪声、严重非线性和投资 者的盲目性等因素决定了股票预测的复杂性。而股票市场是金融市场的重 要组成部分,股票数据的分析和预测具有重大的理论意义和应用价值。 本文中所设计的实际股票预测系统,针对国内股票进行股价预测,以 供股票投资者进行操作,而达到提高盈利,降低投资风险的目的。 系统的主要功能主要包括以下几个方面: ( 1 ) 数据管理由于本系统只针对特定的股票,数据从数据库中读取已 经从网上下载下来的数据或者直接从网上读取并显示。数据读取包括了程 序配置o d b c 数据源,系统建立或断开与数据库的连接以及对新兴铸管股 票数据的导入、删除及更新。 ( 2 ) 参数的确定训练应用两种算法根据教师信号进行训练,在训练结 束后确定b p 神经网络权值,检验优化的神经网络的训练结果应用在股市 预测中的可靠性。 ( 3 ) 预测结果预测结果是对历史数据进行训练完成后的输出,使用优 化后的神经网络参数对新的数据进行预测并显示预测值。 4 1 2 神经网络用于股市预测的一般流程 开始确定要预测某个序列时,一般并不知道它的维数是高还是低,如 果维数为无穷大,则它是完全随机的,那么无论神经网络规模多大都不能 燕山大学工学硕士学位论文 得到很好的预测,在这种情况下将表现出训练的失败。而混沌时间序列【3 6 】 就不同了,混沌至少在未来短的时间内是可以预测的。只要选择好神经网 络模型,是可以完成样本的训练的。 下面给出本文利用神经网络进行股票走势预测的流程d 5 , 3 6 】。 第一,确定网络结构,即确定输入层节点数( n ) 、输出层节点数( m ) , 隐含层数以及每个隐含层的节点数; 第二,对股票价格走势样本进行分类; 第三,选择适当的算法训练网络,使该网络尽量拟合学习段时间序列; 第四,用检验段数据检验训练好的网络。如果效果很好,便可以利用 训练好的网络对未来股市进行预测。 如图4 - 1 所示,股市预测分为训练和预测两个基本步骤。 e f k ) 图4 1 股市预测流程 f i g u r e4 - 1f o r e c a s t i n gp r o c e s s 4 1 3 开发工具 设计和开发神经网络,必定会涉及到大量的有关数值计算等问题。尽 管现代数值计算理论已经发展到很完善的地步,但是利用计算机对神经网 络模型进行仿真和辅助设计时,仍然是件很繁琐的事情。 考虑到m a t l a b 提供了必要的工具箱及大量的函数调用,具有很强的计 算机语言图形处理功能,并能提供有关数值计算、控制系统仿真、信号处 理、模糊逻辑系统辨识等方面的十几个工具箱,为众多领域的研究开发提 供了方便的条件。因此本课题采用m a t l a b6 5 与v i s u a lc 抖6 0 ( v c + + ) 混合 编程【3 7 。9 】的方式来综合利用它们的优点。 ( 1 ) m a t c o m 方法可以通过在m a t c o m 中f i l e 菜单下的c o m p i l e t o e x eo rd l l 调用m 文件编译,把需要的c p p 、e x e 、d l l 文件加到v c + + 开发环 第4 章系统设计与实现 境的工程中,再包含头文件就可以实现调用。还有一种v i s u a lm a t c o m 的方式,这种方式操作更加简便易行,只需要熟悉m a t l a b 编程,经过简单 的步骤就可以轻松实现v c 环境中调用m a t l a b 。 ( 2 ) m a t l a ba d d i n 方法通过m a t l a ba d d i n 实现它与v c + + 混合编程。 ( 3 ) v c + + 和m a u a b 的接口原理v i s u a lc + + 应用程序将命令或数据发 送给m a t l a b 自动化服务器,m a t l a b 自动化服务器根据v i s u a lc + + 应用程序 发来的命令请求执行,并将执行结果以字符串的方式输出给v i s u a lc + + 应 用程序。 4 1 4 算法的选取 4 1 4 1 标准b p 算法本系统选用b p 算法的目的在于用它与改进的遗传 算法优化的神经网络做比较。传统的b p 算法在实际的应用中是很广泛的, 股票预测这个课题,大部分都是应用b p 算法来实现的。在实际的训练过 程中,b p 算法也表现出它的稳定性。 4 1 4 2遗传算法优化的神经网络本系统选用遗传算法优化的神经网络 的目的是为了验证该算法在股票走势预测中的有效性。通过它与b p 算法 做比较,说明这个方法的优越性。 4 1 5 研究对象的选取 在股票市场中存在这样一些股票,即那些过去几年经营业绩都十分突 出的股票,我们称这样的股票为绩优股。一般这类股票其行业前景较佳, 每年可维持一定的成长性,股息分配也可保持较优厚水平。通常这类股票 为长期投资者所喜受,是股市的中流砥柱,由于其稳定性,适合利用神经 网络来进行学习与预测。 新兴铸管( 股票代码0 0 0 7 7 5 ) 是国内规模最大、规格及品种最全、管件 配套的离心球墨铸铁管生产基地,其主导产品离心球墨铸铁管占据国内市 场半壁江山。从盈利能力来看,新兴铸管是一支稳健的绩优股,自1 9 9 7 年上市以来,新兴铸管主营业务收入和净利润复合年增长率均在2 0 以上, 是当之无愧的绩优股。从股价表现来看,该股历史最高价是2 0 7 0 元,出 燕山大学工学硕士学位论文 现在上市之初的1 9 9 7 年6 月。1 9 9 8 年8 月至今,股价主要在8 3 0 一1 6 2 0 元区间波动。现行新兴铸管静态市盈率在2 1 倍左右,所以新兴铸管是一只 价值型股票。由此可知,该股票是一只稳定的价值型股票。因此选择新兴 铸管作为实验对象。 4 2 数据库的设计 本系统所使用数据库名称为s t o c k d b ,其中包括两个表,用于存储股 票原始数据以及神经网络的权值和阀值信息。表格的结构及每个字段代表 的意义如表4 1 、表4 2 所示。 ( 1 ) 表名称为新兴铸管的股票代码:0 0 0 7 7 8 表结构及字段意义如表4 1 所示。 表4 - 1 历史数据表格 t a b l e4 - 1t a b l eo f h i s t o r yd a t a 列名数据类型长度意义 d a t ec h a t1 0 日期 b e g i n 5 开盘价 h i e , h e s t 5 最高价 l o w e s t5最低价 a c t u a l p 5 收盘价 v o l u m c n b i g i n t 8 成交量 ( 2 ) 表名称w e i g h l t h r e s h o l d 表的结构及字段意义如表4 2 所示。 表4 - 2 参数表格 冶6 l e4 2 西6 l eo f p a r a m e t e r 列名数据类型长度意义 i nt oh i d e w e i g h t1 0输入层到隐含层权值 h i d e t o _ o u t w e i g h t 1 0 隐含层到输出层权值 h i d e t h r e s h o l d 1 0 隐含层阀值 第4 章系统设计与实现 4 3 数据源管理的实现 本节主要介绍数据管理的具体实现的方法。 4 3 1 配置数据源 v c 程序和数据库连接有两种方法第一种是手动配置o d b c 数据源, 但是这项工作比较繁琐,而且可移植性差。本文采用程序配置o d b c 的方 法主要用到o d b ca p i 函数s q l c o n f i g d a t a s o u r e e 。具体实现如下: b o o l c s t o c k a p p :c o n f i g s q l s e r v e r ( l p c t s t rl p s z s e r v e r , l p c t s t r l p s z d a t a b a s e ,l p c t s t rl p s z d s n ) i f d l p s z d a t a b a s e | l ! l p s z d s n ) r e t u r nf a l s e ; i f ( i l p s z s e r v e r ) l p s z s e r v e r = _ t ( ”( 1 0 c a l ) ”) ; i n tn l e n ;t c h a r p a t t r i b u e 51 2 = o ) ; i n tn p o i n t = 0 ; _ t c s c p y ( p a t t r i b u e + r & o i n t ,h ”d s n = ”) ) ; n l c n - - t c s l e n ( t ( ”d s n 一) ) ; n p o i n t + = n l e n ; _ t c s c p y ( p a t t r i b u e + n p o i n t ,l p s z d s n ) ;n l e 妇t 七s l e n ( 1 p s z d s n ) ; n p o i n t + = n l e n ;p a t t r i b u e n p o i n t + + = 、o : _ t c s c p y ( p a t t r i b u e + n p o i n t , t ( ”t r u s t e d _ c o n n e c t i o n = y e s ”) ) ; n k t j c s l c n ( t ( ”t r u s t e d _ c o n n e c t i o n = y e s ”) ) ; n p o i n t + - - n l c n ;p a t t r i b u e n p o i n t + + 】= 、o ; t c s c p y ( p a t t r i b u e + n p o i n t ,_ t ( ”s e r v e r = ”) ) ; n l e n - - _ t e s l e n ( _ t ( ”s e r v e r = ”) ) ;n p o i n t + - - n l e n ; _ t c s c p y ( p a t t r i b u e + n p o i n t , l p s z s e r v e r ) ; r i l e n o c s l e n ( 1 p s z s e r v e r ) ; n p o i n t + = n l e n ; p a t t r i b u e n p o i n t + + = o : _ t c s c p y ( p a t t r i b u e + n p o i m , _ t ( ”d a t a b a s e = ”) ) ; n l e n 鼍_ t c s l e n ( j ( ”d a t a b a s e 一) ) ; n p o i n t + = n l e n ; _ t c s c p y ( p a t t r i b u e + n p o i n t , l p s z d a t a b a s e ) ; 3 3 燕山大学工学硕士学位论文 n l e n = _ t e s l e n ( 1 p s z d a t a b a s e ) ; n p o i n t + - - - n l e n ; p a t t r i b u e n p o i m + + 】= x 0 ; p a t t r i b u e n p o i m 2 f o : r e t u r ns q l c o n f i g d a t a s o u r c e ( n u l l ,0 d b c _ a d d _ d s n , 了( s q ls e r v e r ”) ,( l p c s t r ) p a t t r i b u e ) ; 使用s q l c o n f i g d a t a s o u r c eo d b c a p i 函数时,还要做以下两点工作: ( 1 ) 声明包含系统的o d b c i n s t h 头文件。如果不加入这个头文件系统, 编译时就会显示u n d e c l a r e di d e n t i f i e r 错误。 ( 2 ) 将o d b c c p 3 2 1 i b 加入到项目中去。因为在使用此a p i 函数时,必须 用到o d b c c p 3 2 d 1 1 ,它是m i c r o s o f t 提供的3 2 位o d b c 安装和管理的d l l 。 4 3 2 建立与数据库的连接 在程序开始运行时,在应用程序初始化的函数i n i t i n s t a n c e 中对数据库 进行连接,主要进行两个判断,首先判断配置o d b c 数据源是否成功,其 次判断打开数据库是否成功如果配置数据源和打开数据库两个操作都成 功,则系统继续运行,否则,系统给出相应提示信息,并且不继续进行任 何操作。进行这两个判断的作用主要是使系统能够有较好的容错性能,主 要代码如下: i f ( ! c o n f i g s q l s e r v e r ( n u l l ,”s t o c k d b ”,”s t o c k d b ”) ) a f x m e s s a g e b o x ( ”数据源配置失败请检查后重新运行程序”) ; r e t u r nf a l s e ; i f ( ! m _ d b o p e i l e x ( ”o d b c ;h o s t = i o c a l ;d s n = s t o c k d b ”) ) a f x m e s s a g e b o x ( ”数据库连接不对检查权限”) ; “冲咖f a l s e ; 4 3 2 断开与数据库的连接 当系统结束运行时,应在应用程序类的e x i t l n s t a n c e 函数中做一些关 于系统结束的后续处理工作,其中就包括断开程序与数据库的连接,实现 如下: 第4 章系统设计与实现 i f ( m _ d b m _ h d b c ) t r y md b c l o s e ( ) ; c a t c h _ a l l ( e ) e n dc a t c h 二a l l 4 4 数据管理的实现 此功能是用来对系统所使用的数据进行统一管理,包括对股票的历史 数据信息进行导入和读取,如图4 2 所示。 臣回,圜隧图罄渤慧燮登要= ? ”誓 r 捌鲢:一 | :o c k b u s i n e s s , s o h u c o m l q h p p h p ? c o d e = 0 0 0 7 7 8 。团旦副生副 旦麴i 妥真数i 墨童筮i 量堡鲶i 墼叁垒 二鏖i e 习 2 0 0 6 i 2 培5 5 2 55 3 丁 5 ,1 25 ,3 6i b - :3 5 5 e :fi 2 8 0 6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论