(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf_第1页
(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf_第2页
(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf_第3页
(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf_第4页
(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(产业经济学专业论文)基于BP神经网络的股票短期预测应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i 摘 要 摘 要 股票分析和预测是一个复杂的研究领域,本论文将股票技术分析理论与人工 神经网络相结合,针对股票市场这一非线性系统,运用 bp 神经网络,研究基于历 史数据分析的股票预测模型,同时,对单只股票短期收盘价格的预测进行深入的 理论分析和实证研究。 本论文首先综述研究了股票分析的多种方法,并重点推荐了技术分析法和神 经网络方法;通过优劣势比较分析,选择了基于技术分析的 bp 神经网络作为股票 预测模型建立的基本方法。 接下来,探讨了 bp 神经网络的模型与结构、bp 算法的学习规则、权值和阈值 等,构建了基于 bp 神经网络的股票短期预测模型,研究了神经网络的模式、泛化 能力等问题。并且,利用搭建起的 bp 神经网络预测模型,采用多输入单输出、单 隐含层的系统,预测单只股票未来一个月收盘价的中短期变化趋势。对于网络的 训练,选用学习率可变的动量 bp 算法,同时,对网络结构进行了隐含层节点的优 化,多次尝试,确定最为合理、可行的隐含层节点数,从而有效地解决了神经网 络隐含层节点的选取问题。 同时,本论文还深入研究了 bp 神经网络在 matlab 中的设计和实现,包括如 何创建神经网络,如何对网络进行初始化、训练和模拟;并利用 matlab 函数进行 编程,实现了所设计的 bp 神经网络。 针对所建预测模型,本论文对沪深两市的多只股票进行了实证分析,证明所 采用的研究方法和所设立的模型是实用并且有效的。它不仅简化了网络结构,还 提高了预测精度,具有较好的预测能力和泛化推广能力。这就说明了本文所构建 的基于 bp 神经网络的股票短期预测模型的有效性和普适性。 本论文在前人研究成果的基础上,针对现实复杂经济系统的客观需要,提出 了作者自己的观点和想法,并把它们付诸实践,希望可以对人工神经网络技术用 于实际预测做出一点贡献。 关键词:技术分析,bp 神经网络,股票预测,matlab ii abstract stock analysis and forecasting is a complex field of study. the paper will make research on stock prediction model based on the analysis of historical data, using bp neural network and technical analysis theory. at the same time, making in-depth theoretical analysis and empirical studies on the short-term closing price forecasts of single stock. firstly, analysis of the various methods stock and recommend key technical analysis and neural network methods. comparing of advantages and disadvantages, the choice is bp neural network based on the technical analysis, as the method of stock forecasting model established. secondly, making research on the model and structure of bp neural network, learning rules, weights of bp algorithm and so on, building a stock short-term forecasting model based on the bp neural network, related with the model of neural network and the ability of generalization. moreover, using system of multiple-input single-output and single hidden layer, to forecast the stock closing price in the next month by bp neural network forecasting model structured. the network of training is chosen bp algorithm of traingdx, while making optimization on the node numbers of the hidden layer by several attempts. thereby resolve effectively the problem of it. thirdly, this paper has deep study of the bp neural network in matlab, including how to create a neural network, how to initialize the network, training and simulation, and using matlab programming function and achieve the designed bp neural network. the last but not the least, it is proved that the research method and the established model are practical and effective by empirical analysis of several stocks in the shanghai and shenzhen stock markets. it not only simplifies the network structure, but also improves the prediction accuracy as well, owning good predictive capability and generalization. according to request of the complex economic reality, the author provides her own views on the basis of previous researches and hopes make a contribution for the iii prediction by the artificial neural network. keywords: technical analysis, bp neural network, the stock forecast, matlab 学位论文原创性声明学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。 除文中已经注明引用的内容外, 本论文不含任何其他个人或集体已经发表或撰写过的作品成果。 对本文所涉及的研究工作做出重要贡献的个人和集体,均已在文 中以明确方式标明。本人完全意识到本声明的法律责任由本人承 担。 本人郑重声明:所呈交的学位论文,是本人在导师的指导下, 独立进行研究工作所取得的成果。 除文中已经注明引用的内容外, 本论文不含任何其他个人或集体已经发表或撰写过的作品成果。 对本文所涉及的研究工作做出重要贡献的个人和集体,均已在文 中以明确方式标明。本人完全意识到本声明的法律责任由本人承 担。 特此声明特此声明 学位论文作者签名:学位论文作者签名: 年年 月月 日日 学位论文版权使用授权书学位论文版权使用授权书 本人完全了解对外经济贸易大学关于收集、保存、使用学位 论文的规定,同意如下各项内容:按照学校要求提交学位论文的 印刷本和电子版本;学校有权保存学位论文的印刷本和电子版, 并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有 权提供目录检索以及提供本学位论文全文或部分的阅览服务;学 校有权按照有关规定向国家有关部门或者机构送交论文;在以不 以赢利为目的的前提下,学校可以适当复制论文的部分或全部内 容用于学术活动。保密的学位论文在解密后遵守此规定。 本人完全了解对外经济贸易大学关于收集、保存、使用学位 论文的规定,同意如下各项内容:按照学校要求提交学位论文的 印刷本和电子版本;学校有权保存学位论文的印刷本和电子版, 并采用影印、缩印、扫描、数字化或其它手段保存论文;学校有 权提供目录检索以及提供本学位论文全文或部分的阅览服务;学 校有权按照有关规定向国家有关部门或者机构送交论文;在以不 以赢利为目的的前提下,学校可以适当复制论文的部分或全部内 容用于学术活动。保密的学位论文在解密后遵守此规定。 学位论文作者签名:学位论文作者签名: 年年 月月 日日 导师签名:导师签名: 年年 月月 日 日 1 第1章 绪论 第1章 绪论 股票投资是一种风险投资,自产生以来,对股票价格的预测就一直是学术界 和广大投资者最感兴趣的问题之一。它不仅具有实用的应用价值,还具备重要的 理论意义。 对于股票价格的预测,传统方法多是依赖于其内在价值或是股票价格间的线 性关系,局限性非常明显;而神经网络则可以基于现有市场行为的样本,从过去 行为的规则性中推断出可能存在的规律,并对它进行逼近,从而与复杂的股票价 格走势曲线拟合,克服传统预测方法不足,达到良好的预期效果。 本论文将在股票投资市场蓬勃发展的大背景中, 利用 bp 神经网络算法对单只 股票短期(20-30 天)预测进行研究。 1.1 选题背景 1.1.1 我国股票市场的发展 我国股票市场的起步比较晚,伴随着中国经济的发展,股票市场在当年的深 圳产生。 1988 年,深圳特区尝试对一些企业进行股份制改制,选择了 5 家企业作为股 票发行上市的试点,其中包括一家由深圳几家农村信用社改组而成的股份制银行, 这就是后来大家熟悉的深发展(深圳发展银行,股票交易代码为 000001) 。由此, 便产生了经人民银行批准公开发行上市的中国第一支股票。深圳发展银行 1987 年 初经中国人民银行研究决定,在深圳特区筹建的第一家股份制、区域性、综合性 银行,采取向社会发行 50 万股(面值 20 元)的人民币股票,17 万股(面值 100 元)的港币优先股股票,筹资人民币 1000 万元,港币 1700 万元,作为发展银行 的资本金1。 从此,我国的沪深股市便从一个地方股市开始逐步发展成为全国性的股票市 场。在 1990 年 12 月正式营业时,上市的股票数量只有为数很少的几只,其规模 很小,且上市的股票基本上都是上海或深圳的本地股,如上海的老八股中只有一 1 中国证券业协会编, 证券市场基础知识中国财政经济出版社,2007 年 7 月 2 支是异地股票。在其后股市的发展中,由于缺乏战略性的考虑,造成了资金的扩 容与股票的扩容不同步,特别是资金扩容,其速度远远快于股票扩容。在 1991 年 至 1996 年的五年间,股票营业部从数十家扩展到近 3000 家,入市资金从 10 多亿 元增加到 3000 多亿元,而上市公司却只从当年的近 20 家增加到 400 多家,上市 流通的股票只有 300 亿股。股市的供求关系极不平衡,这样就造成了股价在最初 两年出现暴涨的局面2。 上海股市从 1990 年 12 月开始计点,1992 年年底就上升到了 780 点,平均年 涨幅达到 179;深圳股市从 1991 年 4 月开始计点,1992 年底也涨到了 241 点, 年均涨幅也有 6853。由于股价在开始两年涨幅过度,伴随着股票的扩容,在 1993 年上半年股价达到历史性的高度以后,股价就停步不前,沪深股市就进入艰 难的调整阶段。 通过以上数据可以明显地看到,我国股票市场的发展带有浓重的中国社会主 义特色,是不太完善和成熟的。在这种情况下进行股票投资,蕴含着很大的投资 风险。 1.1.2 股票市场的投资风险 股票投资是一种风险性投资。它的风险是指股票预期收益变动的可能性及变 动幅度。与股票投资相关的所有风险称为总风险,总风险又可分为系统风险和非 系统风险两大类。 系统风险是指由于某种全局性的共同因素引起的投资收益的可能变动,这种 因素以同样的方式对所有股票的收益产生影响,是不可回避、不可分散的风险。 这些风险包括政策风险、经济周期波动风险、利率风险和购买力风险等。 1、政策风险 政策风险是指政府有关证券市场的政策发生重大变化或是有重要的法规、举 措出台,引起证券市场的波动,从而给投资者带来的风险。由于证券市场政策是 政府指导、管理整个证券市场的手段,因此,一旦出现政策风险,几乎所有的证 券都会受到影响。 2、经济周期波动风险 经济周期波动风险是指证券市场行情周期性变动而引起的风险。这种行情变 2 中国证券业协会编, 证券市场基础知识中国财政经济出版社,2007 年 7 月 3 中国证券业协会编, 证券投资分析中国财政经济出版社,2007 年 7 月 3 动不是指证券价格的日常波动和中级波动,而是指证券行情长期趋势的改变。 证券行情变动受到多种因素影响,但决定性的因素是经济周期的变动。经济 周期的变化决定了企业的景气和效益,从而从根本上决定了证券行情,特别是股 票行情的变化趋势。证券行情随经济周期的循环儿起伏变化,总的趋势可分为看 涨市场或称多头市场、牛市和看跌市场或称空头市场、熊市两大类型。在整个看 涨行市中,几乎所有的股票价格都会上涨;在整个看跌行市中,几乎所有的股票 价格都不可避免地有所下跌,只是涨跌程度不同而已。 3、利率风险 利率风险是指市场利率变动引起证券投资收益变动的可能性。市场利率的变 化会引起证券价格变动,并进一步影响证券收益的确定性。利率与证券价格呈反 方向变化,即利率提高,证券价格水平下跌;利率下降,证券价格水平上涨。利 率从两方面影响证券价格。一是改变资金流向;二是影响公司的盈利。 4、购买力风险 购买力风险又称为通货膨胀风险,是由于通货膨胀、货币贬值给投资者带来 实际收益水平下降的风险。在通货膨胀情况下,物价普遍上涨,社会经济运行秩 序混乱,企业生产经营的外部条件恶化,证券市场也难免深受其害。 但是,普通股股票的购买力风险相对较小一些。因为当发生通货膨胀时,由 于公司产品价格上涨,股份公司的名义收益会增加,特别是当公司产品价格上涨 幅度大于生产费用的涨幅时,公司净盈利增加,此时股息会增加,股票价格也会 随之提高,普通股股东可得到较高收益,可部分减轻通货膨胀带来的损失。 需要指出的是,购买力风险对不同股票的影响是不同的;在通货膨胀不同阶 段,对股票的影响也是不同的。这是因为公司的盈利水平要受多种因素影响,产 品价格仅仅是其中的一个因素。一般说来,率先涨价的商品、上游商品、热销或 供不应求商品的股票购买力风险较小,国家进行价格控制的公用事业、基础产业 和下游商品等股票的购买力风险较大。在通货膨胀之初,企业消化生产费用上涨 的能力较强,又能利用人们的货币幻觉提高产品价格,股票的购买力风险相对小 些。当出现严重通货膨胀时,各种商品价格轮番上涨,社会经济秩序紊乱,企业 承受能力下降,盈利和股息难以增加,股价即使上涨也很难赶上物价上涨,此时 普通股也很难抵偿购买力下降的风险了。 非系统风险是指只对某个行业或个别公司的证券产生影响的风险,它通常由 某一特殊因素引起,与整个证券市场的价格不存在系统、全面的联系,而只对个 4 别或少数证券的收益产生影响。非系统风险是可以抵消、回避的,因此又称为可 分散风险。非系统风险包括信用风险、经营风险、财务风险等。 1、信用风险 信用风险又称为违约风险,指证券发行人在证券到期时无法还本付息而使投 资者遭受损失的风险。信用风险实际上揭示了发行人在财务状况不佳时出现违约 和破产的可能,它主要受证券发行人的经营能力、盈利水平、事业稳定程度及规 模大小等因素影响。 2、经营风险 经营风险是指公司的决策人员与管理人员在经营管理过程中出现失误而导致 公司盈利水平变化,从而使投资者预期收益下降的可能。 公司的经营状况最终表现于盈利水平的变化和资产价值的变化,经营风险主 要通过盈利变化产生影响,是普通股票的主要风险。公司盈利的变化既会影响股 息收入,又会影响股票价格。当公司盈利增加时,股息增加,股票价格上涨;当 公司盈利减少时,股息减少,股价下降。 3、财务风险 财务风险是指公司财务结构不合理、融资不当而导致投资者预期收益下降的 风险。 对股票投资来讲,财务风险中最大的风险当属公司亏损风险。公司亏损风险 虽然发生的概率不是很高,但这却是投资者常常面临的最大风险。投资股票就是 投资与公司,投资者的股息收益与通过股票价格变动获得的资本利得与公司的经 营效益密切相框。所以,股票的风险将直接取决于公司的经营效益。 股票市场是一个风险与收益并存的投资领域,在股市中如何能够获得丰厚的 收益,同时又将风险降低到最小,这不仅需要理性的头脑,而且也需要精准的预 测工具,神经网络恰恰就能做到这一点。 1.2 股票预测的国内外研究现状 20 世纪以来,股票市场的预测研究引起了国内外投资者、相关领域专家的广 泛关注。目前已经形成了多种研究模型和方法。本节将前人的研究成果作一下简 单的回顾。 5 1.2.1 股票预测国外研究现状 股票市场建立一百多年以来,对股票价格行为的准确描述与预测一直是众多 投资者和学者梦寐以求的目标,然而影响股票价格的因素非常多,包括外部因素 如整个经济环境、政治事件、甚至是某位有影响的人物的一言一行;内部因素如 市场效率、上市公司业绩等等。各因素的影响程度、时间范围和方式又不尽相同, 造成异常复杂的价格变化,使得对其准确预测变成一件异常困难的任务。尽管如 此,由准确预测寻求套利的机会从而获得超额的收益吸引着一代又一代的学者和 投资者进行研究和实践,他们不断的从不同角度、不同理论、不同投资策略和不 同的实际经验中发展出了众多的预测方法,关于股票市场价格变动预测分析的论 著大量问世,如市场有效性理论、市场均衡理论、资本资产定价理论、期权定价 理论等。股票价格的形成机制,从系统论的角度看,是一个复杂的非线性系统;它 的难以描述性、难以分析性、难以预测性体现了股票市场的高度复杂性和非凡的 魅力所在。下面是国外股票市场价格预测的发展过程。 ? charles dow 在 1900 年到 1902 年, 写了一系列的评论来阐述他的市场观。 ? sam nelson 收集了 charles dow 的评论并将他的观点发展为市场行为原 则,这就是成为技术分析基础的道氏理论。 ? richard schabacker 第一个将通用图表形态分类,研究出“缺口”理论, 被称作技术分析科学之父 4。 ? 瑞夫n艾略特通过研究市场波动和循环的形态,提出了“波浪理论”。 ? w- d - gann 研究了时间要素的重要性,提出了“价格时间等价”的概念。 随后,又出现了很多分析方法,包括 k 线图分析法、柱状图分析法、点数图 分析法、移动平均法、形态分析法、趋势分析法、角度分析法、神秘级数与黄金 分割比螺旋历法、四度空间法等。这些分析方法主要依赖于图表,图表信息具有 明显的直观化优点,但图表的分析与指标的选择却要依靠主观的判断,这是这些 分析方法面临的主要问题。由于股票交易的模式和相关信息的复杂性,这样一种 严重依靠经验的方法,其可靠性在很大程度上受到质疑。 从 60 年代开始,人们尝试使用各种时间序列分析方法来预测股市。在时间序 列分析中,线性模型的研究比较成熟。 ? schekman 通过建立自回归模型对法兰克福股市进行预测,取得比较满意 4 richard schabacker,technical analysis(traders master class), donald mack (hardcover april 1998) 6 的结果 5。 但是股市是一个非线性系统,用线性模型逼近容易丢失有用信息。为了更确 切描述实际系统特性,又发展了阈值自回归模型、多项式自回归模型和指数自回 归模型等,用这些方法对股市进行建模和预测也取得了比较好的结果.然而,由于 股票市场的复杂性,模型的辨识非常困难。 随着混沌和分形理论的发展,用非线性确定系统规律研究股价行为越来越显 示出强大的生命力。 预测理论家 gordon 指出, 混沌理论开辟了预测研究新的领域, 为原来被认为不可预测的复杂系统的预测提供了新的理论与方法。 ? 1989 年美国学者 lebaron 发现了股票日收益序列与周收益序列中存在混 沌现象 6。 ? 分形学的创始人 mandelbrol 对股票价格的变动规律进行了研究,他从股 票价格变动的分布及其分布的相似性方面论证了股票价格的变化是分形 的。 ? farmer 和 sidorowich 对股市时序进行了研究,采用数值计算,观察系统 的相图结构,计算系统的 lyapunov 指数,验证了股票市场混沌现象的存 在性,并应用动力学中相空间重构的思想对股价时序进行技术处理,然后 在重构相空间上,利用小波理论对股市时序进行预测 7。 近年来, 随着神经网络理论的发展成熟,其在模式识别和复杂系统控制等方 面己经取得了巨大的成功,并开始在经济、金融等领域广泛应用。神经网络具有 可逼近任意非线性连续函数的学习能力和对杂乱信息的综合能力,而这些能力正 是其它方法所不具有的。目前基于神经网络的股市预测方法在国际上正在兴起, 这正是本文研究的出发点。 ? 1988 年 white 利用 bp 网络对 ibm 股票进行预测,其目标是未来一个月内 买进和卖出的最佳时机 8。 ? 1990 年由 kimoto 等同样用 bp 网络对东京证交所综合指数进行预测,并 且探讨了股票买卖决策支持系统 9。 ? kamijo 和 tanigawa 对股票价格进行模式识别 10。 5 schekman j a, lebaran b. nonlinear dynamics and stock returns. journal of business 1989, 62:311317. 6 lebaron b. nonlinear dynamics and economic. journal of business 1990, 47:212346. 7 farmer, sidorowich. yapunov and stock prediction. journal of business 1990, 562:411687 8 white, h. economic prediction using neural networks: the case of ibm daily stock returns, neural networks, ieee international conference on, 1988, 2(6):4 51 一 458. 9 kimoto, t 0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1; %创建bp神经网络和定义训练函数及参数 net = newff(threshold,25,1,tansig,logsig,traingdx,learngdm,mse); %设定训练次数为20万次 net.trainparam.epochs=200,000; %设定训练目标为0.0001 net.trainparam.goal=0.0001; %训练神经网络 net=train(net,a600036,b600036); 由于初始权值随机产生,所以上文程序的一种运行结果如下: traingdx, epoch 0/200000, mse 0.053713/0.0001, gradient 0.0745146/1e-006 traingdx, epoch25/200000, mse 0.0517321/0.0001, gradient 0.0732266/1e-006 traingdx, epoch50/200000, mse0.0458664/0.0001,gradient0.0704889/1e-006 traingdx,epoch199650/200000,mse0.000101753/0.0001,gradient3.35191e-005/1e-006 traingdx,epoch199675/200000,mse0.000101282/0.0001,gradient3.32751e-005/1e-006 traingdx,epoch199677/200000,mse9.99995e-005/0.0001,gradient3.28641e-005/1e-006 traingdx, performance goal met. 根据以上程序,建立神经网络net,具体参数如表3.3所示 44 表 3.3 建立的神经网络 net field value version 5.1 numinputs 1 numlayers 2 biasconnect inputconnect layerconnect outputconnect numoutputs 1 inputs layers biases inputweights layerweights outputs adaptfcn trains adaptparam gradientfcn calcgrad initfcn initlay performfcn mse performparam trainfcn traingdx trainparam iw lw b userdata hint revert 资料来源:本论文整理 45 从上文的程序片断中, 可以看到隐含层节点数目为25的情况下, 训练200,000 次虽然达到了训练目标0.0001,但收敛速度比较缓慢,没有实现最优的模型建立。 面对这种情况,本文将分别针对隐含层节点数目、初始权值进行大量的尝试,改 进、优化预测模型,以期达到更好的预测效果。 3.4.3 bp神经网络模型的优化 3.4.3.1 隐含层节点数目优化 由于网络训练20万次需要将近4个小时的时间,所以,本文在测试隐含层节 点时,设定训练目标为0.001,训练3000次;这样同样可以达到优化隐含层节点 数的目的。 本文以节点数25为基点,在15,25之间进行多次尝试比对。根据仿真输出 结果与真实值之间的误差大小,来确定最终的隐含层节点数目。具体实现过程如 下所示: %尝试隐含层节点个数 no=15 20 21 22 23 24 25; for i=1:7 net= newff(threshold,no(i),1,tansig,logsig,traingdx,learngdm,mse); net.trainparam.epochs=3000; net.trainparam.goal=0.001; net=train(net,a600036,b600036); out =sim(net,a600036); %利用仿真函数sim计算输出 p(i)=norm(b600036-out); %求出预测误差 通过以上循环函数的运行,可得到隐含层节点数的综合比较(如表3.3所示) 。 46 表 3.3 隐含层节点数比较 隐含层节点数 收敛速度 均方误差 梯度 预测误差 15 3000/3000 0.00134761 0.00348632 0.36644 20 3000/3000 0.00102687 0.00187293 0.32183 21 2668/3000 0.000999894 0.000174363 0.32551 22 2304/3000 0.000999315 0.00019375 0.29998 23 2718/3000 0.00101798 0.0019867 0.32168 24 3000/3000 0.00110692 0.00729981 0.31971 25 2836/3000 0.000999961 0.000433343 0.30999 资料来源:本论文整理 经过表格的对比分析,可以清楚的看到,隐含层节点数为22时,其预测误差 和均方误差均为最小,分别为0.29998和0.000999315,并且它的收敛速度也相对 较快,可以经过2337次训练达到误差目标值。 所以,本模型选择隐含层节点数为22,其训练误差曲线为图3.9所示。 图 3.9 隐含层节点数为 22 的训练误差曲线 资料来源:本论文整理 3.4.3.2初始权值优化 bp算法实质上是根据输出的平方误差偏导来修正权值,它不仅表明了权值修 47 改的大小,而且表明了权值修改的方向(加或减)。建立模型所期望的目标是,距离 误差最小点较远,平方误差偏导较大,这样的话训练就比较快。但实际上,在整 个权值空间中,均方误差相对于各权值的变化具有非常复杂的曲面,所以满足收 敛条件的解不唯一,有无数个点可以达到终点,也有无数个解达不到终点,这就 使得初始值的选取非常困难。 权值初始值的位置对网络的训练是否收敛影响很大,本文选择尝试法确定初 始权值。由于网络结构中隐含层节点和输出层节点的输出范围为0到1之间,所 以初始权值的选取范围就只和bp神经网络的结构有关。这样,使网络训练的初始 权值选择e num1 . 022之间的随机数,其中 num为该连接权值的输入节点的数目。 多次尝试,比对网络的训练效果、拟合效果,预测模型最终确定的初始权值 如表3.4和图3.10所示,通过语句iw=net.iw1实现,输出为一个22*12的矩阵 (22为隐含层节点数,12为输入层节点数) 。 表 3.4 各节点的初始权值 1 2 3 4 5 6 7 8 9 10 11 12 1 1.73 1.65 -1.31 0.03 -0.50.34-1.46-0.651.042.22 -0.78 2.29 2 1.23 1.32 -0.11 -1.25 0.18-1.42-0.85-0.110.640.85 1.26 -1.55 3 -1.49 0.54 -0.29 -1.5 -1.21-1.07-1.2-0.340.530.41 -0.12 1.93 4 1.27 0.84 0.38 -0.88 -1.491.06-0.991.56-0.03-0.7 -1.26 0.39 5 0.5 0.87 0.75 1.25 0.25-1.581.43-0.670.130.95 1.4 -0.21 6 -1.4 -0.11 1.09 -0.77 0.791.810.18-2.02-0.540.04 2.59 -1.02 7 -1.13 0.58 -1 1.24 1.890.030.041.110.89-1.23 -0.65 -1.66 8 -0.09 -1.6 0.01 -1.15 -0.062.72-1.94-0.66-2.121.72 -1.13 0.31 9 1.68 0.69 0.52 1.13 0.04-1.361.05-1.711.22.16 -0.47 2.4 10 1.51 -2.55 -1.98 -1.5 -0.76-0.540.62-0.02-1.38-0.01 -0.43 -1.49 11 -1.16 -0.88 -1.39 -0.88 -2.19-1.54-0.31-1.44-0.080.56 0.25 0.14 12 1.5 -1.68 -0.12 -1.06 0.172.74-0.78-2.460.111.92 0.26 -2.04 13 2.1 -0.43 2.36 0.66 -0.79-3.12-0.71-0.151.89-0.9 1.88 -0.56 14 0.63 1.71 -0.04 0.78 0.460.76-1.592.83-2.57-1.35 0.98 -0.69 15 1.56 1.1 0.64 -0.36 -0.621.47-0.980.392.170 -1.04 1.02 16 -1.16 -0.73 -0.93 1.22 -1.081.63-0.73-0.731.24-1.1 -0.99 -1.37 17 -0.28 1.62 0.94 0.24 -1.47-1.44-1.5-0.95-0.540.92 -1.12 -0.15 18 3.14 0.35 1.18 0.56 3.280.67-1.25-0.34-0.82-1.23 -2.46 1.54 19 1.35 0.18 -0.37 2.53 -0.56-1.80.280.840.96-0.34 0 -2.79 20 1.63 -0.19 0.49 -0.19 2.051.34-1.89-1.84-0.9-1.36 -0.23 1.08 21 0.52 1.51 1.3 2.01 0.55-0.790.78-2.870.160.42 -0.64 -0.21 22 -1.5 0.89 1.45 0.93 0.871.471.78-10.6-0.04 -0.55 1.16 资料来源:本论文整理 22 d.e. rumelhart, j.lmeclelland, parallel distributed processing complex systems, 1990, (2):39-44. 48 图 3.10 各节点初始权值立体图 资料来源:本论文整理 3.5 利用模型进行股票短期预测 利用上一节建立起的优化预测模型,对股票收盘价进行短期预测。 3.5.1 输入输出拟合效果 建立隐含层节点数为22,优化初始权值的bp神经网络后,经过30万次的训 练, 训练目标达到6.57772e-005, 如图3.11所示。 之后, 进行仿真输出, 利用matlab 语句绘制拟合效果图,如图3.12所示。 %利用仿真函数sim计算输出 out =sim(net,a600036); %用红色线条绘制仿真数据 plot(1:90,out,r) %保持画面不变 hold on %用蓝色线条绘制真实数据 plot(1:90,b600036,b) 49 图 3.11 训练目标误差曲线 资料来源:本论文整理 图 3.12 输入输出拟合效果 资料来源:本论文整理 50 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 2-apr 9-apr 16-apr 23-apr 30-apr 预测值 真实值 3.5.2 基于模型的股票短期预测 模型建立结束后,通过优化处理,输入输出的拟合效果通过图3.12可以看出, 基本得到了体现。下面利用该模型对单只股票进行短期预测,观察预测的结果。 采用招商银行 (600036) 的2007年3月1日至2007年3月29日的测试数据, 共21条,预测其2007年4月1日至2007年4月30日的收盘价格。在数据归一 化的前提下,其误差率为0.004301,预测值与真实值的拟合效果如图3.13所示。 图 3.13 预测值与真实值的拟合效果(归一化) 资料来源:本论文整理 经过反归一化处理,将预测数据还原到真实的取值区间,这时的误差率为 1.3863,预测值与真实值的拟合效果如图3.14所示,误差曲线如图3.15所示。 51 0.000 5.000 10.000 15.000 20.000 25.000 2-apr 4-apr 6-apr 8-apr 10-apr 12-apr 14-apr 16-apr 18-apr 20-apr 22-apr 24-apr 26-apr 28-apr 30-apr 真实值 预测值 误差 -0.6000 -0.4000 -0.2000 0.0000 0.2000 0.4000 0.6000 0.8000 1357911 131517 1921 误差 图3.14预测值与真实值的拟合效果(反归一化) 资料来源:本论文整理 图 3.15 误差曲线 资料来源:本论文整理 综上所述,使用bp神经网络算法建立预测模型,在优化之后取得了较好的预 测效果。如果计算机硬件条件再好一些,训练的次数更多一些,其预测的精准度 52 将会更高。 3.6 本章小结 本章是文章的中心章节, 研究的核心成果建立了一个bp神经网络预测模 型在本章中终于得以实现。在此章节中,通过比较各类模型的优缺点,最终选用 了bp神经网络模型;接着详细阐述了bp神经网络模型的算法以及学习方法;然 后按照模型建立的基本步骤和方法建立网络模型。首先选定了matlab作为设计 模型的工具,然后不断反复试验,得出bp神经网络的最优参数搭配,接着通过尝 试法,对模型隐含层的节点数目和初始权值进行优化,最后对预测数据集进行预 测,得到了比较理想的预测结果。 53 0 5 10 15 20 25 30 19-mar 26-mar 2-apr 9-apr 16-apr 23-apr 预测值 真实值 第第4章 股票短期预测模型实证分析与评估章 股票短期预测模型实证分析与评估 在对股票短期预测模型进行实证分析和评估时,一般应该考虑一下两个方面: 1、模型预测的精准度;2、模型的泛化能力。毋庸置疑,模型预测的精准度是建 模时首先要考虑的问题。在本文中,模型的泛化能力是针对模型对训练样本以外 的新样本的预测能力而言的。泛化能力较好的模型对训练样本以外的新数据进行 预测时,其预测精准度不应该有较大幅度的下降。本章将对已生成的bp神经网络 模型进行实证分析,并对预测结果进行对比与评价。 4.1 bp 神经网络股票短期预测实证分析 确立了预测模型之后,由于硬件条件所限,分别对沪深两市金融、地产、钢 铁、石化和医药行业的五只龙头股票进行短期预测分析,从而验证bp神经网络股 票预测模型的精准度及泛化能力,进行实证分析。 1、金融深发展(000001) 将深发展(000001)的数据导入matlab,按照上文的步骤进过训练建立好 模型。通过2007年1月30日至2007年3月16日共29天的数据,预测接下来的 2007年3月19日至2007年4月26日其收盘价格。 其预测值与真实值的拟合效果 如图4.1所示,误差曲线如图4.2所示。 图 4.1 预测值与真实值的拟合效果 资料来源:本论文整理 54 误差 -0.800 -0.600 -0.400 -0.200 0.000 0.200 0.400 0.600 0.800 1.000 13579 11 13 15 17 19 21 23 25 27 29 误差 0.000 5.000 10.000 15.000 20.000 25.000 19-mar 26-mar 2-apr 9-apr 16-apr 23-apr 30-apr 真实值 预测值 图 4.2 预测误差 资料来源:本论文整理 2、地产万科a(000002) 将万科a(000002)的数据导入matlab,按照上文的步骤进过训练建立好 模型。通过2007年1月29日至2007年3月16日共30天的数据,预测接下来的 2007年3月19日至2007年4月30日其收盘价格。 其预测值与真实值的拟合效果 如图4.3所示,误差曲线如图4.4所示。 图 4.3 预测值与真实值的拟合效果 资料来源:本论文整理 55 14.000 14.500 15.000 15.500 16.000 16.500 17.000 17.500 18.000 18.500 2-apr 9-apr 16-apr 23-apr 30-apr 真实值 预测值 误差 -1.000 -0.500 0.000 0.500 1.000 1.500 2.000 13579 11 13 15 17 19 21 23 25 27 29 误差 图 4.5 预测误差 资料来源:本论文整理 3、钢铁鞍钢股份(000898) 将鞍钢股份(000898)的数据导入matlab,按照上文的步骤进过训练建立 好模型。通过2007年3月1日至2007年3月30日共21天的数据,预测接下来 的2007年4月2日至2007年4月30日其收盘价格。其预测值与真实值的拟合效 果如图4.5所示,误差曲线如图4.6所示。 图 4.5 预测值与真实值的拟合效果 资料来源:本论文整理 56 误差 -0.4000 -0.2000 0.0000 0.2000 0.4000 0.6000 0.8000 1357911 131517 1921 误差 0.000 2.000 4.000 6.000 8.000 10.000 12.000 14.000 26-mar 2-apr 9-apr 16-apr 23-apr 30-apr 真实值 预测值 图 4.6 预测误差 资料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论