基于神经网络的股价预测

上传人：精*** IP属地：广东上传时间：2020-04-04 格式：DOC 页数：34 大小：126KB 积分：28 举报 版权申诉

已阅读5页，还剩29页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

精品文档 1欢迎下载基于神经网络的股价预测摘要随着中国经济的快速增长和金融市场的不断扩大股票这类对虚拟经济的投资越来越受人们的青睐股市出现后人们试图研究股价波动掌握价格波动规律学术界发明了各种研究方法来预测股票 BP 神经网络在大数据预测的经典算法中受到投资者和研究者的青睐然而 BP 算法由于其收敛缓慢而易于落入局部最小值效率较低基于对股价预测问题的深入分析和各种预测股价方法的比较本文通过建立遗传 BP 神经网络模型探讨了股价预测方法首先将利用遗传算法搜索的最优个体作为 BP 神经网络的初始权重和阈值然后通过试错法确立隐层节点的数量构建 BP 神经网络的模型然后使用 BP 算法训练网络训练过程自动调整学习率基于遗传算法的 BP 神经网络不仅可以发挥遗传算法的全局搜索而且能快速有效地发挥 BP 神经网络的作用两者的结合加快了运算效率提高了 BP 神经网络学习能力和预测股票的能力基于该算法的思想本文构建了预测模型以 Matlab9 0 为实验平台进行模拟实验选取上海和深圳 300 指数为实验对象用前 10 天的收盘价和开盘价加上当天的开盘价来预测当天的收盘价其中将 140 天的历史数据中的前 100 组数据用作训练样本最后 30 组数据用作测试样本从收敛速度稳定性和准确性的三个角度比较和分析 BP 神经网络预测模型和遗传 BP 神经网络的预测模型实验表明提出的基于遗传神经网络的预测股价方法具有一定的实用性关键词机器学习股价预测 BP 神经网络遗传算法绪论 1 1 研究背景和意义股票市场在全球金融体系中起着至关重要的作用因为它允许公司通过交易公司所有权股份来筹集资金但是它不仅对企业本身很重要而且还被用作银行和私人投资者的投资平台为了获得良好的股票投资回报对未来价格的准确预测至关重要然而预测股市是一个艰巨的任务因为股票的价格走势受经济因素业务因素政治因素市场因素和心理等因素的影响从股市表面上看股市在缺乏一定法律约束的情况下出现变化同时中国股民的结构具有特殊性买家的心理状态和股票交易行为对股票走势有直接的影响导致股份价格波动不容易掌握股价股市的变化和整个市场经济的发展有着密切的关系在国民经济中发挥了非常大的作用它的作用不只是受到广大投资者的关注政府也十分关注对于股票投资者未来股价变动趋势预测越准确收购的盈利几率和避免风险就越容易国家经济发展在建设方面股票预测研究也起着重要的作用所以研究股价走势预测具有重大意义股票预测是基于过去和现在的股票价值来引入未来价值这决定了股票预测研究对象不是精品文档 2欢迎下载一个特定的事件而是一个随机的不确定的事件这需要使用匹配的科学预测方法来做出合理的推论对于股票预测基本特点如下 1 股票预测是一种非线性动态系统股票市场是一个非常复杂的系统没有准确的方式来满足任何一种股票预测而且近年来发现试图找到一个非常精确的方法是不现实的我们可以做的是在合理的范围内预测出错控制 2 根据股票市场各种因素的复杂关系一般的预测方法难以准确预测和股票时间序列相关的历史数据也很多建立股票预测模型的一般线性方法显然是一个很大的错误难以实现实际效果 3 由于股票系统的非线性动力学必须使用股票预测方法来拟合非线性数据方法目前线性系统等多项成熟的方法如多元线性回归分析非线性系统处理理论不完善进一步进行理论与实践研究 4 股价数据有一些波动的奇点这些奇点可能对股票预测的研究有一定的影响线性方法可以直接消除这些奇异点但非线性系统认为系统的鲁棒性不能直接从我们的数据推导出这些奇异点 5 买家为投资者投资者是非常主观的动态个人有良好模式的股价历史数据使得预测误差控制在一个很小的范围内但由于股票受到个人对未来事件的影响我们对股价走势的预测仍然有一定的不准确性 6 考虑到我们的股票市场受到明显的国家政策的影响有必要通过科学的方法来预测国家政策的这个因素 1 2 国内外研究现状过去很长一段时间由于股市规模小信息共享的速度太慢股票的技术限制被分析人们只能通过自己的主观判断做出决策和投资随着近几十年股票市场的快速发展信息披露的规范化和信息共享的多样化人们开始寻求一些有效的预测方法来分析和研究股票市场进行更有效的投资但股市是一个复杂的系统不仅受市场外部因素的影响还受到自身内部对股市的影响预测确实有一定的难度但人们并没有停止对股票预测的研究和探索 1 2 1 国内外研究现状 1987 年神经网络算法第一次被应用于预测领域此后神经网络在预测研究中得到迅速发展美国前沿金融公司使用神经网络来预测 20 世纪 90 年代中期的股票市场在 20 世纪 90 年代 White 利用神经网络来预测 IBM 股票的每日收益率 21 然而预测结果不能令人满意此外通过分析神经网络被捕获在局部最小值发现该网络不能收敛到最小点 1990 年 Kimoto Yada 等学者利用神经网络技术开发 TPOix 预测系统 3 该系统主要在东京证券交易所股票加权平均指数类似于道琼斯指数预测结果显示神经网络模型的预精品文档 3欢迎下载测结果优于 TOPix 加权平均值的结果 1996 年 Gen Cay 在 1967 年建立了前身人工神经网络模型 41 以道琼斯工业平均指数的移动平均线作为输入变量 1988 年道琼斯指数分批进行了分析预测结果表明 BP 网络模型的预测能力明显优于简单移动平均法 2000 年罗德里格斯等研究人员建立了移动平均规则和前向人工神经网络的综合模型对西班牙股市的实证分析显示基于预测结果进行的股票交易收益远高于收购后获得的收益 2003 年 G Peter zhang 实验结果表明神经网络模型不仅具有比 ARIMA 模型更好的预测精度而且具有处理非线性数据的优点实验结果表明神经网络模型不仅具有比 ARIMA 模型更好的预测精度另外进入二十一世纪以后神经网络在股市分析中已经出现了很多研究成果 A murat oi Bayogly 和 Ismet Bahadir 比较了神经网络和贝叶斯估计的两种方法在股票市场交易中的预测效果 71 本文选择 215 个股票的历史数据根据不同的标准对这些历史数据进行分析得出结论两种方法均可应用于股票市场但神经网络方法的效果明显好转 Chi Jie Lu 认为股票市场的数据非常嘈杂时间变化非常强劲他尝试使用完整的独立分量分析进行去噪然后提出基于神经网络的股票趋势预测模型该模型首先构建一个独立的然后使用它来分析预测变量以产生独立的分量然后去除数据以重建预测变量重建的预测变量将包含低噪声信息作为神经网络模型的新输入变量该模型使用日本日经 225 指数的开盘价来评估最终表现结果表明 Chi Jie Lu 提出的新模式优于与神经网络模型相结合的小波去噪技术但对神经网络的内部结构没有深入的分析和研究 Hammd M Alhaj ali 和 L hall 使用 BP 多层神经网络分析了中东约旦股市的股价 9 通过实证分析发现与统计分析方法相比 BP 神经网络预测方法获得更高准确性预测能力更好但是他们的研究并不涉及 BP 神经网络一个一个地将问题逐渐转化为局部最小点 Arnold F Shapiro 将三种方法与粗糙集神经网络和遗传算法结合起来独立处理时间序列数据构建了一个综合预测模型 10 进行数据处理和预测既保留了每种方法的优点也弥补了彼此然而在研究过程中不分析每种方法单独的效果对综合模型的影响综合模型的有效性并没有直观的体现出来来自 TOBB 大学的 Murat 使用神经网络模型来分析和预测 TKC 证券的数据 11 输入向量的选择从不同类型的模型开始包括趋势动机模式和波动性并验证数据结果表明与其他预测模型相比神经网络预测模型更好可用于预测投资组合的价格并预测短期交易然而研究仍然有一些主观性没有详细的解释选择模型输入向量的基础和原因 MelikeBildirici 等将 ARCH GARCH 模型与人工神经网络模型 12 相结合分析了近三十年来土耳其股市的股票市场数据结论表明 ANN APGARH 模型显着提高了股票价格预测的准确性但仍然缺乏模型处理大规模非线性数据的能力 1 3 本文所做的工作本文的主要内容是研究遗传神经网络在股票价格预测中的应用主要针对 BP 算法在股价预测中的障碍例如收敛缓慢有很大概率落入局部极小点等问题使用遗传神经网络算法建立股票预测模型并验证其可行性本文主要内容如下 1 使用遗传算法优化 BP 神经网络的初始权重和阈值通过遗传算法优化 BP 神经网络的权重和阈值首先编码初始权重和阈值然后设置遗传算法的参数计算适应度函数对编码个体进行操作和重新计算适应度函数确定是否达精品文档 4欢迎下载到适当的准确度 2 优化 BP 神经网络的结构首先确定网络结构中隐藏层节点数的近似间隔和范围然后使用试错法计算隐层节点的具体数量在此过程中逐渐增加隐层神经元的数量选择均方误差 Mean Square Error MSE 作为误差的度量在相同的训练频率下选择与最小平均误差对应的隐藏层数 3 提高 BP 网络的学习率在训练过程中调整学习率使小时候小大时间大可以非常随机地选择所选范围的初始学习率您可以在评估条件时参考额外的动量如果新错误大于过去错误的若干倍数学习率将会降低否则学习速率将保持不变如果新的错误少小于旧的错误情况则会增加学习率 4 建立股票预测模型利用前十个交易日的开盘价预测第十一个交易日的收盘价股票预测模型设置为 3 层输入层有 20 个节点隐层有 12 个节点输出层为只有一个节点 5 使用 Matlab9 0 进行模拟实验使用沪深 300 指数 130 套历史数据对网络进行训练和测试并预测未来 30 天的沪深 300 指数收盘价分析结果可以得出结论预测模型具有更好的收敛性和稳定性预测结果的准确性更高论文结构 1 4 本文分为四章具体安排如下第一章主要分析了进行股票价格预测的背景和意义以及国内外股票预测研究现状最后总结了本文所做的工作第二章主要阐述 BP 神经网络和遗传算法的相关理论知识首先分析影响股票走势的因素并比较股价预测方法然后介绍 BP 神经网络和遗传算法及其在股票预测中的应用第三章分析如何通过遗传算法优化 BP 神经网络提出遗传神经网络学习效果的改进构建基于遗传 BP 神经网络的股票预测模型在第四章中利用 MATLAB 的外部接口将股票数据导入到 MATLAB 中对基于 BP 神经网络和改进遗传神经网络算法的股票预测模型进行了模拟和验证验证了遗传神经网络遗传预测模型的可靠性和准确性精品文档 5欢迎下载总结了我所做的工作分析了提出的方法的缺点改进了方向第二章相关理论依据 2 1 神经网络预测方法神经网络由许多并行高度关联的数据处理单元组成类似于神经元神经网络模型是基于对人类大脑信息处理机制的初步了解的分布式并行数据处理结构神经网络根据训练数据对内部节点之间的关系进行连续调整达到学习数据变化规律的目的这可以在下一个时期预测数据趋势来实现预测功能神经网络具有分布式存储并行处理容错能力强非线性度高自组织性强自学习能力强适应能力强等特点被广泛应用于经济数据分析和价格预测神经网络预测方法包括径向基函数神经网络反向传播神经网络 BP 和感知神经网络 211 在预测神经网络股价走势的具体过程中有必要全面解决三个问题它们是输入量确定回溯期选择神经网络算法及其参数确定的问题讨论分析这三个重要问题具体如下 1 解决相关投入数量澄清问题解决股价走势需要处理大量数据包括历史数据和实时数据等大量内容涉及的参数包括价格数量等多项内容虽然这些内容和数据看起来比较简单但在实际操作过程中解决相关数据输入输出是个大问题完成准确的预测工作是非常困难的其实由于股价走势在综合技术分析过程中股票开盘价收盘价数量等综合信息是根据人们的历史经验以相关技术手段计算结果从中发现股市走势的规律是很难的使用神经网络预测方法可以实现选定网络的输入变量预测未来股价走势 2 解决确定问题参数的神经网络算法本文采用 BP 算法可以全面实现股价时间序列问题充分体现时间变化对股价变动的直接影响 3 解决回溯窗口的选择在股市发展变化中日均股价技术分析指标受股市变动趋势的影响随着股市的变化这个过程实际上就是一个时间序列的变化解决回溯窗口的问题就是我们面临的一个重要问题 2 1 2 股票预测困难股价波动受到干扰因素的影响在以下几个方面有困难 1 心理预期心理的不确定性股权投资的目的是为了盈利通过出售行为实现利润投资者的心理影响预计会非常大投资者不是完全理性的但对心理偏好的厌恶感会有过度自信放牧效应等等所以投资者预期会有非常强烈的心理不确定性和不可预测精品文档 6欢迎下载性会影响股票价格随着时间的推移这种效应变得越来越难以衡量 2 股价数据非线性股价和影响股价的因素数据之间存在很高的非线性度股票价格预测系统应具有强大的计算能力来处理大量的非线性数据传统的预测方法主要是解决线性数据预测的方法股票价格预测难以成为高度非线性的复杂系统 3 股价数据高噪音影响股票价格的因素有很多一些因素几乎完全无关所以股价数据在这个过程中会包含更多的噪音数据的高噪声会影响股票的预测准确性和准确性价格预测系统如果不消除等级那就是股价预测过程需要关注的一个难题总之股价预测是一个复杂的系统具有高度的非线性特征受到很多因素和功能的影响 2 2 BP 神经网络通过上述股票预测分析我们可以看出影响股票价格的因素有很多而且价格变动是一个动态过程难以量化研究人员难以建立基于股票的历史数据大多数传统统计方法都是基于时间序列的线性特征大量的研究表明股票价格的运作是非线性的所以传统的方法不能对股票价格波动进行有效的分析和预测 BP 神经网络的基本原理是模拟人脑的思维行为金融理论认为股价轨迹是人们变化的结果所以人们以许多方式思考的方式可以反映股票价格的变化因此使用具有非线性特征的 BP 神经网络可以在理论上模拟股票价格的运作 2 2 1BP 神经网络基础针对 BP 神经网络的研究可以起源于 19 世纪末在神经网络的整个历史中其发展分为四个阶段胚胎阶段的第一阶段从 1890 年到著名的美国心理学家 W James 率先研究人类大脑结构和功能到 1969 年 Minsky 和 Papert 发表了感知器 Perceptions 第二阶段是低估阶段从 1969 年到 1982 年 J J Hopfield 出版了着名的文章神经网络与物理系统 Neural Network and Physics system 第三阶段是复兴阶段从 J J Hopfield 研究论文突破性进展开始 1986 年结束 D E Rumlhart 和 J L McClelland 率领研究团队发表了并行分布式处理 Parallel Distributed Processing 第四阶段是高潮阶段 1987 年第一届国际人造神经网络学术会议作为标志人们对人工神经网络的研究与应用的热情急剧高涨至今依然处于上升之中 BP 反向传播网络是由误差反向传播算法训练的多层前馈网络 241 它是最广泛使用的神经网络模型之一 BP 网络可以训练和存储大量的输入输出模式映射不会体现出表现此映射的函数方程其学习方法是使用最陡下降法利用逆向传播从而持续调整算法的权重和阈值直到算法误差平方和最小 25 26 BP 神经网络拓扑包括输入层隐含层和输出层如图 2 1 所示输入层从外部接收输入样本 X 然后执行权重调整在此过程中将比较理想的输出信号和实际的输出信号用得到的误差来校正权值精品文档 7欢迎下载在图中是输入采样信号是网络输出信号其中输入层隐含层和输出层的输入和输出定义如表 2 1 所示各层输入输出定义操作输入层隐含层输出层输入 X G M 输出 G H Y 同时定义输入层到隐含层的关联权值为隐含层到输出层的关联权值为隐含层的输出阈值为输出层的各结点输出阈值为为学习速率网络适应函数 S f x 输入采样信号受到权值的作用生成结果减去阈值能够得到隐含层的各个输入通过隐含层的输入调用 S 函数能够运算出隐含层的输出对输出层的输入 M 调用函数 S 得出输出层的各结点输出 Y f 根据输出层的实际输出向量 Y 和期望输出向量 O 能够计算出输出层各结点的误差 1 利用关联权值输出层的一般化误差和隐含层的输出计算隐含层各节点的一般误差 1 用误差和隐含层各节点的输出校正关联权值 N 1 N 用误差和隐含层各节点的输出修正阈值 N 1 N 精品文档 8欢迎下载使用隐含层各节点的误差和输入层的输入向量 X 来校正关联权值 N 1 N 使用隐含层各节点的误差和输入层的输入向量 X 校正关联权值的阈值 N 1 N 反复进行以上步骤直到误差值达到指定的范围或者训练达到指定次数时结束 2 2 2BP 学习算法误差反向传播 BP 算法是典型的监督训练算法学习过程由两个过程组成即信号的正传播和误差的反向传播通过向后分配输出误差将误差分配给每个层的子模块以获得每个子模块的误差信号进而调整每个子模块的权值这样输入和输出问题的一组样本就可以被看作是非线性优化问题神经网络学习是为了能够学习一个可以获得输出的模型实际上学习过程在外部样本中不断调整过程的权重而在这个过程中是调整规则的权重在学习和优化过程中使用梯度下降算法得到模型实际和理想输出之间的均方误差 MSE 以此达到神经网络训练的目的它是一种非循环多重神经网络学习算法算法流程图如图 2 2 所示计算隐含层节点误差数值学习求误差梯度全部满足开始初始化提供输入特征向量和期望输出特征向量求隐含层输出层各结点精品文档 9欢迎下载求期望输出特征向量实际输出值的偏差满足要求开结束是否否是精品文档 10欢迎下载 BP 神经网络算法流程图 BP 神经网络的初始化包括在每个关联权重范围 1 1 内任意分配一个值选择合适的误差函数 e 确立计算精度和最大学习次数 M 有必要确定问题 1 样本数据第一要有一定量的典型和良好精度的样本将收集到的数据随机分成训练样本检验样本 10 以上和测试样本 10 以上确定输入和输出变量值和数据预处理输入数据值的一般要求在 0 和 1 之间 2 神经网络拓扑结构确定优先考虑 3 层 BP 网络隐含层最基础的要求是在达到尽可能少的隐含层结点的精度要求的同时隐含结点数必须少于 N 1 N 是训练样本数另外训练样本的数量必须大于 BP 神经网络模型的关联权重一般是 2 10 倍 3 神经网络训练 BP 神经网络训练是应用误差回归网络权重的不断调整原理让该结构的输出值和现有的训练样本的输出值之间的平方和最小或者小于预期由于研究数量有限主要取决于经验知识和设计师的经验 4 学习率学习率代表网络学习过程的稳定性学习率的选择值得重视大可能会使系统变得不稳定学习率不够多可能会使得训练周期过小收敛速度缓慢无法逼近目标误差 2171 于是通常取较小的学习率来保障系统的稳定从误差下降曲线可以看出学习率的选取较为恰当则误差下降速度较快假使存在大的振荡则说明学习率过大在实际应用中我们通常取 0 1 之间的常数 5 模型的初始关联权重 BP 神经网络算法本身的结构和性质会导致误差函数具有不少局部最小点 BP 神经网络算法在最终收敛中局部全局最小点由不同初始权重的网络确定转换函数 Sigmoid 要求分配初始权重在 0 5 至 0 5 之间 6 网络模型的性能和泛化能力确定网络模型的泛化能力是高还是低不是关注测试样本本身的大小是要比较测试样本误差是否与训练样本和测试样本类似 7 确定合理的网络模型如果要确定全局最小点第一步要做的是利用不断更改网络的初始关联权重来获取对应的最小点然后找到最小的网络误差在极点上获得网络关联权重的最优解为此网络的结果 2 2 3 基于 BP 神经网络的股票预测模型精品文档 11欢迎下载股市数据量非常大可能导致股市波动很大因素这些因素之间的关系也非常复杂基于这些大型模糊和非线性股票市场数据传统的计算方法难以建立在合适的数学模型上 BP 神经网络具有非线性模拟自主学习等优点金融市场数据分析的方法得到众多研究人员的喜爱并且经过他们的不懈努力很多研究成果被发明出来本节运用 BP 神经网络算法来构建股票预测模型实现第十一个交易日的收盘价预测反映股价的技术指标包括股票开盘价格当天收盘价格当天最高价格当日最低价格如果所有这些指标都用作预测模型的输入向量则预测模型将不能承受如此大量的计算此外神经分支越多即输入变量的数目越多神经网络的训练时间会越长而且经实验表明这种正相关增加趋势是呈指数增长本文将利用 BP 神经网络算法来建立股票预测模型将网络输入定作 10 个连续交易日收盘价数据从而预测第 11 个交易日收盘价使用 BP 神经网络进行股票预测的具体过程如下首先根据用户输入的股票价格指数确定输入样本并将样本数据归一化然后输入到 BP 神经网络然后 BP 神经网络用于独立输入数据学习测试根据网络权重的输出自动调整最后通过不断重复学习和调整实现正确配套训练所需的产值达到预测未来股票价格的目的 BP 神经网络预测模型的大致过程如图 2 3 所示开始数据输入数据归一化处理网络建立及初始化网络训练与学习满足要求网络仿真结束精品文档 12欢迎下载否是 BP 神经网络预测模型的流程图 1 选择输入和输出样本集利用 MATLAB 的外部接口将股票数据导入到 MATLAB 中并从中提取 130 个样本数据样本数据分为两类当进行网络训练时我们用前 100 个当做是训练输入样本剩下的 30 个当做测试时所用数据 2 样本数据进行归一化为了保持数据的原始特性输入数据被预处理并转换成 0 1 之间的数字 3 确定 BP 网络预测模型结构结果表明三层前馈神经网络可以以近似任意精度逼近任意非线性关系在本文中我们搭建了一个 3 层 BP 网络结构来对股价的走势进行预测输入层神经元数是 n 10 输出精品文档 13欢迎下载层神经元数是 m 1 BP 神经网络隐层神经元数为 12 规划的 BP 神经网络预测模型在图 3 2 中 4 训练网络网络的初始权重通常采取较小的任意常数在该文中我们假定初始权值是在 1 1 区间的某一任意权重隐含层激活函数选择双曲正切 S 型传递函数 tansig 输出层激活函数选择线性传递函数 purelin 学习算法采用具有高收敛速度和高精度的 Levenberg Marquardt 算法训练 2000 次使用误差平方和作为误差函数目标误差为 1 0e 30 学习率设定为 0 01 5 网络仿真股票预测模型的 BP 神经网络采取调用 Sim 函数的方式来模拟仿真数据调用 mse 函数来计算拟合误差最后评估计算出来的结果 2 3 遗传算法 2 3 1 遗传算法基础在上个世纪八十年代密西根大学的荷兰教授和他的同学们在自然和人工自适应系统的研究中开创了遗传算法 GA 的思想 GA 是一种直接搜索算法遗传算法的思想来源于达尔文进化与遗传学理论不依赖于问题本身而是解决问题基于科学家们对 GA 的多年研究目前遗传算法已经广泛应用于社会科学经济学和机器学习等方向利用 291 概念的大量进化和遗传方面的遗传算法结合达尔文进化论和遗传学理论提出了一种新的直接搜索优化方法作为一个新的事物遗传算法重新定义了一些概念包括位串 Bit String 在染色体染色体的遗传学中是表示个体的概念群体 Population 对应于染色体收集的遗传学是代表性的组合基因 Gene 是构成字符串的一种元素它可以表示每个个体独有的特征基因特征 Gene Feature 基因位点相同的基因值基因位置 Gene Locus 基因在染色体上的坐标适应度 Fitness 将单一染色体适应环境适应良好的个体将优先继承相对较差适应性差获得遗传的可能性非常小其基本原理是处理染色体上的基因然后找出理想的染色体来进行试验这个原理也可以精品文档 14欢迎下载理解为模拟自然选择和遗传发生的复制交叉和突变现象原则可以来自任何一组初始种群选择随机选择交叉和突变将导致一组对环境更加敏感的个体并最终将群体演变成更好更好的搜索空间区域通过这样的一组行动将继续发展直到最适应个人环境并最终得到最优解的问题 30 遗传算法在问题优化过程的运行中是完全随机的通过求解最优运算直到遗传代数或适应度达到最终要求才能获得最优解算法的过程是一个循环的过程基本过程如图 2 3 所示 3 从图 2 3 可以看出算法所需的基本步骤包括 1 编码策略选择要解决问题的解决方案首先必须选择适当的编码策略将所选代码解决的问题转化为字符串结构空间 2 选择目标函数来定义适应度函数 f x 3 选择遗传策略确定初始种群数具体遗传操作设定概率值等遗传参数 4 人口初始化 5 通过函数计算适应度值 f x 6 根据遗传策略再次对群体进行遗传操作实现人口的演变 7 确定组的进化是否在多大程度上是否满足先前设定好的循环条件如果不满足则返回步骤 6 或直接通过修改遗传策略返回到步骤 6 2 3 2 遗传算法求解过程 1 遗传密码染色体的编码是遗传算法中需要解决的主要问题好的和坏的编码直接影响整个遗传算法是否收敛是否更快的收敛通用编码方式一般为三符号编码二进制编码浮点编码 f3 列如果您使用上述三种编码方法之一无论根据具体问题选择哪种类型的编码只需充分了解遗传算法中三种编码方法的特征从而做出正确的染色体代码将会有一个收敛可以和速度最好的解决方案这里有一些三种编码方法做一些介绍 1 符号编码符号编码在使用过程中不是常用的编码方法因为在交叉和突变方面难以实现这种编码字符串的符号组合是一些符号或字母而这些符号和字母没有具体含义而是一个代码在问题难以以数字和二进制方式进行编码的情况下或者在特定方向上解决实际问题的情精品文档 15欢迎下载况下易于使用编码例如遗传算法中的块编码 2 二进制编码二进制编码在使用过程中是非常常见的编码其特点是操作简单无论是编码还是解码都比较简单二进制编码是 0 和 l 的组合易于实现编码和解码遗传算子的操作过程比较简单然而二进制编码的缺点也是很多的对于连续多维函数的一些优化问题它不是可测试性不能直观地表达并且编码精度受到编码长度的限制在浮点编码和二进制编码时容易产生对方的错误从而影响整体的成败二进制编码具有优点和缺点 3 实数编码实际编码也是使用编码方法最常见的相对于二进制代码实际编码更适合于连续函数优化问题对于高精度的需要需要对大量真实编码的值进行编码更为合适与二进制码相比编码空间的实数也更大然而使用浮点编码来注意染色体的值必须在浮点范围内否则解将会溢出总的来说实数编码有更多的优势 2 人口初始化遗传操作前必须有涉及进化的原始人群人群可以随机生成可以由用户给出人口规模的选择很重要如果选择人口太大虽然可以找到最优解但收敛速度相对较慢这需要很多时间如果你选择一个小的人口虽然收敛速度更快但是找到的解决方案并不一定是最佳的解决方案因此人口规模的选择应以实际问题为依据以前的经验合理设定考虑到收敛速度和遗传结果一般来说初始组可以采取以下策略根据问题的固有知识尝试把握整个问题空间分布范围内的最优解占用空间然后根据分布范围设置初始组您也可以随机生成一定数量的个人然后选出最初添加到初始组中的个人重复该过程直到初始种群中的个体数目达到预定大小 3 适应度函数设计适应度函数是一个独立的个体其范围定义的领域功能是不断的不同的无论这些问题是不是固定的限制其设计是基于现实的解决方案适应度函数设计会影响质量对于遗传算法的搜索结果因为遗传算法的选择操作是基于个体的适应度值组中的每个人是否被消除该度量是根据适应度函数的个体的适应度值在自然界中每个生物体的演化是适应周围的自然环境健身功能作为环境的性质看每个人的个体离开个人能够适应个人的环境通过演化将更适应个人从而提高人口整体竞争水平适应度函数通常由正在研究的问题的目标函数来转化这里有一些最常见的适应度函数 1 直接从要解决的目标函数中转化的适应度函数即精品文档 16欢迎下载当目标函数是求解最小化问题时 Fit f x f x 当目标函数是求解最大化问题时 Fit f x f x 要直接解决的目标功能的适应度功能太简单有两个方面的弊病一方面可能与非负面需求的概率相反另一方面各种适应度值的分布所以平均适应度不能完全反映人口的平均表现而且还没有看到遗传算法的整体优化 2 如果目标函数最小化则如果目标函数是最大化的问题则其中是 f x 的最小估计与第一种方法相比第二种方法是一种改进的适应度函数称为极限施工方法但其阈值难以估计或不能估计 3 如果目标函数最小化则 1 类似于 2 C 是目标函数边界的保守估计在遗传算法的过程中适应度函数的选择是关键的一步这将影响遗传算法的演化这可能会影响遗传算法从而找到更好的结果 4 遗传操作遗传算法由三个基本的遗传操作组成选择操作交叉操作和变体这三种遗传算法是遗传算法的核心它们可以产生新的群体然后完成整个群体的演化 1 选择运算符在遗传算法中选择找到更适应个体消除低适应性个体操作的选择允许优秀的基因被保存导致更高的健康个人 331 选择操作是通过一组个人来适应能力的估计以下介绍今天几个主要的选择运算符 A 适应度比例法健身比法也称赌博选择方法是一种常用的方法这样一来个体在适应水平和个人能力水平可以从概率中选出的群体是一定的比例其理论基础如下我们可以设一个群体为 N 其中一个是 i 其适应度是所以个体 i 被选择的概率是精品文档 17欢迎下载通过上述公式我们可以看出如果适应度的适合度值较低则选择个体的概率将较小另一方面适应性越高个人被选择的概率就越大 B 最好的个人保存方法最好的个人保存方法是在人口中具有较高适应度的个体不必参与任何遗传操作直接拷贝继承到下一代这种方法避免了具有高适应度的个体的破坏但不能单独使用如果给定人口中没有最优解则该方法不太适合本地解决方案所有这些都需要其他选择算法的组合可以更全面 C 期望方法在选择投注时当个人数量小时不能完全反映个人的适应度可能存在高度的适应度被淘汰并且保持较低的适应度该方法的预期值可以解决这个问题主要思路如下计算组中每个个体的期望值如果个人被选中并交叉配对下一代计算期望需要输 0 5 另一方面如果个人没有参与交叉配对操作那么预期的数量应该减少 1 期望小于零的个人不再参与任何选择 D 排序选择方法该方法基于适应度计算的功能首先需要计算每个人的适合度值然后根据约定的概率对某一种方式排序的概率进行排序从而使每个人概率是他们自己的选择概率值 E 联赛选择方法该方法是将最高适应度的组直接输入到下一代继承中每次执行迭代直到迭代结束 2 交叉算子跨越的思想是保留遗传算法中良好个体的特征探索新的遗传空间产生新的个体并保持多样性 341 交叉运行可以提高人口的整体适应度主要交叉方式如下 A 一点交叉单点交叉是一个相对简单的交叉在个人的基因串中设置一个交叉点交叉点的设置是随机的交叉的两个人之间交叉的前后两个部分交叉如果基因组具有 N 个编码位置则可以跨越 N 1 个点精品文档 18欢迎下载 B 算术交叉当浮点编码时算术交叉的选择是一种比较常见的形式新的代码串由两个子代码的任意组合生成例如假设两个子编码字符串进行算术交叉操作并且通过该交叉操作生成的两个新的编码字符串如下在上述公式中编码的字符串 X1 和 X2 是组中的母体染色体是算术交叉后获得的后代的个体 a 0 1 被设置为常数上述操作过程中使用交叉运算是均匀算术交叉的方式当使用算术交叉操作时需要设置线性运算的组合系数然后根据上述公式可以得到两个新的编码字符串代码前后的交点需要特别注意一定要做同样的格式长度相同是促进遗传操作实施的唯一途径 3 变异算子为了保持人口的多样性有必要改变单个基因序列的某个位置的编码这是突变算子的基本内容当使用二进制编码时通过选择一些基因的值进行否定即 1 0 或 0 1 进行突变一般来说变异算子的实现基于 A 确定该基因座是在群体中所有个体的编码范围内随机选择的 B 基因突变的概率以提前设定的突变概率 P 进行遗传算法中使用变异算子有两个目的 1 当遗传算法搜索最优解时出现悬停现象变异算子具有随机搜索的能力它提供遗传算法向最优解逼近如果突变概率太大个体接近最优解整个搜索过程被破坏 2 遗传算法需要保持人口的多样性遗传算法需要保持人口的多样性避免早熟现象存在交叉算子遗传算法具有强大的全局搜索能力是遗传算法中最重要的遗传算子遗传算法的变异算子提供了本地搜索能力因此需要将其作为运算符的辅助函数在遗传操作过程中只有当交叉算子和变异算子结合使用时全遗传将快速准确地解决问题在解决复杂和现实的问题时基本的变异算子不能满足这导致了对变异算子的更多研究以下是几种变体方法基本位变化基本位变化主要用于二进制编码即随机选择一些基因位然后根据所选位上的突变概率为负将 1 变为 0 或 0 变为 1 B 均匀变化当编码方式为浮点编码时使用均匀的变化更多通过以较小的替代基因座上的原始基因精品文档 19欢迎下载的概率来代替均匀分布的随机数来进行均匀变化 C 边界变化根据上述操作的均匀变化进行边界变化在执行此操作时我们需要选择位于轨迹上方的两个相应边界基因的值并选择其中一个被替换当没有其他约束时遗传编码很长这种变化会产生负面影响只有当个人接近最优解时这段代码才会起到很好的效果 D 不均匀变化变分运算符与人口的进化代数相关联因此在进化的早期阶段变异范围具有相对较大的空间而在进化过程中变异空间将越来越小操作员接近零所有的变异算子对整个遗传进化都有微调效应 5 参数选择根据遗传算法的应用我们需要设置一些参数包括总组的大小染色体的长度和各种操作符的出现概率这些参数是重要的需要设置为适当的参数值因为它们与以后优化的结构有关下面我们将对这些参数进行一些简短的描述 1 染色体长度选择染色体的长度不尽可能长染色体计算精度的长度虽然较高但计算时间却很长为了平衡计算精度和计算时间有学者在优化过程中研究了染色体编码同时具有良好的遗传优化效果 2 人口规模的选择人口规模的大小应该在适当的范围内如果所选择的人口规模太大可以找到最优解但如果所选择的群体规模太小遗传时间将会使遗传时间特别长会很短但不一定找到最优解因此人口规模的选择应根据实际问题一般选择范围 20 200 3 交叉概率的选择由于交叉算子的存在遗传算法将具有全局搜索的能力交叉概率的选择也应在适当的范围内交叉概率太大会导致优秀基因的损失交叉概率太小会影响整个遗传的效率在大多数情况下交叉概率的选择范围从 0 6 到 1 如果在遗传过程中使用自适应调整交叉概率可能会有更好的结果 4 突变概率的选择突变操作是遗传位突变操作的个体编码变异概率必须选择合适的范围一般变异概率在 0 005 0 01 之间过多的突变概率将导致个体接近最优解的更大变化这不利于收敛变异概率太小将导致早熟现象如果遗传过程中使用自适应调整突变概率可能会有较精品文档 20欢迎下载好的效果其实在遗传算法的实际应用中没有一套数据可以应用于所有参数的情况参数的选择受到很多因素的影响没有绝对的标准如果要选择最佳参数则需要根据实际问题进行深入研究 2 3 3 遗传算法的优点遗传算法在处理复杂系统优化方面具有很强的适用性遗传算法在搜索过程中只需要确定目标函数的搜索方向和相应的适应度函数遗传算法为解决复杂系统问题提供了一个共同的系统它不依赖于具体领域的问题可以广泛用于许多科学 35 61 与其他系统优化搜索算法相比遗传算法在解决系统优化方面具有很大的优势主要表现在以下几个方面遗传算法由于其进化特征解决问题的方法并不多经过编码处理遗传算法应用于遗传过程中基因的遗传和遗传过程导致优化过程的适应性编码问题的方法比一般算法更为普遍优越 2 遗传算法从多个搜索点同时进行搜索有利于全局优化遗传算法从解决方案的求解器开始而不是从单个解决方案开始传统优化算法的主要缺点是单点搜索开始算法很容易陷入局部最小点 37 这不能解决全局最小点直接进入局部最优解遗传算法可以同时处理群体中的多个个体具有潜在并行性因此遗传算法整合了定向搜索和随机搜索的优势在更好的区域搜索和强大的空间扩展之间取得了一定的平衡 3 遗传算法只需要根据适应度函数值即可确定搜索方向 f3 81 其最大的优点基本上不用搜索空间知识或找到其他辅助信息只有适应度函数值可以评估个人作为相应遗传操作的基础一些传统的优化算法使用辅助功能信息来根据目标函数值来确定搜索的方向适应度函数不受连续可微约束的约束其定义域也可以根据需要任意设定该特征使得遗传算法的应用大大扩展这种确定搜索方向的方法使得在具有高适应度函数值的解空间中定位搜索空间变得容易从而在一定程度上提高了搜索的效率 2 4 总结本章介绍了 BP 神经网络的原理和算法并分析了 BP 神经网络在股票预测中的应用同时介绍遗传算法的原理和基本操作分析遗传算法在优化问题求解中的优势第三章基于遗传神经网络的股票预测模型评估学习算法有许多标准但核心依然是简单性可塑性和有效性一般来说简单的算法很难有效塑料算法不是太简单有效的算法需要完善和特异性从而与可塑性和简单精品文档 21欢迎下载性相冲突 BP 算法是基于梯度法简单和塑性是其主要优点但 BP 算法这种方法也有其缺陷一方面收敛速度较慢另一方面也受到局部极小的麻烦遗传算法是一种全球搜索算法它是从多个初始点到多方向搜索组的潜在解决方案该搜索允许其跳出局部最优解的能力具有良好的全局搜索能力为了补偿 BP 算法的缺点提高算法的效率我们可以使用遗传算法优化 BP 神经网络目前有三种常用的优化方法 41 1 使用遗传算法优化 BP 神经网络的权重和阈值 2 采用遗传算法优化 BP 神经网络的拓扑结构 3 利用遗传算法对 BP 神经网络学习规则进行优化使其能够适应问题和环境的要求 3 1 遗传神经网络算法遗传算法优化 BP 网络包括三种方法包括 1 连接权重和阈值的优化 42 在学习 BP 网络的过程中根据连接权的一定变更规则获得连接权重在训练过程中进行连续调整以获得较好的连接权限分配然而由于要优化的目标函数非常复杂 BP 算法不能使用一维搜索方法来计算每个调整的步长导致算法的效率如果训练时间太长则 BP 算法将落入局部最小值无法获得最优连接权重分布使用遗传算法优化连接权可以解决这个问题具体优化过程如下 A 首先随机生成一组分布形成一系列权重或净值使用编码方案进行编码然后构造一个表示网络权重分配的字符串因为以前的网络结构并且学习规则已经确定则字符串对应于权重和阈值以获取神经网络的特定值 B 其次计算新生成的神经网络的误差函数通过该函数确定其适应度函数的值一般来说误差越大适应度越小 C 将个体中适应度最大的直接送到下一代 D 最后目前一代群体进行交叉和突变等遗传操作造成新一代群体精品文档 22欢迎下载 E 重复步骤 b d 不断发展初始权重分布直到满足训练目标 2 网络结构优化网络结构由网络拓扑结构和节点转换功能两部分组成优点结构将严重影响网络处理能力良好的结构需要同时满意解决不产生冗余节点和冗余连接到目前为止人们在设计网络结构时一般使用以下两种方式首先是预先确定的二是使用增量或减少检测方法增量检测方法是在训练过程中从较小的网络结构最小数量的隐层节点和连接权根据具体需要不同的问题逐步增加各种结构部分直到找到相应的网络结构解决问题使用该方法的减少检测方法恰恰相反通过遗传算法演化神经网络结构的步骤是 A 随机生成 N 个结构对每个结构进行编码使得每个编码的个体对应于一个结构 B 以多种不同的初始权重分布训练个体浓度的结构 C 根据培训结果或其他策略确定每个人的适应度 D 选择一些具有最大适应度值的个体直接继承下一代 E 遗传作业如当代一代的交叉和突变以产生下一代群体 F 重复 b e 的步骤直到当前一代的个人能够满足要求 3 优化学习规则在神经网络系统中学习规则决定了系统的功能在采用遗传算法之前先进行神经网络训练中的学习规则采用遗传算法后神经网络中的学习规则将演变为满足问题和环境的要求进化学习规则的过程可以描述为 44 A 随机生成 N 个个体每个个体代表学习规则 B 构建训练集每个元素代表一个结构连接是一个随机或预先确定的神经网络然后用每个学习规则对训练集的元素进行训练 C 计算每个学习规则的适应度 D 根据适应度选择 E 遗传操纵每个编码学习规则以产生下一代个体 F 重复 b e 步骤直到满足要求精品文档 23欢迎下载遗传神经网络的构建步骤主要包括优化方案编码方案适应度函数遗传操作和神经网络的训练算法 1 确定优化程序您可以选择使用 4 1 1 中描述的优化方案之一或组合多个场景进行优化在本文中方案 1 用于使用遗传

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于神经网络的股价预测

文档简介

温馨提示

最新文档

评论

基于神经网络的股价预测

文档简介

温馨提示

最新文档

评论

相关文档