版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于BP神经网络-ARIMA复合模型的股价预测实证研究目录TOC\o"1-3"\h\u18649第一章、绪论 283941.1研究背景与意义 267611.2研究目标和方法 221609第二章、文献综述 628738第三章、相关理论 8173693.1ARIMA模型 814333.2神经网络 913563第四章、ARIMA-BP神经网络组合模型 1126584.1数据选取 11233544.2数据处理 11170154.2.1收盘价ADF检验 12226894.3BP神经网络模型预搭建阶段 13263494.4BP神经网络模型训练阶段 14277444.5搭建ARIMA模型 1789504.6BP神经网络-ARIMA组合模型预测 1825236第五章、稳定性检验 2043645.1数据周期对股价预测的影响 20141705.2训练次数对股价预测的影响 225695.3个股选择对股价预测的影响 23121495.4样本容量对股价预测的影响 2326792参考文献 25摘要:通过在A股市场的28个板块中,综合考量成交量、EXPMA指数平均数、PRICEOSC指标等技术指标,每个板块选取两支股票,获取每支股票从2019年1月2日9:31到2021年3月19日15:00共计128,881个分钟收盘价。总训练库数据个数7,217,336个。利用总训练库的数据,将模型的预测效果作为衡量标准,不断修改完善预设的BP神经网络模型的基本参数,并探索搭建好的BP神经网络模型的预测期数。本文通过发挥ARIMA模型趋势性预测良好的优势,降低BP神经网络模型的深度学习难度,进而提高了BP神经网络模型的预测精度,并且在成功扩大了预测期数。BP神经网络-ARIMA复合模型很好的提高了BP神经网络模型的整体性能。针对新提出的模型进行了稳定性分析,考虑了研究对象、持仓时间、数据时间周期对模型的影响。仿真实验证明该模型的预测效果稳定,说明该模型具有普遍适用性、市场实用性和稳定可行性。该模型可以为众多投资者和市场监管者带来一定的指导方向和参考价值。关键词:BP神经网络模型;ARIMA模型;股价预测第一章、绪论1.1研究背景与意义随着中国金融市场的蓬勃发展,股票市场愈发受国内投资者青睐。股票价格的趋势判断备受学术界与金融投资界关注。股票价格的变化是一种振荡明显、不稳定、复杂且难以预测的时间序列。收盘价是一个包含非常多投资信息的价格,不仅反映着金融市场对某只股票的关注程度,也有能预示下一交易时间段的股价走势的作用。对于收盘价的预测具有十分重要的现实投资意义。由于传统非人工智能的方法在处理海量、庞杂的股价数据工程量大,在实际预测中往往不尽如人意。为模拟现代投资的分散非系统性风险的实际需求,本文使用金融预测中前沿的机器学习之BP神经网络模型(卷积神经网络),在海量的数据集中找到最优学习集合。且与ARIMA模型结合,修正神经网络模型在预测时的精度问题,进一步提高神经网络模型在预测时的准确度。BP神经网络-ARIMA复合模型在实际股票组合投资中具有良好的指导意义与潜在价值,是一款新型高效准确的组合投资的预测模型,供机构投资者参考。1.2研究目标和方法本文旨在通过优化深度学习之神经网络模型来实现对股票收盘价的预测。借助BP神经网络模型、LSTM神经网络模型、ARIMA模型、深度学习等相关理论基础,构建ARIMA-BP神经网络模型与ARIMA-LSTM神经网络模型,通过对各种模型预测结果的比较分析,筛选出效果最优的复合模型。最后将最优模型应用于分散化投资,进行模型的稳定性分析,若预测结果稳定且准确,此组合模型便具备日常股票投资的实用性与实用性。本文在A股市场全部28个板块中(农林牧渔、采掘、化工、钢铁、有色金属、建筑材料、建筑装饰、电气设备、机械设备、国防军工、汽车、电子、家用电器、食品饮料、纺织服装、轻工制造、医药生物、公用事业、交通运输、房地产、银行、非银金融、商业贸易、休闲服务、计算机、传媒、通信、综合),根据成交量、EXPMA指数平均数、PRICEOSC指标、MACD指数平滑异同平均指标等,在每个版块选取两只业绩优良并且流通市值位居板块前列的股票,共计56只股票。每只股票通过爬虫方法获取2019年1月2日9:31-2021年3月19日15:00共计128,881个分钟收盘价。总训练库数据个数为7,217,336个。整个实证过程分为四个阶段:1.数据预处理与模型预训练阶段。首先将56支股票的原始收盘价数据分为1分钟收盘价数据、5分钟收盘价数据、20分钟收盘价数据、一小时收盘价数据、日收盘价数据五类,分别进行稳定性分析,将不平稳的数据做n阶差分处理(做了差分处理的数据,在模型最后再做反归一化处理,获得价格数据),得到按照时间间隔划分的平稳收盘价数据。之后开始搭建BP神经网络模型与LSTM神经网络模型。在进行海量测试后发现,对于收盘价的预测而言,BP神经网络模型的预测效果显著大于LSTM神经网络模型的预测效果,笔者本人最终采取BP神经网络模型作为复合模型的一部分。通过预设输入层感知器个数、隐含层层数、隐含层每层感知器个数、输出层感知器个数、输入层到隐含层的权重、隐含层到传输层的偏置、学习速率、选取合适的激励函数等,通过这56支股票的平稳收盘价数据不断输入预搭建的BP神经网络模型,将得到的预测结果于真实数据做对比,不断修改完善以上模型的基本参数,最终获得最优模型基本参数,并且初步探索可预测期数,模型预搭建完成。BP神经网络模型股价预测训练过程示意图2.BP神经网络模型搭建与训练阶段。对于“收盘价”的五组分时训练的平稳数据,通过对比不同基本参数得到的预测结果的准确度,最终选取了“1-12-1-1”的BP神经网络模型,即一层输入层(其中感知器个数为1)、两层隐含层(其中感知器个数分别为12和1)、一层输出层(其中感知器个数为1)的模型构造。激励函数选取Sigmoid函数,由于BP神经网络模型具有误差反向传播的特点,本文通过梯度下降法计算梯度进行迭代,更新参数向量。模型搭建完成,将平稳的收盘价数据输入模型,找到最优机器学习的次数,设定该次数为本BP神经网络模型的迭代次数,划分训练集与预测集,以训练集数为600,预测集数为200,共800个数据,机器学习次数为500次,预测期数为2期为例,训练集输入1-598的收盘价数组,通过模型初步预测,输出3-600的收盘价数组,预测值即为数组中599号与600号两个收盘价,与训练集中的599号与600号收盘价做对比,第一次预测偏差较大,该1-598的收盘价数组被重新导入输入层,整个模型更新输入层到隐含层的权重与隐含层到输出层的权重,并且该数组会选择新的进入隐含层的感知器。以上过程为一次机器学习的内部过程。通过以上500次机器学习过程,模型根据损失函数设置了最优的内部参数,再将预测集的数据导入,输入601-798的收盘价数组,通过500次机器学习,最终输出603-800的收盘价数组,最后两期799号与800号收盘价数据,即为BP神经网络的预测数据。如果输入的数据是经过差分处理的数据,那么得到的输出数据还需进行反归一化处理,才能获得最终的预测收盘价。BP神经网络模型内部结构示意图3.ARIMA-BP神经网络组合模型搭建与测试阶段。该阶段为对BP神经网络的优化阶段。通过实验可以得知,BP神经网络在对噪声的学习效果并不是特别理想,而ARIMA模型在处理收盘价这种时间序列在短期效果明显,但ARIMA点拟合效果不佳,但趋势拟合效果较优,ARIMA模型和BP神经网络模型可以互补短处,将ARIMA模型融入BP神经网络的预测中,可以提高BP神经网络模型的预测能力。以训练集数为600,预测集数为200,共800个数据,机器学习次数为500次,预测期数为2期为例,改良后的组合模型实现如下:通过ARIMA模型先对着800个数据进行平稳化处理。训练集与测试集确定最优ARIMA模型,并往后预测5%样本大小的数据。新的训练集为1-570为原始平稳数据,571-600为ARIMA预测数据;新的预测集为601-790为原始平稳数据,791-800为ARIMA预测数据。将新的训练集与预测集代入第二阶段实验,训练BP神经网络模型,得到组合模型预测结果。并与ARIMA模型,BP神经网络模型,LSTM神经网络模型,ARIMA-LSTM组合神经网络模型预测结果作对比,找出最优模型。ARIMA-BP神经网络组合模型示意图4.稳健性检验阶段。更换输入样本的时间类型,分别代入1分钟收盘价数据、5分钟收盘价数据、20分钟收盘价数据、一小时收盘价数据、日收盘价数据的样本,重复实验。并且在实验中适当扩大缩小样本的大小,以确定样本类型对该组合模型的影响程度。
第二章、文献综述传统金融学派将股票价格的变动因素归结为宏观、中观和微观三个层面。宏观层面包括银行存款利率、国际收支、经济增长情况、货币供应量等社会、政治、经济、军事、文化等因素;中观层面包括该只股票所处行业的行业前景、行业地位、行业生命周期等行业发展与区域经济发展状况对该只股票的影响因素;微观层面包括该只股票上市公司的经营状况、财务状况、管理水平、行业竞争水平等上市公司自身状况的因素。其中,稳固基础理论将股票的内在价值视为未来全部股息的“现值”,实际中长期增长率与增长周期的不可预测让这种方法失去计量的准确性。吴玉桐(2008)[1]吴玉桐,梁静国.股票价格的影响因素研究[J].现代管理科学,2008(07):111-112.认为股价的变化时投资者的心理预期在股市中的综合反应。股票价格受到诸多因素的影响,价格变化呈现非线性变化,传统的预测方式并不适用于A股市场,基于股价的线性与非线性变化的假设中,有许多学者建立单一模型与复合模型将模拟数据逼近所研究的股票价格的变化。[1]吴玉桐,梁静国.股票价格的影响因素研究[J].现代管理科学,2008(07):111-112.首先,基于股价在较短波动范围内呈现线性变化的假设,国内外学者普遍采取ARIMA模型来对股价进行预测,翟志荣(2010)[2]翟志荣,白艳萍.基于MATLAB的自回归移动平均模型(ARMA)在股票预测中的应用[J].山西大同大学学报(自然科学版),2010,26(06):5-7.搭建ARIMA模型预测单只股票的收盘价,相较于其他预测方法而言,对于波动不剧烈的股票样本预测精度很高。徐晨萌(2019)[3]徐晨萌,方华.运用ARMA模型对股价预测的实证研究[J].经济研究导刊,2019(31):77-82.ARMA模型可以较好地解决非平稳金融时间序列的预测。高斯神经网络预测(2004)[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.、高斯回归过程预测(2013)[5]杨振舰,夏克文.基于高斯过程回归的上市股价预测模型[J].计算机仿真,2013,30(01):293-296+304.、灰色预测法(2015)[6]周琴,雍丹丹,王兴龙.灰色神经网络在股价预测中的应用[J].商,2015(39):169-170.、马尔科夫链[7]张紫乾,刘明婉.马尔科夫链模型对短期股价的预测[J].大众投资指南,2019(12):272.等。在很多情况下,股价的变化存在非常复杂的噪声,对股价在较短波动范围内呈现线性变化的假设是忽略这些噪声的,所以在精度层面而言,并非最佳模型。并且由于股价波动剧烈,且数据噪声较大,传统的线性模型难以准确刻画股价波动的内在规律。[2]翟志荣,白艳萍.基于MATLAB的自回归移动平均模型(ARMA)在股票预测中的应用[J].山西大同大学学报(自然科学版),2010,26(06):5-7.[3]徐晨萌,方华.运用ARMA模型对股价预测的实证研究[J].经济研究导刊,2019(31):77-82.[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.[5]杨振舰,夏克文.基于高斯过程回归的上市股价预测模型[J].计算机仿真,2013,30(01):293-296+304.[6]周琴,雍丹丹,王兴龙.灰色神经网络在股价预测中的应用[J].商,2015(39):169-170.[7]张紫乾,刘明婉.马尔科夫链模型对短期股价的预测[J].大众投资指南,2019(12):272.所以国内外学者开始向“股价呈现非线性变化”的方向探索。实际上股票价格的波动受历史数据、地方与国家对于该行业的政策等影响,突发事件、股民的心理预期等也会在不同程度上影响股价的变动,所以线性预测模型难以精准预测股价的变化规律。基于股价在较短波动范围内也会呈现非线性变化的假设,国内外学者普遍以SVM模型为基础,邬春学(2018)[8]邬春学,赖靖文.基于SVM及股价趋势的股票预测方法研究[J].软件导刊,2018,17(04):42-44.从不同角度优化SVM模型,从而达到精准预测股价的目的。杨新斌(2010)[9]杨新斌,黄晓娟.基于支持向量机的股票价格预测研究[J].计算机仿真,2010,27(09):302-305.建立基于支持向量机(SVM)的股市预测系统模型,发现支持向量机模型比神经网络和CAR模型有较高的预测精度,证明SVM模型适用于股市预测等非线性问题的预测。谢国强(2012)[10]谢国强.基于支持向量回归机的股票价格预测[J].计算机仿真,2012,29(04):379-382.基于粒子群优化支持向量机(SVM),利用粒子群算法良好的寻优能力,对支持向量机参数进行优化,加快支持向量机学习速度,再采用非线性预测能力优异的支持向量机对股票价格进行预测。Zhongx(2012)[11]ZhongxinDing.ApplicationofSupportVectorMachineRegressioninStockPriceForecasting[A].IntelligentInformationTechnologyApplicationAssociation.AdvancesinIntelligentandSoftComputing143[C].IntelligentInformationTechnologyApplicationAssociation:智能信息技术应用学会,2011:7.发现SVM模型能全面反映股票价格变化的非线性的时变规律。但是单纯使用SVM模型有两个很大的问题需要解决,SVM模型的参数优化问题与预测区间过窄的问题。为了满足实际投资者对于预测区间范围的需要,国内外学者开始聚焦神经网络技术(ANN)在股价预测中的作用。[8]邬春学,赖靖文.基于SVM及股价趋势的股票预测方法研究[J].软件导刊,2018,17(04):42-44.[9]杨新斌,黄晓娟.基于支持向量机的股票价格预测研究[J].计算机仿真,2010,27(09):302-305.[10]谢国强.基于支持向量回归机的股票价格预测[J].计算机仿真,2012,29(04):379-382.[11]ZhongxinDing.ApplicationofSupportVectorMachineRegressioninStockPriceForecasting[A].IntelligentInformationTechnologyApplicationAssociation.AdvancesinIntelligentandSoftComputing143[C].IntelligentInformationTechnologyApplicationAssociation:智能信息技术应用学会,2011:7.1987年,Ledes和Farbor第一次将神经网络(ANN)运用到预测领域中,人工神经网络是由大量简单的处理单元按照某种方式联结而成的自适应的非线性系统.它具有高度的非线性全局作用与自学习功能,并且可以逼近任何连续函数,是预测股价的一种有效方法。但是RezaRamezanian(2019)[12]RezaRamezanianandArsalanPeymanfarandSeyedBabakEbrahimi.Anintegratedframeworkofgeneticnetworkprogrammingandmulti-layerperceptronneuralnetworkforpredictionofdailystockreturn:AnapplicationinTehranstockexchangemarket[J].AppliedSoftComputingJournal,2019,82认为使用人工神经网络考虑股票价格时,具有时变性,且存在过拟合、局部最小等缺陷,预测结果有时不可靠,限制其在股票价格这种非线性、时变性问题的应用。人工神经网络是证券市场预测研究的一个发展方向,但杨振舰(2013)[5]杨振舰,夏克文.基于高斯过程回归的上市股价预测模型[J].计算机仿真,2013,30(01):293-296+304.认为目前在神经网络的构造、专家经验的提取、模糊形态的建立等方面,还不能得到满意的结果。如隐含层数的选择、过分强调拟合问题、局部最小值以及泛化性能不强。到后来的模糊神经网络预测[13]刘庆玲.基于模糊深度学习网络算法的短期股价预测[D].哈尔滨工业大学,2016.、高斯神经网络(MatthiasSeeger)[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.、BP神经网络预测[14]陈小玲.基于ARIMA模型与神经网络模型的股价预测[J].经济数学,2017,34(04):30-34.、RBF神经网络预测[15]俞国红,杨德志,丛佩丽.ARIMA和RBF神经网络相融合的股票价格预测研究[J].计算机工程与应用,2013,49(18):245-248+259.[12]RezaRamezanianandArsalanPeymanfarandSeyedBabakEbrahimi.Anintegratedframeworkofgeneticnetworkprogrammingandmulti-layerperceptronneuralnetworkforpredictionofdailystockreturn:AnapplicationinTehranstockexchangemarket[J].AppliedSoftComputingJournal,2019,82[5]杨振舰,夏克文.基于高斯过程回归的上市股价预测模型[J].计算机仿真,2013,30(01):293-296+304.[13]刘庆玲.基于模糊深度学习网络算法的短期股价预测[D].哈尔滨工业大学,2016.[4]MatthiasSeeger.GaussianProcessesforMachineLearning[J]InternationalJournalofNeuralSystems,2004.[14]陈小玲.基于ARIMA模型与神经网络模型的股价预测[J].经济数学,2017,34(04):30-34.[15]俞国红,杨德志,丛佩丽.ARIMA和RBF神经网络相融合的股票价格预测研究[J].计算机工程与应用,2013,49(18):245-248+259.BP神经网络模型是金融与经济领域应用非常广泛的神经网络模型,是一种通过误差逆向传播算法训练的多层前馈神经网络。具有了较强的非线性映射能力、泛化以及容错能力等诸多优点。樊重俊等(2008)[16]樊重俊.非线性经济预测中的神经网络方法评述[J].统计与决策,2008(13):161-162.通过对神经网络方法和传统统计预测方法的比较,说明了神经网络方法有助于提高预测精度;郝勇等(2006)[17]郝勇,运用神经网络技术研究上海证券股票价格分类指数的波动规律.上海市,上海工程技术大学,2006-01-01.运用BP神经网络,对公用事业指数波动规律进行预测和分析,达到了较理想的预测效果。但是传统BP模型存在着变量选择困难、收敛速度慢和无法用于训练深层神经网络等缺点。并且BP神经网络模型隐含层的单元数却很难判定:单元数量过少会影响模型训练和预测的精度,实证效果降低;另外,过多单元数则会影响网络概括推理能力。可见,模型设定是否成功在于精准确定隐含层层数以及相应的单元数。[16]樊重俊.非线性经济预测中的神经网络方法评述[J].统计与决策,2008(13):161-162.[17]郝勇,运用神经网络技术研究上海证券股票价格分类指数的波动规律.上海市,上海工程技术大学,2006-01-01.针对BP神经网络模型的各种不足,国内外学者从不同的角度对该模型进行优化:(一)部分学者通过优化模型的算法来提高模型预测的精度。徐清风(2021)[18]徐清风,于茹月,勾宇轩,赵云泽,李勇,黄元仿.基于云遗传BP神经网络的黄淮海旱作区土壤有机质预测精度分析[J].中国农业大学学报,2021,26(04):167-173.[18]徐清风,于茹月,勾宇轩,赵云泽,李勇,黄元仿.基于云遗传BP神经网络的黄淮海旱作区土壤有机质预测精度分析[J].中国农业大学学报,2021,26(04):167-173.通过使用云遗传算法的BP神经网络模型,提升了BP神经网络模型的预测效率;曹晓(2017)[19]曹晓,孙红兵.基于灰色GARCH模型和BP神经网络的股票价格预测[J].软件,2017,38(11):126-131.使用灰色GARCH-BP神经网络复合模型,弥补bp算法的低精度问题。GARCH残差序列经过BP神经网络模型的测算后,利用预测值矫正灰色GARCH模型的预测结果,提高了股票价格的预测精度。(二)有些研究致力于提高BP神经网络模型的运算速度。郭明霄(2021)[20]郭明霄,王宏伟,王佳,李昊哲,杨仕旗.基于动量分数阶梯度的卷积神经网络优化方法[J/OL].计算机工程与应用:1-9[2021-05-03]./kcms/detail/11.2127.TP.20210420.1125.042.html.动量分数阶梯度下降算法,解决了传统BP神经网络使用梯度下降法导致的收敛速度非常慢的问题,大大提升了BP模型的训练速度。如何更好地将BP模型应用于金融领域一直是各界学者想要解决的问题。[19]曹晓,孙红兵.基于灰色GARCH模型和BP神经网络的股票价格预测[J].软件,2017,38(11):126-131.[20]郭明霄,王宏伟,王佳,李昊哲,杨仕旗.基于动量分数阶梯度的卷积神经网络优化方法[J/OL].计算机工程与应用:1-9[2021-05-03]./kcms/detail/11.2127.TP.20210420.1125.042.html.BP神经网络的组合模型相对于单一模型,前者具有高精准度和预测精度,强健性和强抗过度拟合能力等优势。本文通过发挥ARIMA模型趋势性预测良好的优势,降低BP神经网络模型的深度学习难度,可以扬长避短,能够更有效地研究股票价格的运行规律和趋势走向。
第三章、相关理论3.1ARIMA模型(一)ARMA模型理论基础
ARMA模型也称Box–Jenkins模型,简称B-J法,20世纪70年代初,是美国统计学家Box和英国统计学家Jenkins共同提出的一种时间序列的分析方法。在当前经济学的研究中,ARMA模型是拟合平稳时间序列最常用的模型。平稳性时间序列是指当时间发生变化时该序列的基本性质不会发生变化;而非平稳性时间序列,则是指统计规律随着时间的变化而变化。因此,当我们得到一组时间序列数据时,首先要对其进行ADF检验以判断该组数据的平稳性,若得到的时间序列是非平稳的,我们就需要对原始数据进行对数或差分处理使其平稳。其次,绘出平稳时间序列的ACF与PACF的图像,确定几个备选模型。然后对每个备选模型进行估计与检验,并根据备选模型的SC、AIC以及拟合度R2判断模型是否满足简约性,即最小的SC、ARMA模型是由自回归模型AR(p)模型和移动平均模型MA(q如果时间序列yt的每个观测值都是当期及其前期随机扰动项的加权平均和,那么该过程是移动平均过程,可用MA(y而AR(p)模型和MA(q)模型都是ARMA(p,q)的特例:当p=0时,ARMA(0,q)即为MA(q)模型;当y其中,(二)ARMA模型的定阶与识别在模型的定阶与识别时,我们主要观察不同时间点上的自相关函数与偏自相关函数。做出该时间序列每个时间点上的观察值,获得极端值、缺省值、结构变化等隐含在数据中的信息。当时间序列非平稳时,我们可以先更正极端值与缺省值或进行一阶差分使其平稳化,然后进行p和q阶数的确定。对于MA(q)过程,ACF会在q阶之前显示显著异于零的自相关系数,而在q阶之后立刻衰减;而PACF则以指数形式迅速衰减或是以正弦波形式振荡衰减。相对于MA过程,AR(p)过程的ACF以指数形式迅速衰减或是以正弦波形式振荡衰减;而PACF则会在p阶之前表现出显著的峰值即自相关性,随后迅速下降。如果ACF与PACF无一衰减,均显示为拖尾,那么数据就很有可能是两者结合的过程,我们则选择建立(三)ARIMA模型的定阶与识别ARMA(p,d,qARMA(1-其中3.2神经网络神经网络分为生物神经网络与人工神经网络两种。生物神经网络,一般指生物的大脑神经元、细胞、触点等组成的网络。用于产生生物的意识、帮助生物进行思考和行动。人工神经网络(ArtificialNeuralNetworks,简称为ANNs)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的数学模型。这种网络依靠系统的复杂程度,通过调节内部大量节点之间相互连接的关系,从而达到处理信息的目的。BP(BackPropagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念。是一种按照误差逆向传播算法训练的多层前馈神经网络,也是应用最广泛的神经网络。BP神经网络模型BP神经网络是一种典型的非线性算法。BP神经网络由输入层、输出层和之间的若干层(一层或多层)隐含层构成。每一层可以有若干个节点。这个节点又被称为感知器。层与层之间节点的连接状态通过权重来体现。如果只有一个隐含层,便是传统的BP神经网络模型,若含有多个隐含层,则属于深度学习的神经网络模型。其中,BP神经网络的机器学习方式为反向传播方式,训练BP神经网络的方法为梯度下降法。1.感知器—BP神经网络中的单个节点感知器是1950年由FrankRosenblatt第一次引入。包括输入项、权重、偏置、激活函数、输出组成。感知器构成图其中,X1、X2和X3为输入节点,W1、W2和W3为权重,b为偏置,激活函数为f,输出节点为output。2.BP神经网络的反向传播BP神经网络模型的反向传播流程图BP神经网络的反向传播,是指将输出的结果与理想的输出结果进行比较,将输出结果与理想输出结果之间的误差利用网络进行反向传播的过程,本质上是一个“负反馈”的过程。具体的过程是通过多次迭代的过程,不断地对网络上各个节点之间的所有权重进行调整,权重调整的方法为梯度下降法。3.梯度下降法梯度是一个矢量,表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(梯度方向)变化最快,变化率(该梯度的模)最大。当梯度取“正”时,上升最快;梯度取“负”时,下降最快。梯度下降法是训练神经网络和线性分类器的一种普遍方法。很多深度学习实际上都是在计算梯度,然后通过梯度进行迭代,更新参数向量。第四章、ARIMA-BP神经网络组合模型4.1数据选取股票收盘价中,不同时间间隔的收盘价数据所包含的影响股价的信息存在差异,样本训练集和预测集中数据的间隔频率、样本容量都会影响模型的预测准确效果,现有研究都聚焦于日度数据,日度数据确实能很好的反映每天股价的总体震荡情况,但是以日度数据为研究对象建立的模型却不能很好的刻画收盘价波动的内在规律,会失去非常多的交易信号。样本容量在机器学习中也是非常关键的问题。如果样本容量过大,机器学习中会因为计算各种复杂参数导致“过拟合”问题,若样本容量过小,则机器学习不充分,模型的拟合能力较差。在本节中建立BP神经网络模型的部分,也会探讨这个问题。本文在A股市场全部28个板块中(农林牧渔、采掘、化工、钢铁、有色金属、建筑材料、建筑装饰、电气设备、机械设备、国防军工、汽车、电子、家用电器、食品饮料、纺织服装、轻工制造、医药生物、公用事业、交通运输、房地产、银行、非银金融、商业贸易、休闲服务、计算机、传媒、通信、综合),根据成交量、EXPMA指数平均数、PRICEOSC指标、MACD指数平滑异同平均指标等,在每个版块选取两只业绩优良并且流通市值位居板块前列的股票,共计56只股票。每只股票通过爬虫方法获取2019年1月2日9:31-2021年3月19日15:00共计128,881个分钟收盘价。总训练库数据个数为7,217,336个。这里以单支股票平安银行(股票代码000001)为例,解释每支股票的收盘价数据是如何影响BP神经网络模型的预搭建过程的。4.2数据处理将平安银行(股票代码000001)的原始分钟收盘价数据分为1分钟收盘价数据、5分钟收盘价数据、20分钟收盘价数据、一小时收盘价数据、日收盘价数据五类,分别标记为1-5号样本。下面分别对这五个样本进行平稳性检验。4.2.1收盘价ADF检验1-5号样本平稳性检验结果如下表所示,5个样本均需要进行差分使之平稳。1-5号样本数据ADF检验表1分钟数据5分钟数据20分钟数据一小时数据日数据TestStatistic-1.567812-1.102833-2.101261-2.450267-1.581319P-value0.75830.71670.24430.12830.4915CriticalValues:-3.43(1%)、-2.86(5%)、-2.57(10%)通过ADF检验可知,这五个样本均不平稳,分别进行一阶差分处理后,对原始数据进行一阶差分后的序列图与原本的序列图更趋于平稳:1号样本时间序列趋势图1号样本自相关及偏自相关图我们可以大致判断经过一阶差分后的时间序列为平稳时间序列。经过一阶差分处理后的DY序列的自相关系数和偏自相关系数迅速趋于0,围绕0上下波动,并且自相关图和偏自相关图呈现明显的拖尾。依据模型识别的基本原则,我们选择建立ARIMA模型,模型中p和q阶数的确定我们可以根据信息准则进行选择。但是,单单用图形法来判断该组时间序列的平稳性并不能得出确切的结论,我们仍需进行ADF的单位根检验以判断该序列是否是真正的平稳时间序列。我们选择无趋势项和无常数项进行ADF检验,新的TestStatistic值与P值如下表所示。可以得到一阶差分后,5个样本均在99%的显著性水平上呈现平稳状态。将1-5号样本差分后的新样本分别记为A、B、C、D、E号样本。1-5号样本差分后数据ADF检验表1分钟数据5分钟数据20分钟数据一小时数据日数据TestStatistic-99.638-32.414-13.886-47.109-23.517P-value0.0000.0000.0000.0000.000Lags13232900CriticalValues:-3.43(1%)、-2.86(5%)、-2.57(10%)4.3BP神经网络模型预搭建阶段将平安银行(股票代码000001)的原始分钟收盘价数据分为1分钟收盘价数据、5分钟收盘价数据、20分钟收盘价数据、一小时收盘价数据、日收盘价数据五类,分别标记为1-5号样本。分别进行ADF检验,差分后分别使其平稳,从浅层神经网络模型开始探索。通过预设输入层感知器个数为1、隐含层层数位1、隐含层每层感知器个数为2、输出层感知器个数为1、输入层到隐含层的权重、隐含层到传输层的偏置、机器学习次数为500次。由python自带的numpy包自主完成运算与预设,激励函数选择Sigmoid函数,开始的样本容量设置为800(训练集样本大小为600,预测集样本大小为200)将得到的预测结果于真实数据做对比,预测效果不理想,开始不断修改完善以上模型的基本参数,逐步增加隐含层层数与隐含层上感知器的个数,重复预测过程,记录最优模型参数,在1-5号样本实验完成后,更换股票样本,重复以上操作,记录最优模型参数。为何不用“随机搜索”和“遗传算法”而采用梯度下降法?因为随着网络深度的增加和节点个数的增加,误差会不断增大,所以在本次神经网络模型构建的过程中,使用梯度下降法修正参数。BP神经网络模型结构表经过海量实验预测后,发现输入层个数上感知器个数为1,隐藏层个数在2层,感知器个数在10-15个,输出层上感知器个数为1时,激励函数选取Sigmoid函数,由于BP神经网络模型具有误差反向传播的特点,本文通过梯度下降法计算梯度进行迭代,更新参数向量。以此基础值设置的BP神经网络模型的预测效果最优,在该并且初步探索可预测期数,模型预搭建完成。4.4BP神经网络模型训练阶段预搭建好BP神经网络模型之后,接下来开始探索可预测期数。将1-5号样本代入预搭建好的BP神经网络模型中,模型的学习次数为500次,训练集容量为1000,预测集容量为200,预测期数即真实值、训练集R方、预测集R方、最终损失函数如下表所示:BP神经网络模型训练记录表预测值真实值训练集R方预测集R方最终损失函数1号样本预测一期9.6660099.730.9730.8080.00231号样本预测两期9.671779.730.9480.7170.00399.6664579.711号样本预测三期9.6722459.730.9510.7160.00389.6722459.719.665949.722号样本预测一期11.19045911.210.9790.7910.0012号样本预测两期11.18458211.210.9520.5940.002111.21257911.242号样本预测三期11.17272111.210.9520.4510.003911.1916111.2411.18216511.23号样本预测一期11.93350911.880.9690.90.000815473号样本预测两期12.0496511.880.9460.7990.001611.94800611.883号样本预测三期12.04086611.880.9590.720.002512.031811.8812.06806811.784号样本预测一期13.36598713.180.9700.9460.00114号样本预测两期13.52735813.180.9630.9130.002213.32209213.94号样本预测三期13.45088513.180.8900.7940.003513.36588412.913.59255312.985号样本预测一期21.82807522.470.9580.9490.0055号样本预测两期22.10856622.470.9220.9000.009221.82807522.235号样本预测三期20.33650822.470.8780.8600.013319.95333722.2320.55339422.031号-5号样本分别为平安银行(股票代码000001)2019年1月2日9:31-2021年3月19日15:00的1分钟收盘价数据、5分钟收盘价数据、20分钟收盘价数据、一小时收盘价数据与日收盘价数据从表中可以很清晰的看出,随着预测期数的扩大,预测的准确度开始迅速下降,预测集的R方也在部分样本中出现直线下跌。在两到三期预测中,也出现了预测趋势与真实值变化趋势相反的现象:4号样本滞后二期预测图3号样本滞后三期预测图在大量实验中发现,BP神经网络模型在小幅震荡数据的短期预测中效果显著:BP神经网络模型一期预测图所以在接下来的组合模型部分,将通过使用ARIMA模型与BP神经网络模型的组合,来优化BP神经网络的预测效果,并且在保证精度的情况下扩大BP神经网络模型对于收盘价的预测期数。4.5搭建ARIMA模型对A、B、C、D、E五个新样本分别进行ARIMA模型的构建。通过统计软件Eviews中ARIMA自动定阶工具包,计算出A、B、C、D、E五个新样本的ARIMA模型分别为:A号样本为ARIMA(2,1,2),B号样本为ARIMA(3,1,3),C号样本为ARIMA(2,1,3),D号样本为ARIMA(2,1,2),E号样本为ARIMA(1,1,3),并且滞后预测10%的样本大小,预测结果如下:A-E号样本ARIMA模型预测图不难发现,ARIMA模型在处理大样本数据拟合的时候,预测容易陷入均衡点,我们适度缩小训练集与预测集的大小(训练集容量调整为800个,预测集容量调整为200个),更换股票样本重复上述过程,发现ARIMA模型在趋势预测上效果显著:ARIMA模型预测图在重复实验的过程中,记录相应样本的ARIMA预测数据,以便代入BP神经网络模型中。4.6BP神经网络-ARIMA组合模型预测本节通过构造下图所示的ARIMA-BP神经网络组合模型,来达到优化BP神经网络的预测效果,并且在保证精度的情况下扩大BP神经网络模型的预测期数。选取4号样本前1000个数据,记为6号样本。前800个数据记为训练集,后200个数据记为预测集。分别将训练集与预测集设置为7号和8号样本。将7号样本和8号样本分别通过Eviews软件找到最佳ARIMA模型,并且通过6号样本的前780个数据往后预测20期,通过8号样本的前195个数据往后预测5期。将两次预测数据按照对应的时间,替换6号样本原本对应时间的数据。将新的6号样本代入已预搭建完成的BP神经网络中,设置机器学习的次数为200次,组合模型预测效果、ARIMA模型预测效果、单BP神经网络模型预测效果如下表所示:BP神经网络模型训练记录表真实值ARIMA模型预测值BP神经网络模型预测值ARIMA-BP神经网络组合模型预测值一期预测:16.717.1393101417.1142
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年对外汉语教师资格证考试汉语教学文化适应试卷及答案
- 小儿中暑健康宣教
- 2025年文物保护专家资格考试试题及答案解析
- 企业员工团体意外险培训
- 职业病危害及粉尘防爆安全培训考试试卷及答案
- 2025年金融产品创新试题及答案
- 2025大学生安全教育测试试题及答案
- 空调设备安装施工方案
- 2024年二级造价工程师建设工程计量与计价实务安装工程真题及答案
- 2025医学产前诊断技术考试题目及答案
- 数学教学软件与应用-几何画板能做什么
- 危险化学品建设项目安全条件审查要点
- 北京2023年中国工商银行博士后科研工作站博士后研究人员招聘上岸提分题库3套【500题带答案含详解】
- 第三单元 金属的腐蚀与防护 课件(共20张PPT)
- AED的使用(教学讲解课件)
- 血液科出科题库
- 社会研究方法03350
- 贝克-常伟汽车后视镜电加热薄膜技术
- 大学生素质教育主题班会课件
- 体育器材台账
- 2021年吉县社区工作者招聘笔试题及答案解析
评论
0/150
提交评论