




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于BP神经网络的股指收益率预测研究以高频数据为样本第4期(总第115期)2021年4月统计教育StatisticalThinktank(SeriesNo.115)Apr2021基于BP神经网络的股指收益率预测研究以高频数据为样本叶银龙黄晓莉刘干摘要:高频金融数据和金融资产收益率是金融计量学的一个全新的研究领域.目前,国内学者利用年,月,日等300指数高频数据中的日内收益率进行建模与预测.结果说明:神经网络模型对股票高频数据的日内收益率具有很强的预测能力'关键词:高频金融数据;收益率;神经网络;预测ForecastofStockMarketReturnsBasedonBPNeuralN
2、etworkCaseoftheHigh-FrequencyDataYeYinlong,HuangXiaoli,LiuGanAbstract:Thestudyofhigh-equencyfinancialdataandstockmarketreturnsisabrandnewfieldinfinancialeconometrics,however,currentstudiesonfinancialreturnsusuallyuselow-frequencydataratherthanhigh-frequencystockmarketbasedonhighfrequencydata.KeyWord
3、s:highfrequencyfinancialdata;returns;neuralnetwork;forecast1引言股票市场的价格走势是极为复杂且难以预测的,这是因为市场参与者难以准确把握宏观经济形势,金融政策,公司财务状况,国际环境以及投资者心理承受能力等因素的变化及其对市场的影响方式和作用.于是,如何较为准确地预测股票收益率引起许多研究者和市场分析人员的极大兴趣,他们都试图建立关于股票收益率适当的计量经济模型.以往很多文献都将股票收益率作为线性时间序列进行建模与预测,具体模型包括自回归滑动平均(ARMA)模型,季节模型及带时间序列误差的回归模型,它们试图用简单模型来刻画股票收益率与
4、时间所的精度,但是模型仅仅局限于线性问题分析,并不能入,一些非线性模型被很好地运用到股票市场时间序列上.此外,不少研究说明,门限自回归模型(TAR)及其来,许多学者在尝试着用核回归,局部最小二乘估计及神经网络等非参数方法对股票收益率进行预测.【q其作者简介:叶银龙,1983年生,浙江龙泉人,杭州电子科技大学财经学院统计学硕士研究生,研究方向:金融数据挖掘,神经网络;黄晓莉,1962年生,浙江台州人,杭州电子科技大学财经学院副教授,研究方向:数理统计与经济分析;刘干,1967年生,安徽安庆人,杭州电子科技大学财经学院副教授,研究方向:计量经济与统计建模.第4期叶银龙等:基于BP神经网络的股指收益
5、率预测研究39中,神经网络是目前研究中较为常用的方法.股票市场本质上属于典型的非线性动力学系统,而神经网络模型可以很好地解决这一类非线性问题.与一般的统计模型相比拟,神经网络可以不考虑传统统计模型中较多的研究条件与假设,可利用学习训练或设计网络结构的方式处理非线性问题.目前,神经网络模型被广泛地运用到关于股票市场的研究中.AtiyaAF,ChenJF利用股票市场中常用的技术指标或公司金融比率作为变量,通过神经网络学习并搜寻技术指标中可能存在的套利关系,以解决投资者在使soumi采用不同的预测期间,比拟方式加以分析神经网络与ARMA模型在股市上价格的估计或应用的优指标所建立的神经网络模型进行股价
6、预测时,发现原始信息比技术指标更加有效.51同样地,Chenoweth在采用不同周期的技术指标时,发现以周为单位且训练样本越多时,此时神经网络预测能力最正确,而变量越说明,神经网络在股票市场的运用是相当广泛有效的,而且所建立模型的预测能力是非常不错的.不过,他们的缺陷在于其研究根本上都是针对股票市场的低频数据进行建模,而关于日内高频数据建模的文献非常少.高频数据是指以小时,分钟或秒为抽样频率的日内数据,如果数据频率越高,获得的股票市场信息就越多.而且,股票日内收益率预测得越精确,股票市场波动率将会得到更有效的度量,从而进一步有利于风险管理和控制.因此,基于高频数据的股票日内收益率研究越来越受到
7、人们的关注.基于以往研究的缺乏,本文以股票市场高频数据为对象,利用BP神经网络对日内收益率进行建模与预测,以寻求精度更高的预测模型,从而可以更好地把握股票市场的波动趋势及有助于市场参与者对证券市场进行风险控制和管理.2BP神经网络模型原理BP(BackPropagation)神经网络是一类前馈型神经网络,它由输入层,中间层和输出层组成,中间层也连接的神经元节点,相邻层之间各神经元通过不断变经网络拓扑结构.其中:输入层有凡个节点,对应输入;输出层有m个节点,对应输出y_;隐含层有q个节点,对应的输出Zl;输入层与隐含层之间的权值,隐含层与输出层之间的权值为茸.Xl*xH"qm图一1BP
8、神经网络根本结构BP网络中隐含层激活函数通常采用s型的对数的,不仅使得网络的容错性较好,而且可以严格利用剃度法进行推算,权值修正的解析式十清楚确71.BP学习算法是一种有监督的学习过程,它是根据给定的(输入,输出)样本数据来进行学习,并通过调整说,一次学习过程由输人数据的正向传播和误差的反个学习样本,),Ii=1,2,对样本(,Yk'),在正向传播过程中,样本k的输入向量X.,强,从输入层的rt个节点输入,经隐含层逐层处理,在输出层的m个节点的输出端得到样本k的网络计算输出向量,m).比拟和样本k的期望输出向量Y:,五,),假设个学习样本的计算输出都到达期望的结果,那么学习过程结束;否
9、那么,进入误差反向传播过程,把与】,:的误差由网络输出层向输入层反向传播,在反向传播过程中,修改各层神经元的连接权值阐.BP反向传播算法的具体步骤可归纳如下:(1)输入个学习样本(孔,l,:),k=l,2,J7,r.3和各层节点数,由学习样本输人向量的长度rg确定网络输入层节点数为rt;由学习样本输出向量y:的长度m各层间连接权矩阵,第层连接第/+1层的连接权矩阵为:翱nO×n(f=l,2,L一1),初始化各连接权矩阵的元素值.(3)输入允许误差和学习率,初始化迭代计算次数t=l,学习样本序号k=l.叶银龙等:基于BP神经网络的股指收益率预测研究2021生(4)取第k个学习样本,y:
10、),Xk=(x越,y,珐,).(5)由孔进行正向传播计算,计算输入层各节点的输出为(q=l,2,n)(1)逐层计算各层的各节点输人和输出为n(/-1)职="0q-"(2)=19亏,)(f=2,=1,2,(3)(6)计算输出层(第L层)的各输出节点误差为=(4)=1(Y-yyk)q=l,2,(5)(7)假设对个学习样本的任一样本k有=1,2,m),那么学习过程结束;否那么,进行误差反向传播修改各连接权矩阵.输出层(第层)的连接权矩阵为J_一0孟f(Jj2(6)Aw(L0)=叼"0(7)(+1)=(1)+)(8)(j=l,2,m;=1,2,rt(L-)反向逐层修改连接
11、各隐含层的连接权矩阵:n)6c(9)q1c)=一D(1o)O+1)="(+"O)(11)(f=一1,2,16=1,2,n田;i=1,2,【f_''(9)k=k+l(modN),t=t+1转步骤(4).3样本选取与模型设计.本文主要针对沪深300指数的Et内高频数据,对股票交易系统,采用沪深300指数2021年7月1日至9月18日每日的1分钟高频数据,共13817个有效样本,其中包括10658个学习样本和3159个测试样本.本文的研究对象是高频金融时间序列的收益率,并采用下面的公式来表示:=,2,n(12)式中-.R为沪深300指数时刻(以1分钟为位)的恢益率
12、,为t时刻的收盘价格,为f时刻的收盘价格.在金融文献中,资本资产定价模型(CAPM)理论就假定资产收益率序列是不可预测的,应没有自相关否成立的判定工具.然而,股价的决定方式和指数收益率的计算方式可导致在观察到的收益率序列中有内高频金融时间序列的计量统计特点,本文采用Eviews对该数据进行相关性检验,并得到高频金融数据波动率自相关及偏相关分析如表1所示:表1高频数据收益率相关性检验表AtoDIat123盆r¨jlrnlati0nAr123Af:口tI:arnh-UU日JuIJLJ20251012054443o00030o'9017054494o0004一o15BEl07257
13、964oo0o5016800o161B73006一口079O05B627420o0070o,7006362936D000801270o52B5174000090153oo24683940011002200216990100口0120065004070482000013011600327235日000014012200237440500口0150D9200217SSB400口01600300009756日703O017口D1B?D口057573,000口180D4B0007760500000190口4日00O576364Oo0020002500017644B0021001100077646400
14、0022oo33000376614000023一o034000日767760000240019000576日27口000250O06oo0876833000026o口37002D77020000029004000027日1100000300口1B00057日157000031000533000100107B17200口035003900227e4220o00360o4600047871800370o4400107日98300从表1可以发现,在0.05的临界水平下,高频金融时间序列收益率与其37阶以内的滞后项存在较为显着的相关性,但是与37阶以后的滞后项不存在明显的相关性.因此,在对高频金融时间
15、序列收益率进行建模时,可以选择当前收益率及其37阶滞后项作为变量.3.2输入,出层的向量确定神经网络不需要任何的统计或数学知识描述输入一输出模式间的映像,它是根据已选取的样本数据,通过学习和训练,凭自身的网络结构实现对信息的记忆,然后对测试样本进行预测.因此,在神经网络训练时,训练数据应包含所研究对象的全部模式.即,本文输入向量的各个分量应该选取能充分反映沪序列波动率相关性表的研究,确立了38个输入层节点(神经元),包括时刻的收益率及其前37分钟每分钟的收益率,即(1),R(2).,R(37),尺38).输出层是对基于高频数据的收益率进行预测,即及输出变量的样本数据见表2:.第4期叶银龙等:基
16、于BP神经网络的股指收益率预测研究413-3隐层神经元数目确实定隐层神经元负责实现非线性样本的线性转换,所数和节点个数可自行指定,一般在神经网络中选择一层隐含层,而确定适宜的隐层神经元数目是设计BP网络的关键.在以往的众多研究中,人们总结出一些关于确定隐层神经元个数的经验公式,其中,Mirchadani认为隐含层单元数.,与输入模式P的关系为:快速训练法,运用多层感知机模型,确定为一层隐含层,而隐含层的节点数目依据公式max(3,+,20),式,可以计算隐含层的神经元数目为3.激活函数是一个神经元及网络的核心,网络的预函数)的作用是激活神经元,使其对输入产生响应.在实际应用中,可根据需要选取适
17、当的激活函数,常的非线性特征,使BP算法训练的多层前馈式网络建立了从输入到输出的高度非线性映射,可以表达复杂的客观现象.而且,由于其导数常常可用.)自身表示,所以在误差反向传播的过程中,不需要另外计算激活函数的导数,大幅度地减少了计算量,提高了网络的效率.在实际应用中,通过对股票样本数据的学习训练,可以发现采用f(x)=tanf1/1+exp(-x)1)作为激活函数,网络的收敛速度最快.4实证结果与分析本文运用SPSSClementine数据挖掘软件,以高频数据为样本对沪深300指数的日内收益率构建BP神经网络模型.其根本过程是,首先将2021年7月1日至8月29日的10658个样本数据作为学
18、习和训练样本,建立一个三层BP神经网络模型,然后用剩余的3159个样本数据作为测试样本,来进行模式识别,再判断神经网络模型对沪深指数收益率的拟合程度及预测效果.用样本数据对神经网络进行训练时,需要网络训练参数进行设置,本文确定动力因子a=O.9,较高的0值有助于防止网络的局部极小值,使神经网络的权数调整更加平滑;预测精度为90%,迭代周期为250次,控制误差取为0.0001.最大容许误差设为0.005,学习步长为0.01,最大训练次数为500.利用上述神经网络及其网络规那么,可以得到预测经网络模型,再将其对剩余3159个测试样本进行判断,来验证系统的预测结果.在Clementine中,将BP神
19、经网络参加到测试样本的数据流中,可以得到测试测值和收益率实际值做比拟分析,如图2所示:图2收益率实际值与预测值比拟从图2可以发现,神经网络模型较好地拟合了测于测试样本较大,为了更加直观清楚地判断收益率的预测效果,选取了预测周期第一天的收益率实际值与预测值进行比拟,得到图3的时间序列图:,UIUU150200图3股指收益率预测值与实际值时序比拟图由图3可见,BP神经网络对于沪深300指数收益率的拟合效果相当不错,就整体趋势而言,网络模型根本上模拟出实际收益率的特征,说明BP神经网络42叶银龙等:基于BP神经网络的股指收益率预测研究2021生对于指数收益率的预测能力是较强的.为检验模型的预测效果,
20、引入MAPE指标,MAPE平均相对误差绝对值的定义为:组合等提供了一个可靠的工具.船:l曼l(13)iiI2】式中,为实际值,为预期值.根据上述公式,计算得到BP神经网络3159个测试样本的MAPE=I.66%,说明神经网络的预测精度非t3J常高,BP神经网络对于高频金融时间序列收益率的预5结论与启示股票市场高频数据是当前金融计量研究的热点问题,基于高频数据的股指日内收益率建模与预测对数据挖掘中的神经网络对高频数据进行建模与预测,实证研究说明其预测能力是非常有效的,可以有效地模拟出短期的沪深300股票指数时间序列收益率的趋应用的可行性,而且也为进一步测算股票市场波动率与金融领域的衍生工具定价,
21、风险管理与控制及投资参考文献RueyS.Tsay.AnalysisofFinaneeialTimeSeriesM.北京:机械工263.works:Asurveyandnewresults.NeuralNetworks,IEEETransac-tionson,2o01,(12):929-935.gYAbstract,1996,(37):108116.ketreturns.JournalofEconometrics,2002,(107):291-312.tionsonHigh-TechStocks-ACombinedGARCH-NeuralNetworkApproach.JournalofEconomicsandFinance,2001,(25):276-292.tionusingneuralnetworksandtheextendedsampleautocorrela-tionfunetion:areevaluation.DecisionSupportSystems,2000,(19):21-30.袁曾任.人工神经元网络及其应用【M】.北京:清华大学出版社,1999.朱大奇,史慧.人工神经网络原理及应用M】.北京:科学出版社,2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版型钢结构瓦工施工总承包合同
- 2025版沙盘模型制作技术培训及转让合同
- 2025版新能源汽车充电站运营维护专业服务合同
- 2025版外卖配送服务合同技术升级范本
- 2025场环保产业调研与可持续发展服务协议
- 2025代收代缴水电费及环保监测服务合同
- 2025年商铺认筹与商业综合体合作框架协议
- 2025年度幼儿园食堂安全卫生管理服务协议
- 2025年度绿色建筑劳务分包合同示范文本大全
- 2025版智慧桥梁建设劳务分包合同模板
- 期权开户考试题及答案
- 建筑工程装饰预算课件
- 《民营经济促进法》解读与案例分析课件
- 山地绿化工程的安全防范措施
- 监理挂靠合同协议书
- 2025年广西南宁宾阳县昆仑投资集团有限公司招聘笔试参考题库含答案解析
- 2025-2030中国公路养护行业市场深度调研及前景趋势与投资研究报告
- 《数据采集与分析》课件
- 国家生物安全法课件
- 老年人生命教育
- 租车合同免责协议模板
评论
0/150
提交评论