版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于LSMWSVM的股票价格预测基于LSMWSVM的股票价格顶测杜贤利,姚洪升(怔苏大学系统工程研究所,tt亦镇投2712013) 摘要:义拿基于小波分解理论和支持向量机核函数的条件,提出了最小二乘Morlet小波核的支持向受机(LS-MWSVM)算法。用该算法建模并对沪深3日收盘价进行预测,且与常用的RBF核的LSSVM模型及RBF神经网络模型的预测能力进行了比较。结果表明,LS-MWSVM的预测能力要好于其它两种模型。进一步得出,采用最小二乘支持向受机与小泼理论结合的组合模型对股市进行预测效果较好。关键诩:次预测,); Morlet小波;核函,事t;LS-MWSVM中图分类号:TP301
2、jF830 文献标识码:A文章编号:1002-6487(2008)19斗062-03中。称为特征空间映射,日为特征雪间。用。把数据集从输o 引菌入空间映射到特征空间是输入空间中的非线性拟合问题变成高维特征空间的线性拟合问题。高维特征空间的回归函数鉴于我国即将推出沪深3指数期货,所以对股指的准为( 1) 确预测将变得愈加重要。但股票市场受罔缘政策,国内外经济f(x)=哈(x)+h=<(直>+h环境,按费者的预期等众多因素的影响,以致于其时序是一种其中为日中的权向量,h为偏景(bias),<>表示内积。含噪声的,非线性的时序,所以想对股票价格进行准确预测将根据结构风阶最小化
3、原理,结合考虑函数复杂度和拟合误比较闲难。传统的股票价格走势的分析中,相对稳定成熟的方差,回阳问题可以表示为等式的柬问题:法包指:l基本分析法和技术分析法。目前较多使用数最化模型1 ._,TT J(,)骂一+L(2) 包括:时间序列方法、回归分析法和人士神经网络方法,支持2 -_. 2 i例向盘机方法等11阳。本文尝试采用Morlet小波构造了个核函约束条件为Yi=功(x+b吨i其中ieR i=I,2.M为误撞数,并借鉴小被分析及通归的思想提出了最小工乘Morlet小变量。注意到J(忐)是由正则化项1/2怡和误羡平方和项披支持向最机(Least叫uaresMorlet wavelet supp
4、o眈vectorma?/2L组成,为一个正的实常嫩,它代表对回归误楚的惩chines )的滚动预测模型,将用该模型对用于沪深3指数每日收il价进行预测,并与传统的基于RBF核的LS-SVM和罚程度,为了求解上述优化问题,当维数较高时,直接计算RBF人工神经网络预测模型进行了比较,从实验结果来看,对规划,布可能较难,因此将规划问题转化到对偶空间中,定义于股指这类复杂时间序列的预测LS-MWSVM模裂无论从训Lagrange函数:练速度还是预测精度上均要优于后面两类模型。U,b,)=J(,。四五叫哈(xJ+b吨,明yJ典中;eR为L, S-MWSVM的预删搁嚣a伊ange乘子。于是最优解的条件为:
5、。L飞、1.1 最小二乘支持向贵机太十=?=L叫(风) . 1 预测问题实际上是属于回归问翩,即通过函数估计方法aL n. ?b叩v-叩.j-,驭(3) 建立输入变量与输出变量的关系模型,并根据模型进行未来输出值得预测。SVM回归的基本思想就是通过一个非线性映。Lt?$02丰哈(茧;)+b吨-Yi=?叶,2.M. 射将低维的输入空间映射到高维特征空间,在高维特征空间求解上面的方程,消去惠,得到如下结果:进行线性回归。d设数据为d维向巅,数据集(x,.Yii=1.2.3,.nX. e R为|。Ivlm (4) 输入资锺(R为实数域)YteR为输出变量,且y,:f(XJ,i= 1, 2,3, 1.
6、 n叫-1IlJ lY 1M,f(x)为待估计的米知函数。作为非线性映射中民问日。其基金项目:国家自然科学基金资助项目(70401013)62 统计与决策2低18年第19期(总第271期)?1?1?1?1?1?獱症浡舍?剂?1?1?1勎?曎?椽?慧?1?榣?棋?睡捴畡猎?1?1?杲?1?1?1?1?1?1?楮?1?1?1?1?1?沣?1?牡?1?牬症潲?牥灰?1?虑?整汥?1?卖?1?1?1敳?1?1?1?1?1?1?瑏?1?1?1?涌?1?潒?1?1?1?来?1?1?1?1?1?斳?抣?1?擎?1?1?1?1?1?1?1?1?1?1?柜?卖?熣?1?1?1?1?1?1?1?呐?祪?厡?1?1
7、?瑬?1?1?1?1?1?1?1?1?1?1?1?1?1?1?氧?悭?1?1?卖?1?1?1?1?1?昶?坓?1?1?1?戽?捭?1?1?1?1?1?噍?1?1?牬?1?1?1?1?1?1?1?琩?1?1?1?整?1?1?1?1?1?1砩?椩?1?1?1?1?1?坓?1?1?1?1?1?1?1?1椽?1?1?1?沣?1?1?1?1?絩?噍?1?1?楡?1?祩?1?1?1?1?剂?1?1?1?1猩?1?1?1?牬?1?1?1?1?1?1?1?1?1?1?整?1?1卖?1?1?1?1?1?1?1?1?1?1?匦?1?1?汣?捯?卖?獖?1?1?1?溣?1?1?1?1?1?1?1?1?漧?1?1?牬
8、?1?1?1?榡?1?整?1?撡?1?1?擎?1?1?1?1?1?砳?1?1?1?1?1?1?1?1?1?1?1?牬?卖?楝?整?1?1?剂?1?这盟Y=y,机y.J,J.=l,l.町Y=Y;Y2yMl,Oij=(x;)到,为了使模型能准确地反映系统当前的状态,就要用新的中(XJ=K(Xi,xJ数据描述模型,而与当前时刻相关性变小的数据可以想略或, i,j= 1,2, Mo K(lC;,xJ称为核函数,应满足Mercer条件,LS-SVM的估计表达式为:再建模中所占的比藏应降低,因此,建立一个随时间滚动的建模数据区间并保持该时间长度L不变。当有一个数据加入Yi=立iK(Xk,x?仙(5) 时,
9、最早的一个数据相应从L区间滚动出去,随着系统地进将变最空间中的内积转化为原空间中提个函般的计算,行,模型随着数据区间的更新,不断更新。附于瑞个漉动的数从而间接求解出输入空间向商维特征空间的映射。,b可据区间的数据区随时间变化,故称这个数据区间为滚动时间l发通过求解线性方程得到。LS-SVM仅稽要确定核踊数的形窗呵。在滚动建模过程中,权值与阔限b不断被修正,是一状参数和惩罚系数。而不需要选取不敏感损失函数的值,这个滚动优化的过程。假如给定时间序列啡,t址,2N前N,-m样简化了计算而便于使用。个数据用于预测模型的训练,后N-N,用于测试。以m(输入叩叮由Hilbert-由chmidt原理,任何满
10、足Mercer条件的选取均维数)为滑动窗口得到Nm个R;中的点X,=斗x;矶X,+旷+可作为高维间的核函数。y问唰组成样2本机怀x对阳才(x瓦队t伪yd协川州,)忡)t川+札1.川川.悦拥,2N,前N协产m个数据为训练样矶冽机叫核函数常有下列几种形式:卫本拉,用于估伽i计f映射t阳R后RN-N,个数据为测试样本评价(1)多项式核函数:K(x冽=(瓦,y+C)dc为常数d=l乒.预测效果,利用训练样本对模型进行训练得到回归函数为: (拥向暴核函散:刚刚叫(-叫C)y,附i均=L2 所以LS-MWSVM的预测表达式为:(3)双幽核:K(x,y)=tanha(x-y)叫,晶,t均为常数M 最后得到L
11、S-SVM回归模型你应;K(丸,只)仙。75(6) YNHtl>岳飞机1.忡叫哼(10)1.2 小波核函数RBF核LS-SVM的预测表达式为:在信号处理,倒像照缩,模式识别以及许多非线性科学l阳,、且且) 可k-I?,.;,.,)+bM俨叩(寸领域内获得了广泛的应用。小被函数h(直)具有震商特性,能f. 其中X加俨芷协制,XIlNal>!;xNJ迅速衰减到零的一类函数(I h(对dt;)。通过h以)的伸缩和,唰2 嚣瞌分析与精廉仰后派生出一旅函数:h(o,h)=lal吨(于)b e R,a e R,a;O&O 式中:,础,)(x)成为连续小波,a为尺度因子或频率因子,b为时
12、实验设计2.1 间因子。对于能最有限信号或时间序列f(x)eV(R),其连续小本文采用LS-MWSVM模那对沪深3每日收盘价进行榄变换定义为:建模与预测,希螺能为投资者和有关公司、证券脏管部门提供一定的参考。选取数据为27年7月24日到28年12忡:I a-W(a,b)h(孚)蛐(7)r月11日的每日收盘价组成的114个数据序列,取前94个敬RR 据用于建立预测模型,用其后20数据用于检验预测效果。式中,C为与h(.)有关的常数。利用张量积理论,可得到h(原始数据从旅虎财经网捕下载)。为降低预测设搓,对数据d维分离小被函数的乘权:dH进行了归一化处理,预测后可以进行反归一化得到预测真实En,
13、dM 叫Enu JX X 耐叮m(8) 数据。叫下丽分别用LS-MWSVM模型,RBF核的I.S-SVMRBF ,可以证明:Morlet小波母函数中(x):cos(I,7Sx)exp(-xJ2)神经网络模型进行试验。试验程序采用7.0与语言相结合编由张量积理论构造的核函数满足条件,并向上可知:写,可在80硬敬,512内存的微机上实现。fr J1 .,.,. (Xi_X;)2 数据预处现与预测模型的许价标准Morlet小披核诵的业(x,xJ=忡。s(1.7Sx瓦卜)2.2 (9) 将观测值施围坐换到仰,1之间进行归一化处理,即Xi据式中,x;表示第m个训练输入样本的第m个分最n,d_ X_i_代
14、表输入向量的维数。为了远算方使我们取向础,这样核参其中呐阳一化后的数据,功原始数据。ax(xJ 数就变为一个为ao本文选择归一化均方根误羡(RMSE)与MAPE作为评价预测方法与模型1.3 y-Yi 假设有一L细连续记录数据,系统当前的状态主要由过,模型预测效果的判掘,其表达式为:MAPE斗LI I 川1=I Yi I 去时刻到当前时刻的L组记录数据来描述,即系统当前的建模倍息可以从当前起到过去的L组数据中得到。因此可用L组数据建模,曲子系统是时蜜的,新的输入输出数据不断得统计与决簸28年第19期(总第271期)63 ?1?祩?1?1?揎?1?钦?1栨?劣?1?昨愭擎?梸汨?1?1?1?1?1
15、禣?亣祴琽?1?1秂剂毖?1?1?浡?沣?硬?1?1?1?1?1?碣?1砩?1?1?1?1?1?1?1?1?墣?1?1?1?摴?砩?1?1?1?1没?墡?1?1?1?劣?1?1?1?1?1?夽?1?1?1?敲?1?1?梢?1?1?1?1?1?玡?1?硴?扬碣?1?1?1?犡?1?1?1?瑡?1?1?1?1?1?昨整?卖?1?1?湨?砩?1?1?1?1?噍?1?炮?1?敨?1?孡?1?1摥?筸?1?1?夲愧?1?1?1?1?浩?1?瓐?1?1憡?1?1?1?1?1?梢卖?1?1?1?扸?1?1?摴?1?1?1?1?1?1?1?暣?1?1?1卖?卖戬?1?1?1?1?1?椬?1?块?1?1?瑝?1
16、?1?溡?1?1?樽?1?栨?1?1?1?1?玑?1?沣?步?1?憣?1?1?1?1?1?梢?涸?1?碣?1?1?1?懎?砬?1?1?1?1?1?卖?砾?1?1?1?亡?1?1?1?挩?1?捯?1?瓓?1?1?1?没?1?1?1?1?栨?1?猨?1?1?1?1?1?1?1?牣?砩?管?1?偅?悫?硰?1敲?1?1?1?1?1?卖?礩?慩?1?1?1?1?1?1?1?1?戨?1?暡塬?1?1?1?1?1?1?1?1?1?1?1?沣?丬?1?1?1?1?御?1?硰?1?1?1?1?1?1?欨?夽涸?硰?1?1?1?1?1?熣?1?硺?洨?1?1?1?碣?1?1?1?墣?1?采?1?十?1?1?碣?
17、1?1?乲?抡?掸?1?1?1?1?睥体?忎偅?1?1?1?1?1?1?磒?1?的核函数的情况下,其模型的预测能力将会有较大的提高,专预测的结果具有更好的可靠性。使用该方法进行般指预测将,其中Yi为阳一化后的实际值YiRMSE=I十二(川)2I 具有很好的前景。为归化后的预测筒。2.3 实验结果3 蜡论由前述理论可知,核函数类型以及神经网络的激励的数一旦确定,则问归模型的性能很大程度上取决于与参数的选使用基于I.S可MWSVM回归预测模型是把小波的时颇多择。为使所建模型尽量符合实际情况,提高预测精度,本文采变性与I.SSVM优点相结合,对沪深3每日收盘价预测具用Cross-Validation
18、算法问问对参数进行估计,该方法中,除了有明显的优点:(1)从预测的RMSE、MAPE指标来辛苦,I.S叩a,外,还有输入维数需要确定,如果对所有的参数值进行MWSVM都比RBF核的I.SSVM和RBF神经网络方法具有验证,占主运算代价是不可接受的,闲此本文采用步长逐步缩优势,可以对米来进行更好的预测,并避免过拟合问题。(功小的网格搜索方式。首先,对各参数以大间隔路走参与计算I.S四MWSVM方法是种全局优化方法,可以避免神经网络的点,找出使误羔较小的IK域,然后再在该l泛域内以较小步等方法可能的局部收敛问题。(3)I.S-MWSVM方法能较好地长为间隔选择计算点,如此下去,直到所有参数取值达到
19、一挖掘数据l冽的非线性依颇关系,这是很多时间序列方法难以定精度或者验证准确率的改进达到停机标准。通过训练得做到的。到:I.S-MWSVM及核的I.S-SVM的近似最优参数分别为:m=本文所推荐的方法只是从纯粹的时间序列出发,其指导34, a:O.32,=70,m=15,=0.3;y=70o RBF神经网络模型采用小思想是价格包含一切因素,的从预测结果来看,SVM只能捕波工具箱仿真。捉到数据变化的很少一部分,预测的绝对误差还较大,米来下面是利用L.;-MWSVM算法,RBF核的I.S-SVM以及的研究中应该努力发现价格变化的本质,以实现更精确地预RBF神经网络回归算法,使用最优参数训练得到的模型
20、,对测。27年7月24日到28年1月11日沪深300日收撤销数附加个数据进衍了滚动烦测,预测结果(见附1)初误差对参考文献:比(见表1)如下。lj姚洪兴,盛昭翰,陈洪香.股市预测中的小波神经网络方法I月.系统工税玻论与实践,22,33(6).阳刚刚刷刷附则2JWei Huang,Yoshiteru Nakamori,Shou-Yang Wang.Fo.附制tingstock market movement direction with support vector machineJ.Computers &Operations Research 32(25). 3J.1.彦峰,高凤;基于
21、支持向量椒,的股市预理.JJJ.计算机仿真26,23(11).4P萨阁成,.1.猛,曾华2事.支持向登机导伦M).北京:电子工31:.出版1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 11 18 19 7.0 社,24.回1预测结巢5曲文龙,樊广役,杨炳儒.1.于支持向-:t机的复杂时间序列预测研究刀;计算机工程,25,(31).6)Senjian An,Wanquan Liu,Svetha Venkatesh,Fast cross-validation algorit如nssquar刷刷P阳.rtvector machine and kemel ridge re伊ssionJ.Pattem Reco伊ition40(2007). 由上可以看出,I.S-MWSVM模剑能够很好地址行跟踪7STay.Francis E.H. and L.J. Cao.Mod fied suppory machines n 预测,且精度较高,与功能强大的RBF神经网络和常用的financial time series fore町atingJ).Neurocomputing,48(22).RBF核的I.SSVM预测能力相比具
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026贵州中医药大学博士后招聘备考题库及1套完整答案详解
- 2026贵州医科大学附属白云医院养老护理员招聘8人备考题库及答案详解(夺冠系列)
- 宝宝皮肤护理与预防湿疹
- 2025 小学一年级道德与法治上册独自在家不害怕课件
- 2026年工地安全管理标准化建设
- 远程会诊护理的经济效益
- 职业医学与工程学的联合防护模式
- 临潭事业编招聘2022年考试模拟试题及答案解析42
- 职业健康素养对医疗员工组织承诺的预测作用
- 职业健康档案电子化传输过程中的加密技术应用
- 2026云南昭通市搬迁安置局招聘公益性岗位人员3人备考题库及答案详解(考点梳理)
- 2026中国电信四川公用信息产业有限责任公司社会成熟人才招聘备考题库及一套答案详解
- 2025-2030心理健康行业市场发展分析及趋势前景与投资战略研究报告
- 技术副总年终总结
- 《马年马上有钱》少儿美术教育绘画课件创意教程教案
- 天津市专升本高等数学历年真题(2016-2025)
- 2025年化工原理考试题及答案
- 湖南省益阳市2024-2025学年高二上学期语文1月期末考试试卷(含答案)
- 幕墙工程售后质量保障服务方案
- 铝合金铸造项目可行性研究报告
- 2024年西藏自治区事业单位《职业能力倾向测验(D类)》考试真题及答案
评论
0/150
提交评论