付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、4 4基于数据挖掘预测模型的股票交易系统根据上市保险公司的业务分析和财务分析来看,对投资者来投资中国平安的价值最高,由于实验运行时间较长,数据挖掘分析的方法相同,与选择哪家上市保险公司历史交易数据无关。本文选择了中国人寿历史交易数据进行了数据挖掘与分析。4.14.1数据来源本文所用数据为中国人寿 (601628) 历史交易数据, 数据来源于雅虎财经网站 (网址:https:/finance.yahoo.conj)。获取方法为如下 R 代码:library(tseries)CLI_Web_1p%wv其中kVi二 PiCijT6CiHiLi3G、HL 分别为交易日 i 的收盘价、最高价、最低价。M
2、(i=1,,k)为从交易日i开始接下来的1:k天平均价格相对交易日i收盘价的变动率(称收益率)0T(2)即 Vi(i=1,,k)中其绝对值大于阈值p%的那些值之和。其含义如图 6 所示(有关 R 代码见附录):如果工为高的正值,则意味着有潜在的买入机会,因为有良好的预测价格会上涨;如果工为低的负值,表明价格可能下降,可以进行卖出行动;否则持有该股票100图6T值与交易价格的变动该预测的解释变量由一组基本变量和一组技术变量组成。基本变量为 Ri.(h=1,K,k)(当k=10时,该组变量即有 10 个),定义如下:G美“G_h即交易日i相对于交易日i-h的收益率。可选择的技术变量很多,本文选取其
3、中最常用的 12 个:ATR,SMI,ADX,theAroonindicator,theBollingerBands,theChaikinVolatility,CLV,EMV,MACD,MFI,SAR,Volatility,其各自含义参见 TTR程序包。.3 特征选取(4)4月。120164月2520165月162016f月。32016从上述 22 个解释变量中选取最合适的变量集。特征选取方法可分为两大类:一类称特征筛选方法(与建模工具无关),另一类称特征包裹方法(将建模方法与特征选取过程相结合)。本文基于训练数据集(该股票自上市之日起至 2012年 1 月 9 日止的交易历史
4、数据),采用随机森林方法(属于第二类方法)根据特征重要性选取特征,各特征重要性如图 7 所示(有关 R 代码见附录):%lncMSE图7各特征的重要性按重要性大于 6.5 选取特征,卫果如下(R 代码见附录):1myATR.GSPCmySMI.GSPCmyADX.GSPCmyCLV.GSPC5myVolat.GSPCmyMACD.GSPCmySAR.GSPCrunMean.Cl.GSPC.4 模型建立可按预测任务的不同形式、 不同的建模工具 (及同一建模工具中不同的参数设定) 、不同的交易策略建立可供选择的预测模型。(1)预测任务形式本文将预测任务形式分为两种。一种形式是先预测
5、目标变量Ti,再按前述阈值规则将其转换为预测的交易信号,此时,预测任务即为预测问题。另一种形式是直接预测交易信号,此时,预测任务即为分类问题。(2)建模工具本文使用三种建模工具,分别为人工神经网络(ANN)、支持向量机(SVM)与多元自适应样条回归(MARS),并分别由 R 程序包 nnet、e1071(kernlab)及 earth 提供。(3)交易策略曜疑c微骸嗅就CmvSAR.GSPCmyVolat.GSPC蹿鬻CmyMFLGSPCm/EMV.GSPC娥Delt.CDelt.CLIOCl.GSPC.k.1.10.GSPC.k.1.10.1Deft6arithmetic1Deft.8国ic3eft.4.arithmeticDeft.9.arithmeticGSPC此I。Deft10arithmeticTIVTIVBB.GSPCBB.GSPCDfelt.CI.GSPC.lc1.W.Dety.arithmeticBWi0Dert5anthmicDeltCl.GSPCk1.10Deft.3.arithmet
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年九年级数学中考模拟试卷(云南卷)
- 五一出游季安全须谨记-五一假期安全教育班会教案
- 2026年高二生物下学期期中考试试卷及答案(九)
- 2026年康复评定学:生命体征的观察与护理课件
- 谈高中英语语法教学的有效开展策略
- 数据安全企业运营方案预案
- 商务考察邀请商洽函(8篇)
- 数据收集处理合规性保证函(5篇)
- 环境科学考察与研究方法指导书
- 大型活动安保人员伤亡预案
- 现代汉语基础教程(高校现代汉语课程)全套教学课件
- GB/T 43970-2024化学蒸气发生-原子荧光光谱分析方法通则
- 湖南省“五市十校”2024年高考化学二模试卷含解析
- 二级学院科研简洁的工作总结
- 书稿中学考试全书 《高中数学总复习四十三讲》上
- 统编小学语文六年级下册试题1-6单元达标测试卷及答案(人教部编)
- 郴州市桂东县事业单位考试历年真题2023
- GB/T 32945-2016牛结核病诊断体外检测γ干扰素法
- GB/T 18173.2-2014高分子防水材料第2部分:止水带
- GB/T 14563-1993高岭土
- 弱电项目施工合同
评论
0/150
提交评论