




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验八 预测股票市场的收益实验目的和要求:1. 理解股票时间序列的分析和相关包调用;2. 理解和掌握通过学习的方法建立股票时间序列的预测模型;3. 理解股票时间序列的模型评价标准;实验指导:对数据挖掘而言股票市场交易是个具有巨大潜力的应用领域。事实上,由于大量历史数据的存在,人工对这些数据进行检测是很困难的,而数据挖掘技术对大数据有先天的优势。另一方面,有学者声称,市场在价格调整上适应之快,以至于根本没有空间可以得到稳定的收益。这就是有名的有效市场假设。这个理论先后被一些更宽松的版本所取代,即由于短暂的市场无效,市场还是有一些交易机会空间的。股票交易的总体目标是维持一个基于买卖订单的股票组合。长期目标就是从这些股票交易中获取尽可能多的利润。本章对股票组合简化,只“交易”一只单一的证券,这里采用股票市场指数标准普尔指数。对于给定的证券和初始资金,我们将尝试通过交易行为(买人、卖出、持有),在未来一段测试期使利润最大化。应用数据挖掘技术得到结果给出信号,然后据此作为决策的基础来制定交易策略。在该过程中,我们应用标准普尔500指数的历史数据来预测未来的指数变化。因此我们的预测模型将包含进一个交易系统中,该交易系统应用模型的预测结果来生成决策。总体的评估标准就是该交易系统的性能,即该交易系统的交易所产生的利润或者损失,以及对投资者有意义的一些其他统计指标。因此,我们的主要评价指标是应用数据挖掘过程发现的知识来进行交易所产生的结果,而不是在该过程中所开发的模型的预测准确性。1.包 xts的介绍和包中的数据结构xts扩展zoo的基础结构,由3部分组合。索引部分:时间类型向量数据部分:以矩阵为基础类型,支持可以与矩阵相互转换的任何类型属性部分:附件信息,包括时区,索引时间类型的格式等xts基础xts: 定义xts数据类型,继承zoo类型coredata.xts: 对xts部分数据赋值xtsAttributes: xts对象属性赋值.xts: 用语法,取数据子集dimnames.xts: xts维度名赋值sample_matrix: 测试数据集,包括180条xts对象的记录,matrix类型xtsAPI: C语言API接口类型转换as.xts: 转换对象到xts(zoo)类型as.xts.methods: 转换对象到xts函数plot.xts: 为plot函数,提供xts的接口作图.parseISO8601: 把字符串(ISO8601格式)输出为,POSIXct类型的,包括开始时间和结束时间的list对象firstof: 创建一个开始时间,POSIXct类型lastof: 创建一个结束时间,POSIXct类型indexClass: 取索引类型.indexDate: 取索引的.indexday: 索引的日值.indexyday: 索引的年(日)值.indexmday: 索引的月(日)值.indexwday: 索引的周(日)值.indexweek: 索引的周值.indexmon: 索引的月值.indexyear: 索引的年值.indexhour: 索引的时值.indexmin: 索引的分值.indexsec: 索引的秒值数据处理align.time: 以下一个时间对齐数据,秒,分钟,小时endpoints: 按时间单元提取索引数据merge.xts: 合并多个xts对象,重写zoo:merge.zoo函数rbind.xts: 数据按行合并,为rbind函数,提供xts的接口split.xts: 数据分隔,为split函数,提供xts的接口na.locf.xts: 替换NA值,重写zoo:na.locf函数数据统计apply.daily: 按日分割数据,执行函数apply.weekly: 按周分割数据,执行函数apply.monthly: 按月分割数据,执行函数apply.quarterly: 按季分割数据,执行函数apply.yearly: 按年分割数据,执行函数to.period: 按期间分割数据period.apply: 按期间执行自定义函数period.max: 按期间计算最大值period.min: 按期间计算最小值d: 按期间计算指数period.sum: 按期间求和nseconds: 计算数据集,包括多少秒nminutes: 计算数据集,包括多少分nhours: 计算数据集,包括多少时ndays: 计算数据集,包括多少日nweeks: 计算数据集,包括多少周nmonths: 计算数据集,包括多少月nquarters: 计算数据集,包括多少季nyears: 计算数据集,包括多少年periodicity: 查看时间序列的期间辅助工具first: 从开始到结束,设置条件取子集last: 从结束到开始,设置条件取子集timeBased: 判断是否是时间类型timeBasedSeq: 创建时间的序列diff.xts: 计算步长和差分isOrdered: 检查向量是否是顺序的make.index.unique: 强制时间唯一,增加毫秒随机数axTicksByTime: 计算X轴刻度标记位置按时间描述indexTZ: 查询xts对象的时区2. 定义预测任务假设从交易方面看,我们认为价格变动超过P%时值得交易(即获利超过交易费用)。在这个假设下,我们需要预测模型来预测在未来k天中是否能够获得这个边际利润。注意,在这k天中,实际上可以观察的价格可能高于这个比例和低于这个比例。这意味着,预测未来某个特定时间t+k的报价可能不是最好的方法。事实上,我们需要预测的是在未来k天中价格总的动态变化,并不是预测某个特定时间的一个特定价格。例如,在时间,t+k的收盘价的变化可能比p%低得多,但是在它前面日期t,,t+k的价格变化可能远远大于p%。因此,我们事实上需要的是未来k天的总体价格趋势。我们从报价数据计算一个变量,它可以作为未来k天的趋势指标值。这一指标值应与我们对接下来的k天能够获得p%的价格变化的信心相关。在这个阶段,重要的是要注意,当我们提到p%的变化时,它的意思是高于或低于目前的价格。这里的想法是,正的变化将导致买入,而负的变化将触发卖出行动。这里我们给的指标把趋势作为一个单一的值,正值表示向上的趋势,负值表示价格向下的趋势。假设每天的平均价格可以由一下面公式来近似:其中,Ci,Hi,Li和分别为第i天的收盘价、最高价和最低价。设Vi代表未来k天的平均价格相对今天收盘价的百分比变化(通常称为算术收益)我们把动态变化绝对值超过目标收益p%的变化进行累加作为一个指标变量T:指标变最T用来找出在k天内,日平均价格明显高于目标变化的那些日期的变化之和。大的正T值意味着有几天的日平均报价高于今天收盘价的p%
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理三测考试题及答案
- 东南亚跨境电商市场跨境电商平台客户服务优化报告
- 导游业务教学课件
- 对比车辆性能课件
- vb实验考试试题及答案
- ps常用考试题及答案
- 工程施工度汛方案(3篇)
- 英语初三试卷及答案
- 2025年投资常识题库及答案
- 教学设计比赛题目及答案
- 身体尺(课件)二年级上册数学人教版
- 化验室检验和试验管理制度
- 欠款转为借款合同
- 公路隧道建设施工技术规范学习考试题库(400道)
- 严重创伤重症监护
- 人教版六年级语文上册生字表(带拼音词组)-2023修改整理
- 初中生自我介绍范文给老师
- 北京市建筑施工作业人员安全生产知识教育培训考核试卷ABCDE
- GB/T 14048.7-2016低压开关设备和控制设备第7-1部分:辅助器件铜导体的接线端子排
- 议论文如何议论-使素材紧扣中心论点的方法
- 第十二章-地球系统科学课件
评论
0/150
提交评论