股票预测模型_第1页
股票预测模型_第2页
股票预测模型_第3页
股票预测模型_第4页
股票预测模型_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2014 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛 承承 诺诺 书书 我们仔细阅读了 全国大学生数学建模竞赛章程 和 全国大学生数学建模竞赛 参赛规则 以下简称为 竞赛章程和参赛规则 可从全国大学生数学建模竞赛网站 下载 我们完全明白 在竞赛开始后参赛队员不能以任何方式 包括电话 电子邮件 网上咨询等 与队外的任何人 包括指导教师 研究 讨论与赛题有关的问题 我们知道 抄袭别人的成果是违反竞赛章程和参赛规则的 如果引用别人的成果 或其他公开的资料 包括网上查到的资料 必须按照规定的参考文献的表述方式在正 文引用处和参考文献中明确列出 我们郑重承诺 严格遵守竞赛章程和参赛规则 以保证竞赛的公正 公平性 如 有违反竞赛章程和参赛规则的行为 我们将受到严肃处理 我们授权全国大学生数学建模竞赛组委会 可将我们的论文以任何形式进行公开 展示 包括进行网上公示 在书籍 期刊和其他媒体进行正式或非正式发表等 我们参赛选择的题号是 从 A B C D 中选择一项填写 我们的报名参赛队号为 8 位数字组成的编号 所属学校 请填写完整的全名 参赛队员 打印并签名 1 2 3 指导教师或指导教师组负责人 打印并签名 论文纸质版与电子版中的以上信息必须一致 只是电子版中无需签名 以上 内容请仔细核对 提交后将不再允许做任何修改 如填写错误 论文可能被取消评奖 资格 日期 年 月 日 赛区评阅编号 由赛区组委会评阅前进行编号 2014 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛 编编 号号 专专 用用 页页 赛区评阅编号 由赛区组委会评阅前进行编号 赛区评阅记录 可供赛区评阅时使用 全国统一编号 由赛区组委会送交全国前编号 全国评阅编号 由全国组委会评阅前进行编号 1 题目 摘要摘要 针对 写清楚什么问题 通过 方式怎么分析 考虑到 约束 限制条件 运用 方法 解决 问题 300 500 左右 逐个问题来表述 问题一 问题二 问题三 问题四 问题五 问题六 关键词关键词 3 5 个个 2 1 问题的重述 股票交易数据的分析股票交易数据的分析 1 1 问题的背景问题的背景 新中国股份公司的出现和股票市场的形成出现于 20 世纪八十 九十年代 特别 上海证券交易所 深圳证券交易所的成立标志着我国证券市场开始发展 1990 年 12 月 19 日 上海证券交易所开业 1991 年 7 月 3 日 深圳证券交易所正式开业 中国证券市场作为一个新兴的高速成长的证券市场 在短短十几年的时间里取得 了举世瞩目的成就 证券市场在促进国有企业改革 推动我国经济结构调整和技术进 步方面发挥了突出的作用 目前我国股票总市值已经超过日本 位于世界第二 1 2 问题所给信息及数据问题所给信息及数据 股票市场的发育程度与活跃状态 通常与一个国家或国际社会的经济发展状态关 联 同时也受风险投资者 机构 散户 对企 行 业成长环境的评估与发展前景的 预判等多方面因素的影响 特别 不同投资者基于市场投机的利益博弈 有时成为证 券交易市场风云起伏的重要主导因素 通常用 牛市 熊市 牛市 熊市 这样的交替转化来描述股票市场的景气度周期 性质 所谓 牛市 也称多头市场 指多数上市公司的股票的行情 交易价格 普遍 看涨 延续时间较长的大升市 而 熊市 则正好相反 也称空头市场 指行情普遍 看淡 延续时间相对较长的大跌市 图 B1 上证指数历史数据图 19901219 20150717 共 6013 个交易日数据 不难 发现其交易记录上的几个阶段性高点 分别以 HP1 HP2 HP3 HP4 标示 特别 HP3 对应发生在 2007 年 10 月 16 日的高点 6124 04 而 HP4 对应发生在 2015 年 06 月 12 日 5178 19 1 3 所要解决的问题所要解决的问题 通过一些主要门户网站或股票交易的专业网站 可以获取非常丰富的上市公司股 票交易历史数据 通过对这些数据的有效建模分析 我们希望在如下方面得到有价值 的结论 1 近 25 年的股票交易历史 有何典型的周期性结论 2 可以获取国际上其它一些重要经济体的证券交易指数历史数据 分析其变 动有无共同的特点 3 请结合我国的一些主要经济发展数据指标 给出上证指数目前的合理估值 4 HP3 与 HP4 在适宜的时间跨度下 显示出极强的相似性 升也匆匆 落也 汹汹 一方面 从大众对风险投资概念与心理意识 两次过山车行情的心理把握与介 入节奏有非常大的不同 另一方面 股市行情与外围经济发展的支撑数据关联也有很 3 大差异 百尺巨浪 成于万里浩淼碧波 我们通常认为 系统的大范围坍塌必然可以 从一些局部环节的表现上发现线索 因此 我们希望能从一些个别上市公司的交易数 据的奇异变化 来做出市场风险积累与释放前兆的预警方法 比方给出类似一轮行情 延续的时限 显然能做到最切近的提示是最有价值的 和冲高的幅值等的预判 5 一些观点认为 近期股市交易的大幅起落 只是宏观慢牛当中的一次短暂 性修复 请通过严肃的建模分析 给出相应的分析结论 6 结合你的工作 请给出你对目前中国股市发展的政策建议 篇幅限制在 1000 字以内 2 问题的分析 市场上 股票价格起伏无常 投资者往往面临着市场价格风险 对于多种股票的 价格变化 投资者要逐一了解 既不容易 也不胜其烦 题目中提供了 1990 2015 年 上证指数的 6000 多个交易日数据 作为股票市场价格变动的指标 供我们参考 我们通过找出影响股票价格指数的各种因素 并根据这些因素 结合相关数据的 建模分析 借以预测股市未来走势 同时 搜集了我国的一些主要经济发展数据指标 并选取有代表性的股票的成交数据 为当前的上证指数合理估值 2 1 问题 问题 1 的分析 的分析 观察近 25 年来的股票交易历史数据 有波峰 有波谷 震荡起伏 体现出一定的 周期性 所以我们采用周期性函数拟合的方法 假设拟合函数傅里叶级数展开到 5 阶 股票的历史数据系列 可以看做是一系列不同振幅与相位的正弦函数迭代所构成 在计算机上我们给定了置信度 P 与检验的最大最小周期 使之自动进行时间序 列的周期性检验 找出最显著的周期进行拟合 一直到再也找不出显著周期为止 2 2 问题 问题 2 的分析 的分析 本题选取的数据是道琼斯指数 1896 2012 年的完整收盘价数据 进行相关性分析 具体操作是采用 散点图 的方法 显著性水平为 0 05 同时通过计算相关系 数 R 进行深入的定量考察 2 3 问题 问题 3 的分析 的分析 此问我们结合了国内生产总值 GDP 城乡居民储蓄 居民消费指数 CPI M1 供给 量 M2 供给量及其各自的同比增长率 共计 5 组 10 个主要的经济发展数据指标 运 用多元回归的方法 在 matlab 软件上求出各组数据的权重系数 确定至少 3 个关 键的影响因素 进而给出上证指数目前的合理估值 4 2 4 问题 问题 4 的分析 的分析 本题建立了系统模型以方便求解 在股票市场这个现实的系统中 以 为 输入 以 为输出 利用 方程 约束条件有 系统的目标在于通过 一些个别上市公司的交易数据的奇异变化 做出市场风险积累与释放前兆的预警方法 2 5 问题 问题 5 的分析 的分析 每日股票交易的数据 可以看作是随着时间的推移而形成的一个随机时间序列 通 过对该时间序列上股票指数的随机性 平稳性以及周期性等因素的分析 将这些单日 股指数之间所具有的相关性或依存关系用数学模型描述出来 从而达到利用过去及现 在的股票指数信息来预测未来股票价格情况的目的 对此我们运用了自回归积分滑动平均模型 ARIMA 模型 以时间序列的自相关分 析为基础 而且对序列 取对数和作差分 等平稳化处理 既考虑了股票指数在 时间序列上的依存性 又考虑了随机波动的干扰性 除此之外 结合了 参数估计 通过了假设检验 诊断了残差序列 对于股票交易短期趋势的预测很有依据性 3 模型的假设 3 1 基本假设基本假设 3 1 1 模型一模型一 1 2 3 1 2 模型二模型二 1 2 3 3 1 3 模型三模型三 1 假设股票交易市场是一个线性时不变系统 2 假设当任意两支大盘股相关度足够高 大于 时 可以以其中一支为基础 数据 近似预测另一支 3 5 3 1 4 模型四模型四 1 2 3 4 变量假设 4 1 变量的符号说明变量的符号说明 符号表示的内容 6 5 模型的建立与求解 5 1 问题 问题 1 的模型建立与求解 的模型建立与求解 5 1 1 图像解释图像解释 近 25 年来的股票历史交易数据如图 随着时间的推移 震荡上扬 连续震荡上扬 连续 3 次次 包络线 指数递增 迅速又衰减 包络线 指数递增 迅速又衰减 对应时间点 详细函数变化要说清楚 5 1 2 构造函数拟合构造函数拟合 5 1 3 发现周期性结论发现周期性结论 7 5 2 问题 问题 2 的模型建立与求解 的模型建立与求解 5 2 1 其他重要经济体的证券历史交易数据其他重要经济体的证券历史交易数据 表格 1 道 琼斯股票指数历史收盘数据 5 2 2 相关性分析相关性分析 5 2 3 模型求解模型求解 沿用问题 1 的模型 解题说明如下 5 2 4 结论结论 5 2 4 1 道道 琼斯历史股指数变化趋势分析琼斯历史股指数变化趋势分析 5 2 4 2 与上证的共同点挖掘与上证的共同点挖掘 8 5 3 问题 问题 3 的模型建立与求解 的模型建立与求解 5 3 1 参考数据指标参考数据指标 本题所参考的主要经济发展指标包括 国内生产总值 GDP 城乡居民储蓄 居民 消费指数 CPI M1 供给量 M2 供给量及其各自的同比增长率 共计 5 组 10 个 同 时提供有有上证指数的相关信息 而每一类数据的时间跨度均在 1990 2013 年 表格 2 我国主要的经济发展指标 5 3 2 相关矩阵计算相关矩阵计算 各个经济发展指标用分别用列向量组 表示 而 24 年来的上证指数以向量 组 表示 依次将每一个经济发展指标与对应时期的上证指数做相关性分析 相 关系数 通过协方差计算 协方差矩阵如下 结果得出 列向量组 相当于 向量组 的系数矩阵 建立公式 5 3 3 偏最小二乘法分析偏最小二乘法分析 偏最小二乘回归偏最小二乘回归 多元线性回归分析 典型相关分析 主成分分析多元线性回归分析 典型相关分析 主成分分析 方法体现 设有 q 个因变量和 p 个自变量 为了研究因变量与自变量的统计关系 观测了 n 个样本点 由此构成了自变量与因变量的数据表 X 和 Y 偏最小二乘回归分别在 X 与 Y 中提取出 t 和 u 要求 1 t 和 u 应尽可能大地携带它们各自数据表中的变异信息 9 2 t 和 u 的相关程度能够达到最大 在第一个成分被提取后 偏最小二乘回归分别实施 X 对 t 的回归以及 Y 对 t 的回归 如果回归方程已经达到满意的精度 则算法终止 否则 将利用 X 被 t 解释后的残余 信息以及 Y 被 t 解释后的残余信息进行第二轮的成分提取 如此往复 直到能达到一 个较满意的精度为止 若最终对 X 共提取了多个成分 偏最小二乘回归将通过施行 yk 对 X 的这些成分的回归 然后再表达成 yk关于原自变量的回归方程 为自变量 因变量赋值 展示最终表达式 5 3 4 求解求解 5 3 5 上证目前的合理估值上证目前的合理估值 5 4 问题 问题 4 的模型建立与求解 的模型建立与求解 5 4 1 数据的分析比较数据的分析比较 首先 根据所提供的 B 题参考数据 601318 文档中平安证券自 20070301 20150717 的历史交易数据 以交易日 t 为横轴 以每日交易的最高价 X t 为纵轴 作出平安证券 8 年来股票交易历史数据的曲线图 图 上证在一张图上 我们发现 该曲线的数据震荡变化态势大体类似于题目中 图 B1 上证指数历史 数据图 19901219 20150717 共 6013 个交易日数据 的变化走势 通过其相关矩阵 的推导求解 得知两组大盘数据的相关度在 95 以上 据此 我们大胆猜想 上证的 大盘指数可以由平安提供的大盘历史数据经一定的拉伸变换和时延操作近似得来 5 4 2 模型的建立模型的建立 这里要给出一个系统框图 本题建立一系统模型 H 把整个股票交易市场看作是一个系统 令 Y t X t h t 其中 X t 代表平安证券的每日交易指数 作为系统激励信号 Y t 代表上证的大盘指数 作为系统响应信号 而 h t 则表示系统所发挥的作用 研究清楚 h t 的数学表达式 将 对于股票市场风险的预估及未来股指的预判有重要意义 10 5 4 3 模型求解模型求解 在这样一个系统模型中 实际上输入 X t 与输出 Y t 已经能够从附件所给出的 平 安历史交易数据 和 上证历史交易指数 中有所窥见 通过已有的数据 我们可以 采用逆卷积的方法去求解系统 h t 可以假设 h t A t B t t0 t0作为时延 以下是 详细求解过程 配部分程序语言和求解用图 5 4 4 风险预测和行情预判风险预测和行情预判 可能的风险 对策建议 预测图 5 5 问题 问题 5 的模型建立与求解 的模型建立与求解 5 5 1 应用应用 ARIMA 模型建模的步骤模型建模的步骤 Step1L 求出该观察值序列的样本自相关系数 ACF 和样本偏自相关系数 PACF 的值 Step2 根据样本自相关系数和偏自相关系数的性质 选择阶数适当的 ARMA p q 模型进行拟合 Step3 估计模型中未知参数的值 Step4 检验模型的有效性 如果拟合模型通不过检验 转向步骤 2 重新选择模 型再拟合 Step5 模型优化 如果拟合模型通过检验 仍然转向步骤 2 充分考虑各种可能 建立多个拟合模型 从所有通过检验的拟合模型中选择最优模型 Step6 利用拟合模型 预测序列的将来走势 5 5 2 随机序列的确定随机序列的确定 5 5 2 1 数据的来源数据的来源 基本数据选取的是 B 题目提供的 19901219 20150717 共 6013 个交易日的上证历 史指数 拟对 2015 年 7 月以后约百日内的上证综合指数进行预测和实证分析 我们把 这部分随机数据用时间序列时间序列 yt 来表示 11 图图 1 上证指数历史数据图 上证指数历史数据图 19901219 20150717 共 共 6013 个交易日数据 个交易日数据 5 5 2 2 原随机序列的平稳性检验原随机序列的平稳性检验 1 平稳性的时序图检验 平稳性的时序图检验 观察时间序列 yt 图谱是否围绕着一个常数附近作随机波动 波动幅度范围是否 基本一致 有界 由图图 1 断定 上证指数的时序图尚不够稳定 2 平稳性的自相关图检验 平稳性的自相关图检验 以下作出自相关图 一个坐标轴表示延迟时期数 k 另一个坐标轴表示自相关系数 ACF 通常以悬垂线表示自相关系数的大小 给出自相关图 观察 自相关系数 ACF 随延迟期数 k 的增加并没有快速衰减到零 在 k 3 以 后仍旧大于 2 倍标准差 初步判断 已知的时间序列 yt 尚不够稳定 5 5 2 3 平稳化处理平稳化处理 对时间序列 yt 进行若干次差分 可使序列平稳化 将一阶差分的序列记为 Y 进行 ADF 检验 从图 可看出 差分后的序列为平稳 时间序列 ADF 检验的一些设定形式或公式 配一阶差分的 ADF 检验图 有差分序列的自相关和偏自相关函数图也要 序列蕴含着显著的线性趋势 1 阶差分就可以实现趋势平稳 序列蕴含着曲线趋势 通常低阶 2 阶或 3 阶 差分就可以消除曲线趋 势的影响 5 5 3 模型定阶与识别模型定阶与识别 自回归模型 AR p AR Auto regressive 移动平均模型 MA q MA Moving Average 混合模型 ARMA p q ARMA Auto regressive Moving Average 模型 ARMA p q 的一般表达式为 12 t 是白噪声 并且对于所有的 t 满足 E t yt 1 yt 2 0 引进延时算子 B yt 1 Byt 则有 其中 5 5 3 1p q 参数的处理参数的处理 令 求和自回归移动平均模型 ARIMA p d q 配参数求解结果 或者必要的说明 5 5 3 2 白噪声检验白噪声检验 对 ARMA p d q 的残差序列进行 Q 检验 具体结果如下 配白噪声检验相关图 由图 可知该残差序列为白噪声过程 因此确定用模型 ARMA p d q 来拟合时间 序列 yt 是合适的 5 5 4 模型的求解及结果输出模型的求解及结果输出 我们可以得到我们可以得到 yt l的预测值的预测值 yt l qtqttt ptpttt yyyy 2211 2211 ByB t t p pB BBB 1 2 21 q qB BBB 1 2 21 t yBpARpARMA t 0 即 0 ByqMAqARMA t t 即 ByB t d t p i q li p i qlily qlily yy yyEly ti iltiti ttqlt ltltpltpltt 1 1 11 1111 0 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论