回归分析在股票预测中的应用.doc_第1页
回归分析在股票预测中的应用.doc_第2页
回归分析在股票预测中的应用.doc_第3页
回归分析在股票预测中的应用.doc_第4页
回归分析在股票预测中的应用.doc_第5页
免费预览已结束,剩余39页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

成都理工大学毕业设计 论文 I 回归分析在股票预测中的应用 作者姓名 王雅芬 专业班级 应用数学 2005070101 指导老师 罗德江 摘 要 回归分析预测被广泛应用于经济学 社会科学 工程技术和生物学等许多 领域当中 进行各专业指标变量的统计分析和预测控制 本文从回归分析预测 与其他预测方法的简单算法对比出发 系统的讨论了线性回归分析和非线性回 归分析的基本算法 再以八一钢铁股票的历史价格为例 对比多元线性回归和 非线性回归分析预测 得出非线性回归分析拟合能力更强 拟合优度更高的结 论 关键字 回归分析预测 非线性回归 线性回归 拟合度 成都理工大学毕业设计 论文 II Regression analysis in the stock of the use of forecast Abstract The regression analysis forecast is widely applied in the economic the social sciences the engineering technology and the biology and so on the middle of many domains carries on each specialized target variable the statistical analysis and the predictive control This article embarks from the regression analysis forecast with other forecast technique s simple algorithm contrast system s discussion linear regression analysis and non linear regression analysis s primary algorithm again take 81 steel and iron stock s historical price as the example the contrast multi dimensional linear regression and the non linear regression analysis predict that obtained the non linear regression analysis fitting ability to be stronger a goodness of fit higher conclusion Keywords Forecast regression analysis Non linear regression Linear regression Fit 成都理工大学毕业设计 论文 III 目 录 第 1 章 前 言 1 1 1 选题背景和意义 1 1 2 股票的可预测性 2 1 3 回归的发展概况 3 1 4 文章结构 4 第 2 章 预测方法概述 6 2 1 趋势分析法 6 2 2 时间序列法 7 2 3 灰色预测法 7 2 4 模糊数学法 8 2 5 回归分析法 9 第 3 章 回归分析 10 3 1 线性回归分析 11 3 1 1 一元回归模型 11 3 1 2 多元回归线性分析模型 12 3 1 3 线性相关程度测定及相关性检验预测 16 3 2 非线性回归分析 17 3 2 1 非线性回归分析 17 3 2 2 参数估计和模型检验 19 3 2 3 非线性回归分析存在的问题 21 第 4 章 实例分析 23 4 1 用回归分析进行预测的步骤 23 4 2 数据的选取 23 4 3 线性回归分析的程序实现 24 4 3 1 回归方程求解 24 4 3 2 运行结果 26 成都理工大学毕业设计 论文 IV 4 3 2 模型预测 27 3 3 3 结果分析 27 4 4 非线性回归分析的程序实现 27 4 4 1 模型拟合 29 4 4 2 差分运算 29 4 4 3 模型定阶 31 4 4 4 建立模型 31 4 4 5 模型检验 31 4 4 6 模型预测 32 4 4 7 绘图 32 4 4 8 结果分析 33 结 论 34 致 谢 35 参考文献 36 附 件 37 成都理工大学毕业设计 论文 1 第 1 章 前 言 1 1 选题背景和意义 股票价格是中国绝大多数公民关心的问题 也是经济 系统科学领域研究 的热点问题 目前 证券市场的成熟程度己经成为衡量一个国家经济总体发展水平的重 要指标 西方发达国家证券化比率 股票市场总市值占 GDP 的比重 高达 50 100 新中国的证券市场虽然起步较晚 但有了较快发展 主要表现在股票市 场的总市值和上市公司数目的不断增长 我国加入 WTO 所有经济元素都在向 国际看齐 诸如法律法规 关税水平等 但随着贸易制度的完善 股市作为经 济的 晴雨表 与国际接轨 逐步走向成熟 规范是必然趋势 随着国家对证 券市场的开放 政策调控水平以及投资集团群体思维能力的提高 人们在交易 行动之前对证券市场的未来加以预测也会成为一种自觉的思维活动 投资者们时刻在关心股市 分析股市 试图预测股市的发展趋势 然而影 响股票价格的因素很多 其作用机制也相当复杂 其走势的预测非常困难 主 要因为我们缺乏信息对市场影响的传导系统的结构和系统模型 并且不能准确 把握金融政策 利率政策 公司状况 国际市场及投资者心理承受能力等因素 的变化及其对市场的影响方式和作用 因此 对我国证券投资预测的研究 不 仅可以使投资者获得风险既定下的最大收益或收益最大下的最小风险 而且对 研究证券价格的形成机制 评价证券市场效率以及对证券市场实施有效监管都 具有重要作用 也正因为如此 如何判断或预测股票市场价格走势引起了众多 经济金融学家和市场分析人员的极大兴趣 各种预测方法相继涌现 证券投资 领域可以说是研究和运用各种预测方法最多的领域之一 股市预测是经济预测的一个分支 它是以准确的调查统计资料和股市信息 为依据 从股票市场的历史现状和规律性出发 运用科学的方法 对股票市场 的未来发展前景做出测定 股市的可预测性问题与有效市场假说 三 ffieientMarketHypothesis 简 称 EMH 密切相关 如果有效市场理论或有效市场假说成立 股票价格充分反映 了所有相关的信息 价格变化服从随机游走 股票价格的预测则毫无意义 从 成都理工大学毕业设计 论文 2 中国股票市场的特征来看 大多数学者的结论支持中国的股票市场尚未达到弱 势有效 也就是说 中国股票市场的股票价格时间序列并非序列无关 而是序 列相关的 即历史数据对股票的价格形成起作用 因此 可以通过对历史信息 的分析预测价格 随着计算机技术 混沌 分形理论的发展 人们开始将股票的市场行为纳 入非线性动力学研究范畴 我国学者闰冀楠 张维和美国学者 AF Darart 和 MZhong 等分别采用非参数检验等方法 发现我国股市的指数收益中 存在经典 线性相关之外的非线性相关 从而拒绝了随机游走的假设 指出股价的波动不 是完全随机的 它貌似随机 杂乱 但在其复杂表面的背后 却隐藏着确定性 的机制 因此存在可预测成分 当然 认为股价可预测 并不等于说可以 100 的准确预见 而是指可以使用经济预测的方法 建立起能在一定误差要求之下 的预测股价变动的预测模型 一批学者先后证实了证券市场的确存在着一些可利用的规律 其成功率之 高和稳定性之久 远远超出了 随机行走理论 可以解释的范围 因此 最近二 十年 持证券市场缺乏效率观点人越来越多 证券市场预测的研究也再次成为 人们关注的热点 应用技术分析等方法进行证券投资预测分析研究中逐渐成为 证券投资的主要手段之一 1 1 2 股票的可预测性 通过对已知事实的分析总结 得到对客观世界的认识和规律 这些规律可 以帮助人类认识现有的世界 同时帮助人类对未知的现象做出正确的预测和判 断 预测不能直接观测的事实 预测是指从已知事件测定未知事件 预测理论 作为一种通用的方法论 既可以应用于研究自然现象 也可以应用于研究社会 现象 将预测理论应用于各个领域 就产生了预测的各个分支 如医学预测 电力预测 经济预测 气象预测等等 在金融经济学的发展上 人们对金融预测作了大量的探索 取得了丰硕的 成果 典型的金融预测是回归分析预测 回归分析预测就是在大量观测数据的 基础上 找出这些变量之间的内部规律 从而定量的建立起一个变量与其它变 量的数学表达式 为了研究这种规律性 人们提出了许多预测模型 并对这模 型的性质及分析方法进行了深入的研究 2 成都理工大学毕业设计 论文 3 这些在理论上很成功 但它们都是建立在很理想的假设上 而这些假设与 市场的实际情况有很大差距 所以这些理论在实际效果中并不理想 另一种方 法是从统计角度对金融时间序列进行研究 这种方法直接从实际数据出发 应 用概率统计推断出市场未来的变化规律 虽然这种方法从经济学角度来讲缺乏 理论性 但是在实际应用中效果较好 而且 统计方法还可以对经济模型的好 坏进行检验和评价 股市预测 是金融经济预测的一个重要分支 它对股票市场所反映的各种 资讯进行收集 整理 综合等工作 从股市的历史 现状和规律性出发 运用 科学的方法 对股市未来发展前景进行测定 11 1 3 回归的发展概况 回归分析方法通常分为线性和非线性回归方法两大类 其中线性回归方法 己经发展成为数理统计学的一个相对成熟的重要分支之一 并被广泛应用于经 济学 社会科学 工程技术和生物学等许多领域当中 进行各专业指标变量的 统计分析和预测控制 并取得可喜成绩 随着回归分析方法研究的逐步深入以 及具体实践遇到的大量复杂的非线性问题 在线性统计的基础上 非线性回归 分析研究也逐渐发展起来并成为处理非线性问题的主要手段之一 起到传统线 性回归方法不可替代的重要作用 统计学理论的预测方法 主要是基于模型拟合和最小二乘原理建立各种回 归 自回归 混合回归模型进行预测 此类方法 具有严格的数学基础 应用 也最广泛 近年也有相当的发展 如 Nelder JA 和城 dderburn R w M 提出了广义线性模型 13 它放松 了经典线性模型的假设 极大地丰富了回归分析的理论 Aarno Li 和 Duan 对 假设进一步放松 提出了一般回归模型 该领域研究具有十分惊人的前景 但 由于其仅能辨识参数的方向 应用起来十分不便 仅能对建模提供指导 在计 量经济研究中 Ichimura 则提出了一类十分重要的模型一单指标模型 研究的 重点在于使之更适合于实际社会经济系统建模 非参数建模 数据驱动式建模所考虑的重要问题是 在事先对模型完全不 了解的情况下 如何提出一个适当的模型 这方面研究的一个重要论题是非参 数建模 Friedman 和 Stuetzle 提出了 pp 回归模型 Breioan 和 Friedman 提出 成都理工大学毕业设计 论文 4 了建模的 ACE 方法 Hastie 和 TibS 于 lirani 提出了广义加性模型 Buja Hastie 和 Tibshiran 对加性建模进行了全面的评述与讨论 Breiman 提出 了高维数据建模的 MARS 方法 它们共同的特点是模型形式灵活 建模过程涉及 很少假定 但计算量大 解释困难 在指导变量选择及模型设定方面深入的研 究是必不可少的 至于估计问题 NL2SLS 非线性二阶段最小二乘 NL3SLS 非线性三阶段最 小二乘 和 NLFIML NLLIML 非线性完全 有限 信息极大似然 估计方法是通常 采用的方法 AmemiyA 和 Gallani 均给予了总结与评述 14 解决的关键在于 辅助变量的选取 另外 有效初始点设置及考虑全局最小参数估计一方法的研 究也是值得考虑的 1 4 文章结构 首先介绍论文研究背景和研究的可行性 并讨论了回归的简单发展 股票 预测已成为越来越多的股民和学者关注的问题 股票理论的可预测性被越来愈 多的人认可 回归分析和非线性回归分析已越来越广泛的使用于股票研究中 进行不断的研究和改善 意图得到更稳定更符合规律的算法结构 其次对各种预测方法进行了简单的概述介绍 包括理论定义和基本算法 并简单阐述了各种预测方法的优缺点 可以看到各种方法都有它的优缺点和需 要注重改善的地方 各种预测方法的对比中 可以发现回归分析预测有操作简 单 容易理解等方面的优点 但也有选不准自变量的困扰 再次仔细介绍了回归分析的两部分 线性回归分析和非线性回归分析算法 的算法结构步骤和具体算法 从最基本的一元线性回归分析着手 介绍与一元 线性回归分析算法相似度跟高的多元线性回归 并进一步的引出非线性回归分 析 提出非线性回归分析的分析结果依赖于人为地设定出合理的期望函数和接 近真实的初估值的缺点 最后 实例分析中简单讨论了数据处理的方法步骤 解决数据来源 选定 八一钢铁历史数据数量 95 期 分别做了线性和非线性回归分析的程序对比 线 性回归分析中使用 matlab 程序以开盘价 最高价 最低价 成交额 成交量为 自变量 做出多元线性回归函数 并进行相关性程度分析 进行了 10 期收盘价 格预测 非线性回归模型中 实现通过对每日收盘价的统计和规范化建立使用 成都理工大学毕业设计 论文 5 garch 模型 先对数据进行差分规范化 使得数据达到平稳序列 绘制时序图 确定随机波动比较平稳 考查差分后序列的自相关图确定其相关性 建立模型 检验模型 实现模型拟合成功后成功预测 10 天的预测收盘价 数据用程序处理 成功 成都理工大学毕业设计 论文 6 第 2 章 预测方法概述 预测作为一门实用学科 它所研究的内容就是如何对未来事物的发展进行科 学的估计 所谓经济预测 就是指人们根据对客观经济发展事物及规律的认识 在观察和分析经济发展过程的历史与现状的基础上 对未来的经济发展趋势做出 合理的判断和估计 以个别经济单位生产经营发展的前景作为考察对象 研究其 各项有关指标之间的联系和发展变化状况的 则属于微观经济预测 如对工业企 业所生产的具体商品的生产量 需求量和市场占有率的预测等 微观经济预测 是企业制定生产经营决策以及编制和检查计划的依据 经济预测的方法大体可分为两大类 一类是定性分析法 又称经验判断法 它是人们通过对事物的性质 特点和已占有情况的分析 依靠主观判断和逻辑分 来析预测事物未来发展状况的其结果只是定性描述和大体估计 常用的定性预 测方法有 市场调查预测法 专家评估法 主观概率法等 另一类是定量分析法 又称分析计算法 它是人们利用已占有的基础数据资料 通过建立数学模型进 行计算来预测事物未来发展状况的 其结果则比较明确和具体 随着时代的发展 数学被越来越多的应用到金融中 它也给金融带来了一 场革命 其中最受人瞩目的莫过于金融工程 定量投资以及风险管理 基于以 上理论 除了传统的股票投资分析方法以外 近年来又发展了许多新的股市预 测方法 并且取得了很好的效果 7 2 1 趋势分析法 趋势分析法也称趋势曲线分析 曲线拟合或曲线回归 是根据已知的历史 资料来拟合一条曲线 使得这条曲线能反映负荷本身的增长趋势 然后按照这 个增长趋势曲线 对要求的未来某一点估计出该时刻的负荷预测值 常用的趋势模型有线性趋势模型 多项式趋势模型 线性趋势模型 对数 趋势模型 幂函数趋势模型 指数趋势模型 逻辑斯蒂 logistic 模型 龚伯茨 gompertz 模型等 寻求趋势模型的过程是比较简单的 这种方法本身是一种确 定的外推 在处理历史资料 拟合曲线 得到模拟曲线的过程 都不考虑随机 误差 成都理工大学毕业设计 论文 7 采用趋势分析拟合的曲线 其精确度原则上是对拟合的全区间都一致的 在很多情况下 选择合适的趋势曲线 确实也能给出较好的预测结果 但不同 的模型给出的结果相差会很大 使用的关键是根据地区发展情况 选择适当的 模型 2 2 时间序列法 时间序列 也叫时间数列 历史复数或动态数列 它是将某种统计指标的 数值 按时间先后顺序排到 所形成的数列 时间序列预测法就是通过编制和分 析时间序列 根据时间序列所反映出来的发展过程 方向和趋势 进行类推或 延伸 借以预测下一段时间或以后若干年内可能达到的水平 设为时间序列中时点 i 的观测值 其样本为 N 每次移动地求算术平均值 i x 所采用的观测个数为 n 则在第 t 时点的移动平均值为 1 M 2 1 t nti intttt x n xxxx n M 1 1211 1 1 式中 第 t 时点的移动平均值 也可当做 t M 第 t 1 时点的预测值 即 1 t y 2 2 tT My 11 tt My 由 2 2 式可导出 2 3 nttntntttt xx n xxxx n M 1 1 121 即得 2 4 1 1nttTt xx n MM 由 2 4 可见 在计算各时的移动平均值过程中 若已算得 则用 2 4 式较易 1 t M 于迭代计算出 1 M 2 3 灰色预测法 灰色预测法是一种对含有不确定因素的系统进行预测的方法 灰色预测模 型称为 GM 模型 GM 1 1 表示一阶一个变量的微分方程型预测模型 GM 1 1 是一阶单序列的线性动态模型 成都理工大学毕业设计 论文 8 设有数列 1 0 x 2 0 x 0 nx 对作累加生成 得到新的数列 其元素 0 x 1 x 2 5 0 0 1 nxix i n ni 2 1 对数列 可建立预测模型的白化形式方程 1 x 2 6 1 1 ax dt dx 式中 为待估参数 分别称为发展灰数和内生控制灰数 设为待估 a a 参数向量 则 a a 最小二乘法求解 有 2 7 n TT yBBBa 1 式中 2 8 1 1 2 1 1 3 2 2 1 1 2 1 2 1 1 1 1 1 1 1 nxnx xx xx B 2 9 T n nxxxy 3 2 0 0 0 将 2 7 式求得的代入 2 6 式 并解微分方程 有 GM 1 1 预测模型为 a 2 10 a x a xix ai 1 1 0 1 灰色模型法使用短期数据得到的结果比较占优 但是使用长数据列得到的结 果与其它相比 并不占优 数据列过长 系统受干扰的成分多 不稳定因素大 反而易使模型精度降低 降低预测结果的可信度 2 4 模糊数学法 模糊推理是在模糊逻辑基础上对模糊命题进行演绎和归纳推理 以完成具 有象人一样的近似判断能力的工作 模糊推理的句型表达如下 成都理工大学毕业设计 论文 9 规则 如果是 且是 且是 那么是 1 x 1 A 2 x 2 A n x n AYB 前提 如果是 且是 且是 1 x 1 A 2 x 2 A n x n A 结论 那么是YB 简记为 BAAA 221 结论为 n AAA 21 B 其中 X Y 为被研究对象的名称 n 为被研究对象的个数 B 分别是 i A 论域 Y 上的模糊子集 表示 且 运算 给出建立在推理规则上的逻 i A 辑运算 2 5 回归分析法 回归预测可以说是最为古老同时又应用得最为广泛的一种定量预测方法 是处理多变量相依关系的一种统计方法 它是数理统计中应用最为广泛的一种 方法之一 它的基本思想是分析预测对象与有关因素的相互关系 选择适当的回归模 型 即回归方程 表达出来 然后再根据数学模型预测其未来状态 然而在许多实际问题中 由于各种关系错综复杂 要精确的建立变量间数 学表达式又特别困难 同时很多变量之间还受到其它偶然因素的影响 使得这 些变量之间的关系具有不确定性 回归分析方法就是在大量观测数据的基础上 找出这些变量之间的内部规 律 从而定量的建立起一个变量与其它变量的数学表达式 因此简单说来 回归 分析就是研究一个变量与其它变量之间关系的一种统计方法 由于有较为严密 的理论基础和较成熟的计算分析方法 所以 如果模型建立得当 则可得到比 较精确的预测结果 常用的回归模型是多元线形回归模型 一元线性回归模型 只是多元线性模型的一个特例 和多元非线形回归模型 3 成都理工大学毕业设计 论文 10 第 3 章 回归分析 回归预测方法是以相关性原理为基础的预测方法 是数理统计中回归分析 方法在预测中的应用 从市场现象之间的因果关系出发 通过建立回归预测模 型 根据一种或几种现象的变化去推测另一种现象变化的一种定量预测法 在经济预测中 人们把预测对象当作因变量 把那些与预测对象有关的因 素当作自变量 收集自变量的充分数据 应用相关分析和回归分析求得回归方 程 并利用回归方程进行预测 在回归预测中 预测对象 y 是一个随机变量 与之相关的普通变量 x 或一 组普通变量 称为自变量 如果对于自变量的每一个取值或每 1 x 2 x 3 x n x 一组取值 预测对象 y 的取值都有相应的分布 但由于变量间关系的复杂性或 由于统计数据 试验数据不可避免地存在随机误差而使它们之间的关系带有不 确定性 使预测者无法得到描述它们之间关系的精确的数学表达式 那么 就 需要用回归分析的方法 通过大量的统计数据或试验数据 寻找它们之间潜在 的统计规律性 并以回归方程做出描述 根据回归方程 就可以由一个或多个 自变量的给定值对预测对象做出估计和预测 回归预测法中的自变量与因变量之间 有的属于因果关系 有的属于伴随 关系 不能认为只有因果关系才能进行回归预测 实际上伴随关系也是一种相 关关系 只要收集大量的足够的资料 也可以用回归预测法进行预测 在回归 预测法中 自变量不是随机的或者是给定的 这与相关分析中自变量有所区别 相关分析中的自变量是随机的 由于回归分析方法有较严密的理论基础和较成熟的分析 计算方法 同时 各种社会现象都普遍地与某些因素存在着不同程度的相关关系 所以回归预测 方法在股票市场的预测中得到广泛的应用 6 以下则初步介绍怎样运用回归分析的方法描述这种关系 并据此进行股票 市场预测 成都理工大学毕业设计 论文 11 3 1 线性回归分析 3 1 1 一元回归模型 应用回归分析法进行经济预测的关健就是建立回归方程当一个自变量与因 变量 即预测对象 之间相关关系的统计规律呈线性关系时 就称其为一元线性回 归 一元线性回归分析预测法 就是处理一个自变量与因变量间线性关系的一种 用途很广的方法 该方法简单 适用 可用于处理有因果关系的经济方面的统计数据 一元线性回归的基本模型为 bxay 其中 y 为预测对象少的估计值 x 为自变量 是预测对象的相关因素 a b 为回归系数 回归直线由回归系数来确定 a 和 b 应满足条件 使回归线在总体上与各个数据点最为接近 回归系 数 a b 是根据最小二乘法和已知的样本资料求出的 其求解结果是 2 1 11 22 1 11 2 1 2 1 1111 1 1 xx yyxx xnx yxnyx x n x yx n yx b xbya 式中 分别为自变量 x 和预测对象 y 的统计数据 分别为 x 和 i x i y x y y 所取统计数据的平均值 按上述公式求出回归系数 a 和 b 后即可确定回归方 程 根据回归方程 可以由给定的自变量的取值 x 对预测对象少的取值做出 预测 线性回归预测是在假定 y 与 x 之间存在着线性关系的条件下进行的 线性 回归预测模型能否做出较好的预测 这取决于 y 与 x 之间呈线性关系的近似程 度 y 与 x 之间在多大程度上可以近似地认为它们之间存在着线性关系 不能 仅凭散点的分布直观判断 还应当通过相关性检验做出定量判断 相关性检验是根据 y 与 x 的相关系数来判断它们之间的线性关系 相关系 成都理工大学毕业设计 论文 12 数 r 的绝对值越接近于 1 则 y 与 x 越接近于线性关系 越接近于零 则rr y 与 x 越偏离线性关系 只有当足够大时才能以线性回归模型进行预测 确r 定 y 与 x 之间线性关系的恰当的值 可以从相关系数临界值表上查出临界值r 行判断 当时即可认为 y 与 x 之间存在着显著的线性关系 相关系数 a r a rr 可由下式求得 n i ii n i ii yyxx yyxx r 1 22 1 由于线性回归模型是对 y 与 x 关系的近似描述 所以当以回归模型进行预 测时 得到的预测值 y 也只能是近似的 这就需要对预测值的置信区间做出判 断 预测值的置信区间可由下式计算 n i i n i i a xx xx n yy n t 1 2 2 01 2 0 1 1 2 2 2 y y上 下 式中表示预测置信区间的上 下限 是显著性水平为 上 下 y 2 2 ta n 自由度为 n 2 的 t 分布临界值 它可以根据所确定的显著性水平和所取样本数 n 从 t 分布表中查出 3 1 2 多元回归线性分析模型 在股票市场预测中 由于股票市场这一经济现象的复杂性 预测对象往往 不是仅与一个自变量有关 而是受到多个相关因素的共同作用 为了全面地描 述预测这一经济现象与诸相关因素的关系 更有效地做出预测 就需要建立有 多个自变量的回归预测模型 具有多个自变量的回归预测称为多元回归预测 4 假设预测对象 y 与一组自变量 存在着线性回归关系 那么预 1 x 2 x n x 测对象与这一组自变量之间的关系可以用多元线性回归方程 nnx bxby 22110 xbb 成都理工大学毕业设计 论文 13 来描述 式中 为回归系数 0 b 1 b 2 b n b 回归系数的确定同一元回归分析相类似 是以预测对象 y 及各自变量 1 x 的统计数据按最小二乘法求出 2 x n x 设分别是 的最小二乘估计值 于是有 n 210 0 b 1 b 2 b n b 3 1 nnx xxy 22110 式 3 1 中 是 y 中的一个最小二乘估计 对于每一个试验数据 y 由式 3 1 可得一个 即 inii xxx 21 mi 2 1 i y inni xbxbby 110 这里称为实际值的回归值 mi 2 1 i y i y 显然 回归值与实际值有误差 即 i y i y 110inniii xbxbbyyy 2 1 mi 当然我们希望与值偏离程度越小越好 这样才能使回归值与实际值 i y i y i y 拟合得最好 这里和偏差越小是指每一个和 于是对全部观察值 实 i y i y i y i y i y 验值 有 min min min 10 1 2 110 1 2 n n i innii n i ii bbbQ xbxbby yy 为此我们可以用微分学中求极值的原理来确定 0 b 1 b 2 b n b 3 2 n i ijii j n i ii njxyy b Q yy b Q 0 1 0 2 1 0 2 2 整理化简为 成都理工大学毕业设计 论文 14 3 3 n i iim n i imi n i im n i iim n i im n i iimim n i i n i ii n i i n i i n i im n i im n i i n i i yxxxxbxxbx yxbxxbxxbxbx ybxbxbxnb 11 2 2 1 1 1 10 1 1 1 1 12 1 211 1 2 10 1 1 10 2 0 21 0 10 这里令 XX xxxxxx xxxxxx xxxn A T n i im n i imi n i imi n i im n i imi n i ii n i i n i i n i im n i i n i i 1 2 1 2 1 1 1 1 1 1 21 1 2 1 1 1 11 2 1 1 YX y y y xxx xxx yx yx y C T nmmm n n i iim n i ii n i I m 2 1 21 12111 1 1 1 1 111 m b b b B 1 0 所以 3 2 式可用矩阵形式表示为 YXBXx TT 或CAB 如果系数矩阵 A 满秩 则存在 此时有 1 A 成都理工大学毕业设计 论文 15 3 YXXXCAB TT11 4 这里式 3 4 即为多元回归方程中参数的最小二乘估计 建立多元线性回归方程之前 通常先对预测对象 y 与各个自变量的关系进 行分析 描绘出 y 与各个自变量的散点图 如果预测对象与自变量之间为某种 非线性关系 则须以类似一元非线性回归的方法 通过变量代换转化为线性关 系来处理 多元回归预测是一元回归预测的推广 其基本原理和步骤与一元回归预测 大致相同 只是多元回归预测的方法要复杂得多 计算量要大得多 多元线性回归模型为 xy 其中 21 n yyyy mnmm n n xxx xxx xxx x 21 22221 11211 111 n 10 10 n 其中 X 为设计矩阵 为参数向量 利用最小二乘法我们可以得到参数向 量的解为 yxxx 1 n xyxy 2 这里通常假定模型满足如下条件 1 随机误差是不相关的 即 0 E 2 Var0 ji Cov ji 2 解释变量与误差相互独立 即 0 xE 3 解释变量之间线性无关 即 成都理工大学毕业设计 论文 16 1 mXRank 3 1 3 线性相关程度测定及相关性检验预测 运用回归模型预测的关键是准确地把握住预测变量与相关变量之间的相关 程度 只有在变量之间存在着密切的线性关系时 所建立的线性回归模型涉及分 析预测 才会变得有意义和有价值 因此 对于有不同的变量 往往先进行相关分析 然后再选有明显关系的变量 进行回归分析 在回归分析中 两个变量间相关程度的测定 一般通过计算相关 系数 r 并进行相关显著性检验判定 相关系数 r 的计算公式为 22 yyxx yyxx r ii ii 相关性检验 在计算相关系数 r 的基础上 再通过查 相关系数检验表 可 得到的值 并将其与 r 进行比较 注 为显著性水平 一般取 0 01 2 nra 或 0 05 n 为已知的自变量 即因变量 的数据个数 n 2 称为自由度 若 r n 2 则表明在 显著性水平上 y 与 x 之间的线性关系是显著的 r 越接 a r 近于 1 预测变量 y 与相关变量 x 的相关程度就越高 当 0 7 r 1 时 表明预测变量与相关变量有较高程度的相关 当 0 3 r 0 7 时 表明两者有中等程度的相关 当 0 r 0 3 时 表明两者相关程度甚差 当 r t Lag MU 0 04304 0 02843 1 51 0 1336 0 MA1 1 0 10646 0 10571 1 01 0 3166 1 MA1 2 0 29892 0 10127 2 95 0 4001 2 MA1 3 0 09634 0 10633 0 91 0 3673 3 图4 9 模型检验图2 由于 P 值均大于 0 05 故各参数均显著 所以模型拟合成功 4 4 6 模型预测 对未来 10 天收盘价的预测 成都理工大学毕业设计 论文 33 图4 10 预测结果图 即未来 10 天的收盘价为 9 6793 9 6079 9 6830 9 7260 9 7690 9 8121 9 8551 9 8981 9 941 2 9 9842 4 4 7 绘图 将序列拟合值与序列观察值联合作图 如图 4 11 星号是为序列观察值 红色曲线为模型拟合值 由图知 拟合效果较好 图中绿色曲线给出的是 95 预测区间 x 4 5 6 7 8 9 10 11 12 t 0102030405060708090100110 图 4 11 预测图 成都理工大学毕业设计 论文 34 4 4 8 结果分析 未来 10 天的收盘价为 9 6793 9 6079 9 6830 9 7260 9 7690 9 8121 9 8551 9 8981 9 941 2 9 9842 对比数据 9 89 9 75 10 09 10 95 10 73 差距分别为 0 2107 0 1421 0 407 1 224 0 961 平均误差 0 58896 误差值小 相对多 元线性回归不需要更多的当期相关数据 直接可以利用历史数据进行预测 进 行真正意义上的收盘价预测 成都理工大学毕业设计 论文 35 结 论 非线性回归分析是目前统计学中继线性回归分析之后备受关注的统计方法 之一 本文讨论了各种预测的一般方法 重点线性回归模型和非线性回归模型 的对比 回归预测有着好理解 操作性强的理论优点 从使用条件看 回归分 析致力于统计规律的研究与描述 适用于大样本 且过去 现在和未来发展模 式一致的预测 线性回归模型较之非线性回归模型更为简单容易操作 但拟合 程度远远不及非线性回归分析 为说明这一问题 本文在对基础理论的讨论基 础上使用实例八一钢铁最近股价借助了 MATLA 和 SAS 专业统计软件编程处理 建立线性和非线性回归模型 由于数据进行差分规范 选取了拟合范围更广的 期望函数 确定了自相关系数具有短期相关性 进行了使得模型对观测数据的 拟合能力更强 拟合优度更高 得到短期的股票预测值 非线性回归分析在研究方法和研究对象上远比线性回归分析复杂得多 许 多问题尚处于探讨之中 诸如模型非线性性态强度分析以及模型重新参数化对 非线性性态的影响等本文尚未涉及的问题 还有待于今后做进一步研究 成都理工大学毕业设计 论文 36 致 谢 本文是在尊敬的导师罗德江老师的悉心指导下完成的 从论文的选题至论 文的形成 无不倾注着导师大量的心血和汗水 导师严谨的治学态度 无私奉 献的敬业精神 勤劳刻苦的工作作风 以及对科学的献身精神都给我留下了极 为深刻的印象 三年来 导师无论在学习 工作还是生活上给予了无微不至的 关怀和真诚的帮助 这种真挚的师生情谊令我倍感亲切和终身难忘 值此论文 完成之际 谨向辛勤培育我的导师致以诚挚的敬意和衷心的感谢 感谢成都理工大学数学与应用数学专业所有老师在我求学期间给予的热心 帮助和指导 感谢所有帮助 关心和支持我舍友 同学 老乡 是你们让我的 人生有了精彩的片段 最后感谢我最亲爱的家人的支持和鼓励 正是他们对我的期望和鞭策 才 让我更加努力和进步 成都理工大学毕业设计 论文 37 参考文献 1 丁东 股票十日通 M 北京 京华出版社 1998 2 黎旨远 西方经济学 M 清华大学出版社 1987 3 何晓群 刘文卿应用回归分析 M 北京 中国人民大学出版社 2001 1 157 4 张尧庭 方开泰 多元统计分析引论 M 北京 科学出版社 1982 5 韦博成等译 BatesD M w 从 tSD G 著 非线性回归分析极其应用 北京 中国统计出版社 1997 6 何晓群 回归分析与经济数据建模 M 北京 中国人民大学出版社 1997 7 丁学东 文献计量学基础 M 北京 北京大学出版社 1993 8 张军亮 广义 S 曲线非线性回归模型及其在文献计量学中的应用 硕士论文 2004 9 何晓群 陈志良 回归变量选择与回归误差分析 M 统计与预测 1988 3 10 高惠漩等 SAS 系统 SAS STAT 软件使用手册 M 北京 中国统计一出版社 1998 11 李国平 中国股票市场的可预测性研究 J 高职论丛 2006 9 3 5 11 42 12 陈溟 中国股票市场非线性预测模型研究 内蒙古科技与经济 J 2006 23 31 33 13 Bates J M Granger C W J The Combination of Forecast Operational ResearchQuarterly 1969 20 4 319 325 14 Bollerslev T Chou R Kroner K ARCH Modeling in Finance a Review of theTheory and Empirical Evidence Journal of Econometrics 1992 52 5 59 15 刘晓斌 非线性预测在市场研究中的应用 J 统计与决策 2001 8 22 23 16 17 陶建宏 王京芳 张蓉 股票风险的估计模型及其应用研究 J 天津职业技术师范学院学报 2004 14 1 74 77 成都理工大学毕业设计 论文 38 附 件 实例中使用的八一钢铁历史数据 开盘价最高价最低价 成交量 万股 成交额 万元 收盘价 19 219 79 211 274 6512095 109 58 29 359 419 09704 416499 249 15 39 29 449 011 115 6810341 929 27 49 349 569 2953 369002 979 52 59 449 799 381 108 8710619 009 46 69 99 99 511 313 4212700 969 56 79 610 159 62 085 7820487 799 89 89 419 579 241 096 4910338 309 55 99 649 79 231 264 5511883 309 41 109 659 759 431 487 4014202 889 64 119 610 29 63 969 1339706 319 74 128 859 578 763 390 1131960 859 55 139 159 68 822 788 3625915 979 01 148 959 248 832 249 7620440 649 15 158 989 68 984 727 4943979 509 19 168 668 788 522 309 8520144 278 76 178 788 98 563 145 7627568 368 64 187 918 517 912 161 9718342 648 51 197 767 897 651 111 958659 257 73 207 367 627 361 000 757558 367 56 217 347 517 18959 167102 557 41 22887 331 751 1613268 607 34 238 068 157 96907 927352 868 1 248 538 598 011 713 8714287 208 07 258 558 658 341 326 1511299 828 5 268 468 638 351 343 9511513 208 6 278 98 98 512 305 6719 990 798 52 288 699 218 584 747 2542 834 748 97 298 618 928 482 353 1420 586 358 72 308 518 748 43 422 8529 487 358 72 318 369 018 115 066 8043 425 648 73 328 228 388 141 358 1211 286 828 33 337 998 27 97939 667 645 718 19 348 278 427 991 214 8710 027 208 01 358 388 448 211 248 3110 415 608 32 368 88 858 42 010 2017 243 958 45 成都理工大学毕业设计 论文 39 378 528 868 513 350 6229 186 768 76 388 458 598 371 738 5714 814 528 53 398 148 418 071 488 0212 307 368 4 408 578 628 362 169 2418 408 088 37 418 649 138 384 840 9442 860 278 7 428 378 597 962 920 3224 380 448 55 438 678 778 362 026 6417 405 728 37 448 678 878 523 15

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论