




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 18基于多元线性回归的期权价格预测模型王某某(北京航空航天大学 计算机学院 北京 100191) 1摘 要:期权是国际市场成熟、普遍的金融衍生品,是金融市场极为重要的金融工具。2015 年 2 月 9日,上海证券交易所正式推出了我国首支场内交易期权上证 50ETF 期权,翻开了境内场内期权市场的新篇章。50ETF 期权上市以来,市场规模逐步扩大,其发展情况境外期权产品相同时期。本文以此为研究背景,以“50ETF 购 12 月 1.95”这支期权为研究对象,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。本次研究以多元线性回归的全模型(模型 1)为出发点,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。进而通过主成分回归(模型 4)和逐步回归(模型 5)进行降维,结果表明因变量与解释变量之间存在强烈的线性相关关系,且主成分回归和逐步回归相比全模型有更好的预测能力。关键词:期权价格 多元线性回归 50ETF 多重共线性 因子分析一、引言期权(option)是依据合约形态划分的一种衍生品,指赋予其购买方在规定期限内按买卖双方约定的价格(即协议价格或行权价格)购买或者出售一定数量某种金融资产(即标的资产)的权利的合约。期权购买方为了获得这个权利,必须支付给期权出售方一定的费用,称为权利金或期权价格 1。2015 年 2 月 9 日,上海证券交易所正式推出了我国首支场内交易期权上证50ETF,翻开了境内场内期权市场的新篇章。期权是与期货并列的基础衍生产品,是金融市场极为重要的金融工具之一。自 50ETF 上市以来,市场规模逐步扩大。2015 年 2 月日均合约成交面值为 5.45 亿元,12 月就达到了 47.69 亿元,增长了 7.75 倍;2 月日均合约成交量为 2.33 万张,12 月就达到了 19.81 万张,增长了 7.5 倍;2 月权利金总成交额为 2.48 亿元,12 月就达到了 35.98亿元,增长了 13.51 倍 1。我国股票市场有上亿的个人投资者,是一个较为典型的散户市场 1。相较于专业投资机构讲,散户缺乏时间,精力以及专业分析,投资具有很大的投机行为。对于这些投资者来说,期权价格的变动则是他们最为关注的问题,其变化直接影响到自身的收益。在实际情况中,影响股票价格的因素很多,涉及到金融政策、利率政策以及国际市场等因素,其作用机制也相当复杂 2。因此,对于期权价格预测的研究,则可以降低投资者的投资风险,及时调整投资结构,从而保障自身的收益。1作者简介:王某某,北京航空航天大学研究生 邮箱:。2 / 18本文选择“50ETF 购 12 月 1.95(期权代码:10000629) ”这支期权作为研究对象,根据过去一个月内期权的交易数据,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。下文由如下几部分构成:第二部分介绍了本次研究的数据集,包括数据来源、和数据字段;第三部分重点介绍了各个多元线性回归模型,包括全模型及异方差检验,残差的独立性检验、误差的正太分布检验和多种共线性检验,在第 4 小节和第 5 小节分别采用主成分回归和逐步回归对模型加以改善;第四部分运用第三部分建立的各个模型对期权价格进行了预测;第五部分对本文研究进行了总结并未来的研究加以展望。二、数据说明本次研究的数据来源于 Wind 资讯金融终端,从上面获取了“50ETF 购 12 月 1.95”这支期权自 2016 年 10 月 24 日至 2016 年 11 月 24 日(只包含工作日)共计 24 日的交易数据。经过整理后得到最终的数据字段,见表 1。表 1 期权交易数据字段收盘价 开盘价 最高价 最低价 结算价成交额 成交量 持仓量 涨停价 跌停价期权交易数据见附录 1。三、建模1 符号说明各个变量及其符号说明见表 2。表 2 各个变量及其符号说明变量 符号明日收盘价 Y今日开盘价 13 / 18今日收盘价 2今日最高价 3今日最低价 4今日结算价 5今日成交额 6今日成交量 7今日持仓量 8今日涨停价 9今日跌停价 102 解释变量与指标变量的散点图在建立模型之前,首先利用 MATLAB 绘制各个解释变量与指标变量(明日收盘价)之间的散点图,观察各个解释变量与指标变量之间的关系,散点图结果见图 1。4 / 18图 1 各个解释变量与指标变量(明日收盘价)的散点图通过图一中的散点图可以看出,明日收盘价与今日收盘价、今日开盘价、今日最高价、今日最低价、今日结算价、今日持仓量、今日涨停价以及今日跌停价之间有较为明显的线性关系;而与今日成交额以及今日成交量之间的线性关系并不明显。5 / 183 全模型通过散点图我们观察到指标变量与各个解释变量之间大致上为线性关系,所以考虑多元线性回归模型进行建模。3.1 模型建立与求解首先建立各个解释变量与指标变量的全模型,即考虑如下模型:=0+11+1010+ (0, 2) 式中, , , , 都是与解释变量无关的未知参数,其中 , ,0 1 102 0 1称为回归系数。10在 MATLAB 中使用 regress 函数即可求解此多元线性回归模型,求解结果见表 3.表 3 MATLAB 求解全模型结果回归系数 回归系数的估计值 回归系数置信区间0 0.1555 -0.1938 0.50491 1.8288 -0.9212 4.57872 0.0586 -1.5671 1.68433 0.6199 -0.4249 1.66474 -1.0532 -1.9703 -0.13625 -1.2208 -3.8759 1.43426 0.0000 -0.0000 0.00007 -0.0000 -0.0001 0.00008 -0.0000 -0.0000 0.00009 0.3233 -1.0317 1.678310 0 0 06 / 18= 0.9489 = 26.7989 0.0001 = 0.00012 F p s2从上表容易看出模型(1)成立,此时指标变量与解释变量满足的回归模型为:=0.1555+1.82881+0.05862+0.619931.053241.22085+0.32339(模型 1)在 MATLAB 中画出模型 1 的残差分布,见图 2。除第 12 个数据外其余残差的置信区间均包含零点,因此第 12 个点应当视为异常点,将其剔除后重新计算,得到模型 2:=0.2484+1.54321+0.02912+0.748230.872641.12925+0.15849(模型 2)模型 2 的 = 0.9736, = 49.1655, 0.0001, = 0.0001。2 F p s2但同时我们发现,各个回归系数的置信区间仍然均包含零点。画出模型 2 的残差分布,发现又出现了异常点,按照上面的方法剔除异常点直至没有异常点产生。最终一共去掉了5 个异常点(分别是 2,12 , 15,22 以及 23) ,最终得到模型 3: =0.3999+2.76641-0.59872+1.660731.37124- 3.159650.00017+0.66699(模型 3)模型 3 的 = 0.9969, = 281.6079, 0.0001, 0.0001。2 F p s2可见模型 2 相当显著,各个回归系数的置信区间均不包含零点;但是去除的数据点有5 个(总共 23 个) ,去除的异常点比较多,容易去除有用信息,所以我们只把模型 3 作为图 Error! Main Document Only. 模型 1 的残差分布7 / 18后期预测的一个对比模型,在之后的分析中,我们只考虑去除第 12 个异常点的数据。接下来进行异方差检验,残差的独立性检验以及多重共线性检验。3.2 异方差检验通过 SPSS 画出残差对预测值的散点图,见图 3。根据图 3 可以认为数据基本不存在异方差性,即认为随机误差具有相同的方差。3.3 残差的独立性检验通过 SPSS 的 Durbin-watson 检验得到 DW 值为 2.545,模型 2 中解释变量数量 k(包括常数项)为 7,样本数量 n 为 22,查 DW 分布表得到相应的 0.510, 2.015。由于d= d=,认为随机误差之间无自相关 3。d4d3.4 误差的正态分布检验通过 SPSS 画出正态 P-P 图以及回归标准化残差频率分布直方图,见图 4。图 Error! Main Document Only. 残差对预测值的散点图8 / 18从上图可以认为误差服从均值为 0 的正态分布。3.5 多重共线性检验多元线性回归模型的基本假设中要求设计矩阵 X 的列向量之间不存在密切的线性关系3,如果存在,就称它们之间存在多重共线性。通过 SPSS 进行多重共线性诊断,结果如下表。从上表可以看出绝大部分变量的 VIF 值远远大于 10,说明严重存在多重共线性,针对多重共线性的问题,接下来用主成分分析加以处理。图 Error! Main Document Only. 误差的正太分布检验图表 Error! Main Document Only. 多重共线性诊断结果9 / 184 主成分回归利用 MATLAB 对这个十个解释变量进行主成分分析,分析过程如下。1)对原始数据进行标准化处理x= 即每个元素的值减去该列的均值,然后除以这一列的方差。2)计算相关系数矩阵 R,结果见表表 5 解释变量的相关系数1 2 3 4 5 6 7 8 9 101 1.00 0.92 0.98 0.96 1.00 0.61 0.50 -0.88 0.92 0.922 0.92 1.00 0.90 0.96 0.91 0.43 0.31 -0.88 0.99 0.993 0.98 0.90 1.00 0.94 0.98 0.68 0.58 -0.88 0.91 0.914 0.96 0.96 0.94 1.00 0.95 0.46 0.34 -0.84 0.96 0.965 1.00 0.91 0.98 0.95 1.00 0.64 0.54 -0.88 0.91 0.916 0.61 0.43 0.68 0.46 0.64 1.00 0.99 -0.54 0.46 0.467 0.50 0.31 0.58 0.34 0.54 0.99 1.00 -0.45 0.34 0.348 -0.88 -0.88 -0.88 -0.84 -0.88 -0.54 -0.45 1.00 -0.86 -0.869 0.92 0.99 0.91 0.96 0.91 0.46 0.34 -0.86 1.00 1.0010 0.92 0.99 0.91 0.96 0.91 0.46 0.34 -0.86 1.00 1.003)计算特征值和累计贡献率见表 6表 6 各个解释变量的特征根和累计贡献率变量 特征根 累计贡献率1 8.1030 81.03%10 / 182 1.5011 96.04%3 0.1878 97.92%4 0.1553 99.47%5 0.0240 99.71%6 0.0173 99.89%7 0.0074 99.96%8 0.0028 99.99%9 0.0013 100.0%10 0.0000 100.0%可以看出,前两个特征根的累计贡献率就达到了 90%以上,主成分分析效果很好。下面选择前四个主成分(累计贡献率 99.47%)进行综合分析。4)前四个特征根对应的特征向量见表 7表 7 前四个特征根对应的特征向量1 2 3 4 5 6 7 8 9 10第 1 个特征向量0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 亲戚间合作买房合同范本
- 业务预付款合同协议范本
- 2025合同补充协议模板
- 提供场地合作协议合同范本
- 小儿推拿治疗鼻炎课件
- 小儿推拿宣传课件
- 出租车夜行包车协议合同
- 出售百年树木合同协议书
- 期货从业资格之《期货基础知识》题库检测题型带答案详解(巩固)
- 期货从业资格之期货投资分析通关检测卷附参考答案详解(预热题)
- 已完工程量转让协议
- 新高考数学全国卷1第20题说题课件
- 河南省2023年对口升学养殖专业试卷(专业课+基础课)
- GB/T 3098.15-2023紧固件机械性能不锈钢螺母
- 兰花花叙事曲二胡曲谱
- 调解协议书电子版5篇(可下载)
- 材料性能学(第2版)付华课件1-弹性变形
- GB/T 4909.4-2009裸电线试验方法第4部分:扭转试验
- PDCA质量持续改进案例一:降低ICU非计划拔管发生率
- 企业标准编写模板
- 初中道德与法治 九年级(维护祖国统一)初中道德与法治九年级作业设计样例
评论
0/150
提交评论