版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ARIMA融合BLSTM模型的股票预测分析案例目录TOC\o"1-3"\h\u15504ARIMA融合BLSTM模型的股票预测分析案例 177261.1滤波与消噪 131661.2滤波原理 3258261.3实验说明 475621.3HP滤波分解时间序列 5273021.4基于Hp滤波的ARIMA模型的股票价格预测 694761.4.1ARIMA模型的建模步骤 6153671.4.2建立模型 6253661.5基于HP滤波的ARIMA-DBLSTM模型的股票价格预测 101.1滤波与消噪在多种因素的共同影响下,导致跨期传播的波动幅度较大,使其有着处处不连续毛刺的表现。但是,在一定的时期内,导致价差呈现上升或下降趋势的因素之一又包括这多种因素中的一些成分所形成的一个具有持续性的合力。一些研究者们对识别趋势形成的信号进行了大量的研究,用来进行传统的趋势交易策略分析。然而大多数的研究对象是金融类的时间序列数据,且通常是波动幅度较大的金融数据,因此,此类研究的结果在很大程度上会受到短期波动的影响,使得识别结果不准确。那么,在识别信号快要出现的时候,可以通过哪些方法来过滤掉这些噪声呢?接下来,将介绍一些过滤理论和过滤工具,为解决上述问题提供了很多启示。时间序列的分析和处理有两种方式。一种是直接将时间序列数据的结构特征与时间扭曲、即时域分析结合起来;时间序列的分析处理大致有两种思路。一种是直接拆分随时间变化的时间序列数据的结构特征,即在频域分析时间序列的结构特征;二是利用功率谱的概念来研究时间序列在频域中的结构特征。金融时间序列的过滤技术也是在上述两种思想的基础上发展起来的。最早的滤波方法的基础理论是傅里叶分析理论,其中时域信号可以转换成频率不一致的三角函数的叠加,然后在频域内滤波。噪声的定义是超过了设定的阈值的频率,其傅里叶系数为0。早期的滤波方法就是通过傅里叶逆变换将该类噪声恢复到时域内,从而达到滤波去噪的目的。但这种早期的滤波方法不适用于金融数据,因为金融时间序列数据通常是非平稳的数据,非平稳数据的特性是随时间而变化的,但早期的滤波方法在处理数据的高频部分时,是全方位处理的。在某一个时域内,这种高频部分可以被定义成噪声,但是在其他不同的时域内,又可能是有用的信号。在如今的滤波方法中,研究对象的主要是频域内和时域内序列,其中Wiener滤波法是频域内的典型代表,Kalman滤波法是时域内的典型代表。Wiener滤波法是研究频域内对象的典型代表,它的中心思想是通过构建最小均方误差的损失函数,找到一个最优的脉冲响应函数,输入波形的最优选择为滤波器的输出波形。即在设定的一系列条件的基础上,从最原始的时间序列中得到一个较为平滑的波形,这个波形是不包含原始数据中的噪声的。但是,这种方法同样也是在非平稳数据,如金融时间序列数据,的研究过程中存在一定的局限性的,因为这种方法的一个前提条件是需要通过自相关函数、功率谱密度等方法得到区别噪声和有用信号的先验知识。Kalman滤波法是研究时域内对象的典型代表,它引入了递归的思想,可以根据前一时刻的状态估计值和当前时刻的观察值得到当前时刻的估计值。在递归的过程中,最优值的优化准则选择的是最小均方误差。由于递归可以根据上一轮的估计快速更新和处理数据,因此只须输入一次历史数据,这也是Wiener滤波法所不能做到的。然而,这种递归的方法需要对系统的运动规律非常了解,并且能建立出精确的方程,这使得Kalman滤波法非常难以在非平稳金融时间序列中应用。小波分析也同样得到了广泛的应用,其中使用较多的是定量投资。小波理论是滤波理论中的巨大突破,它改进了传统的频谱滤波中傅立叶分析结构。小波变换和傅立叶变换在对信号进行分解时,有着较大的差异。通过小波变换分解得到的是不同频率的小波函数,而通过傅立叶变换分解得到的是三角函数,显然,这两者存在较大的差异。在小波变换中,最后所需要得到的小波函数的计算依据是分解得到的不同频率的小波函数的变换以及其变换尺度,并且可以分为两个部分:高频部分和低频部分。在使用小波变换的实际研究过程中,由于高频层中的噪声是普遍存在的,所以在使用小波变换时通常有以下几步:第一、分解原始信号,得到n层的小波分量以及n层的高低频系数;第二、设定较为合适的阈值,方便在对这些高低频系数进行量化之后,能够有效的进行滤波,消除噪声;第三、处理完这些高低频系数之后,将得到的小波函数重组,最终获得消除了噪声的新信号。但是,在定量模型的构建和实践中,小波分析中的参数选择问题是一个很大的问题。过多的参数依赖性将大大降低模型的可信度。1.2滤波原理HP滤波方法被广泛应用于宏观经济变量的研究领域中。首次被提出是在1980年,Hodrick和Prescott用来分析美国战后的经济运行状况。因此,HP滤波最初就是用来分析宏观经济数据的,其目的是为了得到一个小且稳定的波动方差。在这个过程中,不断的调整所研究的时间序列的波动性,让其波动范围与均值的变化范围是相匹配的。从数理理论的角度出发,HP滤波器的原理简单来说就相当于是一个高通滤波器。HP滤波器可以自动的将不同频率的时间序列数据的波形分解,得到多种频率不同的波形组合,然后过滤掉频率较低的波形,最终得到的波形是波动幅度可控的且波动频率较大的。接下来,介绍HP滤波方法在股票价格预测领域上的应用。假设原信号包含主要趋势成分和噪声成分,那么需要先将其中的主要趋势成分和噪声成分区分开来,公式如下:yt=g用HP滤波方法将股票指数序列分解为线性的趋势项和非线性的周期项,要通过HP滤波从yt中将gt和minSλ其中,残差项t=1Tyt−gt2刻画了主要趋势成分gt对原序列yt的追踪程度,而二阶差分项t=3Tgt−g接下来,给出HP滤波最优化问题的求解过程。式(5-3)是一个无约束极值问题,最高阶为二阶,存在解析解。通过对不同gi∂S(5-3)在求解线性方程组的数值时,主要有两种方法可以选择。第一种是直接法,将要求解的方程组转化为等价的三角形方程,然后求解方程组,这样得到的结果具有较高的精度。除了等价的三角形方程组外,也可以选择转化为其他等价的可以求解的方程组。第二种是迭代法,它通过计算机利用一定的极限过程逐步逼近线性方程组的精确解。迭代法虽然也存在一定的错误率,但其需要的计算机存储单元小,求解速度快。而在本文的研究分析中,认为整个模型的好坏是由解线性方程的速度决定的,因此,在速度和精度二者中,优先选择速度。1.3实验说明(1)实验环境。本文模型试验阶段的程序是在VScode和RStudio编辑器上实现的。VScode是一个运行于MacOSX、Windows和Linux之上的,针对于编写现代Web和云应用的跨平台源代码编辑器,能够极大提升python语言开发效率的编辑器。RStudio是个IDE,代码编写的集成环境,没有R的话,Rstudio没法正常运行。RStudio改善了R原生的那种比较粗糙的编写环境,在用R的时候更方便,更高效。实验的运行环境为:Intel(R)Core(TM)i5-8250U、12G内存(SSD)、Windows10、64位操作系统、python3.8、pandas、numpy、tensorflow、xlrd、sklearn、matplotlib、RX644.4.0。(2)训练样本。本文第三章预处理后的数据集,共3857组数据。(3)预测样本。本文第三章预处理后的数据集,共10组数据。(4)LSTM网络设置:一共有4层网络,包括三层双向LSTM网络和一层全连接层,其中,每层双向LSTM网络由32个神经单元组成,全连接层由64个神经单元组成。1.3HP滤波分解时间序列根据以往的研究经验,可将λ取为14400。因此本文选择HP的λ为14400,分解出的趋势序列和噪音序列如图5-1所示。图5-1HP滤波下分解的趋势序列与噪音序列由图5-1,可以得到HP滤波分解后的两个序列图。其中趋势序列较好的表现的原序列的趋势,而噪音序列在0的周围上下波动。特别需要注意的是,本章将利用HP滤波分解股票时间序列,将时间序列分为趋势序列和噪音序列,而后用ARIMA模型和深层双向长短记忆神经网络来预测趋势序列和噪音序列。由于ARIMA模型只适用于短期预测,所以这里的训练集和测试集需要重新选择。本章选取前3857条数据作为训练集,后10条数据作为测试集。1.4基于Hp滤波的ARIMA模型的股票价格预测1.4.1ARIMA模型的建模步骤(1)画出时序图、自相关和偏自相关图,利用这些图形(或者利用单位根检验判别)判断序列的平稳性。(2)通过差分运算得到平稳的时间序列,一般来说,进行一到两次差分运算,就可以得到,否则,就可以认为该时间序列不适合用ARIMA模型来进行建模。(3)对差分后的时间序列进行平稳性检验,以及白噪声序列,有时会出现差分后序列平稳下来,但是差分后的序列为白噪声,那么这时候该时间序列同样不适合ARIMA模型的建模处理。(4)画出差分后时间序列的时序图、自相关和自相关图,来对该ARIMA模型进行定阶(或者利用最小AIC准则来定阶也可以)。(5)求出模型的各项参数。(6)对模型的残差进行白噪声检验和参数进行显著性检验。(7)利用模型进行预测。1.4.2建立模型首先我们可以画出时序图如图5-2所示。图5-2时序图在RStudio上进行ADF检验,得到结果如图5-3所示。图5-3ADF检验结果由图5-3,发现P值远大于0.05,所以该序列为非平稳时间序列。因此,需要进行差分运算,去除时间序列的趋势因素。图5-4差分后时序图图5-4为一阶差分后的时序图,可以看到数据在0周围上下波动,应该为较平稳的序列。对已经进行一阶差分的序列进行ADF检验,结果如图5-5所示。图5-5差分后的ADF检验结果这里看到p值小于0.01,因此我们可以拒绝原假设,认为该序列是平稳序列。接下来,进行白噪声检验,结果如图5-6所示。图5-6白噪声检验这里白噪声检验的p值远小于0.05,因此可以认为一阶差分序列非白噪声序列,说明该序列适合ARIMA模型的建模处理。在RStudio上画出序列的自相关图和偏相关图,得到结果如图5-7和图5-8所示。图5-7自相关图图5-8偏相关图由图5-7的自相关图和图5-8的偏相关图,可以看到自相关系数是拖尾的,而偏相关系数是明显二阶截尾的。因此建立ARIMA(2,1,0)模型。图5-8ARIMA模型拟合效果由图5-8可以得到ARIMA(2,1,0)模型的拟合效果较好。因此使用ARIMA(2,1,0)模型来预测趋势序列的未来10天的数值分别为3396.456、3401.031、3401.578、3410.088、3414.551、3418.956、3423.293、3427.553、3431.727、3431.805。1.5基于HP滤波的ARIMA-DBLSTM模型的股票价格预测根据第四章的结论,可以得到深度双向长短记忆神经网络的预测效果优于单层长短记忆神经网络,因此本章将直接采用第四章中的深度双向长短记忆神经网络模型对噪音序列进行预测。这里的神经网络结构为:4层网络,包括三层双向LSTM网络和一层全连接层,其中,每层双向LSTM网络由32个神经单元组成,全连接层由64个神经单元组成。在最后一个双向LSTM层和全连接层中添加一个系数为0.1的Dropout层。经过模型训练,最后对未来10天的噪音序列进行预测,得到预测结果为-9.630127、0.96295166、7.1239624、32.30359、11.36908、-22.90332、-20.65216、1.23584、-11.693726,30.766785。将趋势序列和噪音序列的结果相加,得到ARIMA—DBLSTM模型的预测结果,如表5-1所示。表5-1各模型精度对比模型MAEMSERMSEEVSrDBLSTM模型19.585398.4619.9620.99975
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店员工试用期工作总结(资料8篇)
- 2026年保密宣传月保密知识测试真题及答案
- 2026年保密教育线上培训考试真题及答案
- 第四单元 美洲乐声- 化装舞会 教学设计 人音版初中音乐七年级下册
- 本册综合教学设计高中物理第二册沪科版(2020·上海专用)
- 初中语文写作 说明事物要抓住特征教案
- 第十二课 规划演示作品教学设计初中信息技术浙教版2013七年级下册-浙教版2013
- 江苏省盐城市亭湖新区九年级化学下册《10.1 常见的酸和碱》教学设计 (新版)新人教版
- 第7课 视频编辑也轻松教学设计-2025-2026学年小学信息技术(信息科技)第六册(2018)电子工业版(安徽)
- 部编版语文五下素养教案-习作2:写读后感(第2课时)
- 初中数学竞赛双十字相乘法因式分解练习100题及答案
- 幼儿园《春天是一本书》课件
- 2024年贵州六盘水市公安局合同制留置看护人员招聘笔试参考题库附带答案详解
- 英文科技论文写作
- 水玻璃贴衬花岗岩新技术
- 云县病死畜禽无害化处理项目环评报告
- XX县群文阅读课题中期成果报告:县域性推进小学群文阅读教学实践研究中期研究成果报告课件
- GB/T 38658-20203.6 kV~40.5 kV交流金属封闭开关设备和控制设备型式试验有效性的延伸导则
- GA/T 1047-2013道路交通信息监测记录设备设置规范
- 2023年成都天府新区投资集团有限公司招聘笔试模拟试题及答案解析
- 通用设备经济寿命参考年限表
评论
0/150
提交评论