版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于差分自回归移动平均模型(ARIMA)、LSTM以及LSTM-Bspline的保洁公司收盘价分析预测研究摘要金融市场是国家经济体系中至关重要组成部分,在某种意义上反应着一个国家的经济发展状况,对金融时间序列进行预测一直是众多投资者的关注热点。然而,由于受国际市场、政治形势以及自然灾害等多种因素影响,金融时间序列具有极大的不确定性,呈现出非平稳、非线性、高度嘈杂等特征。这给金融时间序列的预测增加了难度。相较于普通时间序列,金融时间序列往往在不同时间区间内呈现出不同的变化特征。因此,对某个时间点的预测或对序列整体变化趋势的分析往往无法反映出金融时间序列真实的变化规律。本文提出了时间序列的分段预测概念,并建立了LSTM-Bspline分段预测模型。首先将时间序列划分为等长度的局部拟合区间,然后采用结构特性优良的B样条函数对区间内的序列值进行拟合。通过分析时间序列的性质发现拟合区间内的B样条参数与上一区间内的序列值存在函数关系。针对局部拟合区间内B样条的参数。本文采用长短期记忆神经网络(LSTM)对其建立模型,根据与上一区间的序列值对当前区间的B样条参数作出估计。通过对模型进行训练获取估计值,进而计算出局部拟合区间内的序列预测值。为验证模型的可行性,本文将宝洁公司2009年2月至2020年12月的股票数据作为实证分析对象,分别使用差分自回归移动平均模型(ARIMA)、LSTM以及LSTM-Bspline对未来300个交易日的收盘价进行分析预测,并将预测结果进行对比。选取多种评价指标来评价比较模型之间的优劣。结果表明本文构建的LSTM-Bspline模型预测是有效的。关键词:金融时间序列;ARIMA模型;LSTM模型;B样条函数目录TOC\o"1-3"\h\u24212摘要 第一章绪论1.1研究背景和意义时间序列是一种将同一统计指标的数值按照其发生的时间顺序排列而形成的序列。生活中一些常见的数据如股票收盘价、商品日销量以及每日的气候等都属于时间序列的范畴。由此可见,时间序列的研究与我们的生活息息相关。时间序列分析的原理为,时间序列数据中蕴含着某些随时间变量不断变化的潜在信息。通过对数据处理分析,选取合适的时间序列模型,可以提取出时间序列中蕴含的内在规律,根据这些规律,能够预测出下一时间段数据可能达到的水平[1]。金融经济数据的预测是时间序列分析的一个重要研究方向。金融市场是国家经济体系中至关重要的一部分,一个国家金融市场的兴衰反应了国家经济发展的状况。因此,通过时间序列分析,寻找出蕴含在金融市场数据中潜在的规律有助于人们正确把握金融市场的变化情况以及发展趋势,从而帮助金融投资者制定出更加合理的投资策略,减小投资风险,增加投资带来的收益。同时可以给国家经济政策的调整提供数据基础和理论依据。因此金融时间序列的分析一直受到众多统计学们的关注。股票价格是一种典型的金融时间序列数据。我国第一张股票出现在1986年。我国股票市场从成立到现在,虽然经历了一段时间的成长,但仍处于发展的初期。其间,我国股票市场经历过从地位到高位,从高位到突破,也经历过从突破到跌破。这些变化反映出了股票的波动性特征。正因为股票市场如此令人难以捉摸,对股票走势进行分析显得尤为重要,因此本文选取股票收盘价数据作为研究对象,尝试多种时间序列模型,预测股票收盘价的变化趋势。ARIMA模型是最常用的时间序列模型之一。该模型在面对大量不间断的数据时,有着较高的预测准确度,被广泛应用于金融时间序列领域。但是ARIMA模型也存在着一些缺点,参数估计较为复杂,并且通过模型估计出的参数无法移植[2]。20世纪40年代,神经网络作为一种新的研究时间序列的工具被提出。随着学者们不断的研究,神经网络发展出多种变体。其中,循环神经网络(RNN)是一种专门处理时间序列的神经网络[3]。相较于传统神经网络,RNN在处理时间序列时具有诸多优势。首先,其具有记忆能力,可以读取历史序列的信息,更好的挖掘样本之间的时序关联[4],对未来时刻的数据水平进行预测。其次,RNN可以用来处理任意长度的序列数据[5],这使得它在金融时间序列研究领域中得到更为广泛的应用。但是RNN也存在不足之处,其自身的结构十分复杂,使得在处理大量数据时存在长期依赖的问题。当输入的序列数据过长时,距离某时刻较远的序列信息会被弱化甚至忽略。简言之就是循环神经网络无法“记忆”距当前时刻较远但对预测结果起决定作用的信息[6]。为了解决这个问题,2012年,GravesA[7]在RNN的基础上做出了改进,提出了LSTM引入了线性连接和门控机制,在一定程度上解决了RNN中的长期依赖问题。B样条曲线是一种用于处理函数逼近问题的非参数方法[8]。其结构特性优良,逼近能力强,并且构造简单,被广泛应用于各个研究领域。Davis和Nihan(1991)[9]将非参数回归方法用于时间序列分析,故本文考虑将B样条曲线拟合应用于时间序列中。本文以LSTM作为基础,将B样条函数和LSTM结合,构建了LSTM-Bspline分段预测模型。分别使用ARIMA和LSTM模型以及LSTM-Bspline模型对同一组股票数据进行分析预测。通过将预测结果可视化,选取多种评价指标,对结果进行分析对比。从不同角度比较评价这三种方法的特点和预测效果的优劣性,进而证明LSTM-Bspline模型的有效性。1.2国内外研究现状金融时间序列预测的模型大致可分为两类,一类是以概率论和统计学作为理论基础来构建的传统时间序列模型;另一类是机器学习领域的人工神经网络模型。本节从这两个方面出发,分别展开介绍传统时间序列模型研究现状和人工神经网络的研究现状。1.2.1传统时间序列模型研究现状传统时间序列模型可分为确定性模型和随机性模型。确定性模型认为时间序列是多种变化因素(如趋势变化、季节变化、周期性变化和循环波动等)共同作用的结果[10]。针对上述各种变化因素,ClevelandRB和ClevelandWS(1990)[11]提出了STL(SeasonalandTrenddecompositionusingLoess)分解法。该方法结合了传统线性回归的简洁性和非线性回归的灵活性[12],但是其缺点在于对异常点具有健壮性,仅能处理加法模式的分解。针对时间序列中的周期变动和随机变动问题,HamiltonJD(1994)[13]提出了移动平均法(MA)。该方法可以缓和时间序列中存在的周期变动和随机波动等干扰因素,使序列的变化趋势更为显著[14]。但是,移动平均法也存在局限性。该方法有时会出现预测值停留在过去的水平的情况,无法预测未来出现的不同水平的波动。而且,MA依赖于大量的历史数据,在应用会产生由于样本不足而导致预测结果欠佳的问题。在移动平均法的基础上,DCMontgomery,JSGardiner和LAJohnson(1990)[15]提出了指数平滑法。该方法含参量低,易于实现,并且可以适应性数据的变化模式并进行调整。但该方法仍有不足,它对数据的转折点的识别能力较差,并且对于长期数据的预测结果不佳,多用于短期数据。在随机性模型中,统计学家们利用随机理论研究时间序列,探究由随机因素引起的变化中潜在的规律。20世纪70年代,BoxG和JenkinsGM(1976)[16]提出了自回归滑动平均模型(ARMA)。ARMA是自回归模型(AR)与MA的结合体,适用于很大一类实际问题。其缺点是其参数估算比较繁琐。随后,在ARMA模型的基础上,BoxG和JenkinsGM又提出了更为完善的ARIMA模型。ARIMA模型是对ARMA模型的改进,是ARMA模型与差分法相结合的产物。EngleRF(1982)[17]提出了自回归条件异方差模型(ARCH),该方法可以描述出时间序列中随时间变化的条件方差,[18]。在ARCH模型的基础之上BollerslevT(1986)[19]提出了广义ARCH模型,也称为GARCH模型。GARCH模型是为了研究金融时间序列数据提出的模型,尤其对波动性的分析预测表现出色。1.2.2人工神经网络模型研究现状人工神经网络模型具有优秀的学习能力和抗干扰能力,拟合能力强,十分适用于预测金融时间序列[20]。McCullochWS和PittsW(1943)[21]根据生物学中神经元的结构原理,构建了第一个神经元模型(MP)。RosenblattF(1958)[22]提出了具有最简单结构的人工神经网络模型——感知器模型,其结构简单能够解决相当复杂的问题。但是,它不能处理线性不可分问题。WerbosPJ(1974)[23]提出了著名的反向传播(BP)算法,BP算法的计算分为两个过程,分别为信号的正向传播和误差的反向传播[24],适用于多层神经元网络。BP算法具有强大的信息处理能力,在处理函数复现问题时表现十分出色[25]。由于BP算法以梯度下降法基础,因此在训练具有多个隐藏层的深度网络时,BP算法易陷入局部最小值。HopfieldJJ(1982)[26]首次提出了RNN,RNN是一种递归神经网络,该模型将序列数据作为输入,在序列的演进方向进行递归并将所有循环单元按照链式连接[27]。RNN擅长对序列的非线性特征进行学习,被广泛应用于自然语言处理(NLP)和各类时间序列的预测等领域。但是RNN也有缺点,当输入序列的长度过大,RNN会产生长期依赖的问题[28]。针对这个问题,HochreiterS和SchmidhuberJ(1997)[29]在RNN的基础上进行改进并提出了LSTM。LSTM是一种特殊的RNN,它通过设置门控结构,将短期记忆与长期记忆结合,通过控制记忆单元缓解了RNN的长期依赖的问题,在一定程度上防止了梯度的消失与爆炸。Chung(2015)[30]对LSTM模型进行了简化,提出了门控循环单元(GRU)。相较于LSTM,GRU具有参数少,收敛快的优点。但缺点也很明显——面对较大的数据集时,其预测表现远逊色于LSTM。1.3研究内容与框架1.3.1研究内容本文的选题是时间序列预测方向,研究对象为金融时间序列。主要研究内容分为以下三个方面:对金融时间序列研究背景和意义进行描述,叙述金融时间序列预测的必要性,分析研究难点。对现有常用的时间序列模型——ARIMA、LSTM展开描述,介绍不同模型的理论依据、建模步骤、模型的优缺点以及在金融时间序列中的应用情况。分析金融时间序列在不同时间段内变化规律不同的特点,提出时间序列的分段拟合概念。将时间序列划分成不同区间,采用B样条方法对区间内时间序列数据进行拟合。然后采用LSTM,提取上一区间内的时序信息,来获取当前区间内B样条基函数系数的估计值,进而求出区间内序列的预测值。选取宝洁公司2009年2月至2020年12月的股票数据作为研究对象,将收盘价作为预测指标,分别使用ARIMA、LSTM、LSTM-Bspline模型进行实证分析。使用多种评价指标,在多种不同的角度对模型预测性能进行比较,分析不同模型之间的优劣以及特点,证明LSTM-Bspline模型的可行性。1.3.2研究框架本文总体结构框架由五个章节构成。第一章为绪论。1.1节介绍了本文的研究背景与研究意义,阐明了金融时间序列的研究的必要性。1.2节对国内外研究现状进行介绍,叙述国内外研究者针对时间序列问题提出的模型以及目前模型存在的局限性。1.3节对论文的研究内容进行总体叙述,并给出论文的整体框架。第二章为金融时间序列预测的基本理论。2.1节介绍了金融时间序列特性,分析其与普通时间序列的不同。2.2节介绍了常用的金融时间序列预处理方法,并叙述不同数据预处理方法对预测模型的影响。2.3节对常用的传统时间序列模型ARIMA进行展开介绍,叙述ARIMA模型的原理以及建模过程。2.4节对常用的神经网络模型LSTM展开介绍,叙述模型的内部结构以及计算过程,并且介绍模型构建的基本流程。第三章为基于LSTM-Bspline的时间序列分段预测模型。3.1节提出时间序列的分段预测问题,分析分段预测的必要性。3.2节初步建立时间序列的分段拟合模型。3.3节介绍B样条函数的定义、构造方法以及优点。3.4节建立基于B样条函数的时间序列分段拟合模型,并通过LSTM提取序列时序信息来获取B样条模型参数。第四章实证分析。本章选取宝洁公司的股票数据作为研究对象,将股票收盘价作为预测指标,4.1节对数据进行整体描述,并将数据可视化。4.2节至4.4节分别使用ARIMA模型、LSTM模型和LSTM-Bspline模型对收盘价进行预测,并分析结果。4.5节将不同模型的预测结果进行比较,证明LSTM-Bspline的有效性。第五章全文总结与展望。本章对全文的总体研究和工作进行全面的概括总结,补充说明目前论文研究中存在的有待改进的地方,提出未来在进一步的研究中需要努力和改进的方向。第二章金融时间序列预测的基本理论本章从四个部分展开介绍金融时间序列预测的基本理论:第一部分介绍金融时间序列的特征;第二部分介绍金融时间序列分析中常用的数据预处理方法;第三部分介绍ARIMA模型的基本理论以及模型构建过程;第四部分介绍LSTM的结构原理以及建模必要过程。2.1金融时间序列的特征时间序列是指按照一定的时间间隔(如每时,每日,每周,每月,每年等)收集的一系列数据。根据时间的变化,将随机变量的变化或随机事件的产生用数据的形式记录下来,形成的具有时间先后顺序的一系列数据就是时间序列。而使用相关的方法和理论对时间序列进行数据采集、处理、分析、以及预测序列未来变化趋势的技术被称为时间序列分析。根据收集数据的背景的不同,时间序列可以被分为很多种,金融时间序列就是其中之一。金融时间序列数据与普通时间序列的不同之处在于,它反映了金融市场在时间维度上的变化情况。在独特的金融理论背景下,金融时间序列具有高复杂度、高噪声、高混乱度、动态性、非线性相关性以及非参数性等特点[28]。并且金融时间序列数据存在着多种不同的性质(如趋势性、季节性等),多为非平稳序列。因此,在对金融数据进行分析之前,需要预先消除数据中存在的的趋势性和季节性等因素,使之转变为平稳序列。另外,金融数据还具有强烈的波动性,在外界因素的作用下序列会随着时间的前向推移不断上下浮动。随机波动会导致金融时间序列数据的趋势在稳步上升后突然下降或在逐渐下降后突然上升,想要对其准确预测十分困难。2.2金融时间序列的数据预处理在采集到研究样本后,时间序列分析的首要工作是对数据进行预处理。首先分析数据的特征,然后根据数据特征以及研究需要对样本采取恰当的预处理机制。否则会受到数据中多种因素的干扰而难以挖掘到有效信息,预测结果欠佳。常见的用于预处理方法有:数据的差分处理、数据的归一化和滑动窗口技术等。2.2.1数据的差分处理金融时间序列大多具有非平稳性的特点,而传统的时间序列模型只能针对平稳时间序列建立模型。因此,需要对具有非平稳性的样本采取合适的算法进行转化,将其处理为平稳性数据。目前应用最广的数据平稳化方法是差分法。设一组序列为则对该序列进行差分处理后得到的序列为:2-(1)经过一次差分变换的得到的时间序列称为一阶差分序列,重复2-(1)的变换过程可以得到更高阶数的差分序列。2.2.2数据的归一化在机器学习和深度学习研究领域里,对于使用梯度下降算法优化的模型,特征的尺度将对其优化效率产生很大的影响。如果不对样本数据实行归一化处理,当数据相差较大不在同一尺度时,会出现梯度迭代方向偏离最小值的情况。这将使得模型优化效率降低,训练时间变长。如图2.1所示。图2.SEQ图\*ARABIC\s11尺度相差过大的梯度更新轨迹而对数据进行归一化处理,可以使得梯度更新的方向更接近最小值方向,大大提高训练速度,如图2.2所示。图2.SEQ图\*ARABIC\s12归一化处理后的梯度更新轨迹归一化的第一步是提取数据集的最大值与最小值,然后对数据集所含全部序列值用如下公式进行变换。2-(2)2.2.3滑动窗口技术金融时间序列与普通时间序列相比,具有快速、大规模和持续的特点,最新的数据往往对预测起着至关重要的作用。因此,序列中的最新信息是往往是金融市场参与者们的关注焦点,它们是预测金融数据的关键。在面对庞大的数据时,采用滑动窗口技术可以始终保持以最新时段的数据作为模型的实时输入。因此,滑动窗口技术在金融时间序列预测领域得到广泛应用。滑动窗口技术对数据的处理原理如图2.3所示。图2.SEQ图\*ARABIC\s13滑动窗口技术其中表示模型的输入,表示时间序列值,进入(或离开)窗口的时间点表示为。为窗口的宽度,其中前个点为训练模型的历史数据,第点为时间序列的预测值。2.3ARIMA模型的基本理论2.3.1.ARIMA模型的原理ARIMA模型是目前最为常用的传统时间序列模型,其原理与ARMA相似。而ARMA的原理如下所示:且:其中,代表模型的自回归阶数,代表模型的移动平均阶数,经过上述过程建立的ARMA模型可表示为。ARIMA模型在ARMA的基础上添加一步差分过程,解决了ARMA不能处理非平稳数据的问题。首先对非平稳数据进行次差分处理,将其转化为平稳时间序列,随后对转化后的数据应用模型建模,形成最终的。2.3.2ARIMA模型的构建ARIMA模型的构建过程大致分为平稳性检验、非白噪声检验、模型定阶和模型检验,下面将对这几个流程分别展开描述。1.平稳性检验ARIMA模型是平稳时间序列的过去误差和过去序列值的线性组合,检验研究样本是否平稳是建模的前提。确定样本的平稳性后才能对模型参数进行选择。平稳性分为严平稳和宽平稳[31],ARIMA模型中的平稳性条件是宽平稳。当时间序列的主要性质近似稳定(二阶矩平稳),即时间序列满足:a.,;b.,为常数;c.,且,。其中表示常数,则称具有宽平稳性。常用的检验方法为图检法与ADF检验法结合。首先绘制样本折线图,观察图像走势,如果图像未呈现明显趋势,可以初步判定为平稳时间序列。随后对序列进行ADF检验,如果值大于提前设置的显著性水平,则样本非平稳。针对非平稳样本,采用差分法对其变换,直至将其转化成平稳序列。2.非白噪声检验得到平稳序列后,需要检验其是否为白噪声,白噪声中含有的可提取信息极低,因此,如果数据为白噪声,则失去了研究意义,需更换数据。常用的白噪声检验方法为Ljung-Box()检验,该方法的原假设和备择假设为:检验统计量为:其中,表示检验样本的长度,表示样本阶自相关系数,为滞后阶数。如果值小于提前设置的显著性水平,拒绝原假设,则说明样本序列之间存在自相关性,不为白噪声序列。3.模型定阶完成平稳性检验并证明序列不为白噪声后,需要对模型定阶,即选取合适的值和值。常用的方法是通过观察自相关函数()图和偏自相关函数()图的拖尾性或截尾性特征来定阶。定阶规则如表2.1:表2.1ARIMA模型定阶规则当图和图的截尾或拖尾特征不好判断时,采用信息准则法定阶。常用的准则和准则。准则计算公式为:2-(3)准则计算公式为:2-(4)其中表示模型参数的数量,表示模型的极大似然函数。选择或值最小的一组。4.残差检验选择好模型阶数后,即可对模型进行训练,训练完成后可以得到残差序列。残差序列是样本与模型估计值之差,如果残差序列不为白噪声,说明残差中还残留着部分信息,模型对样本信息的提取不够充分。在进行残差检验时可以采取多种方法共同观测,如检验,自相关性检验,QQ图检验,多种方法共同分析,可以使结果更全面准确。2.2LSTM的基本理论LSTM是一类用于捕获时间序列中蕴含的长期和短期依赖关系的特殊RNN模型。其在RNN的基础上加入了门控结构,在一定程度上解决了RNN存在的长期依赖问题。近年来,在深度学习领域得到广泛应用。2.2.1LSTM内部结构LSTM是一个高度复合的非线性参数函数,它将一列向量通过隐含层映射到另一组向量。其内部结构如图2.4所示。图2.SEQ图\*ARABIC\s14LSTM内部结构2.2.2LSTM的前向传播过程LSTM通过门控结构来决定信息传递至神经元的程度。LSTM拥有三种门控结构,分别为遗忘门、输入门、输出门[33]。下面对这三种门控结构展开描述。(1)遗忘门:遗忘门的作用是确定从神经元中舍弃什么样的信息,是LSTM前向传播过程的第一步。设前一时间点的输出值为,当前时间点的输入值为,门的偏置项设为,则遗忘门的输出值表示为:其中表示遗忘门的权值向量,表示值域为[0,1]的的函数,其作用是决定信息传输的比重。(2)输入门:输入门的作用是确定何种信息被放在神经元中,由两个部分组成,第一部分为输入门层,其输出值的表达式为:用来决定候选神经元的输入程度。第二部分通过层创建一个当前时刻的候选细胞状态,表达式为其中为输入门的权值矩阵和为偏置值,为神经元经过更新后的权值矩阵,为神经元经过更新后的偏置值。简单来说,输入门通过函数创建新的输入值,通过函数决定输入比重。(3)神经元的记忆更新在进行上述过程后,获得了时刻的控制信号、和候选细胞状态,可对时刻的细胞状态进行更新,得到时刻的细胞状态:(4)输出门输出门的作用是生成时刻LSTM结构的输出值,分两步。第一步运行一个层来产生一个值域为[0,1]的控制信号。第二步运用函数对细胞状态进行转换,并通过计算它和层的输出值的乘积,得到LSTM的输出值。其中,和为输出门的权值向量和偏置值。2.2.3LSTM的损失函数损失函数的提出是为了衡量预测值与实际样本值的不一致程度。选择合适的损失函数可以计算出LSTM每次迭代的输出值与真实值的误差,指导LSTM下一次迭代向着正确的方向进行。LSTM中常用的损失函数有以下几种:均方误差(MSE)损失函数MSE表示样本真实值与估计值之间欧式距离。设时刻的样本值为,估计值为,MSE的函数表达式为:2-(3)交叉熵损失函数交叉熵是信息熵概念的延申,广泛应用于分类问题。其作用是度量两个概率分布间的差异性信息,衡量模型训练得到的概率分布与真实分布的差异情况。设时刻数据的真实概率为,模型训练得到的概率为,交叉熵损失函数的函数表达式为:2.2.4LSTM的优化器神经网络训练过程的本质是损失函数的最小化问题,求解这个问题的方法被称为优化器。常用的优化器有以下几类:1.随机梯度下降法(SGD)其思路是沿着梯度方向前进一定距离,该算法的更新规则如下:其中表示要更新的参数,表示参数的目标函数。SGD算法简单易实现,但是也有一些不足,如选择恰当的初始学习率困难,且不同参数以同一学习率迭代等。2.自适应梯度法(AdaGrad)AdaGrad的核心思想是在更新步长时,额外增加分母——梯度平方累积和的平方根。更新规则如下:其中为待更新的参数,为第时间步的梯度,表示第时间步的梯度平方,为学习率。该算法能够针对不同的参数选择不同的更新速度。对于更新频繁的梯度,随着累积的分母项的逐渐增大,其更新步长减小。而稀疏的梯度其分母项的累计速度较慢,因此更新步长相对较大[34]。在数据分布稀疏的情境下,AdaGrad算法能实现更高效的收敛。但是随着时间步的增加,AdaGrad的分母项的梯度平方不断累积,分母项不断增大,会使得学习率过小,参数更新速度过慢。3.RMSProp算法RMSProp算法在更新学习率时,结合了梯度平方的指数移动平均数[35]。这种做法克服了AdaGrad的梯度急剧减小的问题[35]。该算法的原理如下:a.计算时间步的梯度:b.计算梯度平方的指数移动平均数:其中表示指数衰减率。c.更新参数:其中,作用是避免除数为0。为学习率。4.Adam算法Kingma和Ba(2014)[36]提出了Adam优化器。该算法的进步之处在于,计算更新步长时综合考虑了梯度的一阶矩和二阶矩。具体计算步骤如下:a.计算时间步的梯度:b.分别计算梯度的指数及指数平方的移动平均值:上式中的初始值和的初始值统一设置为0。参数和分别表示和衰减率。c.对和进行修正。由于中和的初始值均为0,在训练过程的初期会使得和更新方向偏向0。因此要对和进行如下修正:d.更新参数。得到修正后的和后可对进行更新:与AdaGrad算法和RMSProp算法相比,Adam具有诸多优势。算法简单易实现,能自动调整学习率,适用于梯度稀疏或梯度存在大量噪声的情况。2.2.5LSTM的超参数选择超参数是构建模型过程中涉及的无法通过训练得到的参数。在构建LSTM的过程中,隐藏层神经元的数量、优化器的初始学习率、滑动窗口的长度等均为超参数,无法通过训练获得。超参数的选择会影响模型的预测结果,因此需要采取正确的算法进行选择。常用选择算法有网格搜索和随机搜索。网格搜索适合处理模型超参数较少(一般不大于三个)的问题情境。其原理是对每个超参数预先给出搜索范围,在所有超参数搜索空间的笛卡尔积中遍历,找到使验证集误差最小的超参数组合,如图2.5所示。图2.SEQ图\*ARABIC\s15网格搜索随机搜索是一种遍历式的搜索方法,更易找到使误差最低的超参数组合,但当超参数数量过多时,搜索效率过低。此时可以采用速度更快的随机搜索法。随机搜索规则为:预先给每个超参数定义一个边缘分布,使用随机采样法得到不同的参数组合,并选取使验证集误差最小的超参数组合,如图2.6所示。图2.SEQ图\*ARABIC\s16随机搜索随机搜索法牺牲了部分准确性,但大幅缩短搜索时间,适用于模型超参数较多的情况。2.3模型效果的评估仅依靠图像,无法得出模型确切的预测性能,因此需要选取合适的指标,对模型预测效果进行评估,常用的指标如下:绝对误差(AE):绝对百分比误差(APE):均方误差(MSE):决定系数(R2):
第三章基于LSTM-Bspline的时间序列分段预测模型3.1.金融时间序列的分段预测问题许多金融时间序列(如股票),由于受到某段时期的政策或气候影响,其变化规律呈现出阶段性。即在不同时间段内,序列往往呈现出截然不同的变化规律。对于金融投资者来说,其关注的重点多为时间序列在某段时期内的变化规律,而非序列的整体水平或在某个点的水平。比如相较于股票收盘价的整体均值或在某个时间点的值,股票投资者会更为关注股票的十日均线(股票收盘价每十天的均值)及其变化情况。目前常用的预测模型多为逐点预测,根据每个时间点前一段序列来预测当前时间点的值,即:然而,金融时间序列的变化呈现阶段性,如果中的序列点横跨不同的时间阶段,其所蕴含的规律会截然不同,因此在对其分析时难以提取出正确的规律。针对逐点预测中的问题,本文建立LSTM-Bspline模型对时间序列进行分段预测。首先将金融时间序列分割成时间跨度相同的局部拟合区间,对区间内的数据建立B样条模型进行拟合。而B样条模型的参数则通过LSTM进行获取。3.2.时间序列的分段拟合模型3.2.1时间序列时间段的划分金融时间序列往往在不同时间区间内有着不同的变化规律,为研究不同时间区间内的序列值变化情况,需要首先根据研究需要对序列进行划分。设一组金融时间序列数据为,假设将每个时间点设置为一个局部拟合区间,则序列被分成个周期,,如3-1图:图3-SEQ图\*ARABIC\s11时间序列分段示意图3.2.2时间序列的分段拟合将第个局部拟合区间内的第个时间点的序列值表示为。在第个局部拟合区间中,序列值会随其序列索引值的变化而变化,且对于每一个索引值,都存在唯一的序列值与其对应,符合函数关系的定义。因此可以判断序列值与其序列索引值之间存在函数关系。函数表达式如公式3-(1)所示。3-(1)由于金融时间序列与时间变量之间呈现一种高度复杂的非线性关系,且时间序列的序列值与序列索引值之间的函数关系缺少相应的先验知识。因此,常用的参数模型难以对上式中的关系进行建模。B样条曲线拟合是一种非参数回归方法,适用于对不确定、非线性的函数关系进行建模。在对数据进行分析时,不需要大量的先验知识,只需要足够多的历史数据作为支持,这与金融时间序列数据的特点相契合。因此,本章采用B样条曲线来对局部拟合区间内的序列值与其在区间内的索引值之间的函数关系建立回归模型。3.3B样条拟合的介绍B样条是一种用于处理函数逼近问题的工具。其结构特性优良,逼近能力强,并且构造简单,被广泛应用于各个研究领域。B样条曲线是在贝塞尔曲线的基础上提出的,Bezier(1962)提出了贝塞尔曲线,用于汽车主体的设计。贝塞尔曲线拥有平移不变形和几何结构不变性的优点,然而在实际应用中,研究者们发现贝塞尔曲线存在一些局限性。其中最为显著的问题在于,贝塞尔曲线在应用中无法进行局部修改,某个控制点位置的改动会引起曲线整体的变化。Gordon、Riesenfeld(1972)等人提出了B样条曲线[36]。其解决了贝塞尔曲线无法进行局部修改的问题。B样条曲线在改变某个控制点的位置时仅改变曲线控制点附近的部分,这使得B样条曲线的调节更为灵活。3.3.1B样条基函数的定义B样条函数存在几种不同的定义方法,不同定义方法虽然思路不同但是本质相同。本章使用由Cox和deBoor[37]通过递推方法定义的B样条函数,下面对其展开介绍。首先明确B样条基函数的定义。设B样条函数的定义区间为,则区间上的一组节点可以表示为:3-(2)在3-(2)中,表示B样条基函数第个节点,。代表区间上内节点的数量,表示B样条基函数的次数,其中和的取值范围为正整数。由全部节点组成的向量被称为节点向量(knotvector),半开区间被称为第个节点区间(knotspan)。在区间上定义的内节点数为次数为的全部B样条基函数组成的集合可以表示为:根据Cox-deBoor递推公式,得到第个次B样条基函数的递推表达式:第个次B样条基函数的形成过程如图3.2所示。图3-SEQ图\*ARABIC\s12B样条基函数的形成过程3.3.2B样条基函数的特点1.非负性。通过观察公式可以发现,对所有的,和,取值保持非负的。2.局部支撑性。在区间上非零,并且对于任意相邻的节点,除了基函数外,其余基函数在区间都为零。3.单位分解性。上的非零的次B样条基函数之和恒等于1。3.3.3B样条函数回归模型设是B样条基函数在上张成的线性空间。假设可以被中的元素近似,即: 其中,表示B样条基函数的系数,是需要估计的参数。最常用的参数的估计方法为最小二乘估计,即求解使下式子达到最小的一组参数。其中表示系数向量,表示矩阵,表示响应变量。3.3.4B样条节点的选取B样条的节点决定了B样条基函数的值,节点的选取会直接影响模型的拟合效果,因此确定合理的节点尤为重要。根据节点的间距特点,可以分为均匀节点和非均匀节点,当每个节点的间距相等,则称为均匀节点,反之为非均匀节点。对于非均匀节点,其选取方法较为复杂,本文不再赘述。均匀节点的选取较为简单,易于实现,因此本文采用均匀节点的B样条函数。对于均匀节点的B样条,其节点的位置完全由内节点的数量所决定,因此,只需要对进行参数选择,即可完成节点的选择。参数的选取方法可以采用公式2-(3)介绍的AIC准则,和公式2-(4)介绍的BIC准则进行选择。3.4基于B样条的时间序列分段拟合上一节介绍了B样条的原理及优点,本节使用B样条方法来对公式3-(1)的关系建立模型。3.4.1区间内序列值的B样条拟合:对第个局部拟合区间内的时间序列建立B样条拟合模型,变量设置为第个周期中的序列索引值,。B样条基函数的次数设为,区间设为,内节点数为则得到如下方程:3-(3)其中,为第个局部拟合区间的B样条系数,仅随着周期的索引值变化。预测的关键是求参数。3.4.2基于LSTM的B样条参数求解由于为时间序列,因此第个局部拟合区间内的序列值与第个区间内序列值之间存在函数关系。在公式3-(3)中,第个局部拟合区间内的序列值又由参数决定,因此可认为参数与第个局部拟合区间内的序列值存在函数关系,即3-(4)LSTM在处理多种时间序列问题有多种优势,在上一章已经介绍,因此本节采用LSTM对3-(4)函数关系建模。首先依据第个局部拟合区间内的时间序列值构造变量序列。参照WeizhongZhang,LinMa等人(2010)[38]的构造方法,提取与周期内个样本的第一阶,二阶,三阶,四阶中心矩有关的信息。构造如下长度为的变量序列:我们将作为第个局部拟合区间LSTM模型的输入,将作为LSTM模型的输出,可建立如下关系:其中表示LSTM参数,代表最后的隐藏状态,代表输出层参数。上述一系列参数可以通过最小二乘法获得,即:经过对模型的训练,可以得到第个局部拟合区间的B样条基函数系数的预测值,将其代入公式3-(3),即可计算出第个局部拟合区间内序列的预测值3.4.3模型的超参数选取本章将B样条与LSTM结合构建模型,在建模过程中涉及的超参数有三个。1.局部拟合区间包含的序列点个数。2.B样条均匀节点数量。3.LSTM神经网络隐藏层的包含的神经元数量。模型超参数不大于三,因此依然采取第二章介绍的网格搜索完成参数选择。其中对于超参数,在实际应用中也可以根据研究需要人为设定。基于上述模型建立的步骤以及模型涉及的超参数,本文将新提出的模型表达式表示为。
4实证分析为验证本文提出的LSTM-Bspline模型的可行性,本文选取股票数据作为研究对象。股票数据是一种典型的金融时间序列,由于其受到气候、政策等因素的影响,呈现出阶段性变化的特点。本章将本文提出的方法与传统的ARIMA以及LSTM模型比较,证明LSTM-Bspline模型在预测此类阶段性变化数据时的优越性。4.1实证数据4.1.1数据选取本文选取的数据是宝洁公司2009年2月至2020年12月的股价数据作为研究对象,数据来源于英为财情网站,部分数据如表4.1所示。表4.SEQ表\*ARABIC1宝洁公司股票数据日期收盘开盘高低交易量涨跌幅2009/2/353.9153.4954.0952.5414.90M1.62%2009/2/452.5254.3354.4552.2114.76M-2.58%2009/2/553.3252.2953.652.1317.73M1.52%2009/2/65453.4254.4653.0615.34M1.28%2009/2/952.9453.8953.9852.6713.42M-1.96%2009/2/1051.4552.7453.4650.9722.52M-2.81%2009/2/1151.1651.851.9150.8616.40M-0.56%2009/2/1251.2850.9351.449.9518.02M0.23%宝洁(PG)公司建立于1837年,是日用消费品行业的巨头。因此其股票的走势也在一定程度上反映了人们当前的消费水平以及世界经济状况,因此,对其股票进行分析研究对我们了解当前以及未来的经济形势有着重要意义。所选取的数据中包括股票当日最高价、最低价、收盘价、开盘价。其中,收盘价是多数市场参与者认可的研究指标,具有重要的研究意义。因此,本文选择收盘价作为研究指标。4.1.2数据的描述所选时间段内宝洁公司股票收盘价走势如图4.1所示。图4.SEQ图\*ARABIC\s11宝洁公司股票收盘价从图中看,该时间段内宝洁公司股票日收盘价数据总体呈现上涨趋势,并伴随着频繁的波动。其间也经历过三次较大幅度的下降,分别是在2015年三四季度、2018年二三季度和2020年一二季度。数据的分布图如图4.2所示。图4.SEQ图\*ARABIC\s12宝洁公司股票收盘价分布图通过观察发现,数据分布图并非为单峰对称的正态分布,而是总体呈现为非对称分布偏态分布。其箱型图如图4.3所示。图4.SEQ图\*ARABIC\s13宝洁公司股票收盘价箱型图在箱型图中可以大致看出数据的中位数、最大值、最小值等信息。通过对数据进行分析,得到数据统计特征如表4.2所示。表4.SEQ表\*ARABIC2数据统计特征MeanStdMaxMin25%50%75%81.9520.61144.4944.1864.9080.0989.01观察表格发现,所选样本数据的标准差和极差都较大,数据具有较强的波动性。4.2ARIMA模型的实证分析4.2.1数据预处理首先需要对数据集进行划分,由于需要评价模型的预测性能,因此需要将原始样本划分为训练集和测试集。首先在训练集上训练获取模型参数,然后对测试集上的数据进行预测,通过比较预测结果与测试集的误差来评价模型的预测效果。本节将样本划分为训练集和测试集。划分比例为9:1。将宝洁公司2009年2月3日至2019年10月23日之间所有交易日的股票收盘价作为训练集,共计2700个交易日的数据;将宝洁公司2019年10月24日至2020年12月31日之间交易日的股票收盘价作为测试集,共计300个交易日的数据。训练集和测试集数据分别如图4.4和图4.5所示。图4.SEQ图\*ARABIC\s14ARIMA模型训练集数据图4.SEQ图\*ARABIC\s15ARIMA模型测试集数据4.2.2平稳性检验首先观察图4.1,发现数据呈现出明显的整体上升趋势,故初步判断其为非平稳序列。将显著性水平设置为0.05,对序列进行ADF检验,发现值为0.98,远大于0.05。因此可以确定该样本具有非平稳性。因此需要对样本进行差分变换。由于随着差分次数的增加,会导致信息损失,因此,本文从一阶差分开始处理,即对原始研究样本进行公式2-(1)的处理。差分变换后的序列如图4.6所示。图4.SEQ图\*ARABIC\s16差分处理后的序列观察图像可以发现,样本经过差分变换后,不再同原始序列一样呈现出较为明显的上升趋势,并且无明显周期性变化,数据的值围绕0轴上下波动,基本消除了趋势,数据有稳定的均值,因此,初步判定一阶差分后的样本序列为平稳时间序列。为保证判断的严谨性,继续对差分后的数据进行ADF检验,值为,远小于0.05,印证了经过一阶差分后的样本具有平稳性。4.2.3非白噪声检验采用检验法验证经过一阶差分变换后的样本是否为非白噪声,将显著性水平设置为0.05。通过计算得到值为远小于显著性水平。因此可以判断,一阶差分后的样本不为白噪声,有可供提取的信息。4.2.4模型定阶绘制一阶差分后序列的图(图4.7)和图(图4.8)。图4.SEQ图\*ARABIC\s17差分序列的ACF图图4.SEQ图\*ARABIC\s18差分序列的PACF图观察序列的图和图,发现图像的的截尾现象或截尾现象并不明显,不好据此作出判断,无法依据此方法进行定阶。因此使用信息准则作为模型定阶的标准。根据经验,将ARIMA模型阶数和的取值范围设为之间的整数。确定参数取值范围之后,对不同参数组合进行尝试,计算每组参数的AIC得分,选择AIC得分较小的模型为最优模型。比较发现取时AIC取值最小,故最终得到模型。4.2.5残差检验完成模型定阶并进行训练后,得到残差序列。通过多种方法检验残差序列中是否存在残留信息。如果残差内仍有较多信息残留,需要重新选择模型。(1)白噪声检验绘制残差项的图(图4.9)和图(图4.10),观察判断其是否为白噪声,图像如下所示图4.SEQ图\*ARABIC\s19残差序列ACF图图4.SEQ图\*ARABIC\s110残差序列PACF图观察残差的和图发现,图中的竖线全部位于蓝色区域内,因此可以初步判断残差序列为白噪声。对其进行检验进行验证,发现值为0.97,远大于0.05,因此判断序列残差为白噪声。(2)自相关性检验对残差序列进行自相关性检验,如果序列不存在自相关性,则说明其残差中的信息被充分。本节采用德宾-沃森(DW)检验,当DW值显著的接近于0或4时,说明被检测的序列存在自相关性,当DW值接近于2时,则不存在自相关性[39]。经过检验得到DW值为2.02,十分接近2,因此判断残差序列不存在相关性,信息提取较为充分。(3)正态性检验理想的残差序列服从正态分布,本文采用最直观的QQ图对残差进行检验如图4.11所示。图4.SEQ图\*ARABIC\s111残差序列QQ图观察图像可以发现图像点基本沿着分界线,故可以判断,残差序列基本服从正态分布。4.2.5模型预测利用最后得到的模型进行滚动预测,即首先用训练集所有数据预测测试集第一项数据;然后将训练集的第一项剔除,并添加测试集第一项数据,利用这新的一组数据对测试集第二项数据进行预测。依次类推,不断用测试集中的数据更新训练集,并始终保持用来预测的数据量与原训练集数据量相同。预测结果如图4.12所示。图4.SEQ图\*ARABIC\s112ARIMA模型预测结果4.2.6模型效果的评估本部分采用3.3节介绍的四种评价指标得到的模型预测效果如图4.3所示。表4.SEQ表\*ARABIC3ARIMA模型预测效果评估meanstdminmaxAE6.034.270.0524.93APE4.79%3.43%0.04%21.09%MSE54.56R20.46观察表4.3发现,ARIMA模型对收盘价预测的AE最小值为0.05,最大值为24.93。说明ARIMA对有的点预测准确,有的预测结果不理想,预测效果具有较大的起伏。平均AE为6.03,平均APE为4.79%,MSE为54.56说明模型预测的整体误差不大,在可接受的范围内;R2为0.46,低于0.5,不太理想,说明ARIMA模型对预测变量的解释程度一般。综合图像和表格可以发现,ARIMA模型可以大致预测出股票收盘价的发展趋势,在个别点上预测准确,但是预测效果起伏较大,预测效果不稳定。4.3LSTM模型的实证分析在上一部分ARIMA建模的过程中,通过平稳性检验得到了收盘价数据不平稳的结论,虽然进行差分处理后,ARIMA模型预测结果大致反映出数据的变化趋势。但经过差分后的序列会损失部分信息。在本节中,采用对时间序列平稳性无要求的LSTM进行建模。4.3.1数据处理1.数据集划分LSTM中存在超参数,需要额外划分出一个验证集,其作用是对超参数进行调优。将上一节划分出的训练集按照8:1分成新的训练集和验证集。全部数据被按照8:1:1分成了训练集(图4.13)、验证集(图4.14)和测试集(图4.15)三部分。图4.SEQ图\*ARABIC\s113LSTM模型训练集数据图4.SEQ图\*ARABIC\s114LSTM模型验证集数据图4.SEQ图\*ARABIC\s115LSTM模型测试集数据2.数据的归一化为提升模型的训练效率,对数据进行归一化处理。采用公式2-(2),将原始股票收盘价数据的值域缩小到。3.数据维度转化在进行完数据集划分的工作后,使用滑动窗口技术对数据进行处理,将数据转化成适合作为LSTM模型输入的形式。设时间序列长度为,时间窗口长度为。原始序列从一维转化为二维,维度由从转化为。4.3.2模型的构建1.损失函数的选取本节研究的是回归问题,因此,选择均方误差作为损失函数,即公式2-(3)。2.优化器的选取在上一章中介绍了四种优化器,相比于其他优化器,Adam优化器具有多种优势,也是目前被认为综合效果最佳的优化器,因此,本节选取Adam作为优化器。3.超参数的选择本部分建立LSTM模型中需要选择的超参数主要有以下三个:(1)LSTM隐藏层神经元的个数,设为。(2)滑动窗口长度,设为。(3)每次进行优化算法所输入的样本数量,设为。除以上三个,模型中其余超参数(如Adam算法的学习率参数),采用程序内默认设置。对于上述三个超参数,本节简化了参数选择过程,依据以往经验,预先对超参数作出合理假设。假设为训练集样本数的十分之一,即进行十次迭代即可完成一次完整的训练。经测试,在这个假设下,训练过程中所得的梯度较为稳定。在上述假设下,模型中需要选择的参数为和,超参数数量较少,因此采用准确度更高的网格搜索法进行选择。针对本文所建立的模型,在经过大量实验以及阅读相关文献[40]后,分别将和的搜索范围设置为{6,12,24}和{5,10,15}。在遍历了这9个模型之后,结果显示,神经元个数为24,窗口长度为20的模型其验证误差最低。4.3.3模型预测模型训练完成后,进行预测,由于数据经过归一化处理,因此需要将模型输出结果进行反归一化处理,得到真实预测结果,即对预测序列进行如下计算:4-(1)其中表示原始序列,为最终预测结果。预测结果如图4.16所示。图4.SEQ图\*ARABIC\s116LSTM模型预测结果4.3.4模型效果的评估依然采用评价指标AE,APE,MSE,R2来对模型的预测效果进行评估。表4.SEQ表\*ARABIC4LSTM模型预测效果评估meanstdminmaxAE5.284.250.0322.96APE4.22%3.47%0.02%18.41%MSE45.97R20.54观察表4.3发现,LSTM模型对收盘价预测的AE最小值为0.03,最大值为22.96。虽然这两项指标均低于ARIMA模型,但相差仍较大,说明LSTM模型仍存在预测效果起伏较大的问题。AE的标准差略低于ARIMA模型,说明LSTM模型的稳定性比ARIMA较强。平均AE为5.28,平均APE为4.22%,MSE为45.97,均低于ARIMA,说明LSTM预测的整体误差比ARIMA小。R2为0.54,高于0.5,说明预测变量中大部分的信息得到解释。综合图像和表格可以发现,LSTM模型的整体预测性能略高于ARIMA模型,但预测的稳定性仍令人难以满意。4.4LSTM-Bspline模型的实证分析股票数据在不同时间段内会呈现不同的变化规律,LSTM-Bspline模型结合了LSTM与B样条拟合的优点,可以对时间序列进行分段预测。但模型的实际预测效果还未经过验证。在本节中,使用LSTM-Bspline模型来上述股票收盘价数据建立模型,并将模型预测效果与ARIMA以及LSTM的结果相对比。检验LSTM-Bspline是否有效。4.4.1数据处理1.局部拟合区间的划分由于的LSTM-Bspline模型是一种分段预测模型,因此需要对数据集划分局部拟合区间,即选取每个局部拟合区间内包含的序列值。在股票市场中,十日均线是股票投资者们重点参考的一项指标,这说明每十天股票的变化情况具有较大的研究价值。因此,本节选取来进行局部拟合区间的划分。每十天为一个局部拟合区间,3000个股票收盘价数据被等分成300个集合。2.样本数据集的划分本文建立的LSTM-Bspline模型以LSTM为基础,训练方法与LSTM模型相同。因此样本数据集的划分与上一节保持相同,即:按照8:1:1将数据分为训练集,验证集,测试集。训练集包含2400个序列值,240个局部拟合区间。验证集和测试集都包括300个序列值,30个局部拟合区间。数据的归一化LSTM-Bspline模型与LSTM训练过程相同,因此为提升训练效率,仍对数据进行归一化处理。模型输入的转化LSTM-Bspline模型第个局部拟合区间的输入值为第个局部拟合区间内的个样本序列值的1、2、3、4阶中心矩。因此采用公式3-(1)对原始序列进行处理。4.4.2模型的优化器与超参数设置鉴于Adam算法的种种优点,且为了使结果比较更为直观,本节仍然选取与上节LSTM模型相同的Adam算法。LSTM-Bspline模型超参数共有三个,其中超参数已经提前选定设置为10。只剩下B样条等距内节点数和LSTM隐藏层神经元个数需要调整。超参数个数较少,采用网格搜索法对其进行选择,其中的搜索范围依然沿用上一部分的设定。参数的搜索范围设为,对一共9个参数组合进行遍历,选取使验证集误差最小的值。最终选取的超参数,。4.4.3模型预测在对模型进行训练后,对输出结果进行公式4-(1)的反归一化变换,得到预测结果如图4.17。通过观察可以发现,LSTM-Spline模型对数据变化趋势的拟合较为准确的,只是数值存在偏差。图4.SEQ图\*ARABIC\s117LSTM-Bspline模型预测结果4.4.4模型效果评估表4.SEQ表\*ARABIC5LSTM-Bspline模型预测效果评估meanstdminmaxAE5.012.200.0111.59APE3.99%1.84%0.01%10.39%MSE30.05R20.70观察表4.5发现,LSTM-Bspline模型对收盘价预测的AE最小值为0.01,最大值为11.59。均为三个模型中最低,并且差距不大。AE的标准差仅为2.20,明显低于ARIMA和LSTM模型,说明LSTM-Bspline的预测结果在三个模型中最为稳定。平均AE为5.01,平均APE为3.99%,MSE为30.05,均为三个模型最低,说明LSTM-Bspline预测的整体准确度最高。R2为0.70,说明预测变量中的绝大部分的信息得到解释。综合图像和表格可以发现,LSTM-Bspline模型结果与实际值仍然有误差,但是对序列变化趋势的拟合较为准确,预测准确度和稳定性都为三个模型中最佳。因此,总体而言LSTM-Bspline模型的预测性能在三个模型中最优。4.4.5模型比较分析为了比较更为直观,将三种预测方式的平均AE(MAE)、平均APE(MAPE)、MSE和R2放在同一表格进行直接对比,如表4.6所示。表4.SEQ表\*ARABIC6模型预测效果比较MPEMAPEMSER2ARIMA6.030.047954.560.46LSTM5.280.042245.970.54LSTM-BSpline5.010.039930.050.70观察表格发现,三个模型按照MPE、MAPE、MSE三项指标的从小到大排序均为LSTM-BSpline最小,LSTM次之、ARIMA最大;这说明,相较于ARIMA和LSTM模型,LSTM-BSpline的整体预测准确度更高,总体误差最小。三个模型按照R2从小到大排序为:ARIMA最小,LSTM次之,LSTM-BSpline模型最大,这说明,相较于ARIMA和LSTM模型,LSTM-BSpline在预测时,原数据的变化被解释的比例更大,模型拟合优度更好。宝洁公司股票收盘价数据为非平稳时间序列,ARIMA模型在进行差分处理时损失了部分数据信息,因此其结果逊色于LSTM模型。股票数据往往在不同时间段内呈现不同的变化趋势,LSTM-Bspline模型可以时间序列进行分段预测,对不同时间段内的数据选择不同的参数进行拟合,因此其预测效果优于LSTM模型。第六章总结与展望6.1总结随着国际形式日趋紧张,金融市场的变化牵动着每个公民的心,对金融时间序列进行合理的分析判断愈加重要。然而复杂的国际形势导致金融市场更加动荡,金融数据的非线性、非平稳性、不确定性等特点进一步加剧。这使得对金融市场进行正确判断更为困难。针对这个问题,本文提出时间序列的分段预测概念,构建LSTM-Bspline模型对时间序列进行分段预测,可以挖掘出金融时间序列数据在不同时间段内蕴含的不同变化规律。并现将本文主要工作总结如下:(1)介绍金融时间序列的研究意义,分析了金融时间序列的特点。对现有的较为流行的两大预测模型——ARIMA模型、LSTM模型进行展开叙述,介绍两模型的原理、结构,比较不同模型之间的优劣性,并介绍建模步骤。(2)分析金融时间序列在不同时间段内变化规律不同的现象,提出时间序列的分段预测概念并将B样条函数与LSTM模型结合,建立时间序列的分段拟合模型。首先将时间序列划分为等数量的局部拟合区间,然后对区间内的序列使用B样条函数进行拟合。而当前区间的B样条基函数的系数与前一区间内的序列值存在函数关系。因此采用LSTM模型对这种函数关系进行建模,通过训练获取当前区间的B样条基函数的系数,进而可以计算出当前区间内的序列值。(3)为验证LSTM-Bspline模型的预测效果,本文选择股票作为研究对象,选取宝洁公司2006年2月到2019年1月共3000个交易日的股票收盘价作为研究样本,将后300个数据作为测试集,分别采用ARIMA、LSTM和本文提出的LSTM-Bspline模型对未来300个交易日的收盘价进行预测,并将结果进行分析。通过比较预测结果的MAE、MAPE、MSE、R2发现,LSTM-Bspline模型的整体预测结果优于LSTM优于ARIMA,证明本文构建的模型有效。6.2展望本文提出金融时间序列的分段预测概念,将LSTM与B样条曲线结合,构建了分段预测模型LSTM-Bspline。虽然取得了不错的预测效果,但是还存在着优化空间,主要体现在以下几个方面:1.模型的输入变量本文依照前人的经验将其设置为过去时间段内的一阶、二阶、三阶、四阶距,缺乏理论依据。因此,在后期可以尝试对序列进行不同的处理作为输入变量,比较预测效果,并寻找更为坚实理论支撑。2.模型的损失函数本文选取为泛用性强的均方误差,未来可以考虑尝试不同的损失函数,通过比较结果来确定最符合模型的损失函数。3.为了简化建模过程,本文默认选择了均匀节点的B样条函数进行拟合,并且在实证分析部分,预先设置了局部拟合区间的长度。在未来,为了进一步提升模型的预测性能,可以尝试选取非等距B样条曲线,并尝试更多的模型超参数组合。这无疑会增加模型训练的工作量,但可以作为本文未来的努力方向。
参考文献
张美英,何杰.时间序列预测模型研究综述[J].数学的实践与认识,2011,41(18):189-195.刘静,关伟.交通流预测方法综述[J].公路交通科技,2004(03):82-85.张淑军,张群,李辉.基于深度学习的手语识别综述[J].电子与信息学报,2020,42(4).MatsubaI.Applicationofneuralsequentialassociatortolong-termstockpriceprediction[C]//[Proceedings]1991IEEEInternationalJointConferenceonNeuralNetworks.IEEE,1991:1196-1201.陈观钦.基于深度学习的理解式中文短文本摘要生成方法研究[D].广东工业大学.鞠春雷,聂方超,刘文岗,郭金山,张江石.基于长短期记忆网络的矿工不安全行为研究[J].煤矿安全,2020,51(09):260-264.
GravesA.Supervisedsequencelabelling[M]//Supervisedsequencelabellingwithrecurrentneuralnetworks.Springer,Berlin,Heidelberg,2012:5-13.龚小龙.基于结构参数优化的B样条网络时间序列预测模型及工业应用[D].湖南工业大学.DavisGA,NihanNL.Nonparametricregressionandshort-termfreewaytrafficforecasting[J].JournalofTransportationEngineering,1991,117(2):178-188.郝博乾.基于时间序列分析的股票预测模型研究[D].电子科技大学,2011.ClevelandRB,ClevelandWS.STL:Aseasonal-trenddecompositionprocedurebasedonLoess[J].Journalofofficialstatistics,1990,6(1):3-73..周鲁天,梁睿,彭楠,等.基于ARIMA的矿山电网故障暂态行波波头辨识及故障测距[J].电力自动化设备,2020,v.40;No.314(06):245-256.HamiltonJD.Timeseriesa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026云南曲靖市师宗平高学校面向全国招聘储备教师5人备考题库及一套完整答案详解
- 2026年计算机网络安全策略与实践考试题
- 2025-2030商业银行产业园区定位规划及招商策略咨询报告
- 2026上半年云南事业单位联考曲靖市师宗县遴选24人备考题库(含遴选计划)及一套参考答案详解
- 2026年汽车制造工艺及质量管控的标准化测试题
- 2026上半年贵州事业单位联考商务厅(贵州省人民政府口岸办公室)招聘1人备考题库及答案详解1套
- 2026年自然语言处理机器智能核心技术试题库
- 2025海南乐东黎族自治县县内竞聘中小学校副校长10人备考题库(第1号)及答案详解1套
- 2026年音乐之谜从乐理基础到音乐家水平测试题库
- 2026年福建莆田石南轮渡第二轮船员招聘11人备考考试题库及答案解析
- 2025年司法协理员年度考核表
- 风电项目质量管理
- 静脉输液操作规范与并发症预防指南
- 临床正确标本采集规范
- 福建省福州市福清市2024-2025学年二年级上学期期末考试语文试卷
- 2025年CAR-NK细胞治疗临床前数据
- 班团活动设计
- 基金通道业务合同协议
- 党参对人体各系统作用的现代药理研究进展
- 交通银行理财合同范本
- 林业结构化面试题库及答案
评论
0/150
提交评论