




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 基于小波分析的金融时间序列预测 北京邮电大学 目录 摘要 . 问题的提出 . 传统方法及改进的方法 . 模型构造前的准备 .据的来源 . 3 数据的处理 . 4 准化处理 . 4 益率的定义 . 4 4 模型的建立( 型) .建模思路 . 5 对原始数据进行小波分解 . 6 波分析的基本理论 . 6 波分解 . 10 时间子序列的预测 . 14 波空间变换序列的预测 . 14 尺度空间变换序列的预测 . 15 预测数据的重构及检验 . 17 5 模型评价及改进方向 . 20 点: . 20 点及改进方向: . 20 参考文献 . 22 1 摘要 本文以金融时间序列 为研究对象,将小波分析应用于时间序列预测 ,并以美国 S& 首先, 利用小波分析的时频分解特性,将时间序列分解到不同频率空间,得到具有不同稳定特性的空间映射。再分别利用神经网络自适应能力对时间序列的非线性分量进行模拟预测,与 适用于平稳序列的 自回归模型处理平稳分量 的 分析 预测 。 具体来说,由波 对序列进行分解 得到了序列在 各级 小波空间与 各级 尺度空间的分量。其中,对于高频段的小波空间利用神经网络进行训练并对训练的系统进行预测;而在 低频平稳的尺度空间 先利用单位跟检验对数据的平稳性进行检验,由相关分析可以得到序列在 尺度空间的分量具有很显著的平稳性,对回归分析的可行性提供了保证, 然后 利用 回归模型 对序列的尺度空间分量 进行回归分析并 利用已有数据对收益率进行预测。再 将二者加以结合来对时间序列进行重构得到了收益率 整体 的发展趋势。最后将这种混合策略 的 预测结果与单个方法的预测结果 与实际数据 进行对比, 从作出的曲线图可以看到混合策略 较之 单个预测方法 有明显改善,即与实际数据更加符合 。 但从最终结果的分析,得到了该方法的缺陷,如 小波空间中神经网络分析对于可能出现的突发事件无法做出及时反应以致可能产生预测误差的扩散。该缺陷可以通过神经网络与遗传算法的结合加以改善,而且 该方法对数据量的大小具有一定的要求。 关键字 :小波变换 神经网络 型 2 1 问题的提出 当今世界的经济格局复杂多变,经济的全球化紧密将各国的经济发展紧密地联系起来,成为一个经 济网络,互相影响,任何一个微小的波动都有可能发展成全局的震荡。金融市场是一个国家经济运行的核心,更是世界经济的核心,探求金融市场的变化规律,从而进行有效的金融管理以提高金融投资效率,这些都是各国政府与投资机构孜孜以求的目标,也是每个单体投资人的目标。而金融时间序列代表的是经济与金融领域中最重要的数据,因为其代表的是资产价值随时间的演变。故,对这类数据的研究能够很好的反应本国的经济状态和发展趋势,全面考虑未来有可能发生的情况,从而制定更适合未来发展的政策。从宏观的角度来看,金融时间序列包括股票,股票,利率以及 期权期货市场等等。作为数理统计学的一个分支,时间序列分析自 1960 年代起就已经得到了广泛的研究。传统的金融时间序列分析方法主要包括基本分析、技术分析以及各种数理统计学方法等。而以我国来看,证券市场一直在我国金融市场中占有不可动摇的主导地位,它是我国经济发展的“晴雨表”,其发展依靠实体经济的支撑并且能够真实的反应公众对实体经济发展的预期。 随着中国经济市场的逐渐完善,证券市场不断成为中国社会经济生活中的一个重要元素。因此,为了更好的保证我国的经济政策的健康,稳定,持续的发展,我们必须有效地分析中国以至世界的 证券市场的波动性及发展趋势,进而对国内的经济发展趋势做一个大体的预测。而要对证券市场进行分析,就必须综合大量的历史数据,并从这些历史数据中总结出潜在的规律,从而根据这些规律对将来的证券走势进行预测。因此,金融时间序列分析理论也正式诞生。由于股票的所有历史价格可以看成是一个高频的金融时间序列,因此,深入的研究金融时间序列对证券市场的发展和完善有着重大的指导意义。(王文利, 2004) 本文以研究美国纽约指数 (S&P 指数 )为例,提出了一种预测股票收益率的方法。由于股票市场基本上具有一致性,故此研究对中国股票收益率 的研究也有着借鉴意义。 2 传统方法及改进的方法 普通的时间序列分析方法是数理统计的一个重要的应用,然而,传统的时间序列的分析方法大都集中于对整个时间域的数据进行整合,并且假设时间序列是一个平稳的序列,自相关性随着时间间隔的增大而不断衰减。传统时间序列所采用的定常参数数学模型和真实系统的实变性之间的差异,导致无法有效地处理具有较大规模的数据集。此外也不适合用于从大量的数据中主动地发现各种潜在的规则。 但是,金融时间序列包含了强烈的不确定因素,它通常都表现出强非平稳性及较长的记忆性。例如,资产波动率有着各 种不同的定义,对一个股票收益率序列,波动率是不能直接观察到的。因此,如果对金融时间序列用传统的方法,如自回归模型( 型),随机滑动模型( 型)等等,得出来的结论可能 3 会存在很大的偏差。 然而如果我们考虑利用时频联合分析方法分析金融时间序列,就可以极大地解决上述的问题。现阶段,时频联合分析方法主要包括 布和小波变换两种。相比之下,小波分析能够通过伸缩和平移运算,改变时间频率的分析窗的大小,从而对时间序列进行多分辨分析。更进一步,小波分析能把全空间分解成若干个子空间,而每个子空间拥有较小的频率 带,即波动率更小。因此,在每个子空间上对时间序列进行预测能够得到更好的效果。 本文就是利用小波分析的减噪能力处理分解原时间序列,在若干个子空间内分别得到一个子序列;然后对每个子序列运用数据挖掘的 技术进行预测;最终再将预测得到的新序列通过小波重建技术重新整合 3 模型构造前的准备 根据 面公布的数据 可以查到 S&数的所有历史数据,本文截取 3084 个数据点,每个数据点包括股指在当期的开盘价,收盘价,最高价及最低价,本文采 用每日的收盘价进行研究。 数据如下图 500 1000 1500 2000 2500 3000100012001400股价图 为了能够检验模型的可行性,我们截取 3072 个数据点作为模型的原始数据,以此来预测后 12 个时间序列点。 12 个时间数据点进行比较,求出相对误差。 4 数据的处理 准化处理 1. 当进行小波分解时,由于本文中处理的数据小数点后的位数过多,在编程时可能造成数据丢失,故将原始数据都乘以 1000。 2. 在进行神经网络算法时,需要对数据进行标准化处理 益率的定义 对数收益率 简单收益率 考虑到对数收益率拥有 更好的统计性质(统计与金融),本文采用对数收益率分析原始序列。如下图: 收益率 图 4 模型的建立( 5 建模思路 传统的线性计量模型都只能提取时间序列的整体及整个时间域的 信息 从而对未来进行预测,这就要求时间序列有很好的平稳性,因而无法处理序列中那些由于短时间突发事件而产生的“奇异点”对未来的影响。针对这种情况,神经网络算法通过模拟大脑神经 元的学习过程 ,记忆信息的方式很擅长描述变量之间的非线性关系 ,能够很好的把握序列局部的性质及短时间内的影响。然而,在实际运用中,如果直接运用神经网络模型学习训练以逼近复杂的高频金融时间序列,寻找序列的内在的关系和趋势时,往往需要大量的输入数据,这样要消耗大量的时间;而且这些金融时间序列往往拥有很强的记忆性,也就是说序列的自相关系数衰减程度不大。因此,要成功的预测此序列,也需要在一定程度上对序列的整个时间域进行分析,而这对于侧重局部数据分析的神经网络理论来说是灾难性的。 因此我们考虑用小波分析的理论对原高频金融时间序列进行减噪处理(即降低序列的波动性),然后结合线性回 归模型( 型)和神经网络算法( 法)对处理后的序列进行预测。进一步说,小波分析能够把原始序列分解成低频部分(尺度序列)及高频部分(小波序列)。一方面,低频部分代表了原始序列的概貌(即序列大体的走势方向)。由于去掉了序列中的噪声,这一部分的自相关性很强,而且基本上可以看成是平稳的,线性的,因此,用 型预测这一部分的效果比神经网络更好;另一方面,高频部分代表了原始序列中的短时间内的“奇异点”(即噪声),这些序列通常具有非平稳性,非线性,非正态,要求快速响应等特点,而且这些 短 时间内的噪声与其他短时间内 的噪声的相关性很低,因此,运用侧重局部数据分析的非线性模型 神经网络对这部分数据进行预测是很合适的。利用小波分解将两种方法加以结合则能够发挥二者数据处理的优势。 为了检验模型的预测效果,我们将在网上找到的 S&P 股票的历史价格( 为两部分,前 3072 个序列点( 为模型中的历史数据,以这些数据为原始时间序列来预测后 11 个时间序列。再用这需测出来的 12 个序列点与真实数据比较( S&P 在 间的历史价格) ,求出误差。并将这个误差与直接用 经网络算法预测出来误差相比较,从而评价模型的优劣性。 总而言之,本文的数据处理过程分为以下四步: 1. 用小波分析理论对原始金融时间序列进行分解,得到时间序列在各个小波变换域的变化序列和最后的尺度变换序列。 2. 运用神经网络算法对各个小波变换域里的变化序列进行预测,并用 型对尺度变换序列进行预测。 3. 将第二步中预测出来的各个新序列用小波重建技术合并产生原始序列的短期预测。 4. 将得到的预测序列和原始序列进行比较,检验该模型的预测效果。 具体的流程图为 6 流程图 由于该模型结合 了小波理论, 经网络, 型,故成为 型。 对原始数据进行小波分解 波分析的基本理论 定义: 是空间 的一个闭子空间列, 被称为 的一个多分辨分析,如果 满足下面的四个条件: 一致单调性 , j 渐进完全性 , ; 伸缩规则性 ; 7 正交基存在性 存在 其中 则称为尺度函数, 称为逼近空间。 定理 设 是由尺度函数 生成的多分辨分析,则对任意的 ,函数集是 的标准正交基。 定理 设 是由尺度函数 生成的一个多分辨分析,则下述两尺度方程成立。 则 定理 定义 令 则 是 在 中的正交补空间, 即 分解算法 假设 f 是我们要处理的时间序列(先假设是一个连续函数),可看作 ,但我们测得的信号只是实际信号 的一个近似,设 ,由于 是 空间的标准正交基,故 有 8 显然 然而又有 因此 其中 结合 (1),(2),(3)式可以得到 类似的不断这样分解下去,可以将 分解为 空间上的函数 与 空间上的函数 ,并得到相应的尺度系数 及相应的小波系数 最终可以得到 的分解式 (分解到 M 层 ) 进一步来看,我们将 在其 子空间上分解,求出它在各空间上的子函数(即根据(4)式迭代求出尺度函数系数 与小波函数系数 ) 9 我们必须将系数初始化,即给 赋值。 当 为连续函数时, 因为在本文中, 为离散序列时,故需要对 进行抽样取值近似上面积分, 重构算法 对于给定的信号 f,按照前面的分解算法可以将其分解为 与 (jlM)中的成分 ,然后根据需要对分解后的序列进行数据处理,当处理后,小波系数会发生变化,这就需要一个重构算法,使处理后的信号 能用 里的基底表示,即使 设 令 即 10 则 类似的,可以重构出 (jlM),并得到其的小波系数 , 最终得到 。 波分解 需要解决的问题 : (1) 选用什么样的小波基函数对原序列进行分解; (2) 需要将序列进行多少次分解: (3) 法每循环一次都要进行二抽样,因此,随着分解的增加,分辨率的降低,子序列的数据点变少,需要找一种改进算法来克服这一缺点。 问题的解决: (1) 对于问题一 由于本文处理的时间序列的波动性较大,而且序列中有“奇异点”存在,故所采用的小波最好具有对称性,否则在分解重构后会造成失真( ) ,(因为其 不满足线性相位 );另一方面,由于序列具有一定的相关性,即有冗余性,为了 消除冗余性,应尽量采用具有正交性的小波基,否则,当 采用非正交基的时候,基小波的系数之间会体现出依赖,这样分解得到的小波子空间中的序列会有一定相关性,这种情况再用神经网络算法预测会有较大的误差。综上所述,最好采用具备正交性及对称性的基小波,而只有 波同时具备这两个性质,故采用 波。 (2) 对于问题二 由于股票波动频繁,分解层数越多越好;但随着分解阶数的增加,尺度空间和小波空间的变化越来越小,而工作量却成倍的增加,故分解层数也不宜过多。 经过比较,选用 6 层分解。 (3) 对于问题三 为了得到一个稳定的时间序列预测,我们需要分解出来的子序列的数据点相较于原始序列 不减少,因此我们考虑在原始序列抽样取值时,在偶数点上加上 0,这样一来,原始序列的抽样点变多一倍,则子序列的抽样点便与原始序列抽样点数 11 量一样了。 对时间序列进行分解 根据上面所阐述的算法,由 程可得到分解后的各个小波空间的子时间序列及各尺度空间的序列,具体如下图 (注意,由于证券收益率太小,有太多位小数,我们在处理数据时可能会造成数据丢失,故我们将所有数据均乘以1000.) 小波空间的序列 图表 1(第一级小波空间 ) 图表 2(第二级小波 空间 ) 图表 3(第三级小波 空间 ) 12 图表 4(第四级小波 空间 ) 图表 5(第五 级小波空间 ) 图表 6(第六 级小波空间 ) 尺度空间的序列 图表 7(第一级尺度空间 ) 图表 8(第二 级尺度空间 ) 13 图表 9(第三级尺度空间 ) 图表 10(第四级尺度空间 ) 图表 11(第五级尺度空间 ) 图表 12(第六级尺度空间 ) 由上图可以看出随着分解的深入,尺度序列与小波序列都呈现出了越来越低的分辨率,曲线变的越来越平滑。 特别的,由 于小波序列属于原始序列的高频部分,表示了原序列的细节变化部分,所以图像呈现出强烈的非线性性,故需要高响应度的算法来处理,而且序列曲线呈现出了一定的周期性,即表示序 列的自相关度较小,因此进一步说明,用神经网络算法预测 是可取的 。但是可以发现,低层次的小波序列很不平滑,变化频率很高,用神经网络算法来预测这一部分的子序列还是会有较大的误差 。 另一方面,随着分解层数的增加,尺度序列变得越来越简单(即越来越逼近原序 14 列的概貌),第六级尺度空间的序列拥有较好的平稳性及线性性,故采取线性自回归模型来预测效果更好。 时间子序列的预测 波空间变换序列的预测 经网络模型 对于具有小波分解后产生的高度非线性的小波空间,借助前馈神经网络( 法处理非线性问题的自适应特性分别对各级小波空间的序列进行模拟进而预测股市的变化趋势。通过对已有数据的训练来调节系统的权值与阈值以及偏移量,进而利用得到的网络模型作用于后期的输入量以得到输出的预测值。 神经网络基本模型 具体来说,神经网络模型的建立通过以下几步得以实现: 随时间变化的收益率作为待训练系统的目标量,而标志其变化的时序作为网络的输入量 对目标量与输 入量进行归一化处理得到网络模型输入端的有效数据 网络初始化时将隐层神经元的个数设置为 20,初始化网络的转移函数与训练函数分别是 利用各级小波空间已有的 3072 个数据对该网络系统进行自适应训练,迭代500 次后即可得到训练的系统,由训练结果可以得到该系统对已有数据预测输出的有效性进行评估。检验后即可对后期的输入(时序)进行模拟预测,最终得到各级今后 10 个时隙的预测值作为总体预测值在该级小波空间的投影 模型结果 根据上述模型,用 程实现神经网络算法得 未来 1 级小波空间 2 级小波空间 3 级小空间 4 级小波空间 5 级小波空间 6 级小波空间 时刻 1 刻 2 刻 3 刻 4 15 时刻 5 刻 6 刻 7 刻 8 刻 9 刻 10 刻 11 刻 12 合度(R) 上表可知,神经网络对于各个小波空间序列的拟合程度很高。 尺度空间变换序列的预测 根据小波分析理论,随着尺度空间阶数增大,原序列在此尺度空间中投影得到的 序列具有越来越好的线性性及平稳性。为了科学起见,我们用单位根检验判断序列的平稳性。 单位根检验 此处我们通过利用软件 通过 观察图像 ,由于图像不具有长期明显的上涨或者下降,而且图像的均值接近 0,因此 我们使用软件进行单位根检验的时候选择既不含常数项也不含趋势项形式的方程 作为检验方程 ,其中检验类型选择 原序列进行单位根检验 , 佳的滞后期得出结果如下图: 16 由上图可知,软件取定 2,且此时检验 小于显著性水平为 1%的临界值,因此可以拒绝原假设,即序列不存在单位根,是平稳的 。 故我们采用 AR(p)模型进行预测。 型 首先确定阶数 P 根据文献(金融时间序列分析) 应选择合适的 p 值,使得 最小,其中 是 的最大似然估计, 是残差的方差, T 是样本容量。 通过统计软件的计算, p 取 12 可以使得 小。 故可以建立 2)模型 上式 中, 表示当期的尺度变化值, 表示 i 时刻前的尺度变化值。 用马可威软件进行求解,并对得到的方程进行系数显著性检验,剔除那些系数不显著的,并 重新建立 型,最后可得 运用马可威软件可得各变量的系数如下表 17 由上表可知,各变量的显著性都很好。 由以上残差表可知,模型的拟合度很好。再根据自回归 型预测出尺度序列的点列可得下图: 2 4 6 8 10 120 0 0 0 预测数据的重构及检验 预测结果 根据上述的模型,我们对 S&P 在 中间的 12 个时间序列点进行预测,可以得到下表 1 级小波序列 2 级小波序列 3 级小波序列 4 级小波序列 5 级小波序列 6 级小波序列 6 级尺度序列 重构序列 18 真实数据比较可得(预测数据要除以 1000) 结果分析 1. 由上图可知,预测序列在 A 点, B 点, C 点的预测效果比较差,特别是 A 点,股票的走势都预测错了,但其他点的预测效果还可以。 经过分析我们得出结论, 型不能很好的对证券市场中的未知的突发事件作出及时响应。例如我们对位于 A 时刻( 预测点与实际序列进行分析,首先,我们列出 A 时刻前五个时刻的 证券收益率的变化图, 收益率的变化图 从图中可以看出,在 &数发生了突变,经过查询资料( 们得知,这是因为在当天美国政府发布了美国前几个月的经济报表,公布了美国金融危机后期经济复苏速度迟缓的事实,导致投资者的信心受挫,对市场产生担忧,这一信息迅速反应到证券市场中,使得股指由 的大涨(涨幅 变成 的大跌(跌幅 。而这一个突发事件是从历史数据中不可能预测的到,即 法及时从历史数据中获得这个突发事件的信 息,故在 A 点预测失败。 对于 B 点与 C 点, 6 月 10 号及 6 月 15 日,股指的大幅波动,则是由于, 6 19 月以来原油价格的进一步走低;穆迪警告下调意大利银行的信用评价,加剧了欧洲的债务危机;对于这些事件,(主要是原油下跌的事件)历史数据中有一定的体现,所以 型有一定的反应,但响应不够精确,故预测数据的误差较大。 而对于其他点, 型的预测结果的误差还是很小的。这是因为, 如, 型在对 进行预测时,考虑了 的突发事件的影响,因此预测数据比较成功 。 总之, 型只能从历史数据中获得信息,并运用这些信息对未来进行预测,而对那些未知的突发事件的响应具有滞后性。 2. 最后将 型,直接用 经网络算法,直接用 型得到的预测序列比较得 若直接运用 型得到下表 即如果直接用 型预测,拟合度 R 特别低。因为原始序列是高度非线性的,故直接用 型的预测效果极差。 我们再比较 型及 型 ,预测结果如下表 型 型 原始数据 20 由上图可以得到, 型的预测效果明显优于 型, 再对求相对误差得, 相对误差 型 除 A,B,C 点 ) 型 以上可知,使用普通 经网络预测时会出现较大幅度的相对误差,而且有很多数据甚至连正负都预测错了。而另一方面,混合策略 型则有明显的改善 ,进而能够对数据进行相对有效的预测,虽然相对误差较大,但是由于数据本身的绝对值较小,所以预测序列绝对误差很小。 5 模型评价及改进方向 点: 该模型以小波理论为基础将待分析序列分别投射到不同频段的小波空间与尺度空间,以对序列进行时频窗分析,实现序列概貌与细节的分解,再对两个领域分别运用适用的方法进行有效的预测。利用这种分解策略能实现较之传统方法更为有效的预测 对序列在具有高度非平稳性的小波空间的投影序列建立具有自适应与非线性的神经网络模型,构造前向反馈神经系统进而实现对网络进行多次训练可以有效 处理因高频变化的非线性序列,最终进行有效的预测。而对序列在尺度空间的投影则充分利用其平稳性进行自回归模型进行预测,这样就将两种使用与不同对象的预测方法实现有机结合 点及改进方向: 21 对序列在高频空间映射的处理利用神经网络算法时,对于实际情况可能出现的突发事件不能有效的预测,进而可能出现预测误差的扩散影响以后的预测效果。针对这个缺陷,可以考虑利用遗传算法与神经网络算法的结合,即基于遗传算法的神经网络。遗传算法中的基因变异可以从概率的角度体现可能出现的突发事件(变异),再结合对神经元的权值与阈值的调节对 数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年漆包线项目资金筹措计划书代可行性研究报告
- 葛洲坝集团投资管理办法
- 虹口区仓库库存管理办法
- 融资性担保公司管理办法
- 衡阳电动车管理办法规定
- 街道无主小区管理办法
- 装配车间易耗品管理办法
- 西安无病例小区管理办法
- 计划外资金审批管理办法
- 证监会内部信息管理办法
- 小升初语文阅读理解练习100篇
- (正式版)SHT 3045-2024 石油化工管式炉热效率设计计算方法
- 矿泉水区域总代理销售合同
- 《养老护理员》-课件:协助卧床老年人使用便器排便
- 调节阀培训课件
- 日立电梯小组慢车调试培训教材(MCA)
- 建筑电气施工图识读
- 30万吨年合成氨、52万吨年尿素工程可行性研究报告
- 苏州市昆山市事业单位招聘紧缺人才考试真题2022
- 2019人教版新教材高中化学选择性必修三第一章重点知识点归纳总结(有机化合物的结构特点与研究方法)
- 2020年12月9日湖北武汉黄陂区社区干事招聘笔试试题
评论
0/150
提交评论