基于arima的模糊时间序列预测模型_第1页
基于arima的模糊时间序列预测模型_第2页
基于arima的模糊时间序列预测模型_第3页
基于arima的模糊时间序列预测模型_第4页
基于arima的模糊时间序列预测模型_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于arima的模糊时间序列预测模型

1基于模糊逻辑的金融时间序列预测金融挖掘是信息社会中一个非常挑战的研究方向。由于其复杂的结构和随机性,很难找到内部规律。其中,基于时间序列分析的方法,能够有效地将已发生的、进行中的以及即将发生的事件联系在一起,在时间的维度上进行分析。时间序列中最常见的是Box-Jenkins类模型,在该类模型中,ARIMA模型由于其简单性、可行性和灵活性,为目前应用最广泛的时间序列预测模型之一。另外,金融数据记录的模糊性是不可避免的,因此限制了传统预测模型的使用范围。1993年Song和Chissom[1~2]创造性地提出了模糊时间序列的定义,应用模糊逻辑理论,在不确定环境下有效地处理了不完整和含糊的数据。论文以阿拉巴马大学的学生注册数据为例,进行了模糊时间序列的预测研究,并提出了一个包括下列四个步骤的预测模型:①根据训练集和模糊隶属度函数对论域进行模糊划分;④将观测值模糊化,然后根据③中确定的模糊关系矩阵和给定的预测规则求得预测值。随后该模型广泛地应用于经济、社会生活等领域,特别是其预测功能常被用于入学人数[3~8]、气温和股票指数[10~11]的预测。然而,金融数据通常具有高维的特性,在提取多维特征进行建模时可能引起“维度灾难”,这也使得模糊时间序列方法的应用受到限制。以股票预测为例,提取的多维特征有股票每日收益率、5日移动均线变化值、成交量DHL等,模糊逻辑关系查找计算繁琐复杂,多维特征提取之后预测效果也并不理想。考虑到ARIMA模型的简单有效性,本文创新地对ARIMA模型定义了相似性和模,在此基础上,采用模糊c-均值(FCM)算法对子序列聚类,进而应用模糊时间序列方法对金融时间序列进行挖掘和预测。一方面,基于模糊逻辑的预测方法,能够有效发现金融时间序列中的相似模式;另一方面,ARIMA模型自身操作的简单灵活性以及新的相似性和模定义的合理性,使得本文中的模型对高维金融时间序列的特征提取大为简化。2模糊性质的定义定义1所谓给定了U上的一个模糊集是指:对ue420u∈U,都指定的数μ(u)∈[0,1]与之相对应,它叫做u对U的隶属度。这意味着做出了一个映射:μ(u):U→[0,1],u→μ(u),这个映射称为的隶属度函数。定义2令U为给定论域,给定U的一个次序分割集,则U={u1,u2,…,un}。一个定义在论域U中的模糊集合A表示如下:定义A为论域U上的语义变量集(即模糊集),并记为:其中:fA为定义在A上的模糊隶属函数,fA:U→[0,1];fA(ui)为ui在模糊集A上的模糊隶属度的值,并且fA(ui)∈[0,1],1≤i≤n。定义3对于任意固定的t(t=…,0,1,2,…),设Y(t)ue447R,即为实数域的子集,Y(t)上定义一组模糊集fi(t)(i=1,2,…),且F(t)={f1(t),f2(t),…},则称F(t)为定义在Y(t)上的模糊时间序列。其中:F(t)为语言变量;fi(t)为F(t)中可能的语言值,即定义1中的fA(ui),因为对于不同时刻t,F(t)是不同的,故F(t)为t的函数,且论域可能随t而变化,因此使用Y(t)作为变化的论域。定义4设R(t;t-1)为定义在从F(t-1)到F(t)的模糊关系,若满足F(t)=F(t-1)oR(t;t-1),则称F(t)是由F(t-1)得到的,且可以用模糊逻辑关系来表示F(t-1)→F(t)。其中:“o”代表合成运算,F(t)和F(t-1)都是模糊集,关系R称为定义在F(t)上的一阶模糊关系。定义5令F(t-1)=Ai,F(t)=Aj,则两个连续的观测值F(t)和F(t-1)可以用一个模糊逻辑关系表示,记为Ai→Aj。其中:Ai为模糊关系的前件,Aj为模糊关系的后件。根据定义4,如果t=1,2,…,N,则可以建立N-1个一阶模糊逻辑关系:F(i-1)→F(i),(i=2,3,…,N),用模糊集合之间的关系来表示,它们就是N-1个Ai,t-1→Ajt,(t=2,3,…,N),其中Ai,t-1和Aj,t分别表示t和t-1时刻序列值所属的模糊集合。3建模过程简单本文建模流程图:3.1基于arma方法的模型构建差分自回归移动平均(ARIMA)模型实质上是自回归移动平均模型(ARMA)的扩展形式,是由Box和Jenkins(1970)提出的一种时间序列建模方法。由于ARMA模型的构建要求时间序列满足平稳性,对于具有非平稳的特性的金融时间序列,我们可进行差分直至序列满足平稳性要求。在使用ARIMA方法建模时,最终可以经逆差分变换得到原序列。我们把具有如下结构的模型记为差分自回归滑动平均模型(滑动也译作移动),简记为ARIMA(p,d,q),ARIMA模型是ARMA模型的扩展:在实际中,只要p值足够大,则可由AR(p)模型逼近ARMA(p,q)模型,因此在本文中,对于时间子序列,我们只考虑使用ARIMA(p,d,0)建模,求解最优p和d的近似值。3.2金融时间序列中,不同子序列间的相似性通过3.1,我们已经对时间子序列应用了ARIMA(p,d,0)模型并估计了相应系数,为了对子序列进行聚类以及进一步的模糊化,我们需要合理地度量两个ARIMA(p,d,0)模型的距离,用以衡量两个不同子序列间的相似性。也即,在相同的差分阶数d下,需要定义两个AR(p)模型间的距离,为此,本文创造性地提出了以下两个定义:相似性My_sim,模My_norm。定义6在金融时间序列中,XT-1~XT-P的情形对当前时刻XT影响程度往往呈递减趋势,相应地,AR(p)模型的系数φ1,φ2,…,φp对模型的影响程度也是递减的。对此,我们考虑对不同时刻赋予不同的权重,W={w1,w2,…,wp},其中wi=2(p-i),i=1,…,p,即得到下列两个子序列A和B的My_sim(A,B)相似性:定义7相应地,对于任一子序列,我们定义AR(p)模型的模My_norm如下:3.3模糊时间序列预测模型经过前面的准备工作之后,下面开始介绍一种新的预测方法———基于ARIMA的模糊时间序列预测模型。该模型主要包括以下四个阶段:子序列划分及My_norm模计算、子序列模糊化、建立模糊关系行程模糊逻辑表、预测并去模糊化[14~15],下面详细介绍本文在各个阶段的实现算法。子序列的拟合并估计对于给定时间序列{XT},我们将它划分为等长的时间子列{Yt},对子序列{Yt}应用ARIMA(p,d,0)模型进行拟合并估计出最优的p和d,根据公式(3)计算每个子序列的ARIMA(p,d,0)模型的My_coe值。基于聚类数k的边界条件论域U=[Rmin,Rmax],其中Rmin和Rmax分别为根据Step1中计算得到的My_norm的最小值和最大值。使用FCM算法对数据聚类,并根据聚类结果指导论域子区间的划分。这样处理是因为聚类中心的位置分布反映了数据整体结构,用其指导论域子区间划分,可有效提高预测精度。具体实现步骤如下:首先计算聚类数k,则:其中,n为训练样本个数,X(i)和X(i-1)分别为第i个和i-1个子序列对应的My_norm系数。为向上取整运算。(2)将k个聚类中心为从小到大排序得到ci(i=1,2,…,k),将相邻的两个聚类中心ci,ci+1的中点作为论域子区间的边界点,定义边界点为bi(i=1,2,…,k-1)得到论域子区间为:(3)定义子区间对应的模糊集合,并将数据模糊化。定义模糊结合Ai为:其中,fij表示uj对模糊集合Ai的隶属度(i=1,2,…,k;j=1,2,…,k)。定义:数据的模糊化规则为:如果某样本数据属于uj,且uj对Ai的隶属度在其所有隶属度中的最大值,则可将该数据值模糊化为Ai。将所有时间子序列模糊化,得到相应的模糊时间序列{At}。n假设当前时刻为t,前三个时刻分别为t-3,t-2,t-1,t=4,5,…,n。我们对Step2中得到的模糊时间序列{At}建立3阶模糊逻辑关系如下:其中i1,i2,i3=1,2,…,k,表示相应子序列所属的模糊集合,我们可以依次建立总计n-3个模糊逻辑关系,由此形成时间子序列的模糊关系表。模糊关系前件对比利用Step3得到的模糊关系表,我们希望依据前三个时刻T-1,T-2,T-3所属的模糊集来预测当前时刻T所属模糊集:将式(7)的前件依次与模糊关系表列出的n-3个关系式的前件逐个进行对比。具体的对比原则是:对于模糊关系表中At-3,i1中i1=n1与AT-3,i1中i1=m1,它们差值的绝对值为|n1-m1|,将3个前件的第二下标的差值绝对值求和,如果小于某一个设定值(阈值),则认为关系匹配成功。预测结果的描述统计匹配成功的模糊关系的后件分布,设各种可能出现后件的频数为fi(i=1,2,…,k),根据下式(9)去模糊化,得到T时期的预测结果为:4该模型在预测汇率方面的应用4.1汇率不确定性研究自2005年7月21日起,央行宣布开始实行以市场供求为基础并参考“一篮子”货币进行调节和有管理的浮动汇率制度。伴随着我国汇率调整更加市场化,汇率的波动幅度也会有所加剧。从宏观经济角度来看,汇率对经济增长、金融市场稳定、利率稳定、充分就业等方面都有重要影响。如何实现汇率预测,有效发挥货币政策的杠杆作用,维持经济环境稳定尤为重要。无论汇率制度怎样变化,由于汇率必然向市场出清的均衡点自动调整,因此利用汇率自身变化传递的时间序列信息进行研究更能体现汇率的预测价值。首先,对汇率数据进行子序列划分,由于本文的目的是预测最长3个月的汇率走势,因此以3个月为限来分组,表1给出了子序列划分结果4.2实验步骤和主要结果(1)arisa算法拟合本文通过大量实验结果表明,使用ARIMA(8,1,0)对子序列有较好的拟合效果,计算72个子序列的My_norm模如表2所示。(2)个数为7的聚类算法依据公式(4),计算得到由数据自身结构指导的分组个数为7,也即通过聚类算法将72个子序列聚为7组。本文采用FCM算法,在求解相似性时使用定义6中的My_sim(A,B),表3给出了聚类中心的部分结果。(3)计算并排序7个聚类中心的模型,以获得最终的色度范围,如表4所示(4)根据本文提出的宇宙间隔和模糊性方法,表5显示了模糊性的关系4.3模型预测效果评价为了与其他预测方法进行横向对比,我们参考文献(熊志斌,2011)中的评判方法。采用均方根误差(RMSE)、平均绝对误差(MAE)以及方向预测精度(Dire-ctionalAccuracy,DA)三个指标来衡量模型预测效果的好坏。前面两个指标反映预测值与实际值之间误差大小,第三个指标则是预测方向的正确程度。5新方法改进方向本文将传统的ARIMA模型与模糊时间序列方法融合在一起,使用ARIMA模型提取子序列特征,并结合模糊逻辑理论进行最长90天的预测。新方法充分利用了两个模型的自身优势,从而得到了准确度更高的预测结果。模型的改进方向是讨论在不同的情境中,如何确定模糊隶属度以及判断模糊关系的阶数。进一步地,我们考虑将此模型应用到股票市场中,进行股票行情预测分析。②根据时间先后对训练数据建立模糊关系集合;③由②中所有的模糊关系求得模糊关系矩阵;式中:,称为p阶自回归系数多项式。,称为q阶移动平均系数多项式。(1)定义论域U。找到合适的性能(5)预测结果根据表5模糊关系,预测后件所属的论域子区间:(A2,A2A2)→?设定阈值为2:统计匹配成功的模糊关系后件分布如下:据公式(9)去模糊化,得到预测结果为:同样方法预测74,75,76期AR(4)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论