基于分形市场的认股权证定价分析及基于快速傅立叶变换的动态时间序列在线查询算法_第1页
基于分形市场的认股权证定价分析及基于快速傅立叶变换的动态时间序列在线查询算法_第2页
基于分形市场的认股权证定价分析及基于快速傅立叶变换的动态时间序列在线查询算法_第3页
基于分形市场的认股权证定价分析及基于快速傅立叶变换的动态时间序列在线查询算法_第4页
基于分形市场的认股权证定价分析及基于快速傅立叶变换的动态时间序列在线查询算法_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于分形市场的认股权证定价分析摘要:传统的Black-Scholes期权定价模型没能考虑权证执行的“稀释效应”以及“红利分配”问题,修正的模型虽然解决了这两个问题,但仍然建立在市场有效性的假设基础之上,而分形市场中的分数布朗运动定价模型合理的解决了这些问题。本文以武钢认股权证(WISCO)为例,对认股权证的定价进行实证探索,并对权证的理论价格与实际价格以及标的证券——武钢股价的走势进行对比研究,指出了认股权证市场价格的不合理性和存在的获利机会。关键词:认股权证;Black-Scholes模型;权证定价;分形市场

WarrantPricingBasedonFractalMarketAbstract:TraditionalBlack-Scholesoptionpricingmodeldidnotconsiderthe"dilutioneffect"and"dividenddistribution"intheimplementationofwarrants,althoughthemodifiedmodelmanagedtoresolvethesetwoissues,itisstillbasedontheefficientmarkethypothesis.FractalmarketandthefractionalBrownianmotionpricingmodelreasonablyresolvetheseproblems.Inthispaper,wetaketheexampleofwarrantsfromWISCO,makeempiricalexplorationonwarrantspricing,analyzethetheoreticalpriceandactualpriceofwarrants,andcomparethemwiththesharepricesoftargetedsecurity-WGGF,asaconclusion,wepointoutthatthepresentmarketpriceofwarrantsareunreasonable,thereexistspotentialforprofits.Keywords:Warrants;Black-Scholesmodel;warrantspricing;FractionalBrownianmotion

导论认股权证的设计和投资中,它的正确定价是一个核心问题,而作为投资者,清醒认识认股权证投资中蕴含的风险是至关重要的。在1973年Black-Scholes期权定价公式提出后,认股权证的定价研究进入了一个鼎盛时期。Galai,Schneller(1978)在有效资本市场的假定下,通过单期和多期的分析框架,提出了考虑流通股稀释效应的认股权证定价模型,并考察了权证发行对公司价值的影响。国内学者大多采用这一模型对认股权证的定价进行实证分析。周延(1998)通过对B-S模型的分析,推导出了考虑股本稀释效应的认股权证定价公式。傅世昌(2004)在股本稀释的B-S模型基础上,提出了任何时刻可执行且执行价格为时间函数的认股权证定价模型。Black-Scholes模型建立在有效市场假设(EMH)之上,但是,对股票市场的大量实证研究都表明股票市场价格并不符合正态分布,存在“尖峰肥尾”的特征,而且股价存在长期相关性,并不是随机游走的。1994年,Peters提出了分形市场假说,它强调信息和投资起点对投资者行为的影响,并应用R/S分析法证明了不同资本市场都存在着分形结构和非周期循环。国内部分学者针对分形市场也作了实证研究。徐龙炳、陆蓉(1999)对沪深两市进行了R/S分析;张维、黄兴(2001)采用更长的采样区间、分析了沪深股市的日、周收益率,从而论证了市场存在非线性结构;刘韶跃和杨向群(2002、2004)对分数布朗运动环境下标的资产有红利支付的欧式期权定价进行了探讨;周孝华(2002)通过分析布朗运动与分形布朗运动,提出了分形维纳过程的概念并利用它推导出不付红利的股票价格遵循含有分形维纳过程的微分方程。唐斌、李虹蓉(2006)将分数布朗运动定价模型应用于权证分析,利用一些可观察的数据来对公司权益价值及波动率这两个不可观察的变量进行估计,证明其结果比以往的模型更为合理。本文首先对几种权证定价模型进行了阐述,着重对分形市场中的分数布朗运动定价模型进行分析,然后利用模型对每个交易日的武钢蝶式权证进行定价分析,得出中国权证市场上存在的一些特征。认股权证的定价模型一、考虑稀释效应与红利分配的Black-Scholes模型由于认股权证本质上就是一种期权,所以很多学者直接利用Black-Scholes期权定价公式:(1),计算权证的价格。Hull(2003)在传统的Black-Scholes期权公式基础之上,针对认股权证执行后产生的“稀释效应”对公式进行了调整。考虑一个有股流通股股票的公司,现在发行数量是份的欧式认股权证,行权价格为,行权比例为,到期期限是,股票在整个期限内不支付红利。假设认股权证的价格是。如果在T时刻认股权证的持有者执行了认股权证,该公司获得了数额为的现金流入,公司股权价值增长到,而总股本变成,因此认股权证执行后的瞬间股票价格变成:因此每份认股权证的损益函数为:相比于传统的Black-Scholes期权定价公式,可以看出考虑“稀释效应”认股权证的价值就是份基于的欧式股票看涨期权的价值。由此得到不支付红利的欧式认股权证价格的定价模型:(2)r为无风险利率,表示股票价格的波动率,为标准正态分布的累计分布函数。对于支付红利的情况,只是将股价S减去每期红利的现值,以表示距每比红利发放的时间跨度,表示每期支付的红利。此时(2)式转化为:(3)其中:Hull(2003)的权证定价模型虽然考虑了“稀释效应”,但运用这一模型时,为了定价的方便,一般用股票的价格及其波动率来近似替代公司的权益价值V及波动率,这两个变量是不可观察的。因此这样得出的权证价格已经背离了原模型。二、分形市场中分数布朗运动的定价模型假定金融资产的价格变动服从分数布朗运动,而不是标准的几何布朗运动。Hurst参数为H的分数布朗运动是一个连续的Gaussian过程:,且有:。当1>H>0.5时,具有长期依赖性,存在“记忆效应”,过去与现在呈现正相关关系,H值越接近于1,过去的序列走势对将来的影响越大。参数H可由Hurst(1951)提出的重标极差分析法获得(RescaledRangeAnalysis,R/S)。徐龙炳、陆蓉(1999)对沪深两市进行了R/S分析,其Hurst指数分别为0.661和0.643,周期为195天。叶中行、曹奕剑(1998)对几只个股的Hurst指数做了计算,其中武钢股份为0.5584。CiprianNecula利用傅立叶变换方法推导出分数布朗运动下的Black-Scholes模型,其公式如下:(4)其中:相比于传统的B-S公式,主要是通过Hurst指数对期权的持续期做了相应的调整。从公式易看出,若H=0.5,即为标准布朗运动。由于不同Hurst指数对应的权证价格也不同,因此,为了正确地定价权证,必须在分形市场中考虑标的股票的分形结构。结合Ukhov,AndreyD.(2004)可观察数据的权证定价模型和分形市场中的分数布朗运动,唐斌、李虹蓉(2006)提出了一个改进的权证定价模型。是公司的权益价值,N仍是流通总股本。用来取代,则认购权证的价格即为份基于的看涨期权的价格。再结合公式(4),得出分数布朗运动下的权证定价模型为:(5)其中:由于公司权益价值与股票、权证之间存在着如下关系:,可知公司权益价值的波动率是权证和股价波动率的加权平均。因此,公司权益价值的波动率与股价的波动率之间存在着以下关系(Ukhov,AndreyD.,2004):其中,S表示当公司权益价值变化一个单位时,股票价格的变化量。公司权益价值、权证与股票价格有关系:,所以结合(5)式,可得到:由以上两式得:。因此,公司权益价值V与权益价值的波动率,可从如下方程组中解出:(6)其中:从而得到t时刻的认购权证价格为:。对于支付红利的情况只需在方程组(6)的基础上将每股权益价值减去每期红利的现值即可。武钢权证定价的实证分析一、武钢蝶式认股权证简介表1武钢认股权证的基本信息证券代码武钢JTB1武钢JTP1权证类型认购权证认沽权证原行权价2.93.13新行权价(分红后)2.622.83发行数量47400万份行权方式欧式行权比例1结算方式证券给付(实物)存续期间05-11-23至06-11-22行权期间06-11-16至06-11-22武钢认股权证是由认购权证和武钢认沽权证组合而成的蝶式权证,认股权证其实是一种期权,武钢的认股权证的其实两种期权的宽跨式组合。组合的损益图类似一个“聚宝盆”。武钢认购权证和认沽权证都是欧式期权(表1),我们将采用以上定价模型对武钢认股权证进行定价分析。武钢股份的Hurst指数采用叶中行、曹奕剑(1998)[9]所做的计算为0.5584。无风险利率(r)为2.25%。股票价格的年波动率采用武钢股份2005年至2006年的交易数据计算。根据法则由武钢股价日波动率求得年波动率:其中:为武钢股份每日收盘值;n为交易天数;=240(一年交易日的天数),为日波动率。。二、模型定价的结果分析利用MATLAB编程,求得三种认购权证定价公式(1)、(3)、(6)及相应的认沽权证的定价公式的数值解,即为武钢蝶式认股权证在每一个交易日的理论价格。图1认购权证实际价格与理论价格对比图2认沽权证实际价格与理论价格对比图3武钢股价与认购权证价格的对比图4武钢股价与认沽权证价格的对比我们用Ci(i=0、1、2、3)表示认购权证的价格,Pi(i=0、1、2、3)表示认沽权证的价格。分别表示为认股权证的实际价格、Black-Scholes模型求得的理论价格、修正的Black-Scholes模型求得的理论价格以及基于分形市场的分数布朗运动定价模型下的理论价格。对比标的资产的价格、权证实际价格以及理论价格,会发现权证市场几个特征:1.武钢认股权证的价值被严重高估,随到期日临近而逼近理论价值(图1、2)2005年11月23日,武钢认股权证的开盘价格就已经远远高于其理论价值,出现了明显的价值高估。这反映了市场中投机现象非常严重;同时也反映了权证交易中蕴含了巨大的风险。因为期权的价值包括内在价值与时间价值,在内在价值一定的前提下,出现较大高沽的原因就主要表现在人们放大了认购权证的时间价值,因此随着行权日的临近必然会出现价值回归。此时,在缺乏“做空机制”的权证市场,高位进入的投资者无疑将面临极大的风险。2.相比于武钢股份股票价格的走势认沽权证的价格背离其真实价值走势(图3、4)认沽权证作为一种看跌期权,其价值应当与标的证券的价格走势相反,因为股价越高,行权的获利就越小,但是武钢认沽权证的实际价格却没能反映这种关系,出现“价格逆反现象”。认购权证与标的证券的价格走势基本是一致的。3.认购权证实际价格在面临标的证券价格的较大变化时出现反应过度问题具体来说是在2006年分红前的一个月内,面对武钢股份(600005)股价的快速上扬,C0抬升的比例比C3更大,直到到期日的前几个交易日才因为价值回归,使得实际价格与理论价格吻合起来。这也是投资者非理性的一种表现。4.在低“稀释效应”和“红利分配”的条件下,可以近似地用股票波动率来替代公司权益价值的波动率,也可以不考虑红利的分配问题。这主要体现在三种定价模型的差异性不是很大,其中使用修正的Black-Scholes模型的价格要低于传统的模型。我们还可以发现用这种方法求得的结果表现出较大的波动性。和股票期权一样,认股权证是一种以小博大的金融工具,对投资者很有吸引力。根据上面的分析,价格高估、反应过度、价格逆反现象等的存在已经证明中国认股权证市场是无效的,投资者完全可以在市场上进行投机获利。但是投资者还要学会如何控制认股权证的价格风险。“做空机制”的不完善,容易造成暴涨暴跌的局面。所以,投资者一定要警惕权证市场上的巨大风险。

结论利用传统的B-S模型、修正的B-S模型以及分数布朗运动的定价模型对武钢蝶式认股权证的定价后,结合标的证券(武钢股份)价格、权证理论价格与实际价格的在走势,进行对比分析,得到以下结论。第一,在对认股权证进行定价时,要综合考虑“稀释效应”和“红利分配”以及市场的有效性问题。根据发行权证的具体情况采用适当的模型来对它进行估算,否则会使投资决策中的定价分析产生较大误差。第二,我国权证市场的效率是比较低下的,实际价格与理论价格存在一个高估差额,甚至长期出现认购权证与认沽权证同涨同跌的怪异现象,充分反映了中国投资者的非理性。这与长期以来人们只注重投机不注重“投资”有很大的关系。第三,应及时引进权证市场的做空机制。高估价差的存在,主要原因是中国资本市场做空机制缺乏。做空机制在成熟的资本市场上,往往被认为是市场良性健康的保证。即将推出的股指期货无疑是发展中国资本市场做空机制的重要举措。第四,要加大对认股权证相关产品知识面推广,着重对定价与风险因素进行说明,并加快推进认股权证的多样化方案。认股权证作为一种金融衍生品,对于大部分中小投资者而言比较陌生。在武钢权证的行权日过后,居然出现了权证持有者忘记行权的情况,导致权证变的一文不值,蒙受重大损失。

参考文献:[1]LauterbachB.andP.Schultz(1990)Pricingwarrants:AnempiricalstudyoftheBlack-Scholesmodelanditsalternatives[J].JournalofFinance,(45):1181-1209.[2]LongstaffE.(1990)Pricingoptionswithextendiblematurities:Analysisandapplications[J].JournalofFinance.(45):935-957.[3]Lauterbach,BeniandPaulSchultz,(1990)PricingWarrants:AnEmpiricalStudyoftheBlack-ScholesModelandItsAlternatives,JournalofFinance,Vol.65,4/9:1181–1209[4]Ukhov,AndreyD.(2004)WarrantPricingUsingObservableVariables.TheJournalofFinancialResearch,27(3),329-339.[5]傅世昌.变执行价格认股权证定价研究[J].云南财贸学院学报,2004.(5).[6]刘韶跃,杨向群.分数布朗运动环境中标的资产有红利支付的欧式期权定价[J].经济数学,2002,19,(4)[7]孙浩中.认股权证投资风险分析:以宝钢权证为例[J].南方金融,2006,(1).[8]唐斌,李虹蓉.分形市场中的股本认股权证定价研究,工作论文,2006.[9]叶中行,曹奕剑.Hurst指数在股票市场有效性分析中的应用[J].上海交通大学学报,1998.32,(3).[10]张维,黄兴.沪深股市的R/S实证分析[J].系统工程,2001,Vol.19,No.1,pp1-5.49.基于快速傅立叶变换的动态时间序列在线查询算法摘要:针对时间序列实时分析的需要,给出了一种动态序列的在线相似性查询算法。该算法利用改进的欧氏距离作为模式的相似度量方式,然后利用快速傅立叶变换,实现动态序列与各指定模式的批处理相似性计算。为了缩短在批处理的等待时间,再利用预测模型对未来的值进行预测,通过比较预测序列与特定模式之间的相似性,来实现在线查询的快速响应。模拟实验结果显示,该算法在一定程度上解决了在线查询的准确性与时效性。关键词:动态时间序列数据挖掘快速傅里叶变换相似性查询SimilarSearchAlgorithmofOnlineStreamingTimeSeriesBasedonFastFourierTransformAbstract:Analgorithmononlinesimilarsearchinastreamingtimeseriesisproposed.ThisalgorithmusesimprovedEuclideanDistanceassimilarmeasurement,andthenevaluatesthesimilardistancebetweensteamtimeseriesandfeaturetimeseriesinabatchmodeusingFastFourierTransform.Inordertoshortenwaittime,predictionmodelsareusedtopredictfeaturevalue,andaccomplishfastresponsebycomparisonthesimilaritybetweenpredictionseriesandfeatureseries.Simulationresultsshowthattheproposedalgorithmcanefficientlysolvetheonlinesimilarsearch.Keywords:streamingtimeseries,datamining,fastfouriertransform,searchbasedsimilarity

1引言时间序列相似性查询是时间序列的一个重要分析方法,目的在于从时间序列库中找出与给定查询序列最接近的数据序列[[]ChotiratAnnRatanamahatana,JessicaLin,DimitriosGunopulosetc.,MiningTimeSeriesData,DataMiningandKnowledgeDiscoveryHandbook[]ChotiratAnnRatanamahatana,JessicaLin,DimitriosGunopulosetc.,MiningTimeSeriesData,DataMiningandKnowledgeDiscoveryHandbook2010,Part6,1049-1077图1动态时间序列在线相似性查询对于动态序列的相似性在线查询而言,查询效率是在线查询优先要解决的问题。注意到由于动态序列的长度是不断地增加,因此其不能像静态序列那样可以构造固定的索引结构来提高查询的效率。动态在线查询的工作最早见于Terry和Goldberg等人在1992年对数据库的查询[[]D.Terry.D.Goldberg,D.NicholsandB.Oki.Continuousqueriesoverappend-onlydatabases.InProc.oftheACMSIGMODConf.OnManagementofData,pages321-330,1992.],这种在线查询模式一旦提交,就会在整个数据库中不断地执行下去。Chen等人把动态在线查询技术运用到项目NiagraCQ中[[]J.Chen,D.J.Dewitt,F.TianandY.Wang.NiagaraCQ:ascalablecontinuousquerysystemforInternetdatabases.InProc.oftheACM.SIGMODConference,pages379-390,2000.],这种在线查询不在仅限于增量式的数据源。Wang和Gao则把相似性查询运用到流式序列上来,提出了一种带预测值的在线查询算法[[[]D.Terry.D.Goldberg,D.NicholsandB.Oki.Continuousqueriesoverappend-onlydatabases.InProc.oftheACMSIGMODConf.OnManagementofData,pages321-330,1992.[]J.Chen,D.J.Dewitt,F.TianandY.Wang.NiagaraCQ:ascalablecontinuousquerysystemforInternetdatabases.InProc.oftheACM.SIGMODConference,pages379-390,2000.[]LikeGao,X.SeanWangContinuallyEvaluatingSimilarityBasedPatternQueriesonaStreamingTimeSeriesInSIGMODConference,2002.为此,本文提出一种基于规范化的欧氏距离度量。这种相似度量比传统的Euclidean相似性距离度量在振幅上的适应性要强,同时在计算时间上却不会有太大的增加。然后在此基础上,利用快速傅立叶变换对动态序列与各个模式序列之间的距离采用批处理方式进行相似性距离计算。同时为了减少批处理的等待时间,本文还引入了预测模型来提高批处理的效率,从而减少了查询的响应时间。2基本概念和算法2.1动态序列上的在线查询设两时间序列的长度为,那么它们之间的Euclidean距离为:该度量方式虽然可以作为相似度量方式,但是其只能适应幅度取值相似的的情况,对于幅度变化较大,但是变化趋势相似的序列却不能有效地适应。如考虑序列x1=(8,10,8,12,8,6,7,8,9,10,8,7),x2=(10,9,7,6,8,10,7,9,8,7,8,7,8,),x3=(13,15,18,16,19,16,13,15,17,18,19,15,14),分别见图2中(a)(b)(c)。其中D(x1,x2)=2.23,D(x1,x3)=7.81,这样可能会得出这样的结论x2比x3更相似于x1,但实际上应该是x1与x3更相似。图2三个时间序列但是分别对x1,x2,x3做均值规范化后,即对应的序列分别减去它们的均值(分别为8.23,8,16),然后再计算它们的距离有,D’(x1,x2)=2,D’(x1,x3)=0.7994,从而得出x3比x2更相似于x1的正确结果。由此有必要对序列进行规范化,利用其均值来实现规范化的度量相似性距离。定义1(规范化的距离)给定两个长度为的序列,它们的规范化距离可以定义如下:其中Mx,My是序列的均值。在本文中,假定长度固定的序列称为模式序列,记为Fi,其长度为Li+1,一个实时系统中含有多个这样的模式序列。称长度无限大的序列为动态序列,记为IS。在某个时刻p,p≥0,其长度为p+1。所谓在线查询就是要在每个时刻p,在IS中查询哪些模式序列Fi与其是最相似或比较相似。定义2(序列间的距离)设Fi是在数据库中的一些模式序列,其长度为li+1,对于给定的某个时刻p,IS与模式序列Fi在p时刻的距离定义为D(IS[p-li,p],Fi)。如果p<li,则令距离为无穷大。定义3(最接近和范围序列)设p≥0是一个整数,给定一个实数,称Fi是在时刻p上距离最接近的模式序列,如果对于其它模式序列Fj(j≠i),有D(IS[p-li,p],Fi)<D(IS[p-lj,p],Fj);称Fi与IS在p时刻是基于h范围内接近的模式序列,如果有D(IS[p-li,p],Fi)≤h。定义4(两种查询类型)一个在动态序列上的在线查询就是指以下命题:1)在每个时刻p,发现与IS距离最接近的模式序列;2)在每个时刻p,发现与IS的相似距离是小于范围h的模式序列,h是一个大于0实数,是一个阈值。为了研究的方便,要求p≥max{li|Fi},模式Fi的长度为li+1。2.2批处理计算对于处理在线查询,最原始的方法就是在每个时刻p,分别计算IS与Fi之间的距离。显然这样单个序列处理的计算量是非常大,其查询响应时间很难满足用户的需要。为此,将考虑其他方法来处理对不同序列进行距离计算。考虑D(IS[p-li,p],Fi)的定义,有:(1)其中MIS是序列IS[p-li,p]的移动平均值,MFi是Fi的平均值。与是随着时间变量推移而增加的,因此有关这些项可以通过前一个位置的值增量式地获得计算结果;和等没有时间变量的项,它们是可以提前计算出来;与是关于移动平均项,它们也可以采用增量式计算的方法获得;而关于最后一项,对于乘数IS[p-li+s],其将时间变量p向前移一时刻变成p+1时,尽管Fi[s]却保持不变,但其仍然要分别和IS[p-li+s]的每个时刻数据要计算它们的乘积。这个计算也是最耗时间的,而且当前乘积的和与上一次计算的结果却没有什么直接关系。因此如何能快速地计算该项结果就成为在线相似性计算的关键。注意到,中的数据项类似于IS和Fi之间的相关系数计算。而对于它,则可以采用快速傅立叶变换来快速计算上述结果。定义5(相关函数)给定无限序列x和长度为l+1的有限序列y,那么它们之间的协相关函数为:其中,d是x和y之间的位移数,也称延迟参数。从上面式子可看出,只有x[d],x[d+1],...,x[d+l]参与了x和y在延迟d上的协相关函数计算。因此,结合(1)其最后一项可以写为。定义6(傅立叶变换与反傅立叶变换)设x和X是两个长度为N+1的时间序列,则有,其中X是x具有(N+1)点的傅立叶变换,x是X具有(N+1)点的反傅立叶变换。定义7(循环协相关序列)设x和X是两个长度为N+1的时间序列,则表示非规范化的循环协相关序列,其可定义为:定理1(循环相关性定理)设x,X,y和Y是两个长度为N+1的时间序列,且,,则有,其中是的复共轭。根据定理1,利用傅立叶变换来获取循环相关系数。思路是:假设N=,其中k为某些正整数,先利用快速傅立叶变换计算序列的傅立叶系数,然后计算它们的乘积,最后根据结果,再利用反傅立叶变换来获取它们的循环相关系数。具体来说,给定序列,,其长度分别是N+1,首先利用FFT计算X和Y,然后生成序列<>,最后再利用反FFT获得它们的循环协相关系数。通过上述循环协相关系数,就可以快速计算动态序列IS与模式序列Fi的协相关系数。3改进的相似性在线查询上述批处理计算方法与传统顺序扫描的方法相比,可以节省大量的计算时间,然而,上述过程不能直接提高相似性查询的响应速度。因此,在这部分中,将探讨提高相似性在线查询响应速度的方法。3.1带预测值的在线查询不难发现,造成批处理计算方式响应时间慢的主要原因是它必须等足N-lmax个动态序列的值后才会进行一次批处理计算。如果选择的N使得N-lmax比较小(也就是说,批处理发起的时间间隔很短),那么该批处理计算不可能会有什么时间节省,事实上还有可能比最原始顺序扫描的方式还要耗时,因此它毕竟还有另外的一些计算开销,如傅立叶变换等。相反,若N-lmax比较大,也就是说发起批处理的时间间隔相对较长,那么其需要等待的响应时间就要很长,这很难适应实际应用在线需求。因此,在批处理等待的时间内,如果根据一些已出现的数值,可以利用一些预测模型来对未来的值进行预测,然后通过预测值来发起批处理,那么这样则大大可以提高算法的响应时间。事实上在许多实际应用中,时间序列是可以采用预测的方法来估计其未来的趋势和模式[[]L.Gyorfi,G.LugosiandG.Morvai.Asimplerandomizedalgorithmforsequentialpredictionofergodictimeseries.IEEETransactionsonInformationTheory,45(7):2642-2650,1999.][[]I.KimandS.R.Lee.Afuzzytimeseriespredictionmethodbasedonconsecutivevalues.InFuzzySystemsConferencesProceedings,Vol.2,703-707][[[]L.Gyorfi,G.LugosiandG.Morvai.Asimplerandomizedalgorithmforsequentialpredictionofergodictimeseries.IEEETransactionsonInformationTheory,45(7):2642-2650,1999.[]I.KimandS.R.Lee.Afuzzytimeseriespredictionmethodbasedonconsecutivevalues.InFuzzySystemsConferencesProceedings,Vol.2,703-707[]S.PolikerandA.Geva.Anewalgorithmfortimeseriespredictionbytemporalfuzzyclustering.InProceedings.15thInternationalConferenceonPatternRecognition,vol.2,728-731,2000[]T.V.Gestel,J.Suykens,D.E.Baestaens,.A.Lamberechts,G.Lanckriet,B.Vandaele,D.B.Moor,andJ.Vandewalle.FinancialtimeseriespredictionusingleastsquaresSuportVectorMachineswithintheevidenceframework.IEEETransactionsonNeuralNetwork,12(4):809-821,2001.利用动态序列的预测值来代替实际真实值后,同样可利用快速傅立叶变换,采用批处理方式计算动态序列与模式序列在一些未来时刻的预测相似性距离。预测的长度取决与实际应用的需要,因为通常预测长度越长,预测的准确性就越差。当实际值到来时,预测误差便可计算出。这样通过预测误差和预测相似性距离获取与动态序列距离接近的模式序列。本文称这种方法为带预测的相似性在线查询(OnlineQueryingwithPrediction),记为OQP。图3预测和批处理过程图3展示了OQP过程。假定当前考虑时刻为ps,即是说在ps-1时刻的在线查询已经完成,ps时刻的数值还没有到来。在这个时刻,利用n步向前预测方法已预测到这个时刻的值。用预测长度来表示最大的预测区间,在ps到来前,利用预测模型获得了在ps,ps+1,...,ps+n-1,的预测值。用PS表示一个包含ps-1实际值,n个预测值和一些未预测值(用0来表示)的动态序列,并称该序列为预测序列,那么此时有:对于PS,仍然可采用前面2.2的算法,按照批处理方法进行相似性距离计算。此外,算法不能在ps+n-1以后的时刻不能获得预测值,因此算法最多只能计算PS与Fi在时刻ps,ps+1,...,ps+n-1上的预测相似性距离。一旦在ps和ps+n-1之间某个时刻的实际值到来,算法可利用预测误差来查询与动态序列相似的模式序列,查询的具体过程取决于查询的类型。由定义4可知,查询类型包含两种,即最接近查询和h-范围查询。3.2最接近的相似性查询算法动态时间序列最接近的相似性在线查询,需要在每个时刻上找出与动态序列相似距离最短的模式序列。即是说,查询算法根据预测距离和预测误差来过滤掉那些与动态序列距离较远的模式序列。考虑在ps和ps+n-1之间某个时刻p,通过3.1中的算法可以获得每个模式序列Fi的预测距离D(IS[p-li,p],Fi)。此外,2.2给出的算法还可以增量式地计算预测序列PS与实际序列IS在p时刻后,长度为li+1的预测误差,即预测误差D(PS[p-li,p],IS[p-li,p])在p时刻到来之前,其所有时刻的值是已知的。根据上述预测距离和预测误差,可以得到实际动态序列与各个模式序列在时刻p上距离的最小和最大边界。事实上,利用Euclidean距离,它们存在如下三角不等式:(3)其中x=PS[p-1i,p],y=IS[p-li,p],此三角不等式的关系可以用图4来描述。图4三角不等式之间的关系注意到,不等式(3)对于每个模式序列Fi在时刻p都是成立的。为了简单起见,查询算法采用最大预测误差来估算其上边界,即令给定模式序列Fi,D(IS[p-li,p],Fi)+maxD(PSp,ISp)就是其最大边界值,Fi,D(IS[p-li,p],Fi)-maxD(PSp,ISp)就是其最小边界值。下图5给出了在p时列刻,按照预测距离D(IS[p-li,p],Fi)i=0,...,m大小递增排序,各个模式序列所获得的最小和最大边界值。图5最接近的候选序列在图5中,为了叙述简单,对模式序列重新编排下标,并按照它们与动态预测序列的相似性距离大小递增排序,记为<s0,s1,...sm>。因此有:(4)由不等式(3)可知,(4)之中的实际动态序列IS与模式序列Fi在p时刻的实际相似性距离必须也满足上述边界要求。由于算法的目的是要在p时刻找出与动态序列最接近的模式序列,而模式序列Fs0与动态序列是具有最小的预测距离,因此其在全部模式序列中具有最小的上边界距离,见图5中的minUp。3.3h范围的相似性查询算法h-范围的的相似性查询不像前面的最接近查询,其返回结果只有一个,h-范围的查询可能有0个或多个结果返回。注意到前面的不等式(3)中三角不等关系对于每个时刻p都是成立的。因此,查询算法仍然可以利用前面的最上边界和最下边界的方法。首先根据它们与预测序列PS的预测相似性距离进行递增排序,按照图6方式获得其最上边界值和最下边界值。图6h-范围查询的候选序列不像最接近查询一样,其最上边界值可用来过滤掉那些不可能是查询结果的模式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论