高频金融时间序列模型化研究综述_第1页
高频金融时间序列模型化研究综述_第2页
高频金融时间序列模型化研究综述_第3页
高频金融时间序列模型化研究综述_第4页
高频金融时间序列模型化研究综述_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高频金融时间序列模型化研究综述

1高频数据与非高频金融时间序列信息技术的发展提高了数据采集和处理方法的进步。除了从年、月、周、日收集的金融数据外,人们变得越来越容易获得在较小的时间间隔内(例如,小时、分钟、秒等)获得的观测数据。通常,从小时、分钟或秒中收集的数据称为高频数据,而在流程中实时交易的数据称为高频数据。这些数据的获取对于研究市场的微观结构和运行机制具有重要的理论和实践意义。一般来说,基于分散采集数据序列的信息将不可避免地导致信息损失。数据频率越低,相关信息的损失越多。因此,高频数据比低频数据更多地包括市场微观结构和太阳现象信息。在金融低频时间序列的波动性度量研究领域,ARCH模型及其扩展形式和随机波动(SV)模型及其扩展形式是两类非常成功的方法.而研究结果表明它们并不适合直接用于高频金融时间序列的建模.例如,金融时间序列的波动率的驱动因素是GARCH等计量模型难以揭示的,而通过对高频数据的分析,人们发现许多市场的微观结构因素和一些交易者的行为因素才是使价格产生波动的真正原因,如实时交易的不等间隔、交易规则和指令流等.这些发现无疑具有重要的研究价值.考虑到高频数据和超高频金融数据之间在模型分析上质的区别,下面我们将把它们分开讨论.2高频交易时长数据的时序特征(超)高频金融时间序列的生成以及采集机制决定了其独有的特征,主要包括以下4个方面:1)超高频的交易的时间记录间隔往往不是均等的.金融市场的交易是在随机的时点上进行的,因而间隔不是均等的.建立在等时间间隔观测基础上的传统计量经济模型(如ARCH模型和SV模型)将无法精确描述这种非等间隔的时间序列的性质.而非等间隔时序也突出了交易之间的持续时间的重要性.2)交易记录时间的不一致性.随着交易记录的时间刻度的精确化和机械化,同一时间的交易可能会因为交易系统或数据传输的原因在不同时刻发布并记录;而不同时刻的交易则有可能在同一时刻被合并发布,高频数据的时间间隔的随机性因而增加.3)离散取值.在时间刻度趋于连续化的高频数据记录中,因为交易机制的原因,所记录的价格数据却是离散观测值,如中国沪深股市的最小价格变动单位是分,美国NYSE股价变动最小单位是1/8美元.4)海量数据.高频数据的记录中,在交易活跃的时段会有多笔交易同时发生,它们往往伴随着不同的价格变化,而以秒、分来计量的交易时间则显著的延长了时间序列的长度.除拥有与日度、周度或者月度等低频金融时间序列相似的特征如厚尾、非正态、波动率聚集等之外,高频金融时间序列也表现出一些典型的统计特征,主要表现如下:1)“日历效应”(CalendarEffects).在成熟市场中,波动率、交易量、买卖价差、交易频率等金融指标在一个交易日内表现出稳定的、周期性的U型运动模式,即一天中早上、下午开市、闭市时高,中午时间低.2)时间序列峰度递增性.Anderson和Bollerslev在1998年发现随着数据频率的增加,时间序列的峰度也随之增加,当数据频率取到分钟数据时,峰度就已超过100.3)价格序列一阶负相关性.Low和Muthuswamy在1996年用5分钟频率的数据验证序列的负相关性,并进一步证明了这种相关性具有非线性的特征.4)波动率具有杠杆效应.正收益对波动率的影响弱于负收益的影响.5)波动率的斜偏性.Anderson等在2001年通过研究DowJones股票日收益波动率和相关系数时发现:已实现的波动率和协方差的非条件分布高度右偏,已实现波动率和相关系数呈现很强的时间依赖性并有移动到一起的趋势.6)收益率波动与平均交易量具有正相关性.Xu等在1999年研究表明:收益波动率与平均交易量的正相关性在交易活跃的股票上表现得很突出.3高数据建模研究方法在高频金融时间序列的研究领域中,形成了许多处理高频数据的分析模型,其中几类模型由于其代表性而成为该领域研究的重点.3.1基于fff回归模型的评估除Dacorogna等在1994年提出的时间变换模型(TimeDeformationModels)和Beltratti与Morana在1998年提出了的随机波动率模型(SV模型)外,在日历性模型中影响最大的要属Anderson和Bollerslev的一系列工作.他们1994年提出了用一种FFF回归建模框架(FourierFlexibleFormRegressionFramework),在这种框架下估计量假设没有方差,从而可以在二步法分析中得到真实的波动率值.为改进二步分析法对估计量的方差的敏感性,他们于1998年进一步修正和拓展了此估计方法.Bai等人则在2000年拓展了他们的结果去研究在高频数据波动率估计的依存性和非正态性问题.Ann等人在2001年利用此方法实证分析了香港证券市场,取得了不错的效果.3.2高频金融时间序列的模拟ARCH类模型在低频时间序列分析中的表现优良,人们很自然的考虑如何将其移植到高频数据建模中来.虽然此研究的效果还有待提高,但是依然有一些很具影响的结论和模型.它们大致可以分为两大类,一类是异质ARCH模型(HARCH);一类则是弱GARCH模型(WeaklyGARCH).针对高频数据的两个基本特征,即波动的长记忆性(绝对值收益的相关系数呈双曲线形下降)和非对称性,Müller和Dacorogna等在1997年提出了HARCH模型(HeterogeneousARCH).HARCH模型中,条件方差是过去不同期限长度的收益率的平方和,而GARCH模型是HARCH模型的一种特殊形式.此外,他们在HARCH模型基础上建立了EMA-HARCH模型(ExponentialMovingAverageHARCH),此模型可以更好的刻画波动率的长记忆性.由ARCH模型扩展出的另一类研究高频金融时间序列的模型是弱GARCH模型,其由Drost和Nijman在1993年提出.对不同频率的数据,不管是流量,还是存量,弱GARCH模型的参数之间需满足一定解析关系,即在时间聚合(Temporalaggregation)下是封闭的.Drost和Werker在1996年讨论了连续时间GARCH模型与弱GARCH模型的联系.弱GARCH模型建立了低频时间序列和高频时间序列之间的解析关系,其参数封闭性的结论可以作为评价模型适合性的一个标准.3.3应用一致性的理想统计在非参数领域,神经网络、遗传算法、小波变换和数据挖掘中近邻分析技术等已在高频数据分析中得到一定程度的应用.这里需要特别提出的是Zhou在1998年提出F—致性的思想:经典统计学中一致性是指随样本量无限增大时,统计量所具有的一种良好的大样本性质;但如果考虑数据频率的不断细分而使得样本量无限增大,F—致性是指统计量的性质不会随着数据频率的变化而改变.4acd模型及其祖先研究中的数据延伸4.1模型构建和检验记录每笔交易的数据就是所谓的超高频(UltraHighFrequency)时间序列.超高频数据的时间间隔是随机的,针对这一点,Engle和Rusell在1994年的一篇WorkingPaper中对下一笔交易到达时间的条件分布建立了ACD模型(AutoregressiveConditionalDurationModel)的雏形形式.他们在1998年正式提出ACD模型.ACD模型的核心思想是用随机标值点过程(MarkedStochasticPointProcess)去刻画交易过程.不同的标值点过程得到不同的ACD模型.在实证方面:Engle和Russell在1997年利用ACD模型对外汇报价变化的频率进行了成功的研究.在金融研究中使用的久期序列通常有价格久期和交易久期.价格久期指的是市场上交易品种的价格发生变动的时间间隔,交易久期是指两笔连续发生交易的时间间隔.受交易费用的影响,我们更关注价格久期.前后两次价格变化超过某一阀值,就定义为一个标记事件,把相邻两次事件的时间间隔定义为价格久期,即前后两次价格变化超过该阀值,即|Pi-Pj|≥c所需的时间.通常情况下,价格久期越小,价格变动越频繁,市场波动越剧烈.价格久期序列存在着显著的“日内效应”,即在日内呈现出周期性的走势.为防止日内效应对模型性数据分析产生负面影响,在建模分析之前一般剔除“日内效应”.“日内效应”是时间的函数,可以采用以时间为自变量的线性样条函数(LinearSplineFunction)来描述它.用原始的久期序列除以样条插值拟合而来的久期序列,得到剔除了日内效应的久期序列.而价格变动时间间隔往往存在着“聚类性”,即短的时间间隔后面也往往跟随着短的时间间隔,而长的时间间隔后面往往会出现长的时间间隔,这与低频数据的聚类性相似.对时间间隔相关性进行研究可以检验是否存在聚类性,即如果时间间隔表现出显著的相关性,那么它往往存在聚类性.我们也可以对剔除日内效应的久期建立ACD模型,通过观察模型中的估计系数来判断时间间隔是否具有聚类性.ACD模型与GARCH模型具有相似的结构特征.GARCH模型主要描述波动的聚类性,ACD模型则主要描述交易或价格持续时间的聚类性.GARCH模型是对回报方差的自回归过程,而ACD模型是对久期的自回归过程.ACD模型能够对金融产品交易过程中的久期进行衡量,也可以作为进一步研究波动性密度特征的基础.设{xi}为剔除日内效应后的价格久期序列,ACD模型把久期表示为:其中ψi=E(xi|Ii-1),Ii-1为ti-1时刻的信息集,过去的信息全部通过ψi影响现在的久期.ACD(p,q)形式如下:其中ω>0,αj≥0,βj≥0,<1.4.2模型构建及残差聚合分析一般情况下,当{εi}假设独立同分布并服从某特定分布的时候,ACD模型称之为强型ACD模型.此时历史信息以条件均值ψi的形式进入久期,xi的波动被ψi完全捕捉到.然而,当{εi}独立同分布的假设过强并难以捕捉久期的变化时,则假设{εi-1}是一个鞅差序列,此时的ACD模型被称之为弱型ACD模型.如同GARCH(1,1)模型可以很好地描述大多数金融数据一样,ACD(1,1)可以很好地拟合原始数据.为此,人们往往采用简单有效的ACD(1,1)模型来实证研究.在诸多ACD模型中,线性ACD是最基础的模型,不过它存在两方面的缺陷.首先,线性的条件期望函数对参数有限制,即必须确保模型不会预测到负的久期,这一条件要求系数必须为正;其次,基于最近久期的条件期望值的调整过程,可能用非线性形式来建模相对更合适.于是,在强型ACD模型族中有了相对更具弹性的非线性ACD模型,如对数ACD模型、BOX-COXACD模型,指数ACD模型等.一般,ψi是过去久期及其条件期望的函数,根据函数形式的不同,分为:1)Engle和Russell在1998年提出的线性ACD模型约束条件:ω>0,α≥0,β≥0,α+β<1.最后一个条件保证了价格久期的非条件均值的存在性和过程的平稳性,其他条件则保证价格久期的条件期望为正.2)Bauwens和Giot在2000年提出的对数ACD模型避免了线性ACD模型隐含的参数约束,更加方便合理,同时为了检验市场微观结构效应,还可以方便的加入其它外生的条件变量.3)Dufour和Engle在2000年提出的BOX-COXACD模型也是一种非线性模型,在δ→0时,BOX-COXACD模型就退化为对数ACD模型.4)Dufour和Engle在2000年提出的指数ACD模型也是一种非线性模型,可以描述非对称效应,若,则此时模型中斜率是α+δ,截距是ω-δ.若,则此时模型中斜率是α-δ,截距是ω+δ.关于残差εi的分布,同GARCH模型中的正态分布一样,指数分布是ACD模型的研究起点,复杂些的还有常见的威布尔分布(Weibull)、Lunde在2000年引入的广义伽马分布,和Gramming与Maurer于同年引入的更为复杂的布尔分布(Burr).不同的分布假设拓展了模型的适用性.1)标准指数分布(E)指数分布的生存函数(S(x)=P(X>x)是常数.2)威布尔分布(W)其中γ>0威布尔分布的生存函数是单调的.当γ=1时,威布尔分布就退化为指数分布.γ<1时,生存函数是递增的,表示更可能表现出较短的久期值,当γ>1时,生存函数是递减的,则表示更可能表现出较长的久期值.威布尔分布可以更好的描述出现较短和较长久期出现的可能性.3)广义伽马分布(G)其中γ,λ>0当λ=1时,广义伽马分布就退化为威布尔分布,当γ=λ=1时,广义伽马分布就退化为指数分布.当λγ<1,γ>1时,生存函数为U型,表示交易不很活跃.当λγ>1,γ<1时,生存函数为倒U型,表示交易很活跃.4)布尔分布(B)Burr分布可以由Gamma分布和Weibull分布的混合分布导出.指数分布、Weibull分布可以视为Burr分布的极限分布.ACD模型可以采用极大化似然函数的方法来估计参数,其数值算法可采用Berndt等人在1974年提出的BHHH算法.对模型的残差进行诊断检验,可以检验各ACD模型是否较好地捕捉久期的动态性和分布特征及其预测效果.Engle和Russell在1998年指出,ACD模型捕捉数据自回归结构的程度可以通过考察标准残差εi=xi/ψi其自相关的程度来确定:由于残差是模型无法预测的,所以如果它是白噪声,则表明该ACD模型对久期自回归结构的描述正确.而这可以利用Ljung-Box的Q统计量来检验“标准化”久期εi=xi/ψi的自相关性,若无法拒绝前k阶自相关系数都为0的原假设,则说明该ACD模型很好地解释了价格久期的聚集效应.4.3门限变量zi-1,rj的形式弱型ACD模型则放宽了强型ACD模型的分布函数的限制条件,使得许多ACD模型更具适用性,其中,应用最为广泛、发展最为完备的弱型ACD模型为门限ACD模型和Markov变换ACD模型.1)门限ACD模型(TACD模型)Zhang,Russell和Tsay在2001年提出了TACD模型,它允许ψi序列是非线性的.TACD模型作为线性ACD模型的推广,它允许在时间序列的不同子时期内久期的条件均值方程不相同并具有不同形式的分布.TACD(p,q)的形式如下:设xi为调整后的久期,定义Rj=[rj-1,rj),j=1,…,J,其中-∞=r0<r1<…<rJ=∞表示门限值,如果门限变量Zi-d∈Rj,则有:其中,为独立同分布的序列,它们在不同的时间区间上可以服从不同的分布形式,门限变量为Zi=h(xi,…,xj;Yi,…,Yj),{Yj}为相关经济变量组成的向量.2)Markov变换ACD模型(MSACD模型)Hujer等在2002年提出了MSACD(MarkovSwitchingACD)模型.该模型久期序列xi依赖于某个潜在的服从Markov过程的随机变量Si.该模型和Hamilton在1989年推广的Markov变换自回归模型(MarkovSwitchingAutoregressiveRegressionModels)相似,它包括了很多已有的ACD模型.以两阶段MSACD为例:Si=1是第一阶段,Si=2是第二阶段.随机变量Si的引入对了解市场的微观结构有一定的帮助.为避免ψi的条件均值由于序列相关性带来的计算复杂性,可采用Gray在1996年提出的方法,将ψi在各个阶段的条件期望根据其在该状态的条件概率来平均,即:其中P(Si=j|Ii

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论