重标极差rs分析法估计hurst指数的有效性检验_第1页
重标极差rs分析法估计hurst指数的有效性检验_第2页
重标极差rs分析法估计hurst指数的有效性检验_第3页
重标极差rs分析法估计hurst指数的有效性检验_第4页
重标极差rs分析法估计hurst指数的有效性检验_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

- 1 -R/S 类方法估计 Hurst 指数的有效性检验 1 黄诒蓉 2 中山大学管理学院,广州 510275,中国【摘要】 本文在设定不同 H 真实值的情况下,通过 DHM 算法模拟出一系列 FGN 序列,对 CRS、MRS 和 VS 等三种 R/S 类方法估计 H 指数的有效性进行了研究。研究结果表明,CRS 受到序列长度、短期相关性处理和白噪声成分强弱的显著影响,MRS 受到序列长度和白噪声成分强弱的显著影响,而 VS 受到白噪声成分强弱的影响,并且均不具有正态分布特性,分别当 H 真实值介于 0.7 至 0.8、0.6 至 0.7 和 0 至 0.6 之间时能对 H 指数做出较好的估计,而当 H 真实值介于 0.8 至 1 之间时,R/S 类方法均低估 H 指数。关键词 Hurst 指数;经典 R/S 分析;修正 R/S 分析;V/S 分析;有效性。Testing the Efficiency of Hurst Index Estimation Based on R/S Type MethodYirong HuangSchool of Business, Sun Yat-Sen University, Guangzhou 510275, ChinaAbstract: This paper studies the efficiency of estimating Hurst index with R/S type including classical rescaled range analysis, modified rescaled range analysis and rescaled variance analysis by simulating FGN series with DHM. There are evident differences between the effects of the length of series, the type of dealing with short-rang dependence, strength of added white noise in series on three estimators, moreover, they have separate applicable interval of estimating Hurst index. Keywords: Hurst Index; Classical Rescaled Range Analysis; Modified Rescaled Range Analysis; Rescaled Variance analysis; Efficiency.1 资助项目:国家自然科学基金项目(项目名称:资本市场的分形结构及其应用研究,项目编号:70501034,项目负责人:黄诒蓉) 。2 黄诒蓉,男,1976.11,中山大学管理学院副教授、博士,通讯地址:广州市新港西路 135 号中山大学管理学院,邮编:510275,Email:,电话- 2 -1 引 言Hurst(1951) 1在长期的水文研究工作中发现,河流流量存在较强的长记忆性。后来,许多研究发现,该特性不仅存在于自然界,而且广泛存在于经济与管理领域的数据中。金融时间序列长记忆性的检测与建模目前已经成为金融计量领域研究的重要内容。长记忆性通常从具有双曲率缓慢衰减形式的自相关函数和在零频率处趋于无限值的谱密度函数等两个角度进行刻画,而且均通过Hurst 指数(下文简称 H 指数)来表征长记忆性程度。因此,H 指数的估计与检验是长记忆性研究的关键工作,其估计与检验的有效性直接影响对长记忆性的甄别。尽管现有文献提出多种估计 H 指数的方法,但是 R/S 类方法由于其简洁性而一直受到研究者的青睐,迄今为止仍是估计 H 指数最常用的方法。该类方法最早是由 Hurst(1951) 1和 Mandelbrot & Wallis(1969) 2提出的经典 R/S 分析方法(Classical Rescaled Range,下文简称 CRS) ,后来 Lo(1991) 3通过考虑序列的短期相关性对 CRS 进行了修正而提出修正 R/S 分析方法(Modified Rescaled Range,下文简称 MRS) ,Giraitis et al.( 2003) 4利用部分和序列的方差替代部分和序列的极差对 CRS 进行了修正而提出 V/S 分析方法(Rescaled Variance,下文简称 VS) 。虽然 MRS 和 VS 均是从不同方面对 CRS 进行了某种程度的修正,但是能否真正提高 H 指数的估计有效性呢?尽管许多研究文献对R/S 类分析方法的有效性提出许多质疑,但是目前大多数的研究都是这些估计方法在某些领域的直接应用,而对它们估计 H 指数的有效性的关注和研究却很少。R/S 类分析方法由于产生于 Hurst 的长期实践工作过程而没有严格的数学推导,因此,我们难以使用严格数学证明来检验其有效性,但是可以通过模拟研究方法来综合评价它们的有效性。鉴于此,为检验 R/S 类方法估计 H 指数的有效性,下面将通过预先设定不同的 H 真实值并模拟出一系列的 FGN 序列,然后利用 CRS、MRS 和 VS 三种方法分别估计 H 指数,从 H 估计值的均值和标准差两方面反映序列长度、短期相关性处理、白噪声成分等因素对 H 指数估计的影响,并综合比较三种估计量的有效性,为 R/S 类分析方法使用者提供有益的参考。- 3 -2 研究方法2.1 R/S 类分析方法通常将 CRS、MRS 和 VS 统称为 R/S 类分析方法,原因在于它们具有共同的基本原理,我们可将它们估计 H 指数的基本步骤概括如下:第 1 步,将原始序列划分成若干子序列。合适选定某标度长度 n,将原始序列 划分成 M 个互不重叠的长度为 n 的子序列: ,Tty )y,(21, ,其中, , 表),(n2n1 )y,y(M2)1(n)1 /T示取整,下同;第 2 步,计算出与标度长度 n 所对应的标度统计量。首先计算出根据标度长度 n 所划分出的所有子序列的局部统计量 ,然后利用所有局部统计量计m,nLS算出标度长度 n 对应的标度统计量 ,此处标度统计量是所有局部统计量的n平均值,即为 ;M1m,nnLS第 3 步,改变标度长度 n,重复前面的步骤,这样得到一系列的标度长度n 及其相应的标度统计量序列 ;第 4 步,若标度统计量序列与标度长度序列存在如下的标度关系:,其中, 为某常数,则可以采用如下的双对数回归方式估计 H 指HnCS数:。 (1))nlog(H)Cl()Slog(nCRS(Hurst,1951 1;Mandelbrot,1969 2)使用如下的局部统计量为:, (2)m,n,m,nS/R)/(其中, 为第 m 个子样本的极)y(iymaxR,nk1t,tn,nk1t,tn,n 差, 为第 m 个子样本的标准差, 为第2,n1t,tm,n)y(S n1j,t,ny- 4 -m 个子样本的均值。MRS(Lo,1991) 3使用如下的局部统计量:, (3))q(/R)/m,n,n(其中, 同上述 CRS 中的定义, 由下式定义:m,nR(,, (3)jqjynjt mnjtmntqjntmnt yy)(2 )()21)(1 1,1,2, 其中, ,当 时, 为 Bartlett 权重,2n1tm,n,t2y)(nq1qj)(j和 为第 m 个子样本 的样本方差和 j 阶样本自协方差。 的选择2,nj1t,y )(n至关重要,其直接影响到检验效果。Lo 建议使用如下的 q 值最优选择公式:, (4)3/23/1nqopt其中,n 为子样本长度, 为一阶自相关系数的估计值, 表示取整。当 时,MRS 与 CRS 方法一致。0qVS(Giraitis et al. ,2003) 4使用的局部统计量为:, (5)m,n,SV)/(其中, 为第 m 个子序列部分和序列 的方差,具体展开形式为:,nV1k,其它与 2n1k n1ktm,n,t2tm,n,t1k2nm,n )y()y()S(上述 MRS 中的定义相同。2.2 模拟设计2.2.1 FGN 和 FBM 序列的模拟算法由 Mandelbrot & Van Ness(1968) 5提出的分形高斯噪声(Fractional Gaussian Noise,简称 FGN)是第一个完整的长记忆模型,通常定义为具有 H- 5 -指数的分形布朗运动 的一阶差分过程 ,其第)t(BH0tHHt )(B1t(y|k 阶自协方差函数为:, (6)H2H222y |k|1k|)(其中, , 为任意正数, 为 H 指数。 ,10k)y(Vart2 10为模拟上述定义的 FGN 序列,许多学者提出了多种模拟算法,比如,基于条件分布的 Durbin-Levinson 方法(Brockwell & Davis,1991 6) 、基于循环嵌入矩阵和傅立叶变换的模拟方法(Davies & Harte,1987 7;Wood & Chan,1994 8) 、基于小波的合成模拟方法(Abtry & Sellan,1996 9)等。我们通过反复模拟比较发现,这些模拟方法的效果基本一致。因此,本文选择 Davies & Harte( 1987) 7提出的算法(Davies & Harte Method,简称 DHM)模拟 FGN序列。在式(1)给定自协方差序列 的条件下,DHM 算法模拟长度为 TT0k的 FGN 样本序列 的基本步骤如下:T1ty第 1 步,计算序列 :120k,A, (7)T/kji1T2jj/kjiT0j,k ee其中, ,该步其实是对自协方差序列 实施离散1i2 1T110 ,傅立叶变换(DFT) ;第 2 步,检查非负条件:对所有 , ,该步也很重要,若不满足非kAT,负条件,则模拟序列是无效的;第 3 步,模拟产生均值为 0、方差为 1 的独立高斯随机变量序列 ;120TtZ第 4 步,计算复值序列 : T2kV, (8),1T2k,VZA,k),i(0,*T2,21k2,0k- 6 -其中, 表示 的共轭复数。*kT2VkT2第 5 步,通过离散傅里叶逆变换(IDFT)可得到模拟序列 :T1ty, 。 (9)1T20kT/)1t(kiteVy,t2.2.2 模拟参数与程序的设定为综合对比 3 种估计量估计 H 指数的有效性,首先需要对模拟参数做出设定。我们选择 0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9 等 9 个数值作为 H指数的真实值,这些取值范围基本覆盖了序列的各种特性:当 H 真实值介于 0与 0.5 之间时,序列具有反持续性(或均值回复) ;当 H 真实值等于 0.5 时,序列没有记忆性;当 H 真实值介于 0.5 与 1 之间时,序列具有长记忆性(或状态持续性) 。当考察序列长度对 H 估计值的影响时,我们选定 、 、 、 、7289102、 、 、 等 8 种长度,这些长度基本可覆盖目前大多数分析数据的长121342度范围,当考察相关性处理、白噪声成分对 H 估计值的影响时,模拟序列长度均选择为 ,相关性处理仅考虑一阶短期相关性剔除的情况,白噪声成分考虑1根据在 FGN 序列追加的白噪声成分标准差与 FGN 序列标准差之间的 4 个比值0、0.33、0.66、1.0 划分的 4 种情况。本文的所有运行结果均是在 Matlab7.0 软件中自行编写程序得到的,如需源程序可向作者索取。首先,在上述模拟参数的设定下,每种情况均模拟出 100 个序列,利用 3种估计量分别估计出每个序列的 H 估计值,这样每种情况均得到 H 估计值序列;其次,分别估计出在每种情况下 H 估计值的均值、标准差和均方误差,10iH分别定义为: 、 、10iHM10i2i M9SD,从而评价序列长度、相关性处理和白噪声成分等每10i2TiHSE种因素对 3 种估计量估计 H 指数的影响;然后,利用统计分析中常用的直方图、JB 和 KS 检验统计量对 H 估计量的正态分布特性进行统计检验。- 7 -3 研究结果3.1 序列长度对估计结果的影响为反映序列长度对 H 估计值的影响,我们对于每个 H 真实值均模拟出 100个序列,然后分别利用 CRS、MRS 和 VS 三种估计量估计出每个序列的 H 指数,并且计算其均值和标准差,分别如图 1 和图 2 所示。0.1 0.3 0.5 0.7 H一一一CRSMH一一一0.1 0.3 0.5 0.7 H一一一MRSMH一一一0.1 0.3 0.5 0.7 H一一一VS MH一一一0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一2728292102112122132140.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9H一一一H一一一272829210211212213214图 1 序列长度对 H 估计值均值的影响从图中可看出,序列长度对 H 估计值的均值和标准差产生显著的影响。随着序列长度的增加,3 种估计量得到的 H 估计值均值将越来越接近于 H 真实值,H 估计值的标准差显著降低,当序列长度为 时,估计偏差和标准差最大。而且 VS 所得到的 H 估计值均值受序列长度的影响比 CRS 和 MRS 均要小得多,尤其是当 H 真实值介于 0 至 0.6 之间时,估计偏差较小, VS 和 MRS 所得到的H 估计值标准差没有显著差异,但均比 CRS 要小,因此表明, VS 更具有小样本特性。0.1 0.3 0.5 0.7 0.900.0 CRSH一一一SDH一一一0.1 0.3 0.5 0.7 0.900.05 MRSH一一一SDH一一一0.1 0.3 0.5 0.7 0.900.05 VS H一一一SDH一一一图 2 序列长度对 H 估计值标准差的影响- 8 -3.2 相关性处理对估计结果的影响我们知道,MRS 和 VS 均在估计标准差中考虑了序列的短期相关性,那么在估计前对序列进行短期相关性处理是否会对这些方法估计 H 指数仍产生显著的影响呢?这里我们仅考虑剔除一阶短期自相关性的情况。0.1 0.3 0.5 0.7 H一一一CRSMH一一一一一一一一一一一一一一一一一一0.1 0.3 0.5 0.7 H一一一MRSMH一一一一一一一一一一一一一一一一一一0.1 0.3 0.5 0.7 H一一一VS MH一一一一一一一一一一一一一一一一一一图 3 相关性处理对 H 估计值均值的影响从图 3 看出,当 H 真实值介于 0.7 至 1.0 之间时,剔除一阶相关性对 CRS得到的 H 估计值均值产生显著影响,而对于其他的所有情况均没有显著影响。从图 4 看出,短期相关性处理对 3 种估计量得到的 H 估计值标准差的影响较小。0.1 0.3 0.5 0.7 0.90.0150.020.0250.030.0350.040.0450.05 CRSH一一一SDH一一一一一一一一一一一一一一一一一一0.1 0.3 0.5 0.7 0.90.010.020.030.040.050.06 MRSH一一一SDH一一一一一一一一一一一一一一一一一一0.1 0.3 0.5 0.7 0.90.010.020.030.040.050.060.07 VS H一一一SDH一一一一一一一一一一一一一一一一一一图 4 相关性处理对 H 估计值标准差的影响3.3 白噪声成分对估计结果的影响在考虑白噪声成分方面,在利用 DHM 方法模拟得到的 FGN 序列基础上追加各种白噪声成分,这里以白噪声成分标准差与 FGN 序列标准差之间的比值大小表明序列包含白噪声成分的强弱,选取 0、0.33、0.66、1.0 等 4 种情况作为研究对象。从图 5 可看出,随着白噪声成分标准差与 FGN 序列标准差的比值逐渐增加,三种估计量得到的 H 估计值均值均逐渐随之发生显著变化,而且当 H- 9 -真实值处于低端时,序列所包含的白噪声成分越强,三种估计量高估 H 指数的程度将逐渐显著地变大,而当 H 真实值处于高端时,序列所包含的白噪声成分越强,低估 H 指数的程度将逐渐变大。从图 6 可看出,序列所包含的白噪声成分的增加将增大 H 估计值的标准差,从而使 H 指数的估计结果稳定性下降。总体上,三种估计量受白噪声成分的影响大致相同。0.1 0.3 0.5 0.7 H一一一CRSMH一一一00.330.6610.1 0.3 0.5 0.7 H一一一MRSMH一一一00.330.6610.1 0.3 0.5 0.7 H一一一VS MH一一一00.330.661图 5 白噪声成分对 H 估计值均值的影响0.1 0.3 0.5 0.7 0.90.010.020.030.040.050.06 CRSH一一一SDH一一一00.330.6610.1 0.3 0.5 0.7 0.90.010.020.030.040.05 MRSH一一一SDH一一一00.330.6610.1 0.3 0.5 0.7 0.90.010.020.030.040.050.060.07 VS H一一一SDH一一一00.330.661图 6 白噪声成分对 H 估计值标准差的影响3.4 H 估计量的分布特性本文以统计分析中常用的直方图、JB、KS 为检验 H 估计量的正态分布特性。检验结果表明,几乎所有情况下的检验统计量均是显著的,具体检验结果此处从略。三种 H 估计量的抽样分布形式均与正态分布存在较大差异,但是VS 的 H 估计量的差异要小一些。由此表明,R/S 类方法得到的 H 估计量并不具有正态分布特性,利用正态分布对 H 指数进行显著性检验将产生不正确的结论。3.5 三种方法估计结果的综合比较前面我们考察了各种因素对三种估计量估计 H 指数的影响。这里在选择序- 10 -列长度为 、不进行短期相关性处理和不追加白噪声成分的情况下,着重考察12在 H 真实值的不同范围内三种估计量的有效性问题。 H 指数估计值的均值、标准差和均方误差如图 7 所示。从图可看出,在 H 真实值的不同范围内,三种估计方法的估计结果存在一定的差异。当 H 真实值在 0 至 0.7 之间时,CRS 高估H 值,而在 0.8 至 1 时低估 H 值,仅在 0.7 至 0.8 之间时才能给出较好的估计。在 H 真实值在 0 至 0.6 之间时,MRS 高估 H 值,而在 0.7 至 1 时低估 H 值,仅在 0.6 至 0.7 之间时才能给出较好的估计。VS 在 0 至 0.6 之间时能给出比较接近于 H 真实值的估计,而当 H 真实值大于 0.6 时,却给出低估的估计结果。总体来看,三种估计量各自存在不同的适用范围,当 H 真实值介于 0 至 0.6 之间时,VS 能做出较好的估计,当 H 真实值介于 0.6 至 0.7 时,MRS 能做出较好的估计,而当 H 真实值介于 0.7 至 0.8 时,CRS 能做出较好的估计,而当 H 真实值介于 0.8 至 1 时,三种方法均低估 H 指数,低估程度和估计误差由CRS、MRS 和 VS 依次增大。0.1 0.3 0.5 0.7 H一一一MH一一一CRSMRSVS0.1 0.3 0.5 0.7 0.90.010.020.030.040.050.06H一一一SDH一一一CRSMRSVS0.1 0.3 0.5 0.7 0.900.0H一一一MSEH一一一CRSMRSVS图 7 三种估计方法的综合比较:均值、标准差和均方误差4 研究结论与建议本文在设定 9 个 H 真实值的条件下利用 DHM 方法模拟出一系列 FGN 序列,对序列长度、短期相关性处理和白噪声成分等因素对经典 R/S 分析方法、修正R/S 分析方法和 V/S 分析方法估计 H 指数有效性的影响关系进行了研究。本文研究发现,VS 受序列长度的影响最小,具有较好的小样本特性,CRS较容易受到短期相关性处理的影响,MRS 、VS 几乎不受其影响,而三种方法均受到序列含有的白噪声成分强弱的较大影响,三种估计量均不具有正态分布特性,各自存在不同的适用估计范围,CRS、MRS、VS 能做出较好估计的 H- 11 -真实值范围分别为 0.7 至 0.8、0.6 至 0.7、0 至 0.6,而当 H 真实值介于 0.8 至 1时,三种方法均低估 H 指数,低估程度由 CRS、 MRS、VS 依次增大。因此,在选用 R/S 类分析方法估计 H 指数并对诸如长记忆性、自相似性等分形特征进行判定时,我们应根据不同的情况进行区别对待和慎重考虑。参考文献1 Hurst H.E. 1951. The long-Term Storage Capacity of Reservoirs. Transcactions of the American So

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论