(概率论与数理统计专业论文)关于极值指标的假设检验问题.pdf_第1页
(概率论与数理统计专业论文)关于极值指标的假设检验问题.pdf_第2页
(概率论与数理统计专业论文)关于极值指标的假设检验问题.pdf_第3页
(概率论与数理统计专业论文)关于极值指标的假设检验问题.pdf_第4页
(概率论与数理统计专业论文)关于极值指标的假设检验问题.pdf_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 近些年来,极值理论再次成为统计研究领域的热点。极值理论( e x t r e m e v a l u et h e o r y ) 是研究顺序统计量的极端值的统计特性的建模与估计问题。 以往的关于极值理论的文献都基本上是讨论了独立同分布情形下的极值理 论,已经提出了大量的结果,形成了相对成熟的理论构架。近二十多年来,对平 稳序列的极值理论的研究也开始多了起来,提出了很多极值指标0 的估计方法, 但对于极值指标目的假设检验问题的讨论并不是很多。本文在介绍了经典极值理 论和平稳序列的基本极值理论之后,通过随机模拟法,验证了对于极值指标0 1 的平稳同分布随机序列来说,溢出值时间间隔分布是不服从简单几何分布的。本 文提出了对于极值指标0 1 的平稳序列的溢出值时间间隔分布服从混合几何分 布的假设检验问题,给出了检验统计量的渐近分布和拒绝域。此外,本文还讨论 了检验功效问题,并以g a r c h 和a r m a x 过程为例,讨论了检验的功效。 关键词:平稳时间序列,极值指标,假设检验,溢出值时间间隔,混合几何分布, 检验功效 a b s t r a c t e x t r e m ev a l u et h e o r yi sat h e o r yc o n s i d e r i n gt h eb e h a v i o u ro fe x t r e m ev a l u e s o fas e q u e n c e b e f o r el9 8 0 s ,al a r g en u m b e ro fp a p e r sa p p e a r e d ,m a i n l yc o n s i d e r e d t h ee x t r e m ev a l u et h e o r yf o ri n d e n p e n d e n ta n di d e n t i c a l l yd i s t r i b u t e d ( i i d 1 s e q u e n c e s i nt h el a s tt w od e c a d e s e x t r e m ev a l u et h e o r yf o rs t a t i o n a r yt i m es e r i e s a t t a c t e dm o r ea n dm o r ei n t e r e s t s ,a n dv a r i e so fm e t h o d sw e r ed e v e l o p e dt oe s t i m a t e t h ee x t r e m a li n d e x 口f o rs u c hs e q u e n c e s h o w e v e r ,f e wa u t h o r sc o n s i d e r e dt h e h y p o t h e s et e s t i n gp r o b l e mo nt h ee x t r e m a li n d e x i nt h i sp a p e r ,w es h o r t l yi n t r o d u c e t h ec l a s s i c a le x t r e m ev a l u et h e o r ya n db a s i ce x t r e m ev a l u et h e o r yo fs m t i o n a r y s e q u e n c e s w ei n v e s t i g a t et h ei n t e r - e x c e e d a n c et i m e so fas t a t i o n a r ys e q u e n c e e x t r e m a li n d e x 目 1 d on o tf o l l o wg e o m e t r i cd i s t r i b u t i o n w ep r e s e n tah y p o t h e s i s t e s tp r o b l e mt h a tt h ei n t e r - e x c e e d a n c et i m e so fas t a t i o n a r ys e q u e n c e e x t r e m a l i n d e x 臼 1 f o l l o wm i x e dg e o m e t r i cd i s t r i b u t i o n t h ea s y m p t o t i cd i s t r i b u t i o no ft h et e s t s t a t i s t i ca n dr e j e c t e dd o m a i na r eg i v e n t e s tp o w e ri sa l s od i s c u s s e di nt h ee n d t e s t p o w e ro ft h es e q u e n c e sf r o mg a r c hp r o c e s sa n da r m a xp r o c e s sa r eg i v e nv i a s i m u l a t i o n k e yw o r d s :s t a t i o n a r yt i m es e r i e s ,e x t r e m a li n d e x , h y p o t h e s i st e s t , i n t e r - e x c e e d a n c e t i m e ,m i x e dg e o m e t r i cd i s t r i b u t i o n ,p o w e ro ft e s t 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果。据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人已经发表或撰写过的研究成果。对本文的研究做出重 要贡献的个人和集体,均已在文中作了明确说明并表示谢意。 作者签名:叠:皇氩日期:2 型星:= f 。3 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版。有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 学位论文作者签名:他攫- 九 导师签名: 学位论文作者签名:婚鼍撖, 导师签名: j 7 捌毛 日期:一生 第一章绪论 1 1 引言 极值理论( e x t r e m ev a l u et h e o r y ) 是研究顺序统计量的极端值的统计特性 的建模与估计问题。对极值风险进行合理、有效的度量和估计,不仅是统计学界 的一个重要课题,也引起了金融、保险、水利、气象、地质、农业、工程设计等 多个领域的关注。比如,金融资产收益率序列的尖峰、厚尾特征使得用传统的正 态分布假设不大合适,为了更有效的刻画金融资产收益率序列的尾部特征,用于 处理极端事件的极值理论成为了金融风险管理操作中的一种有效的工具:在保险 行业,尤其是在非寿险业中,选择一个好的统计模型来拟合大的观测值,也就是 极端值,对保险产品的定价以及超出损失再保险的定价有着重要意义,因为“占 总数次数2 0 的那些索赔额之和大约是公司历史索赔总额的8 0 ! ( e m b r e c h t s e t a l ,1 9 9 7 ) 。 极值理论最早可以追溯到2 0 世纪早期,f i s h e r 和t i p p e t t 提出了关于最大顺 序统计量标准化的广义极值分布极限理论。但直到2 0 世纪5 0 年代,极值理论才 开始真正引起科研工作者的注意,并开始对它建模。近些年来,极值理论再次成 为统计研究领域的热点。r e s n i c k ( 1 9 8 7 ) 、r e i s s & t h o m a s ( 1 9 9 7 ) 、b e i r l a n de ta 1 ( 2 0 0 4 ) 分别对极值理论进行了系统的介绍。 l e a d b e a e r ( 1 9 8 3 ) 研究了平稳时间序列的最大顺序统计量的渐近分布问题, 同时还将边际分布相同的独立同分布随机变量序列和平稳序列的最大顺序统计 量标准化的极限分布进行了比较,给出了度量平稳序列中超越定水平的数据的 聚类指标极值指标( e x t r e m a ii n d e x ) ,用来刻画相关序列的局部相关性。 有关极值指标的两种最普遍的估计方法有:区组( b l o c k s ) 方法,游程( r u n s ) 方法,b e i r l a n de ta 1 ( 2 0 0 4 ) 对这两种方法作了全面而系统的介绍。但是,h s i n g ( 1 9 9 1 ) 指出这些估计方法在选取分簇参数( d e c l u s t e r i n gp a r a m e t e r ) 具有较大 的任意性,即,游程长度的选择会很大程度的影响对簇( c l u s t e r ) 特征的估计。 此外,近来学者又提出了另外两个估计方法:l a u r i n i & t a w n ( 2 0 0 3 ) 的双门限 法( t w o t h r e s h o l dm e t h o d ) 和f e r r o & s e g e r s ( 2 0 0 3 ) 的区间法( i n t e r v a l s e s t i m a t o r )。闰世锋( 2 0 0 7 ) 考虑了噪声因素,提出的多门限指标估计,改进 了双门限方法。s f i v e g e s ( 2 0 0 7 ) 在f e r r o & s e g e r s ( 2 0 0 3 ) 的研究基础上,给出 了极值指标的一种极大似然估计。 对于极值理论中的检验问题的研究,受到的关注程度不如极值领域中的统 计估计方法的研究。早期的成果r e i s s & t h o m a s ( 1 9 9 7 ) 作了一个简单的回顾。 s t e p h e n s ( 1 9 7 7 ) 研究了g u m b e l 模型的拟合优度检验。m a r o h n ( 1 9 9 8 ) 对g u m b l e 吸收域的检验问题进行了研究。m a r o h n ( 2 0 0 0 ) 讨论了极值分布模型和广义p a r e t o 模型的检验问题。d i e t r i c h ,d eh a a n & h i i s l e r ( 2 0 0 2 ) 提出了对数据是否满足g e v 分布的条件进行检验的方法。n e v e s & a l v e s ( 2 0 0 8 ) ,h i i s l e r & p e n g ( 2 0 0 8 ) 分 别对极值理论中的检验问题做了全而而系统的回顾,不仅介绍了对极值条件的检 验的研究工作,也介绍了对各种一元极值模型检验的研究工作,以及对多元极值 模型检验的研究工作,使得学者对目前极值理论中的已研究和待研究的检验问题 有了一个清晰的认识。 1 2 本文研究的主要问题 本文在介绍了经典极值理论和平稳序列的基本极值理论后,通过随机模拟 法,验证了极值指标0 1 的平稳同分布随机序列溢出值时间间隔的分布不服从 简单的几何分布;由对溢出值时间间隔分布的假设,提出了一个关于极值指标的 假设检验问题,并通过随机模拟的方法,验证了该假设检验问题;最后,研究了 该检验问题的功效。 本文的主要内容包括: 【1 】经典极值理论的简单介绍。 介绍了独立同分布随机序列的极值定理,以及极值指数的估计方法。 【2 】平稳同分布序列极值理论的介绍。 介绍了平稳同分布随机序列的基本极值定理,以及极值指标的估计方法。 3 】验证平稳同分布序列溢出值时间间隔的分布。 通过随机模拟法,验证了极值指标0 0 ) : ( i ) f r e c h e t p a r e t o 型: f0 ,当x 0 , a ( x ) 5 p 一,a ,当x o ( i i )g u m b e l 型: a ( x ) = e 一。,x 乏 ( i i i )w e i b u l l 型: 州= 一美 属于f r e c h e t p a r e t o 型的常见分布有p a r e t o 分布,b u r r 分布,学生- t 分布;属于 g u m b e l 型的常见分布有指数分布,正态分布,对数正态分布,g a m m a 分布; 属于w e i b u l l 型常见分布有均匀分布,逆p a r e t o 分布。 2 1 2 广义极值分布( g e n e r a le x t r e m ev a l u e sd i s t r i b u t i o n ) 上述三种极限分布在形式不同,对于x ;的分布而言,其尾部性质也是不一 样的,而且,在实际应用中,人们通常选取其中一种分布族,然后再估计其参数。 这样,如何选取最适当的分布族就尤为重要,若不当,则会带来很大的麻烦。 我们可以将上述三种分布族统一成一个形式: g y ( 石) = e x p 一( 1 + r x ) 叫一 ,这里1 + 0 。 ( 1 1 ) 称满足( 1 1 ) 式的分布函数族为广义极值( g e n e r a l i z e de x t r e m ev a l u e ,g e v ) 分 布,形态参数y 称为分布g 的极值指数( e x t r e m ev a l u ei n d e x ) 。这里, 0 时, g ( x ) 对应着f r e c h e t 型分布,我们称为厚尾分布;y 0 和吃,使得( x t i , 。- - 吒) 的渐近分布是一个非退化分 布,即: 尸( 鱼岳生x ) 寸g ,( x ) ,n 寸, 其中,q ( 石) = e x p 一( 1 + y x ) 1 啊 ,这里1 + 0 。 g n e d e n k o 对三种分布形式的吸收域( m d a ) 问题进行了研究,具体的可参 阅b e i r l a n de ta i ( 2 0 0 4 ) 。 笙三皇丝塞堡笪型笙互鲨 坐丕衄垫盔堂亟土迨_ 义垒 i 图2 1 g e v 密度函数图。粗实线( 一) 为w e i b u u 型( y 一0 5 ) ,细实线( 一) 为f r e c h e t 型( y = 0 5 ) ,折线( 一) 为g u m b e l 型( y = 0 ) 从密度函数图,可以看出三种分布类型的 尾部特征是有差别的。 这样,关于g e v 分布的统计推断问题就集中在参数y 上了。对于独立同分 布的随机变量序列极值分布的参数估计方法,通常可分为参数方法和非参数方法 两大类。 对于极值的不同的解释方法,我们可以得到不同方式的估计。下面来介绍 几种常用的估计方法: 2 2 独立同分布序列极值指数的估计方法 2 2 1p o t ( p e a k s o v e r - t h r e s h o l d ) 方法 p o t 方法是实际应用中最常用的模型之一。它考虑的是超过某一较大的门 限值溢额( e x c e s s ) 的条件生存函数。 令( x ) = p ( x 一, u ) 表示超出门限值的分布。- i s g 乃肛,为广义 p a r e t o 分布( g e n e r a lp a r e t od i s t r i b u t i o n ,简写g p d ) ,定义如下: g ,。( x ) = ( 1 + y x - , a ) 一歹 e x p ( x - * ) 仃 ( 1 + y 型) 一7 p i c k a n d s ( 1 9 7 5 ) 证明了对某正的盯( ) ,p ( , o ,x a y = 0 ,x , y o , ) 。通常情况下,门限值来自样本的一个值,取= 瓦叱。 极大似然估计 设,= ,巧。来自独立同分布的样本,服从广义p a r e t o 分布,则其对数极大 似然函数为: - 。g 三c 仃,y ,= 一。- 。g 盯一( 专+ 兰i = 1 - 。g c + y 吾, 其中,l + * - - l 0 ,i = 1 ,。如果厂= 0 ,则似然函数为: l o g = 一以l o g o - - 三誊, 这样就可以通过似然函数得到各个参数的极大似然估计,分别记为岔夕。 门限值的选取 从上面的论述可知,门限值的选取是至关重要的。q q 图和均值溢额图 ( m e a ne x c e s sp l o t ) 不仅可以帮助我们来判断极值分布的序列是“厚尾”还是 “薄尾”的,还可以用来初步的确定门限值的选取。 q q 图就是利用样本分位数和其分布分位数来分别作为平面图形的横纵坐 标来完成的,应近似为一条直线。对于p a r e t o 分布来说,记为p a ( a ) ,分布函数 为:f o ) = l x 1 ( x l ;c t 0 ) ,坐标可采用( - l o g ( 1 - p j 。) ,1 0 9 置,。) , 只。车i ( n + 1 ) 。当某样本分位数后有明显的线性变化时,可用此样本分位数作为 门限值,并且此直线的斜率为1 ,。 图2 2 这两个图形分别是来自p a ( 1 ) 分布的1 5 0 0 个模拟数据的q q 图,横纵轴坐标分别是 ( 一l o g ( 1 一只,。) ,z ,。) ,( 一l o g ( 1 - p j ,。) ,l o g x j ,。) ,从上面的两个图可以看到p a ( 1 ) 是属 于厚尾的f r e c h e t p a r e t o 型分布的 均值溢额图 均值溢额函数( m e a ne x c e s sf u n c t i o n ) 定义为: p ( ) = e ( x 一i x ) , 在实际中,可用: = 丢害+ ,。吨叱一= ,n 山 一般地,如果均值溢额函数在超过某一点后有明显的线性变化时,可将此 点对应的样本次序统计量作为门限值,而且可通过斜率来观测是否服从g p d , 即:斜率为正时,观测数据服从g p d 。关于q q 图和均值溢额图的详细解释, 可参阅b e i r l a n de ta 1 ( 2 0 0 4 ) ,r e i s s & t h o m a s ( 1 9 9 7 ) 。 图2 3 这两个图形是来自p “1 ) 分布的1 5 0 0 个模拟数据的均值溢额图,横纵轴坐标分别是 ( e k 七) ,( x n - k , n ) 2 2 2 区组极大方法( b l o c km a x i m am e t h o d ) 由定理2 2 可知,对于一个随机样本而言,其标准化的最大值的渐近分布为 g e v 分布。于是可利用子样的极值来作估计,这样就产生了区组的估计方法。 对于随机变量x 的观测值 五9 oo9 以 ,分成如下的区组: 五川,一。) ,j = l ,k ,其中甩= 历后。 令第j 个区组的最大值为,即:= m a x 誓j _ 1 ) + ) ,j = l ,k 。 于是得到独立的极值样本 巧,砭) 。这样,当独立同分布序列极大值存在非退 化的渐近分布时,可用序列极值样本来拟合广义极值分布。 极大似然法 设 z ,砭) 来自独立同分布的g e v 分布,在y o 时,对数似然函数为: 魄三( b , o r , y 卜挑旷( 圳扣孚,毒孚, 其中,i + yr - b 0 ,i :1 ,k 。 当) ,= 0 时,相应的对数似然函数为: 崦三( b , 1 7 , y 卜挑旷扣( 一半媾i = l 也o , 这样就可以得到( ,盯,y ) 的极大似然估计。b e i r l a n de ta 1 ( 2 0 0 4 ) 对于该估计的性 质进行了介绍,另外也介绍了概率加权矩估计法( p r o b a b i l i t y w e i g h t e d m o m e n t s ) 。 2 2 3 非参数方法 学者还提出了一些基于极值次序统计量对极值指数,的估计,其中很著名的 就是h i l l 估计和p i c k a n d s 估计,其形式分布如下: 峨广妻善l o g x _ 1 + 1 - l o g x , , 。, 玑= 古g ( 瓮岩警 o 很多学者对这两种估计也进行了推广,可参阅b e i r l a n de ta 1 ( 2 0 0 4 ) ,r e i s s & t h o m a s ( 1 9 9 7 ) 。 第三章平稳时间序列的极值理论 3 1 平稳时间序列的基本极值理论 第二章讨论了独立同分布序列的极值分布及统计推断问题,但在实际中, 这种独立性是很难满足的,而常常存在一定的相依性,例如:金融收益率时间序 列的波动聚集性,即:大的波动之后紧跟大波动;小波动紧随小波动,显然序列 不满足独立同分布的条件,这难免会减弱模型的功效。我们希望可将上述条件加 之放宽,以使模型发挥更好的效果。一个较自然的想法就是考虑来自同分布的平 稳序列,假设变量相关但其随机性在时间上是齐次的。 序列的相依性会影响极值的数目和表现行为,这就需要来寻找一些其他的 方法和工具来描述这些特征。研究表明,只要合理的限制极值事件的长期相关性, 就可以将其与独立同分布情形下的极值序列分布联系起来。 这里对极值事件长期相关性的限制条件通常称为d ( u 。) 条件。 d ( ) 条件: 对于所有的4 缶,( 掰。) ,a 2 缶帆。( ) ,ls ,n - s ,有: l 尸( alna2 ) 一尸( a1 ) p ( 42 ) i 口( 刀,j ) , 且对于一些满足s n = d ( 盯) 的正整数数列s n 有a ( n ,s n ) 一0 ( 刀一o o ) 。其中, 乞。( ) = “m ( ,) “。 :, 9 6 9 七) ) 是事件 置“。) ( j - i 七) 所有交集的集 合。 o ( u 。) 条件就是说通过分割序列,使得每个区组内的极值事件是近似独立 的。详细的解释和证明,可参阅b e i r l a n de ta 1 ( 2 0 0 4 ) 。 当平稳序列满足上述的d ( u 。) 条件时,长期相关性就可以忽略,而影响极值 行为的则是局部相关性,使得极值会成簇( c l u s t e r ) 出现。 下面是l e a d b e t t e r 提出的关于平稳时间序列的两个著名的定理。 定理3 1( l e a d b e t t e r ,19 7 4 ) 设五,以是平稳序列,如果存在常数列 0 和瓯,满足: p ( 墨鱼x ) 与g ( x ) ,n 一, 其中,g 为一个非退化分布。如果对任意一个满足g ( x ) 0 的x 来说,条件d ( u 。) 成立,其中,= a n x + b n ,则g 是一个极值分布函数。 定理3 2( l e a d b e t t e r ,1 9 8 3 ) 设置,以是平稳序列,置,只是关联的独立同分布序列。如果存在常 数列 o 和既,满足: p ( 墨篙粤工) 与d ( x ) ,nj , 其中,g 为一个非退化分布。对任意一个满足g ( x ) 0 的x 来说,条件d ( u 。) 成立, 其中,“。2a n x + 3 。,而且,对某些x ,p ( ( x 。一b 。) a 。x ) 收敛,则 尸( 墨镜鱼工) 山g ( x ) :g 口( x ) ,n 专o 。, 其中,常数秒【0 ,1 】o 上述的0 被称为极值指标( e x t r e m a li n d e x ) 。 记g 的各个参数为( ,仃,厂) ,6 的参数为( 丘,矛,夕) ,则有: y :尹,:厨一矛坐,盯:6 0 一,;y = y ,= 一盯, 盯= 7 ; 厂 如果y = 0 ,则= 丘+ c r l o g o ,盯= 矛。 定理3 1 说明,如果限制了平稳序列的长期相关性,平稳序列的极值则服从 g e v 分布;而定理3 2 说明,平稳序列的局部相关性对极值行为的影响则表现在 分布参数极值指标上。这样,对于平稳序列的研究重点则在极值指标上,极 值指标可被理解为独立溢额簇中平均溢出值个数的倒数。所以,如果0 l ,) 朋一i x i ) i = 1 ,其中k = - n r 。 游程法是将极值指标解释为溢出值后有一串低于门限值的一指定游程的观 测值的极限概率,即: 秒= l i mo r ( 甜。) ,而b 月( ) = h 五,“。ix i 甜。】。这样, 极值指标的游程估计为: f f 气u ;r ) = ( n - r ) 一, 置 玑m + ,材) ,= l 刀一, 置 甜) i = 1 h s i n g ( 1 9 9 1 ) 游程长度的选择通常会很明显的影响极值簇特征的估计, s m i t h & w e i s s m a n ( 1 9 9 4 ) ,w e i s s m a n & n o v a k ( 1 9 9 8 ) 对极值指标的估计作了改 进。 这两种估计方法都要实现确定分簇参数,对于门限值来说,如果门限值太 大,超越门限值的溢出样本就会很少,则根据这些数据作出的估计误差就会较大; 门限值取得太小,可能不满足建模所依据的理论要求,则模型不能准确刻划分布 尾部行为,所以门限值的选取直接影响了估计的好坏。 近来又提出了另外两种估计:双门限值方法( t w o t h r e s h o l dm e t h o d ,l a u r i n i & t a w n2 0 0 3 ) 和区间估计( i n t e r v a l se s t i m a t o r , f e r r o & s e g e r s2 0 0 3 ) 。第一种估计 方法对极值指标的估计是通过对极值簇的一个预先的识别,利用样本中独立的观 测簇来作估计。比起游程方法和区组方法,双门限方法偏差更小,对分簇参数选 笙三兰:! 堡盟旦堑! ! 塑堡篁堡丝 坐叁! ! 巫踅盔堂亟圭迨_ 文! 兰 择的敏感性也有所下降,但是,此法需要选择两个分簇参数,而且,当极值指标 0 比较大时,双门限方法往往出现估计不足的问题( l a u r i n i & t a w n ,2 0 0 3 ) ,确 定极值簇只考虑到了序列x 和波动率,而忽视了噪声因素,但在极值指标较大 时,恰恰噪声对极值行为有更大的影响,而闫世锋( 2 0 0 7 ) 考虑了噪声因素,提 出的多f - j 限指标估计,在更广的参数估计范围内要优于双门限方法;第二种估计 方法是利用了溢出值的复合p o i s s o n 过程的特征,通过适当的正则化,溢出值时 间间隔( i n t e r - e x c e e d a n c et i m e s ) 近似服从一个由单点分布和指数分布构成的混 合分布( f e r r o & s e g e r s ,2 0 0 3 ) ,但此估计很难使用平滑方法( s i i v e g e s ,2 0 0 7 ) 。 第四章平稳时间序列极值指标的假设检验 4 1 关于溢出值时间间隔分布的一个验证问题 设 五,置,) 是一平稳随机序列,边缘分布为f ,记m ,= m a x 五:i = k + l ,s ) ,m 。= m 。下面我们来考虑超过某一门限值u 的溢出值 ( e x c e e d a n c e s ) 之间的时间间隔的分布。 定义随机变量t ( u ) 如下: 丁( z ,) = m i n n 1 :以+ l uj x l 甜 , 可将其称为溢出值时间间隔( i n t e r - e x c e e d a n c et i m e 或者t i m e sb e t w e e n e x c e e d a n c e s ) 。 也就是,尸 丁( “) = 玎) = 尸( m “,以+ l z fi 置 “)( 刀1 ) ,或者, p t ( u ) 玎 = p ( m 。+ l 材lx i 甜) ( 刀1 ) 。 对于独立同分布的随机序列 五,置,) 而言,很容易的推出: p r ( u ) = 刀 = f ”1 ( “) ( 1 一f ( 甜) )( ,1 ) , 溢出值时间间隔服从几何分布;而对于不是独立的序列,无法得到上述的结论。 这样,对于同分布的随机序列 x 。,x 2 ,) 来说,令p = l - f ( u ) ,可对溢出 值时间间隔t ( u ) 的分布作如下假设检验: 风:p ,= 尸( 丁( “) = j = p ( 1 - p ) 川, ( _ ,1 ) ,即t ( u ) 服从几何分布 h i : t ( u ) 不服从几何分布 利用以上提出的假设检验,可用来判断序列是否是独立的;另外,也可以 用来说明对于极值指标0 1 的平稳同分布的序列来说,溢出值时间间隔t ( u ) 是 不服从几何分布的。 对于来自极值指标0 1 的平稳同分布的样本序列来说,可以通过类似于第 三章的d ( u 。) 条件来限制极值事件长期相关性,使得极值事件近似独立。这样, 对于来自同一分布的样本序列来说,应用极大似然法求出极大似然估计p ,可以 得到p j 的估计分;另外,对于几何分布来说,取大数值的概率都非常小,可以 将样本数据进行合理的合并分类,将样本分为k 类,每类样本的个数为n i ,对应 的概率为毒,。于是,利用分布拟合的z 2 检验统计量 存荟k 学, 在风成立时,近似服从自由度为( k - r - 1 ) 的z 2 分布,对给定的显著性水平a ( 0 口 1 ) 来说,该检验的拒绝域为: z 2 z z l _ 。( k - r - 1 ) 。 a r c h ( 1 ) 模型下的应用 a r c h ( 1 ) 过程是由e n g l e 在1 9 8 2 年引入的,形式如下: 置= qz r ,o - , 2 = + o r l z 1 2 ,其中,互n ( o ,1 ) 。 这里,喁要满足平稳条件。d eh a a ne ta 1 ( 1 9 8 9 ) 推导了a r c h ( 1 ) 过程的极 值指标,用蒙特卡罗随机模拟的办法得到了a r c h ( 1 ) 的极值指标,对 = o 1 ,= 0 5 的a r c h ( 1 ) 过程,0 = 0 8 3 5 ( 闫世锋,2 0 0 7 ) 。 下面应用= 0 1 ,a i = 0 5 的a r c h ( 1 ) 过程来进行模拟产生样本,来验 证该样本序列不是独立的;同时,也可用来说明对于极值指标0 1 的平稳同分 布的随机序列,溢出值时间间隔不服从几何分布。 模拟生成5 1 0 0 个来自= 0 1 ,口。= 0 5 的a r c h ( 1 ) 过程的样本后,首先 去掉初始的1 0 0 个观测值,消除模拟初始值的影响,选取剩余的5 0 0 0 个观测值 五,置,x ,。米作为样本值。 选取观测值丘,l 5 咖来作为门限值,即z ,= 墨,1 5 。,可以得到超过门限值 的溢出观测值2 5 0 个来作为研究对象。这样,可以得到溢出值时间问隔的一组样 本值石,五,咒,将出现频率小的观测值进行适当的合并,分为1 7 类,即 k = 1 7 。下面来验证z 不服从几何分布。作如下假设检验: - o :t 服从几何分布 v s h 1 :t 不服从几何分布 在原假设成立的情况下,p j = p 丁( “) = j = p ( 1 - p ) 川,其中,p = l f ( “) , 利用极大似然法可以得到p 的极大似然估计多= 玎巧。对于此样本来说,可得 到极大似然估计p = o 0 5 1 ,于是可以得到z 2 = 7 1 8 1 2 。这里,r = 1 ,在口= 0 0 5 的 水平下,检验的临界值, j f f 2 0 9 5 ( 七一,一1 ) = z 2 0 _ 9 5 ( 1 5 ) = 2 4 9 9 6 7 1 8 1 2 = z 2 。因此, 拒绝原假设h o ,认为t 不服从几何分布。 图4 1 = 0 1 ,q = 0 5 的a r c h ( 1 ) 的5 0 0 0 个观测值的散点图。 律客翰率与几饵分布理论叛军的地较豳 一乙留分彩理:e 祝枣羽4 拳绷簿 图4 2 来自n 0 = o 1 ,口l = 0 5 的a r c h ( 1 ) 的溢出值时间间隔样本的频率与几何分布理 论概率的比较图。 4 2 关于极值指标的假设检验 4 2 1 假设检验问题的提出 平稳的随机序列区别于独立的随机序列,其中一个重要特征就是观测序列 会产生极值簇( 溢值簇) 现象,而极值指标0 是刻画平稳序列极值簇现象的指标。 这样,平稳序列的核心问题就是围绕着极值指标0 米展开讨论。 对一个 x 。,x :,) 平稳随机序列,具有相同的边缘分布为f ,从定理3 2 可 知,如果极值指标0 1 ,溢出值会有成簇产生的趋势。f e r r o & s e g e r s ( 2 0 0 3 ) 对 这些溢值簇特征进行了研究和推断,利用了溢出值时间的点过程( h s i n ge ta 1 , 1 9 8 8 ) ,给出了溢出值时间间隔的渐近分布。证明了在满足混合系数的( “。) 条 件( s i i v e g e s ,2 0 0 7 ) 的情况下,正则化的溢出值时间间隔f ( 甜) 丁( 甜) 依分布趋向 于一个由指数分布和单点组成的混合分布,即:( 1 一e ) 6 0 + ,其中,岛( ) 是 一,一一 一个在0 处取值的l 退化分布,( ) 是一个服从均值为0 一的指 数分布。我们从这里可以看到,极值指标0 决定了极值簇间的时间问隔的期望值。 b 自n t 捃i i e i i k 上【” 譬l l 。螂;鲥i:=时i 【妇 t, t t i l o-i,e。- _ l l r | 。r|ii|引l,霹f|, 另外,在4 1 节中已经讨论了,对于独立同分布的随机序列来说,溢出值时 间间隔t 服从几何分布。而很容易的知道,对于同分布的平稳随机序列来说, 无法得到同样的结论。但是,从上面的关于f e m & s e g e r s ( 2 0 0 3 ) 的介绍可以 知道,正则化的溢出值时间间隔f f ( u ) t ( u ) 的渐近分布是( 1 - 0 ) 6 0 + 钒形式的混合 分布。这样,受到f e r r o & s e g e m ( 2 0 0 3 ) 的启发,我们认为对于平稳的随机序 列来说,溢出值时间间隔t 服从混合几何分布。又由于极值指标0 影响着平稳序 列的极值簇行为,是区别于独立序列的重要参数。考虑到这些原因,我们构造如 下的混合分布m g ( 8 ,p l ,p 2 ) : p t = 七) = 8 g l ( k ) + ( 1 一目) g 2 ( 七) ,g ( 七) = b ( 1 一a ) ,i = l ,2 。 此外,对于平稳的随机序列,很多学者都提出了各种的条件,对序列的平 稳性进行一定的假定,以便能够很好的限制序列间的相依性。如:定理3 1 中的 d ( u 。) 条件( l e a d b e n e r ,1 9 7 4 ) ,使得每个区组内的极值事件是近似独立的;f e r r o & s e g e r s ( 2 0 0 3 ) 混合系数( 甜。) 条件;在s f i v e g e s ( 2 0 0 7 ) 中,提到了d 2 ( z f 。) 条件( c h e m i c ka ta 1 ,1 9 9 1 ) ,这个条件是基于l e a d b e t t e r & n a n d a g o p a l a n ( 1 9 8 9 ) 提出的,对于落入一个簇中的溢出值进行了限定。 这样,我们可以认为在满足类似于上述的限定条件下,对于相互独立的随 机序列来说,从4 1 节中的讨论可以知道,溢出值时间间隔t 服从几何分布,极 值指标0 = 1 ;而对于极值指标0 i 的平稳序列来说,假定溢出值时间间隔t 服 从混合几何分布m g ( g ,p l ,仍) : p t = k ) = o g l ( k ) + ( 1 一目) g z ( 七) ,g ,( 七) = 仍( 1 一a ) 一,f = l ,2 。 于是,设样本t = ( 石,) ,针对上述情况,提出如下假设检验问题( 1 ) : 日:t 服从几何分布g ( p ) v sh :t 服从混合几何分布m g ( o ,p 。,p 2 ) 注意到几何分布g ( p ) 可以表示成混合几何分布的形式,即: p t = k ) = o g l ( 七) + ( 1 一目) g 2 ( 七) ,g j ( j i ) = 只( 1 一只) ,i = 1 ,2 。 其中,g l ( 后) = g ( k ) ,曰= 1 。 这样,上述检验问题也就等价于如下的有关参数的复合假设检验问题( 2 ) : h o :秒= 1 v s q :口 1 在原假设风成立时,溢出值时间问隔服从几何分布g ( p ) ,密度函数为 尸( 丁= 七) = p ( 1 一p ) “,可以得出p 的极大似然估计p = 刀l ;在备择假设q 成 立时,溢出值时间间隔服从混合几何分布m g ( o ,p l ,p :) = o g ( p 。) + ( 1 - o ) g 2 ( p :) , 可以得到秒,p l ,p 2 的自助法极大似然估计( 郑家晨,2 0 0 8 ) 痧,p 。,厶。这样,可 以通过构造似然比统计量,对该假设检验问题( 2 ) 进行检验。似然比统计量为: 兀 翰( 1 - 3 。) 纠+ ( 1 一莎) p :( 1 - 3 :) 纠) 五( 丁) = 型1 一 兀b ( 1 - b ) 卜1 因此,在j t ( r ) 比较大的时候,备则假设成立观测到样本点的可能性比较大,故 拒绝原假设。因而,取该检验问题( 2 ) 的拒绝域为w = t :2 ( t ) c ) 。在原假 设为真时,检验犯第一类错误的概率为 p 旯( 丁) c 口= 1 ) , 可以利用随机模拟的方法,得到原假设为真时,2 ( t ) 的分位数值,从而给出该 拒绝域数值临界值c 。 另外,也可以通过似然比检验统计量的渐近分布的性质得到该检验问题的 拒绝域。在复合原假设风成立的情况下,有0 = 1 ,未知参数的个数为2 个;在 备则假设成立的情况下,未知参数的个数为3 个,这样,由似然比检验统计量的 渐近分布的性质可以知道,2i n 兄( 丁) 与z 2 ( 七一,) = z 2 ( 1 ) ,因此,在给定口水 平下,该检验的拒绝域为: t :2 i n 2 ( t ) z 2 h ( 1 ) ) 。 4 2 2 假设检验的应用 获取样本的方法 对于以下各种模型的模拟研究时,均产生长度为1 1 0 0 0 的观测值,去掉初 始1 0 0 0 个观测值后得到的,以消除模拟研究时初始值的影响,选取此后的1 0 0 0 0 个观测值作为样本。 在得到来自指定模型的样本后,选取次序统计量五螂。l 。作为溢出观测值的 门限值,将样本中超过门限值的观测值作为溢出值并挑选出来,这样得到的5 0 0 个观测值作为溢出观测值。通过记录溢出观测值的发生时刻,就可以得到溢出值 时间间隔的样本,这些溢出值时间间隔的样本就作为我们下文各模拟试验的研究 对象。 独立同分布情况下的应用 下面考察对于在原假设h o 成立的情况下,来验证该检验问题。也就是说, 溢出值时间间隔服从几何分布g ( p ) 。通过随机模拟的方法得到样本t = ( 正, 正。) ,是服从几何分布g ( p ) 的,这样按照4 2 1 节所述,可以得到各个未知参数 的极大似然估计,故而可以计算出似然比统计量,也就能够得到 兀 翰( 1 一a ) 纠+ ( 1 一参) p :( 1 一敦) 纠) 2 i n 2 ( t 、= 2 l n 上 兀p ( 1 一p ) 卅 ,= l = 2 2 0 3 3 8 4 1 = z 2 0 9 5 ( 1 ) 。 因此,在口= 0 0 5 时,拒绝原假设,认为极值指标0 6 6 3 5 = z 2 。舯( 1 ) ,可 以认为,在口= 0 0 1 时,拒绝原假设,认为极值指标0 3 8 4 1 = z 2 0 彤( 1 ) 。故在口= 0 0 5 时, 拒绝原假设,认为极值指标秒 6 6 3 5 = z 2 。9 9 ( 1 ) ,可以认为在口= 0 0 1 时, 拒绝原假设,也就是说认为极值指标0 l 的。 从上面对g a r c h ( 1 ,1 ) 的模拟研究结果还可以看到,对于g a r c h ( 1 , 1 ) 平方过程 霹) 和g a r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论