(概率论与数理统计专业论文)平稳序列极值指标的一种估计.pdf_第1页
(概率论与数理统计专业论文)平稳序列极值指标的一种估计.pdf_第2页
(概率论与数理统计专业论文)平稳序列极值指标的一种估计.pdf_第3页
(概率论与数理统计专业论文)平稳序列极值指标的一种估计.pdf_第4页
(概率论与数理统计专业论文)平稳序列极值指标的一种估计.pdf_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文对平稳序列的极值指标进行了研究文章的第二章介绍了极值理论的基本 知识;第三章介绍了平稳序列的极值指标的几种估计方法,包括从等待时间的角度 寻找极值指标的估计在此基础上,本文第四章给出了极值序列等待时间可能的分 布形式。混合几何分布,并以此得到一种新的极值指标估计方法为了讨论估计方 法的效果,本文采用随机模拟的方法,从不同的角度比较了几种估计方法 关键词:极值指标,极值理论,平稳序列,等待时间,a r - m a x 模型 a b s t r a c t w | ed j s c u 蹈t h ee 8 t i m a t o rf o re 吼r e l a li n d 懿o fs t a t i o n a r y8 e r i 鹪ab r i e fi n t m d u c t i 叽t ot h ec l a 鼹i c a le 吼r e m ev a l u et h e 0 珂i sg i v e ni nc h a p t e r2 i nc h 印t e r 3 ,w ei n t r o d u o e v e r a le s 乞i l a t i n gm e t h o df o r ( t r e m a li n d e xo fs t a t i o n 猢了s e r i 箦, i n d u d i n gt h en l e t h o di n 们e wo fi n t e r 删e n c et i m e i nc h 印t e r4 ,骶百v eap o s - 8 i b l e 陆t r i b u t i o no ft h ei 玎七日( c e e d e n o et i 玎1 e :m i 】( i n 分g e c ,m e t r i cd i 8 t r i b u t i o n ,丘o m w h i 6 hw el ,e ta 珈芎w 髑缸m a t o rf 研嗽e m 矗li n d e x i n0 r d e rt od i s c u 鼹t h ee f f b c t0 f t h en e we s t i 斌o r ,w ec o m p 盯et h e e 8 t i m a t o r 8v i a8 i m l 山a 乞i o n k e ”m r d s :e i 础r e m a li n d 麟,e 赋r 瞰l e 、r a l t h e 0 s t a t i o 舶叫s e r i 鹤,i n t e r e x - c e e d 锄c et i l e ,a r - m a xm o d d 1 1 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成 果据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或 撰写过的研究成果对本文的研究做出重要贡献的个人和集体,均已在文中作了明 确说明并表示谢意 作者签名:擞咻赳 学位论文使用授权声明 本人完全了解华东师范大学有关保留,使用学位论文的规定,学校有权保留学 位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版有权将学位论 文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅有权将学位论文 的内容编入有关数据库进行检索有权将学位论文的标题和摘要汇编出版保密的 学位敝作者签名:铆配惫导师签名 日期必铲弓 日期 夕扳 莎易) 第一章绪论 研究随机变量极值分布的理论称为极值理论( e 础r e m e u et h e 0 珂) f i s h e r 与t i p p e t t 在1 9 2 8 年提出的样本最大值的渐近分布理论开创了极值理论的先河 在随后的半个多世纪里,学者们在这一领域展开了广泛的研究,极值理论也得到不 断的应用和发展 本文将主要研究平稳序列极值指标( e l 础r e m a li n d 麟) 的估计方法,旨在从等待 时间的角度出发找到一种依赖尽可能少的参数的极值指标的估计方法,并用随机模 拟的方法比较新的估计方法的效果 本文的第二章将简单介绍极值理论对于独立同分布随机变量序列,根据f i s h e r 和t i p p e t t ( 1 9 2 8 ) ,g n e d e n k 0 ( 1 9 4 3 ) 以及j e n h 瑚o n ( 1 9 6 9 ) 的研究,我们知道其极 值的渐近分布可以归纳为个单参数分布的一般形式,其中的单参数,y 即为极值指 数( e ) 【t r e i n ev a l u ei n d e ) 【) 本文将从不同的角度,介绍前辈学者做出的几种关于7 的估计方法对于平稳随机变量序列,根据l e a d b e t t e r ( 1 9 8 3 ) 的研究,我们知道满 足长期渐近独立条件的平稳时间序列极值的渐近分布为极值分布,且它们与具有相 同边际分布的独立序列具有相同形式的渐近分布,而序列的短期相依性仅体现在极 值指标上因此,对于有相依性的序列而言,极值指标的估计成为研究极值模型的 关键 本文的第三章将介绍前辈学者对极值指标估计方法的研究:h s i n g ,h 心e r 和 l e a d b e t t e r ( 1 9 8 8 ) 引入点过程模型,并证明了随机变量序列中超过较高门限值的点 的极限过程为复合泊松过程l e a d b e t t e r 西文( 1 9 8 8 ) 和o b r i e n ( 1 9 8 7 ) 分别提出 极值指标的区组( b l o c l ( 8 ) 估计和游程( r l - n s ) 估计方法定义两次溢值点发生的间 隔为等待时间( i n t e r e ) 。c e e d a n c et i m e s ) f e r r o 和s e g e r s ( 2 0 0 3 ) 研究了等待时间的 分布,并基于此找到极值指标的一种估计,并证明其相合性 受此启发,本文第四章在f e r r o 和s e g e r s ( 2 0 0 3 ) 的基础上推广等待时间的分 布形式,并依此得到一种新的不依赖与人为选定参数或者与尽可能少的人为参数有 关的估计量同时我们将用随机模拟的方法比较新的估计方法与已有的若干估计方 法 1 第二章极值理论 2 1 独立同分布序列的极值理论 2 1 1 独立同分布序列极值分布的概率性质 设 五,托,) 为独立同分布随机变量序列,其共同的边际分布函数为 f ( z ) ,记五。n 为序列的最大值,即。 n = m a x ( 魁,尥,) 由于随机变量序列的最小值 置。n = n l i n ( 五,恐,) = 一m a x ( 一墨,一恐,一k ) , 所以,由极大值的分布不难得到极小值的分布本文将主要研究随机变量序列的极 大值 极值理论主要讨论k n 的渐近分布,即。 p ( 瓮剑_ g ,n _ o o ( 2 1 ) 需要解决两个主要问题;找到使( 2 1 ) 式成立的可能的非退化的分布函数g ( z ) ;根 据分布函数f ( z ) ,以找到使( 2 1 ) 成立的序列 和 k ) ,其中 o f i s h e r 和t i p p e t t ( 1 9 2 8 ) 解决了第个问题,证明了极值分布只有三种形式:n 舌 c h e t p a r e t o 型,g u m b e l 型以及w e i b u l l 型g n e d e n l ( o ( 1 9 4 3 ) 对第二个问题进行 了研究,分别找到了对应于这三种分布形式( 分布函数g ) 的吸收域( d o m a l i no f a t t r a u c t i o n ) ,记为d ( g ) 所谓吸收域d ( g ) 是指满足一定条件的一组分布,而这些 分布的极值分布均为g 他们的研究结果为如下定理t 定理2 1 ( f i s h e r - t i p p e t t g n e d e n l 【0 定理) 任一变量的极值分布必属于下面三种类型之一( q o ) : 一,雕c 危e t p o 他t o 型: 嘣加 o 呸0 i e 唧z o 2 第二章极值理论 华东师范大学硕士论文3 等三= 警等_ a 一,对任意入 。 n 砂g t m 6 e z 型: a ( z ) = e c 一。, z 7 已 且f d ( a ) 。当且仅当存在函数6 当z _ 时, 生;擎掣一e , 对任意t o 1 一f ( z ) 。一。 一圳肌铀谢f 型: 叫垆f r 鬟 且f d ( 皿a ) ,当且仅当z 。 o 1 一f ( z 。一圭) “、 上剧一“ 其中茹。为x 分布的右边界 j e n l 【i 1 1 :s o n ( 1 9 6 9 ) 把这三种形式归结为个单参数分布的一般形式: g ,y ( z ) = e 】【p ( 一( 1 + p ) 一1 n ) ,其中1 + ,y z o ( 2 2 ) 我们般称,y 为极值指数( 疏砌n ev 砒u ei n d e x ) 在极值理论,尤其是独立同分布 随机变量的极值理论中是非常关键的一个量前辈学者们对7 给出了相当多具有优 2 1 2 独立同分布序列极值指数的估计 极值指数的估计方法可以分为三大类: ( i ) 样本分位点法( m e t h o do fq u a n t i l e ) ; ( i i ) 区组最大值法( m e t h o do fb 1 0 c km a 对m a ) ; ( i i i ) p o t 方法( p e a k 8o v e rt h r 曲o l da p p r o a c h ) 第二章极值理论华东师范大学硕士论文4 ( i ) 样本分位点法 由q q 图( q q p 1 0 t ) ,可得当p _ o 时,等一一y 。其中q ( 1 一p ) 为样本分 位点于是h i u ( 1 9 7 5 ) 利用,y 与样本分位点的关系,给出了针对p a r e t o 型极值分 布的极值指数的估计方法, 风,n = 去1 0 9 一,n l o g 咄n ( 2 3 ) p i d 凼( 1 9 7 5 ) 同样给出了基于分位点的极值指数的估计方法: 协= 壶,昭c 鼍黑篆等, 仁4 , 其中,f 明表示大于七的整数中最小的个与h i 估计相比。p i c k 觚d s 估计对极 值分布的形式没有限制其后,d e l d k e r 8e t 耐( 1 9 8 9 ) ,b e i r l a n t 以口j ( 2 0 0 5 ) ,s 昭e r s ( 2 0 0 5 ) 等都对h i l l 估计及p i c l 【a n d s 估计做出推广或者改进 ( i i ) 区组最大值法 由( 2 2 ) 式,我们知道t 学吼加 三 二= 嚣k 翟0 停0 ( 2 5 ) ( 2 5 ) 式所定义的为广义极值分布( g e n e r 址z e de 飙r 锄ev a l u ed i s t r i b u t i o n ) ,简称 为g e v 分布而极值指数的估计可以通过拟合广义极值分布来得到p ,盯分别是 位置参数与刻度参数的估计,7 也被称为形状参数 区组最大法的主要想法是将x 的总共t 个观测值按如下形式进行分组: 五i + l 恐住| i 鼍m 1 ) n + 1 ,。i + 1 ,坼) , 前m 个区组的最大值,记作 k ,l = l ,m ) 为估计参数所需要的样本他们独立 同分布服从于g ( 矽,盯,仉p ) ( 1 ) 极大似然方法 第二章极值理论华东师范大学硕士论文5 记t k ,i = 1 ,m ) 为来自g e v 分布的独立同分布样本,其对数似然函数为。 当,y 0 时, l o g ) 一m l o g 叫扣1 0 9 ( 1 + 7 擎) _ ( 1 + 7 竽) 1 ( 2 6 ) 当,y = o 时, 1 0 9 三h 7 川弛) = 一m 1 0 9 盯一善唧( 一掣) 一萎半( 2 7 ) 通过最大化( 2 6 ) 或者( 2 7 ) 式可以得到参数( ,y ,p ,口) 的极大似然估计般情况下, 该估计并不满足极大似然估计的渐近性质,但是s m i t h ( 1 9 8 5 ) 指出在y g e y 时,当7 一0 5 时,该估计的渐近正态,渐近有效性和一致性都成立而事实 上,y 与g e y ( 2 ) 概率加权矩( p r o b a b i l i t y w b i g h t e dm o m e n t s ) 方法 所谓概率加权矩是g r e e n w o o d ( 1 9 7 9 ) 提出的,其定义如下- 屿,r ,。= e y p 【f ( y ) 】【1 一f ( y ) 】8 f k 菇n g ( 1 9 8 5 ) 给出了g e v 分布的概率加权矩; m ,加= 击 肛一号【1 一( r + 1 ) 1 r ( 1 一,y ) 】) 取r = o ,1 ,2 ,并用 霸,n o 的无偏估计或者渐近一致估计( l a n ( 1 w e h r ( 1 9 7 9 ) ) 替换后, 即可用数值方法解出参数( ,y ,弘,矿) 的估计在,y 可ix 亡) 第二章极值理论华东师范大学硕士论文6 定义2 1 广义p 龇e t o 分布 f 1 一( 1 + 警) 嘶,秒( o ,0 0 ) ,y o , g ( 可) = l e x p ( 一詈) , 矽( o ,o o ) ,y = o , ( 2 8 ) i 1 一( 1 + 警) 一l n ,秒( o ,一号) , ,y o 和k ,以及非退化分布g , 使得 p 【丝安生z 】三g ( z ) ,他_ o o 。 a n 一 1、77 如果d ( ) 条件成立,且对所有的z ,= z + k ,则g 为一个广义极值分布 定理2 3 ( l e a d b e t t e r ( 1 9 8 3 ) ) 第二章极值理论华东师范大学硕士论文8 若以下( 1 ) 一( 3 ) 条件成立s ( 1 ) 存在常数列 o 和k 以及非退化的分布函数g ( z ) 使得。 p 【坐鱼= 二鱼叫三台 ) ,n o o ; n j ( 2 ) d ( ) 条件成立且对所有的z ,= n n z + 6 n ; ( 3 ) 存在z ,使得p 【( 尬。一k ) 卅收敛,则: p 【竿叫3 g ( 巩n _ o o 这里0 ( z ) 是广义极值分布,且 g ( z ) = e 吵( z ) ,口【0 ,1 】 ( 2 1 2 ) 定义2 3 ( 2 1 2 ) 式所定义的口即为极值指标( e 飙r e m a li n d e 对 当0 p ,我们称 这样的x 为滥值点( e x c e e d a n c 鹤p o i n t ) 溢值点发生的时刻我们称为溢值时点 ( e ) :c e e d a n c et i n 瑚) ,记为& 序列的个溢值点,就有相对应的个溢值时 点,& ) = 歹i 坛 仳n 】, 歹= 1 ,2 ,( 3 2 ) t = l 为了得到的极限分布形式,还需对序列的相关性做出限制,如下条件: 定义3 1 ( n ) 条件 记乃,七( ) = 仃( 五 ) :j i 后) 为盯一域对任意的a 1 五,l ( ) ,a 2 五托n ( 乱n ) 以及1 z n s ,有; p ( a 1na 2 ) 一p ( a 1 ) p ( a 2 ) i q ( n ,s ) , 其中当n _ o o 时,q ( 礼,s 竹) _ o 9 第三章平稳时间序列极值指标的估计华东师范大学硕士论文1 0 ( ) 条件比d ( ) 条件稍强一些这主要是表现在( ) 条件包含了 五 :歹t 七) 所有的信息,而d ( ) 条件只是关于 五:j t 七) 最大样本点 的信息有了( t i ,1 ) 条件,我们就能得到如下定理: 定理3 1 ( h 8 i n g 砑以( 1 9 8 8 ) ) 设 x ) 是平稳序列,极值指标为p 存在一列阈值t ,l 使得( t n ) 条件成立 且n f ( ) _ r ( o ,) 若存在整数序列,和分布7 r ,其中s n = o ( r n ) ,= o ( n ) ,n o r ( 死,s ”) = d ( ) 且当n o o 时,对所有j 1 有0 ) _ 7 r ( j ) ,则 l 二。 其中为g p ( 口7 ,7 r ) ,d p ( ) 表示个复合p o i s s o n 过程 定理3 1 告诉我们 k 的极限形式为个复合p 0 i 8 s o n 过程这个复合p o i s s o n 过程表现为:在( o ,l 】的区间内平均打个簇,而每个簇的大小的分布是霄,并且簇 的大小与簇的个数是独立的 3 2区组估计( b l o c l ( s ) 与游程估计( r u n ) 由定理( 3 1 ) ,极值指标的估计可以理解为簇的个数与所有溢值点的比值不同 的定义簇的方式就产生了区组估计与游程估计( l e a d b e t t e re 亡0 z ( 1 9 8 9 ) ) 区组估 计的思想是将平稳序列样本分成七个区组,并认为同一区组中出现的溢值点为个 簇即:选定阈值牡以及区组长度7 , 七 七- 1 l 纪一1 ) ,步 缸) 鳄( 让;r ) = 生百一 m - 1 l ( 五 t ) i = l ( 3 3 ) 其中后= 【佗州,坛j 一1 ) r j r = m a x 托一1 ) r + 1 ,玛r ) 游程估计的想法是将两个接近的溢值点看作为一个簇,其接近程度即为游程的 长度即:选定阈值让以及游程长度r 。 t l r ( 钆一r ) 一1 l ( 五 u ,坛,件,让) 谚( 让;r ) = 兰b 广一 佗_ 1 l ( 五 仳) 扛= l ( 3 4 ) 第三章平稳时间序列极值指标的估计华东师范大学硕士论文1 1 其后,s m i t h 与w e j 鼹m 缸( 1 9 9 4 ) 提出区组估计的改进形式w e i 潞m a n 与n o 晚k ( 1 9 9 8 ) 研究了两种估计方法的渐进偏差并对两种估计进行了比较,发现游程估计方 法比区组估计更优i i s i n g ( 1 9 9 3 ) ,w e i 觥与n 0 v a k ( 1 9 9 8 ) 证明了在适当条件下 估计的渐进正态性 区组估计与游程估计都给出一种簇的定义方式,并由此得到极值指标的估计 两种估计方法在定义簇的时候都需要给定一些辅助参数( a u 】d l i a 巧p a r 锄1 e t e r ) ,比 如区组估计中的区组长度和游程估计中的游程长度这些参数的选取较为任意,而 不同的选取方式又会对极值指标的估计产生很大的影响下面将要介绍的就是一种 依赖更少辅助参数的估计方法 3 3 从等待时间角度寻找极值指标的估计 f e r r 0 与s e g e r 8 ( 2 0 0 3 ) 从等待时间的角度出发,得到如下定理t 定理3 2 记氕,j ( 锃) 为由【五 让,七t z ) 生成的仃一域若存在正整数= d ( ) 使得对任意的c 0 有。 q ,锄( ) 2l 嚣和s 叼lp ( bia ) 一p ( b ) i = 。( 1 ) , ( 3 5 ) 其中,a 五,k ) ,b 五+ 和,则 p 尹( ) t ( ) t 一pe 印( 一巩) , t o ( 3 6 ) 这里,t ( ) 表示取阈值为钍n 时的等待时间由定理3 2 可知,= 户( 牡) t ( 仳) 三 乃,其中乃服从混合分布: ( 1 一p ) e o + 口p 口, 其中印表示代= o 】- 的退化分布,肋表示均值为p - 1 的指数分布进一步可得等 待时间t 正则化的近似分布形式= - p ( t n ) = 缈一, n 1 第三章平稳时间序列极值指标的估计华东师范大学硕士论文1 2 实际中,我们一般取t t l 为序列的某个高阶分位点( 比如蜀o 9 5 ,l i 或者x l o 9 n 1 分位 点) ,而p = f ( ) ( 相应等于o 9 5 或者o 9 ) 我们知道,独立同分布序列溢值点间等 待时间的分布为个几何分布这里得到等待时间的分布是一个混合分布:以概率 1 9 矿取t = l ;当t 1 时,为一个均值等于t 与的几何分布本文的第四章, 将把这一分布形式做进一步的推广,从而得到一种估计方法 基于此分布,f e n 0 和s e g e 玛( 2 0 0 3 ) 给出了样本对数似然函数,并指出可以通 过数值解法就能得到了极值指标的极大似然估计另外,由矩方法也能得到极值指 标的一种估计 2 亿一1 ) ) 2 霞( 仳) = 景l _ 一, ( 3 7 ) ( 一1 ) ( 正一1 ) 亿一2 ) i = l 为样本的溢值点个数为了避免最大等待时间不大于2 时,( 3 7 ) 式无解的问题, 可以做如下改进t im i n ( 1 ,墅掣) ,m a x 正) 2 , 既( 让) = 2 量砰 lm i l l ( 1 ,铭( 乱) ) ,m a x 正 2 f e r r o 与s e g e 瑙( 2 0 0 3 ) 提出的估计在一定程度上解决了区组估计与游程估计 需要人为给定若干参数的不足但是也存在着自身的问题:由于等待时间的分布在 r = 1 这一点为概率为1 一口矿的退化分布这样一来,极值指标的估计就会对样 本中正= 1 的个数相当敏感 第四章平稳序列极值指标的一种新的估计 4 1 等待时间分布的一种新的假设 本文以下将主要采用a r - m a x ( a u t o 鼬f e 鼹i o n - m 8 硝删l 瑚) 模型进行研究a r - m a x ( 口) 的定义如下。 五= m 觚 q 五“( 1 一口) 五 , os 口 1 , 五的分布函数为f ( z ) = 1 一e 一1 肛 根据b e i r l a 呲da z ( 2 0 0 4 ) ,我们知道: p 霸硝= p 阢z ,( 1 一口) z i 茹,( 1 一n ) 磊叫 = p 【五卅 p ( 1 一q ) 磊明 n 一1 = 仞( p 【一 l + ( 1 一口) ( n 一1 ) ) 叫 即给定参数a ,就可以得到该模型的极值指标为1 一口选取此模型可以方便我们 的模拟研究 第三章中,我们指出平稳序列的溢值点会呈现簇化,也就是说由于序列的平稳 性,当序列出现一个溢值点五后,不久即出现又一个溢值点的可能性很大这样 的表现就会使相应的等待时间取值较小,相应也有取值较大的等待时间图1 为上 述a r - m a x ( a ) 模型分别取口= 0 2 ,o 5 ,0 7 样本量竹= 2 0 0 0 0 ,阈值= 托i 的 等待时间的直方图,可以看出,等待时间的分布确实呈现出分散化 f e r r o 和s e g e r s ( 2 0 0 3 ) 的模型将等待时间分为两类: 正= 1 ) 与 互1 ) 由 此得到的等待时间的分布会受到 正= 1 ,的次数的影响,进而得到的极值指标的 估计也会对 正= 1 ) 的次数相当敏感 1 3 第四章平稳序列极值指标的一种新的估计华东师范大学硕士论文1 4 图j 等待时间的直方图自上而下分别为a 冗一朋h x 徊矽模型,a r 一 朋a x 徊矽模型和a r m a x p 砂等待时间的直方图序列长度为 2 口口d 口,取阈值= x p 9 叫 为了避免这一缺点,我们给出一种新的等待时间的分类方法:不人为给出具体 第四章平稳序列极值指标的一种新的估计华东师范大学硕士论文1 5 的分类门限,取而代之的是两个参数不同的几何分布,即: a = tlt g 白1 ) ,t 噩,霸) ) , b = tit g ( p 2 ) ,t 噩,甄) ) , au b = 乃,歹= l ,) 且a nb = d 其中,g p l ) 与g ( 仡) 为两个参数为p l 和p 2 的几何分布,不妨设n 现当仡= l 时,该模型即退化为单点分布与几何分布的混合,所以混合几何分布模型可以看成 是f e r r 0 和s e g 啪( 2 0 0 3 ) 模型的一种推广对混合几何分布模型比较直观的理解 是,取值较小的正( 并不限于正= 1 ) 更可能属于b ,但同时并不排除其属于a 的 可能性由此,我们可以得到等待时间的分布为混合几何分布,其分布函数为, p ( t = 后) = q ( 1 一p 1 ) 七一1 p l + ( 1 一g ) ( 1 一p 2 ) 七一1 p 2 ,( 4 1 ) 其中q 为混合比例( m i ) ( t u r ep r o p o r t i o n ) 沿用第三章的定义,( 4 1 ) 式所定义的 t ) 的均值为: 口1 一g 1 石十i 一再: 化简后可得混合比例的表达式为; 口= 磐意等, 他2 , 以及p l 和仇与门限值p 的基本的大小关系: o p 1 ( 1 一p ) p 2 1 4 2 基于混合几何分布的极值指标的估计 ( 4 3 ) 第三章的讨论中,我们知道极值指标的估计可以理解为簇的个数与所有溢值点 的比值不同定义簇的方法会产生不同的极值指标的估计在我们的混合几何分布 模型中,我们将等待时间分为两类:a ,b 根据我们的假设,p 1 与等待时间序 列 正,i = 1 ,一1 由( 4 1 ) 式,可得样本对数似然函数为; ( 噩,易,一1 ) = 1 0 9 【印1 ( 1 一p 1 ) 白一1 + ( 1 一g ) p 2 ( 1 一仇) 幻一1 】 代入( 4 2 ) 式后得。 肌轧) = 蓦l o g 删( 1 刊+ 删( 1 刊】 ( 4 4 ) 需要注意的是( 4 4 ) 式中,我们假设 噩,疋,豫一1 ) 为独立随机变量而事 实上, 噩,马,甄一t 的独立性很大程度上受到序列( 五) 相关性的影响以下 的模拟研究中,我们将采用b o o t s t r 印的方法,用重抽样的办法来得到估计所需样 本,进而利用( 4 4 ) 式得到极值指标的极大似然估计另外,( 4 4 ) 式的形式相当复 杂,要从中得到p 极大似然估计的显性表达式比较困难可以采用数值解法,比如 n e w t o n r a p h s o n 迭代法得到使( 4 4 ) 式最大的n ,耽考虑到( 4 3 ) 所得到的结果。 迭代初值的选取可以用枚举法得到,在较低的精度上让p z 和纯取遍所有可能的值 得到使对数似然函数最大的p l 和沈比如当p = 0 9 5 时,我们以0 0 1 为精度这 样仇的可能取值有0 0 1 到o 0 4 的4 个值,而仇的可以取0 0 6 到o 9 9 的9 4 个值 将迭代结果代入( 4 2 ) 式即可得到极值指标p 的极大似然估计一g 4 3 极值指标估计方法的模拟研究 本节,我们将对不同的平稳序列模型采用模拟的方法从均值,方差以及涵盖机率 ( c o v e r a g ep r o b a b i l i t y ) 三个角度比较上文所述三种极值指标估计方法。( 3 4 ) ,( 3 7 ) 第四章平稳序列极值指标的一种新的估计华东师范大学硕士论文1 7 以及一g ( 3 4 ) 的游程估计取游程长度7 = 1 ,5 ,9 所谓涵盖机率来源于经典统计 学派的区间估计的定义 定义4 1 涵盖机率 设p 为待估参数,口的个区间估计为c 厶,所谓涵盖机率为以下概率t g p = p ( p c 而) 实际应用时,涵盖机率等于多次重复后区间估计包含参数真值的概率 本文中,我们将采用b o o t s t r 印方法得到极值指标的估计,并依此得到其涵盖 机率具体步骤如下t ( 1 ) 模拟产生一列平稳序列 五,t = 1 ,n 取定阈值后可得溢值点及相应的 等待时间序列 正,i = l ,) ; ( 2 ) 产生个随机数,对模拟产生的等待时间序列重抽样( 风嬲m p l e ) ,得到 b o o t s t r 印样本集 耳,t = 1 ,) ; ( 3 ) 根据 霉,i = 1 ,) 得到极值指标的估计矿; ( 4 ) 重复( 2 ) ,( 3 ) b 次,即可得到b 个极值指标的估计,按由小到大的顺 序排列为。以 呓 给定置信水平口,则可以得到一个口的区间估 计:【p c b a 2 j ,口b ( 1 一a 2 ) j 】- ( 5 ) 重复( 2 ) 一( 4 ) 仇次,计算其中包含口真值的区间估计的个数,即可得到估 计的涵盖机率 以下的模拟研究,我们将产生2 0 0 0 0 个序列样本 x ,i = 1 ,2 0 0 0 0 ) ,选取1 5 个阈值钍n ,分别为样本分位点x d 舶至跖关于涵盖机率,我们取b = 1 0 0 0 ,m = 5 0 0 4 3 1 极值指标估计均值及方差模拟比较 图2 共有3 组图,自上而下分别为a r m a x ( o 2 ) ,a r m a x ( o 5 ) 以及a r m a x ( 0 7 ) 模型各种极值指标估计的均值及方差左图表示估计的均值图中我们 分别在参数p 的真值处添加了一条横线,以便于比较右图表示估计的方差 对a r m a x ( 0 2 ) 模型,估计量( 3 7 ) 与口m g 的期望与真值间的偏差都不大, 且估计( 3 7 ) 较p m g 更接近真值而游程估计的期望与真值间的偏差相对较大, 第四章平稳序列极值指标的一种新的估计华东师范大学硕士论文1 8 这一点在游程长度取值较大以及阈值取值较小时尤为明显从方差的角度看,矽材一g 比估计量( 3 7 ) 的方差更小而游程估计的方差虽然较小,但由于其偏差很大,估计 效果也没有口m g 理想所以,一g 与估计量( 3 7 ) 相比,偏差相近,但更稳定 对a r - m a x ( o 5 ) 以及a r m a x ( o 7 ) 模型,口m g 较估计量( 3 7 ) 偏差更小, 且方差也相对更小而游程估计的方差虽然最小,但是由于其偏差较大,估计效果 并不理想 可以看到对不同的模型,估计量( 3 7 ) 的方差相对较大,这也与我们在4 1 节 中所提到该估计对 正= 1 次数敏感的推断一致总体来说,从均值及方差的角度 来看,我们得到的估计口m g 与估计量( 3 7 ) 相比更稳定,而与游程估计相比,估计 偏差更小 一一一一一一一一:j 2 + + + + - + + + + + m 意;麓黧:裳黧龇融m 舣( o 戤a m m 唧脚以及a 融 := 冀黧竺竺雯竺的涵盖机率我高磊善戮5 :0 嚣等 一器竺? 懒涵主蠢。蒜巍i 焉罢 涵盖机率等于9 5 处添加条横线 “9 “干列r 睫于此较,我幻在 在阈絮。:黧嬲竺与的涵盖懈都黻,只是 在阈值取值较小时,涵盖机率比估计( 3 7 ) 小 。皿叽午伺p 秋灭,只是一g 都比嚣鬻。:竺二:竺似7 ) 枫取大粉阈鲥媚盖机率 都比箩( 3 7 ) 大,尤其胡值取值较小暇为矗蛔聊冈幽啪涵盖机率 栅黧黧黧警机率相对龇 这一点在闺值取值偏小时尤 栅显觚猎撕的游擘长度账游程估磊矗矗篡醐小毗 第四章平稳序列极值指标的一种新的估计 华东师范大学硕士论文2 0 图? 涵盖机率比较自上而下分别为a r 一朋a x 徊缈,a r 一似x 阳矽 与a r m a x 徊砂模型各种极值指标估计的涵盖机率纵坐标为估 计量的涵盖机率,横坐标以及图示与图2 一致 结束语华东师范大学硕士论文2 1 结束语 通过研究,我们认为极值发生间的等待时间的分布为两个几何分布的混合,而 其中的混合比例与极值指标有直接的关系基于此,我们得到了一种依赖相对较少 人为参数( 仅需给定极值门限阈值) 的极值指标的估计方法,即口m g 为了验证该 估计的效果,我们采用随机模拟的方法从均值和方差以及涵盖机率的角度比较了该 方法与其他几种现有的估计方法从均值和方差角度看,- g 较估计量( 3 7 ) 更稳 定,而比游程估计偏差更小从涵盖机率角度看,口m g 在大部分情况下比我们用来 比较的估计方法有更高的涵盖机率当然本文只是在f e r r o 和s e g e 瑁( 2 0 0 3 ) 的基础 上做了合理的猜测和推广,其中的理论证明还有待进一步的研究 参考文献 【1 】b e i r l a n tj ,s e 零髑j 觚d 胁c a t 陋以】( 2 0 0 4 ) s t a t i 8 t i c 80 f 【t r e m 镐:t h e o q 越d 印p m 嘶i o n s 面7 l nm e 暑,拶踟鸠l 垴肠,l d d ,k 【2 】b e i r l 觚tj ,d i e r d ! 口【g 蛐dg u i u 肌a ( 2 0 0 5 ) e s t i m a t “m0 ft h ee 吼弛眦v a h 舱i n d 旺 。缸dr e g r e 蚓强t h eg e 】嗽址z e dq u 跚t 讹p k 8 b e 仃m 讲k 托僦j j ,d 玩舛9 - 9 锨 【3 】b e r m 眦s m ( 1 9 6 4 ) l i m i tt h e o 棚瑚五d rt h em 妇硼帆t 唧i n8 t a t i o 瑚哪s e q u 吼嘲 a 彻口bo ,m n 纨e m 口“o 越g 洳亡i 阻蹈5 必- 5 j 抗 【4 】c 硝t i u oe 锄dh a ma s ( 1 9 9 7 ) f i t t i n gt h eg e n e r a l i z e dp 越e t o 曲t m u t i o nt 0 眦a 砌玎仳z 巧t ea m e 一蝴武口纽统础伽硒口挽m 删肛舱缎 【5 1 d e k k e r 8a l m ,e i n m a h lj h j 缸dd eh a 蚰l ( 1 9 8 9 ) am o 账呲t i m a t o rf o rt h e i n d 甑o f 觚e x t r e m 争v a l u e 曲t r i b u t i o n a 佗n 幽西n 蜘i j 乃船纷j 嬲墨 【6 】f b 舯c a t 锄ds 锷e 璐j ( 2 0 0 3 ) i n 触钮c ef o rc l t l s t 哪o fe x t r e 啪v a l 啷乃t m 耐 o f 跏譬a ls t 6 t 童s t 毫c a lso c i e 蜘b 6 5 5 4 5 5 5 6 。 吲f i 8 h e rr a a n dt i p p e t tl h c ( 1 9 2 8 ) o nt h e t 妇a t i o n0 ft h e 丘e q u e n c y 撼r i b u t i o 璐0 f t h el a g r 缈to r 锄a l l e s tm e m b e ro fa 8 a m p l e 【j 】p r d c e 赫呦巧琥e 伪仇m 由e r 鼢洳s 印 i z 跏t e 纫群,j 8 班j 鳃 【8 】g r e e n w 0 0 dj a ,l 觚d w e h rj m m a t a l 硒n c 缸dw 拙sj r ( 1 9 7 9 ) p r o b a b i l i 锣 w e i g h t e dm o i 脯n t s :d e 丘i l i t i o na n dr e l a t i o nt 0p 缸锄e t e 糟o fs e v e r a ld i s t r i b u t i o 硝e x p r e s s a b l ei ni i i v e r 8 ef o r m 肌t e rr e s d 钍僦8r e s 化 j 另j 舛9 强玉 9 1h i ub m ( 1 9 7 5 ) as i m p l eg e n e r a l 印p r o a c ht oi n f e r 阻c ea b o u tt h et a n0 fad i 8 t r i b u - t i ( m a 肌口跆d ,n 协舭s 只j j 纷j j 铭 参考文献 华东师范大学硕士论文2 3 【1 0 】h k i n gj r m ( 1 9 8 5 ) 触9 0 r i t h ma s2 1 5 :m 叙岫m 【l n l 0 0 de s t i m a t i o l l0 ft h e p a r 锄喊e 瑙0 ft h eg 匝e r a u z e de 】( t 舢ev a l u ed i s t r i b u t i o n a 即矗以口蜘统c s 跗,肋j 一 3 l o 【1 1 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论