(概率论与数理统计专业论文)gamma分布中至多一个变点的统计推断.pdf_第1页
(概率论与数理统计专业论文)gamma分布中至多一个变点的统计推断.pdf_第2页
(概率论与数理统计专业论文)gamma分布中至多一个变点的统计推断.pdf_第3页
(概率论与数理统计专业论文)gamma分布中至多一个变点的统计推断.pdf_第4页
(概率论与数理统计专业论文)gamma分布中至多一个变点的统计推断.pdf_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文由两部分构成第一部分简要概述了变点问题的应用背景及其统计分析的研究 进展 第二部分研究了至多一个变点时r 分布的变点的检验和估计我们采用局部比 较法,借助g a u s s 过程理论和滑窗方法,利用第一型极值分布逼近本文提出的统计量的 分布,给出了检测变点岛的程序和估计,并应用m a t l a b 进行模拟。由于r 一分布簇在金 融领域有着十分重要的作用,因而这个课题的研究不仅具有理论方面研究的价值,同时 还具有一定的应用价值 本文第一章里我们简要概述了变点问题的发展、研究状况、主要研究方法以及国内 学者在变点统计分析领域的研究 在本文的第二章,我们研究了r 分布至多一个交点的检验和统计推断,包括,1 :不 论a 是否变化,r 至多一个变点的检验;以及若变点存在,变点幻的估计2 :不论一 是否变化, 至多一个变点的检验 第三章讨论了”不变时, 至多一个变点的另一检验方法 本文的最后一章里,我们主要用m a t l a b 对第二章、第三章中提出的统计量进行模 拟 abstrac t t h i st h e s i sc o n s i s t so ft w ot o p i c s i nt h ef i r s tp a r t ,t h ea p p l y i e db a c k g r o u n da n dt h ed e v e l o p m e n to fs t a t i s t i c a la n a l y s i so fc h a n g e - p o i n tp r o b l e ma r eb r i e f l yi n t r o d u c e d i nt h es e c o n dp a r t c h a n g e - p o i n to fr d i s t r i b u t i o nw i t ht w op a r a m e t e r si sd i s c u s s e d w i t ht h eh e l po ft h et h e o r y o fg a u s s i a np r o c e s sa n dt h em e t h o do fs l i p p i n gw i n d o w ,t h ed i s t r i b u t i o no ft h es t a t i s t i c sp r o - p o s e di nt h i st h e s i sc a nb ea p p r o x i m a t e db yt h ef i r s tt y p eo fe x t r e m a ld i s t r i b u t i o n t h ed e t e c t p r o c e d u r e sa n di n t e r v a le s t i m a t i o no fc h a n g e - p o i n ta r ea l s op o s e db yt h es t a t i s t i c sp r o p o s e d f d i s t r i b u t i o nc l a s si sv e r yi m p o r t a n ti nf i n a n c e ,s ot h er e s e a r c h e so ni ta r eg r e a t l yv a l u e a b l ei n b o t ht h e o r e t i c a la n da p p l i e db a c k g r o u d i nc h a p t e rl ,w ew i l li n t r o d u c et h ed e v e l o p m e n to fc h a n g e p o i n tp r o b l e m ,s t a t u so fr e s e a c h , t h em a i nm e t h o do fr e s e a c ha n dr e s e a c h e sa b o u ts t a t i s t i c a la n a l y s i so fc h a n g e p o i n ta th o m e i nc h a p t e r2 ,w ew i l ld i s c u s sm a i n l yt h ed e t e c t i o na n ds t a t i t i c a li n f e r e n c eo fc h a n g e - p o i n t o fr d i s t r b u t i o nw i t ha tm o s to n ec h a n g e - p o i n t ,i tc o n s i s t so ft w op a r t s 1 :w ed i s c u s st h e d e t e c t i o no fp a r a m e t e r w i t ha tm o s to n ec h a n g ep o i n tw h e t h e rt h eo t h e rp a r a m e t e rac h a n g e s o rn o t ,a n dt h ee s t i m a t o ro fc h a n g e - p o i n tk 0i ft h ec h a n g e - p o i n te x s i t s 2 :w ed i s c u s st h e d e t e c t i o no ft h ep a r a m e t e raw i t ha tm o s to n ec h a n g ep o i n tw h e t h e rt h eo t h e rp a r a m e t e r c h a n g e so rn o t i nc h a p t e r3 ,w ew i l ld i s c u s sa n o t h e rm e t h o do fd e t e c t i o no ft h ep a r a m e t e raw i t ha tm o s t o n e c h a n g ep o i n tw h e n t h eo t h e rp a r a m e t e rpi sn o tv a r i a b l e i nt h el a s tc h a p t e r ,w ew i l lm a k et h es i m u l a t i o nf o rt h es t a t i s t i c sp r o p o s e di nt h es e c o n d c h a p t e ra n dt h et h i r dc h a p t e rw i t ht h eh e l po fm a t l a b u 致谢 三年的硕士生活即将结束,我要向所有关心和帮助过我的老师和朋友们表示深深的 首先我要特别感谢我的导师缪柏其教授缪柏其教授在近三年的学习中给予了我不 厌其烦的悉心指导和帮助他那认真、严谨的治学作风,敏锐的洞察力和丰富的科研经 验深深地感染了我本篇论文的选题、文献查阅、证明过程到论文的排版缪老师都倾注 了大量的精力缪老师渊博的学识、严谨的治学态度和对问题独到的见解是这篇论文得 以完成的保证在这三年中,我感受最深的是,缪老师在帮助我解除许多困惑的同时 也让我试探着去了解什么才是真正的研究 其次,我还要向胡太忠教授、赵林城教授、苏淳教授、韦来生教授、吴耀华教授、张 曙光副教授以及本科阶段的老师陈桂景教授和胡舒合教授表达由衷的感谢之情正是在 这几位尊敬的老师的直接指导和帮助下,我才得以步入概率和统计的广阔天地同时系 里许多老师,包括夏红卫老师、臧红老师也给予了我不少有益的帮助,在此一并向她们 表示我的谢意 另外,我也要感谢我的同班同学金百锁、曹懿等和师兄吴振翔、叶五一、潘婉彬、潘 光明、胡治水等的热心帮助和鼓励 最后,我要感谢我父母及家人感谢他们给予我的无以回报的支持 第一章变点问题的研究进展 1 1变点问题简述 在统计学中,变点问题是一门比较热门的课题变点问题最初是从质量控制中提出 来的,人们从生产线上抽捡产品以检测产品质量是否发生显著波动,特别是检测产品是否 超过其质量控制范围当产品质量发生质变( 主要是指超出质量控制警戒线) 时,希望能 及时预警,以免出现更多的次品这个质变的时刻就称为变点一般地,变点就是指”模 型中的某个或某些量起突然变化的点”或者说,一列样本观察值序列在某个时刻,样本 的分布参数或数字特征起了突然的变化,这个时刻就是变点,而该时刻又是未知的变点 问题的统计推断就是依据具体背景,对未知时刻作出估计,并对检验统计量的性质进行统 计分析从历史上说,现在一般认为变点问题的研究起始于p a g e ( 1 9 5 4 ) 在b i o m e t r i k a 上发表的关于连续抽样检验的文章自上世纪七十年代以来,许多的统计学家投入到这 一研究领域,发表了一大批有关变点理论和应用的学术论文特别是近二十年来,变点 问题在理论上已有了一系列较为成熟的结果目前,已有一些关于变点问题研究状况的 专著和综述性文献,如c s o r g oa n dh o r v a t h ( 1 9 s 8 ) ,k r i s n a i a h a n dm i a o ( 1 9 8 8 ) ,陈希 孺( 1 9 9 1 ) ,b a s s e v i l e a n d n i k i f o r o v ( 1 9 9 3 ) ,c s o r g o a n d h o r v a t h ( 1 9 9 7 ) 等等,其中 c s o r g o a n dh o r v a t h ( 1 9 9 7 ) 的专著”l i m i tt h e o r e m si n c h a n g e p o i n t sa n a l y s i s ”就 是对这一领域近二十年来理论研究的总结 变点理论是统计推断的的中心问题之一在理论研究方面涉及了统计理论的众多方 面,同时也结合了统计控制理论、估计理论、假设检验理论、b a y e s 理论、固定样本抽 样方法和连续样本抽样方法,是统计推断中的一个非常有理论意义的研究分支在应用 方面,变点问题不但在早期的应用领域一工业自动控制中有大量的实际应用,而且现在 已经发展到在许多领域都有应用,象经济、金融、医学、气象、流行病学等方面都有大 量的应用背景例如,在流行病学中,人们最关心的问题之一就是传染病在其传染过程 中其传染率变化大小和变化时刻,这对确定合理的治疗和控制手段很重要变点问题有 很多的分类连续地观察一过程,当检y , j j n 变点时才停止观察( 抽样) ,称之为连续抽样方 法或事中( o n 1 i n e ) 变点问题若从完全获得的样本观察值中检测变点是否存在,称为固 定样本方法,或事后( o f f - l i n e ) 变点问题就样本观测值之间的关系,可分为独立样本和 相依样本情况下的变点问题由变点处变化的形式主要分为突变( a b r u p tc h a n g e ) 和渐变 ( g r a d u a lc h a n g e ) 的变点问题从分布的两主要数字特征,均值和方差的变化,常考虑位 置变点和刻度( 参数) 变点就观测样本数据特性可分为随机过程( 时间序列) 和随机场 1 第一章变点问题的研究进展2 ( r a n d o mf i e l d ) 中的变点问题对变点问题的研究主要围绕变点的检测,估计( 点估计和 区间估计) ,估计量的渐进分布和收敛速度等方面 1 2 变点问题研究方法简述 变点问题的研究由于涉及到独立和非独立随机变量的分布,在理论上处理起来难度 较大,相应地一些估计和检测变点问题的方法也在不断地发展和完善如:( 加权) 最小 二乘法,极大似然法( k r i s n a i a h a n dm i a o ( 1 9 8 8 ) ) ,累次计数法, b a y e s 法,非参数法 和局部比较法等等 一最小二乘法:最小二乘法就是以观察值与理论值之差的平方和作为目标函数, 以其达到极小值之点作为有关参数的点估计,它无须对模型中的随机误差的分布有特定 的假设 1 :均值变点模型( 见k r i s h n aa n dm i a o ( 1 9 8 8 ) 和h u d s o n ( 1 9 6 6 ) ) 设x l ,满 足 x l = a i + 岛,i = 1 a l 2 - 2 a m l = b l= a m 2 = 0 2 ,一,a m 。+ 1 此处1 m 【 m 口 c 时,否定原假设,即认为有变点,c 为一适当确定的界限在否定原假设的条件下,构 造目标函数 q + 1m j 6 。+ z ) = ( 置一b ) 2 j = li = m ,一1 + 1 第一章变点问题的研究进展 记 ( 肃1 ,危口) = a r g ,r a i n 、 t ) l m l ,m 口j 则( 赢一,吼) 为变点( i t 1 ,m 口) 的估计 3 2 :线性回归变点模型考虑一个变点的情况设 l ,c t ,= 爱:妻高:昌:耋乏乏:乏2 ;: c 2 s , 其中卢1 = ( n ( 1 1 ,硝”,群1 ) ,历= ( o ( 剐,卢,辟2 ) 为未知的回归系数向量,0 t o 1 ( 在岛7 伪时) 为回归变点,x ( t ) = ( 1 ,x 1 ( t ) ,一,玛( t ) ) 为完全已知的非随机函数,随 机误差e ( t ) 一( 0 ,0 - 2 ) 同时满足连续性条件 f l l x ( t o ) = 岛x ( t o )( 1 2 4 ) 设( x ( t 1 ) ,v ( t 1 ) ) ,( x ( t 。) ,v ( t 。) ) 为来自模型的观察值,其中0 t l t 。 1 给定一组正实数u l ,一,u 。,即权值对任一t ( 0 ,1 ) ,令r ( t ) 为满足t i 一1 ts 如的正整 数i 令 r ( 幻“ t ( 卢1 ,成,t ) = w i ( y ( t i ) 一卢:x ( 如) ) 2 + u 。( y ( 如) 一琏x ( 岛) ) 2( 1 2 5 ) i = 1 t = r ( t ) + l 找卢1 ,阮,t 的加权最j , - 乘估计厦,岛,使得 t ( 声1 ,岛,幻= m i n t ( f l l ,岛,t )( 1 2 6 ) 则 为t o 的估计 对多个变点的情形有类似的讨论 二 极大似然法:即通过求似然函数极大值去估计有关参数,此处变点视为一个参 数,以正态样本为例 设样本x ,一,五。独立,且 x :n ( a l ,盯 ) ,i = 1 ,一,m 一1 ;冠n ( a 2 ,盯;) ,i = m ,- ,n m ,o ,o ;均未知,m 为变点在则易得对数似然函数 l o g l ( m ;。l ,。,a ,a ;) = 一i nl 。9 2 ”一! ! ! i 二! l l 。g 。 一半- 硐一r 蚤a - 1 嗡芋一塞掣。川 第一章交点问题的研究进展 先固定m ,对l o g l ( m ;a 1 ,a 2 ,口 ,a ;) 求极大,记为日( m ) 即 再找赢,使 s ( m ) = l o g l ( r n ;a 1 ,在2 ,子;,子;) 赢2 a r g 2 m m a x n 日( m ) 4 ( 1 28 ) ( 1 2 9 ) 则俞为变点m 的估计 在采用最j 、- - 乘法和极大似然法时,所得变点的估计量的分布一般非常复杂,即使 在最简单的情形下,也无法得到其精确分布,只能得到其渐近分布 三 b a y e s 法:就是把包括变点在内的模型中的参数视为随机变量,并引进其概 率分布,即先验分布利用先验分布和样本分布,定出变点这个参数的后验分布,并基于 它作出推断b a y e s 方法的优点在于它可以容易地提供变点的点估计、区间估计及变点 是否存在的检验考虑至多一个变点的模型: 憾浆罱 篆。, z 其中m 为未知参数卢17 ,觑,x ( t ) 见线性回归模型变点估计参见r u k h i na l ( 1 9 9 6 ) 对于多个变点问题,有类似讨论 1 3国内在变点统计分析领域的研究 国内统计学者在这一领域的研究开始于上世纪八十年代在理论领域,1 9 8 8 年,陈 希孺院士和缪柏其教授分别利用”局部比较法”研究了变点问题这种方法一般有两个 优点:( 1 ) 关于假设检验问题导出的检验统计量,有比较简单的渐进分布( 2 ) 对估计检 验的功效和变点的区间估计,提供了方便的做法陈希孺( 1 9 8 8 ) 考虑了下述跳度变点的 模型: z c = 。;粢,耋:乏:乏。0 ( 1 3 1 ) 其中a ,0 ,t o 是未知参数,0 t o 1 为变点,e ( t ) 一f ( t ) 利用局部比较法,构造统计 量取f 为一正整数,满足 l i m 三:o ;l i m 坐咝:o n _ + 。onn - + o 。 f ( 1 3 2 ) 第一章变点问题的研究进展 令 则关于变点的检验问题,提出了如下的统计量 靠= m a i y m i :m = 2 1 ,n ) 5 ( 1 3 3 ) 当靠的值较大时,认为变点t o 存在关于检验统计量矗的分布,可以得到下述渐近分 布 。l - 干i r a w p ! 口娄_ a n 扛) ) = e x p ( 一2 e - x ) o o z 。o ( 1 3 4 ) 其中如( z ) 具体形式见定理2 2 1 m i a o ( 1 9 9 3 ) 推广了陈希孺( 1 9 8 8 ) 的工作至坡度变点的 情形:令 z c t ,= :竺 :葛:罱:耋:乏: c - 3 s , 其中n ,风,成,t o ,为未知参数,得到了在坡度的情形下与跳度情形平行的结论谭智平 ( 1 9 9 6 ) 进一步研究了这些问题k r i s h n a i a h ,m i a oa n dz h a o ( 1 9 9 0 ) 利用局部比较法, 讨论了多元线性模型协方差阵变点个数的检验问题 缪柏其( 1 9 9 3 ) 利用w i l c o x o n 两样本统计量,对位置参数模型参数变点的检验问题 提出了下述统计量 厶2 。s k _ n - 。而 丽瓶( - a m ( m + 1 ) 2 ) ( 1 36 ) 其中m :m l + m 2 , a = 警,o l ,= 登r 蛳这里r 蛳l j5m 2 为x k + 。+ j 在 ( x + 1 ) ,凰+ 。+ 。) 中的秩,并且证明了矗的渐近分布 缪柏其和魏登云( 1 9 9 4 ) 利用u 一统计量,讨论了尺度参数变点的统计推断问题,取 核函数 定义u 一统计量为 妒( z ,z z ,。s ,z a ) = ( i z ,一。z i i x - - 2 7 4 1 一;) 乳= 丽南) _ 2 峰乏圳! ,乏;。比州一州一胁锄忍) x 董一 = 一x m 叫 1 | 上何 = k 第一章交点问题的研究进展 6 对于尺度参数变点问题提出检验统计量 扣m 札a x 2 。i 等t k l ( 1 3 - 7 ) 得到了类似的结论 。 w a n g ( 王_ 静龙) a n db h a t t i ( 1 9 9 8 ) 利用广义似然比检验思想,对正态分布序列均值未知 时方差只有一个变点的检验问题,给出了三日r 一检验检验如下: 设x l ,x 。为独立随机变量序列,x l ,x k 。( p ,口 ) ,x k 。+ l j ,一 ( p ,一;) ,p 为未知参数,k o 为未知变点利用广义似然比思想,构造统计量 其中 船:$ ( 五_ _ ) 2 岛= 学 r 2 l ( m t i ( n n r k s = 圭( x i x ) 2 1 n ( 5 ;) 2 = i 三( 噩一耳) 2 nf f + l ( 1 38 ) 当r 的值较小时,认为变点凰存在同时还给出了基于u 一统计量的上一检验,基于 b a y e s 方法的b 一检验 缪柏其和谭智平( 2 0 0 1 ) 基于k o m o g r o v 型统计量和k i e f e r 过程,讨论了二阶随机控 制变点的统计推断问题,得到了检验统计量的渐近分布,并证明了变点的估计是强相合 的 缪柏其、赵林城等( 1 9 9 3 ) ,( 2 0 0 3 ) 基于信息论准则,分别研究了在方差相同和不同的条 件下,均值向量变点的个数和位置的检验及估计问题,设独立随机变量序列x h ,x n 满足 x i = 地+ k ,1 i n “为一非随机的p 维左连续的阶梯函数,k 为一均值为0 ,协方差为a l 的独立的p 维 正态随机向量令r o = 0 ,r q + l = n ,记r l ,为p 的所有变点,即 肛。= 0 ,当。一1 i o 且p 知l 聘,j = 1 ,2 ,q ( 1 3 9 ) 设协方差a 为一左连续阶梯函数,即 a i = a ;,当q 一1 i r j ,j = 1 ,2 ,q ( 1 _ 3 1 0 ) 令t i = 哥,i = 1 ,2 ,qa - l _ 称t l ,t q 为序列( 五,isi 茎n ) 的变点 第一章变点问题的研究进展7 称正整数集l ( | v ) ,k q ( ) 为 0 ,j 的有q 个分点的一个划分,是指0 k l ( n ) , k q ( ) n 记i i ( ) 为 o ,】的任一划分,硝“为【o , 的有g 个 分点的所有可能划分的集合,则硝。包含g 罨一。个不同的划分,用k ;,i i ,k q 分别表示 k i ( ) ,( m ,尉 在q 已知时,设划分 = ( k o ,k q + i ) ,a j = k j + 1 一畸,满足 | 丙k i _ l 专,o r _ 1 ,2 ,g ( 1 3 1 1 ) 记 k 言= 7 r :7 k q a n d s a t i s f yf o r ( 1 3 6 ) a n d a j o t n ,歹= i ,一,g ) , 其中a n 满足 h i t i + l r l fm 。器2c , o ,n m 。s u p 南 l ( 1 3 1 2 ) 令 口+ 1k j + l g 。= 一i 1 町l o g ieo 于1 ( 置一- x j ) ( x i 一瓦) l ( 1 3 1 3 ) 。j = li - b + 1 其中瓦= 叮1 。:k & 3 + 1 。墨若划分# :一k o o , 0 其中r ( ) 是g a m m a 函数 f ( p ) = t ”- l e - t d t 。( 2 1 2 ) 0 由f 分布的定义易知,r 分布簇包含了其他一些分布簇: l 指数分布簇e ( a ) 是v = 1 时的r 分布簇特例; 2 当”= , = 时,r ( , ) 就是常用的x 2 ( n ) 分布簇; 3 当”= n 为正整数时,r ( n , ) 就是e r l a n g 分布,它常用于可靠性理论和排队论 中,如一个复杂系统中从第一次故障到恰好再出现n 次故障所需的时间 因此研究了r 分布簇参数变点的统计推断,也研究了x 。( n ) 分布簇、指数分布簇e ( a ) 和e r l a n g 分布簇的变点的统计推断。 命题2 1 1 设x r ( g ;u a ) ,其密度为 贝 证明:因为 m ) 2 高e 。“1 ”o 即* 篙咐州 _ 1 2 ,3 , e x = i ,( x ) = 蠡 e e 程x = ( - 一姜) 一”e e z x = ( - 一;) 耻譬篙e 。v “如 :篙+ o o e 也吲岩抛 = 丽, x - k :+ o o e 咖m 严州抛:篙啦州 令= l ,2 ,即得e x = ,v a t ( x ) = 轰 类似可得e e 蹦= ( 1 一癸) ,e 。2 x = ( 1 一女) ” 由命题可得以下基本性质: l :丽e x = 痧, 2 :而e 习x 两= 入, 第二章至多一个变点的r 分布的统计推断 引理2 1 1 设 ,n 1 ) 为i , i d 随机变量序列,e x := 0 ,e x = d 2 0 ,且存在t 1 0 当 0 p ( r ) = e z ( t ) z ( t + r ) = 1 一i t i + o “t i ) , ( r 0 ) p 2 ( t ) d t 0 0 则对一切实数z j i mp s u pl z 0 ) ls a t ( x ) ) = e x p ( - 2 e 一。) 一。 。 。 ( 2 1 4 ) - - + o g 0 0 1 = k 为正整数,满足条件 1 i m 三:o :l l m 坚! 罢坐:o ( 22 2 ) d 2 = v a t ( 置) 已知,定义 孔= 以( 誉一杀) 幢z 锄 靠2 i n a 。x f 矧 ( 22 4 ) 副z ) : 2 1 3 2 n 叫】叫2 ”2 3 2 n f _ 3 ) + j 1l 。g l o g ( 等叫一互1l 。g ” ( 2 删 则 。l i m p ( 厶( z ) ) :e x p ( 一2 e - z ) 一o 。 z 。( 2 删 由巩的定义知 :瓦1 ( f 叉2 , k - - l - x l , k ) + 丽 x 2 , k ( 毒一z ) + 象( 彘一- ) 兰五女+ 噩女+ 毛k ( 2 2 7 ) 第二章至多一个变点的r 分布的统计推断 引理2 2 3 在定理( 2 2 1 ) 的条件下,有 。l i m f 墨莹f i t 2 t l 2 o 。l 。i m 。f 墨f 陬2 o 证:易知 所以 由重对数律知 类似得 所以有 同理可得 耻茅( 去一,) 厅lj 2 一麓 。v j 石可再亩 “以巾:黾) x 2 ,k 一“ 芦 。l + i r a 。z 赞x _ f 吲 = 概。嚣。胁1 水k + l 嘲嘲嘞) 2 _ a 2 s 撬鼢肼黔- - e x i ) 2 - a 2 】l + 概:婴。压( 甄- r 2 ) z 一 ,熙f 跺f ( ;) 4 1 ( 叉z 圹麟i ) - = l i mm a l n 叶。f n l x i i e x i 1 i = 1 够狐面1 可 1 3 ( 228 ) ( 2 2 9 ) 2 瓜l o g l = 0 ( 2 2 1 0 ) 71 k + l 撬。爨。v 拼舌 ( 置一e 置) 2 。 2 2 1 1 。l - + i m 。f 嚣浆fi t 2 k l 2o n l _ + i m o 。f m k a n x fi 如k i2 o o 3 带 ( 2 2 1 2 ) 第二章至多一个变点的r 分布的统计推断 引理2 ,2 4 在定理( 2 2 1 ) 的条件下,有 证:因为 由重对数律知 所以 类似可得 所以有 同理可得 。l i + i r a 。f 勃,一o - i l o g n 2o 讯p 撬阢t 一口j l o g n 2 0i np 。l + i m 。l 子2 , 一a l l o g n “0 挛巴l 霹, 0 - 2 1 1 。g n 。,s = l i m 曼1 i m 十撬( e 置一夏,) 2 l o g n 。l 。i r a 。i ( e x t 一冠,k ) i 瓦而 萎一l e x i , 。熙芎丽厕厮= o 。s i ! 恐( e x z 一冠,) 2 l o g n = 0 o s 撬f 盖k + l 【( 墨一e 置) 2 一a 2 j f j o g n = 。 n s 0 骢阮 一o l l o g n 2 0 i np 热阢一口l l o g n 。o i n p 舞 i i 理2 2 5 设定理( 2 2 1 ) 的条件满足,而矿的话计子2 适合条件 则有 j i 雹l 子2 一矿l l o g n = 0 i np n 。o 1 4 f 22 1 3 ) ( 2 2 1 4 ) ( 2 2 1 5 ) ( 2 2 1 6 ) ( 2 2 1 7 ) ( 2 2 1 8 ) 。l 。i m 。p n s a n ( z ) ) = e x p ( 一2 e 一。) 一o o z 。 ( 2 2 1 9 ) 其中矗n * g g t 面定理2 , 2 2 礼 g k 州1j 矿一 严 礼 弱 抛 1iij x 盯 e 一 + 户 墨 日 e 一 涵 陋 州州 第二章至多一个变点的r 分布的统计推断 证明:参见文献 7 】 定理1 的证明:记 五:垄二皇! 垄2 盯 t 瓯= 五 t = 1 1 5 口2 已知,因为x l ,7 i id r 扛:u a ) ,且e ( e 蛹) 0 有 由丑的定义知 i m s u p 恶譬) 。 ( 2 z 驯 丑女= 而1 ( s ( r + f ) 一2 + s ( 一f ) ) ( 2 2 2 1 ) 棚曼n ,享f | j 有 溉 i l l 妒g x 。i t l t 一而1 ( 丽1 彬( 3 ) 一2 丽1 ( 3 ) + 丽1 ( 3 ( b 叫) ) l 撬去1 0 9 n s u 如p ;盟掣= s ( 2 。z z ) 作一个g a u s s 过程 z ( o = 丽1 ( 呻+ 互3 ) 一2 w ( 呻一;) ) ( 2 t 2 2 3 ) 南p i 术两式可知z ( t 1 为平稳g s s 挝稃由引理f 2 1 2 1 知 击毁p f 黑f i z ( 薯) i a 。( 。) ) = e x p ( - 2 e - 。) 又因为 。1 + i r a 。p 岛如( 。) ) 2 撬墨譬i t k l 如( 。) ) 2 兽p ( f m k 0 f = f n 为正整数,满足条件( 2 2 ,2 ) , 令 则有 矗2 f i n a h y x i 孔 。l 叶i r a o 。p 岛a n ( z ) ) = e x p ( 一2 e 一2 ) 一 0 f = f 。为正整数,满足条件 ( 2 2 2 ) ,a 。( 。) 定义同( 2 2 5 ) ,令 磊= v ;( 蒜一等) 仁。z , 则在d 2 已知时有 矗2 f 嚣慧f 阢 ( 2 3 3 ) 。1 i r a 。p 口;n a n ( z ) ) 2e x p ( 2 e 一。) 一。 z 。 ( 23 ,4 ) 在j 2 未知对,若子为口的估计,且满足 则仍有结论 撬 参一口1 1 0 9 “2 0 孰p 甚器p ( 子乏n 以n ( z ) ) = e x p ( 一2 e - = ) 一o 。 石 0令 则 m 兰i n 置= 一i n a + l n ( a 墨) 皇一i n + e i a 墨i idr ( z ;p ,1 ) 且随机变量e 。皇l n ( a 蜀) 的分布与a 无关,仅与”有关 证明: 记g ( y ) 为a 盈的密度函数,则由密度转换公式得 咖) = 。m 高e - a 钆r 去 :熹。一”旷。 2 而9 所以 x 。一r - ( z ;2 ,1 ) ,且与 无关 ( 3 1 1 ) 由上述命题可知,在v 不变的情况下,要检验r 序列x 。,x 。是否有变点,即要 检验序列h ,的参数( i n ) 是否存在变化 1 8 第三章v 不变时,a 至多一个变点的另一检验 3 2a 至多个变点的检验 1 9 定理3 2 4 设x i ,i i d 服从r ( z ;,a ) ,f = z 。为正整数,满足条件( 2 2 ,2 ) , 厶( 。) 定义同( 2 25 ) 记 m 皇i n x i = 一i n a + i n ( a x l ) 皇一i n + e i( 3 2 2 ) 其中e i = l n ( a x i ) ,a 墨r ( x ;v ,1 ) ,口2 = v a r ( g i ) = v a r ( e i ) 令 玩2 志 在d 2 = v n r ( y ) = v a r ( e i ) 已知时,令 q n2 i m k a n x fi z k 则有 。l _ i m 。p ( a n 扣) ) = e x p ( 一2 e 一。) 一。 。o 在g r 2 = y ( k j = v a r ( e i ) 为未知参数时,可用 ;k + l ( e 一瓦。) 。 = + l ( 3 2 3 ) ( 3 2 4 ) 1 t 饿玩) 2 , ( 3 ,2 5 ) 。i = k - 1 + 1 来作为0 - 2 的估计, e 。: 莹m ,e 。: 圭k 并令 仁= + 1i = k - f + 1 则方2 满足 2 - 疆丽i = k i 徭i = 露k - i 菰 每 1 r+h一1 k 蕊2 f 当翟罢f f 磊f 6 ) 溉j 子一f l l o g n = 0 i np n l - + i m p 且n ( 。) ) = e x p ( 2 e 一。) 一o 。 z o g ( 32 7 ) l m | b 。 = 一 k 一口 州斟 ,一 第三章一不变时,a 至多一个焚点的另一检验 证明:因为 争= 面1 篷挚一。妻。学) = 去( 跗+ f ) 一2 跗) + 跗- f ) ) 其中p 兰e k = - l n a + e ( e 也s ( b ) 兰壹! 由于e e 。m = e e n x t = el x 4 。 0 充分小时,由引理2 2 1 知,存在一个 标准布朗运动过程( ) 使 因为 所以 ( i 等坐) 一 ( ) j 1 i 。r a + s 。u p s u p 面f 一) 0 。,” ( 3 删 警一而1 ( w ( + f ) 一2 ( ) + ( k i面4 s u p 。一2 阶) 一w ( ) f ( 3 驯 撬f 筝一而1 ( ( 女+ f 卜2 ( 女) + 彤( 一啪 l 洫兰i 昭n n o 。2 f ” 由引理2 1 2 及类似定理2 , 2 j i 的证明得 所以 。p 唑! 二里盟 l n - il o g n 点怒尸 f e s u p 。一f l 而1 ( w ( 忌+ z ) 一2 ( 七) + w ( 七一f ) ) 1 墨a n ( z ) ) = e x p ( 一2 e 。) 一0 ( 3 。 。o 。l _ i m p 叼n sa n 扛) ) = e x p ( - - 2 e 一。) 一0 0 z 。c 在一2 = v n r ( m ) 为未知参数时,用子2 来估计沪,由引理2 2 4 得孑2 满足 。t _ i m 。l 子a 1 0 9 n 2o 讯p 由引理2 2 5 知, 。1 1 i r a p 懿sa n ( z ) ) = e x p ( 一2 e - 。) 一 茁 a n ( 。( 。) )( 3 2 1 3 ) 时,拒绝凰,即认为 有变点,此时检验的渐近水平为a 变点位置k o 的估计;: k = m i “ :吲2 爨。吲) ( 32 - 1 4 ) k o 的区间估计:( ;一f ,+ f ) k o 的区间估计的长度为2 l ,为提高估计的精度,应 取较小z o ,但它会带来两个问题;一是若k o 的存在要由上述检验决定时,i 过小会引起 h o :v 1 = 屹不成立时,被接受的可能性增大;二f 太小时,置信系数1 会很低 第四章m a t l a b 模拟 为了验证在第二,第三章中提出的统计量用于检验变点位置的可行性,用m a t l a b 进行了模拟,在n = 0 0 5 的水平下,p 检验的结果见下表其中r ( z ;v l , 1 ) ,r ( z ;一2 ,a 2 ) 表示变化前后的分布,n l 表示变化前的随机产生的样本个数,也即真实的变点位置; n 表示随机产生的总的样本个数,表示估计出来的变点位置,f 表示滑窗的长度, t e s t = a n ( o ( o ) ) ,k e s a = 矗。 4 1第二章中的统计量的模拟 从表一中可以看出在a 不变的情况下: ( 1 ) 地的比率越偏离1 越容易检测出变点,即灵敏度越高 f 2 ) 在沈的比率偏离l 不大情况下,z 值不能取,导太小,z 太小不能检测出变点 位置,随着 的增大,灵敏度相对越来越高,但是;也不能太大,太大也无法检测变点位 置;同时也可以通过扩大样本量n 来提检验的高灵敏度 ( 3 ) 不论变点的真实位置如何,位置是在中间或是靠近端点,在2 满足一定条件下, 本文提出的统计量均可检测出变点位置 从表二中看出: ( i ) 在ua 等比例变化时,即r 一分布均值不变时,用一般的均值变点检验方法无法 检验出”是否存在变点,由上述2 2 节中提出的统计量巩可以检验出v 是否存在变点, 这是本文中提出用于检验变点的统计量的一大优点 ( 2 ) b l l t 2 的比率偏离1 的称度越大,越容易检测出变点;b 1 ,地的比率偏离1 的称度 较小时,滑窗长度f 不能太大 从表三中看出: ( i ) 在一,a 不等比例变化时,上述方法也适用于检验变点位置 ( 2 ) 当屹的比率偏离1 的称度较大时,对较小的n ,上述统计量也适用,因而对实 际数据的检验有很强的适用性;当屹的比率偏离1 的称度较小时,适当扩大样本量n , 对实际数据同样有较强的适用性 第四章m a t l a b 模拟 表一 la i地a 2t e s tk e s a l f l 115l4 2 9 85 6 8 93 02 0 0 01 0 0 0 1 0 2 0 4 2 2 9 91 0 7 6 5 84 02 0 0 01 0 0 01 0 0 6 4 1 7 66 7 5 65 02 0 0 01 0 0 01 0 0 5 4 1 3 29 0 4 86 02 0 0 01 0 0 01 0 2 1 4 0 9 3 69 5 4 3 47 02 0 0 01 0 0 01 0 0 5 4 0 6 0 38 6 8 6 38 02 0 0 01 0 0 01 0 l o 4 0 3 19 0 9 29 02 0 0 01 0 0 01 0 1 5 4 2 7 37 5 7 55 03 0 0 0l 0 0 01 0 0 8

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论