(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf_第1页
(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf_第2页
(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf_第3页
(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf_第4页
(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf_第5页
已阅读5页,还剩109页未读 继续免费阅读

(基础数学专业论文)统计模型结构变化的序贯检测方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 结构变化现象在自然界和人类社会普遍存在,该问题的研究在统计理论与 实际应用中都有重要意义和价值。结构变化分析是现代统计学提供的用以研究这 类现象的工具,按其方法不同可以分为“历史检测法( h i s t o r i c a lt e s t s ) 和“序贯 检测法”( s e q u e n t i a lt e s t s ) 两类。本文着重于后者,主要研究了下面三类统计模型 中的序贯检测问题。 第一、研究了结构方程模型中的序贯检测问题。基于广义矩方法( g m m ) , 构造了以工具变量为权的残差“加权累积和过程”( w c u s u m ,w e i g h t e dc u m u 1 a t i n gs u m ) ,证明了它在原假设下收敛于p 一维标准布朗桥,而在备择假设下,其 极限过程是一个带“漂移项”的p 一维布朗桥。基于部分和过程的泛函,提出了 一类检验统计量的构造方法,当泛函在满足齐次性和连续性条件下,得到了这类 统计量在原假设和备择假设下的极限分布;并证明在“漂移项 非零条件下,当 6 = 1 2 时,具有“非平凡势( n o n t r i v i a lp o w e r ) ,而当0 6 1 2 时,该类检验 统计量则是相合的,并且验证了该类统计量包含了著名的c r a m e r m i s e s 检验统计 量以及朗格朗日乘子统计量作为特例。针对结构局部发生变化的情形,构造了反 映局部变化的“加权滑动和过程”( w m o s u m ,w e i g h t e dm o v i n gs u m ) ,首先证 明了一个d 0 ,7 - 1 p 空间上的随机过程增量收敛定理,其后证明了滑动和过程在原 假设收敛于p 一维标准布朗桥的h 一增量过程,最后证明备择假设下极限分布为带 “漂移项的增量过程;基于对增量过程取齐次连续泛函,提出了一类检验统计 量,获得了类似于w - c u s u m 情形下的结论。最后对两类统计量进行模拟计算, 证明了它们是有效的,且在实际检测中的表现各有所长。 第二、研究了广义线性模型中的在线检测问题。基于拟似然得分( q u a s i m l s c o r e s ) 建立“部分和过程及“滑动和过程,并证明它们在原假设下的极限分 布分别为布朗桥及其h 一增量过程。对“得分部分和过程”取“m a x m a x 泛函 而得检验统计量,然后获得该检验统计量的极限分布,同时推断出其渐近分布的 精确表达式,并证明该检验统计量在备择假设下是相合的,最后给出了变点位置 与“检测延迟之间的近似数量关系。对“得分滑动和”取“m a x - m a x ”泛函获 得检验统计量,并证明了该检验统计量的极限分布,同时给出了其渐近分布的一 个非显式表达,证明了备择假设下检验统计量的相合性。在随机模拟一节中,给 出了布朗桥的 一增量过程的“m a x - m a x ”泛函统计量的经验分位数表,并在随 机模拟中验证了文中所提“部分和 与“滑动和 方法的有效性,同时在广义线 两北大学埔- l 学位论文统计模型结构变化的序贯检测 性模型取“典则连接函数 时的特例一正态线性模型场合,与已有方法进行了对 比,结果显示文中所提方法表现更优。 第三、研究了非参统计模型中的在线检测问题。建立了回归函数的 n a d a r a y a - w a t s o n 估计量,以此为基础构造残差序列,并以“长期平均密度 的核估计量为权构造了“加权残差部分和”过程。在原假设下,证明了该过程的 极限分布为标准布朗桥;通过对该过程取齐次连续泛函构造了一类检验统计量, 并证明了它们的极限分布,给出了“渐近分位数 的构造方法。在两类备择假设 日1 a 或者日1 b 下,证明“加权残差部分和”过程均收敛于带“漂移项 的布朗 桥。同时,在两类备择假设下,给出了“加权残差部分和过程齐次连续泛函形 式的检验统计量的极限性质;在“漂移项”非零条件下,当7 7 = 1 2 时该类统计 量具有“非平凡势”,而当0 7 7 1 2 时,检验统计量是相合的。最后,本章 通过随机模拟试验验证了所提方法的有效性。 关键词:结构变化,贝叶斯公式,可靠性统计,c u s u m ,m o s u m 英文摘要 a b s t r a c t i nn a t u r eo rs o c i e t y , t h e r ee x i s t ss t r u c t u r a lc h a n g e sp h e n o m e n ae v e r y w h e r e t h e r e s e a r c h e so nt h et h e s i sa r ev e r yv a l u a b l ef o rs t a t i s t i c a lt h e o r i e sa n da p p l i c a t i o n s a n a l y s i so fs t r u c t u r a lc h a n g e sp r o v i d e ss t a t i s t i c a lt o o l st os t u d yt h ep h e n o m e n a s t a t i s t i c a l p r o c e d u r e si ns t r u c t u r a lc h a n g e sa n a l y s i sc a nf u r t h e rb ed i v i d e di n t ot w oc a t e g o r i e s : t o r i c a ld e t e c t i o na n do n - l i n ed e t e c t i o n w ew i l lc o n c e n t r a t eo nt h el a t t e ra n ds t u d yh o w t od e t e c ts t r u c t u r a lc h a n g e si nt h r e ec l a s s e so fs t a t i s t i c a lm o d e l s : f i r s t l y ,s e q u e n t i a ld e t e c t i o no fs t r u c t u r a lc h a n g e si ss t u d i e di ns t r u c t u r a le q u a t i o n s m o d e l s b a s e do ng m m ,w - c u s u m ( w e i g h t e dc u m u l a t i v es u m ) p r o c e s si sc o n s t r u c t e d t h ep r o c e s si sp r o v e dt oc o n v e r g et op - d i m e n t i o n a lb r o w n i a nb r i d g eu n d e rn u l la n dc o n v e r g ei n t op - d i m e n t i o n a lb r o w n i a nb r i d g ew i t ha “d r i f t ”u n d e ra l t e r n a t i v e b yt a k i n g ah o m o g e n e o u sa n dc o n t i n u o u sf u n c t i o n a lo nw c u s u mp r o c e s s al a r g ec l a s so ft e s t s t a t i s t i c sa r ep r o p o s e d p r o v i d e dt h a t “d r i f t d o e s n te q u a lz e r o ,t h et e s ts t a t i s t i c sh a v e n o n t r i v i a ll o c a lp o w e ru n d e rl o c a la l t e r n a t i v eo fo r d e r6 = 1 2a n dd i v e r g e su n d e rn o n l o c a l a l t e r n a t i v eo fo r d e r0 5 1 2 i ti sv e r i f i e dt h a tt h ef a m o u sc r a m e r m i s e ss t a t i s t i c a n dl a g r a n g e - m u l t i p l i e rs t a t i s t i ca r ei n c l u d e di nt h ec l a s s i nt h ec a s eo fl o c a ls t r u c t u r a l c h a n g e s ,w m o s u m ( w e i g h t e dm o v i n gs u m ) p r o c e s si sc o n s t r u c t e da n dp r o v e dt oc o n v e r g et oh - i n c r e m e n t ( w i t hs t e ps i z eh ) o ft h eb r o w n i a nb r i d g eb a s e do nap r e l i m i n a r y t h e o r e mw h i c hd e s c r i b e sc o n v e r g e n c eo ft h ei n c r e m e n to fas t o c h a s t i cp r o c e s so nd 0 ,7 - p u n d e ra l t e r n a t i v eh y p o t h e s i s w - m o s u mp r o c e s sc o n v e r g e st oab r o w n i a nb r i d g ew i t h a “d r i f t ”b yt a k i n gah o m o g e n e o u sa n dc o n t i n u o u sf u n c t i o n a lo nw c u s u mp r o c e s s , w ep r o p o s eal a r g ec l a s so ft e s ts t a t i s t i c sa g a i na n dc o n c l u d es o m ea s y m p t o t i cp r o p e r t i e s s i m i l a rt ot h ec a s eo f 、v c u s u m f i n a l l ys e v e r a lm e n t oc a r l os i m u l a t i o n so nt h et w o c l a s s e so fs t a t i s t i c sa r ep e r f o r m e dw h i c hi n d i c a t e st h ee f f i c i e n c yo fo u rm e t h o d s s e c o n d l y , s e q u e n t i a ld e t e c t i o no fs t r u c t u r a lc h a n g e si ss t u d i e di ng e n e r a l i z e dl i n - e a rm o d e l s b a s e do nq u a s i m ls c o r e s 、_ c u s u ma n dw m o s u mp r o c e s s e sa r ec o i l - s t r u c t e da n dp r o v e dt oc o n v e r g et oab r o w n i a nb r i d g ea n di t sh - i n c r e m e n tc o r r e s p o n d - i n g l y b yt a k i n g “d o u b l e - m a x f u n c t i o n a lo nt h ew - c u s u mp r o c e s s ,w ec o n s t r u c t e da t e s ts t a t i s t i ca n do b t a i ni t sl i m i td i s t r i b u t i o na n di t se x a c tp r o b a b i l i t yf o r m u l a w ea l s o p r o v et h a tt h es t a t i s t i ci sc o n s i s t e n tu n d e ra l t e r n a t i v ea n do b t a i nt h er e l a t i o n s h i pb e t w e e n 1 c h a n g e - p o i n tl o c a t i o n 。a n d 1d e l a yp e r i o d 。b yt a k i n g 。d o u b l e - m a x ”f u n c t i o n a l 6 两北大学博一i j 学位论文统计模犁结构变化的序贯检测 o nt h ew - m o s u mp r o c e s s ,w ec o n s t r u c ta n o t h e rt e s ts t a t i s t i ca g a i na n dg a i ni t sl i m i t d i s t r i b u t i o na n di t sn o n e x p l i c i te x p r e s s i o no fp r o b a b i l i t yf o r m u l a t h e nt h ec o n s i s t e n c y i sa l s op r o v e d i nt h es u b s e c t i o no fs i m u l a t i o n ,w et a b u l a t et h en o m i n a lc r i t i c a lv a l u e f o rt h e “d o u b l e m a x f u n c t i o n a ls t a t i s t i ca n da l s ov e r i f yt h ee f f i c i e n c yo fo u rm e t h o d s b ys e v e r a ls i m u l a t i o n s i nt h es p e c i a lc a s eo fg l m - - n o r m a ll i n e a rm o d e lw i t hc l a s s i c a l l i n kf u n c t i o n ,w ec o m p a r eo u rm e t h o d sw i t he x i s t i n go n e sa n do u rm e t h o d sp e r f o r mm o r e e x c e l l e n t l y f i n a l l y , s e q u e n t i a ld e t e c t i o no fs t r u c t u r a lc h a n g e si ss t u d i e di nn o n p a r a m e t r i cr e - g r e s s i o nm o d e l s 。b a s e do nn a d a r a y a - w a t s o ne s t i m a t o ro fr e g r e s s i o nf u n c t i o n ,w ec a l c u - l a t et h er e s i d u a ls e r i e sa n dc o n s t r u c t r e s i d u a lc u m u l a t i v es u mp r o c e s s w i t hw e i g h t v a l u e so fk e r n e le s t i m a t o ro f “l o n g r u na v e r a g ed e n s i t yf u n c t i o n ”u n d e rn u l lh y p o t h e s i s ,t h ep r o c e s sc o n v e r g e st oas t a n d a r db r o w n i a nb r i d g e b yt a k i n gah o m o g e n e o u s a n dc o n t i n u o u sf u n c t i o n a lo nt h ep r o c e s s ,al a r g ec l a s so ft e s ts t a t i s t i c sa r ec o n s t r u c t e d w ea l s op r o v et h e i rl i m i td i s t r i b u t i o n sa n dt h e i rc o r r e s p o n d i n gc o n s t r u c t i o nm e t h o d so f “c r i t i c a lv a l u e s ”a tt h es a m et i m e t h ep r o c e s sc o n v e r g e st oab r o w n i a nb r i d g ew i t ha d r i f t u n d e rt w oa l t e r n a t i v eh y p o t h e s i s h i ao rh i b p r o v i d e dt h a t d r i f t d o e s n t e q u a lz e r o ,t h e yh a v en o n t r i v i a ll o c a lp o w e ru n d e rl o c a la l t e r n a t i v eo fo r d e r5 = 1 2a n d d i v e r g e su n d e rn o n l o c a la l t e r n a t i v eo fo r d e r0 5 1 2 w ei n v e s t i g a t eo u rd i s t r i b u t i o n t h e o r yw i t ham o n t ec a r l os i m u l a t i o nw h i c hi n d i c a t e st h ea p p l i c a b i l i t yo fo u rm e t h o d s k e yw o r d s :s t r u c t u r a lc h a n g e s ,b a y e s i a nf o r m u l a t i o n ,r e l i a b i l i t ys t a t i s t i c s ,c u s u m , m o s u m 一7 一 小义r t l 的记号与名词 符号 ( q ,厂,p ) e x v a r x c o v ( x ,y ) x 。三x x n 土x r ( z ) 与f ( x ) p n 弓p 盯( x 1 ,x 2 ,) i ( a ) 【a 】 aab avb x 皇y a n = d ( b n ) a 礼= o ( b n ) k = o e ( 1 ) k = o e ( 1 ) = o p ( a n ) k = o p ( a n ) a n b n 本文中的记号与名词 意义 概率空间 随机变量x 的均值 随机变量x 的方差 随机变量x 与y 的协方差 随机变量列 k ) 依概率收敛于随机变量x 随机变量列( k ) 依分布收敛随机变量x ( 或弱收敛) 序列r ( z ) 淡收敛于f ( x ) 测度序列 ) 弱收敛于测度弘 由随机变量x 1 ,尥,生成的仃域 集a 的示性函数 实数a 的整数部分 实数a 与b 两者中的小者 实数a 与b 两者中的大者 随机变量x ,y 依分布相等,即:其概率分布函数相同 l i ma n b n = 0 n o 。 l i ms u po n k k + + 1 + c k ,k = 1 ,2 ,n , ( 1 1 ) 其中j c ,k = 1 ,2 ,几是i i d 的且通常要求e ( b1 2 + 6 ) 0 ) ,k + 称为“变 点”,称为“跃度”f j u m ps i z e ) 。关于该模型首要的问题是“变点”检验问题,于 是有如下原假设与备择假设: h o :k + = 扎hh 1 :1 k + 七。) ,6 0 ,1 2 】,该情形在第四章会 出现;3 ) 参数变化程度依赖于时间( i n ) ,而是甭发生变化则依赖于非时间变量;4 ) 参数变化程度依赖于非时间变量,而是否发生变化也依赖于非时间变量。后面两类可 以归入著名的“门限 模型( t h r e s h o l dm o d e l ) ( t o n g ,1 9 9 0 ,f 1 3 3 ) ,其建模是基于“分 段 线性逼近,即:把状态空间分割成几个子空间,每个子空间上使用线性逼近,分 一3 第章绪论 割主要f f l 所谓的“门限”变量来指定,其好处在平稳时间序列场合能继续保持序列的 平稳性,许多经典方法仍然可以运用。前两种情形小同于“门限原理”,其结构变化 的“控制开关”( r e g i m e s w i t c h ) 按时间发生,在时序场合,往往会导致非平稳,难度较 大,本文作者只关注这两种情形。在这四种情形中,首先都会存在“结构变化”的检 验问题,特别的如果通过检验发现存在“突变”,则紧接着一般就会考虑“变点”及 “跃度”估计问题。 “持久性变点”问题在非线性金融时间序列中受到众多关注。k i m ( 2 0 0 0 ,【7 3 】) , k i m 和b e l a i r e ,b a d i l l i ( 2 0 0 2 ,【7 4 ) 提出由i ( o ) 到i ( 1 ) ,或由z ( 1 ) 到i ( o ) 变化的持久 性的残量比率检验,b u s e t t i 和t a y l o r ( 2 0 0 4 ,2 2 ) 提出由i ( 1 ) 到i ( 0 ) 变化持久性的一 致检验,l e y b o u r n e 和t a y l o r ( 2 0 0 4 ,f 9 0 ) 进一步在弱相依的情况下考虑了修正的比率 检验,使检验具有较好的功效。在持久性变点问题中,主要包含变点的检验以及估计问 题。 1 1 2结构变化的历史检测方法 结构变化的历史检测方法与序贯检测方法应用都非常广泛,两者既有区别又有联 系,= 耷:文着重讨论后者,但是为了借鉴思想,了解历史,本小节先介绍历史检测的基 本方法,下节介绍序贯分析方法。 自从p a g e 的开创性研究以及b r o w n 等提出“迭代累积和”( r e c u r s i v ec u s u m ) 方 法以来,在计量经济学和统计学文献中,一大类结构变化的检测方法被提出来。这 些方法,大体而言被分为两类:第一类称之为“似然比方法”( l r ) 或“拟似然比方 法 ( l r - l i k e ) ,指的是考虑模型中至多含有一个突变( a m o c ,a t m o s t o n e - c h a n g e m o d e l ) 的情形,其渐进等价形式包括w a l d 方法,l m 方法和f 方法;另一类称之为“波 动方法”( f l u c t u a t i o nm e t h o d ,见k u a n $ i h o r n i k ,1 9 9 5 ,7 6 ) ,指的是并不考虑结构具 体的变化方式。 ( 一)似然比方法 “似然比方法”( l r ) ,其等价形式包括w a l d 方法、l m 乘子法以及f 检验法。应 用极大似然比检验的思想,对一些分布变点存在性的检验是变点理论中较早讨论 的问题,主要集中在对正态分布均值变点的检验。如c h e r n o f f 和z a c k s ( 1 9 6 4 ,【2 8 ) ,k a n d e r 和z a c k s ( 1 9 6 6 , 7 1 ) ,g a r d e n e r ( 1 9 6 9 “4 3 ) ,s e n 和s r i v a s t a v a ( 1 9 7 5 ,【1 2 4 , 1 2 5 ) ,h a w k i n s ( 1 9 7 7 , 5 8 ) ,w o r s l e y ( 1 9 7 9 ,【1 4 1 ) ,y a o 和d a v i s ( 1 9 8 6 ,【1 4 4 ) ,h o r v a t h ( 1 9 9 3 ,6 4 ) 等等;进一步推广到具有正态误差的线性模型中的似然比检验 方法,文献也很多,包括j a m e s $ 1 s i e g m u n d ( 1 9 8 7 , 7 0 】) ,h a w k i n s ( 1 9 8 7 , 5 9 】) ,k i m 和s i e g m u n d ( 1 9 8 9 ,【7 2 】) ,h o r v a t h ( 1 9 9 5 ,【6 6 ) 等等,特别是h o r v a t h 在文献 6 6 中提 出了线性模型的d a r l i n g e r d 5 s 型极限分布;a n t o c h ( 2 0 0 4 , 5 ) 将h o r v a t h ( 1 9 9 5 , 6 6 ) 相应结论推广到广义线性模型场合,而在一般非线性参数模型场合,a n d r e w s ( 1 9 9 3 , 2 1 ) 基于一般g m m 框架巧妙的构造了拟似然比方法( s u p - l r ) ,并得出布 一4 两北大学博上学位论文统训模型结构变化的序贯检测 朗桥泛函形式的极限分布,l 一时等价的提出了s u p l m ,s u p w a l d 方法。 垦熙友选。设随机变量x 1 ,托,x t 相互独立,x 1 ,拖,托。一( m ,0 - 2 ) , 扎+ 1 ,x 2 ,坼一( 肛2 ,0 - 2 ) ,其中k + 是未知正整数,肛1 ,p 2 ,盯2 为未知参数,若p 1 p 2 , 则称后+ 均值变点假设检验问题为: h o :肛1 = p 2hh 1 :, u l 肛2 对固定的七,由极大似然比检验的思想,令: 丁 a k = s u p 兀,( z l ;p ,盯2 ) ( j u ,口2 ) e o oi = 1 s u p 兀f ( x i ;1 ,盯2 ) 兀f ( x i ;p 2 ,盯2 ) ( p 1 ,p 2 ,口2 ) c oi = 1i = k + l 在正态分布的假设下,可计算得 t 其中睇= 季( x 一又) 2 , = 1 t凫 季咒,- x l k = i 1 五,冠南 i = 1i = 1 - 2 l o g a k = t ( 1 0 9 5 ;一l 0 9 5 2 ) , 对于1 k t 一1 ,检验统计量可以取为 ( 1 5 ) ( 1 6 ) 勿= m a x ( 一2 l o g a k ) 1 k 丁一1 一 若勿较大时,拒绝原假设,则认为变点存在,否则,接受原假设。 在小样本的情况下,s e n 和s r i v a s t a v a ( 1 9 7 5 , 1 2 4 ) 利用随机模拟的方法给出了 检验的临界值,w o r s l e y ( 1 9 7 9 ,【1 4 1 ) 给出了统计量的精确分布。h o r v 螽t h ( 1 9 9 3 , 6 4 ) 把上述检验问题推广为正态分布均值和方差同时有变点的场合,并于1 9 9 5 年在文 献 6 6 】中将其推广到线性模型场合。c s s r 9 6 和h o r v 磊t h ( 1 9 9 7 ,【3 5 ) 进一步把上述检验 问题推广为更一般的场合:设x 1 ,托,硌相互独立,五一f ( x l ,9 ) ,i = 1 ,k + , 五一f ( x i ,曰+ ) ,i = 1 ,k + + 1 ,丁,其中9 ,矿为参数向量考虑如下假设检验问 题: 凰:0 = 0 + hh i :0 0 + ( 1 7 ) 并得到如下定理 定理1 1 3 5 】如果原假设风成立,对任意实数z ,有 丁坐p a ( 1 。g t ) z 2 z + d d ( 1 。g t ) ) = e x p - 2 e - z ) ( 1 8 ) 其中a ( x ) = ( 2l o gx ) 1 2 ,d a ( x ) = 2l o gx + 2l o g l o g - l o gf ( d 2 ) x ,这里d 是参数个数 5 一 一x里这又 鼍 丁斟 又恐 k 五 七二州篷苎蜥 一丁 , = 上出南 分 = 第章绪论 南定理1 1 得到检验统计量z r 的上侧a 分位数为 嘶) = 趔螋迷赫笋业型 s r i v a s t a v a 和w o r s l e y ( 1 9 8 6 ,f 1 3 2 ) 应用极大似然比方法对多元正态分布的均值 作了变点检验w o r s l e y ( 1 9 8 6 ,【1 4 2 1 ) ,g o m b a y 和h o r v 矗t h ( 1 9 9 0 , 4 8 】) ,w a n g 和b h a t t i ( 1 9 9 8 ,【1 3 8 ) 对指数分布的变点进行了讨论,k o k o s z k a 和t e y s s i 芒r e ( 2 0 0 3 , 7 7 ) 把极大 似然比方法应用于g a r c h 模型的变点检验等等对于g a r c h 相依序列,文献 7 7 】应 用b o o t s t r a p 方法模拟临界值印( q ) 挞量友法。上述似然比方法基本上最好的结果是得至l j d a r l i n g - e r d 5 s 型极限分 布( 形如定理1 1 ) 。具有里程碑意义的工作是,在有一个变点的非线性参数模型 中,a n d r e w s ( 1 9 9 3 ,f 2 1 ) 基于g m m 框架提出了类似于( 1 6 ) 的公式 s u pl 凡( 7 r 1 ) 7 r 1 e a e 其中l t k ( t r l ) 表示似然比在交点惫+ = h 7 r 1 】处的估计,且最大化算子s u p ( ) 约束 7 r l e a 。 在 o ,1 】区间的某个子集a 。= 陋1 ,1 一g 2 】。在原假设下,其极限分布为 s u pl p h ( 1 r 1 ) 考s u pg q ( 7 r 1 ) ,( 1 9 ) 7 r l e a e r 1 e a 。 其中 g 扣扣盥业鼍掣警删,( 1 1 0 ) 其中瞩( 亡) 为g 一维独立布朗桥向量。意料之中的是,该极限分布既依赖于q 同时也依 赖于区间赴,特别的,a n d r e w s ( 1 9 9 3 , 2 】) 指出:如果e 1 = 5 2 = 0 则统计量在原假设 下发散,这同时也意味着随着1 ,e 。变小,统计量的临界值变人,而其检验的“势” 降低。一方面区间舡要足够小以使临界值不要太大同时“势”也不至于太低,而 另一方面又要使得区间尽可能大以包含可能的变点,因此,需要设置一个合适的边 界,a n d r e w s 设置为9 1 = e 2 = o 1 5 ( 2 】) ,并提出一般的对称“截尾”区间( 或者渐近对 称“截尾”区间) 九= k1 一e 1 。当然,这不是被强制的做法,只是因为极限分布通过 依赖于,y = 刺而依赖于1 ,e 2 。 可以证明,还可以类似的提出“拟w a l d 方法与“拟l m 方法”,这两种方法均与 “拟l r 方法”渐近等价。以a m o c 一位置模型( 1 1 ) 为例可以容易推断出其w a l d 统计量 的表达式为 w n ( t r l ,= 揣筹落猫掣,( 1 1 1 , 意 注 和方平差残为 、- 、 岛 ,两 南 一 岛 j溉c占 i | 、 玑 歹刨 南 一 玑 j 胤 l l “三, rs 中其 两北大学博上学位论文 统计模型结构变化的序贯检测 到,在原假设下分母收敛盯2 而分子经过简单的代数运算则可以化为 如果尼n 叫7 r 1 ( 0 , 七+ 1 , - 1 2 龟考o r w ( 1 ) 一( 7 r 1 ) 】,则w a l d 统计量的极限分布为: t = l w n ( 7 r 1 ) 爿业坠筹芋型剑 7 r l w ( 1 ) 一w ( 7 r 1 ) 】2 7 r 1 ( 1 7 1 1 ) 这等价于( 1 1 0 ) ( q = 1 ) 。 迸一步a n d r e w s $ o p l o b e r g e r ( 1 9 9 4 ,( 3 j ) 指出s u p l r ( s u p w a l d ,s u p l m ) 并非 最优,而作适当加权之后e x p l r ( 等价的,e x p 一、v a l d ,e x p l m ) ,m e a n l r ( 等价的,m e a n 一、a l d ,m e a n l m ) 存最大化加权平均势意义下达到最优。同时, 受、a l d 表达式启发,b a i ( 1 9 9 7 , 7 ) 在多元线性模型单变点场合提出了变点检验和 估计方法;并于1 9 9 9 进一步提出拟极大似然比方法对线性模型中的多个变点进行检 验( b a i , 9 ) 。 ( 二)波动检验 “波动检验”方法( f l ,f l u c t u a t i o nt e s t s ) ,最早起源于b r o w n ,d u r b i n ,和e v a n s ( 1 9 7 5 , 2 1 ) 的“迭代残差c u s u m ”方法,其基本步骤包括: 1 ) 先崩合适的方法拟合模型,在参数模型中,常用极大似然法( m l ) 、最4 , - 乘 法( l s ) ,或者更一般的m 方法或者广义矩方法( g m m ) :而在非参数模型中,最常见的 是核方法。 2 ) 构造经验波动过程,该过程在“结构变化与“结构不变”两选择中表现不 同。 3 ) 以经验波动过程为基础,利用合适的泛函构造检验统计量。 经验过程的构造是“波动检验 的关键,文献中常见的构造方法包括四类:迭代 残差c u s u m 方法( b r o w ne ta l ,1 9 7 5 “2 1 】;h o r v a t h ,2 0 0 4 ,【8 3 】) ;比检验方法;基于 估计的波动检验方法;基于加权残差的波动检验方法;这些方法和思想散见于各类文 献,一般来说对于一些常见的“结构变化”备择假设都具有较好的“势 ,但是由于 其构造并未考虑具体的备择假设形式,因而相比于后面的“似然比 方法检验“势 一7 。瑚r1 1 一n 十0, , 舻i & 一 厂。 q 竹汹陟f 第章绪沦 较差。关予“波动检验”方法的基本思想和这些特点,b r o w n 在其开创性论文中给了精 辟的论述: “从本质而言,这些技巧事先并未对参数a v 磊, g 形式做任何参数化假定,从 而利用这些特殊的备择假设构造具有较高势的显著性检验方法;相反的, 只是利用某种直观的可视化的图方法,勾勒对于参数恒定这一假定的某种 偏离”( b r o w ne ta l ,1 9 7 5 ,f 2 1 p 1 4 9 1 5 0 ) 这段话至少从两个方面给了作者启发:一是当原假设不成立时,不要轻易对备择假设 的具体情形做出判断,只能作为进一步探索模型的依据,关于该点在第1 1 3 小节中会 有更详细的讨论;二是检验方法尽可能借助直观图形,做出直观判断,这点也是我们 以后各章的努力点之一。 基王残差的= = 遗动捡验! :。在结构变化领域,大多数检验方法都是基于残差部分 和的。为获得一般的思想,我们不妨再回顾p a g e ( 1 9 5 5 ,【1 0 5 ;1 9 5 7 , 1 0 6 ) 的工作,针 对a m o c 一位置模型( 1 1 ) ,使用了中心化数据( d e m e a n e dd a t a ) 的部分和检验结构变化, 构造了c u s u m 检验统计量: 踺卜蟛m i 叫n & , 。m ,a x 。i 。m i a x ,s 一s 其中肆= ( y j 一雪) 。如果其中某一个超过临界值,则拒绝原假设。n a d l e r n l r o b b i n s ( 1 9 7 1 ,【1 0 1 ) 表明卜述统计量等价于观察: 0 r m a x ns r o m l ns (112)rn0 r no 、 如果这个“极差”太大,则拒绝原假设。 g a r d n e r ( 1 9 6 9 , 4 3 】) 借鉴t p a g e 的q h 心化数据部分和榆验思想,同时视变点位置 k + 为随机的,考虑了其先验概率为p t = p ( k + = 亡) ,因而其本质利用t b a y e s i a n 统计思 想。他构造的统计量为: nr们12 q = 靠2 n _ 1 p 。l ( 协一雪) i , ( 1 1 3 ) t = l l j 刊+ 1j 其中雪= n 一1 y t 为样本均值;篚= n _ 1 ( 犰一f j ) 2 为样本方差。如果各观测值为等 权,即:p t = 1 t ,检验统计量简化为 礼rn 2 q = 坛2 n 2 l ( y j 一雪) f , ( 1 1 4 ) t = lp 雹+ 1 j m a c n e i l ( 1 9 7 4 ,【9 7 1 ) 分 1 i :其极限分布为 q 弓片b o ( r ) 2 d r ( 1 1 5 ) 8 两北大学博上学位论文 统计模犁结构变化的序贯检测 m a c n e i l ( 1 9 7 8 ,【9 8 ) 将上一方法从位置模型扩展到具有多项式趋势的回归函数 p y t = 屈,t t i + t ,t = 1 ,2 ,n i = 0 其中屈,t = 屈+ 文厶七。其检验统计量为: q = a 孑2 n 一2 耋1 【i = 耋t1 岛 2 , = 屹2 n - 2 i 岛i , t =i+i n 其中篚= n 。砖,色为回归残差。其极限分布为: t = l ( 1 1 6 ) ( 1 1 7 ) q 毒詹b p ( r ) 2 d r ( 1 1 8 ) 其中讳( r ) 为广义布朗桥。p e r r o n ( 1 9 9 1 ,【1 0 7 ) 将该统计量推广到误差序列相依的情 形,获得了极限分布相同的检验统计量: q = 元。c 。,一1 铊一2 耋l 塞。白 2 , ( 1 1 9 ) 其中h 。( 0 ) 为谱密度函数在0 处的估计值。 综观p a g e 的c u s u m 统计量或者q 统计量的构造过程,_ 口j 以发现:它们都是残差 部分和过程的一个泛函,前者看作部分和过程的极差,后者则可以看作l a g r a n g e m u l t i p l i e r ( l m ) 因而是一个残差部分和平方的均值。这些基于过程的泛函思想被 广泛运用,特别是p l o b e r g e r ( 1 9 9 2 ,【1 1 3 ) ,c h u ( 1 9 9 5 , 3 1 ) ,l e i s c h ( 2 0 0 0 ,【8 7 1 ) 等学 者在文献中作了非常一般的推广。f 补充一部分非参数情形的文献以及h o r v a t h 她们 的d a r l i n g - e r d o s 型的结论1 基王造悠德差的! 这动捡验二另一个在理论和应用领域非常重要的是b r o w n 等 于1 9 7 5 年提出的c u s u m 检验( f 2 l 】) 。这个检验方法基于迭代残差的部分和的最大值泛 函。具体来说,给定一个具有p 一维回归量z 。的线性模型: 定义 y i = z :屈+ c i ,i = 1 ,2 ,他 c u s u m =m a x p + 1 r n ( 1 2 0 ) ( 1 + 2 群) ( 1 2 1 ) 其中方2 一盯2 ,通常取“平均残差平方和 ,为了增加“势”也可以取中心化的“平 均迭代残差平方和”( h a r v e y ,1 9 7 5 , 5 6 】) ;矛为“迭代残著 : 矛= ( y t z :屈一1 ) 厶 五:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论