(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf_第1页
(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf_第2页
(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf_第3页
(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf_第4页
(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(应用数学专业论文)成组复发事件数据的统计建模与分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

d i s s e r t a t i o n s t a t i s t i c a lm o d e l i n ga n da n a l y s i s o f c l us t e r e dr e c u r r e n te v e n td a t a b y s u p e r v i s o r :p r o f m i n y u x i e p r o f s u ih e s p e c i a l t y :a p p f i e dm a t h e m a t i c s d e p a r t m e n t o fm a t h e m a t i c sa n ds t a t i s t i c s h u a z h o n g n o r m a lu n i v e r s i t y m a y ,2 0 1 1 博士学位论文 d o c t o r a ld i s s e r n n o n 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:0 蕃 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同意华中 师范大学可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。 作者签名:d 也导师签名:j 盼瓦角 允许北京万方数据电子出版社出版的中国学位论文全文数据库将本人论文 以电子、网络、镜像及其他数字媒体形式公开出版。 作者签名:谚。 本人已经认真阅读“c a l l s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l l s 高校学位论文全文数据库”中全文发布,并可按“章程中的 规定享受相关权益。回意i 金文握交卮溢后;旦坐玺;旦二笙;鱼三生发查。 作者签名: 0 莒 日期:少i 恽r 月讼日 导师签名:? 和无功 日期:2pf 年3 月以7 日 博士学位论文 i x 圯 t o r a ld i s s e r l 加o _ n 内容摘要 成组复发事件数据是比复发事件数据更加复杂的一大类复杂数据,其研究 结果不但有重要的理论意义,而且具有广泛的应用前景。在本文中,我们较系统 的研究了成组复发事件数据下的统计建模。 第一,复发事件在生物医学研究中经常出现,并且每组中的个体之间可能不 是相互独立的。对于成组复发事件数据,我们给出了半参数的加性比率模型, 在这个模型中协变量与未知的基本比率函数为加性关系。在推断模型参数中, 用到的是估计方程的方法,并且得到了估计参数的大样本性质。我们还进行了 大量的模拟研究,模拟研究的结果与理论结果是相符的。 第二,我们在成组复发事件数据下研究了一个一般半参数的加性乘积比率模 型,在这个模型中有些协变量的影响是加性的,有些协变量的影响是乘性的。 利用估计方程的理论,我们给出了该模型中未知参数和基本比率函数的估计, 同时利用现代经验过程理论证明了所得估计的相合性和渐近正态性。 第三,半参数边际转移模型是较广的一大类半参数模型,它包含了前面的 加性模型和乘性比率模型作为特殊情形。我们给出了成组复发事件数据的一类 半参数的边际转移模型。在未知模型参数和非参数函数的推导中,用到了估计 方程的方法,并且运用现代经验过程理论证明了估计函数的相合性和渐近正态 性。 第四,我们对成组复发事件数据建立了半参数加速失效时间模型,在这个 模型中协变量对均值函数在整个复发过程中有加速、减速的作用,这与前面三 个模型是完全不同的。对未知参数的推导,我们用到了广义估计方程的方法, 又运用了现代经验过程理论,证明了估计参数的相合性和渐近正态性。 关键词:半参数模型;加性比率模型;加性乘积比率模型;边际转移模型; 加速失效时间模型;成组复发事件数据;估计方程 a b s t r a c t i nt h i st h e s i s ,w em a i n l yd e a lw i t hs t a t i s t i c a la n a l y s i so ft h ec l u s t e r e dr e c u r r e n t e v e n td a t a f i r s t l y r e c u r r c n te v e n td a t ao f t e na r i s ei nb i o m e d i c a ls t u d i e s ,a n di n d i v i d u a l s w i t h i nac l u s t e rm i g h tn o tb ei n d e p e n d e n t w ep r o p o s eas e m i p a r a m e t r i ca d d i t i v e r a t c sm o d e lf o rc l u s t e r c dr e c u r r e n te v e n td a t a ,w h e r e i nt h ec o v a r i a t c sa r ca s s u m e d t oa d dt ot h eu n s p e c i f i e db a s e l i n er a t e f o rt h ei n f e r e n c eo nt h em o d e lp a r a m e - t e r s e s t i m a t i n ge q u a t i o na p p r o a c h e sa x ed e v e l o p e d ,a n db o t hl a r g ea n df i n i t es a m p l e p r o p e r t i e so ft h ep r o p o s e de s t i m a t o r s a r ee s t a b l i s h e d w ea s s e st h ef i n i t es a m p l e p r o p e r t i e so ft h ep r o p o s e de s t i m a t o r st h r o u g hs i m u l a t i o ns t u d i e s t h es i m u l a t i o n r e s u l t sp e r f o r mw e l lf o rt h ep r o p o s e de s t i m a t i o np r o c e d u r e s s e c o n d l y , w cp r o p o s e ac l a s so fs e m i p a r a m c t r i ca d d i t i v e - m u l t i p l i c a t i v er a t e sm o d - e l sf o rc l u s t e r e dr e c u r r e n te v e n td a t a ,w h i c hm l o w ss o m ec o v a r i a t ee f f e c t st ob ea d - d i t i v cw h i l co t h e r st ob cm u l t i p l i c a t i v c f o rt h ei n f e r e n c eo nt h em o d e lp a r a m e t e r s , e s t i m a t i n ge q u a t i o na p p r o a c h e sa r ed e v e l o p e d b a s e do nm o d e m e m p i r i c a lp r o c e s s t h e o r y , t h ec o n s i s t e n c ya n da s y m p t o t i cn o r m a l i t yo ft h ep r o p o s e de s t i m a t o r s a r e c s t a b l i s h e d t h i r d l y ,s e m i p a r a m e t r i cm a r g i n a lt r a n s f o r m a t i o nm o d e l sa r ea c l a s so fs e m i - p 盯锄e t r i cm o d e l s ,w h i c hi n c l u d et h es e m i p a r a m e t r i ea d d i t i v em o d e la n dt h e s e m i - p a r 锄c t r i cm u l t i p l i c a t i v er a t e sm o d e l s ac l a s so fs e m i p a r a m c t r i cm a r g i n a lt r a n s - f b r m a 七i o nm o d e bo fc l u s t e r e dr e c u r r e n te v e n td a t ai sp r o p o s e d f o rt h ei n f e r e n c e o nt h eu 玎k n o w nm o d e lp a r a m e t e ra n dn o n p a r a m e t r i cf u n c t i o n ,g e n e r a l i z e de s t i m a t i n gc q u a t i o nm e t h o d sa r ed e v e l o p e d b a s e do nm o d e me m p i r i c a lp r o c e s st h e o r y , t h ec o n s i s t e n c ya n da s y m p t o t i cn o r m a l i t yp r o p e r t i e so ft h ep r o p o s e de s t i m a t o r sa r e f o u r t h l y , w ep r e s e n ta n a t u r a le x t e n s i o no fa c c e l e r a t e df a i l u r et i m em o d c lf o r k e y w o r d s :s e m i p a r a m e t r i cm o d e l s ;a d d i t i v er a t e 8m o d e l ;a d d i t i 悟 m u l t i p l i c a t i v er a t e sm o d e l s ;m a r g i n a lt r a n s f o r m a t i o nm o d c l ;a c c e l e r a t e dr 臣i l u r e t i m em o d e l ;c l u s t e r e dr e c u r r e n te v e n td a t a ;e s t i m a t i n ge q u a t i o n 博士学位论炙 d o c t o r a ld i s s e r n 嫌o n 目录 第一章概述1 1 1 研究的问题及研究背景1 1 2 主要研究内容7 1 3 几个常用的中心极限定理8 1 4 结构安排9 第二章成组复发事件数据下的加性比率模型1 0 2 1 模型和估计1 0 2 2 渐近性质1 2 2 3 模拟1 4 2 4 定理证明1 4 第三章成组复发事件数据下的一般半参数加性乘积比率回归模型2 1 3 1 模型和估计方法2 1 3 2 渐近性质2 4 第四章成组复发事件数据下的半参数转移模型3 2 4 1 模型和方法3 2 4 2 渐近性质3 3 4 。3 定理证明3 5 第五章成组复发事件数据下的加速失效时间模型3 9 5 1 模型和方法3 9 5 2 拟合优度检验4 3 博士期间完成的论文6 2 致谢6 3 博士学饭论文 d ( ) c t o r a ld i s s e 踟o n 第一章概述 复发事件数据( r e c u r r e n te v e n td a t a ) 和成组数据( c l u s t e r c dd a t a ) 是两种常见 的复杂数据。成组复发事件数据( c l u s t e r e dr e c u r r e n te v e n td a t a ) 既包含了复发 事件数据的结构,又包含了成组数据的结构,是一种更复杂精细的数据结构。 对复杂数据进行统计建模和统计分析,揭示其内在规律是生物学、医学、人口 学、生态学、经济学等学科的重要基础,而如何对这样的数据进行统计建模和 分析是当今统计学与生物学、医学、人口学、生态学、经济学等交叉学科的研 究热点。本文主要对成组复发事件数据进行统计建模和统计分析。 1 1 研究的问题及研究背景 1 1 1 复发事件数据( r e c u r r e n te v e n td a t a ) 在许多研究背景下,对每个个体而言,某种感兴趣的事件会反复多次发 生,这类情况的事件称为复发事件( r e c u r r e n te v e n t ) 复发事件数据就是对一些 个体进行观察,某种感兴趣事件重复发生的时间所组成的数据,这类数据经常 出现在生物,医学,社会和经济学等研究领域中。比如: 汽车保修索赔次数; 一些国家妇女的各次生育时间; 某些机器故障的多次发生时间; a i d s 病和一些传染病的重复感染时间; 病人某种疾病的多次复发时间; 动物某些肿瘤的重复发生时间 由于事件重复发生的时间具有以下特点: 1 、:= = 博士擘缘论文 d o c t o r a ld i s s e r t 姗o n 有次序: 有相依性; 存在删失时间; o 删失时间可能与事件发生的事件也具有相依性 等等,因此对于这类数据的统计分析、统计建模以及统计推断与纵向数据不 同,比纵向数据困难的多。由于复发事件数据在生物和医学等领域经常出现, 近十几年来对这类数据的研究异常活跃,是现代生存分析,生物和医学统计等 研究领域的热点之一。又由于复发事件数据结构自身具有重要的特点和广泛的 应用,对它的统计分析已经受到世界各国特别是发达国家的重视,其研究结果 不仅具有重要的理论意义,而且具有广泛的应用前景。 在复发事件数据的分析中,通常关心的是协变量对复发事件率的影响,基 于危险函数或强度过程的半参数回归模型为研究协变量的历史影响提供了自然 和方便的框架;边际模型由于参数估计的目的,没有加入相关结构,但是解释 了对协变量估计的依赖。已经存在的一些基于对强度函数和危险率函数进行统 计建模分析的估计方法,包括边际回归模型( w e i ,l i n & w c i s s f e l d ,1 9 8 9 ;l e e ,w e i & a m a t o ,1 9 9 2 ) 和条件回归模型( p r e n t i c e ,w i l l i a m s & p e t e r s o n ,1 9 8 1 ;a n d e r s o n g i l l ,1 9 8 2 ;c h a n g w a n g ,1 9 9 9 ;w a n g c h e n ,2 0 0 0 ) 对于删失时间与复发时间 独立的情况,m a l l e r 等人对事件过程进行了一些非参数估计方面的研究( m a l l e r , s u n z h o u ,2 0 0 2 ) ;同时l i n 等人分别讨论了比例失效率回归模型和非参数估 计( a n d e r s o n g i l l ,1 9 8 2 ;l i ne ta 1 ,2 0 0 0 ) ;在删失时间与复发时间具有某种相依 性的情况下,g h o s h 等人研究了非参数模型、刻度变化模型以及比例失效率 回归模型的估计问题( g h o s h l i n ,2 0 0 0 ,2 0 0 2 ,2 0 0 3 ;w a n g ,q i n c h i a n g ,2 0 0 1 ; m i l o s l a v s k ye ta 1 ,2 0 0 4 ;l i ue ta 1 ,2 0 0 4 ;h u a n g w a n g ,2 0 0 4 ) 对于复发事件 数据,事件的均值函数比强度函数更具有解释意义,并且许多学者已经提出 了建立在均值或比率函数上的回归方法( p e p e c a i i ,1 9 9 3 ;l a w l e s s n a d e a n , 1 9 9 5 ;l i ne ta 1 ,2 0 0 0 ;l i n ,w c i y i n g ,2 0 0 1 ;s u n s u ,2 0 0 8 ) 例如,p e p c c a ( 1 9 9 3 ) 为模型化比率函数提出的半参数方法;l i n 等在2 0 0 0 年研究了比例均值和比 例模型,s c h a u b e l ,z c n g c a i ( 2 0 0 6 ) 提出了一个半参数的加性比率模型,c o o k 2 :、 博士学位论交 d ( ) c t ( ) r a ld i s s e l 订彻o n l a w l e s s ( 2 0 0 7 ) 对复发事件数据的研究方法给出了非常好的回顾。 对复发事件数据,下面我们主要回顾一些学者在半参数模型方面对加性模 型、乘性模型、加性乘积比率模型、边际转移模型和加速失效时间模型的统计 建模与结果。 加性模型 一些学者已经给出了加性危险模型的许多形式( 例如a a l e n ,1 9 8 0 ,1 9 8 9 ;b r e s - l o w d a y , 1 9 8 0 ,1 9 8 7 ;p o c o c ke ta 1 ,1 9 8 2 ;c o x o a k e s ,1 9 8 4 ;h u f f e r m c k e a g u e , 1 9 9 1 ;a n d e r s o nc ta 1 ,1 9 9 3 ) ,除t a a l e n ( 1 9 8 0 ,1 9 8 9 ) 和h u f f e r m c k e a g u e ( 1 9 9 1 ) 提 出的是非参数方法外,其它的都主要用的是参数的方法。 l i n & y i n g ( 1 9 9 4 ) 提出了下面的半参数加性危险模型: d h i ( t ) = d a o ( t ) + o t z i ( t ) d t , 其中人o ( t ) 是未知的累积基本比率函数,舶是回归系数,z i ( t ) 是协变量向量。l i n y i n g ( 1 9 9 4 ) 采用了计数过程的记号,并且通过计数过程鞅理论方法( f l e m i n g h a r r i n g t o n ,1 9 9 1 ) 得到了模型参数的估计方法和渐近性质。 s c h a u b e l ,z e n g c a i ( 2 0 0 6 ) 对复发事件数据又提出了下列半参数加性比率 模型: e 【d 埘( 0 1 磊( 亡) 】= d # o ( t ) + 铝1 z i ( t ) d t 其中孵( t ) 是第i 个个体的事件发生次数,p o ( t ) 是未知的基本比率函数。s c h a u b e i , z c n g c a i ( 2 0 0 6 ) 研究了该模型中和z o ( t ) 的估计问题,并讨论了这些估计的 相合性和渐近正态性。 乘性模型 对于乘性比率模型,在给定磊( ) 条件下,复发事件数据的比率函数满足下 列模型: e d n ( t ) i 磊( ) 】= d # o ( t ) e x p e o r z i ( 0 p e p e c a i ( 1 9 9 3 ) 研究了以上模型,并利用首次事件之后的复发率函数,给 出了估计的大样本理论,但是证明中尚有一些不足之处。l a w l e s s n a d e a u ( 1 9 9 5 ) 以及l a w l e s s ,n a d e a u c o o k ( 1 9 9 7 ) 研究了以上模型中印和z o ( t ) 的估计,并 3 :; 博士学位论炙 d o c t o r a ld i s s l 三r 砌d n 在假设复发时间是离散的条件下,证明了估计的渐近性质。l i nc ta 1 f 2 0 0 0 ) 禾u 用现代经验过程理论,改进了l a w l c s s ,n a d c a u c o o k ( 1 9 9 7 ) 的估计,并严格证明 - f o o t g l # o ( t ) 估计的大样本性质,还同时给出了均值函数置信区间的一种构造方 法。 加性乘积比率模型 在实际应用中,加性比率模型和乘性比率模型分别给出了协变量和比率函 数之间的两种不同的关系,有的协变量的影响是加性的,有的协变量的影响是 乘性的,还有的协变量的影响既是加性的又是乘性的 l i n g y i n g ( 1 9 9 5 ) 提出了一般的半参数加性乘积危险模型,在该模型下, 一些协变量的影响是加性的,另外一些协变量的影响是乘性的。l i n g y i n g ( 1 9 9 5 ) 乖i j 用计数过程鞅理论方法给出了模型参数的估计函数,证明了其相合性 和渐近正态性,并给出了模型中a a l e n - b r a s l o w 型的基本比率函数估计值的渐近 性质,构建了渐近有效的模型参数和非参数函数的估计值。 对复发事件数据,d a i ,s u n & y a n g ( 2 0 0 9 ) 考虑了一般半参数加性乘积比率 回归模型具有下列形式: e d n ;( ) i 磊( ) 】= g ( 3 t ow i ( t ) ) d t + h ( ,、t x i ( t ) ) d # o ( t ) , 其中阮和7 0 分别是p 1 和p 2 维未知回归系数向量,毗( t ) 和咒( 芒) 分别表7 一j - p l 和p 2 维 协变量过程向量,且p = p l + p 2 ,夕( ) 和忍( ) 为已知联系函数。d a i ,s u n y a n g ( 2 0 0 9 ) 讨论了所给模型中未知参数和非参数函数的估计方法,并利用现代经验 过程理论推导了所得估计的渐近性质。 边际转移模型 点过程不满足比例的均值假设类似于传统的生存数据不满足比例的危险 假设。为了研究非比例危险情况,许多学者( 例如d a b r o w s k a d o k s u m1 9 8 8 ; c h c n g ,w e i y i n g1 9 9 5 ,1 9 9 7 ;m u r p h y , r o s s i n i v a nd e rv a a r t1 9 9 7 ) 已经研究 了比例的机会模型和其他转移模型。l i ne ta 1 ( 2 0 0 1 ) 给出了一个带有c o x 型连 接函数边际均值和比率模型的严格形式,并给出了连续时间背景下的推导方 4 、_ _ 博士学位论文 d o c t o r a ld i s s e r t j :n o n 法,其模型如f : m z ( 亡) = g ( z ) e 盱z ) 这里夕( ) 是一个二次连续可微且严格单调递增的函数,加( ) 是一个递增的函 数。上面的模型是半参数的,基本比率函数m o ( t ) 等于夕 卢o ( z ) ) 。在上面模 型中假设d 夕( z ) 如l z :o o n ,对任意z ,e 铭。z = l i r a l o m z ( t ) m o ( t ) ,另外还 有g ( o ) = p o ( o ) = 0 ,该模型通过连接函数g 定义了一族模型,特别地,它包括 了b o x - c o x 转移模型,即 m z ( 芒) :地咝竺业i p 当p = o n ,可得到 m z ( t ) = l o g p o ( t ) e 酲z - 4 - 1 ) 当p = l 时,司得到 m z ( t ) = m o ( 亡) e 酲。z 。 加速失效时间模型 在许多应用背景下,半参数加速失效时间模型已经得到了广泛的应用,它 是另一类重要的半参数模型。对于经典的生存数据,对c o x l l 率危险模型的一 个重要替代就是加速失效时间模型,在此类模型中失效时问取对数后与协变量 是线性关系,协变量的影响有加速、减速的作用。 对复发事件数据,l i n ,w e i y i n g ( 1 9 9 8 ) 提出了下面的加速失效时间模型: e 【婀( ) i 磊】= 肋( e 酲。磊) , l i n ,w b i y i n g ( 1 9 9 8 ) 通过一般化r 3 x l k t y p e 估计方程( t s i a t i s ,1 9 9 0 ;w - e ie ta 1 , 1 9 9 0 ;l a i & y i n g ,1 9 9 1 ;y i n g ,1 9 9 3 ) 估计了模型中回归参数的向量,并用现代经 验过程理论,证明了估计参数的相合性和渐近正态性。 s u n s u ( 2 0 0 8 ) 提出了复发事件数据下的一类加速均值回归模型: e 【孵 ) l 磊】= p o ( e 所j 五t ) 夕( 盔z i ) , 其中防。和# 2 0 是p 维的未知回归参数。在该模型下,取p l o = 0 ,g ( x ) = e z 时,该 模型就是比率均值模型;当取夕( z ) = 1 时就是加速失效时间模型;当夕( z ) = 5 博士学位论炙 d ( x :t o r a ld i s s e r :t 1 0 n z ,侥o = 一卢1 0 时就是复发事件下的加速比率回归模型。 1 1 2 成组复发事件数据( c i u s t e r e dr e c u r r e n te v e n td a t a ) 在一些生物医学的学习中,研究的个体之间的经历可能是相关的,这样的 数据又是成组数据。例如,在家庭或多区域的研究中,来自于同一个家庭或同 一个区域的个体之间可能是相关联的。如果在研究中感兴趣的事件是成组数 据,并且这些感兴趣的事件在观察的时间内可能多次发生,这样的数据称之为 成组复发事件数据。在许多应用中,经常发生这样的情况:个体自身感兴趣的 事件之间不相互独立,并且研究的个体之间也是不相互独立的。例如,对肾衰 竭病人的住院治疗率的研究中,在同一地理区域的病人由于不可测量的因素, 病人特征可能是相关的( s c h a u b e l c a i ,2 0 0 5 a ,2 0 0 5 b ) 由于成组复发事件数据的复杂性、特殊性以及删失时间的相依性,到目前 为止,对它的研究还仅限于s c h a u b e l c a i ( 2 0 0 5 a ,2 0 0 5 b ) 提出的半参数乘性模 型。 对成组复发事件数据,s c h a u b e l c a i ( 2 0 0 5 a ,2 0 0 5 b ) 提出了下面的比率模型: e d n 荔( s ) i 砀( s ) 】= e x p 硝。z o ( s ) d # o j ( s ) ! 。 e d n 荔( s ) l 纫( s ) 】= o x p e z , j ( 0 d # 0 0 ) 其中n 为集族数,吻为第歹组中的个体数;( ) 是相应的协变量向量;嵋( ) 代表 第j 组中第i 个个体的事件发生次数;d # o j ( t ) 和批o ( 亡) 是未知的基本比率函数。 进一步,以上第一个模型中每个集组中分别有固定的基本比率函数,而第 二个模型中所有的集组有共同的基本比率函数。另外,s c h a u b e l & c m ( 2 0 0 5 a 2 0 0 5 b ) 证明了这两个模型中参数和非参数函数的相合性和渐近正态性。 考虑到成组复发事件数据的复杂性、特殊性以及删失时间的相依性,同时 由于半参数乘性比率模型在成组复发事件数据方面不能包罗万象,还有许多其 他重要的统计问题尚未得到解决,许多比较重要的半参数模型需要建立和研 究,包括成组复发事件数据下的加性比率模型,加性乘积比率模型,边际转移 模型,一些变系数回归模型等,而对这些模型的研究将为经济学、医学、生物 6 博士学位论炙 d o c t o r a ld i s s e r t a t i o n 学等学科提供重要理论依据和实际指导。由于半参数模型结合了非参数模型与 参数模型的优点,既避免了非参数模型“维数祸根”问题,又克服了参数模型 需要明确概率分布的缺点。而且半参数模型在医学和生物学等学科上具有兼顾 抽样数据差异性和研究对象的个体差异性以及群体差异性等特点。所以,我们 主要用半参数模型来对成组复发事件数据进行统计建模与分析。 1 2 主要研究内容 我们对成组复发事件数据,提出了以下四种模型: 1 2 1 加性比率模型 对于成组复发事件数据,我们给出了半参数的加性比率模型,在这个模型 中协变量与未知的基本比率函数为加性关系。在推断模型参数中,我们主要用 估计方程的方法,并得到估计参数的大样本性质。另外,我们还进行大量的模 拟研究,并把模拟研究的结果与理论结果相比较。 1 2 2 一般半参数加性乘积比率模型 我们在成组复发事件数据下研究了一个一般半参数的加性乘积比率模型, 在这个模型中有些协变量的影响是加性的,有些协变量的影响是乘性的。利用 估计方程的理论,给出该模型中未知参数和基本比率函数的估计,我们利用现 代经验过程理论证明所得估计的相合性和渐近正态性。 1 2 3 半参数边际转移模型 半参数边际转移模型是较广的一大类半参数模型,它包含了前面的加性模 型和乘性比率模型作为特殊情形。我们给出了成组复发事件数据的一类半参数 的边际转移模型。在未知模型参数和非参数函数的推导中,主要用估计方程的 方法,并且运用现代经验过程理论证明估计函数的相合性和渐近正态性。 7 博士学位论文 d o c t o r a ld i s s e i 玎娟o n 1 2 4 加速失效时间模型 我们对成组复发事件数据建立了半参数加速失效时间模型,在这个模型中 协变量对均值函数在整个复发过程中有加速、减速的作用,这与前面三个模型 是完全不同的。 这个模型是在计数过程的均值函数下反应协变量的影响。对未知参数的推 导,需用到广义估计方程的方法,并运用现代经验过程理论,证明估计参数的 相合性和渐近正态性。 1 3 几个常用的中心极限定理 定理1 3 1 ( l i n d e b e r g - f c l l c rc e n t r a ll i m i tt h e o r e m )设托,拖, 为独立同分布的随机变量,且他们的期望和方差为 e ( 虬) = 弘,d ( x k ) = c r 2 意 任 对 博士学位论文 d o c t o r a ld i s s e r t 娟o n 第二章成组复发事件数据下的加性比率模型 2 1 模型和估计 假设有n 个相互独立的集族,第j 类集族中的个体个数记为礼f 对第j 组中 的第i 个研究对象,令( 艺) 代表到时刻为止已经发生的事件数,并且锄( z ) 是一 仰x1 维的协变量。在实践中,研究对象被观察的时间是有限的,因此心( ) 可 能不能被完全观察到特别地,n i j ( t ) = ( 亡a ) 是代替( 亡) 能被观察到的, 此处g ,是第j 类中第i 个个体的删失时间,并且aab = m i n ( a ,b ) 假设在给定协变 量时,每个个体的删失时间与复发事件过程是条件独立的,也就是 e d y 荔( 亡) l 匈( t ) ,t 】_ e 【d 吗( ) l ( ) 】 尽管假定了删失时间与事件相互独立,但是一个集族中的个体的删失 时间不必相互独立。依赖时间的协变量磊,( t ) 正如k a l b a e i s c h & p r e n t i c e ( 2 0 0 2 , p 1 9 6 ) 所定义的,是一个外生变量。 对成组复发事件数据,我们提出了下面的加性比率模型: e d n 荔( z ) i ( ) 】= 毗o ( t ) + 藤( t ) d t , ( 2 1 1 ) 此处d p o ( ) 是未知的基本比率函数,且风是一个未知的感兴趣的参数向量。为了 得到模型参数的估计方法,令 坞( ;p ) 2 ( t ) 一上 d 弘。( s ) + 矿锄( s ) d s ) , 由于模型( 2 1 1 ) 给定了基本比率函数,而不是强度函数或危险函数, 有我们熟悉的鞅结构。通过简单计算可得到 e p 嗡( ;p ) i 纫( 亡) 】_ 0 和 e 坞( t ;p ) 】- 0 ( 2 1 2 ) 坞( ;卢) 没 ( 2 1 3 ) ( 2 1 4 ) 博士学位论炙 ) ( = t o r a ld i s s e r f a n o n - 与m b ( t ;p ) 类似,且由于计数过程( ) 能被唯一分解,我们定义过程 岣( z ;) = ( 亡) 一 场( s ) 批o ( s ) 4 - 矿( s ) 出) , ( 2 1 5 ) 其中场( z ) = ,( t ) 在独立删失的假设下,e 【d 坞( t ;阮) i 砀( ) 】= 0 在模型( 2 1 1 ) 下,岣( 亡;阮) 是均值为零的随机过程。因此,对给定的阮, 伽( t ) 的一个合理的估计值就是下面方程的解: ( 芒) 一厶( s ) d p 。( 5 ) + 矿锄( s ) d s ) = o ,0 t 丁, ( 2 1 6 ) j 2 1l = l ” 其中丁是一个提前给定的使得对忱,j ,p ( c i j 丁) 0 的固定值。记这个估计值 为口o ( 芒;) ,它能被表示为 口。( 芒;p ) :厂 1 0 ,翟,p ( s ) 一( s ) 矿锄( s ) d s ,翟。( s ) ( 2 1 7 ) 为了估计岛,用广义的估计方程方法( l i a n g z c g c r ,1 9 8 6 ) 并且把应o ( t ;p ) 换成上面 已经得到的估计值,具体讲,我们得到阮的估计函数为: u ( p ) 2 薹薹z 砀( s ) d 哟( s ) 一( s ) 低( 郇) + 矿纫( s 油) , ( 2 1 8 ) 它等价于 u ( p ) = 正 锄( s ) 一2 ( s ) 烨( s ) 一( s ) 矿纫( s ) d s , ( 2 1 9 ) j = li = 1 。u 其中 耻毫措 仫“。, 令p 为u ( p ) = o 的解,则我们得到估计值声的显示表达式为: 声= 壹j = l 壹i = 1z 下( s ) 锄( s ) 一2 ( s 炉2 d s r 喜薹z r 锄( s ) 一孙肿( s ) ( 2 1 1 1 ) 这里对一个向量钉,秒。2 = 秽沪当矽可用时,基本比率函数u o ( t ) 能被( 2 1 7 ) 中给定 i 拘i b r e s l o w - a a l e n 型估计值应o ( z ) 兰应o ( ;矽) 所估计。 通过简单的代数计算可得 u ( 7 i ;阮) = 正 砀( s ) 一牙( s ) d m i j ( s ;置o ) ( 2 1 1 2 ) 博士学位论文 d c i ( 期r a ld i s s e r 了棚o n 它是一个鞅积分。 2 2 渐近性质 为了研究得到的估计值的渐近性质,我们假设下面的正则条件成立: ( c 1 ) 对某个常数丁 0 ,p ( 丁) o ; ( c 2 ) ( 7 ) 和吩几乎处处被一个常数所控制,其中j = 1 ,n ,i = 1 ,吩; ( c 3 ) 锄( ) 的总变差以一个非随机常数为界即对( ) 的第k 个分量有 l z , j k ( o ) i + i d 七( s ) | q 0 为常数 ( c 4 ) a 是非奇异矩阵,其中4 是a 的极限,且 g = n - 1 jz。(s)细(s)一2(s)一s=li = 1 l ,u ( c 5 ) l i n d c b c r g 条件:对任意e 0 扎- 1 e 谬2 ( 1 l c j l l n l 2 ) _ 0 其中 白2 善z 碘) 巧( s ) ) d 响( s ;z o ) 中 我们总结p 的渐近性质如下: 定理2 2 1 在正则条件( c 1 ) 一( c 5 ) 下,我们有 ( 1 ) 声几乎处处收敛于凤; ( 2 ) n l 2 ( 君一肺) 服从均值为零且协方差矩阵为a 一1 i e a 一1 的渐近正态分布,其 1 2 铆, 孥 e n 似 o n 星l j i 渐近的协方差矩阵能够通过用观察到的相应的经验值代替极限值来估计, 也就是说,a - l e a 一1 的相合估计为a 一1 宝a ,其中竞= 仡一1 凳l 弩2 ,而 己。若上 锄( s ) 一牙( s ) ) d 矾( s ) , 且 d 辊( ) = d n i j ( t ) 一y i j ( t ) d f z o ( t ) + p t z i j ( t ) d t 在下面的定理中,我们将给出基本比率函数的估计值肋( z ) 的渐近性结果。 定理2 2 2如果正则条件( c 1 ) 一( c 5 ) 成立,则 ( 1 ) 在f o ,7 】上,肋( ) 几乎处处一致收敛于p o ( ) ; ( 2 ) n l 2 2 0 ( 亡) 一t o ( t ) ) 弱收敛于零均值的高斯过程,其在( s ,亡) 处的协方差函 数为 r ( 8 ,t ) = 科九( s ) 咖( 艺) 】, 其中 啪) = 耋“s 广d 蚴;舻弛) t d s a - 1 o 白, 啪) = 著z “s 广乜吲s 涵) _ 双曲 氟 而 乏( t ) 2 熙z ( t ) 协方差函数r ( s ,t ) n n # f d i 计为 眠t ) = n 。如( s ) 南( ) , 其中 玉:妻f 亓( s ) - l d 觑( s ) 一f 之( s ) t d 肋( s ) 一岛 。若上抖坛觑( s ) 一上科州s t 1 6 骨( ) = n 。( t ) 1 3 场 吩:l n 芦 熙 i l 砟 博士学位论文 d ( ) c t o r a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论