(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf_第1页
(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf_第2页
(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf_第3页
(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf_第4页
(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(应用数学专业论文)鞅分析在生存分析模型中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

鞅分析在生存分析模型中的应用 摘要 生存分析是数理统计学研究的一个重要分支,自二十世纪7 0 年代中期以 来得到迅速发展,生存分析最初起源于现代医学,工程等科学研究中的大量实 际问题,着重对删失数据进行统计分析研究,因此具有很强的应用性,对医 学、工程产品的可靠性的统计具有重要作用。生存分析理论结合一些新的概率 统计的前沿理论,能妥善地处理现实生活中常见的删失数据问题,而且在解决 实际问题的同时,揭示了一些更为复杂的理论问题,促进了数理统计的发展。 本文在综述生存分析的基本理论与鞅理论的基础上,用偏极大似然估计的 方法确定带有删失数据的具有c o x 强度过程的时间相依协变量分层比例风险模 型的参数估计形式,并采用鞅分析方法得出该模型的参数估计是相合的且是渐 近j 下念的。由此得出,在临床试验中该模型的参数采用偏极大似然法来估计是 可行的。其次应用参数检验与非参数检验两种方法对模型各层的基本风险函数 进行假设检验,结合鞅的中心极限定理构造出相应的检验统计量。 本文又将鞅分析方法引入到带有删失数据的具有c o x 强度过程的时问变系 数比例风险模型中,用局部线性偏极大似然估计的方法确定模型的参数估计形 式,并应用鞅分析方法得出时间变系数的局部线性偏极大似然估计及基本累积 风险函数的非参数估计的自过程是相合的。由此得出对该模型实施自助法是可 行的,为生存分析模型在实际中的应用提供可靠的理论依据。 关键词鞅;生存分析;比例风险模型;自助法 t h e a p p l i c a t i o no fm a r t i n g a l ea n a l y s i s i ns u r v i v a l a n a l y s i sm o d e l s a b s t r a c t s u r v i v a la n a l y s i s w h i c hi sa ni m p o r t a n tb r a n c ho fm a t h e m a t i c a ls t a t i s t i c s ,h a s d e v e l o p e dv e r yq u i c k l ys i n c e1 9 7 0 s i to r i g i n a t e df r o ml o t so fp r a c t i c a lp r o b l e m si n m o d e mm e d i c i n ea n de l l 百n e e r i n g ,s t r e s s e ss t a t i s t i c a la n a l y s i so fc e n s o r e dd a t a ,h a s g r e a tp r a c t i c a b i l i t ya n dc o n t r i b u t e s al o tt or e l i a b i l i t ys t a t i s t i c so fp r o d u c t si n m e d i c i n ea n de n g i n e e r i n g b ya p p l y i n gs o m el a t e s tt h e o r yo fp r o b a b i l i t yt h e o r ya n d s t a t i s t i c s s u r v i v a la n a l y s i sn o to n l yd e a l sw i t hc e n s o r e dd a t ap r o b l e mi nr e a ll i f e ,b u t a l s or e v e a l sm o r ec o m p l i c a t e d l yt h e o r e t i cp r o b l e m sa n dp r o m o t e st h ed e v e l o p m e n t o f m a t h e m a t i c a ls t a t i s t i c s ,w h i l ei ts e r i e sd o w np r a c t i c a lp r o b l e m s f i r s t ,i nt h i sp a p e r , b a s e do nt h ef u n d a m e n t a lt h e o r yo fs u r v i v a la n a l y s i sa n d m a r t i n g a l e ,t h ep a r t i a lm a x i m u ml i k e l i h o o de s t i m a t em e t h o di su s e d t oc o n f i r mt h e f o r mo fp a r a m e t r i ce s t i m a t o r sf o rt h ec o xp r o p o r t i o n a lh a z a r d sm o d e lf o rc e n s o r e d d a t aw i t ht i m e d e p e n d e n tc o v a r i a t e sw h i c hh a v eas t r a t u me f f e c to nt h eh a z a r d f u n c t i o no ft h el i f e t i m ed i s t r i b u t i o no fa ni n d i v i d u a l ,a n dt h em a r t i n g a l ea n a l y s i s m e t h o di st a k e nt og a i nt h ee s t i m a t o r sa r ec o n s i s t e n ta n da s y m p t o t i cn o r m a l t 1 1 i s s h o w st h a ti nc l i n i c a lt r i a l su s i n gp a r t i a lm a x i m u ml i k e l i h o o dm e t h o dt oe s t i m a t et h e p a r a m e t e r so ft h em o d e li sf e a s i b l e t h e nt w om e t h o d s 髂p a r a m e t r i ct e s t a n d n o n p a r a m e t r i ct e s ta r eu s e dt oh y p o t h e s i st e s t i n ge a c hb a s e l i n eh a z a r df u n c t i o n ,a n d t w oc o r r e s p o n d i n gt e s ts t a t i s t i c sa r ec o n s t r u c t e db yc o m b i n e dt om a r t i n g a l ec e n t r a l l i m i tt h e o r e m s e c o n d ,m a r t i n g a l ea n a l y s i sm e t h o di s i n t r o d u c e di n t ot h ec o xp r o p o r t i o n a l h a z a r d sm o d e lf o rc e n s o r e dd a t aw i t ht i m e d e p e n d e n tr e g r e s s i o nc o e f f i c i e n t s ,t h e l o c a l l yl i n e a rp a r t i a lm a x i m u ml i k e l i h o o de s t i m a t em e t h o di su s e dt oc o n f i r mt h e f o r m o fp a r a m e t r i ce s t i m a t o r s ,a n dt h em a r t i n g a l ea n a l y s i sm e t h o di sa p p l i e d t o o b t a i nt h a tb o t ht h el o c a l l yl i n e a rp a r t i a lm a x i m u ml i k e l i h o o de s t i m a t o r sf o rt h e t i m e d e p e n d e n tr e g r e s s i o nc o e f f i c i e n t s a n dt h en o n p a r a m e t r i ce s t i m a t o rf o rt h e i i 哈尔滨理_ t 大学理学硕:i :学位论文 b a s e l i n ec u m u l a t eh a z a r df u n c t i o ni sc o n s i s t e n t t h i ss h o w st h a tb o o t s t r a p p i n gt h e m o d e li sf e a s i b l e t h e r e f o r e ,ar e l i a b l et h e o r e t i c a lb a s i si sp r o v i d e df o rt h ea c t u a l a p p l i c a t i o no fs u r v i v a la n a l y s i sm o d e l s k e y w o r d sm a r t i n g a l e ,s u r v i v a la n a l y s i s ,p r o p o r t i o n a lh a z a r d sm o d e l ,b o o t s t r a p i i i 哈尔滨理工大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文鞅分析在生存分析模型中的应 用,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研究工 作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过 的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以明确方式注 明。本声明的法律结果将完全由本人承担。 作者签名:嗽恒日期:细罗年年月g 日 哈尔滨理工大学硕士学位论文使用授权书 鞅分析在生存分析模型中的应用系本人在哈尔滨理工大学攻读硕士学位期 间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有, 本论文的研究内容不得以其它单位的名义发表。本人完全了解哈尔滨理工大学关于 保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,允 许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用影印、缩印或其他复制手 段保存论文,可以公布论文的全部或部分内容。 本学位论文属于 保密, 盔年解密后适用授权书。 不保密团。 ( 请在以上相应方框内打) 作者签名:狱他 日期:矽哆年中月j i l 日 导师签名:孔掺衫日期:伽声甲月多日 哈尔滨理r t 大学理学硕r l :学位论文 1 1 课题背景及研究意义 第1 章绪论 生存分析是近二三十年发展起来的数理统计新分支,它是根据医学、生命 科学、可靠性工程、保险等科学研究中的大量实际问题提出的,它可以广义地 认为是对生存时间( 非负随机变量) 的一类统计分析技术,主要研究随机删失数 据的统计分析。随机删失是生命科学、医药追踪研究、可靠性寿命试验及其他 一些实际问题中常常碰到的一种重要类型的统计数据。其理论与方法不仅能应 用于生命科学、医药卫生、可靠性工程,而且在保险数学、犯罪学、社会学、 市场学、环境科学、航空航天等高科技领域都有广泛的应用前景。生存分析是 一种以截断数据为研究对象的统计方法,在统计学中自成体系,是一种重要的 统计方法。随着医疗实践、工程实践或其它领域的推动,将会不断有新的统计 方法出现,应用范围也越来越广。“生存时间”一词可作广义的理解。可指自 然界、人类社会或技术过程中某种状态的持续时间,如疾病的发生、药品的持 续效果、一种处理的反应、一种产品的寿命、病情复发或死亡。生存数据不仅 出现在生物医学中,而且出现在工业可靠性、社会科学和商业研究中。在这些 领域生存数据的例子是:可靠性工程中的电子设备( 原件或系统) 的寿命,犯罪 学中重罪犯人的假释时间,社会学中首次婚姻的持续时间,它也可以不是时 间,它可以是汽车车轮转动的圈数,也可以是市场学中报纸或杂志的篇幅和订 费,甚至可能是保险公司在某一索赔案中所负的保险费,股市指数的连续上涨 和下跌的也可以看成是一种特殊的生存数据。 针对中小样本的乘积限估计和针对大样本的生命表技巧构造生存函数的估 计,是生存分析经常要做的事情。通常包括三个函数( 生存函数,概率密度函 数及危险率函数) 的估计。模型拟合和分布拟合是生存数据分析的一个重要环 节。找到某种统计模型很好地拟合数据是深入分析的关键。识别与生存时间有 关的预后因素、识别与疾病发生及治疗效果有关的风险因素的研究是越来越受 人们注意的课题。目前主要集中在预后因素和风险因素与生存时间的关系等方 面展开研究。 生存分析的中心问题是对不完全数据的处理。经典的统计方法是基于完全 数据样本( 即没有删失数据) 建立起来的。主要有参数统计,非参数统计和多元 哈尔滨理丁人学理学硕1 :学位论文 分析。面对不完全数据,经典统计方法表现了明显的不足。生存分析是将原有 的几个分支结合起来,它运用一些较深、较新的概率论和其他的数学工具,如 随机积分,边疆时间鞅论和计数过程等理论。 鞅论是随机过程的一个前沿理论,近年来,它作为一个强有力的研究工具 逐渐向各个学科渗透。鞅作为一种理论工具,在生存分析中的应用占有重要地 位。利用鞅的理论来研究生存分析具有重要的现实意义。近年来鞅的收敛、鞅 的分解、鞅的构造,鞅不等式、可积变差鞅、鞅的随机积分、鞅的中心极限定 理、可料过程的局部鞅,特殊半鞅的可料性、指数鞅的一致可积性、b 值鞅、 鞅重抽样方法、点过程鞅方法等等鞅的理论和方法被应用到生存分析的研究当 中去。如何进一步发展鞅的理论并应用于生存分析,发展生存分析的理论与方 法,从而解决更加广泛的生存分析中遇到的实际问题,已成为生存分析及其发 展的迫切需要,也是鞅理论研究与应用的一个当务之急。 1 2 研究状况及其进展 在许多科学领域,一个基本的任务是要评估若干因素( 协变量) 对一个感兴 趣的变量( 反映变量) 的同时影响。对此,回归模型提供了一个十分有效的框 架,相应的参数、半参数及非参数回归推断理论已经建立。 1 标准的线性回归模型:z = 口- i - p x , + 。黎子良与郑祖康于1 9 9 3 年利用 坐标直线直观地描述随机删失线性回归。1 9 7 6 年,m i l l e r 使用最小二乘估计法 定义口与的最小二乘估计,并提出使用迭代序列计算回归系数向量的估计 p l 。m i l l e r 估计要求终检分布与生存分布沿相同方向改变,亦即要求终检分布在 自变量取值范围内分布较均匀,而在实际中终检值在自变量的取值范围内分布 不一定是均匀的,因此,为了解决这一问题,1 9 7 9 年,b u c k l e y j a m e s 通过修改 观察值五定义了一个伪随机变量,从而改进了m i l l e r 的迭代算法【2 j 。1 9 7 9 年, s c h m e e 和h a h n 提出了在已知随机变量z 服从正念分布的条件下如何利用最小二 乘法求解& ,3 1 。b u c k l e y j a m e s 方法实际上是s c h m e e 与h a h n 正态理论技术的 非参数版本,但是他们提出的迭代算法未必收敛,在这种情形下j a m e s 与s m i t h 于1 9 8 4 年给出了一个备择求解的方法【4 l 。1 9 8 7 年,l e u r g a n s 定义了b u c k l e y j a m e s 估计的改进估计,通过对斯坦福心脏移植数据说明这一估计与b u c k l e y - j a m e s 估计及c o x 回归估计相比具有竞争力f 5 j 。k o u l ,s u s a r l a 和v a nr y z i n 在1 9 8 1 年给出了如何重新定义随机变量 ,利用一次最小二乘法,不需要迭代即可解 得西,的方法【6 1 。1 9 8 7 年,l e u r g a n s 提出把最b - - - 乘法用于合成生存时间的 2 哈尔滨理t 大学理学硕j :学位论文 合成数据的估计量。1 9 9 0 年,h i l l i s 提出了m 估计法。我国的郑祖康在1 9 8 8 年提 出了一类k 类估计方法等等。2 0 0 2 年,q i q i n gy u 又对b u c k l e y - j a m e s 参数估计算 法进行了改进,提出了一种新的非迭代运算。关于该模型参数估计的性质也有 很多的研究,j a m e s 与s m 油证明- 了b u c k l e y - j a m e s 估计的相合性【7 1 ;l a i 与y i n g 证 明了修正的b u c k l e y - j a m e s 估计的相合性及渐近币态性1 8 1 ;t s i a t i s 使用线性秩检 验统计量作为估计方程,定义了参数估计,并证明所定义估计是相合的和渐近 正态的【9 】;l a i ,y i n g 与z h e n g 发展了基于一类适应统计量估计方程估计的渐近 理论【1 0 】;z h e n g 研究了一类参数估计的渐近性质【1 ;s r i n i v a s a n 与z h o u 用点过程 鞅方法证明了估计的渐近正态性【l2 1 ,之后z h a n g 等人利用计数过程和鞅的中心 极限定理研究了参数估计的渐近分布性质及有效性,并将结果应用到嵌套病例 对照研究中【1 3 】。 2 非参数回归模型:z = m ( 置) + 。1 9 9 4 年,f a n 与g i j b e l s 在x 的维数是1 的条件下,通过对数据进行变换定义了聊( ) 的局部线性估计【1 4 1 。c a i 在2 0 0 2 年 发表的论文中给出了所( ) 的加权局部线性估计【”1 。此外,d a b r o w s k a 定义了一 种截断回归非参数估计,k i m 与t r u o n g 用局部线性光滑方法定义了截断回归估 计,z h e n g 定义了近邻非参数相合估计。 3 半参数部分线性回归模型:z = x - + g ( z ) + g 。对于半参数部分线性 模型,相对来说研究较少,w a n g 在2 0 0 2 年发表的论文中给出了与g ( f ) 的估 计【1 6 l 。2 0 0 4 年,“与w a n g 定义了与g ( f ) 的改进估计,通过有限样本模拟研究 后表明改进估计在小样本或重删失下更具有优越性,但该估计的理论结果至今 还未获得。2 0 0 5 年,c h e n ,s h e n 等人发展了秩估计方法【l7 1 。 4 c o x 比例风险模型:j | l ( f ,x ) = 玩( f ) e x p ( f l7 x ) 。该模型由c o x 于1 9 7 2 年提 出。模型提供了探索协变量与风险率或生存分布之间关系并对其协变量的影响 进行研究的另一种方法,该模型是半参数模型,用它分析失效时间数据是非常 有效的,从医药与工程研究中可以看出,该模型比较合情合理地反映了协变量 与寿命变量间的关系;通过适当限制,协变量本身可以是确定性的也可以是时 间的随机函数,从而使该模型在分析生存数据上更具有使用上的灵活性;模型 中的参数可以是常数,也可以是依赖时间的变量,参数估计方程可通过迭代方 法求解。1 9 8 1 年,t s i a t i s 证明了的偏极大似然估计是渐近j 下态的【l 引,这一结 果可用作的假设检验,这一检验方法是著名的w a l d 检验;此外还有对数似然 比检验与得分检验。1 9 7 2 年,b r e s l o w 提出了基准风险函数h o ( t ) 的估计【l 9 1 。 1 9 9 3 年,l i n ,w e i 与y i n g 给出了利用鞅残差进行模型检验的方法【2 0 1 ,之后 哈尔滨理t 人学理学硕1 :学位论文 s u s a n n e 等人给出了c o x 模型的全面拟合优度检验的一个简单计算方法【2 1 1 。1 9 9 7 年,f a n 考虑了一种非参数影响比例风险模型的估计问题,并应用了局部似然 与局部偏似然的估计方法。1 9 9 9 年,c h e n 在c a s e - c o h o r t 及c a s e c o n t r 0 1 分析中分 别给出了c o x 模型的一类估计方程方法。2 0 0 3 年,w a n g 发展了加权核估计方 法。c o x 模型在生存分析中的作用相当重要,但是由于在某些情况下,比例危 险率假设可能不满足,而生存时问分布又无法确定时,参数模型就不能适用, 针对这种情况国内外提出了一些c o x 模型的替代模型:( 1 ) 加速失效时问模型: l i n ,w e i 和y i n g 对传统的加速失效时间模型做了扩展,并用秩估计法估计了模 型的回归参数,且证明该估计是相合的、渐近j 下态的,之后给出了计数过程的 均值函数的n e l s o n - a a l e n 型估计,同时证明了估计是相合的、弱收敛到均值为 零的高斯过程【2 2 】;( 2 ) 半参数转换模型;( 3 ) 可加危险率模型:k i m ,s o n g 与l e e 利用鞅残差给出了多样本删失数据的可加性风险模型的拟合优度检验统计量 1 2 3 ,g a n d y 与j e n s e n 幂0 用鞅残差给出了部分协变量是时变的可加性模型的拟合 优度检验的检验统计量【2 4 】;( 4 ) 变系数风险模型:早先有人利用局部偏似然方法 给出未知系数函数的估计,之后平均加权估计改进了估计的有效性,并被证实 该估计是相合的和渐近正态的。2 0 0 7 年,c a i ,f a n 和z h o u 给出了简单有效的一 步估计,并证明其相合性和渐近正态性,他们利用相同的研究比较了一步估计 和局部偏似然估计,结果显示一步估计在保持其统计性质的前提下大大减少了 计算量,而且最优权重均值估计比极大局部偏似然估计有效1 2 5 i 。同年,“等人 对变系数风险模型的推广形式进行了讨论【2 6 2 7 ,2 8 1 ;( 5 ) 协变量随时间变化而变化 的带时变协量的c o x 模型:r o s s 与j o h n 应用鞅理论研究了混合离散和连续失效 时间的c o x 回归模型的参数估计函数,证明了b r e s l o w 估计是相合性和g a u s s i a n 渐近的【2 9 1 ,w u 利用计数过程技术及v o nm i s e s 方法研究了具有时变协变量的删 失生存资料的c o x 回归模型的b o o t s t r a p 大样本性质,并提出在自助法中,关于 c o x 可加性模型、c o x 周期回归模型、具有时变系数c o x 回归模型、具有c o x 强 度过程的多状态生存分析模型的参数大样本性质还有待解决【3 0 】;( 6 ) 结局事件不 仅仅限于两种状态的多状态的c o x 模型:高峻等人利用随机模拟数据,比较多 结局生存分析模型、将多个结局视为一种结局的单结局c o x 模型及将各个结局 分开拟合多个单结局c o x 模型的回归系数的估计精度【3 l 】;( 7 ) 研究对象面临多个 死亡风险竞争的风险竞争模型等等。 在生存分析的某些理论研究里,常使用现代随机过程的知识,其中计数过 程和鞅的有关理论起着重要的作用。实际上,许多统计量可以表示成某种随机 过程关于计数过程的随机积分。而对这种随机积分的研究,鞅的理论起着关键 4 哈尔滨理工人学理学硕,i j 学位论文 性的作用。陈家鼎在他的著作中介绍了一种特殊的随机过程( 可料过程) 对一种 特殊的鞅( 可表成两个右连续增过程之差的鞅) 的随机积分,并叙述了如何用鞅 方法研究生存函数的p l 估计和生存函数的两样本检验【3 2 1 。之后,王启华补充了 鞅方法在确定统计量的极限分布上的应用,及鞅方法在含协变量的生存分析中 的应用【3 3 1 。 鞅这个名称首先由法国概率学家i a v y 在1 9 3 9 年引进的f 3 4 1 ,后来由美国概 率学家d o o b 发扬光大。之后鞅论的研究工作突飞猛进发展。六十年代初, m e y e r 解决了由d o o b 提出的下鞅分解问题并且发展了平方可积鞅的理论, 1 9 6 7 年,k u n i t a 和w a t a n a b e 研究了对平方可积鞅的随积积分。这些重要工作 为鞅论的发展开辟了新道路,在这一期间m e y e r 和d e l l a c h e r i e 等又创立了随机 过程一般理论,为鞅论的发展提供了强有力的工具。进入七十年代后,鞅论成 了随机过程理论中最活跃和最富于成果的分支之一。在这一时期,c h t t e r j i 提 出并论证了b a n a e h 空间鞅收敛与r a d o n - n i k o d y m 的理论;h a l l 和c c 提出了 鞅的极限理论和它的应用;c a n t o n ,s u c h e s t o n 讨论了数值向量的渐近鞅的收 敛问题;b e l l o w 提出相关停时的若干技巧;w o y c z y n s k i w 提出并论证了某些 线性空间收敛序列的性质等,为鞅论的进一步研究与发展提供了有力的工具与 方法。进入八、九十年代以来,鞅论的发展又进入了一个新的阶段,b e n t h , f r e d ,p o t t h o f f 提出并论证了广义随机过程鞅的性质;k r u k ,l u k a s z 讨论了渐 近鞅的殆必收敛问题;m y k l a n d ,p e r a s l a k 对于鞅的渐近展开进行了深入的探 讨,同时又对鞅的嵌入渐近展开式给予了具体的刻划;z h u ,y i n 对实时随机 逼近给出了一个线性近似的描述;k o n i n g ,a l e x 探讨了基本鞅的逼近问题; k a c h u r o v s k i l 进行了鞅的遍历性讨论,取得了一些成果。近年来,鞅论不仅作 为随机过程的一个分支已快速发展起来,而且渗透到调合分析、b a n a c h 空间几 何学以及随机分析中去,如s i n i c a 讨论了对于离散时间不完备市场的极小鞅测 度问题【3 5 1 ;p e a r s o n ,n e i l 探讨了在离散时间不完备市场中对于期望效用极大化 的鞅测度方法等【3 6 】,就这样互相渗透,互相促进,产生了一些新兴的研究分 支。 我国著名概率统计专家王梓坤院士、严加安院士、陈希孺院士、王寿仁教 授等对鞅论的发展与应用也做出了重要贡献。他们在鞅收敛f 3 刀、鞅分解、鞅不 等式、可积变差鞅、鞅的随机积分【3 引、可料过程的局部鞅【3 9 1 ,指数鞅的一致可 积性f 4 们、b 值鞅等方面进行了一系列工作【4 l 】,获得了一系列有价值的成果。另 外,又有一些专家学者如:甘师信在广义鞅的极限收敛理论及b 值鞅方面作出 了一系列成果;汪振鹏对极限鞅型序列与g f t 收敛性、停止一致渐近鞅及拟 5 哈尔滨理t 人学理学颀r 学位论文 终鞅等研究方面获得了系列成果;万成高对b 值拟鞅序列与b a n a n c h 空间几何 特征研究结合起来,获得了一系列成果;刘培德在概率渐近鞅和极限鞅研究方 面获得了成功;刘智慧在取值于b a n a c h 空间的极限鞅等研究中获得了系列成 果;林玉将b 值鞅的分解应用于插值理论上,获得了成功;赵达纲、曹显兵对 b 值鞅型序列的局部收敛性进行了研究,获得了b 值鞅型序列的局部收敛的若 干结果,赵兴球对b 值鞅进行了讨论,获得了系列成果;杨小云对b 值随机 变量序列部分和的矩的收敛速度,进行了深入具体的刻划等。总之,在我国, 鞅的研究已进入一个新的发展阶段。 当今,发展鞅的理论与方法并将其渗透到数学及其它学科并与其结合形成 新的分支、新的应用方向已成为鞅论发展的新趋势、新动向。尤其在统计分析 突飞猛进发展与广泛应用的今天,如何进一步发展鞅的理论并应用于统计分析 中,发展统计分析理论与方法,从而解决更加广泛的一类问题,已成为统计分 析发展的迫切需要,也成为鞅理论研究与应用的一个当务之急。而目前,虽然 一些学者对鞅的应用也进行了一些讨论,然而对鞅与统计分析的讨论涉及甚 少,尤其是如何将鞅的理论应用于统计分析,如何应用于大样本统计分析、时 空多维序列统计预报分析、无穷逼近分析等研究还是一片空白。因此,我的导 师孔繁亮在前人工作的基础上对b 值渐近鞅进行了研究,获得了一些有益的结 果,1 9 9 8 年在数学学报上发表了“b 值渐近鞅的强弱大数定律 4 2 1 之后又 近一步探讨了“b 值渐进鞅的估值性质” 4 3 1 又提出了动态系统中的统计预报的 鞅方法【删,并应用于气候过程的统计预报【4 5 1 和现代疫情的统计预测之中。近期 又探讨了参数估计的鞅方法,随机逼近的鞅方法【4 6 1 ,投资与效用优化设计的一 种鞅方法【4 7 4 8 a 9 i ,大样本假设检验中最优决策的鞅方法【5 0 i ,金融j x l 险模型中的 鞅方法【5 l j ,以及生存分析中乘积限估计的鞅方法【5 2 1 等。本文将在导师工作的基 础上,将鞅的理论与方法引入生存分析的理论研究当中,从而得出一些好的结 果。 1 3 课题来源 本课题属于理论研究的范畴,选自于指导教师的国家自然科学基金项目 “鞅论及其在统计分析中的若干应用 ( 项目批准号1 0 7 7 1 0 4 6 ) 的有关部分。 6 哈尔滨理t 人学理学硕十学位论文 1 4 本文主要内容 本文主要用鞅方法对生存分析中具有c o x 强度过程的生存模型进行分析研 究,主要分成以下四个部分: 一、第2 章综述了鞅分析与生存分析中的基本知识、相关理论及性质,介 绍了鞅、可料变差过程、补偿子等相关名词的定义,及鞅分解、鞅的随机积分 等定理,其次引入了生存分析中人们普遍关注的生存函数的定义、性质,及其 相关函数如危险率函数、累积危险率函数的定义,并简述了乘积限估计的定义 和性质,及包含完全样本和删失数据的极大似然估计的性质,最后叙述了生存 分析中鞅的定义及性质。 二、第3 章首先介绍了具有c o x 强度过程的分层比例风险模型,并在前人 工作的基础上,将模型中的协变量扩展为随时间变化的,用偏极大似然估计的 方法给出在删失数据下该模型的参数估计形式,其次采用鞅分析方法探讨了参 数估计的性质。 三、对上述模型进行检验,即对各层的基本风险函数进行检验,利用鞅的 中心极限定理构造检验统计量。 四、第3 章最后一部分针对具有c o x 强度过程的时间变系数比例风险模 型,在随机删失数据下,用局部线性偏极大似然估计的方法得出模型的参数估 计形式,并采用鞅方法研究了该模型的b o o t s t r a p 大样本性质。 7 哈尔滨理t 人学理学硕二t 学位论文 第2 章鞅分析与生存分析的相关理论 2 1 鞅分析的一般理论 2 1 1 鞅的相关定义 定义2 1 称仃代数流f = 正,t 0 ) 是右连续的,若对一切t 0 ,石= 正。 定义2 2 一般称( q ,7 r ,p ) 上的( 广义) 实值随机过程x = ( x ( f ) ,t 0 ) 是关于o r 代数流 = 五,t 0 ) 适应的,若对一切t 0 ,x ( f ) 是正可测的。 定义2 3 随机过程罩每个x ( f ) 均是缈的函数,x ( t ) = x ( t ,缈) ,缈q ,当缈 固定时,x ( t ,国) 是t 的函数,这个函数叫随机过程的轨道。若所有轨道x ( f ,国) 是t 的增函数,则称随机过程x = ( x ( f ) ,t o ) 为增过程。 定义2 4 在【o ,) q 中包含占的最小盯代数叫做可料仃代数,用p 表示。 其中为定义在乘积空问 0 ,o o ) x q 上的集合系 = ( 5 ,t xa :0 s f ,a 五 u o 彳:a 磊 称( q ,厂,p ) 上( 广义) 实值随机过程x = ( x ( f ) ,t o ) 是关于仃代数流 万,t 0 的可 料过程,若二元函数x ( t ,) 关于可料o r 代数p 可测。 定义2 5 称n = ( ( f ) ,t o ) 是计数过程,若是右连续增过程且( f ) 只取 非负整数,( 0 ) = 0 。 定义2 6 设x = o ( f ) ,t 0 ) 是适应于 五,t 0 的右连续过程,如果对一切 t 0 ,e i x ( t ) i 且对一切0 s t ,有 e ( x ( f ) i z ) = 工( s ) a 矗 则称x 是鞅。若 e ( 工( f ) i 五) x ( s ) a s 则称x 是下鞅。若 e ( x ( f ) l 五) x ( s ) a 矗 则称x 是上鞅。 定义2 7 设m = ( m ( f ) ,t 0 ) 是鞅且e ( m ( f ) ) 2 ,则( ( m ( f ) ) 2 ,t 0 ) 是下 鞅,( ( f ) ,t 0 ) 为该下鞅的补偿子,称这个补偿子为( m ( f ) ,t 0 ) 的可 8 哈尔滨理t 大学理学硕: 二学位论文 料变差过程。 2 1 2 鞅的相关定理 定理2 1 ( d o o b - m e y e r 鞅分解定理) 设矿代数流f = 巧,t 0 右连续,如 果x = ( x ( f ) ,t 0 ) 是非负的下鞅,则存在鞅m = ( m ( f ) ,t 0 ) 和零初值的可料右 连续增过程a = ( 么( f ) ,t 0 ) ( m 和a 均适应于f ) 满足:对一切t 0 , z ( f ) = m ( f ) + 彳( f ) a s 而且这样的分解在口j 意义上是惟一的,即若对一切t 0 ,x ( t ) = 厨( f ) + 五( f ) a s ,而且( 厨( f ) ,t 0 ) 是适应于i 的鞅,( 五( f ) ,t o ) 是适应于f 的零初值的可 料的右连续增过程,则对一切t 0 , 肠( f ) = m ( f ) a , s ,j ( f ) = 彳( f ) a s 其中的a = ( 彳( f ) ,t 0 ) 叫做下鞅的补偿子,m = ( m ( f ) ,t 0 ) 叫做下鞅的新息 鞅。 定理2 2 设( x ( f ) ,t 0 ) 是适应于f = 巧,t 0 的右连续增过程,x ( o ) = 0 且 对一切t 0 ,e i x ( f ) i o o 。设( 么( f ) ,t 0 ) 是其补偿子, m ( f ) = x ( f ) 一彳o ) ,t 0 又( 日( f ) ,t 0 ) 是关于f 的可料过程,满足下列条件:对一切彩q 及t 0 , fh ( s ,国) 幽( s ,缈) 均存在且e ( 1fh ( j ,国) d a ( s , c o ) 1 ) o o 。令 -def_。 ( f ) 2j :o i - i ( s ) d m ( s ) 。j :日( s ,c o ) a x ( s , c o ) 一j :日( s ,c o ) d a ( s , c o ) 则( ( f ) ,t 0 ) 是关于f 的鞅。 定理2 3 设( ( f ) ,t 0 ) 是( m ( f ) ,t 0 ) 的可料变差过程且m ( o ) = 0 ,则 e ( m ( f ) ) 2 = e ( ( f ) ) ,t 0 定理2 4 设m = ( m ( f ) ,t 0 ) 是适应于i f = 石,t 0 的有界的计数过程,4 是f 的补偿子,m = m - 4 ,i = l ,2 。又h i = ( h i ( ,) ,t o ) 是适应于f 的有界 可料过程,e ( m 形) ) 2 z 0 ( z t 0 ) ,则称 该个体的生存数据是在z 是右( 左) 删失的,并说丁是右( 左) 删失数据。 定义2 1 0 对寿命起影响的变量称为协变量。在技术产品的加速寿命试验 中,协变量叫做加速变量或加速因子。 定义2 1 1 记f ( f ) 为生存时间丁的分布函数,用定义f ( t ) = p ( r t ) ,其中 t 0 ,则生存函数定义为s ( t ) = l - f ( t ) = p ( r t ) ,s ( o ) = 1 ,s ( 佃) = 0 。 定义2 1 2 危险率函数在可靠性统计中叫失效率函数,在医学研究中也叫 做瞬时死亡率,死亡强度等。非负随机变量丁的分布密度函数f ( t ) 存在且右连 续时,则定义r 的危险率函数为 m :巡! :盟,t 0 1 一f ( f )s ( f ) 等价定义形式为 1 五( f ) 2 慨素p ( r f + 出l 丁 f ) 危险率函数与分布函数的关系为 旯( f ) = ( 一l o g ( 1 一f ( f ) ) ) = _ d ( 一l o g s ( f ) ) 口f口f 于是有 s ( f ) = 1 一f ( f ) = e x p - j :旯( “) d u 危险率函数是刻画生存时间的重要特征之一,它实际上是条件生存率,可 以粗略地解释为:五( f ) 是在时间t 活着的个体,在接下来的单位时间区间内死 亡的条件概率。在危险率函数基础上定义累积危险函数为 人( f ) = 【2 ( u ) d u i o 哈尔滨理工人学理学硕士学位论文 定义2 1 3a c t ) = f f 。1 ( , o ) 旃称为a ( t ) 的n e l s o n 估计,其中 歹= x c x ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论