




已阅读5页,还剩130页未读, 继续免费阅读
(概率论与数理统计专业论文)生物统计中模型和方法的若干研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
d i s s e r t a t i o nf o rd o c t o rd e g r e e ,2 0 1 0 m 1 1 1 1 l l i | i i 洲m l i l l l 川i l l l l 唧 y 19 0 3 5 9 8 u n i v e r s i t yi d :1 0 2 6 9 s t u d e n ti d :5 2 0 6 0 6 0 5 0 0 4 s e v e r als t udi e so fmo de i san dm e t ho d sin d e p a r t m e n t m a j o r bi o s t a t i s t i c s d e p a r t m e n to fs t a t i s t i c s p r o b a b i l i t ya n dm a t h e m a t i c a ls t a t i s t i 塑 r e s e a r c hd i r e c t i o nm a t h e 啦煎i 堡亟ls 主煎i 煎i 堡曼 s u p e r v i s o r a u t h o r d a t e p r o f e s s o r sl i x i n gz h ua n dh u l i nw u y u nf a n g o c t o b e r ,2 0 1 0 华东师范大学学位论文原创性声明 郑重声明:本人呈交的学位论文生物统计中模型和方法的若干研究,是在华 东师范大学攻读博士学位期间,在导师的指导下进行的研究工作及取得的研究成果。 除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰写过的研究成 果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢 意。 、 作者签名: 日期: 为| o 1 、6 华东师范大学学位论文著作权使用声明 生物统计中模型和方法的若干研究系本人在华东师范大学攻读学位期间在导 师指导下完成的博士学位论文,本论文的研究成果归华东师范大学所有。本人同意华 东师范大学根据相关规定保留和使用此学位论文,并向主管部门和相关机构如国家图 书馆、中信所和”知网”送交学位论文的印刷版和电子版;允许学位论文进入华东师范 大学图书馆及数据库被查阅、借阅;同意学校将学位论文加入全国博士、硕士学位论 文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或 者其它方式合理复制学位论文。 本学位论文属于( 请勾选) ( ) 1 经华东师范大学相关部门审查核定的“内部”或“涉密 学位论文宰, 于年月日解密,解密后适用上述授权。 ( ) 2 不保密,适用上述授权。 导师签名:兰垒圭刍导师签名: 笙望一j 日期:塑i ! :皇:2日期:丝i ! :皇:么 作者签名: 日期: 乃宏 木“涉密”学位论文应是已经华东师范大学学位评定委员会办公室或保密委员会审定过的学 位论文( 需附获批的华东师范大学研究生申请学位论文”涉密”审批表方为有效) ,未经上述部 门审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用上述授 权) 。 房云博士学位论文答辩委员会成员名单 姓名职称单位备注 岳荣先教授上海师范大学数理学院主席 朱仲义教授复旦大学管理学院 周勇教授上海财经大学统计与管理学院 汪荣明教授华东师范大学金融与统计学院 吴贤毅教授华东师范大学金融与统计学院 目录 ! ! ! 竺! ! 毫= ! = ! ! 皇! 竺毫竺! ! 竺= ! ! 竺詈! = ! ! = 烹! ! ! ! ! ! 竺! 竺! ! ! ! ! - ! 摘要 a b s t r a c t ( 英文摘要) 主要符号对照表 目录 v v l l 1 ) 【 第一章引言 1 1 1 艾滋病数据与常微分方程模型1 1 2 基因芯片数据与相关问题4 1 3 纵向数据与混合效应模型7 1 4 本文的主要工作8 第二章随机系数常微分方程的两步估计以及在纵向动态艾滋病( a i d s ) 数据的 应用 1 1 2 1 引言1 l 2 2 估计方法1 2 2 3 渐近性质1 9 2 4 实际数据分析2 0 2 5 模拟研究2 2 2 6 总结与讨论2 3 2 7 附录2 4 第三章基于数据扩张法的拟最小二乘估计并在基因调控网络( g r n ) 中的应用 3 2 3 1 引言3 2 3 2 基于数据扩张法的拟最小二乘估计3 3 3 3 窗宽忍以及扩张数据的样本量m 的阶3 7 3 4 模拟研究3 9 3 5 实际数据分析4 1 3 6 总结和讨论4 2 3 7 附录4 4 i 第四章重置模拟反推法对基因微阵列( m i c r o a u r r a y ) 数据方差估计的渐近性质4 9 4 1 引言4 9 4 2 p s i m e x 方法的回顾5 0 4 3 渐近理论5 2 4 4m o n t ec a r l o 置信区间和置信带5 5 4 5 模拟研究5 8 4 6 实例分析5 9 4 7 总结与讨论6 2 4 8 附录6 2 第五章随机设计混合效应模型的统计分析 6 6 5 1 引言6 6 5 2 估计方法和步骤6 7 5 3 大样本性质7 0 5 4 置信区间和置信域7 l 5 5 模拟研究7 2 5 6 附录7 5 结论以及未来的工作 r 1 参考文献 后记 博士期间的研究成果及发表的论文 8 2 9 3 9 5 插图目录 插图目录 3 1 均方误差相对扩张数据的样本量m 的走势图( n = 4 1 ,且( 仃 ,砖) = ( 1 0 一,1 0 4 ) ) 。实线、虚线、点虚线分别表示6 1 ,色以及仑3 的均方误差。4 0 3 2 四种与酵母细胞周期相关的基因s w i 4 ,c l n 2 ,h t b l 和a s h l 的转录率估计 值0 ( ) 。4 3 垂1 模型i i i 的9 5 b o n f e r r o n i 型蒙特卡罗置信带的平均值( n = 1 2 5 0 ) 。左右两 侧分别对应m = 3 和m = 5 。实线和点虚线分别表示方差函数夕( x ) 以及函 数估计缸( x ,一1 ) ,虚线表示置信带。6 0 垂2p s i m e x 方差函数估计图。左侧对应含4 个样本的子集。右侧对应含8 个 样本的子集。散点表示样本方差v s 样本均值。实线是方差的p s i m e x 方 差函数估计。6 1 垂3p s i m e x 方差函数估计图。散点表示样本方差v s 样本均值。实线是方差 的p s i m e x 核估计,虚线表示9 5 置信带。6 l 孓1 样本量m = 2 0 0 时,c a s e1 中p 以及d 的对角线元素9 5 的置信域。7 4 5 - 2 样本量m = 4 0 0 时,c a s e1 中p 以及d 的对角线元素9 5 的置信域。7 4 表格目录 表格目录 2 1 个体参数九,店,批以及固定效应参数a ,j 口,的极大拟似然估计( 9 5 置 信区间) 。一2 1 2 2 个体参数q 优,q “,q 2 i 以及固定效应q o ,a 1 ,a 2 极大拟似然估计的平均相对 误差( ) 。2 3 孓1 估计值6 1 ,色和如的均方误差。( l = 【3 】+ ) 4 0 孓2 基于数据扩张的拟最小二乘法和非线性最小二乘法的计算时间( 秒) 。4 1 3 - 3 酵母菌基因调控网络模型中参数的估计值。4 2 垂1 模型i 和i i 中参数9 5 蒙特卡罗置信区间的覆盖率( ) ( 置信区间长度的均 值,标准差) 。5 8 垂2 模型i i i 中夕( x ) 在= 2 处9 5 置信区间的覆盖率( ) ( 置信区间长度的均 值,标准差) 。5 9 5 1 估计值的均值( m e 粕) ,标准差( s t d ) 以及均方误差的算术平方 根( r 溉) 。“反? 代表方差阵d 的第( i ,t ) 个分量,i = 1 ,2 。符号“r 和“i i ” 分别表示c a s e1 和c a s e2 7 3 5 29 5 的置信区间和置信域的覆盖率( ) 。符号“c 冗”和“c j ”分别代指置 信域和置信区间。“仇 指d 的对角元素构成的向量。7 3 5 39 5 置信区间长度的均值( m e a n ) 和标准差( s t d ) 。7 3 中文摘要 摘要 近年来,随着生物学的迅猛发展,对生物数据的分析研究也吸引了越来越多统计 学家的目光。在本文中,我们对生物数据中使用的一些统计模型、方法及相关理论进 行了研究,并通过数据模拟和实例分析验证了我们所提方法的效果和适用性。 艾滋病( a i d s ) 是危害人类健康的一大杀手。目前对艾滋病病毒( h i v ) 的动态研究 是a i d s 研究领域的热门问题。h i v 病毒动态研究可以给a i d s 致病机理以及药效评估提 供重要的依据。本文首先对描述h i v 病毒纵向动态变化的随机系数常微分方程模型提 出了两步估计法。在第一步中,我们对非参数混合效应模型利用局部多项式核估计得 到状态变量及其导数的值,第二步中我们把第一步中的估计值代入随机系数常微分方 程,并提出极大拟似然估计法得出常微分方程中未知参数的估计值。并且,我们对总 体参数的估计推导了大样本性质。经过模拟研究和临床a i d s 数据的实例分析,我们证 实了该方法良好的估计效果和实用价值。同时,我们指出这里的两步估计法并不仅可 用于h i v 动态研究,还可用于流感病毒、药物代谢动力学等其他领域的随机系数常微分 方程模型。 基因芯片( 也称作d n am i c r o a l r r a y ) 技术可以同时测量大量基因的表达值。基因调控 网络是基因表达值数据的一个重要研究内容。常微分方程系统是研究基因调控网络的 常用工具之一。本文第三章研究了用于常微分方程系统的基于数据扩张法的拟最小二 乘估计( d a p l s ) 。我们推导了估计值的相合性,渐近正态性以及均方误差,并在最小 化参数估计均方误差的前提下,给出了选取窗宽和扩张数据样本量的建议。对于基因 数据的重复观察次数较少,即样本量小的缺憾,我们认为数据扩张法可以从原始数据 中挖掘出更多的信息,提高估计效果。在模拟和数据分析中,我们将该方法用到基因 调控网络中去,证实了该方法的估计值确实比拟最小二乘估计法( “a n g w ,u2 0 0 8 ) 有 明显改进。本文在理论和模拟双方面都说明了d a p l s 法的优点。当然,d a p l s 法也 可用于其他领域的常微分方程系统。 此外,基因芯片数据研究中的一个重要方面是检验在不同条件下表达值有显著差 异性的基因。而基因表达值的方差估计对这一检测起着重要作用。本文的第四章研究 了重置模拟反推法( p s i m e x ) 估计m i c r o 狮a y 数据方差的大样本性质,包括参数和非参 数方差函数两种情形。对参数情形,我们研究的问题更具一般性。我们研究了在不能 确定使用的模型是否为真实模型的情况下,参数估计相合到何值,以及是否具有渐 近正态性等问题。对于非参数方差模型,我们研究了p s i m e x 核估计的渐近正态性, 给出了最优窗宽的选取。并且,利用蒙特卡罗法,我们构造了参数方差模型中参数 的置信区间以及非参数方差模型下方差函数的联合置信带。通过模拟,我们验证了 置信区间和置信带令人满意的效果。同时,我们分析了两个m i c r o a r r a y 实际数据来说 明p s i m e x 法估计方差的实用性。 中文摘要 另一方面,纵向数据是多个个体随着时间推移重复观察的数据,在生物、医药、 农业等众多领域出现。混合效应模型是研究纵向数据的一个常用工具。然而常用的随 机效应和误差正态分布的假设不具有稳健性。另外,非正态分布假设下,随机效应及 误差的高阶矩估计也是值得关注的一个问题。在第五章,我们提出了用于纵向数据的 混合效应模型的矩估计方法。该方法在随机效应和误差非正态性分布时,能够对模型 参数以及随机效应和误差的高阶矩作估计。我们证明了矩估计具有强相合性和渐近正 态性。经模拟,我们核实了该方法的估计效果,并构造了参数的置信区间的置信域。 关键词:艾滋病数据,数据扩张法,基因调控网络,极大拟似然估计,基因芯片数 据,混合效应模型,矩估计法,常微分方程模型,重置模拟反推,拟最小二乘估计, 两步估计法。 英文摘要 a b s t r a c t w i t ht h e 缸td e v e l o p m e n t0 fb i o l o 盯i nr e c e n ty e a r s ,t h ea n a l y s i so f b i o l o g i c a ld a t a h a sa t t r a c t e di n o r ea n dm o r ea t t e n t i o no fs t a t i s t i c i a n 8 i nt h i st h e s i s ,w e8 t u d ys e v e r a l s t a t i s t i c a lm o d e l s ,m e t h o d sa n dt h e o r i e sf o rb i o l o 百c a ld a t a ,a 肌dv e r i 矽t h ep e r f o r m a n c e 龇l d 印p l i c a b i l i t yo ft h ep r o p o s e dm e t h o d 8 访as i i n u l a t i o 璐a n dr e a le x 锄p l e s a i d s ( a c q u i r e di m m l m ed e f i c i e n c ys y n d r o m e ) h a sb e e naf a t a lh a z 盯dt oh u m a j lb e - i n g s a tp r e s e n t ,h i v ( h u m a ni m 姗n o d e f i c i e n c y 访r u s ) d y l l a m i cs t u d i e sa 鹏h o ti s s u e si n a i d sr e s e a u r c h h i vd y n a m i c8 t u d i e sc a np r o v i d ei m p o r t a n ti n f d 吼a t i o nf o rl u i d e r s t a n d - i n gt h ep a t h o g e n e s i so fa i d sa n de 、m u a t i o no ft r e a t i n e n te 伍c a l c y t h i st h e s i sf i r s t l y p r o p 0 8 e 8at w os t a g em e t h o df o rr a n d o mc o e m c i e n to r d i n a r yd i n e r e n t i a le q u a t i o n sf o r t h ed y n a m i c so “o n 百t u d i n a lh i vd a t a i nt h e 丘r s ts t a g e ,w e 印p l yt h el o c a lp o l y n o m i a l k e r n e lf o rn o n p a r a m e t r i cm i ) 【e dm o d e l 8t oe s t i m a t et h ev a l l u e sa n dd e r i v 眈i v 鹤o ft h es t a 七e v a r i a b l e s w | et h e ns u b s t i t u t et h ee s t i m a t e si nt h e6 r 8 ts t a g ei n t ot h eo r d i n a 巧d i 乳r e n t i a l e q u a t i o n sa n dp r o p o s eam a 菇m u l np s e u d ol i k e h h o o de s t i m a t i o nt oo b t 撕nt h ee s t i m a t e s o fu 妇w np a r 锄e t e r s f b rt h ee s t i m a t e so fp o p u l a t i o ne 珏b c t s ,w ei i e s t i g a t et h el a r g e s a n l p l ep r o p e r t i e s b ys i m u l a t i o ns t u d i e sa n da n a l y s i so fc l i n i c a la i d sd a t a ,w ei l l u s - t r a t et h es a t i s l 姐n gp e r f o r m a n c ea n du s e f u l n e s so ft h ep r o p o s e dm e t h o d a l s o ,w ep o i n t o u tt h a tt h et w ds t a g em e t h o dc a nb eu s e df o ro r d i n 盯yd i 髓r e n t i a le q u a t i o i l si no t h e r s c i e n t i f i cf i e l d s ,8 u c h 嬲i n f l u e i l z a 啊r u s ,p h a u r m a c o k i n e t i c s ,e t c g e n ec h i p ( a l s oc a l l e da u sd n a m i c r o 盯r a y ) c a ns i i n u l t a n e o u s l ym e a _ s u r et h ee x p r e s s i o n l e v e l so ft h o u s a n d so fg e n e 8 g e n er e g u l a t o 巧n e t w o r k ( g r n ) i sa ni m p o r t a n tt o p i ci nt h e r e s e 盯c ho fg e n ee x p r e s s i o nd a t a o r d i n a 唧d i 髓r e n t i a le q u a t i o ns y s t e mi so n eo fp 伽陀r f m t o o l sf o rg r n i nc h a p t e r3 ,w es t u d yt h ed a t aa u g m e n t a t i o nb a u s e dp s e u d o1 e a s ts q u a r e s ( d a p l s ) m e t h o df o ro r d i n a ud i 髓r e n t i a le q u a t i o ns y s t e m w bp r o v et h ec o l l s i s t e n c y a 8 y m p t o t i cn o r m a l i t ya n dm e a ns q u a r e de r r o ro ft h ep a r a m e t e re s t i m a t e s a l s o ,u n d e r t h ep r i n c i p l eo fm i i l i i l l i z i n gm e a n s q u a r e d e r r o ro ft h ee s t i m a t e s ,w ep r o v i d et h e8 t r a t e 舀e s f o rs e l e c t i n gt h eb a i l d 丽d t ha n ds a m p l es i z eo fa u g m e i l t e dd a t a f b rt h ef e wr e p l i c a t e s o fg e n ee x p r e s s i o nd a t a ,i e ,s m a l ls 锄p l es i z e ,t h ea p p r o a c ho fd a t aa u g m e n t a t i o nc a n d e e p l ym i n et h ei n f o m a t i o no ft h eo r i 舀n a ld a t at oa c h i e v eb e t t e re s t i m a t e s w ea p p l y t h ed a - p l sm e t h o df o rg e n er e g u l a t o r yn e t w 0 r ki ns i i n u l a t i o i l sa n dr e a le x a h l p l e s ,a n d v e r i 黟t h a tt h ed a - p l sm e t h o dh i g h l yi m p r o v et h ea c c u r a c yo fe 8 t i m a t e sc o m p a r e dt o t h ep l sm e t h o d ( l i a n g w h2 0 0 8 ) n 的mb o t ht h e o r e t i c a la n ds i m u l a t i o np e r s p e c t i v e s , v l l 一 w ep r 嘶d es o l i dj u s t i f i c a t i o i l sf o rt h e8 t r a t e 舒o fd a - p l s s u r e l y ,t h ed a - p l sm e t h o di s a l s oa p p l i c a b l ef o ro r d i n a r yd i 缸e r e n t i a le q u a t i o ns y s t e mi no t h e ra r e a s f l u r t h e r m l o r e ,d e t e c t i n gt h ed i h i e r e i l t i a l l ye x p r e s s e dg e n e su n d e rd i h e r e i l tc o n d i t i o 璐 i sa n o t h e rh o tt o p i ci nm i c r o 盯r a yd a t aa n a l y s i 8 v a r i a n c ee s t i m a t i o no ft h em i c r o 缸r a y d a t ap l a 咿ac r i t i c a lr o l ei nt h ed e t e c t i o n i nc h a p t e r4 ,w ei m r e s t i g a t et h ea s y m p t o t i c 8 o fp e r m u t a t i o ns i m u l a t i o n 僦r a p o l a t i o n ( p s i m e x ) m e t h o df o r 聊i a n c ee s t i m a t i o no f m i c r o a r r a yd a t a ,i n c l u d i n gb o t hc a u s e so fp a u r a m e t r i ca j l dn o n p 甜a m e t r i cv a r i a n c ef u n c t i o 璐 f o rp a r 锄e t r i cv 孤i a n c ef u n c t i o i l 8 ,av e r yg e n e r a lp r o b l e mi s8 t u d i e d w bd i s c u s 8t h e c o 璐i s t e n c ya l n da s y l n p t o t i cn o r m a l i t yo fp a r a m e t e re s t i m a t e sw h e nt h ec h 0 8 e nm o d e l m a yn o tb et h et r u ev a r i a n c em o d e l f b rn o n p 盯a m e t r i cv a r i a n c em o d e l ,w ed e r i v et h e a u s y m p t o t i cn o m a u t y0 fp s i m e xk e m e le s t i m a t e sf o rv a r i a n c e c t i o na n d 舀v et h e o p t i m a lb a n d w i d t hf o rm i n i m i z i n gt h ea p p r o 函m a t e dm e a ni n t e g r a t e ds q u a r e de r r o r i n a d d i t i o n ,w i t hm o n t ec a u r l om e t h o d ,w ec o n s t r u c tt h ec o n f i d e n c ei n t e r v a l sf o rp a r a m e t e r s a j l ds i m u l t a n e o u sc o n n d e n c eb a n d sf o r i a n c ef u n c t i o ni nt h en o n p a r a m e t r i cc a s e b y s i m u l a t i o n s ,r ef i n dt h ec o n n d e n c ei n t e r v a l sa n db a n d sp e r f o r m 他u a l s o ,t w or e 越 e x a m p l e so fm i c r o a r r a yd a t aa r ea n a l y z e dt of u r t h e ri u u s t r a t et h ep s i m e xm e t h o d o nt h e0 t h e rh a n d ,l o n 西t u d i n a l ld a t ac o n t a i 璐r e p e a t e dm e a s u r e m e n t st a k e no ne a c h o fs u b j e c t 8o v e rt i i n e ,a r i s i n g 仔e q u e i l t l yf 如mb i o l o 舀c a l ,m e d i c a l l ,a g r i c u l t u r a ls t u d i e sa u s r e l la s 行o mo t h e rs c i e n t i 丘ca r e a s m i x e de 能c t sm o d e li sap o p u l a rt o o lf o r1 0 n 舀t u d i n a l d a t a w h i l et h ee o m m o nn o r m a l i t ya s s u m p t i o nf o rr a n d o me 髓c t 8a n de r r o r 8i sn o tv e 疆 r o b u s t b e s i d e s ,u n d e rt h en o n - n o m a l i t ya s s u m p t i o n ,h o wt oe s t i m a t et h eh i 曲e ro r d e r m o m e n t so fr a n d o me f l _ e c t sa n de r r o r si sa l s oa ni n t e r e 8 t i n gp r o b l e m i nc h 印t e r5 ,w e p r o p o s eam o m e n te s t i m a t i o nm e t h o df o rm 仅e de e c t sm o d e l s u n d e rt h en o n n o m a l i t y a s s u m p t i o n ,t h i s 印p r o 脚出c a np r o v i d ee s t i m a t e so fu n k n 伽l r l l p a r 锄e t e r sa sw e ua sh i g h e r m o m e n t so fr a n d o me 胎c t 8a n de r r o r s t h ec o n s i s t e n c y 趾da s y m p t o t i cn o m 甜i t yo ft h e m e t h o da r ep r o v e d w ba l s oc o n s t r u c tt h ec o 曲d e n c ei n t e r v a 血a j l dr e 舀。璐f o rp a r a i n e t e r s s i m u l a t i o 玎s t l 】d j e sa r ec a r r i e d0 1 】tt oi l 】1 】s t r a 土et b em e t h o d k e yw 0 r d s :a i d s h i vd a t a ,d a t aa u g m e n t a t i o n ,g e n er e g u l a t o 巧n e t w o r k ,m a 静 i i n u mp s e u d ol i k e l i h o o de s t i m a t i o n ,m i c r o 盯r a yd a t a ,m i x e de f b e c t sm o d e l s ,m o m e n t e s t i m a t i o nm e t h o d ,o r d i n a r yd i 髓r e n t i a le q u a t i o n ,p e 咖u t a t i o ns i m u l a t i o ne 赋r a p 0 1 a t i o n ( p s i m e x ) ,p s e u d ol e a s ts q u a r e s ,t w 0 - s t a g em e t h o d 一1 l 一 主要符号对照表 a r e d a p l s g r n i i d m l e m p l e m s e o d e o l s p c v p l s p s i m e x r m s e s c v s i m e x a r a 一1 u e c ( a ) 主要符号对照表 平均相对误差 基于数据扩张的拟最小二乘法 基因调控网络 独立同分布 极大似然估计 极大拟似然估计 均方误差 常微分方程 最小二乘法 点交叉核实法 拟最小二乘法 重置模拟反推法 均方误差的算术平均根 个体交叉核实法 模拟反推法 矩阵a 的转置矩阵 可逆矩阵a 的逆矩阵 矩阵a 的按列拉直向量 第一章引言 第一章引言弟一早ji 面 随着生物学的迅速发展以及生物数据的大量采集,生物统计的重要性也日益显 著。如何利用恰当的模型以及统计方法从生物数据中获得有价值的信息是生物学家和 统计工作者共同的研究兴趣。在生物学的众多科研内容中,艾滋病已经吸引了诸多 科学家的眼球。艾滋病对人类的严重危害激发了人们深入研究以及征服艾滋病的动 力。同时,分子生物学的兴起以及高端实验设备的完善推动了人们从基因层面了解 各类生物的愿望,而基因芯片技术正为人类提供了大量基因方面的数据和信息。此 外,包含多个个体随时间推移的多次观察值的纵向数据也频繁地在生物、医药等科学 领域出现。对艾滋病数据、基因芯片数据以及纵向数据的讨论,许多文献已有相关 讨论,如p e r e l s o ne ta 1 ( 1 9 9 6 ) ,p e r e l s o ne ta 1 ( 1 9 9 7 ) ,w h ( 2 0 0 5 ) ,d h a u e s e l e e re t 越 ( 1 9 9 9 ) ,w e s s e l se ta l l ( 2 0 0 1 ) ,r d d 【e d u r b i n ( 2 0 0 1 ) ,c h e n ,e ta 1 ( 2 0 0 2 ) ,l a i r d w 打e ( 1 9 8 2 ) ,h 8 w i l l e ( 1 9 9 7 ) ,l i n d s t r o m b a t e s ( 1 9 9 0 ) ,j i a n g ( 2 0 0 3 ) 等等。本文便 在前人工作的基础上,对上述三类生物数据中的统计模型和方法作一些研究和探讨。 1 1 艾滋病数据与常微分方程模型 艾滋病的全称是获得性免疫缺陷综合征,是a i d s ( a c q u i r e di m m n ed e l i c i e n e y s y l l d r o m e ) 的音译。艾滋病是人体感染了人类免疫缺陷病毒( h u m a ni m i n u n o d e f i c i e n c y 订r u s ,h i v ,又称艾滋病病毒) 引起的传染病。h i v 病毒主要攻击两种类型的免疫细 胞:c d 4 + t ,c d 8 + t ,即助手t 细胞和杀手t 细胞,使人体对外界细菌和病毒的入侵 失去反应和抵御能力。因此,入一旦感染h i v 病毒,经过潜伏期后免疫功能会逐渐下降 或消失,从而感染其他的疾病导致各种复合感染而死亡。 艾滋病自1 9 8 1 年在美国首次确认后,便迅速蔓延到其他各大洲。目前艾滋病正成为 人类的一大威胁,被称为“超级癌症”和“世纪杀手 ,它给社会带来了巨大危害。 因此,对艾滋病的病理研究、药物和疫苗的研发对人类未来的生存和发展有着极其重 要的意义。而h i v 动态研究( h i vd y n a m i cs t u d i e s ) 对于帮助人们理解艾滋病的发病机制 以及药效的评测都有非常重要的价值。随着对血浆h i v 浓度高敏感化验技术的发展,人 们已然可以在治疗中监测血浆病毒逐渐消逝的过程。对于接受不同治疗方案的不同病 人群体病毒动态的追踪,可以为治疗方案的进一步完善提供有价值的指导,并且可以 疗效评测提供可靠的依据。自从h oe t 越( 1 9 9 5 ) 以及w 西e t2 l 1 ( 1 9 9 5 ) 在n a t u r e 上发表病 毒动态研究的结果,h i v 的动态研究便吸引了a i d s 专家和研究者的大量关注。然而由 于h i v 动态变化的复杂性,如何发展统计方法对临床数据拟合动态模型以及估计参数是 1 一 1 1 艾滋病数据与常微分方程模型 统计学家面临的一大挑战。近年来,常微分方程模型被广泛用于量化h i v 动态系统,并 在a i d s 发病机理等方面得出了许多重要的发现,可参见h oe ta 1 ( 1 9 9 5 ) ,p e r e l s o ne ta 1 ( 1 9 9 6 ) ,p e r e l s o ne t 以( 1 9 9 7 ) ,p e r e l s o n n e l s o n ( 1 9 9 9 ) ,w he 乇a l l ( 1 9 9 9 ) ,h d i n g ( 1 9 9 9 ) ,n o w a k m a y ( 2 0 0 0 ) ,t a n w h ( 2 0 0 5 ) ,w h ( 2 0 0 5 ) 等文献。 h oe ta 1 ( 1 9 9 5 ) 以及w 西e ta l l ( 1 9 9 5 ) 用简单的单指数和双指数模型来拟合抗病毒 治疗后早期阶段的h i v 数据。其后,p e r e l s o ne ta l l ( 1 9 9 6 ) 在假设蛋白抑制剂药物具有 完美药效的前提下,提出了一个常微分方程系统模型, ! , , , i 爱乃( 亡) = 矗而一6 乃, t 爱( 亡) = 一c , ( 1 - 1 ) 【袅邢) = 6 乃:一c j , 这里的而表示未被感染的c d 4 + t 细胞的浓度,乃表示被感染的t 细胞的浓度,是血 浆中具感染力的h i v 病毒的浓度,指没有感染力的h i v 病毒浓度,c 是病毒消亡的速 率,6 是被感染的c d 4 + t 细胞的消亡率,尼是感染率,是每个感染细胞在生存时间内 产生新病毒的平均个数。蛋白抑制剂的作用是使新生的h i v 病毒没有感染力。假设未感 染的细胞浓度t 在治疗后的短期内保持不变,并且在接受治疗前,病人体内的病毒数和 免疫细胞达成平衡,那么上述线性微分方程的显式解( c l o s e d - f o ms 0 1 u t i o n ) 存在。其中 病毒总体浓度y ( t ) ,即+ j 的显示表达式是 y ( t ) = k e 印( 一鳓+ 尝 南 e 印( 一一e 印( 一西) 】一淝e 印( 一叫) ( 1 - 2 ) 其中表示血浆病毒浓度在幻时刻的初值。而观察数据有 y ( 岛) = y ( 如) + e ( 如) ,i = o ,1 ,n ( 1 3 ) e ( 岛) 表示测量误差。p e r e l s o ne ta 1 ( 1 9 9 6 ) 根据模型( 1 2 ) ,对治疗后第一周的h i v 观察数 据作拟合,并利用非线性最小二乘法( n l s ) 估计参数6 和c 。根据估计的参数,他们得到 血浆中自由病毒的半衰期是6 个小时,受感染的c d 4 + t 细胞的半衰期是1 6 天。 p e r e l s o ne ta 1 ( 1 9 9 7 ) 进一步提出了一个常微分方程系统用于治疗后的长期数据, 弥补了模型( 1 1 ) 只能用于治疗后的短期数据的缺憾。p e r e l s o ne ta l l ( 1 9 9 7 ) 的模型刻画 了h i v 浓度的双相下降( 即h i v 浓度在治疗后先下降,再反弹) 。具体模型此略去,详 见p e r e l j s o ne ta l l ( 1 9 9 7 ) 。p e r e l s o ne ta l l ( 1 9 9 7 ) 中提出的常微分方程系统也有显式解, y ( ) = 【a e 一乳+ b e 一“。+ c e p m 。+ ( 1 一a b c ) e d 】 ( 1 4 ) 一2 一二 第一章引言 其中弘m 表示被感染但寿命较长的t 细胞的死亡率,比表示被感染但仍处于潜伏期的t 细 胞的死亡率,a ,b 以及c 是系统参数的函数( 具体请参见p e r e l s o ne ta l l 1 9 9 7 ) 。y ( t ) 的 模型,除了( 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (正式版)DB15∕T 3380-2024 《马铃薯镰刀属真菌病害检测技术规程》
- 书中的奇遇读书故事叙事作文5篇范文
- (正式版)DB15∕T 3350-2024 《饲用燕麦草霉变评价》
- 电力入场考试题及答案
- 读书破万卷写物作文10篇
- 护理专科生理学试题库及答案
- 护理人际关系面试题库及答案
- 大学以往考试题及答案
- 企业信息安全管理制度与流程手册
- 企业文化价值体系分析工具
- 别墅整装交付管理办法
- 《风景谈》课件-课件
- 实验室6S培训资料
- 小米之家培训课件
- 新版gmp指南培训课件
- 邮件沟通礼仪培训课件
- 拔罐适应症研究-洞察及研究
- 2024年药品监管业务知识技能竞赛考试题库(含答案)
- 疼痛科质量控制管理
- 低空经济八大应用场景与实践案例解析方案
- 呼吸管路处理规范与操作要点
评论
0/150
提交评论