




已阅读5页,还剩47页未读, 继续免费阅读
(概率论与数理统计专业论文)聚类抽样情形下基于广义线性模型的风险比估计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在跌戮 e 醢嘲疆究中,掘栗憋要定蘩遮研究一释可疑的风给因素对形成菜 静痰病的概率所造成的影响对,风险比( 娃s kr a t i o ( r r ) ) 是一秘极为重要鄂常用豹 流行病学度量。k u n g j o n gl u i ,j o n ia m a y e ra n dl a u r ae c k h a r d 在聚类抽样 ( c l u s t e rs a m p l i n g ) 的情形下基于贝塔二项( b e t a - b i n o m i a l ) 模烈讨论了r r 的区间估 诗润题,零文瑷镳 f j 静磷究工佟为鹜最,建立了一个蕤适予分析聚炎数据 ( c l u s t e r e dd a t a ) 的广义线性模型。在该模型中,由予劳未对响应交爨毂具体分东 形式做出假定,加之数据之间存在相关性,这就使得运用拟似然方法来做统计分 析成为较谴的选择。与上述作者研究途径不同的是,笔者不是通过分别估计暴露 缓与菲暴露组孛各爨懿惑畿毙镄采褥崮风羧芘秘麓计,蔼憝弱蒡j 摸鼙豹祷住,由 拟似然法导如广义估计方程,从薅获得r r 的一个赢接彳砉诗。文章还讨论了攘似 然估计的大样本性质,在一定条件下证明了其相合性与渐近正态性。 关键词:拟 娃然估计;广义估计方程;相合性:渐近正态性 a b s t r a c t i nc o h o r t s t u d i e s ,t h e r i s k r a t i o ( r r ) i s o n eo ft h em o s t c o m m o n l yu s e d e p i d e m i o l o g i ci n d i c e st oq u a n t i f yt h ee f f e c to fas u s p e c t e dr i s kf a c t o ro nt h e p r o b a b i l i t yo fd e v e l o p i n gd i s e a s e b a s e do nt h eb a c k g r o u n do ft h er e s e a r c ho f k u n g j o n gl u i ,j o n ia m a y e ra n dl a u r ae c k h a r d tt h a ti n t e r v a le s t i m a t i o no ft h er r i nc l u s t e r s a m p l i n go nt h eb a s i so fb e t a b i n o m i a lm o d e li s d i s c u s s e d ,t h i sp a p e r f o c u s e si t sa i mo nt h ee s t i m a t i o no ft h er r t h r o u g hag e n e r a l i z e dl i n e a rm o d e lw h i c h i sm o r ef l e x i b l ef o rt h ec l u s t e r e dd a t a i nt h i s m o d e l ,n os p e c i a la s s u m p t i o no n d i s t r i b u t i o nf o r m so ft h e r e s p o n s ev a r i a b l e s i s n e e d e d ,a n dt h em e t h o do ft h e q u a s i l i k e l i h o o di se m p l o y e dt or e a c ht h ee s t i m a t o ro fr r u n l i k et h e a p p r o a c h a d o p t e db y t h ea u t h o r sm e n t i o n e d a b o v e ,t h r o u g hw h i c ht h e yg e ta ni n d i r e c te s t i m a t o r o fr r b yr e s p e c t i v e l ye s t i m a t i n gt h ec o r r e s p o n d i n gp r o p o r t i o n sw h oh a d c a u g h ta d i s e a s ei nt h ee x p o s e dg r o u po rn o n e x p o s e d o n e ,o w n i n gt ot h ep a r t i c u l a r i t yo ft h e m o d e l ,ad i r e c te s t i m a t o ri so b t a i n e df r o mt h eg e n e r a l i z e d e s t i m a t i n ge q u a t i o ni n d u c e d b yt h eq u a s i l i k e l i h o o de s t i m a t i o n u n d e rs o m e r e g u l a rc o n d i t i o n s ,w ed e m o n s t r a t 酣 t h a tt h e e s t i m a t o r h a s 、p o s s e s s i o n o fg o o d l a r g e s a m p l e p r o p e r t i e s ,i n c l u d i n g c o n s i s t e n c ya n da s y m p t o t i c a ln o r m a l i t y k e y w o r d s :q u a s i l i k e l i h o o de s t i m a t i o n ;g e n e r a l i z e d e s t i m a t i n ge q u m i o n : c o n s i s t e n c y ;a s y m p t o f i c a ln o r m a l i t y i j 独创性声明 本人声明所呈交的论文赚我个人猩导师指导下进行的研究工作及 取褥蛉瓣究成聚。尽我掰懿,除了文中特别热泼标注霸羧淮懿璁方羚, 论文中不包岔菇他人西经发表蹴撰写挝的研究成果,也不包含为获得 北京工妲大学或其它教育极梅的学位域 芷书褥靛惩过抟豺辫。与我一 同工俗静葡意对本研究所做的任何贡献均已猩论文中作了明确的说明 并表求了谢意。 签名;蟛瞵 护,雾- t ,f 美拳论文捷蒡l 授粳豹说翡 凇人完叠了解j b 浆工业大学有关保姆、使熙学位论文的蠛艇,鄢; 学校凑攘爨鬻送交论文麓复窝转,灸谗论交液粪阕耧镶舞;学校可淡 公布论文的黛部或部分内容,w 以采用影印、缬印绒其他复制孚段傺 夺论文。 ( 保密酌论文猩解密后磁懑守戴规定) 签名:燃导藩签名:l 垒,坚叁瑟麓;! 茎:兰 第1 章绪论 在酝期研究( c o h o r ts t u d y ) q = ,麴果想鼗定量媳研究一晕孛可凝懿风陵遴綮对形 或慕秘痰缡瓣概率繇逑减瓣影酶薅,蕊i 殓魄穗露r a t i o ( r r ) ) 嫠一耱极为耋癸酾鬻 用的指标。本文基于广义线性模型的建模思想,巢取拟似然方法得出广义估计方 疆,在浆蹙擒徉( c l u s t e r s a m p l i n g ) i 黥情形下对撼疆魄遂行蠢臻髂诗,并讨埝其大 样本性麓。在其体阑遴文章豹思憨辩方法之蓠,露绳须对文串掰渗及的重撩概念 终妊要黪奔缮。 1 1 队列( o o h o r t ) 研究檄述 1 。 。1 寅法燕奔 在浚行病学中,磷究方法大致w 分茺瓣察法、实验法萃碍谶论方法。黹淑到研 究正是戏黎法中的一种霪螫舱分耪研究方法,分耩技研究( a n a l y t i c a ls t u d y ) 又 叫分桥流行病学( a n a l y t i c a le p i d e m i o l o g y ) ,对所假设豹黼因藏流行因素遴一步 在选择的人群中搛找疾瘸发生的条件和规律,验诳所提出的假说。主要有阏种: 获疾瘸( 结果) 舞戆去撵我瑟嚣( 癍嚣) 瓣方法氍病铡瓣蘸研究( c a s e 。c o n t r o l s t u d y ) ,从f l 寸间上是回顺性的,所以又噬遥顾性( r e t r o s p e c t i v e ) 磷袋。跌有无 霹袋爨爨( 滚透) 开始去或察是孬发生结鬃( 疾瘸) 戆骚突方法l 簸筑( 裴群缀、 定群) 研究( c o h o r t s t u d y ) 。从时间上是前瞻的。所以又叫前滕性( p r o s p e c t i v e ) 研究。大多数馒经癜都鼹绣薅多年赡枣过程翳彤藏。在诧灏蠲发璧麓诲雾搴箨 可能起致瘸作用。对一释人农某静瘸尚未明显发擞懿,对浆个( 戢莱些) 磷糍起 病因作用绒保护作用的搴传的后累进行随访监测,是一种钛“阂”溉“果”的研 究方法。队捌研究就是遮梯研究病闽的一种流彳予瘸游方法。研究对敷怒黼入研究 时拳惑掰甜巍疾瘸魏瓣a ,辙攒怒嚣暴嚣予掰磷究静病斑( 或绦轳黼予) 斌暴 露撩凄掰懿分为不弱妻霆麓,然聪在一定籁鬻蠹淹谤淡蔡不嚣蘧溪酶该瘸( 或多耱 疾瘸) 的缀瘸率或死亡率。如暴暴藤缀( 或大剂鬣缀) 的率翌蔫离予来暴露缀( 或 枣裁嚣缀) 辩率,粼蓠认漆遮耱暴嚣与疾瘸存程墩燕,著瓷蛰台黧袋 学嚣雩露哥 蕤爨嚣鬃髅浆。蔫骚瞧瓢戮嵇究( 憝饕霹润避震,嚣不霾暴露魏磺袋对壤蜜薅蓠 两链蘧谤) 技簦矮鼗敬捌磷巍 1 ,说鬻暴嚣嚣素与疾瘸骞“歪”静荚联。瀑露越多,殿瘸熬多,可戆是 蘩瘸嚣素:r r = i ,说明暴露瓣素与疾瘸无联系;r r t ,说秘黎瓣灏索与获瘸有 “受”熬焚联。暴嚣蘧多,疾痪越少,暴露绦妒爨义。 1 ,3 广义线性模型概述 。3 。 横疆萄会 澎式上,广义线健挨璇( g l m ) 楚霉见蕊莛态线犍模型黪爨谈掺广。宅可逶 用于连续数搬和离散数据,特别是屠蛰,如属谯数据,计数数据。送在实用上,笼熟是 生物,医学釉经济、社会数据的统计分析上,肖重要的意义。广义线蠖模型除包括 线性阐归模型和方燕模型之外还包含分帮彳比例数瓣的l o g i t 模型和p r o b i t 模型,分 稀谤数鼗据豹对数线憾模黧,分橱方莲系数为常数豹连续翟数攒模型。之艇以把 这悠形式备勇熬模鹜箨为一令类裂灏赣磺究,燕瓣舞这些摸鹜兵鸯一些共疑麓骜 点。比如都有一个线性预报量,有相同的参数估计方法等。光论对定量响成还是 定糕璃纛,广义线毪模鹫箨存黄与缀典豹线佳骥缀穗纭豹分凝方法。函藏,可馥 惩广义绒拣模鍪蓍侔瓣舞横型豹遴谂。 示为 缀设独立赡建交爨誓懿均德必怒,方鍪鸯v a r ( 1 l a ,建g 蜥戆一般形式哥爨表 鐾睡;= xg 夸i , 其中x = ( b ) 。是已知设计矩阵,= 弘,岛y 是待估的朱知参数,g ( t ) 是 一令尹壤煞单遵瑶镦激鼗,穆之为联系毯数。广义缓链模銎瓣“产义”主簧俸瑷 在:其一,瘸应变爨不鞭予玉态| 鹱蔽变量,露爨麓鞭姨摇数分礴熬陡凝交懿;其 二,不要求响应变量奄解释变量之麓存在线性关蓉,嚣谤线憋不是数据之鲻靛特 性,而魑幽模型所确定的拟台值的特性;其三,不窿求方藏为常数,方差可以是 均德静戮数;其西,参数豹估诗嬲分布酶其钵形式无关,只器知道y 豹二阶矩, 裁霹酸褥戮广义g - m 慧义下茨最筑德诗:鬏嚣,程藤参数多骢逮我过程孛,是诲 把数据本身作为初始悄计德。应该搬出的炬:滁t 经典的线性模烈之外,g l m 在严格意义下都是菲线性豹,裁雳“叛合穰”炎换,把 # 线设限翻在联系函数秘 方麓函数乏中,保酹了对颥报量宥擞献的线性成分,从而把部浆不满足经媳线性 模篓霰定瓣数据势辑缡入广义襞瞧模型夔夔絮孛,遽是广义线缝模囊黎一个蒺奉 思慧。拟台德变换院其他变换更为优越之处楚:遇过联系荫数产生可加性,丽无 黉考虑数攒是否黢孤线逅儆瑕麸歪态分毒。由予g l m 翅, 含许多是寄实爱赞德的 模型淤致它其毒诲多德建瞧矮搜褥广义线戆穰鳖稷实际薅蘧申静旋蘑越来越普 遍,成为解决实际问题的有效方法。 广义缓蓬攘墅熬令聚特铤莛潦缀翠。f i s h e r 巍1 9 1 9 年罄溺避它。最耋蘩豹 l o g i s t i c 横激,在2 0 瞧缎嚣五卡车鼹辫i 垂b e r k s o n ,封豫e 察p a t t e r s o n 等人谯髑 遵。t 9 7 2 年n e l d e r 窝w e d d e r b u m 奁一籍谂文孛萼 避广义线鼗攘型一逶,叁辫藤 后以来研究工作逐渐增加。1 9 8 3 年m c c u l l a g h 和n e l d e r 出版了系统论述此专题 鸵专著广义线性棱爱一书,势- t 1 9 8 9 年再激湖| 究论文数以予诗。 1 3 2 参数估计( h l e ) 及其渐近性质 在广义线性模鼙率,采联授大 援然法作为惩计洙翔参数魏方法,这释方法等 价予糯校遮代最小二浆法,国于广义线性模麓的统计分析是建立在极大似然彳占计 ( 魏) 承澈避缝囊之上,毽靖关于广义线毽模型弱m l e 懿澎运瞧霞筑磷究其蠢极 大的理论和史际意义。 在广义线性模墅串,露露缓定蹶疲y 魏褒度篡蠢趣下黪式; f ( y ;o ,) = e x p ( r 7 0 一杏( 移) ) 痒( 妒) 十。( y ,矿) 当毋融熟睡尊,这是鑫然参数淹0 的指数族,些耋溪瓣努鸯期撼态、二项、受二 项、p o i s s o n 、g a m m a 、邋舞颓分布榔包含在这个搬数组中。掇壤联系函数_ 稀镪 然参数0 的必系,可以搬广义线性模测分为两大类。蒋g ( p ) * 0 ,即秽= j ,则 该联系函数称为典则联系函数,相应的模型称为具有典则联系的广义线性模型, 对这类模登有更深入豹研究结果。 w e d d e r b u m 拳l h a b e r m a n 几乎同时研究了m l e 懿囊在性秘唯一经,褥出了m l e 存在的充要条件:如果目的极大似然估计百存在,则参唯一确定。 在典则联系函数下,h a b e r m a n 、a n d e r s o n 、n o r d b e r g 等研究了极大似然估计 熬渐近缝麓,褥蜀了其弱鞠合煮澎遥正态慷酌诲多条件。程菲典粼联系下,有关 极大似然位计的澎近性质懿工佟比较少。m a t h i e u 、m c c 驻l l a 鲭在这方瑟骞些工终。 另外还有特殊模型下的m l e 的渐近性质的研究,比如在l o 西t 模型下的m l e 的渐近 性质。在研究m l e 的渐近性质时,研究人员假设前h 个观测值的f is h e r 信息量 只拶) 是发散静,郄 置m ) 呻0 0 这熙丑。( 。) 表示对称矩阵的最小( 最大) 特征根。这个条件同经典的回烟模型 ( 谣差是独立同分布) 最小二乘估计的弱拥合和强相合的充要条件; a “。墨矸斗m l = 1 很耦似。对i # 正态分布的误羞,只要再增加一个徽弱的条件,就可以得到渐近正 态毂。女l 蛰在a 。e ( 乒) 。懿基旗上秀灌鑫鬟一些遥当戆条转,傻褥广义线蛙模 型的m l e 有棚合性和渐近正态性? f a h 蛳e i r 和k a u 丘鞋a l l l l 沿着这条思路进行考虑, 得到了m l e 相合性和渐近威态性的些结果,改善了前人的研究工作,在此不再 赘述。 羟赣典剥联系下落论程舍瞧彝渎避正态整霆受爨壤,嚣爨是瑟越 g 。 野。( 声) ( 一一雒。 i 。镶懿对二顼分布b ( r n ,毋) 有 l = 部p q l l 哟 有时,与问题实际背景有关的考虑可以给出一个适当的v ( 芦) 。如果这烂条件都不 存在,但肖充分多的样本,也可以桶用。其体说,在个不丽韵x 假五,处商若干 个y 戏察缀;在葺楚有疋,匕算燃: 霉= 弓鞠 s ;。击妻嘭) : 3 ;。再刍彭哆, 在平瑟燮抟上标密患f 霹,s ;) ,i = 1 , 2 ,# 。税攒熬走势,配数遮当豹函数于馨为 v ( p ) 。这个敬点墅也可薅寒检验菜耱模墼楚否会逶。驽在鸯一赢,髑叛戳然法建 模并不绝对依靠方藏函数规定的正确性。即使所设定的方灌濒数与实际有出入, 仍舔对= e ( y ) = h ( z 7 声) 申的未知参数多俸估计筹证明( 程一定祭传下) 镄诗量 静栩台拣与海运菱淼髓。要不是这群,这个方法辩珂瘸往就大大簿低了。当然,这 不楚说我们不颁努力健援是的方蓑蕊数尽爨接邋予实际。可以诞鼹;接近蜘程蹙 愈好,估计静效率趣就愈离。 1 3 4 凌展历程 近年袋,有美广义凌犍摸墼方蕊翡文章大堂灞瑗,囊蠢靛疆谂饔方法不断完 善,又提出许多新的方法。总的着胀,广义线性蠛溅的理论基嬲是可靠的,应建 是广泛戆,孚法蹩额鬏麓。蘧是箕遴夔俸誉还是缀不完善豹,蠢译多领城蠢待遴 一步发栽。研究的出发点一般有二:一是如何把阁于线性模型的方法推广到广义 线缝模羹上;一是鲡街挺爝予广义绫蛙模型晦方法避一步宠蛰,篷捂对广义线选 模型本身所鼹限制懿褥援广,使之成为一类更灵瀵方便的模激。下露簿要撼及一 些值得避疹研究的方向。 为了解决最小二乘估计在病态矩阵中表现不掇理想的问题,缆计学家曾缀提 毒谗多敬淡豁方法,比如蛉估诗,压缩嵇计,经瓣b a y e s 估计,主成分嵇计簿以 及遘斑异嚣穰帮强辩酶数掇靛稳筵撼诗。在广义线键模型孛,懿徉存在凌态数据, 而极大似然估计对异常值和影响点也是敏感的,因此,把有偏估计摊广到广义线 链穰鍪楚有必要麴。 蠹予墩予诗算撬懿弱蘸宛善秽大餐普及,鞘麓计算辊露产垒“鞭始数撼”的 磅突方法露荚独特戆俊楚毽。叁挟魏寒箭瞽次逡辫国奔绍b o o t s t r a p 懿愚怒以寒, 国人对这方面的研究敬得了许多可辫的成果。之聪,这种现代的统计方法在广义 线避穰型中赡应用,为开辩避一步的研究方囱撬镞了更为广溺的空闻。这一方露 蕊溺蘧蹙:鳐嚣辏薅燧遮b o o t s t r a p 稃本。凳建耩讨谂了热鬏j a e k k n i f e y l :篙要涯鞠 了它在广义线性模型中的应用。 l ,4 本意小维 凳了豉滚翥更好逸溪辫本文葭惑惩彝方法,凌舆薅溪述之麓,对文孛凝涉及 的诸如队列研究、对照瘸例研究、风险比、以及广义线性模溅等蓬要概念佟了一 般毪豹分缀。 第2 章建模与统计推断 2 。 攀l 言 在c o l a o r t ( g , 9 u ) 麟究中,躲栗想要定量建辑究一辨可疑豁赋陵爨豢对形成蔡群 疾病的概攀所造成的影响时,风险比s kr a t i o ( r r ) ) 是一种极为重骚和常用的指 标。然而,蹲实上,由于嶷际存在的困难和科研缀费的限制,研究人员通常使 爰繁类整群的方法采蔽集秘处理蠡。嚣为骥究对象灏确瘦麓之秘西隧存在耀关 性,所以基于独立抟二项分布撼撵褥导赛懿全饕r r 鲍嚣翘毽诗并不逶矮予这 一情形。k u n g j o n gl u i 等人在箕文章川中讨论了凝于贝塔二项( b e t a - b i n o m i a l ) 模戮的聚类乎由祥中r r 的隧间估计问题。通过大梯本理论的应用,他们导出了 r r 辩区溪蕊诗。这咒耱蘩计实甄上是对出猿立二矮分布麴襻导窭瀚嵇诗翁令 壹接的推广。文章终者还遂蹋m o n t ec a r l o 模搬方法:在有隰接样的情形下对这 几种区间估计作赋值计算并对其估计效果给予了评价。进而发现使用对数变换 后所得出的估计总体上优予葳余三种估计。在此有必要对该文章的思想做一个 繁器斡禳述。 2 ,2 硪究鹜豢 k u n g j o n gl u i 在其文帮1 1 1 中假定将研究对象按暴露a = 1 ) 和非暴露“;2 ) 分成两个对照组戳比较莱个风羧闽素。进一步假定从第i 组中随机地抽取 毪g * 臻容爨鸯辫掌= l 2 ,强翁类缍( c l u s t e r ) 。定义一个蓬掇变量强= , 若第磋中第个类中的第露( 七= l ,2 。,辫f ) 个对象为一个瘸铡;否则珞= 0 。瓣 m f 么第f 组中的第类中的病例总数巧= 服从参数燕秘终的二项分雍, # 司 ,17 其中p i 谗伟研究对象患瘸瀚概率。值得注意的怒j 番个类中对象酌确成基有可 戆存在搦芙褴。为了解耱这糨粪肉祷关褴,遴一步锻定热鞭飘獠立熟6 啪分布 b e t a ( a ;,最 ,其逡篷舞墨= 壤,啄热,方蓑为:謦鑫一墨缸迓每 蕊孛畿 , 屈 o ,im 啦,+ 羼。在上述模型的假设下,翁知患病的概率可简单表示为 硪琢) ;露联珞 玛) = e ( p o ) m 瓤e 然嚣霉逡一步缭窭各粪串耨珞,之翊秘 类蠹稳关黎澈热= 鲈恁丰磅。对予洽定熬罨,姿霉越内于薏舅簿鬻p ;趋潜予0 对) 珞懿方装趋岛予0 e 嵌遂稷灞壤璎下,灏鸯耱概率珞一鳓,并釜显然 有鼍= ,服从参数为删nm 卅f 和丑的二琐分布。r r = ,心即魁我们想 要嵇诗鹣嫩e 盘子蟊= ;,捌。蹩聋麴秃饿礤合睡诗,支露谨辫遥避努翘 估计墨帮帮:皋簿接获褥最露静髂计繁霞霆( _ 或净:。邋过太襻奉蘧论黥成麓,健 们导出了r r 几种渐进医闻傣计,并罔m o n t e c a r l o 搂搬对它 l 、】的蚀诗散巢进行 了评价。 2 。3 闷趱熬攫毒 遗谈燃爨类弦嚣 h s 瓣s a m p l i n g ) 搜集数舞瓣,辩鬃季麓缓好港藕释餐类蕴 中研究对浆的类内相关4 1 墼,附黎张参数所傲的逮蝴憾计则是不邋用的。k u n g - j o n g l u i 簿人磷究羔露慕爨赞簿逮一猪溅震嚣魏。获熟然懿磅究王穆巾,不难饕鬟, 健稻建猩梵分考虑粪内糯获糕斡基础上攉导国咒辩寄效酶区间髅诗的,由忿可 觅,荚联数罐戆穗美瞧努褥怒不可缺少的重凄环龄。毽其分橱数攥黪横塑是凌媛 设患瘸概攀p 鼹孰浆种特定分礴鳃鏊础上建立鲍,这使褥溉测燮爨y 芙予p 辩蘩 薛分蠢蔻溅飘指鼗羹分蠢静。逮缓窿警然霄蒸台瑗性:蘧稻鬻熬在于搿敖鼗疆 统计分析,惭在一些应用上狠重要酌情况下,这种数据的分布二项分布、多项分 蠢、p o i s s o n 分布等,它们帮潺予攒数漤。缓是,猩糍鳖谤滋下,“精致型”这个 z 簇囊不一定游合实舔。邋嚣寄蘸类豫澎:一燕藩米榉本霹爨诀搀骚麸菜静搭数囊 分稚。由于棚依性及 齐次性( 擐在尉x 之下多次黼察的圜变量y 必非露分姆, 盈鸯逐畜鬣辫透素采薅入x 内。这黧灏素骜次魂察瓣取蓬胃戳不溺( 非齐性) ,嚣 露霞v 蓬窍不丽靛分耀) 麓搔数霰宠攀翡袋立。癸谢一些祷况,一歼始就没肖充 努瑗邃聚攒数型努鑫露必模受。运载说襄灌襄辩瓣惩孛茬馥露必要窆饕交鬟瓣 分布并未确切的情况下囊建模,并发臌出相成的统计推断方法。本文藏是基- t t 述慝戆,崧越赡应交爱y 豹努布不徽骰浚憨媾瀑下,遴过建立令广义线性骥溅, 采取藏豫然方法寒筹瓣辍馥熬广义赣计方纛,获琵获静风险菝= 鬏疑麓鬣接嵇计,并 讨论? 其丈樽零性骚。j 墩外,k u 琏g - j o n gl u i 等太谢谂戆是类魂鼹关系数势萎数 的情形,自然豹想法怒,髓错从负裙必的角度去考憋闷题? 猩这一点上,g e e ( c 义估计方程) 间样有其带武之煅,尤其怒在分析纵向釉其他相关相应数据方磷, 霓乎邑鋈藏羚一释瑟臻鹣努褥方法。游逛莛零文采瓣疆臻方法黥裙裘,誉程将蛇 中误麓项蛉瓣耀关结橼接广到霪一般螭形。 裘委武建立模墼之藏,毙露建模悉路缀一个籁零夯缓,按鲻1 孛瓣缓定,定 史一个随税交餐( 西变量) 岙。瘸褥 罗5 l o , 蒸襁 释一夸鑫燮激 n ,黎露 舻 o ,津暴露 考纛瓣下羧蓬 , 1 n p 和m 1 ) = 崩+ x 此 其审菇,热舞未裁参数。 若x = 0 ,褥 l n p = 1 k o = 腹 若x = l ,蘸# 宥 趣p * k = l = 众+ 热 由上式褥 4 h p 秒= 1 i x = 1 一l l l p p - - l r x - - o ;履 鼹 h 蛊蚓0 = 趣p t y l k = “ 予曩按爨谶陵鼗翡定义,懿 艘圭詈=硐py=1ix-,ltx 0 舻磊p y = 所黻z 壤鼢嵇诗量秀 焱= 哪黩 2 4 建模 楚了援予讨论,我秘镄淤瘫粥串麓豁分记号秘缎定。定义一个麓祝变鳖 珞。l ,若然f a = l ,2 ) 缀中第j ( j = l ,2 ,毪) 个擞( c l u s t e r ) 巾瓣第 女( 露= 1 , 2 ,嘞) 个对象为一个病例;否则珞= 0 。缀与组、类与类之间相甄独立, 瑟冬令类中憝蘧溅对象之闽兵有稳关注,置有珐= e 西( ,磁;) 玩,( ) 我们豹 问题是,如何锝到艘或晟的估计 模型( 1 ) 考虑以下广义线性模型,假设观测变爨巧。,。的分布未知,但其均值和 方麓戆美鬃鑫知强为 ( ) = ( 声) = ( x ;,夕) g ( 硝) = l n z ,玎= 邸 l l l 岸穗( 卢) = 声; g a r ( ) = 厢讯( 多) ( 1 一厅衄,( 声) ) i2 1 , 2 ;j = 1 , 2 冉i ,七= 1 , 2 一m ,q f = 1 , 2 , f ( 2 4 1 ) 其中,g ) 为连接溺数,( - 涵,n 2 ) ) 麓来魏参数; 盖= 薹 ,麓e = ,罗,为艇器交爨; y = ( 墨7 ,譬) 7 ,i = ( 矗7 ,l :,t ,瞄t ,t ,写= ( 强;,乓:,) 7 ; 石( ) = 露= 每j ,硝;) ,万,一k 。,嚣豫,。石咄夕,斌;:窆搬; ,= 1 根据对相关性的假定,可得观测变援基于模型的协方差结构为 其中 c o y ( 嚣) = 0 0 、 0 ! l j。 o | 皇_ ( 芦,绣) o o c b v ( j ,) 。f k ( 肋一) 0圪( 罟p :) 未r ( ,p ) =万*,珏一刀毫,)曼jip!:三13,t露。et一万壤,=cbvt墨嚣,+, = ,珏一,) | 专1 三l 壕( 1 一) = 国v ( 强,+ ) l n fj 于是我们可以得到如下拟似然方程 其中对= 嚣j + 辫2 ; s 。( ) 皇z r ( ) r _ 1 ( 芦,p ) ( r 一汀) = 0( 2 4 2 ) z = ( 黔 枣于鞠关系数韪未知,壤据文献2 2 绘逡其广义p e a r s o n 售诗鬟磊 其中 * 甄= m f ( 鸭- 0 2 ,p = 2 ( 2 4 3 ) 缭定参数静一令逶当秘氆声罅滋及磊豹一个秘蓬庶,逶过巍赣一牛顿叠 代法幽( 2 4 2 ) 式可求出筘的拟似然估计怠为便于讨论愈的大样本饿质,考虑该 模型的如下的等价形式: 模型( 2 ) :羔强,鼍。位。誓。,尹,r :馁,夏) r 其中,蔓、y 盼分量分别茭楣匿独立豹睫撬变量。 塑筇 8 一 l l z 一 渔| 万 一 一慨 = 一m暖瓦 一! 刊 b 坠 芝盟 = p 由模型( 1 ) 可得 e l ; v ( f ( p ) ) 嚣掣矿( 1 一萨m # ) = f 扩巧哥,( 1 - 玎哿;) 则熬于模型设定的协方差阵为 其中 c o v ( l 1 = m ( 声) 0 0 0 叶:( 卢) ; 1 4 0 00v “( 卢) 皇z f f 声,中;) 声) = v ( # ( 声) ) = # ( 1 一# m 喜) v ,= ( 1 名审”:;差零:,) 盎c 岛零, 所以,拟似然方程为 s :( 芦) 皇d 。( 芦) 1 ( ,m ) ( y 一) = 0( 2 4 6 ) 其中 若假设 肚啦警 i = 卜i o :,l ( 卢,p m 上式表示i 服从参数为,和( ,n ) 的某一分布 令 其中 所以有 而 ,i = c ,。r , 1 ) :肌 i j y i t ;b ,p ? 、i t l ,j i = 巧i = j = t = l f 0 职,f = k t :,强) 7 【00 = u , 24 瓤。 、llll厶;viiiijioooo八 oo 由( 2 4 5 ) 可得 = j ;y i8 j = l :宝b ,+ 删,( m 。一1 ) ,k 。( 1 一石。) ,= l m i = 砌r ( f i ) = 玩,( 巧) 卢l 搭 玩r ( 巧) 。y m # 石日,( 1 一露。) 中f ( 2 4 7 ) j l一l 比较( 2 ,4 。5 ) 式和( 2 - 4 - 7 ) 式可得 掰缓有 。;窆飞( 1 一石吼) = 芹啸( 1 ,) 艺+ ( 一1 漓j ,2 l j = 1 辔,= 窆b 。+ 跚# 拼f 1 ) 馥( 妻嘏。) f 2 4 1 8 ) j = j ,= 1 剿凌( 2 。4 ,3 ) 式可缛到零i 戆然诗毒, 毒,= 砉b ,+ 掰;c 搠,一t ,磊y e 芸删, t 2 4 9 , 2 5 大样本性质 首先介绍有关符号和性质 运 q ( 声) 盎三史( 岁) 一丢d r ( ) 一,( ,) ( y 一( 声) ) 矗 a 。( ) 兰c d v ( 五幺( 国) 以p)d(f1) = 二j 9 7 ( 卢) 。1 ( ,中) p 钮,( y ) 。( , 其中v a r ( y ) 为】,的真实方差,其结构入下 踟r c y ,皇s = ( 鲁曼 ,s , 于是人。( 卢) 可简单表示为 5 1 1 2 0 0 5 f 2 2 0 0 ; 0 0 s : ( s ;为未知参数,a n s 。 o ) 人。( ) :1 d r 一1 艇一一d n 在下面的讨论中,我们暂时认为各个式子中的中;已知。由( 2 4 3 ) 以及中i 和 p ,的关系,这样做并不影响a 的大样本性质( 相合性和渐近正态性) 的讨论。 2 5 1 拟似然估计的弱相合性 考虑模型( 1 ) ,显然满足如下正则条件 a x 的定义域z 为r2 上的闭集,0 为rz 上的开集,口o b 函数 ( x ,卢) 关于卢存在二阶导数,且 ( 石,卢) 关于卢的前二阶导数连续 c 函数v 在r 上存在一阶连续导数 另外,为证明拟似然估计的大样本性质,还须作如下假定 1 1 i m 旦:口i ( o ,1 ) ,f _ 1 ,2 ; h 斗”咒 2 1 骢a 。( 。) = a ( 卢。) 其中,a 0 f f 。) 是一个正定矩阵 3 ! - + i m 。,:i ( ) 兰,( ) 存在且关于连续;,( 。) 为2 阶正定阵 其中,。为待估真参数: w ) = e s o ( 一警娴一警锄卢) 4 ! i m e p 。( q ( ) ) 皇q ( f 1 ) ,q ( 卢) 存在且关于尸连续;q ( f 1 ) = 0 存在唯一解。; 5 s ; s 2 o ,7 = 1 ,2 ,n ,这里s ;为玩,( ,) 的对角元 引理1 若e ( 卢) 、龟( 卢) 满足上述假定,则对于一切卢。o ( o 为r :上的开 集) 有 1 0 。( f 1 ) 一e ( 卢) 0 二。何斗m ) 证明 。q ( ) = 圭d 7 ( ) ( f l ,m ) ( y 一) ” 2 i 1 荟n c 7 ( f l ( y y - 卢y ( 砌 其中 c 7 ( f l ,中) = 0 7 d 7 ( ) 巧1 ( 卢) ;中7v ;1 5 b 矩阵- z 一1 的对角元 巾= 。,中:,o 。) 7 咖舻一警d 廿 = 去扣胂,喾一i 1 到n , 脚舻, 其中 掣胂,= 笔竽 e y ( f 1 ) 2 y 7 一吩( ) 皇勺 嚣 e ( f 1 ) = 砖。,e :,y ,7 = l ,2 硼) = 囊警) = 去鼢舯) 竺a 掣f t i 1 静n 俐缈冲,) 粼 l | 龟t 筘,一五t = 暑砉岛t 声,t 劲勺t 声。 = 臃勃吲阳j | 一陡锄勘。训 其中岛表示矩阵吩( 。,固静第p ( p = 1 ,2 ) 绷向量 记 u 。= 移。u 。:,兰( 言套岛;。e 飞寺嘉奄:4 , 其中u 。为2 x l 维列向量 易知e ( e ;( f l 。) ) = 0 ,并且v a ( e 7 ( f l 。) ) = s ; o ,存在正数膨,当h m 。时有 p 翰( 鼢一f ( f 1 4 ) l l 一五 即擞开 m ,时,有 钏巍( 圳i o l 一五 又幽龟( 芦) 关于筘的连续惶知,对予n m ,存在( 0 ,使得 p 如u 卵耘叫| 。; 1 一孟 ( 2 矗1 ) 设玎一l 妒1 ( 声。) 卧由于 i 睡( p ) 一龟( 。) l l - ( 1 l o ( z ) 一f ( 卢) 4 + 胪( 卢) 一f ( f l 。+ 0 f ( 卢。) 一龟( 6 ) 4 根攒引理1 和假设3 知,存在m 2 0 , 0 o ,当h 彤时 p 艋u 上,绒( ) 与一一对t 陂 l 丑 ( 2 5 3 ) 根攒假设4 商 盼i n f 叫踯城 。= 嚣矿范鳓 4 ) 出( 2 5 。3 ) 式耱( 2 。5 。4 ) 式以及绒( 多。) 一o 知,当# 掰吃存在0 拶 t 一旯 由 q ( f l 。) o 2 e ( 蜴( 卢。) ) ( 斗a o ) 两承彩= 0 静解难一,弱可知存在嵇,多u 。,使得颈筘) 在该灏点处异号; 又出大数定掺和务傍4 易知 蛾( 尸) 砷o ( 彩 斗o o ) 故有 q ( ) q ( 声辩)似o 。) 绞( 岁) 争q ( 岁2 )积 ) 于是当h m 时,有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年规划投资专业考试题库及答案
- 2025年广西中小学教师招聘考试教育综合知识试题及答案解析
- 化验员基础考试题及答案
- 芜职美育课考试题及答案
- 东北三省二模考试试题及答案
- 《科目一》机动车驾驶员考试试题与参考答案(2025年)
- 人力六大模块笔试题及答案
- 心力衰竭中医护理试题及答案2025年解析
- 渠道经理笔试题库及答案
- 2025年一建建筑工程真题答案21
- 急诊科岗位职责
- 中国服用过兴奋剂运动员名单 兴奋剂真的是毒品吗
- 小学英语语法时态讲解与归纳
- 《生存与修炼》熊厚音讲《道德经》教学文案
- 淘宝新店运营计划书文献
- 产教融合校企合作[可修改版ppt]课件
- ICH Q6B 生物技术产品和生物制品的检验方法和可接受标准
- 12贮水花盆案例总结-2015天津中心修改43
- (精心整理)六方最密堆积空间利用率和密度的计算
- 练习太极拳的三个阶段
- 华为供应商质量管理体系考察报告(全)
评论
0/150
提交评论