




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在生物医学研究中,常常对同一个个体的多个指标在不同时刻进行重复测量,得到的测量 值般视为多元纵向数据因为多个指标之间具有相关性,所以对多元纵向数据进行联合建模 分析,势必会比分开建模分析得到更多的信息本文的目的在于处理当响应变量值是连续型和 有序型时的情形,用个潜在变量模型来描述此类数据,得到广义线性混合效应模型,并假设给 定随机效应,观测值的分布是条件的独立的,通过数值积分的方法求出边缘似然的近似值给出 参数的极大似然估计 关键词:多元纵向数搌潜在变量,l o g i s t i c 模型,数值积分 a b s t r a c t hb i o m e d i c a ls t u d i e s ,m u l t i p l ei u e a s n r e so fl i f ec h a r a c t e r i s t i co f t l e ua r er e c o r d e do v e rt i m e ,s u c h m e a s u r e sa r ef r e q u e n t l yc o r r e l a t e da sm u l t i v a r i a t el o n g i t u d i n a ld a t a j o i n ta n a l y s i so ft h eo u * 。c o m e s v a r i a b l e sh a ss e v e r a lp o t e n t i a la d v a n t a g e so v e rs e p a r a t ea n a l y z e s h e r e i uw ep r o p o s em o d e l sf o ra n a l y s i s o fr e p e a t e dm e a s u r e m e n t so nc o n t i n u o u sa n do r d i n a lv a r i a b l e sm e a s u r i n gt h es a m el a t e n tt r a i to v e r t i m e a s s u m i n gc o n d i t i o n a li n d e p e n d e n c eg i v e nr a n d o me f f e c t s ,w eo b t a i nt h em 砌a l l i k e l i h o o d d e u s i t yu s i n gn u m e r i c a li n t e g r a t i o n ,t h e nt h em a x i m u m - l i k e l i h o o de s t i m a t i o n k e yw o r d s :l o n g i t u d i n a ls t u d y ;l a t e n tv a r i a b l e ;l o g i cm o d e l ;n u m e r i c a li n t e g r a t i o n - i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名:兰盘盎 日期: 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:兰盘丹 指导教师签名 日 期:洳;62 , 日期 学位论文作者毕业后去向: 工作单位:立益聋盛空! 控 通讯地址:享酗至摊建享堡掳燃i 盟巷 电话:p 2 皇= 照! 0 7 t 字4 邮编:皇立笪芝 1 引言 纵向数据研究在生物医学统计中处于特殊的地位,这一研究主要用来分析一段时间或某几 个时间点总体的平均增长趋势和个体之间的差异也就是说,对于纵向研究设计,主要关心两个 问题,个是描述总体的平均增长趋势,另个是用来描述不同个体之间增长趋势的差异,详细 介绍可参考p j d i g g l e ( 2 0 0 2 ) g m f r z m a u r i c e ( 2 0 0 4 ) 我们知道,处理元纵向数据主要有三 种模型:边缘模型,随机效应模型和转移模型( 如,马尔可夫转移模型) 在边缘模型中,对边缘期 望建模,它是原因变量的个函数,并且它的已知连接函数是依赖于原因变量的线性函数,方差 函数可以用边缘期望的已知方差函数与个待估尺度参数的乘积表示,个体的自相关性用边缘 期望的已知相关函数表示在随机效应模型( 又称潜在变量模型) 中,因为个体有其自己的特质, 设为潜在变量,且服从于同一个分布,从而体现每个个体在不同时刻的观测值是相关的在转移 模型中,主要指马尔可夫转移模型,当每个个体不同时刻的响应变量符合马尔可夫性时,可以考 虑该模型针对数据分析的不同需要,还可以将上述模型对照使用,从而研究起来更方便例如, 若研究总体的平均增长趋势,则侧重用边缘模型来分析数据;若研究个体内的增长趋势,则更侧 重用随机效应模型;若既想研究总体增长趋势,又想研究个体之间的增长趋势,贝4 可用混合效应 模型,等筝 然而,在生物医学试验中,所关心的某种生命特征通常是对多个受试者在不丽时间点的多 个观测指标进行重复测量这样得到的数据就是一个多元纵向数据同一个个体虽然不同的响 应变量之间是相关的,但是以往的研究者经常会将它们分开建模,这样势必会造成信息的损失 r v g u e o r g u i e v a & g s a n a c o r a ( 2 0 0 6 ) 的文章中对分开建模和联合建模有详细的阐述,联合建模 得到的估计往往更有效 多元纵向数据是每个个体在每个时间点的多个指标测量值,而不仅仅是一个指标测量值 这多个测量值,有时都是连续型的,有时都是离散型的,有时是连续型和离散型的都有对于每 个个体,这多个测量值本身因为是同一个体在同一时刻的不同响应变量,所以建模时,往往需 要找到各响应变量的内在关系,有时直接用参数联系,但这不能很好地体现出个体的生命特征, 所以将生命特征视为潜在变量并且服从一个分布,就成为大家喜爱的做法h z h a n g ( 2 0 0 3 ) 设潜 在变量来自二项分布如果这个潜在变量还体现了个体的自相关性,那么,还可假设这个潜在 变量服从混合效应模型如,j r o y x l i n ( 2 0 0 2 ) 利用潜在变量模型分析多元连续型响应变量; g m f i t z m a u r i c e n m l a i r d ( 1 9 9 7 ) ,r v g u e o r g u i e v a g s a n a c o r a ( 2 0 0 6 ) 以及m d s a m m e l ,l m r y a n & j m l e g l e r ( 1 9 9 7 ) 是对含离散型和连续型变量的多元纵向数据建模;d t o d e m ,k k i m & e l e s a i t r e ( 2 0 0 7 ) 是对多元有序型纵向数据建模 虽然r v g u e o r g l l i e v a & g s a n a c r a ( 2 0 0 6 ) 很好地对含有序型变量和连续型变量进行联合建 模,但作者是在将离散型数据连续化之后联合分析的,且用相关p r o b i t 模型研究有序变量,但是 相关p r o b i t 模型不能很好地体现有序变量的有序性,而累积l o g i s t i c 模型是在二项数据的l o g i s t i c 模型基础上推广出来的,对于研究有序变量又是很好的分析方法在本文 我们将会详细介绍累 积l o g i s t i c 模型的用处 本文不将有序变量连续化,而直接用累积l o g i s t i c 回归模型给有序变量建模,通过潜在变量 模型作为有序和连续响应变量的纽带,联合分析为了更清楚各参数的意义,本文j 丘过r v g u e o r g m e v s g s a n a c o r a ( 2 0 0 6 ) 的实例,先对连续型和有序型响应变量分开分析,再对它们联合分析 然后求边缘似然,从而得到极大似然估计对于有序型响应变量和混合响应变量的分析,求边缘 似然用数值积分的方法求出,并类似求出对参数的一阶偏导向量和二阶偏导矩阵,再利用牛顿 法迭代得到参数的估计 本文采取了含有潜在变量的广义线性混合效应模型,对含有有序变量和连续变量进行联合 建模特别对有序变量的分析要优于r v g u e o r g u i e v a g s a n a c o r a ( 2 0 0 6 ) 因为累积l o g i s t i c 回 归模型在分析有序响应变量时优于相关p r o b i t 模型,优比可以更好的反映有序变量的有序性。 并且在参数估计上假设条件比她的宽松在随机效应的处理上,我们重新对它们化简,从而求边 缘似然时容易了许多求参数估计时,利用牛顿法迭代也可得到很好的估计 本文的结构如下,在2 中给出模型的定义和性质,并重点介绍累积l o g i s t i c 模型;在3 中, 给出联合分析的参数估计;在4 中,将以r v g u e o r g u i e v a g s a n a c o r a ( 2 0 0 6 ) 的数据为背景,对 含有有j 芋型变量和连续型变量的多元纵向数据分析和建模,并给出相应参数估计的算法;最后 一节将对本文的方法进行总结和讨论 2 2 模型建立 。 我们假设所考虑的多元响应变量是对同一潜在变量的不同描述,用啦,表示第i 个个体第 j 个观测时刻的潜在响应值 它反映了研究者所关心的某种生命特征在本文我们将讨论用一 个潜在变量模型来刻画多元纵向数据 令 挑f = ( u i l v ,挑h ,玑v ) t ,t = 1 ,2 ,一,m 表示第”个响应变量在个时刻的重复测量值,不同的”描述此生命特征的不同方面则 有肌= ( ( 鼽1 ) r ,( v i 2 ) r ,( 们。) r ) 7 ,表示第i 个个体的所有响应值 在本文我们主要考虑响应值为连续型和有序型的情况,不妨设第1 , 2 ,m 个响应变量是 连续型的,第 l + 1 ,m 个响应变量是有序型的 对于每一个有序型变量,它有观测现象的内在趋势,用吃。表示,它不能被直接测量 当p = t j l + 1 ,m 时, lc 1 。,当蝣。n 。时 蛳:卜,当 喙锄时 蛳”。 。 【2 1 ) i : : 【c 凰,当r k v 1 。 蝣。时 这里我们用1 , 2 ,凰表示第”个有序变量的凰个有序型类别,不妨取( 锄。= c t 。) ( 聊v = ) ( 物v = ) ( 物。= 。虬) 用n 。,您,吼。一1 。表示分界点,且有 力” 仡 ( 2 6 ) 可见在模型中,我们加入n 缸可以更合理的表达相同变 量在不同时刻的相关性大于不同变量在不同时刻的相关性;以及不同变量在同一时刻的相关性 大于不同变量在不同时刻的相关性,即,能更好的体现多元纵向数据的相关性 因为每个个体在每个时间点的第u l + 1 ,m 个响应变量有序列关系,所以数据分析时采 用l o g i s t i c 回归模型分别表示这些响应变量的模型,第口个响应变量包括鼠一1 个累积l o g i s t i c 函数,并对其进行估计: l n 【者】 2 鼬l - + 风1 + o 4 ” l n 【糯】_ 觚+ 风1 u j + a l ” ; l n 【孽】:鼬肛l + 风1 地 其中,吃j 表示蚴”= = 1 。,2 一,甄) 的概率,且乐l 。= 1 以上( 甄一1 ) 项 l o g i t 为基于累计概率的累积l o g i t ,这些累积l o g i t 分别为聊。= c l ,对洳= ,物。= 。凰 4 的对数发生比;蛳。= c l 。或。= 对蜥。= ,聊。= c 的对数发生比;i i # 。= c l 一,弼。= 一1 对蜘。= c 凰的对效发生比 这些l o g i t 可以用个公式表达: 1 0 9 l t , r l 加”纠叼川】一【毒畿兰券舄】 ( 2 s ) = 反n k ,+ 风1 + ( = 1 。,凰一1 ) 对于第i 个个体,累积l o g i s t i c 回归模型对凰一1 个l o g i t 中的每个l o g i t 各有一个不同的 犀k 估计,然而对所有的累积1 0 9 i t ,变量地f 却又有个相同风l 的估计因为其假设条件为自 变量的作用独立于所有累积l o g i t 的分界点( a 在这一假设条件下,对于个连续自变量u 材 而言,不同累积对数发生比的回归相互平行,只有截距参数有所差别正是由于累积l o g i s t i c 回 归模型更能体现响应变量的有序关系对于更多有关累积l o g i s t i c 模型参见h z h a n g ( 2 0 0 3 ) 和王 济川等( 2 0 0 1 ) 在本文,我们不采用相关p r o b i t 模型( 参见r v g u e o r g u i e v a g s a n a c o r a ( 2 0 0 6 ) ) 来研究含有有序变量和连续变量的多元纵向数据,在下面几节中,我们将采用累积l o g i s t i c 回归 模型单独分析有序型响应变量,以及联合分析含有有序变量和连续变量的多元纵向数据 我们可以将公式( 2 8 ) 化筒,因为 p ( 脚嚷。,) = p b ) = p 忙巧“7 h 一( a 巾+ 风1 2 十a 如) 】( 2 9 ) = f h ”一( p 知+ 风1 + q ”) 】 根据这个累积分布函数,采用l o g i t 作为对有序变量建模的关联函数,相应的条件l o g i s t i c 回归模 型 m g i t 加k ( 如”,啦”) 1 = 一慨m + 鼠l 地j + ) = 一鼬一风l 一= 1 。,2 ,凰1 )( 2 1 0 ) 对比公式( 2 8 ) 和( 2 1o ) 表达的足一个意思,所以方便记号,( 2 8 ) 化简为 l o g i t 防( 蜘sc k ,n i u ) 】= + 鼬+ 风1 坳十= l 。,2 一,甄一1 )( 2 1 1 ) 容易知遣( 2 1 1 ) 中的反m ,风l 和a 分别是( 2 2 ) 中的一肛i ,o ,一岛l 和一“如但便于习惯,仍 用( 2 1 1 ) 的记号,并且并不改变公式( 2 1 0 ) 的性羼 综上,多元纵向数据模型可简化为 5 ( 1 ) 当 = 1 ,2 , l 时,将公式( 2 4 ) 重新写成, 蛳= 鼬+ 瑶风l 什t 风1 b i + 啦。+ 晰 ( 2 1 2 ) 其中,蜘= 风1 q + 。,”一i i d n ( 0 ,吨) ,因为与。相互独立,所以参数伽并没 有改变原来参数的随机效应b l i i d w n ( o ,e 6 ) ,o 如一i n d e p n ( 0 ,以。) ,墨,砀是已知设计向 量,4 ,风- ,1 是待估参数 ( 2 ) 当= ”1 + 1 ,m 时,将公式( 2 3 ) 代入公式( 2 1 1 ) l o g i t l 吨,( 跏s j b j 向,q “) 】= + + x t g 。1 7 + 劭t 风1b i + 尻1 + 啦, ( 2 1 3 ) 其中,b i i i d f v n ( 0 ,e 6 ) ,一i i d n ( 0 ,口2 ) ,a * 一i n d e p n ( 0 ,畦。) 鼍,z 舀是已知设计 向量,n 。,卢如,风1 ,1 是待估参觌 6 3 参数的估计 为了讨论方便,我们只考虑含有个连续响应变量( 聊1 ) 和个有序响应变量( 黝2 ,其中,口浓 有k 个分类) 的平衡数据( 即所有变量在相同时间点测量得到的数据) 设( 2 1 3 ) 中的= k ,砥= 得到模型: y e j l = 鼬+ x 否m l ,y + z 否q # u b , + 啦! + 如1 1 0 9 i t ( 聊2 k l b l ,嘞) 】= 强+ 肠+ 砑岛1 7 + 刁岛1 b i + 虎1 e 巧+ 嘞 b j i i d m v n ( o ,z 6 ) ,啦l i i d n ( o ,程1 ) ,玎1 一i i d n ( o ,如) ( 3 1 ) q 2 一i i d g ( o ,。口2 2 ) ,一i i d n ( o ,0 2 ) i = 1 ,2 ,n ,j = 1 ,2 ,n ,k = 1 ,2 ,k 由j 陵模型的公式,通过积掉b t ,啦l ,d 蹈得到边缘似然,从而得到观测似然。设0 表示待估 参数组成的向量,则得刭条件似然, f ( 聊阻l ,啦“啦2 ,e o ;o ) = ( 聊l l b l ,啦l ,;口) ,2 ( 掣玎2 f 蜥l ,b i ,嘞,e 巧;疗)( 3 2 ) 其中,f l ( y q l b t ,啦! ,;口) 是聊l 的条件正态密度,条件均值脚l = m o + x 舌岛1 7 + 巧b n b i + n f l 条件方差碍 ,2 ( 1 幻2 i 掣玎1 ,b t ,n i 2 ,玎;8 ) = ( 丌骞) 7 机j 2 = 1 ( 丌豸一霄g ) 7 肌站= 2 ( 稿一”易) 7 2 2 3 ) ( 喝一”基l j ) 7 蚴2 ( 3 3 ) ( 1 一碟一l j ) 1 聊2 2 耳 在这里,表示助z 的条件累积概率, 碣= 嘞( 蜥2 l b i ,1 1 i 2 ;口) = e x p 0 k + 筋+ 码晚l ”召如1 b i + 勉+ 嘞) 【1 + e x p ( + 砌+ x 否岛1 7 + z t 岛i b ! + 岛l 勃+ 知) 】一1 观测似然, ( 3 4 ) l ( y ;o ) = n 兀g ( ;0 ) 扣= 1 f = l nn 0 = 且旦丘。l 。l 。正,g ( 蚴m t ,a i l a 2 s 蚶;日) ( 3 5 ) 7 r ( a ) 丌( o q 2 ) 丌( n f l ) 7 r ( b i ) d e dd a i 2d o ld b l 2 i n = lj n = l 丘tl ,l m 上u ( 蜥1 i b l , 嘶l ,;目) ,2 ( 蜥2 i 蜘1 ,b i ,啦2 ,;日) 霄( 巧) 霄( n t 2 ) 丌( o n ) 7 r ( b 1 ) d s 玎d 口妇d a i ld b t 7 于是,观测对数似然 m i ( 口;) = 圣三l n 丘l 。,l ;:正 ( 蜥l i ,啦! ,;日m ( 蛳2 l 蛳l ,b t n i 2 ,;口) t = 3 = 。 丌( e 玎) r ( a i 2 ) r ( q n ) 丌( b i ) d e l jd q 2d a l ld b i( 3 6 ) 于是,通过解得分函数嘉培= o 求出口的极大似然估计a 8 4 实例分析 4 1 模型化简 在本节,我们将以r v g u e o r g u i e v a g s a n a c o r a ( 2 0 0 6 ) 中的数据为背景,研究含有有序变 量和连续变量的二元纵向数据有5 0 个个体随机等份分配到两个组里,即个处理组,个对 照组,每个组里各2 5 人共有七周的观测,在每个观测点每个个体各有两个测量值,其中个取 值范围0 到9 ,作为服从正态点的连续变量处理,另个取五个等级:l ,2 ,3 ,4 ,5 ,是有序型变量 对模型中的量有以下假定,l 表示连续型变量,蛳2 表示有序型变量i 表示个体,j 表示测 量时刻指示变量j i 表示第1 个个体是否处于处理组,若个体在处理组,则取1 ,否则取0 个体随 机效应b i ;( ,玩1 ) 7 ,系数面= ( 1 ,j ) r ,关心的处理和时间协变量粕= ( 1 ,五,五i d , j 2 ,可2 ) 7 = ( 1 ,x ) 7 ,协变量的回归系数7 = ( 加,饥,舶) r 因为在没有任何信息下潜在变量的预测值可以认为不存在,所以设 7 0m - 0 于是有, m = ( 卢1 1 7 l ,m l ,凤1 ,角1 w ,岛l 舶) r 岛= ( 岛l m ,岛1 仰,励l 3 ,愚1 ,虎1 尸 由公式( 2 1 3 ) ,为了参数靠忙= 1 ,2 ,3 ,4 ) 可识别,设口如= 0 则, 因为风1 ,n m 岛l b l o 和咖表示的是随机截距,所以,令 a 1 = 历l + 啦l ,n 毛;愚l + 口住 ( 4 1 ) l 蜥1 = 鼬+ x 历+ a :1 + 卢1 l k l j + f 巧1 喝2 嘞( 聊2 鲫f ! “叼d 玉) ( 4 2 ) l = e ,中( + j 如+ 屹+ 如1 6 1 j + 岛1 缸) 、。 【f l 十e x p h + x 垆晚+ 屹+ 虎l 玩o + 励1 ) 1 - 1 又设 a 矗= a 1 1 矗l ,废1 圾l = a 1 2 缸,n 乞= a 2 t 矗2 ,虎1 阮1 = 船缸 9 m 恕伽嘲喁弦 d p h 2 一”裟蒜 盯巧 一 n x 弘妒印饭卿州唧 o “甲+ 腑啪唧 其中,( 矗l ,锄,钿) 一i i d m v n ( o ,) a n ,a 1 2 ,a 2 1 ,1 2 2 都取大于零的常数,容易知道,它们 分别是a a ,# 3 1 1 b i l ,屹,卢2 1 b l l 的标准差 设疑的上三角阵元素分别为1 ,r 1 2 , r 1 3 ,l ,r 1 如果设r 1 2 = r 1 3 = r 2 3 = 0 ,也就是 l ,6 2 ,缸) r i i d n ( 0 ,1 ) 从公式( 4 2 ) 为了使虎1 可识别,又设口2 = 1 ,则,一i i d n ( o ,1 ) , 且与矗l ,缸,钿也相互独立 我们在下面几节中将分别对连续变量和有序变量的模型分开考虑,然后再联合分析,并给 出相应的参数估计值 4 2 连续变量模型 对于连续型变量, 聊l = 卢l o + 砑卢l + a i i e i i + a i 2 锄j + 巧l ( 4 3 ) 令0 1 = ( s i o ,;,i l t i ,n l 他,b n 7 3 ,卢1 l 饥,b 1 i 7 5 ,a l l ,a 1 2 ,碚) 7 口l 的边缘观测似然, l i ( y l ;0 1 ) = n1 - f ( y i j l ;0 1 ) = 1 - i ,( - i 靠- ,缸溉) 7 r ( 6 - ) r 洳) 心l 武j 1 3 ( 4 4 ) = 亘垂而翻唧卜瑞,2 娶旦面丽专雨酬一齐群孑 边缘观测对数似然, z,c以;,。,:一半hca;。+-;。+矗,一i50i差7i;茅 c t s , 通过解下面的得分函数丽o l li 口。= 。,得到巩的极大似然估计d 1 这种方法也可以推广到多维连续变量的情况,可参考j r o y x l i n ( 2 0 0 0 ) 在这里就不进 行讨论 4 3 有序变量模型 对于有序型变量, m o d e l2 : 喝= 吒( y i ,2 k i w i 2 ,缸,e j ;0 2 ) = 唧+ 醒岛+ a 2 1 f , 2 - i - 蛔涮+ 岛1 ) 【1 + e x p ( t k + 砰岛+ a 2 l 矗2 + a 2 2 矗酊+ 岛1 玎) 】一1 令0 2 = n ,仡,诒,1 4 ,岛l 讥,岛l 蚀,虎l ,虎1 7 4 ,岛l 加,a 2 l ,沁2 ,岛1 ) t 抛的边缘观测似然, ( 4 6 ) = 垂壹e e 仁舭:氘矾州洲油c 嘲心z 怕嘞他, = 娶5 0 要7 上- 。b o o 上+ 。o o - + 。o o 商商瑶镌皤”( 矗。) 丌( 钿) 丌( ) d & 2 d 缸d e 0 = 如1 l 2 2 l 2 3 l 2 4 l 拍 在这里,物2 = k ,= l ,2 ,5 的条件概率p 葛分别为 癌= ( ”岛) ( 蛳_ 1 ) , 竭= ( 嗡一码) 7 0 “捌) 皤= ( 卜呜) 7 ( 蜥z 硼 蟛= ( 喝一”宅) 7 彻2 2 ) 呜= ( 呜一幅) 7 蛳2 - - 4 ) l 2 1 = i - i ,i i i ( y i j 2 = 1 ) j :麝仁等坞”( 矗2 ) ”( 缸) ”( q ) d 缸怕出巧, 一5 0j 一7 1 l 2 2 2 卫卫,( 嘶2 = 2 ) 麝麝j = 等( 吗一嘭) ”他2 ) ”( 缸) ”( ) 心2 d 矗3 出巧, 冒7 i l 2 32 i i - i 旦i ( y i l 2 = 3 ) - 4 - 。0 0j 一- b 。o oj :( 吗一吗) r ( 6 2 ) ) 7 r ( ) 心2 始3 出巧, 一5 0 1 。= 4 l 2 4 = g1 1 ,i ( y 0 2 = 4 ) ,= ,芸- b 。o o ( 码一唱) ”) ”( 钿) ”( ) 心2d 钿出材, 嚣i l 2 s = 卫l - i ,j ( 物2 = 5 ) j = 芸j = 甚j :芸( 1 一呜) ”( 6 2 ) ”( 缸) ”( ) 螈2d 白出巧 一j j 边缘观测对数似然 5 07 1 2 ( 0 2 ;u 2 ) = 三e i nj = 虑j :甚f c y i j 2 1 f 2 ,钿,叼;如) 7 r ( 矗2 ) ( 缸) r ( ) d 矗2 d 钿出玎( 4 8 ) t = 1 = 1 = 1 2 1 - i - 1 2 2 + 1 2 3 + f 2 4 + 1 2 5 1 1 如2 聊 “ ,脚 s n :i = 如s :k 1 ) i n 罢j :甚j :等”静躲z ) ”( 靠3 ) ”( ) 螈2d 钿出玎, 2 ) i n ,警,等,甚( 噶一嵋) ”) ”) ”( 铂) d & 2d 钰如巧 3 ) l nj :等虑j :( 嗡一呜) ”( 矗2 ) 口( 6 3 ) ”( e 巧) d d 缸d e 巧 4 ) i n ,芸,芸= ( 码一唱) ”( 矗2 ) ”) ”( 幻) d 6 2 螈3d 5 ) i , 1 - = 甚,等= 等( 1 一呜) ”( 6 2 ) ”) ”( ) 始2 螈38 用m a t a n n e r ( 1 9 9 6 ) 介绍的数值积分方法,得到 岛的边缘概率 孑, ”嚣f = ,芸= ,等幅”) ”( 钿) ”( ) 峨z 始。出玎 = 毒= 1 u 摹3 、百e 2 = 1 u 。、7 r s t = 1 u 。 茅 ( 4 9 ) e x p r k + 叉垆岛+ ( l l + a 乞+ 理1 ) 2 】 1 + e x p h + 叉护愚 + a ;1 + a ;2 + 壤l 十、童a 2 1 锄m + 、互a 2 2 矗3 舟+ 、互虎1 5 玎m 】) 一1 则, 5 07 岛1 = l - i 兀i ( y i j 2 = 1 ) ( r 孑) , 4 嚣亏1 场= ,l i ,卫i ( y i ,2 = 2 ) ( 臂一7 r m 。i ) , 一5 0 j = 1 l z 3 = 1 - il - ij ( 玎2 = 3 ) ( ”印m i 一黟) , t = l o l 5 0 7 l 2 , i = 卫卫i ( y l j 2 = 4 ) ( 7 ; 。m t 一码) , 5 0 1j 一7 1 l = 1 3i l f 妇巧2 = 5 ) ( 1 一w 孑) = l j = l 于是 通过解下面的得分函数,得到8 2 的极大似然估计如 丽0 1 2 铲鲁i 如+ 两0 1 2 2k + 两0 1 2 3l 如+ 甏i 如+ 豢i 如= 。 ( 4 1 0 ) 1 2 = = = = = 2 2 2 2 2 蛳 鲫 蛳 蜥 射 rrrr , ,m,脚,问,悼,脚 s斛:i印:l = = = = = 虬 船 丝 筇 m 玎 耵 i i 一 一 一 嘲 帆u 似材 埘舒 一 丌 丌 丌 丌 1 l h h h h h r , z g 4 5 = = = | | = 2 2 2 2 2 聊 聊 鲫 脚 “h “ “ ,埘,触,瑚,同,州 m s55 = = = 1 1 1 l 1 2 3 4 5 k b k b k 因为公式( 4 1 0 ) 无显示解,所以用牛顿算法得到0 2 的近似估计呓 = 一锄0 2 a 1 2 口一, 妒丽0 1 2 ) i 蜉, 上面这种方 去也可推广到多维有序变量的情况根据数据来源特点也可参考d t o d e m ,k k i m e l e s a f f r e ( 2 0 0 7 ) 的文章中阐述的模型 4 4 联合分析 m o d d3 : f 蛳1 = 3 1 0 + x f f o , + 1 1 6 1 + a 1 2 6 3 j + 叼1 j 确= 噶( 靴k l f , 2 ,钿,z 0 ;0 )( 4 1 2 ) l= 。中( + x o t 胁+ 2 1 矗2 + a 船f 诅j + 虎1 巧) 【1 + e x p ( r k + 醒岛+ a 2 1 缸+ 她e 龉,+ 岛1 玎) 】一1 ”的边缘观测似然 二( 斩0 ) = l - in ,( ;口) i = 1 j = l 5 07 = 旦旦j 竺虑虑= 甚,( 如1 i 矗l ,白;口) ,( 聊2 i 蛳1 ,矗2 ,缸,;口) ( 4 1 3 ) 丌( 矗i ) 霄( 6 2 ) 订( 缸) 丌( 订) d 6 ld 6 2 怕d e 0 = l o t 如工l m - 5 的边缘对数似然 5 07 1 ( o ;y ) = 1 n ,( ;口) i = 1 j = l 5 07 = 三三l n 麝麝它e :,( 1 缸;p ) ,( 锄2 l 骑l ,矗2 ,钿,;口) ( 4 1 4 ) 7 r ( 6 1 ) 丌( 6 2 ) 仃( 缸) 丌( ) d 6 1d 矗2d 靠3d e 甜 = 1 0 1 十乜+ f + 札+ j 与公式( 4 9 ) 类似,用数值积分得到碾在如1 ,物2 都考虑的情况下的边缘概率碱, 镌= ,甚,甚,等,等,( 约1 l 靠l ,钿;8 ) 幅”( 矗1 ) ”( 矗2 ) ”( 白) ”( ) 始l 媳2 心3 d 铂 = 嚣i 。篓l 何暑;l 。何 、磊( a ;1 + a i 2 + 砖) 唧 一( y i j l 一礤风一) 1 1 2 2 2 ) 2 2 ( x l l + a 2 2 - i - 砖) ) ( 4 1 5 ) e x p h - i - 碟如- 4 - ( 碣1 + 蝎2 + 卢;1 ) 2 】 1 + e x p h + x 孑岛+ 姆l + v 伍a 2 1 缸m + 磁- i - 编1 8 甜m + 【( z ,巧l 一醒风) a 1 2 a 2 2 + ( a i l + 盯。2 l ,一2 2 2 ( a i l - t - a i 2 + 盯) + 、甄2 2 【( a l + 矗) ( x 1 1 + i 2 + 以) 】 6 3 。】) 一1 则有 于是, l o l l 0 2 厶) 4 础 o l = 1 0 2 = = 1 0 4 = l = 1 ) 口田, 2 ) ( ”踢一,镌) , 3 ) ( ”岛一”磁) , 4 ) ( 嗡一”露) , 5 ) ( 1 一,嵋嚣) 通过解下面的得分函数,得到0 的极大似然估计d 嘉扣等”警”等”丽c 8 1 0 4i a + 等铲。 因为公式( 4 1 6 ) 无显示解,所以用牛顿算法,得到0 的近似估计矿 扩+ 1 ) = 删一【葫0 丽2 1j - - i 舭) ( 嘉) 1 4 ( 4 1 6 ) ( 4 1 7 ) = = = = | | 蜥 聊 聊 蛳 聊 “ “ h “ “ ,n触,n脚,岸,础,兀触 n i snnm兀5兀日 = = = = = 一嘶 | 叼 i | 叫、 丌 丌 丌 ;口 w 一 一 鹊 弼幅卜 h h h h m ” 动 q 印 = i | = = = 聊 聊 鲫 蜥 物 “ “ ,芦,触,纠,似,触 5m 5 讨论与总结 本文借用潜在变量模型体现个体的生命特征,很好的分析含有有序型响应变量和连续型响 应变量的多元纵向数据对于有序型响应变量我们不将它们连续化,而直接用累积l o g i s t i c 回归 模型建模分析- 虽然在积分运算以及在求参数估计上比连续的要复杂,但因为累积l o g j s t i c 回归 模型能够通过优比更好的体现有序变量的有序关系并且因为采用潜在变量模型将有序变量和 连续变量更好的联系起来分扼累积l o g i s t i c 模型实质上减少了信息的损失 在文章中,即使取7 0 = 0 ,伪o = 0 ,但对于岛l 我们同样很毙b ,它体现了有序变量与生命特 征的关系在本文可以求出岛1 的估计 而r ,v g u e o r g u i e v st - g s a n a c o r a ( 2 0 0 6 ) 设阮l = 1 在 求边缘积分时可以通过数学统计软件得到因为牛顿法的广泛实用性,且容易操作,般情况下 具有收敛性,所以在本文选择牛顿法求参数的估计 我们对相关随机效应化简后,假设它们独立同分布于标准正态如果设r 1 2 ,r 1 3 ,t 2 3 不全为 0 ,可能会更好些本文只对完全数据进行分析,如果含有缺失数据的情况,理论上文章中的模型 仍适用,并可以考虑用e m 算法求估计,协变量的假设是根据具体的情况来确定我们在本文考 虑的是协方差参数不依赖于协变量的更复杂的情况,有待于以后的进步探讨 1 1 参考文献 d t o d e m ,k k i ma n de l e 8 a 脏e ( 2 0 0 7 ) l a t e n t - v a r i a b l em o d e l s f o rl o n g i t u d i n a l d a t aw i t hb i v a r i a t eo r d i n a lo u t c o m e s s t a t i s t i c s 讯m e d i c i n e2 6 ,1 0 3 4 - 1 0 5 4 g e b o a u e y ( 1 9 8 6 ) r e g r e s s i v el o g i s t i cm o d e i sf o r f a m i l i a ld i s e a s ea n do t h e r b i n a r yt r a i t s b i o m e t r i c s4 2 ,6 1 1 - 6 2 5 g a r r e t tm f i t z m a u r i c ea n dn a nm l a i r d ( 1 9 9 7 ) r e g r e s s i o nm o d e m f o rm i x e d d i s c r e t ea n dc o n t i n u o u sr e s p o n s e sw i t hp o t e n t i a l l ym i s s i n gv a l u e s b i o m e t r i c s 5 5 1 1 0 - 1 2 2 g m f i t z n m u r l c e n m l a i r da n dj h w a r e a p p u e dl o n g i t u d i n a la n a l y s i s , w i l e y s o n s 2 0 0 4 h e p i n gz h a n ga n dk a t h l e e nm e r i k a n g a s ( 2 0 0 0 ) af r a i l t ym o d e lo fs e g r e g a - t i o na n a l y s i s :u n d e r s t a n d i n gt h ef a m i l i a lt r a n s m i s s i o no fa l c o h o l i s m b i o m e t r i c s 5 6 8 1 5 - 8 2 3 h e p i n gz h a n g ,r u if e n g ,a n dh o n g t uz h u ( 2 0 0 3 ) al a t e n tv a r i a b l em o d e lo f s e g r e g a t i o na n a l y s i sf o ro r d i n a lt r a i t s j o u r n a l0 ,地ea m e r i c a ns t a t i s t i c a l a s s o c i a t i o n9 8 ,1 0 2 3 - 1 0 3 4 i s a a cm d l i j s o n ( 1 9 8 9 ) af a s ti m p r o v e m e n tt ot h ee ma l g o r i t h mo ni t so w n t e r m s ,r 毋。蛹t s o c b5 1 ,1 2 7 - 1 3 8 j a s o nr o ya n dx i n o n gl i n ( 2 0 0 0 ) l a t e n tv a r i a b l em o d e l sf o rl o n g i t u d i n a ld a t a w i t hm u l t i p l ec o n t i n u o u so u t c o m e s b i o m e t r i c s5 6 ,1 0 4 7 - 1 0 5 4 9 】j a s o nr o ya n dx i h o n gl i n ( 2 0 0 2 ) a n a l y s i so f m u l t i v a r i a t el o n g i t u d i n a l o u t c o m e sw i t hn o n i g n o r a b l ed r o p o u t sa n dm i s s i n gc o v a r i a t e s :c h a n g e si n m e t h a d o n et r e a t m e n tp r a c t i c e j o u r n a lo it h ea m e r i c a ns t a t i s t i c a la s s o c i - a t i o n9 7 ,4 0 - 5 2 1 1 0 1 l i nj i n - g u a n ,w e ib o - c h e n g ,hj u e - s h e n g ( 2 0 0 6 ) t e s t i n gf o rd e p a r t u r e sf r o m n o m i n a ld i s p e r s i o na n dp o w e rs i m u l a t i o n si nd i s c r e t eg e n e r a l i z e dn o n l i n e a r m o d e mw i t hl o n g i t u d i n a ld a t a m a t h m a t i c aa p p l i c a t a1 9 ,3 4 2 - 3 4 7 【1 1 】m a r g a r e ta c o n n o h ya n dk u n g - y e el i a n g ( 1 9 8 8 ) c o n d i t i o n a ll o g i s t i cr e g r e s - s i o nm o d e l sf o r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年老年人健康管理考核试题及答案
- 2025年注册验船师资格考试(B级船舶检验专业基础安全)能力提高训练题及答案一
- 2025年公路水运检测师考试《道路工程》真题及答案(完整版)
- 2025年注册验船师资格考试(C级船舶检验法律法规)强化练习题及答案一
- 2025年(自考)护理管理学考试题库及答案(含各题型)
- 2025年高校教务招聘笔试模拟题及考点解析
- 2025年高级测试工程师面试题解析及测试技巧
- 2025年金融专业毕业生求职面试模拟题集及解析
- 2025年考试无忧技术类招聘笔试模拟题及答案速递
- 校长读书汇报课件
- IATF16949过程绩效指标一览表
- 水利部2002《水利建筑工程概算定额》
- 四年级数学下册12月份计算小超市
- 医院陪护中心运营方案
- 厂家如何做好经销商的利润管理
- 2023《中央企业合规管理办法》要点解读课件PPT
- 聚合物基础知识
- 售楼部钢结构玻璃幕墙拆除方案
- 集团公司校园招聘计划实施方案
- JJF 1002-2010国家计量检定规程编写规则
- GB/T 6663.1-2007直热式负温度系数热敏电阻器第1部分:总规范
评论
0/150
提交评论