多水平统计模型.ppt_第1页
多水平统计模型.ppt_第2页
多水平统计模型.ppt_第3页
多水平统计模型.ppt_第4页
多水平统计模型.ppt_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/11/24,高级卫生统计学,1,内容第一节方差成份模型第二节随机系数模型第三节离散数据的多水平模型,2,多中心临床试验的多水平结构,中心(医院):3水平个体:2水平重复测量值:1水平,水平(level):数据层次结构中的某一层次单位(unit):数据层次结构中某水平上的一个实体,层次结构数据非独立数据:如同一只雌性大鼠的重复观测值同一家庭的子女,其生理和心理特征更为相似,相似性或聚集性(clustering)相关程度常用组内相关(intra-classcorrelation,ICC)度量,非独立:相关程度常用组内相关(intra-classcorrelation,ICC)度量,水平2,水平1,两水平层次结构示意图,多中心临床试验研究临床试验和动物实验的重复测量纵向观测如儿童生长发育研究流行病学现场调查如整群抽样调查遗传学家系调查资料meta分析资料,常见的层次结构数据,经典线性模型只对某一层数据进行分析层次结构数据:可能同时受水平1和水平2变量的影响还受到两个水平变量的交互影响(cross-levelinteraction)如发生牙病的危险与个体的遗传倾向、饮食文化、环境因素(氟)等有关,采用经典模型可能失去参数估计的有效性,经典方法框架下的分析策略分解(disaggregation)聚合(aggregation),分解:不满足模型独立性假定,回归系数及其标准误的估计无效未能有效分析水平高的效应,聚合:损失大量水平1单位的信息可能导致“生态学谬误”(ecologicalfallacy)根据聚合单位的分析结果作关于个体的断言,研究结果与真实情况不符,一个虚拟的例子(ExtremeExample),SubjectspecificeffectsofXonPr(Death),OR=20per1unitincreaseinX,PopulationaverageeffectofXonPr(Death),OR=2.7per1unitincreaseinX,多水平统计模型,如何合理的分析层次数据?,回归的不同模式:,2019/11/24,高级卫生统计学,16,第一节方差成份模型(VarianceComponentModel),假定两水平的层次结构数据:水平2-医院,水平1-患者仅有一个解释变量x,和分别为第j个医院中第i个患者应变量观测值和解释变量观测值和为参数为随机误差项,水平2单位,水平1单位,区别:经典模型:方差成份模型:第j个截距值:x=0时,第j个医院y的平均估计值,为平均截距,反映与的平均关系,x=0时,所有y的总平均估计值为随机变量,表示第j个医院y之平均估计值与总均数的离差值,反映了第j个医院对y的随机效应,表示协变量x的固定效应估计值y与协变量x的关系在各医院间是相同的医院间y的变异与协变量x的变化无关,方差成份模型拟合j条平行的回归线,截距不同(),斜率相同()随机截距模型,对医院水平残差的假定,对患者水平残差的假定与传统模型一致,水平1上的残差与水平2上的残差相互独立,,,,,固定部分随机部分两个残差项,多水平模型区别于经典模型的关键即水平2残差,随机效应,需估计4个参数:两个固定系数和两个随机参数和其中医院水平的方差成份患者水平的方差成份,组内相关的度量,方差成份模型中,应变量方差为,即水平2和水平1方差之和,同一医院中两个患者(用i1,i2表示)间的协方差:,组内相关(intra-classcorrelation,ICC),反映了医院内个体间相关,即水平1单位(患者)在水平2单位(医院)中的聚集性或相似性,不具层次结构,可忽略医院的存在简化为传统的单水平模型不能忽略医院的存在采用多水平模型,应变量向量的协方差结构,两水平数据结构只包括随机参数和,同一医院所诊疗的三名患者的协差阵:,医院1:3名患者,医院2:2名患者应变量向量Y总的协方差阵:,固定与随机参数估计,迭代广义最小二乘算法(IterativeGeneralizedLeastSquares,IGLS)(Goldstein,1986)限制性迭代广义最小二乘法(RestrictedIterativeGeneralizedLeastSquares,RIGLS)(Goldstein,1989),两水平方差成份模型:,假定已知方差的值,则可直接构造残差的协方差矩阵采用广义最小二乘法(GeneralizedLeastSquaresGLS)可获得固定系数的估计:,假定方差未知在初始阶段,假定=0,则给出固定系数通常的OLS估计,得到粗残差:,对应于2个医院,一个诊疗3名患者,另一个诊疗2名患者,则和均具有9+4=13个元素。因为的期望为,可将这些向量间关系表达为以下线性模型:,=,+R=,+,+R,为一个残差向量模型右边包含两个已知的解释变量,其系数即待估计的随机参数和通过GLS方法获得和的估计回到初始模型则获得固定系数新的估计在随机与固定参数估计间反复迭代直至收敛,分析软件ML3(1994)/MLN(1996)/MLwiN(1999)HLM(HierarchicalLinearModel)SAS(Mixed),2019/11/24,高级卫生统计学,40,例25-1检索有关吸烟与肺癌关系研究的文献共49篇,各项研究独立且研究假设相同,可以得到的数据包括各项研究的OR值或Ln(OR)值及其标准误、研究水平上的有关解释变量包括样本含量、是否进行性别调整以及设计类型等。,三、应用实例,2019/11/24,高级卫生统计学,41,表25-149篇吸烟与肺癌文献的研究结果,三、应用实例,2019/11/24,高级卫生统计学,42,水平2:文献研究结果(效应尺度)水平1:个体数据不可得,三、应用实例,为第j个研究的Ln(OR)值,2019/11/24,高级卫生统计学,43,总方差:,三、应用实例,变换为:,定义:,2019/11/24,高级卫生统计学,44,全部Ln(OR)的平均估计值:1.44,三、应用实例,2019/11/24,高级卫生统计学,45,三、应用实例,引入解释变量:,:性别调整,:设计类型,2019/11/24,高级卫生统计学,46,性别调整系数不显著,但降低了随机效应效应尺度Ln(OR)与性别调整有关,符号为负性别调整后Ln(OR)值降低,三、应用实例,2019/11/24,高级卫生统计学,47,三、应用实例,2019/11/24,高级卫生统计学,48,第二节随机系数模型(RandomCoefficientModel),与方差成份模型的区别在于,斜率是随机的:协变量对反应变量的效应在不同的水平2单位间是不同的,方差成份模型:斜率固定协变量对反应变量的效应在各个医院间不变随机系数模型:斜率随机协变量对反应变量的效应在各个医院间是不同的,截距与方差成份模型一致斜率为随机变量,假定:,:第j个医院的y随x变化的斜率:全部医院的y随x变化的斜率的平均值:y随x变化的斜率的方差,:第j个医院的斜率与平均斜率的离差:截距离差值与斜率离差值的协方差,固定部分随机部分固定部分全部医院回归线的平均平均截距平均斜率,将模型变换为:,随机效应用方差描述各医院之间y的变异与协变量x的关系需估计4个随机参数:方差、和协方差,应变量方差为:,各医院间y的变异与协变量x有关,组内相关与解释变量有关,2019/11/24,高级卫生统计学,57,三、应用实例,例25-2为研究A、B两种治疗方案对白细胞减少症患者疗效的差别,用随机的方法让50名患者先以A方案治疗,间隔一段时间再以B方案治疗,另外50名患者先用B方案治疗,间隔同样时间再用A方案治疗,同时记录治疗后的白细胞值。,2019/11/24,高级卫生统计学,58,三、应用实例,水平1:重复测量点水平2:患者,2019/11/24,高级卫生统计学,59,三、应用实例,2019/11/24,高级卫生统计学,60,三、应用实例,残留效应引入实验顺序的哑变量:,2019/11/24,高级卫生统计学,61,三、应用实例,顺序效应有统计学意义水平1的方差降低为1.74顺序效应解释了部分随机误差,2019/11/24,高级卫生统计学,62,第三节离散数据的多水平模型,应变量为离散型数据,2019/11/24,高级卫生统计学,63,一、二分类应变量的多水平模型,方差成份模型:,Logit变换:,若,2019/11/24,高级卫生统计学,64,一、二分类应变量的多水平模型,采用“拟似然法”(quasi-likelihood)估计参数,2019/11/24,高级卫生统计学,65,例25-3采用20名调查员对135名农村社区医生的某次问卷调查资料,对以下3个问题进行分析,1.“患者常要求医生开某种抗生素,你遇到过这种情况吗?”2.“假如患者要求开某种抗生素,您同意吗?”3.“有的医生认为,对于能报销药费的患者可多开些抗生素或较贵的抗生素,您同意吗?”。对上述3个问题的回答均为“是”或“不是”。未经重复调查,每个调查员调查的医生数不等,即数据是不平衡的。,二、应用实例,2019/11/24,高级卫生统计学,66,二、应用实例,2019/11/24,高级卫生统计学,67,如调查员的某些特征影响到调查对象的回答应答具有相似性或聚集性两水平层次结构:调查员-水平2单位调查对象水平1单位,二、应用实例,2019/11/24,高级卫生统计学,68,二、应用实例,第i个调查对象对第j个调查员阳性应答概率的期望无解释变量“零模型”或“空模型”参数估计IGLS法或MQL“边际拟似然法”(Marginalquasi-likelihood),2019/11/24,高级卫生统计学,69,二、应用实例,阳性应答概率的平均预测值:分别为0.95、0.46、0.15,20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论