版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多水平统计模型多水平统计模型多水平统计模型 80 年代中后期,英、美等国教育统计学家开始年代中后期,英、美等国教育统计学家开始探讨分析层次结构数据探讨分析层次结构数据(hierarchically structured data)的统计方法,并相继提出不同的模型理论和算的统计方法,并相继提出不同的模型理论和算法。法。 多水平模型多水平模型(multilevel models)最先应用于教育最先应用于教育学领域,后用于心理学、社会学、经济学、组织行学领域,后用于心理学、社会学、经济学、组织行为与管理科学等领域,逐步应用到医学及公共卫生为与管理科学等领域,逐步应用到医学及公共卫生等领域。等领域。多
2、水平统计模型Harvey Goldstein, UK, University of London, Institute of EducationMultilevel Models in Educational and Social Research1987多水平统计模型Anthony Bryk, University of ChicagoStephen Raudenbush, Michigan State University , Department of Educational PsychologyHierarchical Linear Models: Applications and D
3、ata Analysis Methods1992多水平统计模型Nicholas Longford, Princeton University, Education Testing ServiceRandom Coefficient Models1993 多水平统计模型n多水平主成分分析n多水平因子分析n多水平判别分析n多水平logistic回归n多水平Cox模型n多水平Poisson回归n多水平时间序列分析n多元多水平模型n多水平结构方程模型多水平统计模型 ML3 (1994) / MLN (1996) / MLwiN (1999) HLM (Hierarchical Linear Model
4、) SAS (Mixed) SPSS STATA多水平统计模型 两水平层次结构数据两水平层次结构数据水平2 水平1 多水平统计模型“水平水平” (level) :指数据层次结构中的某一层:指数据层次结构中的某一层次。例如,子女为低水平即水平次。例如,子女为低水平即水平 1 ,家庭为高水,家庭为高水平即水平平即水平 2 。“单位单位” (unit) :指数据层次结构中某水平:指数据层次结构中某水平上的一个实体。例如,每个子女是一个水平上的一个实体。例如,每个子女是一个水平 1 单单位,每个家庭是一个水平位,每个家庭是一个水平 2 单位。单位。多水平统计模型n 临床试验和动物实验的重复测量临床试验
5、和动物实验的重复测量n 多中心临床试验研究多中心临床试验研究n 纵向观测如儿童生长发育研究纵向观测如儿童生长发育研究n 流行病学现场调查如整群抽样调查流行病学现场调查如整群抽样调查n 遗传学家系调查资料遗传学家系调查资料n meta 分析资料分析资料多水平统计模型 层次结构数据为一种非独立数据,即某观察层次结构数据为一种非独立数据,即某观察值在观察单位间或同一观察单位的各次观察间不值在观察单位间或同一观察单位的各次观察间不独立或不完全独立,其大小常用组内相关独立或不完全独立,其大小常用组内相关(intra-class correlation,ICC)度量。度量。 例如,来自同一家庭的子女,其生
6、理和心理例如,来自同一家庭的子女,其生理和心理特征较从一般总体中随机抽取的个体趋向于更为特征较从一般总体中随机抽取的个体趋向于更为相似,即子女特征在家庭中具有相似性或聚集性相似,即子女特征在家庭中具有相似性或聚集性(clustering),数据是非独立的,数据是非独立的(non independent)。多水平统计模型 非独立数据不满足经典方法的独立性条件,非独立数据不满足经典方法的独立性条件,采用经典方法可能失去参数估计的有效性并导致采用经典方法可能失去参数估计的有效性并导致不合理的推断结论。不合理的推断结论。 但非独立数据的组内相关结构各异,理论上,但非独立数据的组内相关结构各异,理论上,
7、不同的结构应采用相应的统计方法。如纵向观测不同的结构应采用相应的统计方法。如纵向观测数据常用广义估计方程数据常用广义估计方程(GEE),但有两个局限性:,但有两个局限性:一是对误差方差的分解仅局限于一是对误差方差的分解仅局限于2水平的情形,水平的情形,二是没有考虑解释变量对误差方差的影响。当应二是没有考虑解释变量对误差方差的影响。当应变量的协差阵为分块对角阵时,一般采用多水平变量的协差阵为分块对角阵时,一般采用多水平模型。模型。多水平统计模型经典方法框架下的分析策略经典方法框架下的分析策略 经典的线性模型只对某一层数据的问题进行经典的线性模型只对某一层数据的问题进行分析,而不能将涉及两层或多层
8、数据的问题进行分析,而不能将涉及两层或多层数据的问题进行综合分析。综合分析。 但有时某个现象既受到水平但有时某个现象既受到水平1变量的影响,变量的影响,又受到水平又受到水平2变量的影响,还受到两个水平变量变量的影响,还受到两个水平变量的交互影响的交互影响(cross-level interaction)。多水平统计模型 个体的某事件既受到其自身特征的影响,也个体的某事件既受到其自身特征的影响,也受到其生活环境的影响,即既有个体效应,也有受到其生活环境的影响,即既有个体效应,也有环境或背景效应环境或背景效应(context effect)。 例如,个体发生某种牙病的危险可能与个体例如,个体发生某
9、种牙病的危险可能与个体的遗传倾向、个体所属的社会阶层的遗传倾向、个体所属的社会阶层(如饮食文化和如饮食文化和口腔卫生习惯口腔卫生习惯)、环境因素、环境因素(如饮水中氟浓度如饮水中氟浓度)等有等有关。关。多水平统计模型n分解分解(disaggregation)n聚合聚合(aggregation)多水平统计模型 分解:不满足模型独立性假定,回归系数及分解:不满足模型独立性假定,回归系数及其标准误的估计无效,且未能有效区分个体效应其标准误的估计无效,且未能有效区分个体效应与背景效应。另一种分析策略是用哑变量拟合高与背景效应。另一种分析策略是用哑变量拟合高水平单位的固定效应。水平单位的固定效应。 聚合
10、:损失大量水平聚合:损失大量水平1单位的信息,更严重单位的信息,更严重的是可能导致的是可能导致“生态学谬误生态学谬误”(ecological fallacy)。多水平统计模型 多水平分析的概念为人们提供了这样一个框架,即多水平分析的概念为人们提供了这样一个框架,即可将个体的结局联系到个体特征以及个体所在环境或背可将个体的结局联系到个体特征以及个体所在环境或背景特征进行分析,从而实现研究的事物与其所在背景的景特征进行分析,从而实现研究的事物与其所在背景的统一。统一。多水平统计模型经典模型的基本假定是单一水平和单一的随经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为
11、机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的常量的正态分布,代表不能用模型解释的残留的随机成份。随机成份。 多水平统计模型当数据存在层次结构时,随机误差项则不满足当数据存在层次结构时,随机误差项则不满足独立常方差的假定。模型的误差项不仅包含了模型独立常方差的假定。模型的误差项不仅包含了模型不能解释的应变量的残差成份,也包含了高水平单不能解释的应变量的残差成份,也包含了高水平单位自身对应变量的效应成份。位自身对应变量的效应成份。 多水平统计模型多水平模型将单一的随机误差项分解到与数多水平模型将单一的随机误差项分解到与数据层次结构相应的各水平上,具有多个随机
12、误差据层次结构相应的各水平上,具有多个随机误差项并估计相应的残差方差及协方差。构建与数据项并估计相应的残差方差及协方差。构建与数据层次结构相适应的复杂误差结构,这是多水平模层次结构相适应的复杂误差结构,这是多水平模型区别于经典模型的根本特征。型区别于经典模型的根本特征。 多水平统计模型 多水平模型由固定与随机两部分构成,与一多水平模型由固定与随机两部分构成,与一般的混合效应模型的不同之处在于,其随机部分般的混合效应模型的不同之处在于,其随机部分可以包含解释变量,故又称为随机系数模型可以包含解释变量,故又称为随机系数模型(random coefficient model),其组内相关也可为,其组
13、内相关也可为解释变量的函数。换言之,多水平模型可对不同解释变量的函数。换言之,多水平模型可对不同水平上的误差方差进行深入和精细的分析。水平上的误差方差进行深入和精细的分析。多水平统计模型1. 方差成份模型方差成份模型 (Variance Component Model) 假定一个两水平的层次结构数据,医院为水假定一个两水平的层次结构数据,医院为水平平 2 单位,患者为水平单位,患者为水平 1 单位,医院为相应总体单位,医院为相应总体的随机样本,模型中仅有一个解释变量的随机样本,模型中仅有一个解释变量 x 。多水平统计模型 和和 分别为第分别为第 j 个医院中第个医院中第 i 个患者应变个患者应
14、变量观测值和解释变量观测值,量观测值和解释变量观测值, 和和 为参数估为参数估计计, 为通常的随机误差项。为通常的随机误差项。ijijjijexy010ijyijxj01ije0mj,.,2, 1jni,.,2, 1示水平示水平 2 单位单位示水平示水平 1 单位单位多水平统计模型与经典模型的区别在于与经典模型的区别在于 。经典模型中的估。经典模型中的估计为计为 ,仅一个估计值,表示固定的截距,而在,仅一个估计值,表示固定的截距,而在方差成份模型中方差成份模型中 表示表示 j 个截距值,即当个截距值,即当 x 取取 0 时,第时,第 j 个医院在基线水平时个医院在基线水平时 y 的平均估计值。
15、的平均估计值。00 j0 j多水平统计模型000jju为平均截距,反映为平均截距,反映 与与 的平均关系,的平均关系,即当即当 x 取取 0 时,所有时,所有 y 的总平均估计值。的总平均估计值。 为随机变量,表示第为随机变量,表示第 j 个医院个医院 y 之平均估之平均估计值与总均数的离差值,反映了第计值与总均数的离差值,反映了第 j 个医院对个医院对 y 的的随机效应。随机效应。0ijyijxuj0多水平统计模型 表示协变量表示协变量 x 的固定效应估计值。即的固定效应估计值。即 y 与与协变量协变量 x 的关系在各医院间是相同的,换言之,的关系在各医院间是相同的,换言之,医院间医院间 y
16、 的变异与协变量的变异与协变量 x 的变化无关。的变化无关。1多水平统计模型 方差成份模型拟合方差成份模型拟合 j 条平行的回归线,截条平行的回归线,截距不同距不同( ),斜率相同,斜率相同( )。 0 j1多水平统计模型对医院水平残差的假定对医院水平残差的假定对患者水平残差的假定与传统模型一致对患者水平残差的假定与传统模型一致 水平水平 1 上的残差与水平上的残差与水平 2 上的残差相互独立上的残差相互独立0)(0ijeE200)(eijeVar,0)(0juE200)(ujuVar,0),(00ijjeuCov多水平统计模型 反应变量可表达为固定部分反应变量可表达为固定部分 与与随机部分随
17、机部分 之和。模型具有两个残差项,之和。模型具有两个残差项,这是多水平模型区别于经典模型的关键部分。这是多水平模型区别于经典模型的关键部分。 即水平即水平2残差,随机效应、又称潜变量残差,随机效应、又称潜变量(latent variable) ijjijijeuxy0010ijx10ijjeu000 ju多水平统计模型此模型需估计此模型需估计4个参数,除两个固定系数个参数,除两个固定系数 和和 ,还需估计两个随机参数还需估计两个随机参数 和和 。其中。其中 即为即为医院水平的方差成份,医院水平的方差成份, 为患者水平的方差成份。为患者水平的方差成份。u02e0201u02e02多水平统计模型组
18、内相关的度量组内相关的度量方差成份模型中,应变量方差为方差成份模型中,应变量方差为2200eu0000()()(,)jijjijVar uVar eCov ue)(,|0010ijjijijeuVarxyVar多水平统计模型 此即水平此即水平 2 和水平和水平 1 方差之和。方差之和。 同一医院中两个患者同一医院中两个患者(用用i1,i2 表示表示)间的协方差间的协方差为:为:2000000021,ujjjijjijuuCoveueuCov多水平统计模型组内相关组内相关(intra-class correlation, ICC)222000euu多水平统计模型 测量了医院间方差占总方差的比例,
19、测量了医院间方差占总方差的比例,实际上它反映了医院内个体间相关,即水平实际上它反映了医院内个体间相关,即水平 1 单位单位(患者患者)在水平在水平 2 单位单位(医院医院)中的聚集性或中的聚集性或相似性。相似性。多水平统计模型 由于模型不止一个残差项,就产生了非由于模型不止一个残差项,就产生了非零的组内相关。若零的组内相关。若 为为 0,表明数据不具,表明数据不具层次结构,可忽略医院的存在,即简化为层次结构,可忽略医院的存在,即简化为传统的单水平模型;反之,若存在非零传统的单水平模型;反之,若存在非零的的 ,则不能忽略医院的存在。,则不能忽略医院的存在。u02多水平统计模型 水平水平 2 单位
20、中的水平单位中的水平 1 单位间存在相关,单位间存在相关,通常的通常的“普通最小二乘法普通最小二乘法”(Ordinary Least Squares OLS)进行参数估计是不适宜的。进行参数估计是不适宜的。多水平统计模型 进一步,如数据具有三个水平的层次进一步,如数据具有三个水平的层次结构,如医院、医生和患者三个水平,则结构,如医院、医生和患者三个水平,则将有两个这样的相关系数,即医院内相关将有两个这样的相关系数,即医院内相关和医生内相关。和医生内相关。多水平统计模型随机系数模型是指协变量的系数估计不随机系数模型是指协变量的系数估计不是固定的而是随机的,即协变量对反应变量是固定的而是随机的,即
21、协变量对反应变量的效应在不同的水平的效应在不同的水平 2 单位间是不同的。单位间是不同的。仍以医院与患者两水平数据结构说明随仍以医院与患者两水平数据结构说明随机系数模型基本结构与假设。机系数模型基本结构与假设。随机系数模型随机系数模型(Random Coefficient Model)多水平统计模型ijijjjijexy010与方差成份模型的区别在于与方差成份模型的区别在于 。1j多水平统计模型 方差成份模型中协变量方差成份模型中协变量 的系数估计为的系数估计为固定的固定的 ,示协变量,示协变量 对反应变量的效应对反应变量的效应是固定不变的。在随机系数模型中协变量是固定不变的。在随机系数模型中
22、协变量 的系数估计为的系数估计为 ,示每个医院都有其自身的,示每个医院都有其自身的斜率估计,表明协变量斜率估计,表明协变量 对反应变量的效应对反应变量的效应在各个医院间是不同的。在各个医院间是不同的。ijx1ijxijxijx1j多水平统计模型11)(jE211)(ujVar0 j 的假定及其含义与方差成份模型一的假定及其含义与方差成份模型一致。现致。现 为随机变量,假定:为随机变量,假定:1j多水平统计模型 表示第表示第 j 个医院的个医院的 y 随随 x 变化的斜变化的斜率;率; 表示全部医院的表示全部医院的 y 随随 x 变化的斜率变化的斜率的平均值的平均值(平均斜率平均斜率)。 是指各
23、医院的是指各医院的 y 随随 x 变化的斜率变化的斜率 的方差。的方差。1j121u多水平统计模型 示第示第 j 个医院的斜率与平均斜率的离个医院的斜率与平均斜率的离差值,差值, 指上述截距离差值与斜率离差值的指上述截距离差值与斜率离差值的协方差,反映了它们之间的相关关系。协方差,反映了它们之间的相关关系。111jju0)()(10jjuEuEVar uju()121Cov uujju(,)010101uju1多水平统计模型 ijijjjijijexuuxy01010 即表达为固定部分与随机部分之和。其即表达为固定部分与随机部分之和。其中,中,固定效应用均数描述固定效应用均数描述,它决定了全部
24、医,它决定了全部医院的平均回归线,这条直线的截距即平均截院的平均回归线,这条直线的截距即平均截距距 ,直线的斜率即平均斜率,直线的斜率即平均斜率 。 为为随机系数。随机系数。将模型改记为:将模型改记为:011ju多水平统计模型 随机效应用方差描述随机效应用方差描述,它反映了各,它反映了各医院之间医院之间 y 的变异与协变量的变异与协变量 x 的关系。的关系。模型随机部分具多个残差项,需估计模型随机部分具多个残差项,需估计4个个随机参数,即方差随机参数,即方差 、 和和 以及以及协方差协方差 。20u21u20e01u多水平统计模型模型的反应变量方差为:模型的反应变量方差为: 表明各医院间表明各
25、医院间 y 的变异与协变量的变异与协变量 x 有关,有关,即每条回归线不仅截距不同,且斜率也不同。即每条回归线不仅截距不同,且斜率也不同。当当 x 取取 0 时每个医院时每个医院 y 的平均估计值的平均估计值 不同,不同,且每个医院且每个医院 y 随随 x 变化的斜率变化的斜率 不同。不同。2222010102eijuijuuxxijijjjijijexuuVarxyVar01010,|0 j1 j多水平统计模型组内相关与解释变量有关001100110222222222uuijuijuuijuijexxxx多水平统计模型 值得指出,模型随机部分的解释变量常值得指出,模型随机部分的解释变量常为其
26、固定部分的一个子集,但亦可以不是。为其固定部分的一个子集,但亦可以不是。换言之,可以在模型的固定部分或随机部分换言之,可以在模型的固定部分或随机部分纳入任何水平上测量的解释变量。纳入任何水平上测量的解释变量。多水平统计模型 反应变量向量的协方差结构反应变量向量的协方差结构 从最基本的两水平数据结构来考察反从最基本的两水平数据结构来考察反应变量向量的协方差结构,即只包括随机应变量向量的协方差结构,即只包括随机参数参数 和和 。对应于方差成份模型,反。对应于方差成份模型,反应变量方差为水平应变量方差为水平 1 和水平和水平 2 方差之和:方差之和:)(,|0010ijjijijeuVarxyVar
27、2200euu02e02多水平统计模型 同一个医院所诊疗的两个患者同一个医院所诊疗的两个患者(用用 , 表示表示)间的协方差为:间的协方差为:i1i22000000021,ujjjijjijuuCoveueuCov多水平统计模型因此,同一医院所诊疗的三名患者的因此,同一医院所诊疗的三名患者的协差阵为协差阵为ueuuuueuuuue000000000000222222222222多水平统计模型 对两个医院而言,若一个医院诊疗了三对两个医院而言,若一个医院诊疗了三名患者,另一个医院诊疗了两个患者,则具名患者,另一个医院诊疗了两个患者,则具有有 2 个水平个水平 2 单位的反应变量向量单位的反应变量
28、向量 Y 总的协总的协差阵可表达为:差阵可表达为:多水平统计模型 矩阵的这种分块对角结构表达了不同医院所矩阵的这种分块对角结构表达了不同医院所诊疗的患者间的协方差为诊疗的患者间的协方差为 0 ,它可进一步扩展到,它可进一步扩展到任意多的医院数。将上述矩阵表达为另一种更简任意多的医院数。将上述矩阵表达为另一种更简略的形式略的形式: 222232322000000IJIJVeueu多水平统计模型 为为 维的维的 1 矩阵,矩阵, 为为 维的单位阵,维的单位阵, 的下标的下标 2 表明为两水平模型,表明为两水平模型, 的维数即水平的维数即水平2单单位数,主对角线块的维数即水平位数,主对角线块的维数即
29、水平1单位数,它们单位数,它们均为方阵。在传统均为方阵。在传统 OLS 估计中,估计中, 为为 0 ,则该,则该协差阵退化为标准形式的协差阵退化为标准形式的 , 即残差方差。即残差方差。Jn( )nIn( )nVVu022I2多水平统计模型考察包括随机系数的一般形式的两水平模型考察包括随机系数的一般形式的两水平模型jiijjijjijphhijhijijzezuzuxxy0011002110或简记为或简记为jiijhjhihjijijzezuXy0010多水平统计模型 对于具有随机截距与斜率的两水平模型,对于具有随机截距与斜率的两水平模型,其反应变量协差阵具有以下典型的分块结构:其反应变量协差
30、阵具有以下典型的分块结构:11200TjjXX1010222uuujjjxxX2111210e多水平统计模型 矩阵矩阵 为水平为水平 2 的随机截距与斜率的协的随机截距与斜率的协差阵,即随机系数协差阵,矩阵差阵,即随机系数协差阵,矩阵 为水平为水平 1 的随机系数协差阵。的随机系数协差阵。 这里,水平这里,水平 1 只有一个单一的方差项,只有一个单一的方差项,可进一步采用可进一步采用 表示这些协差阵集。表示这些协差阵集。 将上述矩阵展开得到:将上述矩阵展开得到:21i多水平统计模型uujujeuujjujjuujjujjuujujexxxxx xxxx xxx00110001100110011
31、021212221221221221222222222()() 这是具有分块结构的一个具有这是具有分块结构的一个具有 2 个水平个水平 1 单位的水平单位的水平 2 单位的反应变量协差阵。此单位的反应变量协差阵。此即构造反应变量协差阵的一般模式,它同时即构造反应变量协差阵的一般模式,它同时也概括了拟合水平也概括了拟合水平 1 复杂变异的可能性。复杂变异的可能性。多水平统计模型固定与随机参数估计固定与随机参数估计 固定和随机参数的估计方法一般采用固定和随机参数的估计方法一般采用“迭代广迭代广义最小二乘算法义最小二乘算法”(Iterative Generalized Least Squares,I
32、GLS) (Goldstein,1986)或或“限制性迭代限制性迭代广义最小二乘法广义最小二乘法”(Restricted Iterative Generalized Least Squares,RIGLS) (Goldstein,1989)。多水平统计模型ijjijijeuxy00110现以最基本的两水平方差成份模型来阐现以最基本的两水平方差成份模型来阐明固定与随机参数估计的基本思想和步骤。明固定与随机参数估计的基本思想和步骤。 多水平统计模型 假定已知方差假定已知方差 的值,则可直接构造的值,则可直接构造分块对角阵分块对角阵 ,简记为,简记为 。直接采用通。直接采用通常的广义最小二乘法常的广
33、义最小二乘法(Generalized Least Squares GLS)可获得固定系数的估计:可获得固定系数的估计: u02V( )2VYVXXVXTT111)(多水平统计模型 在初始阶段,假定在初始阶段,假定 为为 0 ,即假定数据,即假定数据不具有系统结构,则给出固定系数通常的不具有系统结构,则给出固定系数通常的 OLS 估计估计 ,得到粗残差:,得到粗残差: 20u( )0)(10ijijijxyy多水平统计模型将粗残差向量记为:将粗残差向量记为:ijyY将粗残差向量形成交叉乘积矩阵将粗残差向量形成交叉乘积矩阵 ,然,然后再形成交叉乘积矩阵后再形成交叉乘积矩阵 的向量化算子,的向量化算
34、子,记为记为 。相应的,也可以形成反应变。相应的,也可以形成反应变量协方差阵量协方差阵 向量化算子,记为向量化算子,记为 。YYTYYTTYYVec)(VVecV多水平统计模型对应于对应于 2 个医院,一个诊疗个医院,一个诊疗 3 名患者,另名患者,另一个诊疗一个诊疗 2 名患者,则名患者,则 和和 均具均具有有 32+22=13 个元素。因为个元素。因为 的期望为的期望为 可将这些向量间关系表达为以下线性模型可将这些向量间关系表达为以下线性模型RVVecYYVecT)(TYYVec)(VVecYYTV多水平统计模型.yyyyyyyyyyy21 12 11 13 11 11 12 12 121
35、 22 22 22ueuuuueuue00000000002222222222.1111111.1000101.u02e02=+R=+R多水平统计模型这里,这里, 为一个残差向量。将粗残差作为模型的为一个残差向量。将粗残差作为模型的反应变量向量,模型右边包含两个已知的解释变量,反应变量向量,模型右边包含两个已知的解释变量,其系数即待估计的随机参数其系数即待估计的随机参数 和和 。通过。通过 GLS 方方法获得法获得 和和 的估计,回到初始模型则获得固定的估计,回到初始模型则获得固定系数新的估计,在随机与固定参数估计间反复迭代直系数新的估计,在随机与固定参数估计间反复迭代直至收敛,此即至收敛,此
36、即 IGLS 算法的基础。算法的基础。Ru02e02u02e02多水平统计模型1. 重复测量数据的多水平模型重复测量数据的多水平模型当同一研究对象被重复测量多次时,测量点即当同一研究对象被重复测量多次时,测量点即为水平为水平 1 单位,测量点又嵌套单位,测量点又嵌套(nested)进作为水平进作为水平 2 单位的个体,这种数据结构具有典型的层次结构特单位的个体,这种数据结构具有典型的层次结构特征。征。 多水平模型的应用多水平模型的应用多水平统计模型在临床试验和动物实验中,常需对患者或动在临床试验和动物实验中,常需对患者或动物的某些指标进行重复测量,以了解不同时间观物的某些指标进行重复测量,以了
37、解不同时间观测指标的变化以及处理因素与观测指标的关系随测指标的变化以及处理因素与观测指标的关系随时间的变化;在生长发育研究中,也需对个体生时间的变化;在生长发育研究中,也需对个体生长或发育指标作多时点的重复测量。长或发育指标作多时点的重复测量。多水平统计模型常规使用的重复测量数据统计方法,一般要求资常规使用的重复测量数据统计方法,一般要求资料是平衡的,即每一个体有相同次数的重复测量值,料是平衡的,即每一个体有相同次数的重复测量值,这对于实验研究是可行的,但在生长发育研究中,测这对于实验研究是可行的,但在生长发育研究中,测量常常是不规则的,这就出现了个体测量时点多少不量常常是不规则的,这就出现了
38、个体测量时点多少不一、时间间隔不等以及观测值缺失等问题,它增加了一、时间间隔不等以及观测值缺失等问题,它增加了传统统计方法拟合个体生长曲线的难度,并引起估计传统统计方法拟合个体生长曲线的难度,并引起估计结果不同程度的偏差。结果不同程度的偏差。多水平统计模型 多水平模型技术可有效和方便地处理此类测量多水平模型技术可有效和方便地处理此类测量模式的数据,提供统计上有效的参数估计,并具有模式的数据,提供统计上有效的参数估计,并具有如下几个特点:如下几个特点:多水平统计模型(1) 考虑了分布于不同层次的测量误差,并给出相应考虑了分布于不同层次的测量误差,并给出相应的误差估计值;的误差估计值;(2) 拟合
39、个体生长曲线时不要求相等的时间间隔,在拟合个体生长曲线时不要求相等的时间间隔,在拟合个体生长曲线的同时也估计全部样本的平拟合个体生长曲线的同时也估计全部样本的平均曲线;均曲线;多水平统计模型(3) 不要求每个个体都有同样多的测量点,即缺不要求每个个体都有同样多的测量点,即缺失测量点并不增加拟合生长曲线的难度;失测量点并不增加拟合生长曲线的难度;(4) 便于在生长曲线中引入其它解释变量,如性便于在生长曲线中引入其它解释变量,如性别、营养状况等,分析其对生长过程的影响。别、营养状况等,分析其对生长过程的影响。多水平统计模型2. Meta分析是指对具有相同研究假设的多项独分析是指对具有相同研究假设的
40、多项独立研究结果所进行的合并分析,在合并不同来源的立研究结果所进行的合并分析,在合并不同来源的研究资料时可能引入异杂方差研究资料时可能引入异杂方差(heterogeneous variance),因此,其数据可看成具有两个水平的层,因此,其数据可看成具有两个水平的层次结构,即研究水平与个体水平。次结构,即研究水平与个体水平。多水平统计模型Meta分析的主要目的是为了得到比单一研究更精分析的主要目的是为了得到比单一研究更精确的结果估计,进一步的目的则是分析影响研究结果确的结果估计,进一步的目的则是分析影响研究结果间差异的因素。间差异的因素。目前,目前,Meta分析主要根据分析主要根据“效应尺度效
41、应尺度”的同质性的同质性检验结果,而决定采用固定效应模型或随机效应模型检验结果,而决定采用固定效应模型或随机效应模型来合并每项研究的来合并每项研究的“效应尺度效应尺度”。采用多水平模型可。采用多水平模型可较为方便地分析影响研究结果间差异的因素如研究水较为方便地分析影响研究结果间差异的因素如研究水平上的有关协变量包括样本含量、设计类型等。平上的有关协变量包括样本含量、设计类型等。多水平统计模型 3. 离散数据的多水平模型离散数据的多水平模型 在流行病学现场调查研究中,常对发病率、患病在流行病学现场调查研究中,常对发病率、患病率或死亡率以及它们在地区之间的变异感兴趣。这里率或死亡率以及它们在地区之
42、间的变异感兴趣。这里的两水平结构是,个体为水平的两水平结构是,个体为水平 1,地区为水平,地区为水平 2。多水平统计模型此类研究常常拥有若干地区某时期的死亡记录此类研究常常拥有若干地区某时期的死亡记录和死者个人特征以及地区特征如人口构成或社会经和死者个人特征以及地区特征如人口构成或社会经济特征等。研究者可以分析这些解释变量是否能够济特征等。研究者可以分析这些解释变量是否能够解释死亡率在地区之间的变异,也可以分析死亡率解释死亡率在地区之间的变异,也可以分析死亡率的差别的差别(比如男性和女性之间比如男性和女性之间)是否在地区之间不同等。是否在地区之间不同等。多水平统计模型4. 多变量多水平模型:多
43、变量多水平模型:在医学研究中,研究者常对个体作几种测量在医学研究中,研究者常对个体作几种测量(即即测量几个指标测量几个指标),如收缩压、舒张压和心率,如果将,如收缩压、舒张压和心率,如果将它们作为反应变量一起进行分析,就可以设置多变它们作为反应变量一起进行分析,就可以设置多变量模型,分析解释变量诸如年龄、性别、是否锻炼、量模型,分析解释变量诸如年龄、性别、是否锻炼、是否吸烟等与这三个反应变量的关系。此时,是将是否吸烟等与这三个反应变量的关系。此时,是将其作为一个两水平模型,每一个体作为一个水平其作为一个两水平模型,每一个体作为一个水平2单单位,位,3种测量组成水平种测量组成水平1单位。单位。多
44、水平统计模型5. 混合反应变量多水平模型混合反应变量多水平模型例如,测定人们的吸烟行为,可以测量某人例如,测定人们的吸烟行为,可以测量某人是否吸烟以及吸烟程度如何,我们可将其考虑为是否吸烟以及吸烟程度如何,我们可将其考虑为一个混合双变量模型,将有关吸烟的影响因素作一个混合双变量模型,将有关吸烟的影响因素作为模型中的解释变量进行分析。为模型中的解释变量进行分析。多水平统计模型多水平分析的主要优点:多水平分析的主要优点:1. 获得回归系数及其标准误的有效估计。获得回归系数及其标准误的有效估计。多水平统计模型2. 可在模型固定或随机部分引入任何水平上所测可在模型固定或随机部分引入任何水平上所测量的协
45、变量,能够探讨各水平单位的特征对反量的协变量,能够探讨各水平单位的特征对反应变量的影响,以及对反应变量在高水平单位应变量的影响,以及对反应变量在高水平单位甚至是低水平单位之间变异的影响,即这些特甚至是低水平单位之间变异的影响,即这些特征是否可以解释这些变异。征是否可以解释这些变异。多水平统计模型3. 在调整了低水平单位甚至高水平单位的各种特征在调整了低水平单位甚至高水平单位的各种特征后,可对高水平单位的残差估计进行排序和比后,可对高水平单位的残差估计进行排序和比较,用于识别极端的高水平单位。较,用于识别极端的高水平单位。 例如,比较若干医院某病治愈率的高低,例如,比较若干医院某病治愈率的高低,
46、在调整了患者、医护人员的各种特征之后,通在调整了患者、医护人员的各种特征之后,通过对医院水平残差估计的考察,可以发现某些过对医院水平残差估计的考察,可以发现某些极端的医院。极端的医院。多水平统计模型 若将其选出作进一步深入的个案调查,则形若将其选出作进一步深入的个案调查,则形成定量的多水平分析和定性调查相结合的研究,成定量的多水平分析和定性调查相结合的研究,有助于探讨更详细的因果机制。这是多水平分析有助于探讨更详细的因果机制。这是多水平分析的另一个重要特点。的另一个重要特点。多水平统计模型应用前景应用前景自然界与人类社会广泛存在着层次结构现象,自然界与人类社会广泛存在着层次结构现象,生物系统具
47、有自然的等级或组群结构,人类社会被生物系统具有自然的等级或组群结构,人类社会被组织成高度复杂的系统结构。组织成高度复杂的系统结构。多水平统计模型医学和公共卫生领域研究的一个重要方面是医学和公共卫生领域研究的一个重要方面是探索疾病发生、发展及其变化的规律性。疾病总探索疾病发生、发展及其变化的规律性。疾病总是在某种特定的环境中产生和发展的,即个体的是在某种特定的环境中产生和发展的,即个体的结局是由个体和所在环境的特征联合决定的。结局是由个体和所在环境的特征联合决定的。无论是观察性研究还是实验性研究,从时空无论是观察性研究还是实验性研究,从时空两个维度均可形成数据的层次结构。两个维度均可形成数据的层次结构。多水平统计模型 多水平模型复杂的误差结构适应并反映了数多水平模型复杂的误差结构适应并反映了数据相应的层次结构,这是多水平分析区别于经典据相应的层次结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南阳市生金安全培训
- 肾脏病教学查房教案
- 直线的点斜式方程高二数学同步课堂人教A版选择性必修第一册教案
- 高三物理光电效应光子教案
- 部编版五四学制五年级语文下册习作神奇的探险之旅教案
- 完整一年级道德与法治玩得真开心教案(2025-2026学年)
- 商业计划书模板教案
- 新教材高中地理第三单元从圈层作用看地貌土壤第四节分析土壤形成的原因教案
- 模块五课题三任务偏心轴三组合工件教案
- 六年级音乐下册五十六朵花人教新课标版教案
- 智能教育:科技驱动下的学校革新
- 汉字笔画练习字帖
- 酒店住宿和餐饮行业企业安全风险分级管控清单
- 手机靓号抵押借款合同
- GB/T 7044-2013色素炭黑
- GB/T 26059-2010钛及钛合金网板
- 羊的品种课件
- 国家开放大学《机械设计基础》机考试题001-009参考答案
- 《大卫-不可以》绘本
- (完整word版)Word信纸(A4横条直接打印版)模板
- 测试算例-各向同性湍流DNS
评论
0/150
提交评论