多层线性模型_第1页
多层线性模型_第2页
多层线性模型_第3页
多层线性模型_第4页
多层线性模型_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.多层线性模型简介,层次calline aramodel(HLM),主要内容,1,多层线性模型简介2,多层线性模型基本原理3,多层线性模型HLM软件应用程序。多层线性模型简介,1,多层数据结构的普遍性多层(多层)数据意味着观测数据在单元中具有嵌套关系。(1)教育研究领域EG:学生夹在班级里,班级夹在学校里,或者学生单纯夹在学校里,学生代表数据结构的第一层,班级或学校代表数据结构的第二层。如果学生在课程中细化数据,班级在学校中细化数据,则为三层数据结构。介绍多层线性模型,(2)组织心理学研究领域的Eg:员工不同的组织,工厂(3)开发心理学领域的Eg:纵向研究,重复研究在一段时间内多次观察孩子,不同时间的观察数据构成数据结构的第一层,孩子的个人差异构成数据结构的第二层。通过这种方式可以观察个人的发展趋势或发展曲线上的差异。两个水平层次数据,水平2,级别1,层次数据的普遍性,层次数据是常规组中的相关(intra-classcorrelation,ICC)度量,其中观测值在观测单位之间(或同一观测单位的观测值之间)不是独立的,也不是完全独立的。例如,同一个家庭的子女比起从一般群体中随机挑选的个体,更倾向于生理和心理特性相似。换句话说,子女的特征在家庭中相似,数据独立。在现有回归(OLS)中,与残差相互独立的假设相反,使用经典方法会导致参数估计的可行性丢失和不合理的推理。在经典方法的框架中,分析策略的经典线性模型只分析一层数据的问题,而不全面分析涉及两层或多层数据的问题。但是,有时会同时受到水平1变量和水平2变量的影响,有时会受到两个水平变量的相互作用(cross-levelinteraction)。对象的事件既受自己的特性和生活环境的影响,也受现有对象效果和环境或背景效果(contexteffect)的影响。例如,学生(个人)的学习成绩与学生的勤奋性有关,也与学校的教员分配有关。企业的创新能力与企业自身的创新投入、学习能力有关,也与企业所属产业的RD强度有关。多层线性模型介绍,2,多层数据的传统分析方法个人的行为既受个人的特性又受环境的影响,因此研究者们总是努力将个别效果与群组效果(背景效果或环境效果)区别开来。个别效果:个别自身性质导致的变异。群体效应:个人所处环境的变异。多层线性模型简介,(1)只关注单个效果,忽略组效果只考虑数据各层中变量之间的关系,观察到的效果同时包括单个效果和组效果,因此可以提高出错的概率,夸大变量之间的关系。(2)在组级别执行分析可能导致数据仅在第二级别的组之间工作,从而丢失重要的个人信息。多层线性模型简介,(3)组内分析组间分析计算相同数据三次。一个是对组中各个层次的分析,一个是组中的效果第二个是平均或合并第一个层次中各个数据,从而获得第二个级别的组之间的数据。组之间的效果第三种是忽略组的属性,分析所有数据,这称为总效果。在此基础上,计算组内效果和组间效果的百分比,以确定组间或组内是否发生了变异。组内分析组之间的分析方法比前两种方法考虑第一层次数据和第二层次数据对变异的影响更多,但是不能对组内效果和组间效果进行具体解释,也不能说明不同组变量之间的关系存在差异的原因。以73所学校的1905名学生为对象,考虑了高中入学成绩和3年后高考成绩之间的关系的HLM数学模型。考虑方法:(1)如果用传统的线性回归分析在学生水平上直接分析,可以看出入学学业成就度与高考成就度之间的回归直线,如下图1所示,从图1的结果可以看出传统回归分析并不区分不同学校之间的差异。图1:不考虑学校间差异的回归直线。HLM数学模型,(2)简单合并数据的话,可以用各学校学生的平均分数代替该学校的成绩,并得到一条回归直线,估计学校水平直接入学分数对入学考试分数的影响,如图2所示,该方法忽略了不同学生(个人)的差异;图2:无视学生差异回归直线的HLM数学模型,(3)假设不同学校入学成绩的高考分数的回归直线截距不同,斜率相同(平均学业成绩有差异),看图3的结果,可以看出不同学校学生的平均大学数学能力考试成绩有差异。图3:考虑各学校平均成绩差的回归线,HLM数学模型,(4)对73所学校分别进行了回归分析,得到了图4的结果,如图4所示,各学校回归线的截距和斜率都不同。也就是说,各学校的学生平均高考成绩各有不同,入学考试成绩对入学考试成绩的影响强度也不同。图4:考虑不同学校的平均成绩差异和入学对毕业成绩影响的差异的回归直线,在很多研究中,采样往往来自不同的级别和单位,通过解决这类问题的新数据分析方法多层模型分析技术,导致多个阶段(多层)的研究问题。这种方法开拓和发展的主要贡献者之一是英国伦敦大学的HarveyGoldstein教授和研究人员称这种方法为“多层分析”。美国密歇根大学的StephenW,另一位主要先驱。Raudenbush教授和同事将其称为“分层线性模型结构”。在此,我们使用诸如张雷的名称将其称为“多层线性模型”或“多层模型”。多层线性模型介绍,3,多层线性模型分析方法回归分析方法Eg:学生成绩(x)学习动机(y)班级教师教育水平(W)(1)每个班级学习动机的学生成绩回归,多层线性模型介绍,(2) 0j和110,介绍了多层线性模型,4,多层线性模型的优点(1)使用收缩估计的参数估计方法,进一步稳定准确地估计估计估计结果:使用两个估计权重的综合作为最终估计,一个是第一层数据中的OLS估计,另一个是第二层数据中的加权最小二乘法估计,最后一个估计是上述两个估计的权重。(2)样本可以处理多种数据,eg:如果部分第二级单位在第一级几乎没有采样,则可以使用其他第二级单位和第二级预测变量对样本较少的一级单位进行回归分析。第一层单元3个或更多。,多层线性模型简介,5,多层线性模型的适用范围(1)组织和管理研究(2)对象跟踪,多观察发展研究(3)教育研究(4)元分析研究,多层线性模型基本原理,1,多层线性模型的基本形态级别1(如学生)级别2(如学校),Yij -固定组件,第一学生,表示任意组件。多层线性模型的基本原理,作为固定组件的两层单元之间0j和1j的平均值作为随机组件的两层单元0j和1j的变异,合并多层线性模型的基本原理,第一级和第二级方程,如下所示:错误项目之间的相关性:具有相同第二级单位的对象在相同错误项目之间具有分布。具有相同第二级单位的对象之间的相似性与具有高于其他单位内对象的错误项目相关。包括残差条目,残差条目,多级线性模型基本原理,因此,多级数据在现有OLS回归分析中不能满足残差的很多假设。多层线性模型分解残差以更好地匹配实际情况,因此对多层数据使用多层线性模型更合理。多层线性模型主模型、2、多层线性模型的主模型零模型第一层和第二层没有预测变量。仅将方程式分解为分散元件分析的个别差异和群组差异所导致的部分。多级线性模型 0模型,第一级:第二级:合并模型:多级线性模型 0模型,第二级单位y的平均值表示第二级单位y的总体平均值,表示第二级方程式的残差(任意项)跨级相关性。指示y的总变化中第二级变化所产生的比例。多级线性模型整个模型,整个模型(TheFullModel)既包含第一级预测变量,又包含第二级预测变量,通过理论配置,您可以解释y的整体变形如何受第一级和第二级元素的影响。第一层:多级线性模型完整模型,第二级:多级线性模型整个模型,在第一级方程式中,0表示截距,1表示斜度在第二级方程式中,第一下标表示第一级参数的类型。第二个下标指示第二个标高参数的类型。0j和1j的预测变量可以相同,也可以不同。多层线性模型协方差模型可以在0模型和整个模型之间向每个层方程中添加其他变量,并设置其他随机分量和固定分量来构造各种分析模型。协方差模型(ANCOVAModel)第一级:第二级:多级线性模型协方差模型,在第一级方程式中,预测变量是整体平均值为参照的偏差,与现有协方差分析的区别是0j不再分解,1j没有随机项。协方差分析的重要前提是协方差变量反映变量回归系数的组间一致性。验证这种假设的方法是将纳入方程,并检查是否成立。多层线性模型随机效果回归模型,随机效果回归模型(RadomEeffectRegressionModel)第一层:第二层:多层线性模型随机效果回归模型,该模型与整体模型不同,因为第二层没有预测变量;第一层的0j和1j与现有OLS回归的不同之处在于,它们不是固定的,而是随机地寻找第一层的截距,第二层单元的倾斜变形。多级线性模型开发模型、开发模型开发模型作为时间的数学函数,使用多观测结果构建模型。主要用于开发研究、垂直研究或跟踪研究。在此模型中,第一层数据是不同时间的观察,第二层数据是单独的特征。多层线性模型开发模型,第一层:线性开发模型Time:通常是增量Eg:0、1、2、3、4、5-5、-4、-3、-2、-1、-1Eg:多层线性模型开发模型,“开发变分确定”的第二级:时间变量编码为0点y的全平均值,线性开发变分的全平均值,单个j和平均开发变分的偏差,单个j和平均变分的偏差。多层线性模型开发模型,“预测开发变化”的第二级:考虑第二级预测变量w后第一级的截距和第二级的斜率在第二级单位之间的残差分布,表明第二级变量w对第一级截距的影响。如果多级线性模型三级模型、第三级模型是第二级模型的直接扩展,则可以根据需要选择0模型和整个模型之间的任意模型。模型1:零模型第一层:第二层:第三层:多层线性模型三层模型,第一下标表示一层方程的参数;第二下标表示第二层方程的参数。第三个下标表示三层方程的参数。表示第二级单位之间的过渡,表示第三级单位之间的过渡级别之间的相关性。第一层分布与总分布的比率:第二层分布与总分布的比率:第三层分布与总分布的比率:多楼层线性模型 3楼层模型,模型2:整个模型第一楼层:第二楼层:多级线性模型第三级模型,第三级:HLM应用示例,Hsb1.sav和hsb2.sav级别1的数据文件hsb1.sav具有7185个观察示例和4个主要级别变量(第二级别指示变量:学校编号ID除外),这4个变量表示的含义如下:minority,学生的种族(1=少数民族,0=其他)female:学生性别(1=女性,0=男性)ses:由学生的社会地位、学生父母的教育水平、职业和收入组成的变量mathach,HLM应用示例,数据文件hsb2.sav包含160所学校,每个学校测量了6个学校级别变量(学校指标变量ID除外)。Size:学校注册数sector:学校类型(1=天主教会学校,0=公立学校)pracad:从事学术研究的学生比例disclim:学校纪律环境,规模测量himnty:学校注册少数学生比例说明(1=40),级别1数据,级别2数据,HLM应用程序示例:影响学生数学成绩的学生级别变量和学校级别变量分析。指定级别1变量,指定级别2变量,保存MDM模板创建MDM文件查看MDM的统计信息,MDM的说明统计信息,级别1的输出变量,无条件模型,选择无条件模型参数估计的结果。finaleswetimotionofiancecomponents :-randomeffectstandardvaria

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论