HLM多层线性模型教程.docx

上传人：T*** IP属地：江西上传时间：2019-11-22 格式：DOCX 页数：26 大小：1.09MB 积分：15 举报 版权申诉

已阅读5页，还剩21页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

HLM多层线性模型教程：1认识多层线性模型 | 浏览：111 | 更新：2014-03-01 09:431. 在社会科学研究进行取样时，样本往往来自于不同的层级和单位，由此得到的数据带来了很多跨级（多层）。多层线性模型又叫做“多层分析（multilevel analysis）”或者是“分层线性模型（hierarchical liner modeling）”。2. 在社会科学中，多层线性的结构非常具有普遍性，如下图列出四种常见的情况3. 拿两层举例子，假如说现在我们考察学生自我效能感对学生成绩的影响，在204. 所学校中抽取了1000名学生，那么很有可能的情况就是有些学校学生的自我效能感平均值较高，而这就有可能是因为学校为贵族学校，学生的经济水平很高。而也可能有民工学校，经济水平较低，自我效能感普遍较低。那么这就存在一种情况就是学生的成绩受到学生个体的自我效能感影响，而每个学校的自我效能感可能与整个学校的整体经济水平有关。那么这就是学生嵌套在学校之间的例子。5. 多层线性模型的基本公式6. 拿上面的例子我们可以写出对于这个案例的多层线性模型。第一层：学生成绩=0+1*学生自我效能感+r第二层：0=00+01*学校社会经济生活水平+1 1=10+11*学校社会经济生活水平+27. 那么对于这样一类的多层线性的数据，我们该如何进行数据处理呢，小编将持续为大家呈现与讲解。原作者：delta数据工作室HLM多层线性模型教程：3认识HLM6.0界面 | 浏览：186 | 更新：2014-03-04 09:44 1 2 3 4 5 6 7分步阅读采用HLM6.0分析多层线性模型能够非常直观的建立方程式，每层变量清晰明了，使用界面友好简洁。下面我将为大家介绍HLM 6.0的主界面，并告诉大家各界面的主要功能。工具/原料 HLM6.0方法/步骤1. 我们打开HLM的主界面，最上面的工具栏就是我们用到的主要菜单，首先file下面我们可以创建新的hlm/mdtm文件（hlm中最重要的文件），如下图，假如我们已经建立好了HLM的MDM文件，那么我们在下次打开的时候需要选择make new mdm from old mdm files，HLM不能直接打开之前的文件，可以从之前的MDM文件中运行。我们需要新建立一个HLM处理，点击如下图，一般如果数据是存在SPSS或者STATA，SAS中的选择stata package input2. 然后我们会看到如下界面，我们一般用的就是2层，假如数据位3层结构，选择HLM3，假如因变量为多个，可以选择下面的MULTIVARIABLE。3. 建立文件的界面主要如下图，区域1和区域2是MDM文件的名称与保存，两个名称可以不一样，但是不能空着。区域3是数据类型的选择，假如数据位人嵌套在组中，选择第一个，假如是追踪数据的多个时间点测量，选择第二个。区域4是水平1的界定，区域5是水平2的界定。选择已经在SPSS中编辑好的数据，然后界定第一层的变量和第二层的变量（详见下篇经验）。最后先make mdm 然后我们可以检查MDM，出来一些描述性的结果，如下图2，然后我们点击DONE4. 点击之后出现下面的界面，水平1的数据下包括右下方的所有变量。然后我们点击因变量，将其设定为产出变量，假如本数据中score为因变量，左击score，选择outcome variable。5. 然后左击自变量，有三种方式，一种是没有中心化的，一种是组中心化的，一组是总体中心化的数据，根据数据类型进行选择，一般假如是原始数据的话选择没有中心化的。6. 再者，我们有时候需要将第二层的某些方程中的随机效应改为固定效应，这个时候在HLM6.0中的操作非常简单，只需要将你所需要固定的随机变量点击变为灰色即可，如下图7. 然后继续设置第二层的变量，如上一样，注意设置哪个方程首先需要点击一下该方程。8. 然后我们就可以运行该程序了。我们也可以先保存再运行，运行之后的结果默认会以hlm2为文件名的txt文档保存在MDM文件所放置的文件夹中。END原作者：delta数据工作室HLM多层线性模型教程：4数据输入（spss) | 浏览：226 | 更新：2014-03-04 10:03 1 2 3 4 5分步阅读上一篇我们讲到了如何设置MDM文件，现在我们看看如何建立可以放入HLM中的数据库，以及在HLM的设置界面上如何进行设置。工具/原料 HLM6.0 SPSS22.0方法/步骤1. 首先我们呈现给大家上篇中所采用的数据输入的结果，水平1和水平的spss文件如下图所示。2. 我们可以看到水平1的ID和水平2的ID变量名是一样的，然后水平1的ID中为1的有很多个数据，这就是嵌套的结构，水平1嵌套在水平2中，这个一定要一一对应起来。水平2中可以不包含因变量，但是水平1中必须有因变量。3. 然后我们回到上一篇所讲到了页面的设置,如下图，水平1的数据文件选择之后，然后我们点击右边的选择变量4. 然后我们可以看到下图弹出，选择ID和变量，ID也就是两个文件关联的东西，因此最开始在spss中进行数据输入的时候两个水平用同一个变量名会非常方便，我们这里选择ID变量为ID号，其他的四个变量进入水平15. 然后我们继续设置水平2，选择水平2的变量如下图，也将ID变量设置为ID号，其他的三个变量进入水平2.6. 6这样我们的输入输入就算完成了。当然HLM还支持其他类型的数据，比如stata SAS等。有兴趣的同学可以继续钻研，因为我们平时处理数据用的最多的是SPSS 所以在此只介绍SPSS的数据在HLM中的输入END原作者：delta数据HLM多层线性模型教程：5结果解释1 | 浏览：178 | 更新：2014-03-02 14:26 1 2 3 4 5分步阅读那么采用HLM软件如何看输出的结果呢？HLM迄今没有中文版本，因此输出结果全部以英文显示。但是其中很多内容是没有什么实质作用，因此我们也很容易对其进行解读。下面来看一个我最近帮别人处理的数据输出结果。工具/原料 HLM6.0软件方法/步骤1. 在输出的最开始部分说明所用软件的名称、作者和发行公司、技术支持的联系EMail地址、公司的网址和本次运行的时间等。2. 以上显示有关文件的存放位置，模型各个层面上的单元个数，程序默认的最大迭代次数被预定为100，如果程序运行了100次迭代后发现模型不能收敛，就会自动询问使用者是否继续运行程序，这个时候，我们只需要输入“yes”即可。模型所用的参数估计方法为限制性极大似然估计（restricted maximum likehood).3. 下面是对变量的加权情况描述，本次运算没有对参与计算的变量值进行加权处理。同时表示模型中的因变量名为score。4. 下图描述模型中的固定部分，本例中第一层的固定部分由4个参数：截距BO和斜率B1，B2，B3；第二层的固定部分有16个系数。5. 然后如下图为模型表达式6. 由于篇幅原因，后面的结果请参照下一篇经验。END原作者：delta数据工作室HLM多层线性模型教程：6结果分析2 | 浏览：153 | 更新：2014-03-02 14:47 1 2 3 4 5 6分步阅读上一篇我们介绍了结果的前几个部分，这些部分都不是很重要，接下来我将为大家解读后面输出的更重要的部分。工具/原料 HLM6.0软件方法/步骤1. 下图呈现的是对模型随机部分的信息描述，当前模型中第一层上的随机变异为sigma square,第二层的变异包括第一层截距和各个学率系数在第二城上的变异。分别为协方差矩阵和相关矩阵。2. 下图为对水平1的截距和斜率信度估计的值，注意后面英文有提示，本次信度估计仅仅是基于16个单元中的14个，因为需要足够的信息进行计算，而固定部分的结果是基于所有的数据。3. 下图是最重要的，是固定部分最后的估计。有两个，一个是带有稳健的标准误估计（with roubast error)，一个没有。在本文中由于数据的原因不能进行文件的标准误估计，因此没有呈现出来。4. 下图是第一层和第二层各个随机效应的参数估计结果。5. 最后给出的是反应当前模型整体你和程度的似然统计结果和模型中估计的参数个数，供未来把该模型和其他模型进行比较时用。END原作者：delta数据工作室分层线性模型（hierarchical linear model HLM）的原理及应用一、概念：分层线性模型（hierarchical linear model HLM）又名多层线性模型（Multilevel Linear Model MLM）、层次线性模型（Hierarch Linear Mode1）、多层分析（Multilevel Analysis/Model）。相对于传统的两种统计方法：一般线性模型（general linear model GLM）和广义线性模型（generalized linear models GLMs），它们又有所不同，HLM中的线性模型指的是线性回归，不过它与一般的分层线性回归（Hierarchical Regression）又是不同的，具体的不同见下面数学模型部分。HLM又被通俗的称为“回归的回归”。Wikipedia：“一般线性回归和多重线性回归都是发生在单一层面，HLM相对于更适用于嵌套数据（nest data）。” 在理解HLM之前应了解有关回归分析和嵌套设计（分层设计）的基本知识。二、模型：1、假设：由于个体行为不仅受个体自身特征的影响，也受到其所处环境（群体/层次）的影响。相对于不同层次的数据，传统的线性模型在进行变异分解时，对群组效应分离不出，而增大模型的误差项。而且不同群体的变异来源也可能分布不同，可能满足不了传统回归的方差齐性假设。在模型应用方面，不同群体（层次）的数据，也不能应用同一模型。鉴于传统方法的局限性，分层技术则解决了这些生态谬误（Ecological Fallacy）。它包含了两个层面的假设：a、个体层面：这个与普通的回归分析相同，只考虑自变量X对因变量Y的影响。b、群组层面：群组因素W分别对个体层面中回归系数和截距的影响。2、数学模型：a、个体层面：Yij=0j+1jXij+eijb、群组层面：0j=00+01Wj+U0j1j=10+11Wj+U1j 涉及到多个群组层次的时候原理与之类似，可以把较低级层次的群组，如不同的乡镇层面与不同的县市层面，可以这样理解，乡镇即是一个个体，群组即是不同的县市。更多层次的可以这样理解，一直是下一层对上一层回归系数和截距的回归。与普通的“回归的回归”不同的是，整个计算过程通过迭代过程完成。3、因变量：此处数学模型仅适用于连续的单因变量。非连续因变量、多因变量、潜变量以及非典型的嵌套设计，多层线性模型也可以进行处理，但对模型的设定会更复杂。4、与分层回归的区别：a、向前回归、向后回归和逐步回归：向前回归：根据自变量对因变量的贡献率，首先选择一个贡献率最大的自变量进入，一次只加入一个进入模型。然后，再选择另一个最好的加入模型，直至选择所有符合标准者全部进入回归。向后回归：将自变量一次纳入回归，然后根据标准删除一个最不显著者，再做一次回归判断其余变量的取舍，直至保留者都达到要求。逐步回归是向前回归法和向后回归法的结合。首先按自变量对因变量的贡献率进行排序，按照从大到小的顺序选择进入模型的变量。每将一个变量加入模型，就要对模型中的每个变量进行检验，剔除不显著的变量，然后再对留在模型中的变量进行检验。直到没有变量可以纳入，也没有变量可以剔除为止。向前回归、向后回归和逐步回归都要按照一定判断标准执行。即在将自变量加入或删除模型时，要进行偏F检验。b、分层回归与前三者的区别与联系：在理解分层回归与以上三者的区别时，应理解以下三个概念。总体变异：预测变量X和结果变量Y之间相关的平方，它包括该X和Y之间的所有关系。共同变异：在每个X互相独立的理想情况下，共同变异为0。它指的是X对Y的影响的重叠部分。独特变异：在控制了其他变量以后，特定X对Y的影响。它表示了Y中由特定X所单独解释的变异。假如X之间存在重叠，那么它们共有的变异就会削弱独特变异。X的独特效应指的是去除重叠效应后该X与Y的偏相关的平方。可以看出，X的独特变异依赖于其他预测变量。在强制回归（ENTER法）中，所有预测变量的偏决定系数之和要小于整个模型的决定系数（R2）。总决定系数包括偏决定系数之和与共同变异。强制回归（ENTER法）的局限性在于不能将重叠（共同）变异归因于模型中的任何一个预测变量，每个预测变量只能分配到它所解释的独特变异，共同变异则被抛弃了。此时的偏相关的平方与回归系数是等同的。分层回归与以上三种方法则提供了一种可以将共同变异分配给特定预测变量的方法。共同变异将会分配给优先进入模型的变量。在分层回归中，将会把重叠（共同）变异分配给第一层模型中的预测变量。因此，上面三种方法则是针对自变量而言的，而分层回归则针对第一层（优先层的模型）。分层回归则是由研究者根据经验和理论思考来将自变量分成不同的组（block），然后再安排每一组变量进入模型的顺序，进入的顺序不是根据贡献率，而是根据相应的理论假设。而且，研究者还可以为不同组的自变量选用不同的纳入变量的方法。从这个意义上说，它与前面三种回归方法只是指定变量进入模型的方式不同。c、分层回归与分层线性模型：从回归模型中，可以看出，分层回归更像是分组回归或者分块回归，而与分层线性模型中的分层，性质是完全不一样的。三、类型1、群组模型：即以上所介绍的研究背景效应的数据处理方式。2、发展模型：主要用于追踪研究的模型建构。不同时间的观察结果（第一层）嵌套于被观察个体（第二层），研究不同的个体对时间效应的回归系数和截距产生了何种影响。在这个模型中，个体不是第一层，而是时间效应，这是发展模型与群组模型在模型建构上的区别。四、应用评价多层线性模型的适用范围非常广，凡是具有嵌套和分层的数据均可使用多层线性模型进行分析。此外，多层线性模型还可以用于纵向研究。采用多层分析的方法处理重复测量数据与时间变量之间的关系。在多层结构中可以对非平衡测量数据得到参数的有效估计。因此用多层分析法处理重复测量的数据，不要求所有的观测个体有相同的观测次数。在纵向调查研究中，由于各种各样的原因，被试个体观测值部分缺失的情况时有发生，因此多层分析法处理缺失数据而不影响参数估计精度的这一特征，使得多层分析法处理在处理纵向观测数据时，比传统多元重复测量方法有很大的优势。与传统的用于处理多元重复测量数据的方差分析和回归分析方法相比，多层分析法至少具有以下优点：1、多层分析法通过考虑测量水平和个体水平不同的差异，明确表示出个体在水平1（不同测量点）的变化情况，因而对于数据的解释（个体随时间的增长趋势）是在个体与重复测量交互作用基础上的解释，即不仅包含了不同测量点的差异，而且包含了个体之间存在的差异。2、多层分析法对数据资料较传统多元重复测量方法有较低的要求，对于重复测量的次数和重复测量之间的时间跨度都没有严格的限制。不同个体可以有不同的测量次数，测量与测量之间的时间跨度也可以不同。3、多层分析模型可以定义重复观测变量之间复杂的协方差结构，并且对所定义的不同的协方差结构进行显著性检验。在多层分析模型中，通过定义第一水平和第二水平的随机变异来解释个体随时间的复杂变化情况，当数据满足传统多变量重复测量模型对数据的要求和假设时，层次分析法得到与传统固定效应多元重复测量模型相同的参数估计和假设检验结果。用多层分析模型可以考虑更高一层的变量，如不同地区儿童对个体增长的影响。但是多层分析模型也有缺点，首先用于多层分析模型的参数估计方法较传统估计参数的方法要复杂得多，而且不能处理变量之间间接的影响关系和处理复杂的观测变量和潜变量之间的关系。五、HLM软件分析步骤：具体操作步骤可以参看：张雷等.多层线性模型应用.北京：教育科学出版社，2005.p42.1、创建HLM可识别的数据文件（*.ssm/mdm格式）a、创建SSM数据文件的原始数据准备：HLM支持的原始数据格式包括纯文本，SPSS，SAS，STAT等主流统计软件，如果不兼容，可以转换成HLM支持的数据格式。一般而言，一层结构一个数据文件，而且这些数据文件，需要存在一个同样的标识变量（ID），最好是数字型的。每层的数据文件均按照这个标识变量排序。b、生成MDM文件（指定数据层级及相关信息）：选择你需要建立的模型层数，以下以两层为例。选择群组嵌套设计还是追踪测量设计=浏览指定第一层的文件=指定标识变量和非标识变量=指定对缺失数据的处理；浏览指定第二层的文件=指定标识变量和非标识变量（HLM的高层数据不允许缺失）。如果是两层以上的数据，原理相同，只不过最高层要指定下一层级的标识变量ID及总标识变量。

人人文库> 全部分类> 教育资料 > 课设设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

HLM多层线性模型教程.docx

文档简介

温馨提示

最新文档

评论

HLM多层线性模型教程.docx

文档简介

温馨提示

最新文档

评论

相关文档