已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HLM 多层线性模型教程 1 认识多层线 性模型 浏览 111 更新 2014 03 01 09 43 1 在社会科学研究进行取样时 样本往往来自于不同的层级和单位 由此得到的 数据带来了很多跨级 多层 多层线性模型又叫做 多层分析 multilevel analysis 或者是 分层线性模型 hierarchical liner modeling 2 在社会科学中 多层线性的结构非常具有普遍性 如下图列出四种常见的情况 3 拿两层举例子 假如说现在我们考察学生自我效能感对学生成绩的影响 在 20 4 所学校中抽取了 1000 名学生 那么很有可能的情况就是有些学校学生的自我 效能感平均值较高 而这就有可能是因为学校为贵族学校 学生的经济水平很 高 而也可能有民工学校 经济水平较低 自我效能感普遍较低 那么这就存 在一种情况就是学生的成绩受到学生个体的自我效能感影响 而每个学校的自 我效能感可能与整个学校的整体经济水平有关 那么这就是学生嵌套在学校之 间的例子 5 多层线性模型的基本公式 6 拿上面的例子我们可以写出对于这个案例的多层线性模型 第一层 学生成绩 0 1 学生自我效能感 r 第二层 0 00 01 学校社会经济生活水平 1 1 10 11 学校社会经济生活水平 2 7 那么对于这样一类的多层线性的数据 我们该如何进行数据处理呢 小编将持 续为大家呈现与讲解 原作者 delta 数据工作室 HLM 多层线性模型教程 3 认识 HLM6 0 界面 浏览 186 更新 2014 03 04 09 44 1 2 3 4 5 6 7 分步阅读 采用 HLM6 0 分析多层线性模型能够非常直观的建立方程式 每层变量清晰明了 使用界面友好简洁 下面我将为大家介绍 HLM 6 0 的主界面 并告诉大家各界 面的主要功能 工具 原料 HLM6 0 方法 步骤 1 我们打开 HLM 的主界面 最上面的工具栏就是我们用到的主要菜单 首先 file 下面我们可以创建新的 hlm mdtm 文件 hlm 中最重要的文件 如下图 假如我们已经建立好了 HLM 的 MDM 文件 那么我们在下次打开的时候需要选 择 make new mdm from old mdm files HLM 不能直接打开之前的文件 可 以从之前的 MDM 文件中运行 我们需要新建立一个 HLM 处理 点击如下图 一般如果数据是存在 SPSS 或者 STATA SAS 中的选择 stata package input 2 然后我们会看到如下界面 我们一般用的就是 2 层 假如数据位 3 层结构 选择 HLM3 假如因变量为多个 可以选择下面的 MULTIVARIABLE 3 建立文件的界面主要如下图 区域 1 和区域 2 是 MDM 文件的名称与保存 两 个名称可以不一样 但是不能空着 区域 3 是数据类型的选择 假如数据位 人嵌套在组中 选择第一个 假如是追踪数据的多个时间点测量 选择第二 个 区域 4 是水平 1 的界定 区域 5 是水平 2 的界定 选择已经在 SPSS 中编 辑好的数据 然后界定第一层的变量和第二层的变量 详见下篇经验 最 后先 make mdm 然后我们可以检查 MDM 出来一些描述性的结果 如下图 2 然后我们点击 DONE 4 点击之后出现下面的界面 水平 1 的数据下包括右下方的所有变量 然后我 们点击因变量 将其设定为产出变量 假如本数据中 score 为因变量 左击 score 选择 outcome variable 5 然后左击自变量 有三种方式 一种是没有中心化的 一种是组中心化的 一组是总体中心化的数据 根据数据类型进行选择 一般假如是原始数据的 话选择没有中心化的 6 再者 我们有时候需要将第二层的某些方程中的随机效应改为固定效应 这 个时候在 HLM6 0 中的操作非常简单 只需要将你所需要固定的随机变量点击 变为灰色即可 如下图 7 然后继续设置第二层的变量 如上一样 注意设置哪个方程首先需要点击一 下该方程 8 然后我们就可以运行该程序了 我们也可以先保存再运行 运行之后的结果 默认会以 hlm2 为文件名的 txt 文档保存在 MDM 文件所放置的文件夹中 END 原作者 delta 数据工作室 HLM 多层线性模型教程 4 数据输入 spss 浏览 226 更新 2014 03 04 10 03 1 2 3 4 5 分步阅读 上一篇我们讲到了如何设置 MDM 文件 现在我们看看如何建立可以放入 HLM 中的数据库 以及在 HLM 的设置界面上如何进行设置 工具 原料 HLM6 0 SPSS22 0 方法 步骤 1 首先我们呈现给大家上篇中所采用的数据输入的结果 水平 1 和水平的 spss 文件如下图所示 2 我们可以看到水平 1 的 ID 和水平 2 的 ID 变量名是一样的 然后水平 1 的 ID 中为 1 的有很多个数据 这就是嵌套的结构 水平 1 嵌套在水平 2 中 这个一定要一一对应起来 水平 2 中可以不包含因变量 但是水平 1 中必须 有因变量 3 然后我们回到上一篇所讲到了页面的设置 如下图 水平 1 的数据文件选择之 后 然后我们点击右边的选择变量 4 然后我们可以看到下图弹出 选择 ID 和变量 ID 也就是两个文件关联的东 西 因此最开始在 spss 中进行数据输入的时候两个水平用同一个变量名会非 常方便 我们这里选择 ID 变量为 ID 号 其他的四个变量进入水平 1 5 然后我们继续设置水平 2 选择水平 2 的变量如下图 也将 ID 变量设置为 ID 号 其他的三个变量进入水平 2 6 6 这样我们的输入输入就算完成了 当然 HLM 还支持其他类型的数据 比如 stata SAS 等 有兴趣的同学可以继续钻研 因为我们平时处理数据用的最 多的是 SPSS 所以在此只介绍 SPSS 的数据在 HLM 中的输入 END 原作者 delta 数据 HLM 多层线性模型教程 5 结果解释 1 浏览 178 更新 2014 03 02 14 26 1 2 3 4 5 分步阅读 那么采用 HLM 软件如何看输出的结果呢 HLM 迄今没有中文版本 因此输出 结果全部以英文显示 但是其中很多内容是没有什么实质作用 因此我们也很 容易对其进行解读 下面来看一个我最近帮别人处理的数据输出结果 工具 原料 HLM6 0 软件 方法 步骤 1 在输出的最开始部分说明所用软件的名称 作者和发行公司 技术支持的联 系 EMail 地址 公司的网址和本次运行的时间等 2 以上显示有关文件的存放位置 模型各个层面上的单元个数 程序默认的最 大迭代次数被预定为 100 如果程序运行了 100 次迭代后发现模型不能收敛 就会自动询问使用者是否继续运行程序 这个时候 我们只需要输入 yes 即可 模型所用的参数估计方法为限制性极大似然估计 restricted maximum likehood 3 下面是对变量的加权情况描述 本次运算没有对参与计算的变量值进行加权 处理 同时表示模型中的因变量名为 score 4 下图描述模型中的固定部分 本例中第一层的固定部分由 4 个参数 截距 BO 和斜率 B1 B2 B3 第二层的固定部分有 16 个系数 5 然后如下图为模型表达式 6 由于篇幅原因 后面的结果请参照下一篇经验 END 原作者 delta 数据工作室 HLM 多层线性模型教程 6 结果分析 2 浏览 153 更新 2014 03 02 14 47 1 2 3 4 5 6 分步阅读 上一篇我们介绍了结果的前几个部分 这些部分都不是很重要 接下来我将为 大家解读后面输出的更重要的部分 工具 原料 HLM6 0 软件 方法 步骤 1 下图呈现的是对模型随机部分的信息描述 当前模型中第一层上的随机变异 为 sigma square 第二层的变异包括第一层截距和各个学率系数在第二城上 的变异 分别为协方差矩阵和相关矩阵 2 下图为对水平 1 的截距和斜率信度估计的值 注意后面英文有提示 本次信 度估计仅仅是基于 16 个单元中的 14 个 因为需要足够的信息进行计算 而 固定部分的结果是基于所有的数据 3 下图是最重要的 是固定部分最后的估计 有两个 一个是带有稳健的标准 误估计 with roubast error 一个没有 在本文中由于数据的原因不能进 行文件的标准误估计 因此没有呈现出来 4 下图是第一层和第二层各个随机效应的参数估计结果 5 最后给出的是反应当前模型整体你和程度的似然统计结果和模型中估计的参 数个数 供未来把该模型和其他模型进行比较时用 END 原作者 delta 数据工作室 分层线性模型 hierarchical linear model HLM 的原理及应用 一 概念 分层线性模型 hierarchical linear model HLM 又名多层线性模型 Multilevel Linear Model MLM 层次线性模型 Hierarch Linear Mode1 多层分析 Multilevel Analysis Model 相对于传统的两种统计方法 一般线性模型 general linear model GLM 和广义线性模型 generalized linear models GLMs 它们又有所不同 HLM 中的 线性模型指的是线性回归 不过它与一般的分层线性回归 Hierarchical Regression 又是 不同的 具体的不同见下面数学模型部分 HLM 又被通俗的称为 回归的回归 Wikipedia 一般线性回归和多重线性回归都是发生在单一层面 HLM 相对于更适用于嵌 套数据 nest data 在理解 HLM 之前应了解有关回归分析和嵌套设计 分层设计 的基本知识 二 模型 1 假设 由于个体行为不仅受个体自身特征的影响 也受到其所处环境 群体 层次 的 影响 相对于不同层次的数据 传统的线性模型在进行变异分解时 对群组效应分离不出 而增大模型的误差项 而且不同群体的变异来源也可能分布不同 可能满足不了传统回归 的方差齐性假设 在模型应用方面 不同群体 层次 的数据 也不能应用同一模型 鉴 于传统方法的局限性 分层技术则解决了这些生态谬误 Ecological Fallacy 它包含了 两个层面的假设 a 个体层面 这个与普通的回归分析相同 只考虑自变量 X 对因变量 Y 的影响 b 群组层面 群组因素 W 分别对个体层面中回归系数和截距的影响 2 数学模型 a 个体层面 Yij 0j 1jXij eij b 群组层面 0j 00 01Wj U0j 1j 10 11Wj U1j 涉及到多个群组层次的时候原理与之类似 可以把较低级层次的群组 如不同的乡镇层 面与不同的县市层面 可以这样理解 乡镇即是一个个体 群组即是不同的县市 更多层 次的可以这样理解 一直是下一层对上一层回归系数和截距的回归 与普通的 回归的回归 不同的是 整个计算过程通过迭代过程完成 3 因变量 此处数学模型仅适用于连续的单因变量 非连续因变量 多因变量 潜变量以及非典型 的嵌套设计 多层线性模型也可以进行处理 但对模型的设定会更复杂 4 与分层回归的区别 a 向前回归 向后回归和逐步回归 向前回归 根据自变量对因变量的贡献率 首先选择一个贡献率最大的自变量进入 一 次只加入一个进入模型 然后 再选择另一个最好的加入模型 直至选择所有符合标准者 全部进入回归 向后回归 将自变量一次纳入回归 然后根据标准删除一个最不显著者 再做一次回归 判断其余变量的取舍 直至保留者都达到要求 逐步回归是向前回归法和向后回归法的结合 首先按自变量对因变量的贡献率进行排序 按照从大到小的顺序选择进入模型的变量 每将一个变量加入模型 就要对模型中的每个 变量进行检验 剔除不显著的变量 然后再对留在模型中的变量进行检验 直到没有变量 可以纳入 也没有变量可以剔除为止 向前回归 向后回归和逐步回归都要按照一定判断标准执行 即在将自变量加入或删除模 型时 要进行偏 F 检验 b 分层回归与前三者的区别与联系 在理解分层回归与以上三者的区别时 应理解以下三个概念 总体变异 预测变量 X 和结果变量 Y 之间相关的平方 它包括该 X 和 Y 之间的所有关 系 共同变异 在每个 X 互相独立的理想情况下 共同变异为 0 它指的是 X 对 Y 的影响的 重叠部分 独特变异 在控制了其他变量以后 特定 X 对 Y 的影响 它表示了 Y 中由特定 X 所单 独解释的变异 假如 X 之间存在重叠 那么它们共有的变异就会削弱独特变异 X 的独特 效应指的是去除重叠效应后该 X 与 Y 的偏相关的平方 可以看出 X 的独特变异依赖于其 他预测变量 在强制回归 ENTER 法 中 所有预测变量的偏决定系数之和要小于整个模型的决定系数 R2 总决定系数包括偏决定系数之和与共同变异 强制回归 ENTER 法 的局限性在 于不能将重叠 共同 变异归因于模型中的任何一个预测变量 每个预测变量只能分配到 它所解释的独特变异 共同变异则被抛弃了 此时的偏相关的平方与回归系数是等同的 分层回归与以上三种方法则提供了一种可以将共同变异分配给特定预测变量的方法 共同 变异将会分配给优先进入模型的变量 在分层回归中 将会把重叠 共同 变异分配给第 一层模型中的预测变量 因此 上面三种方法则是针对自变量而言的 而分层回归则针对 第一层 优先层的模型 分层回归则是由研究者根据经验和理论思考来将自变量分成不 同的组 block 然后再安排每一组变量进入模型的顺序 进入的顺序不是根据贡献率 而是根据相应的理论假设 而且 研究者还可以为不同组的自变量选用不同的纳入变量的 方法 从这个意义上说 它与前面三种回归方法只是指定变量进入模型的方式不同 c 分层回归与分层线性模型 从回归模型中 可以看出 分层回归更像是分组回归或者分块回归 而与分层线性模型 中的分层 性质是完全不一样的 三 类型 1 群组模型 即以上所介绍的研究背景效应的数据处理方式 2 发展模型 主要用于追踪研究的模型建构 不同时间的观察结果 第一层 嵌套于被观察个体 第 二层 研究不同的个体对时间效应的回归系数和截距产生了何种影响 在这个模型中 个体不是第一层 而是时间效应 这是发展模型与群组模型在模型建构上的区别 四 应用评价 多层线性模型的适用范围非常广 凡是具有嵌套和分层的数据均可使用多层线性模型进 行分析 此外 多层线性模型还可以用于纵向研究 采用多层分析的方法处理重复测量数 据与时间变量之间的关系 在多层结构中可以对非平衡测量数据得到参数的有效估计 因 此用多层分析法处理重复测量的数据 不要求所有的观测个体有相同的观测次数 在纵向 调查研究中 由于各种各样的原因 被试个体观测值部分缺失的情况时有发生 因此多层 分析法处理缺失数据而不影响参数估计精度的这一特征 使得多层分析法处理在处理纵向 观测数据时 比传统多元重复测量方法有很大的优势 与传统的用于处理多元重复测量数据的方差分析和回归分析方法相比 多层分析法至少 具有以下优点 1 多层分析法通过考虑测量水平和个体水平不同的差异 明确表示出个体在水平 1 不同 测量点 的变化情况 因而对于数据的解释 个体随时间的增长趋势 是在个体与重复测 量交互作用基础上的解释 即不仅包含了不同测量点的差异 而且包含了个体之间存在的 差异 2 多层分析法对数据资料较传统多元重复测量方法有较低的要求 对于重复测量的次数和 重复测量之间的时间跨度都没有严格的限制 不同个体可以有不同的测量次数 测量与测 量之间的时间跨度也可以不同 3 多层分析模型可以定义重复观测变量之间复杂的协方差结构 并且对所定义的不同的协 方差结构进行显著性检验 在多层分析模型中 通过定义第一水平和第二水平的随机变异 来解释个体随时间的复杂变化情况 当数据满足传统多变量重复测量模型对数据的要求和 假设时 层次分析法得到与传统固定效应多元重复测量模型相同的参数估计和假设检验结 果 用多层分析模型可以考虑更高一层的变量 如不同地区儿童对个体增长的影响 但是多层分析模型也有缺点 首先用于多层分析模型的参数估计方法较传统估计参数的 方法要复杂得多 而且不能处理变量之间间接的影响关系和处理复杂的观测变量和潜变量 之间的关系 五 HLM 软件分析步骤 具体操作步骤可以参看 张雷等 多层线性模型应用 北京 教育科学出版社 2005 p42 1 创建 HLM 可识别的数据文件 ssm mdm 格式 a 创建 SSM 数据文件的原始数据准备 HLM 支持的原始数据格式包括纯文本 SPSS SAS STAT 等主流统计软件 如果不兼容 可以转换成 HLM 支持的数据格式 一般而言 一层结构一个数据文件 而且这些数据文件 需要存在一个同样的标识变量 ID 最好是数字型的 每层的数据文件均按照这个标识 变量排序 b 生成 MDM 文件 指定数据层级及相关信息 选择你需要建立的模型层数 以下以两层为例 选择群组嵌套设计还是追踪测量设计 浏览指定第一层的文件 指定标识变量和非标识变量 指定对缺失数据的处理 浏览指 定第二层的文件 指定标识变量和非标识变量 HLM 的高层数据不允许缺失 如果是两层以上的数据 原理相同 只不过最高层要指定下一层级的标识变量 ID
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内分泌科科普
- 内分泌用药官方培训课件
- 冀时调培训课件
- 兽药质检流程培训课件
- 计量确认记录的管理制度(3篇)
- 车站精细管理制度(3篇)
- 酒店给水设备区管理制度(3篇)
- 兽药GSP培训课件
- 《GA 447-2003警服材料 精梳涤棉混纺格子布》专题研究报告
- 2026年及未来5年市场数据中国KTV点歌系统行业市场竞争格局及发展趋势预测报告
- 《山东省市政工程消耗量定额》2016版交底培训资料
- 《中医六经辨证》课件
- 挂名合同协议书
- 苏教版高中化学必修二知识点
- 2024年国家公务员考试国考中国人民银行结构化面试真题试题试卷及答案解析
- 2025年中考语文一轮复习:民俗类散文阅读 讲义(含练习题及答案)
- 高中数学选择性必修一课件第一章 空间向量与立体几何章末复习(人教A版)
- 标准商品房买卖合同文本大全
- LY/T 3408-2024林下经济术语
- 2025年湖南邵阳市新邵县经济开发区建设有限公司招聘笔试参考题库附带答案详解
- 2023-2024学年八年级(上)期末数学试卷
评论
0/150
提交评论