




免费预览已结束
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8 4 结构方程模型下非正态数据的处理 安徽师范大学体育学院 2 4 1 0 0 0 方敏黄正峰 结构方程模型 S E M 的多变量正态分布假定观 察变量来源于一个多元正态 J M V N 的总体 在这种 前提下 最大似然法 m a x i m u ml i k e l i h o o d M L 方法 给出的参数估计无偏 一致 渐近有效 如果抽样数据 非正态分布 整体模型拟合的 值会膨胀 个别参数 值的标准误估计偏小 导致该参数估计值达到统计上 的显著水平 接纳实际上没有意义的参数 T L I 或C F I 等拟合度指标出现低估现象 这意味着 当数据违 背J M V N 分布假定时 研究者更有可能拒绝实际上构 建很好的模型 或者认为个别参数估计不为0 增大了 统计学推断的I 型错误 对模型修正得到包含冗余参 数的模型 因此 非正态数据的处理是应用结构方程 模型技术时需要注意的问题 处理非正态数据的常用方法 对于非正态数据的处理 如果观察指标属于连续 变量 研究者可以选用不受正态分布限制的A D F W L S 估计法 或使用S c a l e d 和R o b u s t 标准误 或使 用B o o t s t r a p p i n g 后的校正标准误 还可以运用统计方 法对非正态分布的变量进行数据转换 相对于连续数 据 如果测量变量为类别或次序性时 研究者可选用 M p l u s 的C V M c a t e g o r i c a lv a r i a b l e sm o d e l 类别变量 模式 其基本思路是先计算多分相关矩阵 再使用 A D F 估计 如果这些要求不易做到或因使用多分相 关矩阵分析产生非正定矩阵时 研究者可考虑使用项 目包 i t e mp a r c e l i n g 方法进行模型分析 另外 一些 研究者将次序性变量视为连续变量处理 但是这一方 法可能会产生以下后果 过度的偏态和峰度会严重影 响 和参数的z 检验 与类别大小比较 值更容易 受到偏态与峰度的影响 标准化系数估计值有变小的 趋势 尤其类别数很小时 更易出现测量误差相关现 象n 因此 研究者在测验之前应考虑尽量增加次序 性尺度的类别数 以减少这类问题的出现 对于S E M 程序下非正态数据的处理 归纳起来常有 运用渐近分 布自由估计拟合指数 参数估计和标准误 r 和标准 误的校正 使用B o o t s t r a p 计算矿值 参数估计和标准 误等3 种方法 1 渐近分布自由 安徽省高校省级自然科学研究项目 K 2 0 0 9 B I l l Z B r o w n e S 渐近分布自由 a s y m p t o t i cd i s t r i b u t i o n f r e e A D F 估计虽然无需假设数据呈多元正态分布 许多软件可以实现 但有一些实际性限制 拟合函数 的计算需要做A D F 最佳加权矩阵的转置 以含有2 0 个测量变量的C F A 模式为例 需要转置一个2 1 0 x 2 1 0 的加权矩阵 含有4 41 0 0 的唯一要素 计算需要超过 l0 0 0 的大样本才能产生稳定的估计 对于小或中等大 小的样本A D F 估计效果很差 如数据有缺失必须使 用表列删除法 否则会出现处理不同矩阵使牵涉不同 观察值的数目 导致运算困难 正如M u t h 6 n 1 9 9 3 指出的 A D F 估计法没有考虑到实际应用中模型大小 和样本数量的问题 使用A D F 估计模型可能仅是理论 上的选择而非实用的方法 2 S c a l e d 和R o b u s t 标准误方法 为了提高非正态分布下M L 估计 和标准误的 精度 S a t o r r a 与B e n t l e r 1 9 8 8 提出了调整卡方统计 量 S c a l e d X 2 使之符合 分布 这种校正方法主要 考虑峰度对估计的危害 如果观察变量的多元峰度越 大 对于正态理论的 越做向下的调整 E Q S 软件 m l r o b u s t 提供了该校正方法的程序 C u r r a n 等 1 9 9 6 认为这种方法应用于连续性非正态变量小样 本 2 0 0 5 0 0 资料相当好 M p l u s 软件m l m 也提 供了类似的调整的 检验统计量以及稳健标准误 r o b u s ts t a n d a r de r r o r s 还可以通过该软件的m l m v 选项提供类似的检验统计量 称为调整均数和方差的 统计量 m e a na n dv a r i a n c ea d j u s t e dc h i s q u a r es t a f f s t i c F o u l a d i 1 9 9 8 一项模拟研究发现这种方法优 于标准的M Lr 和原始的S c a l e dr 特别是在小样本 时 但是目前对其应用很少 很难反映在各种情况 下该方法的优越性 3 解靴带方法 解靴带抽样是指以原来样本为抽样总体 采用有 放回地随机抽样抽取同一大小的样本 如此重复此步 骤所得样本称为B o o t s t r a ps a m p l e s 接着进行每一 B o o 咖p 样本的参数估计 最后计算每一参数的均值 和标准误H S E M 的B o o t s t r a p 方法有 B o l l e n S t i n e 法 偏差校正法 b i a sc o r r e c t i o n 和百分点校正法 p e r c e n t i l e c o r r e c t i o n F o u l a d i 通过模拟研究比较了不同 样本量及分布情形下B o l l e n S t i n e 解靴带法与s c a l i n g r 法的性能 B o l l e n S t i n e 检验相对较好 尤其在控制 万方数据 C h i n e s eJ o t t r n a lo fH e a l t h S t a t i s t i c s F e b2 0 1 0 V 0 1 2 7 N o 1 I 类错误或小样本时 采用解靴带样本用于校正模型 拟合检验的r 统计量 计算估计参数的标准误 在非 正态数据的S E M 模型研究中 特别是小样本 B o o t s t r a p p i n g 的应用效果较理想 另外 还可以利用统计方法进行数据转换 数据的 正态性转换视数据分布的特性而定 原始数据分布为 低阔峰时可取倒数 原始数据分布为负偏时可取平方 根 原始数据为正偏时可取对数 B o l l e n S t i n eB o o t s t r a p 计算原理 在非正态S E M 应用中 B o l l e n S t i n e 解靴带法将 原始数据矩阵转换使随机样本满足虚无假设的方法应 用于评价S E M 的拟合 迫使再抽样空间满足模型8 0 隐含协方差矩阵等于总体协方差矩阵 获得Z 转 换数据矩阵 Z Y P S 一1 2 1 2 y 为N X P 总体矩阵 s 为饱和模型隐含协方差 矩阵 为H 0 模型的隐含协方差矩阵 再对z 进行解靴带抽样和估计 解靴带得到校正 的B o l l e n S t i n eP 值检验模型拟合 产生参数估计 参数 估计的标准误以及个别参数是否为零的假设检验 B o l l e n S t i n e 解靴带法处理非正态数据的方法不 是调整r 值 而是调整r 临界值 在J V l V N 假定下 如果接受模型拟合 则 检验的期望值应等于模型的 自由度 奶 例如 如果拟合模型为真 数据满足多元 正态分布 矽 2 0 那么期望的r 值应等于2 0 但是 非正态数据下模型拟合的标准M L 值会膨胀超过 自由度 比如说3 0 解靴带方法是重新产生一个整体 模型拟合的 临界值 不是J M V N 下期望的z 2 2 0 而是通过解靴带方法产生一个可能为2 7 的临界值 于是 原来r 值3 0 与解靴带的 临界值2 7 比较 而 不是与模型的自由度2 0 比较 因此 校正的P 值为 B o o t s t r a p 临界值与原来M L 值的比较获得 B o o t s t r a p 临界值的产生 首先 假定样本数据 可以反映总体 解靴带程序是从假拟总体中重复地抽 取 个样本 将每个抽取样本转换为输人数据来假定 模型拟合为真 这一步是必需的 因为要根据每个中 心r 分布计算r 临界值 每个中心r 分布假定虚无 模型是真 这与M L 检验模型拟合的假定相同 接 受虚无假设则 值等于模型的自由度 利用解靴带 样本拟合模型 解靴带程序收集每个样本拟合模型的 r 统计量 并计算它们的均值 这个均数成为原来分 析的r 检验临界值 B o l l e n S t i n eB o o t s t r a p 应用的实例分析 A M O S 程序采用三步处理非正态数据 检验数据 8 5 的多元正态性 B o l l e n S t i n e 的修正P 值评定整体模型 的拟合 B o o t s t r a p 法产生参数估计 参数估计标准误 置信区间以及个别参数的显著性检验 下面以糖尿病 患者生活质量研究的调查资料为案例演示整个操作过 程 该数据有4 0 6 例 删除有缺失值的案例 保留3 9 2 例 运用这些数据检验模型的拟合 图1 图1 模拟实例的结构模型 1 数据非正态性诊断 数据非正态程度常可用偏态 s k e w n e s s 峰度 k u r t o s i s 多元峰度 m u l t i v a r i a t ek u r t o s i s 表示 偏 态反映数据的非对称性 峰度反映数据平坦或尖峰分 布的情况 一般来说 数据偏态的处理较容易 通过数 据转换的方式很难处理峰度异常 而且容易影响参数 估计值 当峰度绝对值大于l O 表示峰度有问题 大于 2 0 可以视为极端的峰度 当多元峰度的临界比率 c r i t i c a lr a t t o c R 大于1 9 6 即表示有些变量违反正 态分布的假定 研究者需要进一步检查到底哪一变量 发生问题 A M O S 可以评定单一变量的偏态和峰度以及多 元峰度 并输出结果 具体操作步骤 打开V i e w A n a l y s i sP r o p e r t i e s 对话框 点击O u t p u t 标签 标记T e s t s f o rn o r m a l i t ya n do u t l i e r s S t a n d a r d i z e de s t i m a t e s S q u a r e dm u l t i p l ec o r r e l a t i o n s 三栏 第二步从A n a l y s i s 菜单点击C a l c u l a t eE s t i m a t e s 运行模型 从V i e w 菜单 打开T e x tO u t p u t N o r m a l i t y 栏输出每个观察变量的最 小值 最大值 偏态及其临界比率 峰度及其临界比率 最下行显示多元峰度 m u l t i v a r i a t e 及临界比率 可以 判断该资料是非多元正态数据 其中患病年数是极端 非正态变量 表1 表1 数据正态性评定结果 患病年数 Y R 经济状况 E C O 社会支持 S S 健康状况 H S 应对方式 C S 生活质量 Q O L 最小值 r a i n 最大值 撒i 偏态 s k t w 峰度 I m r t o s i s 临界比率 C R 多元峰度 M u l t i v a r i a t e 万方数据 8 6 2 B o l l e n S t i n eP 值评定整体模型的拟合 对于非正态性数据模型拟合的评定应采用B o l l e n S f i n eP 值而不是标准M LP 值 为获得B o l l e n S t i n e 检验 从V i e w S e t 的A n a l y s i sP r o p e r t i e s 对话框 点击B o o t s t r a p 标签 勾选P e r f o r mB o o t s t r a p 在其后的 N u m b e ro fB o o t s t r a ps a m p l e s 框填人一个具体的B o o t s t r a p 样本量 如20 0 0 B o o t s t r a p 提取样本的次数一般 是2 5 0 20 0 0 次 勾选B o l l e n S t i n eb o o t s t r a p 框后计 算输出结果 输出结果包括三部分 第一部分为解靴带样本迭 代信息 反映了通过解靴带抽样运算法则 解靴带样本 的生成过程 第二部分显示整体模型拟合的假设检验 B o l l e n s t i n eP 值为0 1 3 7 与之对照 采用常规的M L 方法检验模型与这些非正态数据的拟合结果是 1 0 4 1 6 够 3 P O 0 1 5 则拒绝虚无假设 而B o l l e n S t i n eB o o t s t r a p 方法接受这个被M L 拒绝的模型 第三部分为20 0 0 个B o o t s t r a p 样本数据的 分布及 形态 显示20 0 0 个样本的 均值为5 6 1 8 以r 均 值作为 临界值 则P 0 1 3 7 3 B o o t s t r a p 参数估计和标准误 接受整体模型拟合后需要分析路径系数及其统计 显著性 然而 A M O S 不能同时获得B o l l e n S t i n eP 值 和B o o t s t r a p 参数估计及其标准误 为此 必须重回A n a l y s i sP r o p e r t i e s 窗1 2 1 点击B o o t s t r a p 取消B o l l e n S t i n eB o o t s t r a p 栏 勾选P e r c e n t i l ec o n f i d e n c ei n t e r v a l s 和B i a s c o r r e c t e dc o n f i d e n c ei n t e r v a l s 两栏 在N u m b e r o f B o o t s t r a p 栏空格内输入一个样本量 如2 5 0 表示 2 5 0 个B o o t s t r a p 样本 N e v i t ta n dH a n c o c k 认为增加 解靴带样本量对解靴带估计质量没有实质的改善 如果要解释P 值 则应当选择更大的解靴带样本 如 20 0 0 以保证概率估计的稳定性 输出解靴带参数估计的计算结果 路径系数 方 差 协方差 均数和截距 从方法介绍的角度 输出表 显示了原正态假设下M L 法的协方差估计值 表2 和 解靴带的协方差估计值 表3 表2 显示了各变量间 协方差估计值 标准误 临界比率及P 值 如豁与豫 之间的参数估计一0 7 4 1 标准误0 2 4 7 临界比率为 一0 7 4 I 0 2 4 7 一2 9 9 8 采用P 0 0 5 作为有统计 差异标准 P 0 0 0 3 0 0 5 正态假设的M L 法与 B o l l e n S t i n eB o o t s t r a p 法计算出的各变量间协方差估计 结果存在差异 B o o t s t r a p 法能有效控制I 类错误 表2M L 法的参数估计 E s t i m a t es E O 2 4 7 2 1 6 9 2 7 1 5 6 1 5 7 O 3 0 9 o 1 1 5 c R P 一2 9 9 80 0 0 3 1 2 8 6 7 1 3 1 9 6 1 3 4 9 l 一4 6 6 9 一6 0 9 7 唯 s S s s E c 0 s s 豫 E C D 豫一0 7 4 1 肋2 7 9 0 8 珊3 5 8 2 9 日S8 3 0 6 2 郴一1 4 4 1 Y R o 7 0 3 表示P a 0 0 5 因此不能拒绝 H 0 尚不能认为S G R Q 总分与活动受限相关程度比 S G R Q 总分与呼吸症状相关程度高 关于两个或多个总体相关系数比较的假设检验方 法有很多 上面根据相关系数之间是否有关联分别介 绍一种 希望借此抛砖引玉 让大家了解和重视这方面 的假设检验方法 从而解决更多相关的实际问题 参考文献 1 陆慰萱 张一杰 等 应用S tG c o 曜e s 呼吸问卷评价我国慢性阻塞性 肺疾病患者生活质量的价值 中华结核和呼吸杂志 2 0 0 3 2 6 1 9 5 1 9 8 2 王秋月 壬玮 等 慢性阻塞性肺疾病患者生活质量及其影响因素分 析 中华结核和呼吸杂志 2 0 0 3 2 6 8 1 1 8 1 2 3 F I S h e rR A t a t i s t i e a lm e t h o d sf o rr e s e a r c hw o r k e r s f o u r t e e n t he d i t i o n d a v i e n C T I t a f h e rP u b l i s h i n gC o m p a n y 1 9 7 0 4 S n c d e e o r C o e h r a n S t a t i s t i c a lm e l a o d s I o w a t a t cU n i v e r s i t yP r e s s 1 9 8 0 1 8 5 1 8 8 5 C o h e n J a c o b P a l r i e aC o h e n A p p l i e dm u l t i p l er c g r 潍i o e o r r e l a t i o na n a l y s i sf o rt h eb e h a v i o r a ls c i e n c e 8 1 l J l l s d a l e NJ L a w r e n c eE r l b a t m l A s s o c i a t e s S e c o n dE d i t i o n 1 9 8 3 万方数据 结构方程模型下非正态数据的处理结构方程模型下非正态数据的处理 作者 方敏 黄正峰 作者单位 安徽师范大学体育学院 241000 刊名 中国卫生统计 英文刊名 CHINESE JOURNAL OF HEALTH STATISTICS 年 卷 期 2010 27 1 被引用次数 3次 参考文献 9条 参考文献 9条 1 李茂能 结构方程模式软体AMOS之简介及其在测验编制上之应用 2007 2 Curran PJ West SG Finch JF The robustness of test statistics to nonnormality and specification error in confirmatory factor analysis 1996 01 3 Fouladi RT Covariance structure analysis techniques under conditions of multivariate normality and nonnormality Modified and bootstrap test statistics 1998 4 敖雁 王学枫 汤在祥 Bootstrap方法在平均数假设测验中的应用 期刊论文 中国卫生统计 2006 06 5 Enders CK Applying the Bollen Stine bootstrap for goodness of fit measures to structural equation models with missing data 2002 03 6 Bollen KA Stine R Bootstrapping goodness of fit measures in structural equation models 1992 02 7 Nevitt J Hancock GR Relative performance of rescaling and resampling approaches to model chi square and parameter standard err
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年土工与地质力学综合能力测试题(附含答案)
- 2025年安全工程师资格考安全技术强化训练模拟试题(附答案)
- 2025年用人单位安全生产知识竞赛重点题库及答案
- 中国邮政2025黄冈市秋招采购管理岗位高频笔试题库含答案
- 中国邮政2025宿迁市秋招新媒体推广岗位高频笔试题库含答案
- 2025年安全生产责任制考试卷含答案
- 惠州市烟草公司2025秋招数据分析岗位高频笔试题库含答案
- 中国邮政2025保山市秋招数据分析岗位高频笔试题库含答案
- 中国邮政2025红河哈尼族彝族自治州秋招网点柜员岗位高频笔试题库含答案
- 2025下半年浙江金华市兰溪市市属国企人才引进招聘19人考试参考题库及答案解析
- 大金D型水冷螺杆机说明书
- 部编版三年级上册道德与法治第一单元第1课《学习伴我成长》课件
- JJG 700 -2016气相色谱仪检定规程-(高清现行)
- ASCO双电源自动转换开关操作手册
- 组合式塔吊基础施工专项方案(117页)
- 1、《国际贸易实务》课程标准解析
- 现场临电方案改
- 知识产权进校园小学生知识产权科普讲座课件
- 生活百科常识试题及答案1
- 饼干制造工艺介绍及饼干分类
- 《建筑材料》 教案
评论
0/150
提交评论