结构方程建模中的题目打包策略_吴艳_第1页
结构方程建模中的题目打包策略_吴艳_第2页
结构方程建模中的题目打包策略_吴艳_第3页
结构方程建模中的题目打包策略_吴艳_第4页
结构方程建模中的题目打包策略_吴艳_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理科学进展 2011, Vol. 19, No. 12, 18591867 Advances in Psychological Science DOI: 10.3724/SP.J.1042.2011.01859 1859 研究方法(Research Method) 结构方程建模中的题目打包策略* 吴 艳 1 温忠麟2 (1广东外语外贸大学应用心理学系, 广州 510420) (2华南师范大学心理应用研究中心, 广州 510631) 摘 要 结构方程建模中题目打包法的优缺点包括:指标数据质量变好、模型拟合程度提高; 估计偏差不大, 可校正; 估计稳定, 但降低了敏感性与可证伪性。打包法的前提条件是单维、同质, 适合结构模型分析, 不适 合测量模型分析。对于单维测验, 给出了一个打包流程。对于通常的多个子量表(多维结构)测验, 推荐在子量 表内打包, 每个子量表打包成 1 个指标或者 3 个指标, 用于结构方程建模。 关键词 潜变量; 结构方程; 题目打包; 题目小组 分类号 B841.2 1 前言 结构方程建模, 对样本容量有一定的要求。 有建议说样本容量应当是题目(指标)数量的 10 倍 以上, 或者是自由参数的 5 倍以上(侯杰泰, 温忠 麟, 成子娟, 2004)。可见, 题目越多, 所需样本容 量越大。 题目数量很多时, 要估计的参数也多, 若 样本容量少, 直接用原始题目建模容易产生较大 的参数估计偏倚。Bandalos (2002)的模拟研究显示, 在单维、样本容量为 100, 严重非正态的情况下, 直接使用原始题目建模可产生高达 29.5%的参数 估计偏倚。题目打包法(item parceling, 也译为题 目组合法或题目小组法)是解决此类问题的一种 有效方法(Landis, Beal, Yang, Nay, Rogers Hau Landis et al., 2000)。但当误差很大(题目共同 度0.25)且样本容量小(如全模型 N150), 不同 的打包策略产生的偏差不同, 有时可能会导致结 构参数和模型拟合度产生改变, 好在即便如此, 也 有 软 件 及 公 式 校 正 这 种 偏 差 (Sterba 而从模型的角度, 指标多意 味着模型复杂, 所需样本容量大, 测量误差的绝 对值也大, 估计不稳定, 需要更多的迭代次数才能 收敛, 模型参数也有相对较大的标准误(Little et al., 2002), 直接后果是估计不稳定, 模型拟合差。 题目打包法很好地解决了这对矛盾:用大量 的题目测量潜变量, 既正确定义潜变量, 又通过 打包使指标数量变少而使测量误差总数也变少 (Bandalos, 2002), 模型变简洁, 模型中需要估计 的参数减少, 增大了每个参数的样本容量。或者 说, 打包减少了获得稳定结果所需的样本容量 (MacCallum, Browne, Maccallum, Wegener, Uchino, Matsunaga, 2008), 提高指标信度(Coffman Hall, Snell, Landis et al., 2000), 减少随机误差(Little et al., 2002; Matsunaga, 2008) 和 非 正 态 现 象 (Bandalos Hau Matsunaga, 2008), 更易收敛(Little et al., 2002)。然而, 使用打包法需 要满足一定的前提条件。若应用不当, 可能导致 参数估计偏差(Hau Stephenson Little et al., 2002), 使研究结果不 准确, 甚至得出错误的结论。 3 打包法的前提条件和适用范围 从上面讨论可以看出, 打包法是一把双刃 剑。正确掌握打包法的使用条件和范围很重要。 3.1 前提条件 单维、同质 几乎所有讨论打包法的文献都强调, 在使用 打包法时, 题目要单维、同质。这是因为, 题目打 包的有效程度依赖于被打包题目的单维性。当被 打包的题目不是严格的单维时, 易导致参数估计 偏倚和第二类错误率偏高(Bandalos, 2008), 得到 错误的因子结构, 拟合指数也会有偏倚(Bandalos, 2002; Hall et al., 1999)。 3.2 适用范围 结构模型分析 如果研究者的兴趣在于理解潜变量之间的关 系, 打包法很有用(Little et al., 2002)。如前所述, 打包可以将特定因子效应(如方法效应、 反应偏差) 的方差变成共同方差, 去掉这些效应的影响。在 结构方程模型分析中, 将这些效应的影响降到最 低, 研究者能更精确地揭示结构间的关系, 更容 易达到自己的目的。这里要小心的是:打包前应 先确定这种特定效应是否由其它重要变量导 致?若此效应由其它重要变量所致, 则通过打 包构建的结构关系可能存在偏差(Bandalos, 2002; Hall et al., 1999)。此时, 通过打包法隐藏特定方 差不可取。 在满足前提条件的情况下, 适合使用打包的 其他情况还有:已有数据的心理测量特征不理想 (如非正态); 违背了结构方程模型分析的假设(如 误差相关); 样本容量小, 模型复杂和共同度低的 数据分析(Marsh, Hau, Balia, Meade 对参数估计的准确性如标准差, 并无显 著影响。这是因为将多个题目合并成较少的指标 (例如 2 个)时, 准确度会由于每因子的指标数量 减少而下降, 但每个指标是由多个题目合并而成, 故每个指标的准确度上升, 两相抵消后令打包法 并无显著好处。非正态条件下, 无论从收敛、参 数的偏差及标准误等角度, 将数题打包为一个指 标均没有任何好处, 若合并至每因子两个指标时, 问题更大。将题目打包进行因子分析, 可能导致 1862 心 理 科 学 进 展 第 19 卷 不收敛、高标准误、及偏差参数等问题, 不值得 推荐(侯杰泰, 成子娟, 马殊赫伯特, 1999)。 (2)测量模型的多组比较。测量模型的多组分 析时将题目打包, 会掩盖组之间的方差变异, 错 误地得出各组相同的结论(Meade 适合进行 结构模型分析。满足前提条件后, 若已有数据的 心理测量特征不理想(如非正态); 违背了 SEM 分 析假设(如误差相关); 样本容量小, 模型复杂、共 同度低(Marsh et al., 1998; Meade (2) 忽略组内差异, 尽量缩小组间的差异。如因子法 中的平衡法; (3)随机打包。 第 一 种 策 略 是 因 子 法 (factorial algorithm, Rogers 第二个小组包含题 目 2、5、8; 第三个小组包含题目 3、4、9, 这种 方法平衡了题目独特成分之间的关系, 意欲让每 个小组有差不多的负荷和方差。 高中负荷法。看上面那个例子, 将 9 个题 目按照负荷由高到低排列后, 再按照如下方式 排列: 123 456 789 一列作为一组, 打包后, 第一个小组包含题目1、 4、7; 第二个小组包含题目2、5、8; 第三个小组 包含题目3、6、9。 高高负荷法, 通过打包扩大组间差异。先 做因子分析, 然后将负荷大小类似的题目打包 (Yang et al., 2010)。看上面那个例子, 将9个题目 按照负荷由高到低排列后, 一行作为一组, 打包 后, 第一个小组包含题目1、2、3; 第二个小组包 含题目4、5、6; 第三个小组包含题目7、8、9。 这种方法将负荷类似的题目打包在一起, 组间差 异被放大了。 第二种策略是相关法(correlation algorithm), 这需要多步才能完成。首先计算两两题目之间的 相关, 然后按照相关大小由高到低排列。如, 有 10个题目, 组合成3个小组, 设两两题目相关顺 序为 123456789,10 rrrrr, 将题目1、2放到第 一组; 3、4放到第二组; 5、6放到第三组, 组成3 组后, 将剩余的题目逐个与各小组算相关, 如依 次算题目7、8、9、10与组一的1、2, 组二的3、 4, 组三的5、6的相关, 然后挑出与各组相关最 大的题目组成小组。如果有新题目加入, 则重新 计算相关, 其它步骤类似。这种策略把相关最大 的题目组合到一起, 组内差异变小, 组间差异变 大了。 第三种策略是对称法(radial algorithm), 由 Cattell (1956)提出。 这种策略结合了因子法和相关 法, 做法是先进行因子分析, 然后像相关法那样 第 12 期 吴 艳等: 结构方程建模中的题目打包策略 1863 将负荷类似的题目两两组合分配到需要的小组中, 当每组包含两个题目时, 将组合后的题目和剩下 的题目一起重新因子分析, 根据负荷大小, 每组 挑出负荷最高的题目组成小组。通过这样的方式, 小组之间的差异被加大了(Rogers 如果题目方差不等, 打包结 果会产生偏倚, 更加偏向方差大的题目(Little et al., 2002)。 第五种策略是基于独特信息打包的策略, 也 称 先 验 问 卷 结 构 法(a priori questionnaire construction, Little et al., 2002) 。例如, 根据题目 内容或表述方式(如每个小组各包含一个反向表 述题目)等打包, Afifi和Olson(2005)就曾使用了根 据题目内容打包的方式。 第 六 种 策 略 是 误 差 相 关 法(correlated uniqueness approach, Hall et al., 1999)。在结构单 维的假设下, 根据CFA结果中误差相关的修正指 数, 将修正指数高的题目组合在一起。 4.2 打包效果 三种不同思路的打包策略中, 哪一种打包的 效果最好?总的来说, 让组间差异变小的打包策 略(如 因 子 法 中 的 平 衡 法)模 型 拟 合 比 较 好 (Bandalos, 2008; Kim Little et al., 2002), 不足是容易掩盖真实的结构, 参数估计偏 倚较大(Bandalos, 2002, 2008; Hall et al., 1999), 打包后指标的含义也比较混乱。让组内差异变小 的策略, 如因子法中的高高负荷法、相关法、对 称法等, 通过增加指标的一致性, 提高了潜变量 的单维性(Hall et al., 1999), 打包后的指标含义清 楚、结构清晰(Hoyle 各种策略在参数估计方面都差不多; 相比之下, 因子法的模型拟合最好, 相关法的模型拟合最差 (Rogers (2)潜变量有多少个维度则打包成多少个指标 (相当于每个维度打包成1个指标); (3)潜变量中每个维度打包成多个(如3个)指标。 打包后合适的指标数量要综合考虑样本容 量、模型的复杂度等因素。样本容量大、模型简 单时, 指标数可以适当多一点; 样本容量少、 模型 复杂时, 指标数则可相应减少。 研究发现, 打包成 3个指标的拟合情况比4个、6个要好, 也比直接 使用原始题目要好(Bandalos, 2002; Rogers 反之则每个维度 内打包成3个指标。 1864 心 理 科 学 进 展 第 19 卷 5 打包步骤 在使用打包法前, 首先要确定是否满足前提 条件, 然后再打包。Matsunaga (2008) 总结了一个 打包流程, 我们根据前面的讨论和以往打包的实 践经验做了修改, 给出新的打包流程图(见图3)。 第一步, 确定研究目的是结构模型分析。如 果是进行测量模型分析(包括因子分析和测量模 型的多组比较), 则不要使用打包法。 第二步, 检查量表(或子量表)是否单维: (1)理论上、前期研究中量表(或子量表)是否 单维? (2)单维CFA拟合如何? (3)修正指数显示的误差协方差是否大? (4)理论上是否有重要的外部变量? CFA分析可以检验是否单维。将本是多维结 构当作单维处理, 模型拟合会不好(Hall et al., 1999)。因此, CFA拟合不好, 说明模型的维度不 正确, 或题目质量不好, 需要重新检查和提炼测 量结构; CFA拟合好, 则进一步检查修正指数, 防 止结构多维或者存在其它重要的外部变量。需要 注意的是, 不能单靠探索性因子分析(EFA)检验 单维(Gerbing 如图2所示模型, 有一个外部的未知因子 (但我们不感兴趣、 不重要)在影响, 如受到共同方 法、负向表述、社会期许等因素的影响。这种情 况下增加样本容量并不能解决问题, 打包可以解 决。但如果这个外部因子是重要的, 则不应通过 打包掩盖。 量表实际上是多维的。如果每个维度的题 目不重合, 各自组成一个子量表, 参考下一节有 子量表测验的打包策略, 否则不能使用打包法。 因为即便将多维错误地处理成单维, 打包后, 模 型的拟合指数也可能不错, 却掩盖了数据的真实 结构。当看到修正指数比较大时, 还是要借助于 理论分析, 重新探讨理论。 毕竟, 借助于观察修正 指数不足以区分到底有多少个潜变量, 从理论的 角度出发寻找答案才能得到真正的解答(Silvia 领域代表法, 也叫分配打包法(distributed parceling), 是在每个因子下各抽出一个题目打包, 强调各小组间的一致性, 让组间差异变小。比如, 一个量表有三个维度共9个题目, 维度1包含题目 1、2、3, 维度2包含题目4、5、6, 维度3包含题 目7、8、9, 要组合成三个小组。内部一致性法就 是把同一维度内的题目打包:第一个小组包含题目 1、2、3, 其它类推; 领域代表法的组合方式为:第 一个小组包含题目1、4、7, 第二个小组包含题目2、 5、8, 第三个小组包含题目3、6、9。 量表有多个子量表, 进行结构模型分析时, 推荐用内部一致性法将维度内的题目打包, 若模 型拟合不好, 才使用领域代表法。 但要留意, 领域 代表法可能掩盖了真实的结构, 参数估计可能存 在偏倚(Bandalos, 2002, 2008; Hall et al., 1999)。 具 体到每个维度内部, 可以使用缩小组间差异的思 路, 如用因子法中的平衡法打包题目; 负荷差不 多大小时, 可以随机打包, 也可以根据内容、 特殊 信息或修正指数等来打包。 7 总结 应用工作者在结构方程建模中使用打包法往 往会存在一些误区, 一方面是有人会担心使用题 目小组导致偏倚过大而不敢打包, 因而错失了得 到更好的结构模型和研究结论的机会; 另一方面 是有人会不顾研究目的与前提条件强行打包, 因 而分析了不当的模型并得出似是而非的研究结 论。本文可以告诉读者, 什么情况下值得将题目 打包, 以及如何打包。若满足了前提条件(单维、 同质), 由打包引起的偏倚不大, 且可校正。尤其 当模型复杂、 样本量少、 数据分布呈现偏态时, 用 打包法进行结构模型分析, 能有效地揭示变量之 间的关系。但打包法不适合用来进行测量模型的 因子分析、多组比较。打包法最大的隐患是错误 地将多维处理成单维, 忽略了重要的变量, 因此, 排除多维和其他重要变量的影响是打包前很重要 的步骤。除了在打包前使用CFA进行单维性检验 外, 最好同时参考EFA结果, 如果EFA结果显示 多因子结构, 应当避免打包。 在根据图3所示的流程图决定打包后, 如果 量表有多个子量表(多维结构), 可用内部一致性 法在子量表内打包, 即以维度为单位打包; 具体 到每个维度内部, 可以使用缩小组间差异的思路, 推荐使用因子法中的平衡法打包。若题目负荷差 不多, 可以随机、根据内容、特殊信息或修正指 数等来打包。至于小组个数, 应根据模型的复杂 程度及样本容量、测量精确度等综合决定, 一般 情况下, 打包后每个维度包含3个新指标(即3 个小组)为宜, 必要的时候一个子量表也可以打 包成一个指标, 用于结构方程建模。最后, 研究 者还应该在论文中报告打包流程、 策略及合成指 标的数量。 参考文献 卞冉, 车宏生, 阳辉. (2007). 项目组合在结构方程模型中 的应用. 心理科学进展, 15, 567576. 侯杰泰, 成子娟, 马殊赫伯特. (1999). 验证性因素分析: 问卷题数及小样本应用策略. 心理学报, 31, 7683. 侯杰泰, 温忠麟, 成子娟. (2004). 结构方程模型及其应用. 北京: 教育科学出版社. 王孟成, 蔡炳光, 吴艳, 戴晓阳. (2010). 项目表述方法对 中文Rosenberg自尊量表因子结构的影响. 心理学探新, 30, 6368. Afifi, T. D., WEN Zhong-Lin2 (1 Department of Applied Psychology, Guangdong University of Foreign Studies, Guangzhou 510420, China) (2 Center for Studies of Psychological Application, South China Normal University, Guangzhou 510631, China) Abstract: Item parceling is a technique using in structural equation modeling (SEM). Parceling can improve the quality of indicators and model f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论