版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、心 理科学 进展2 0 1 5 , v o 1 2 3 , no 3 , 5 2 9 5 3 8 ad va n c e s i n p s yc ho l og i c a l sc i e n c e doi :1 03 7 2 4 s p j 1 0 42 2 0 l 5 0 0 5 2 9 因子混合模型 :潜在 类别分析与因子分析的整合 陈宇帅 温忠麟 顾红磊 ( 华南师范大学心理应用研究中心 理学院,广州 5 1 0 6 3 1 ) 摘要 因子混合模 型( f mm) 是 考虑 了群体 潜在异质 性后的 因子分析模型,它将潜在 类别分析( l c a) 与传统 的因子分析( f la
2、 ) 整合在 同一框 架内,既保 留了两种分析技术的优点,同时又展现 出独特优势。f mm 的应用主 要 包括描述变量的潜在 结构 、 对被试进行 分组 以及探测社会称许偏 差等。 我们建议 分别采用 f a、 l c a与 f mm 三种模型拟合数据,参考拟合指数和模型可解释性选择最优模型。总结了f mm 的分析步骤以及软件使用,并 用于探讨大学生社会面子意识的测量模型。 未来研究应关注 f mm分析过程的简化,继续深化对拟合指数等方 面 的探 讨 。 关键词 因子混合模 型;潜在类别分析;因子分析 分类号 b 8 4 1 在心理学研究中,由于许多人格特质 、内隐 态度等的不可直接观测性,潜
3、变量模型得到广泛 应用,其 中因子分析( f a c t o r a n a l y s i s ,f a ) 比较流 行 。然而, f a的样本同质性假设在许多场合可能 不成立( j e d i d i , j a g p a l , & de s a r b o ,1 9 9 7 ; y u a n& be n t l e r ,2 0 1 o ) 。许多研究样本中包含不同性别 、 年级,或者不同能力 、 态度的个体,异质性可能是 普遍存在的。假定所有个体具有相同的参数值往 往与实际相悖,产生模型拟合不佳等结果。尽管 多组模型( mu l t i p l e g r o u p mo d
4、e l s ) , 够处理外显异 质性,但对于样本潜在的异质性则显得无能为力。 为了解决这一问题,因子混合模型( f a c t o r mi x t u r e mo d e l , f mm) 作为一种新的分析技术应运而生。 f mm是潜在类别分析( l a t e n t cl a s s an a l y s i s , l c a) 与 f a的结合,继承了两种分析技术的优点, 弥补了各 自的局限,为研究者提供了一个全新的 视角,但 目前实际应用还不多。 本文以 f mm 为主 题,首先介绍了f mm的基本形式,包括数学模型 及基本原理:接着归纳了 f mm 的主要优势以及 实际应用
5、,然后总结了f mm 的分析步骤,并以一 个实例进行示范;最后就 f mm 有待完善的问题, 收稿 日期 :2 0 1 4 0 5 2 6 国家 自然科学基金项目( 3 1 2 7 1 1 1 6 , 3 1 4 0 0 9 0 9 ) 资助。 通讯 作者 :温 忠麟, e ma i l : we n z l s c n u e d u c n 5 29 提 出研 究展望 。 1 f a、l c a与 f mm 简介 1 1 f a 简介 f a 作为多元统计中重要的方法之一为研究 者广泛使用,其 目的在于通过一个或多个 因子来 解释各指标间的关联,从而实现对指标的分组 。 本文考虑的 f a
6、模型仅限 c f a模型。以图 1中的 m 为例,假定模型中有 ,个指标,测量了两个 因 子 l 和 2 ,其中前 t 个指标测量了 1 ,其余指标 测 量 了 2 。模 型可用如 下方 程表示 : y 1 =r l +1 +8 1 , 一 , yt= + 1 v i i+ , y t + 1 =c t + 1 + + 1 ) 2 叩 2 + + i , , ( 1 ) y,=f ,+ 2 + , 叩 1= 1+ , , 7 2= 2+ 在上述方程中, y l 表示第 1 个指标, r l 表示y 1 的截 距, l 1 表示y 1 在 叩 1 上的负荷, 1 表示y 1 的误差, a 1 表
7、示 因子 叩 1 的均值, 表示 叩 1的离均差( 残差) , 其余符号类推。 1 2 l ca简介 l c a是一种通过类别潜变量来解释指标间的 关联,进而实现指标间局部独立的统计方法。与 f a相比,两者在形式上颇为相似( 见图 1中的 m1 5 3 0 心 理 科 学 进 展 第 2 3 卷 和 m ) ,但两者存在本质差异。首先,潜变量的尺 度不同。f a 中因子是连续变量,而在 l c a 中被 潜在类别变量 c取代。其次,两者关注的焦点不 同。f a 的焦点是对变量进行分类,而 l c a 的焦 点是对被试进行分类。l c a分析的统计原理主要 是条件概率和贝叶斯公式。以图 1中的
8、 m2 为例, 假定模型中共包含 r 个指标, 都是 0 1 取值,指标 间的关联 由潜在类别变量 c 所解释 。设有 个类 别,则有( c l a r k e t a 1 , 2 0 0 9 ) : 土 p ( y j b j ) p ( c = k ) p ( y j = 1c = k )( 2 ) k=l 在公式( 2 ) 中,下标 表示第 个指标,k表示第 k 个类别,6 , 的取值为 0或 1 。p ( c = 和 p 尸b j lc = k ) 是 l c a分析中两个主要的参数,前者称为潜在类 别概率,描述了第 k个类别 占总体的比例,也是 任一被试属于第 k个类别的概率:后者是
9、条件概 率,描述了第 个类别的被试在第, 个指标上取值 6 ,的概率( 邱皓政,2 0 0 8 ) 。p ( y j = b j ) 称为边缘概率 ( ma r g i n a l p r o b a b i l i c y ) ,表示任一被试在第 个指 标上取值 b , 的概率 。 l c a一个重要的假定是局部独立性,就是本 来关联的各指标间在被潜在类别变量解释后彼此 独立。基于上述假定,公式( 2 ) 可扩展为( c l a r k e t a 1 , 2 0 0 9 ) : 羔 p ( y l : b l , , y = ) = p ( c = k ) p ( y l = 6 l lc
10、 = j ) k= l p ( y = b r ic = k ) ( 3 ) 其中, b 1 , b 2 , , b , 的取值为 0或 1 。p 1 =b 一 , y =6 , ) 称为联合概率( j o i n t p r o b a b i l i t y ) ,描述了任 一 被试在 r 个指标上出现某种答题模式的概率。 在求得联合概率 、条件概率和潜在类别概率 的基础上,可依据 ba y e s定理计算每个被试从属 于各类别的概率( 邱皓政, 2 0 0 8 ) ,计算公式如下 : p ( c = k ly l = 岛 , y = b r ) p ( c = k ) p ( y l =
11、 b l lc = 七 ) 尸 ( = lc = k ) ( 4 ) p ( y l =b l , , =b r ) 公式( 4 ) 计算得到的概率称为后验概率 。后验概率 是 l c a进行分类的重要依据,通常将被试判入后 验概率最大的类别中。例如,在 l c a情境下,若 已知某个被试在所有题 目上 的得分均较高,被试 属于高能力组的后验概率将会最大。 1 3 f mm 简介 在 l c a 与 f a 的基础上,将两者加以结合, 便可得 到 f mm。不 同的假设 会得 到不 同的 f mm 形式。图 1中的 m3 为 f mm 的变式之一,就是表 2中的 f mm 2 。 f mm 2
12、同时纳入了潜在类别变量 和因子来解释指标间的关联,其中前者用于对被 试进行分类,而后者用于对变量进行分组 。模型 中由叩 】 和 叩 2 指 向指标的实线表示因子分别由相应 指标测量,由c指向叩 和 叩 的实线表示不同类别 的因子均值可以不同,允许类别内因子方差 、协 方差 自由估计,其余参数( 如因子负荷、截距等) 在 f mm 2模型中则设为等值( 见图 1中的 m3 ) 。 但对于 f mm 的一般形式而言,各参数均允许跨 类别变化。对于每一类,都可以用( 1 ) 中那样的一 组方程表示模型,但不 同类符号需要用类别代码 ( 如 进行区分。例如,用 a - 和 a 2 k 分别表示第 k
13、 类 的两个因子均值 。与多组模型类似,每类截距 自 由估 计 的 同时 需 固 定 因子 均 值 ( l u b k e & mu t h 6 n , 2 0 0 7 ) 。 一 图 1 f a、lc a与 f mm 示 意 图 1 4小结 通过上面 3个部分的描述,可以看出,f mm 实际上是 f a与 l c a的结合体,而 f a与 l c a则 是 f mm 的特例 。当k= i时, f mm模型可简化为 通常熟知的 f a模型:而当潜变量 c 中每一类别内 因子方差均为零时, f mm与 l c a两者无异( l u b k e & mu t h 6 n , 2 0 0 5 ) 。
14、 ma s y n , he n d e r s o n和 g r e e n b a u m ( 2 0 1 0 ) 基于维度一 类别框架下提出了 f mm 更多的 特例,如半参数 、非参数因子混合模型等。c l a r k 第 3 期 陈宇帅等:因子混合模型:潜在类别分析与因子分析的整合 5 3 1 等( 2 0 0 9 ) 根据参数限定程度 的不 同描述了 f mm 的 5种变式( 见表 1 ) ,如潜在类别因子分析模型 f l a t e n t c l a s s f a c t o r a n a l y t i c mo d e l , l c f a) 、混合 因子分析( mi
15、 x t u r e f a c t o r a n a l y s i s ) 等。 2 f mm 的主要优势 传统的 f a 主要用于描述变量间的关系。而 l c a 主要用来对被试进行分组。f mm 作为两种 分析技术 的整合,继承了两者的优点,弥补 了各 自的局限,同时还形成了自身的独特优势。 2 1 f mm 继承的优势 ( 1 )描述变量关系。与 f a类似, f mm 可以通 过抽取一个或多个 因子来解 释各指标 间的关系, 并估计出因子负荷、因子方差等相应参数。 ( 2 )对被试进行分组。 f mm 同样可以像 l c a 一 样根据后验概率将被试划分为不同的潜在类别, 同时估
16、计出潜在类别概率以及条件概率 。 ( 3 )提高分类精确性。f mm 继承了 l ca 的 特点,可将相关的协变量纳入模型中,并与潜在 类别变量建立起联系,能够对被试 的分类结果产 生影响。l u b k e和 mu t h 6 n( 2 0 0 7 ) 的模拟研究表明, 当协变量对潜在类别变量的影响程度提高时,模 型在分类准确性上也能得到相应提高。 2 2克服 了 f a与 l c a 的局 限 首先,如前文所述,f a 最大的特点在于能够 对变量进行分组。然而 f a 同样存在 自身的缺陷, 例如难 以实现被试 的分组。虽然 f a 可通过描绘 因子分数 图并找出可能存在的分界点,但分界点
17、 在实践中通常较难找到,尤其是当因子数 目多于 1时( c l a r k e t a 1 , 2 0 0 9 ) 。f mm 的出现一方面使得 f a本身具有的功能得到了继承,另一方面基于模 型进行分组的优势相比f a有了很大的发展。 其次,虽然 l c a 能有效地对被试进行分组, 但其局部独立性假设是一个潜在的局限。 一方面, 当局部独立性假设难以满足时,l c a 可以通过增 加类别个数来 实现,但也可能因此导致增加的类 别并非真正的子群体,而 f mm 通过添加因子来 解释条 目间余下的关联,避免了这一现象的出现: 另一 方面 ,即便 添加 的类 别 为真正 的子群 体 , f mm
18、也能起到减少类别个数的作用 。此外,根据 l c a 的局部独立性假设,对于每一测验题 目,各 类别内所有个体在该题上均有着相同的条件概率, 而实际上组内同样存在变异, f mm 通过因子很好 地解释了这一变异( c l a r k e t a 1 , 2 0 0 9 ) 。 2 3 f mm 的独特优势 2 3 1 描述变量潜在结构的新视角 当前,对心理特质潜在结构的描述存在两种 不同的主流观点。其中一种认为潜在结构 中仅包 含单一 的连续潜变量,个 体间只存在量的差异; 而另一种则认为这一结构中仅包含单一的类别潜 变量,个体间只存在质的差异。 然而,究竟哪种观 点更为合适时常存在争议,导致
19、两种不 同的分析 技术 l c a以及 f a分别用于同一特质的分析( ku o , ag g e n ,p r e s c o t t , ke n n e t h ,& ne a l e ,2 0 0 8 ;mu t h 6 n , 2 0 0 6 ) 。事实上,变量的潜在结构还存在着第三种 视角,即同时包含连续潜变量与类别潜变量的混 合。f mm 的出现为分析这一视角提供 了可能,融 合了连续与类别潜变量的 f mm 使得研究者在分 析处理问题时更加灵活方便,无须在连续与类别 间强迫做出选择。 2 3 2 检验测量不变性 与多组模型类似, f mm 假定被试群体异质,因 此同样可用来检验
20、测量不变性 问题( me a s u r e me n t i n v a r i a n c e ,mi ) 。某些方面,两者确有相似之处, 如都设定参照组的因子均值为 0 ,仅在满足强等 值( 负荷 、 截距等值) 的情形下才允许因子均值间的 跨类别 比较。但差异依旧存在,主要体现在分析 步骤以及比较标准两个方面 。以多组 c f a 为例, 5 3 2 理 科 学 进 展 第 2 3 卷 在检验跨组不变性时,通常从因子负荷等值开始, 逐步添加限制条件进行分析( 王孟成,2 0 1 4 ;温忠 麟,刘红云,侯杰泰, 2 0 1 2 ) ,而 f mm 并没有类似 统一的步骤,可同时设定多个
21、限制条件进行分析, 如表 1中描述的 f mm变式, 5类模型之间的参数 限定并未出现如多组 c f a一样的递进关系。 此外, 多组 c f a中由于模型之间形成嵌套的关系,一般 可通过嵌套模型的卡方检验进行取舍,而 f mm 的模型比较主要基于信息指数进行判断。 2 3 3允许 因子非正 态 传统的 f a和 s e m 模型中,为了估计的方便, 通常假定因子服从正态分布。然而, 这一正态性假 设在实际问题中并非总能成立,结果可能对模型 参数产生误估( wa l l , g u o , &a me mi y a , 2 0 1 2 ) 。f mm 模型假定因子服从混合分布( mi x t
22、u r e d i s t r i b u t i o n ) , 即一个非正态的因子分布可视为由若干子分布混 合而成,这些子分布接近或符合正态分布,因此, 释放 了传统潜变量模 型关于因子正态性的假定, 使得分析问题更加灵活准确。wa l l等( 2 0 1 2 ) 的模 拟研究发现,在估计非正态因子与二分后果变量 间的关系时,以传统的 f a建构测量模型,采用极 大似然估计( ml ) 的方式将会产生较大的估计偏 差。而 mi x t u r e f a c t o r a n a l y s i s 能够获得接近无偏 的结果,特别是当样本容量大于 5 0 0时。 3 f mm 的应用 f
23、 mm 作为一种新的分析技术 当前应用还不 多,从为数不多的实证研究来看,f mm 的应用主 要包含三大方面:描述变量潜在结构、对被试进 行分组以及探测社会称许偏差。 3 1 描述 变量的潜 在结构 相对 而 言,f mm 在这 方 面 的实证 研究 较 多, 且主要集中于临床心理领域,判断变量的潜在结 构中究竟只包含单一的连续或类别潜变量,还是 包含两者的混合 ( b e r n s t e i n e t a 1 , 2 0 1 0 ; ku o e t a 1 , 200 8; m u t h6 n, 200 6; m u t h6 n&as pa r ouho v, 2 0 0 6 1
24、 。对于这方 面应用,通常做法是分别采用 f a、l c a以及 f mm 三种方法拟合数据,根据拟 合指数的优劣来选取合适的测量模型。以 mu t h 6 n 和 as p a r o u h o v( 2 0 0 6 ) 的研究为例,研究者希望构 建最为合适 的测量模型用于理解烟草依赖这一特 质,为此从 ds m i v量表中选取了7 个条 目,分别 采用 f a、 l c a以及 f mm三种不同类型的潜变量 模型拟合三个不同的样本数据,通过对 比分析发 现,相比传统的 f a以及 l c a,f mm 拟合数据效 果更佳 。 需要注意的是,在实际应用时,虽然大部分 研究者们均采用了 f
25、 a、 l c a和 f mm 三种模型结 合的思路进行分析,但就这些研究而言,涉及到 模型比较 以及拟合指数的选取并未达成一致的观 点,不 过,cl a r k 等( 2 0 0 9 ) 针 对这一 问题整理 了 f mm 分析 的详尽步骤,并 以两个实例进行了详 细解释,值得未来的实证研究借鉴。 3 2 对被试进行分组 在管理 、教育 以及临床领域,研究者常常关 注被试 的分组问题。准确地对人群进行分类不仅 能有 效地 帮助 企业 甄 选人 才,也可 以为不 同能 力 水平的学生制定针对性的培养计划。基于原始分 数的传统分组方式,不仅很难找到合适的分界点, 而且也忽略了测量误差 以及测量等
26、值的重要性, 而基于模型进行分组的 f mm 可以很好地解决这 一 弊端。 mo r i n , mo r i z o t , b o u d r i a s 和ma d o r e( 2 0 1 1 ) 针对加拿大三大服务机构的 4 0 4名员工情感承诺 的 7 个方 面进行 了测 量,并 通过 f mm 将员 工分成 了 5类,其中一类员工在 7个方面上的得分均较 高,另外一类则均较低,其余三类在 7个方面上 的得分有高有低,呈现出不一致的趋势。 同时,研 究还将相关的协变量以及后果变量纳入了 f mm 分析中,作为 f mm 分类有效性的判断标准。 值得注意的是, f mm与l c a两
27、者虽然都可实 现分组的功能,但在实际分类结果上,依然存在 差异。f mm允许类别内条 目间相关,一方面使分 类更具意义,另一方面也使 f mm 潜在类别的构 成与 l c a存在差异( mu t h 6 n&as p a r o u h o v , 2 0 0 6 ) 。 此外,由于引入协变量有助于提高分类的精确性, 因此,当研究的主要 目的在于对被试进行归类时, 可考虑纳入相关的协变量进行分析。同时, l u b k e 和 mu t h 6 n( 2 0 0 7 ) 提出了两步分析的方法,依次考 虑负荷 自由估计和负荷固定的模型,该方法适用 于潜类别间隔较小且协变量不适合纳入模型时的 情形
28、 。 3 3 探测社会称许偏差 社会称许偏差( s o c i a l d e s i r a b l e bi a s ,s db ) 是 指被试倾 向于依据社会满意的方向进行作答的歪 曲反应,通常会影响研究结果的有效性 。过去研 究者发展 了许多探测 s db的方法,如统计控制或 第 3 期 陈宇帅等:因子混合模型 :潜在类别分析与因子分析的整合 5 3 3 是实验设计等等 o比较流行 的做法是 f e r r a n d o ( 2 o o 5 ) 建议的 c f a 检验方式,但 l e i t e和 c o o p e r ( 2 0 1 0 ) 认为这种方式仅仅考虑到条 目本身的特
29、征, 忽略了被试在作答倾 向上的个体差异,他们进一 步提出将 f mm 应用于探测 s db当中,并考察了 关于专业间服务学习的态度测验( a t t i t u d e t o wa r d i n t e r p r o f e s s i o n a l s e r v i c e l e a r n i n g s c a l e , ai s ) 是否 会诱发学生的 s d b反应。模型中包含三类因子 : 焦点因子( f o c a l f a c t o r ) 、 s db因子以及潜在类别因 子( 见图 2 ) ,相应的假设以及竞争模型分别包含 4 个( 见表 2 ) 。其 中,
30、前三类模型的比较用于了解被 试是否可以区分为 s db倾向组和非 s db倾 向组, 而第四类模型用于识别 s db倾向组在不同焦点条 目上的反应是否存在差异。 l e i t e 和 c o o p e r ( 2 0 1 0 ) 表 2 f mm 探测 s db的假 设和竞 争模 型 假设 竞争模型 模型描述 ho : 所 有被试在焦点因子条 目上 的反应无 s db倾 向 h l 【 j : 所有被试在焦点因子条 目上的反应有 s d b倾向 hl ( b ) : 被试 可区分为两类不 同的群体,其 中一类在焦点 因 子条 目上 的反应有 s d b倾向;另一类则无 s db倾 向 hl
31、 ( 。 ) : 被试可区分为三类 或是更多不同的群体 单组无跨负荷模型 所有焦点条 目均不存在跨负荷( 见图 2 中 c l a s s 2 ) 单组跨负荷模型 所有焦点条 目均存在跨负荷( 见图 2中 c l a s s 1 ) 两 组 强 等 值 模 型 票 客 帏槛赌 一 三组或多组强等值模型 两组 或多组 中存在跨 负 争 l 争 2 即 3 旬 印 1 2 铀 铀 图 2两组 f mm ( 资料来源: l e i t e&c o o p e r , 2 0 1 0 ) 5 3 4 理 科 学 进 展 第 2 3卷 的实例中通过模型比较发现,两组强等值模型拟 合最佳。在 c l a
32、s s l中,条 目2在 s d b因子上负荷 达到 0 9 6 ,最大程度地引发了被试的社会称许倾 向。研究还探讨了学生专业与潜在类别变量间的 关系,结果发现心理学专业学生更容易诱发 s db 反应。 将 f mm应用于探测 s db中有着很大的优势, 一 方面,通过焦点条 目在 s d b因子上的负荷显著 与否可识别特定的条 目是否容易引发被试的社会 称许反应,而负荷的大小反映了引发 的程度,便 于测验编制者针对性地修订 问卷;另一方面,通 过潜在类别个数的确定也可以了解被试在测验上 的 s db倾向是否存在异质性。 4 f mm 的分析方法 4 1 f mm 的分析 步骤 f mm 在实
33、际研究中应用较少的一个重要原 因在于其使用方式的不明确,为了解决这一问题, c l a r k等( 2 0 0 9 ) 针对 f mm 的分析步骤、模型比较 等方面进行 了详尽 的阐述,综合他们 的观点,可 包含 如下步骤 : ( 1 ) 单独对数据进行 l c a和 f a分析,分别得 到 l c a确定的最佳类别个数和 f a确定的最佳因 子个数 。 类别个数的确定参考 ny l u n d , as p a r o u h o v 和 mu t h 6 n ( 2 0 0 7 ) 的模 拟研究 结 果,即先参 考 b i c 、l mr 指数初步筛选所有可能的竞争模型, 然后结合 b l
34、 r t 以及分类 的实际意义做 出取舍 ( l mr与 bl r t在 常用 的 s e m 软件 mp l u s中,可 通过调用指令 t e c h 1 1 、t e c h 1 4实现) 。因子个 数的确定同样可参考 b i c指数、因子负荷的高低 以及其他拟合指数做出判断; f 2 ) 构建包含不同类别个数以及不同因子个数 的 f mm。从简单的单因子两类别 f mm 开始,在 固定单因子个数 的情形下逐渐增加类别数,类别 数的上限为 l c a所得到的最佳方案 。 待类别数增 b i c 指数是一种信息指数, 值越小表明模型拟合越 好 : l mr 是一种对数似然比检验,采用两嵌套
35、模型对数 似 然值差异 的近 似分布 ,显 著的 p值 表 明 k个类别 模型 拟合优于 k 1 个类别模型: b l r t也是一种对数似然 比检验,与l mr不同, b l r t 基于 b o o t s t r a p原理构造对数似然值差异的分布,显著 的 p值 表 明 k 个类 别模 型拟合优 于 1 个类 别模型 。 至上限时,考虑两因子两类别模型,依照上述方 式循环,直至因子个数与类别个数各 自达到上限 为止。f mm 模型 比较的标准与 l c a类似。 ( 3 ) 模型比较方面,特别是 f mm 比较时是否 应该考虑测量不变性( mi ) ,研究者尚未达成共识 ( b e m
36、s t e i n e t a 1 , 2 0 1 0 ;k i m, b e r e t v a s ,& s h e r r y , 2 0 1 0 ; mu t h 6 n&as p a r o u h o v , 2 0 0 6 ) 。 c l a r k等( 2 0 0 9 ) 建议将表 1中 f mm 的 5种变式都纳入每一种组 合( 如单因素两类别) 的模型中进行 比较,并指出 在满足强等值时才可进行类别间的比较。 ( 4 ) 在 f mm 的最佳模型确定之后,将 l c a、 f a以及 f mm 三种最佳模型进行比较,参考的依 据同样是 b i c指数 以及模型的可解释性(
37、cl a r k e t a 1 , 2 0 0 9 ) 。 总而言之,模型比较与选择是一个综合考虑 的过程,统计指标 固然是一个重要的参 考标准 , 但模型本身的可解释性同样不容忽视。 4 2 f mm 的分析软 件 目 前, 常用的 s e m建模软件 mp l u s 中已有分 析 f mm 的模块。在使用时需注意一些关键的设 置 。 首 先 ,an a l y s i s 指 令 下 ,一 方 面 需 加 入 t y p e = mi x t u r e ,用于指定模型分析类型为混合分 析 。另一方面,由于混合模型在参数估计过程中 采用基于极大似然估计 的迭代算法 ,容易产生局 部解(
38、 1 o c a l s o l u t i o n ) 而非总体解( g l o b a l s o l u t i o n ) , 且两种解之间的差异较大,因此还需提供不同的 初 始值( mc l a c h l a n&p e e l , 2 0 0 0 ) 。 其次,mo d e l 命令方面,o v e r a l 1 下面的语 句用于定义适用于各类别的模型,同时可限定模 型内参数存在跨类别不变性;c 1 用于说 明第 一 个类 别不 同于其 他类 别 的特定方 面 ;此外 , mp l u s 中默认最后一个类别的因子均值为 0( c l a r k e t a 1 , 2 0 0
39、 9 ) 。 5 应用举例 下面用一个实际例子来演示 f mm 的分析过 程,数据来 自 4 0 0名大学生关于社会面子意识的 测量结果,社会面子意识意指个体在社会关系 中 希望提升面子或是害怕失去面子的需要。测量工 具为 z h a n g , c a o和 g r i g o r i o u( 2 o i l ) 编制的社会面 子意识量表,按 7点记分,从“ 完全不符合” 到“ 完 全符合” 。其中 0 5 的被试含缺失数据,采用 e m 算法进行填补,分析软件为 mp l u s 7 0 。 第 3期 陈 宇帅等 :因子混 合模 型 :潜 在类 别分析 与 因子分 析 的整合 5 3 5
40、 按照前文描述 的分析步骤。第一步,对数据 进行 l c a分析,确定调查群体合适的类别数。由 于本例 中l c a分析属于探索性研究,因此参考邱 皓政( 2 0 0 8 ) 提 出的探索性 l c a 的分析步骤,即从 单一类别开始,逐渐增加类别数,通过拟合指数 比较决定最佳模型 。表 3给出了从一个类别到五 个类别各模型的拟合结果,可以看到,随着类别 个数的增加,模型的 b i c 指数呈单调递减趋势, 依据 p e t r a s和 ma s y n( 2 0 1 0 ) 研究 中的建议,将各 模型的 b i c指数描绘成图,寻找出可能的拐点。 图3显示拐点出现在两类别处, b i c指
41、数支持两类 别模型。但是,l mr在三类别模型中达到了显著 性水平,而在 四类别模型中未达到显著 性水平 , 表 明 l mr 支持三类别模 型。此时,需要通过 b l r t指数来进一步判断,从表 3 可以看出, bl r t 在三类别模型中达到了显著性水平,因此,确定 三类别为合适的类别数,将该模型记为 m, 。 图 4刻画了各类别在问卷上可能的应答模式, 其中类别 1包含了 2 3 8 的被试,这类被试在 1 1 个条 目上均倾向于选择低分,表明类别 1的被试 并非好争面子,也不害怕失去 面子,因此可命名 为“ 低面子关注群体” ;类别 2 包含了5 7 8 的被试, 这类被试关注 自己
42、面子的获得与失去,但这种倾 向性仅处于中等程度,因此可命名为“ 中等 面子 关注群体” ;类别 3包含 了 1 8 3 的被试,这类被 试在所有条 目上均倾向于选择高分,表明被试既 希望获得面子,又害怕失去面子,因此可命名为 “ 高面子关注群体” 。 第二步,对数据进行 f a分析,竞争模型包含 单因子以及两因子模型,从表 3可以看出, b i c指 数支持两 因子模型,其他拟合指数方面,两 因子 模型同样比单因子模型拟合更好,因子负荷均达 到了显著性水平,因此,确定两因子为合适 的因 子数,将该模型记为 m2 。 第三步,构建包含不同类别不同因子个数的 f mm,并将 f mm 的 5 种变
43、式均纳入模型比较 中。 从表 4可以看出,三类别两因子 f mm 4的b i c值 最小, l mr、bl r t均达到了显著性水平,表明三 类别模型相比两类别模型拟合更佳,因此,确定三 类别两因子 f mm 4为 f mm的最佳模型, 记为 m3 。 第四步,比较 ml 、m2 和 m3 。结合拟合指数 发现,m3 的 bi c值最小,因此,本例中选取三类 表 3 l ca和 f a模 型拟 合指数 汇总 表 模型 对数似然值 自由参数个数 r ms e a c f i t l i b i c l mrp值 b l r tp值 单类别 两类别 三类别 四类别 五类别 单因子 两 因 子 -
44、7 5l 6 5 - 7 4 0 6 6 潜在类别分析 1 6 3 1 2 5 1 5 5 78 4 1 5 3 67 6 1 5 2 91 9 1 5 2 7 46 因子分析 0 1 3 2 0 7 8 7 0 7 3 3 1 5 2 3 0 8 0 0 7 2 0 9 3 8 0 9 21 l 5 01 69 00 0 0 00 0 4 00 9 6 l 6 4 o 0 l 6 2 o 0 1 6 o 0 o 1 5 8 0 0 1 5 6 0 0 1 5 4 0 0 1 5 2 0 0 1 5 0 o o 1 48 0 0 1 46 o o 图 3 bi c折 线 图 图 4 三 类别
45、lc a剖 面图 3 4 o 2 6 o 7 6 2 7 9 8 4 7 2 o 6 5 4 4 8 7 7 7 7 一 一 一 一 一 5 3 6 理 科 学 进 展 第 2 3 卷 表 4 f mm 各模型 拟合指 数汇 总表 注 : 模型不收敛 别两因子 f mm 4为最佳模型,表明调查的4 0 0 名 大学生中关于社会面子意识方面不仅存在质的差 异,同时每个类别 中还存在程度上的差异。所有 4 0 0名大学生可区分为三个类别 。而社会面子意 识问卷共测量两个维度,分别为“ 希望获得面子” 和“ 害怕失去面子” ,因子负荷在三个不同类别均 一 致,表明三类群体享有相同的因子结构。 类别的
46、命名与解释参考图 5 。类别 3包含了 2 5 5 的被试,从整体趋势上看,这类被试得分为 三类中最高 ,他们对面子的关注程度最为强烈, 因此可命名为“ 高面子关注群体” 。类别 2包含了 5 8 的被试,这类被试相对类别 3 而言,他们对面 子的关注程度稍显 降低,因此可命名为“ 中等面 子关注群体” ;类别 1则包含了 1 6 5 的被试,这 图 5 三类别 两因子 f mm 4剖面 图 类被试虽然在第 1 、2 、4题中得分倾向于处于中 等水平,表明被试有些许获得面子 的期待,但整 体而言,在大部分题 目上均倾 向于选择低分,因 此可命名为“ 低面子关注群体” 。 比较图 4和图 5 发
47、现,增加了f a的 f mm在 潜在类别概率以及答题模式上相比 l c a 均发生 了明显的变化。l c a模型将本应只存在程度差异 的个体视为质的差异,使得可能同属一个类别的 个体被强制性地划分在两个类别中:而 f mm 考 虑了量 的差异这一 因素,避免了上述分类的出现, 从 而 也 导 致 了 两 类 模 型 归 类 的差 异 ,如 原 本 在 l c a 中从属于类别 2的个体在 f mm 中被划分在 类 别 3中 。本 例结果 也很好 地 印证 了 mu t h 6 n和 as p a r o u h o v( 2 0 0 6 ) 所述 l c a与 f mm 的潜在类别 构成存在差
48、异这一说法。 6 结 语 如前文所述,结合 了两种分析方法特 性的 f mm 有着许多 自身的优势。一方面,它既能够像 l c a 一样探讨样本潜在的异质性问题,了解可能 存在的潜在类别个数,并估计出每个被试从属于 各类别的可能性:另一方面也保留了 f a 所具有 的功能,能够对各类别内观测变量之间的关系进 行建模, 估计各类别内的参数( 如因子负荷 、截距 以及 因子均值等) 并允许其跨类别变化,避免 了 f a 忽视样本潜在的异质性可能导致的错误结果, 使不 同潜 在类别之间的比较成为了可能。诚然, f mm 作为一种新的分析技术拥 有广阔的前景 , 但值得注意的是, f mm 并非总能与
49、数据达到最佳 的匹配( c l a r k e t a 1 , 2 0 0 9 ) ,因此传统的 f a与 l c a 技术同样不应舍弃。此外, f mm还存在着许多问 题有待研究者们进一步探讨。 第一,模型建构方面。 本文描述的 f mm 模型 中 f a 部分均只限于 c f a模型,即每个指标仅在 5 5 54 5 352 51 5o 5 4 3 2 1 o 露 第 3 期 陈宇帅等:因子混合模型 :潜在类别分析与因子分析的整合 5 3 7 各 自因子上有负荷,因子分析的另一种形式 e f a 与 l c a模型的结合,有待研究。 第二,模型拟合方面。f mm 在实际分析过程 中需要拟合
50、的模型数 目较多,特别 当因子或潜在 类别个数较多时,分析将变得更加繁琐。 而且,每 一 模型在拟合数据的过程中,需要不断更改始值 的设定来避免获得局部最大化解,这在很大程度 上降低了 f mm 分析的灵活性。因此,f mm 分析 过程的简化还需加 以改进。 第三,模型评价方面。尽管 ny l u n d等( 2 0 0 7 ) 研究中推荐使用 b l r t检验,但在实际分析过程 中, bl r t检验通常情况下并不敏感,容易出现显 著的结果;而且 当 b i c指数随着类别数的增加逐 渐减少但无 明显拐点时,模型将变得难以取舍 。 因此,有关拟合指数方面还需要更多的研究。 第 四,f mm
51、 作为一种新的统计分析技术,还 有一些细节问题值得继续探讨。例如,传统的 c f a 能够提供测验信度和效度的相关信息,而 f mm 作为考虑了群体异质性 的 c f a模型,能否用来更 好地评价测验信度和效度?又如,虽然 f mm 与 l c a 均可实现对被试的分类,但两者分类精确性 谁高谁低 尚无定论。还有,对于一些复杂的模型, 如多水平 f mm模型,有待研究。 参考文献 邱皓政 ( 2 0 0 8 ) 潜在类 鄹模型的原理与技术北京 :教育 科学出版社 王 孟哉 ( 2 0 1 4 ) 潜变量建模与mp l u s应用:基础篇 童茯l 重庆大学 出版社 温忠麟刘 红云,侯杰泰( 2
52、0 1 2 ) 花应 l应 分 北京 :教育科学 出版社 be r n s t e i n ,a ,s t i c kl e ,tr ,zv o l e n s k y ,m j ,t a y l o r ,s , ab r a mo wi t z ,j ,& s t e wa r t ,s ( 2 0 l o ) di me n s i o n a l , c a t e g o r i c a l ,o r d i me n s i o n a l - c a t e go r i e s :t e s t i n g t h e l a t e nt s t r u c t u r e
53、of a nx i e t y s e n s i t i vi t y a m o ng a d u l t s u s i n g f a c t o r - mi x t u r e mo d e l i n g be h a v i o r t h e r a p y ,4 1 , 5 1 5 -5 2 9 cl a r k, s l , m ut h 6 n, b, ka p r i o , j , d on o f r i o , b m , vi k e n , r , r o s e , r j , s ma l l e y , s l ( 2 0 0 9 ) mo d e l
54、s a n d s t r a t e g i e s , f a c t o r mix t u r e a n a l y s i s t w o e x a m p l e s c o n c e r n i n g t h e s t r u c t u r e u n d e r lyi n g p s yc h o l o gi c al di s o r d e r s re t r i e v e d m a r c h 1 5 ,2 01 4 ,f r o m h t t r l : www s t a t mo d e 1 c o r n d o wn l o a d fm
55、 a 2 0 pa p e r _ v1 4 2pd f f e r r a n d o p j ( 2 0 0 5 ) f a c t o r a n a l y t i c p r o c e d u r e s f o r a s s e s s i ng s o c i a l d e s i r a b i l i t y i n b i n a r y i t e ms m u l t i v a r i a t e be h a v i o r al re s e a r c h ,4 0 , 3 3 1 -3 4 9 j e d i d i ,k ,j a g p a l ,h
56、s , de s a r b o ,ws ( 1 9 9 7 ) fi n i t e mi x t u r e s t r u c t u r a l e q ua t i o n mod e l s fo r r e s p o ns e b a s e d s e g me n t a t i o n a n d u n o b s e r v e d h e t e r o g e n e i t y ma r k e t i n g s c i e n c e ,1 6 ,3 9 -5 9 ki m,s h ,b e r e t v a s ,s n ,& s h e r r y ,
57、ar( 2 0 1 0 ) a v a l i d a t i o n o f t h e f a c t o r s t ruc t u r e o f oq- 4 5 s c o r e s u s i n g f a c t o r mi x t u r e mo d e l i n g m e a s u r e me n t a n d ev al u a t i on i n co u n s e l i n g a n d de v e l o pme n t , 4 2 , 27 5 2 95 ku o ,p h , ag g e n, s h ,p r e s c o t t ,ca , ke n d l e r ,k s , & ne a l e ,mc ( 2 0 0 8 ) us i n g a f a c t o r mi x t u r e mo d e l i n g a p p r o a c h i n a l c o h o l d e pe n d e n c e i n a g e n e r a l p o p u l a t i o n s a mpl e dr u g a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度河北司法警官职业学院单招《语文》测试卷附完整答案详解【必刷】
- 妊娠合并绞窄性肠梗阻个案护理
- 2024-2025学年园林绿化作业人员能力提升B卷题库含完整答案详解(历年真题)
- 重度子痫前期患者护理伦理问题
- 2024-2025学年度电工模考模拟试题带答案详解(黄金题型)
- 2024-2025学年度烟草职业技能鉴定考试综合练习附答案详解(A卷)
- 环保与可持续发展项目执行指南
- 2024-2025学年度“安全生产事故隐患排查”知识竞赛全真模拟模拟题带答案详解(B卷)
- 2024-2025学年度一级建造师全真模拟模拟题带答案详解(基础题)
- 2024-2025学年度园林绿化作业人员考前冲刺测试卷及完整答案详解【夺冠】
- 深圳大学《算法设计与分析》2023-2024学年期末试卷
- 中小学教师聘用合同模板
- 江西天宇化工有限公司30万吨年离子膜氯碱项目环境影响报告书
- 食堂承包居间合同模板
- 新解读《JTGT J21-2011公路桥梁承载能力检测评定规程》
- 处方书写规范考核试题及答案
- 2024年辽宁阜新市事业单位招聘普通高校退伍大学生(高频重点复习提升训练)共500题附带答案详解
- 2024年大学华西医院运营管理部招考聘用3人(高频重点复习提升训练)共500题附带答案详解
- 牛津自然拼读-课件-带音频动画Level3-U3-o-e
- 《民航客舱设备操作与管理》课件-项目四 飞机舱门及撤离滑梯
- 零星维修工程施工组织设计
评论
0/150
提交评论