因子混合模型：潜在类别分析与因子分析的整合

上传人：伐*** IP属地：宁夏上传时间：2020-07-12 格式：PDF 页数：10 大小：595.59KB 积分：7.2 举报 版权申诉

已阅读5页，还剩5页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、心理科学进展2 0 1 5 ， v o 1 2 3 ， no 3 ， 5 2 9 5 3 8 ad va n c e s i n p s yc ho l og i c a l sc i e n c e doi ：1 03 7 2 4 s p j 1 0 42 2 0 l 5 0 0 5 2 9 因子混合模型：潜在类别分析与因子分析的整合陈宇帅温忠麟顾红磊 ( 华南师范大学心理应用研究中心理学院，广州 5 1 0 6 3 1 ) 摘要因子混合模型( f mm) 是考虑了群体潜在异质性后的因子分析模型，它将潜在类别分析( l c a) 与传统的因子分析( f la

2、 ) 整合在同一框架内，既保留了两种分析技术的优点，同时又展现出独特优势。f mm 的应用主要包括描述变量的潜在结构、对被试进行分组以及探测社会称许偏差等。我们建议分别采用 f a、 l c a与 f mm 三种模型拟合数据，参考拟合指数和模型可解释性选择最优模型。总结了f mm 的分析步骤以及软件使用，并用于探讨大学生社会面子意识的测量模型。未来研究应关注 f mm分析过程的简化，继续深化对拟合指数等方面的探讨。关键词因子混合模型；潜在类别分析；因子分析分类号 b 8 4 1 在心理学研究中，由于许多人格特质、内隐态度等的不可直接观测性，潜

3、变量模型得到广泛应用，其中因子分析( f a c t o r a n a l y s i s ，f a ) 比较流行。然而， f a的样本同质性假设在许多场合可能不成立( j e d i d i ， j a g p a l ， & de s a r b o ，1 9 9 7 ； y u a n& be n t l e r ,2 0 1 o ) 。许多研究样本中包含不同性别、年级，或者不同能力、态度的个体，异质性可能是普遍存在的。假定所有个体具有相同的参数值往往与实际相悖，产生模型拟合不佳等结果。尽管多组模型( mu l t i p l e g r o u p mo d

4、e l s ) , 够处理外显异质性，但对于样本潜在的异质性则显得无能为力。为了解决这一问题，因子混合模型( f a c t o r mi x t u r e mo d e l ， f mm) 作为一种新的分析技术应运而生。 f mm是潜在类别分析( l a t e n t cl a s s an a l y s i s ， l c a) 与 f a的结合，继承了两种分析技术的优点，弥补了各自的局限，为研究者提供了一个全新的视角，但目前实际应用还不多。本文以 f mm 为主题，首先介绍了f mm的基本形式，包括数学模型及基本原理：接着归纳了 f mm 的主要优势以及实际应用

5、，然后总结了f mm 的分析步骤，并以一个实例进行示范；最后就 f mm 有待完善的问题，收稿日期：2 0 1 4 0 5 2 6 国家自然科学基金项目( 3 1 2 7 1 1 1 6 ， 3 1 4 0 0 9 0 9 ) 资助。通讯作者：温忠麟， e ma i l ： we n z l s c n u e d u c n 5 29 提出研究展望。 1 f a、l c a与 f mm 简介 1 1 f a 简介 f a 作为多元统计中重要的方法之一为研究者广泛使用，其目的在于通过一个或多个因子来解释各指标间的关联，从而实现对指标的分组。本文考虑的 f a

6、模型仅限 c f a模型。以图 1中的 m 为例，假定模型中有，个指标，测量了两个因子 l 和 2 ，其中前 t 个指标测量了 1 ，其余指标测量了 2 。模型可用如下方程表示： y 1 =r l +1 +8 1 ，一， yt= + 1 v i i+ ， y t + 1 =c t + 1 + + 1 ) 2 叩 2 + + i ，， ( 1 ) y，=f ，+ 2 + ，叩 1= 1+ ，， 7 2= 2+ 在上述方程中， y l 表示第 1 个指标， r l 表示y 1 的截距， l 1 表示y 1 在叩 1 上的负荷， 1 表示y 1 的误差， a 1 表

7、示因子叩 1 的均值，表示叩 1的离均差( 残差) ，其余符号类推。 1 2 l ca简介 l c a是一种通过类别潜变量来解释指标间的关联，进而实现指标间局部独立的统计方法。与 f a相比，两者在形式上颇为相似( 见图 1中的 m1 5 3 0 心理科学进展第 2 3 卷和 m ) ，但两者存在本质差异。首先，潜变量的尺度不同。f a 中因子是连续变量，而在 l c a 中被潜在类别变量 c取代。其次，两者关注的焦点不同。f a 的焦点是对变量进行分类，而 l c a 的焦点是对被试进行分类。l c a分析的统计原理主要是条件概率和贝叶斯公式。以图 1中的

8、 m2 为例，假定模型中共包含 r 个指标，都是 0 1 取值，指标间的关联由潜在类别变量 c 所解释。设有个类别，则有( c l a r k e t a 1 ， 2 0 0 9 ) ：土 p ( y j b j ) p ( c = k ) p ( y j = 1c = k )( 2 ) k=l 在公式( 2 ) 中，下标表示第个指标，k表示第 k 个类别，6 ，的取值为 0或 1 。p ( c = 和 p 尸b j lc = k ) 是 l c a分析中两个主要的参数，前者称为潜在类别概率，描述了第 k个类别占总体的比例，也是任一被试属于第 k个类别的概率：后者是

9、条件概率，描述了第个类别的被试在第，个指标上取值 6 ，的概率( 邱皓政，2 0 0 8 ) 。p ( y j = b j ) 称为边缘概率 ( ma r g i n a l p r o b a b i l i c y ) ，表示任一被试在第个指标上取值 b ，的概率。 l c a一个重要的假定是局部独立性，就是本来关联的各指标间在被潜在类别变量解释后彼此独立。基于上述假定，公式( 2 ) 可扩展为( c l a r k e t a 1 ， 2 0 0 9 ) ：羔 p ( y l ： b l ，， y = ) = p ( c = k ) p ( y l = 6 l lc

10、 = j ) k= l p ( y = b r ic = k ) ( 3 ) 其中， b 1 ， b 2 ，， b ，的取值为 0或 1 。p 1 =b 一， y =6 ， ) 称为联合概率( j o i n t p r o b a b i l i t y ) ，描述了任一被试在 r 个指标上出现某种答题模式的概率。在求得联合概率、条件概率和潜在类别概率的基础上，可依据 ba y e s定理计算每个被试从属于各类别的概率( 邱皓政， 2 0 0 8 ) ，计算公式如下： p ( c = k ly l = 岛， y = b r ) p ( c = k ) p ( y l =

11、 b l lc = 七 ) 尸 ( = lc = k ) ( 4 ) p ( y l =b l ，， =b r ) 公式( 4 ) 计算得到的概率称为后验概率。后验概率是 l c a进行分类的重要依据，通常将被试判入后验概率最大的类别中。例如，在 l c a情境下，若已知某个被试在所有题目上的得分均较高，被试属于高能力组的后验概率将会最大。 1 3 f mm 简介在 l c a 与 f a 的基础上，将两者加以结合，便可得到 f mm。不同的假设会得到不同的 f mm 形式。图 1中的 m3 为 f mm 的变式之一，就是表 2中的 f mm 2 。 f mm 2

12、同时纳入了潜在类别变量和因子来解释指标间的关联，其中前者用于对被试进行分类，而后者用于对变量进行分组。模型中由叩】和叩 2 指向指标的实线表示因子分别由相应指标测量，由c指向叩和叩的实线表示不同类别的因子均值可以不同，允许类别内因子方差、协方差自由估计，其余参数( 如因子负荷、截距等) 在 f mm 2模型中则设为等值( 见图 1中的 m3 ) 。但对于 f mm 的一般形式而言，各参数均允许跨类别变化。对于每一类，都可以用( 1 ) 中那样的一组方程表示模型，但不同类符号需要用类别代码 ( 如进行区分。例如，用 a - 和 a 2 k 分别表示第 k

13、类的两个因子均值。与多组模型类似，每类截距自由估计的同时需固定因子均值 ( l u b k e & mu t h 6 n ， 2 0 0 7 ) 。一图 1 f a、lc a与 f mm 示意图 1 4小结通过上面 3个部分的描述，可以看出，f mm 实际上是 f a与 l c a的结合体，而 f a与 l c a则是 f mm 的特例。当k= i时， f mm模型可简化为通常熟知的 f a模型：而当潜变量 c 中每一类别内因子方差均为零时， f mm与 l c a两者无异( l u b k e & mu t h 6 n ， 2 0 0 5 ) 。

14、 ma s y n ， he n d e r s o n和 g r e e n b a u m ( 2 0 1 0 ) 基于维度一类别框架下提出了 f mm 更多的特例，如半参数、非参数因子混合模型等。c l a r k 第 3 期陈宇帅等：因子混合模型：潜在类别分析与因子分析的整合 5 3 1 等( 2 0 0 9 ) 根据参数限定程度的不同描述了 f mm 的 5种变式( 见表 1 ) ，如潜在类别因子分析模型 f l a t e n t c l a s s f a c t o r a n a l y t i c mo d e l ， l c f a) 、混合因子分析( mi

15、 x t u r e f a c t o r a n a l y s i s ) 等。 2 f mm 的主要优势传统的 f a 主要用于描述变量间的关系。而 l c a 主要用来对被试进行分组。f mm 作为两种分析技术的整合，继承了两者的优点，弥补了各自的局限，同时还形成了自身的独特优势。 2 1 f mm 继承的优势 ( 1 )描述变量关系。与 f a类似， f mm 可以通过抽取一个或多个因子来解释各指标间的关系，并估计出因子负荷、因子方差等相应参数。 ( 2 )对被试进行分组。 f mm 同样可以像 l c a 一样根据后验概率将被试划分为不同的潜在类别，同时估

16、计出潜在类别概率以及条件概率。 ( 3 )提高分类精确性。f mm 继承了 l ca 的特点，可将相关的协变量纳入模型中，并与潜在类别变量建立起联系，能够对被试的分类结果产生影响。l u b k e和 mu t h 6 n( 2 0 0 7 ) 的模拟研究表明，当协变量对潜在类别变量的影响程度提高时，模型在分类准确性上也能得到相应提高。 2 2克服了 f a与 l c a 的局限首先，如前文所述，f a 最大的特点在于能够对变量进行分组。然而 f a 同样存在自身的缺陷，例如难以实现被试的分组。虽然 f a 可通过描绘因子分数图并找出可能存在的分界点，但分界点

17、在实践中通常较难找到，尤其是当因子数目多于 1时( c l a r k e t a 1 ， 2 0 0 9 ) 。f mm 的出现一方面使得 f a本身具有的功能得到了继承，另一方面基于模型进行分组的优势相比f a有了很大的发展。其次，虽然 l c a 能有效地对被试进行分组，但其局部独立性假设是一个潜在的局限。一方面，当局部独立性假设难以满足时，l c a 可以通过增加类别个数来实现，但也可能因此导致增加的类别并非真正的子群体，而 f mm 通过添加因子来解释条目间余下的关联，避免了这一现象的出现：另一方面，即便添加的类别为真正的子群体， f mm

18、也能起到减少类别个数的作用。此外，根据 l c a 的局部独立性假设，对于每一测验题目，各类别内所有个体在该题上均有着相同的条件概率，而实际上组内同样存在变异， f mm 通过因子很好地解释了这一变异( c l a r k e t a 1 ， 2 0 0 9 ) 。 2 3 f mm 的独特优势 2 3 1 描述变量潜在结构的新视角当前，对心理特质潜在结构的描述存在两种不同的主流观点。其中一种认为潜在结构中仅包含单一的连续潜变量，个体间只存在量的差异；而另一种则认为这一结构中仅包含单一的类别潜变量，个体间只存在质的差异。然而，究竟哪种观点更为合适时常存在争议，导致

19、两种不同的分析技术 l c a以及 f a分别用于同一特质的分析( ku o ， ag g e n ，p r e s c o t t ， ke n n e t h ，& ne a l e ，2 0 0 8 ；mu t h 6 n ， 2 0 0 6 ) 。事实上，变量的潜在结构还存在着第三种视角，即同时包含连续潜变量与类别潜变量的混合。f mm 的出现为分析这一视角提供了可能，融合了连续与类别潜变量的 f mm 使得研究者在分析处理问题时更加灵活方便，无须在连续与类别间强迫做出选择。 2 3 2 检验测量不变性与多组模型类似， f mm 假定被试群体异质，因此同样可用来检验

20、测量不变性问题( me a s u r e me n t i n v a r i a n c e ，mi ) 。某些方面，两者确有相似之处，如都设定参照组的因子均值为 0 ，仅在满足强等值( 负荷、截距等值) 的情形下才允许因子均值间的跨类别比较。但差异依旧存在，主要体现在分析步骤以及比较标准两个方面。以多组 c f a 为例， 5 3 2 理科学进展第 2 3 卷在检验跨组不变性时，通常从因子负荷等值开始，逐步添加限制条件进行分析( 王孟成，2 0 1 4 ；温忠麟，刘红云，侯杰泰， 2 0 1 2 ) ，而 f mm 并没有类似统一的步骤，可同时设定多个

21、限制条件进行分析，如表 1中描述的 f mm变式， 5类模型之间的参数限定并未出现如多组 c f a一样的递进关系。此外，多组 c f a中由于模型之间形成嵌套的关系，一般可通过嵌套模型的卡方检验进行取舍，而 f mm 的模型比较主要基于信息指数进行判断。 2 3 3允许因子非正态传统的 f a和 s e m 模型中，为了估计的方便，通常假定因子服从正态分布。然而，这一正态性假设在实际问题中并非总能成立，结果可能对模型参数产生误估( wa l l ， g u o ， &a me mi y a ， 2 0 1 2 ) 。f mm 模型假定因子服从混合分布( mi x t

22、u r e d i s t r i b u t i o n ) ，即一个非正态的因子分布可视为由若干子分布混合而成，这些子分布接近或符合正态分布，因此，释放了传统潜变量模型关于因子正态性的假定，使得分析问题更加灵活准确。wa l l等( 2 0 1 2 ) 的模拟研究发现，在估计非正态因子与二分后果变量间的关系时，以传统的 f a建构测量模型，采用极大似然估计( ml ) 的方式将会产生较大的估计偏差。而 mi x t u r e f a c t o r a n a l y s i s 能够获得接近无偏的结果，特别是当样本容量大于 5 0 0时。 3 f mm 的应用 f

23、 mm 作为一种新的分析技术当前应用还不多，从为数不多的实证研究来看，f mm 的应用主要包含三大方面：描述变量潜在结构、对被试进行分组以及探测社会称许偏差。 3 1 描述变量的潜在结构相对而言，f mm 在这方面的实证研究较多，且主要集中于临床心理领域，判断变量的潜在结构中究竟只包含单一的连续或类别潜变量，还是包含两者的混合 ( b e r n s t e i n e t a 1 ， 2 0 1 0 ； ku o e t a 1 ， 200 8； m u t h6 n， 200 6； m u t h6 n&as pa r ouho v， 2 0 0 6 1

24、。对于这方面应用，通常做法是分别采用 f a、l c a以及 f mm 三种方法拟合数据，根据拟合指数的优劣来选取合适的测量模型。以 mu t h 6 n 和 as p a r o u h o v( 2 0 0 6 ) 的研究为例，研究者希望构建最为合适的测量模型用于理解烟草依赖这一特质，为此从 ds m i v量表中选取了7 个条目，分别采用 f a、 l c a以及 f mm三种不同类型的潜变量模型拟合三个不同的样本数据，通过对比分析发现，相比传统的 f a以及 l c a，f mm 拟合数据效果更佳。需要注意的是，在实际应用时，虽然大部分研究者们均采用了 f

25、 a、 l c a和 f mm 三种模型结合的思路进行分析，但就这些研究而言，涉及到模型比较以及拟合指数的选取并未达成一致的观点，不过，cl a r k 等( 2 0 0 9 ) 针对这一问题整理了 f mm 分析的详尽步骤，并以两个实例进行了详细解释，值得未来的实证研究借鉴。 3 2 对被试进行分组在管理、教育以及临床领域，研究者常常关注被试的分组问题。准确地对人群进行分类不仅能有效地帮助企业甄选人才，也可以为不同能力水平的学生制定针对性的培养计划。基于原始分数的传统分组方式，不仅很难找到合适的分界点，而且也忽略了测量误差以及测量等

26、值的重要性，而基于模型进行分组的 f mm 可以很好地解决这一弊端。 mo r i n ， mo r i z o t ， b o u d r i a s 和ma d o r e( 2 0 1 1 ) 针对加拿大三大服务机构的 4 0 4名员工情感承诺的 7 个方面进行了测量，并通过 f mm 将员工分成了 5类，其中一类员工在 7个方面上的得分均较高，另外一类则均较低，其余三类在 7个方面上的得分有高有低，呈现出不一致的趋势。同时，研究还将相关的协变量以及后果变量纳入了 f mm 分析中，作为 f mm 分类有效性的判断标准。值得注意的是， f mm与l c a两

27、者虽然都可实现分组的功能，但在实际分类结果上，依然存在差异。f mm允许类别内条目间相关，一方面使分类更具意义，另一方面也使 f mm 潜在类别的构成与 l c a存在差异( mu t h 6 n&as p a r o u h o v , 2 0 0 6 ) 。此外，由于引入协变量有助于提高分类的精确性，因此，当研究的主要目的在于对被试进行归类时，可考虑纳入相关的协变量进行分析。同时， l u b k e 和 mu t h 6 n( 2 0 0 7 ) 提出了两步分析的方法，依次考虑负荷自由估计和负荷固定的模型，该方法适用于潜类别间隔较小且协变量不适合纳入模型时的情形

28、。 3 3 探测社会称许偏差社会称许偏差( s o c i a l d e s i r a b l e bi a s ，s db ) 是指被试倾向于依据社会满意的方向进行作答的歪曲反应，通常会影响研究结果的有效性。过去研究者发展了许多探测 s db的方法，如统计控制或第 3 期陈宇帅等：因子混合模型：潜在类别分析与因子分析的整合 5 3 3 是实验设计等等 o比较流行的做法是 f e r r a n d o ( 2 o o 5 ) 建议的 c f a 检验方式，但 l e i t e和 c o o p e r ( 2 0 1 0 ) 认为这种方式仅仅考虑到条目本身的特

29、征，忽略了被试在作答倾向上的个体差异，他们进一步提出将 f mm 应用于探测 s db当中，并考察了关于专业间服务学习的态度测验( a t t i t u d e t o wa r d i n t e r p r o f e s s i o n a l s e r v i c e l e a r n i n g s c a l e ， ai s ) 是否会诱发学生的 s d b反应。模型中包含三类因子：焦点因子( f o c a l f a c t o r ) 、 s db因子以及潜在类别因子( 见图 2 ) ，相应的假设以及竞争模型分别包含 4 个( 见表 2 ) 。其中，

30、前三类模型的比较用于了解被试是否可以区分为 s db倾向组和非 s db倾向组，而第四类模型用于识别 s db倾向组在不同焦点条目上的反应是否存在差异。 l e i t e 和 c o o p e r ( 2 0 1 0 ) 表 2 f mm 探测 s db的假设和竞争模型假设竞争模型模型描述 ho ：所有被试在焦点因子条目上的反应无 s db倾向 h l 【 j ：所有被试在焦点因子条目上的反应有 s d b倾向 hl ( b ) ：被试可区分为两类不同的群体，其中一类在焦点因子条目上的反应有 s d b倾向；另一类则无 s db倾向 hl

31、 ( 。 ) ：被试可区分为三类或是更多不同的群体单组无跨负荷模型所有焦点条目均不存在跨负荷( 见图 2 中 c l a s s 2 ) 单组跨负荷模型所有焦点条目均存在跨负荷( 见图 2中 c l a s s 1 ) 两组强等值模型票客帏槛赌一三组或多组强等值模型两组或多组中存在跨负争 l 争 2 即 3 旬印 1 2 铀铀图 2两组 f mm ( 资料来源： l e i t e&c o o p e r , 2 0 1 0 ) 5 3 4 理科学进展第 2 3卷的实例中通过模型比较发现，两组强等值模型拟合最佳。在 c l a

32、s s l中，条目2在 s d b因子上负荷达到 0 9 6 ，最大程度地引发了被试的社会称许倾向。研究还探讨了学生专业与潜在类别变量间的关系，结果发现心理学专业学生更容易诱发 s db 反应。将 f mm应用于探测 s db中有着很大的优势，一方面，通过焦点条目在 s d b因子上的负荷显著与否可识别特定的条目是否容易引发被试的社会称许反应，而负荷的大小反映了引发的程度，便于测验编制者针对性地修订问卷；另一方面，通过潜在类别个数的确定也可以了解被试在测验上的 s db倾向是否存在异质性。 4 f mm 的分析方法 4 1 f mm 的分析步骤 f mm 在实

33、际研究中应用较少的一个重要原因在于其使用方式的不明确，为了解决这一问题， c l a r k等( 2 0 0 9 ) 针对 f mm 的分析步骤、模型比较等方面进行了详尽的阐述，综合他们的观点，可包含如下步骤： ( 1 ) 单独对数据进行 l c a和 f a分析，分别得到 l c a确定的最佳类别个数和 f a确定的最佳因子个数。类别个数的确定参考 ny l u n d ， as p a r o u h o v 和 mu t h 6 n ( 2 0 0 7 ) 的模拟研究结果，即先参考 b i c 、l mr 指数初步筛选所有可能的竞争模型，然后结合 b l

34、 r t 以及分类的实际意义做出取舍 ( l mr与 bl r t在常用的 s e m 软件 mp l u s中，可通过调用指令 t e c h 1 1 、t e c h 1 4实现) 。因子个数的确定同样可参考 b i c指数、因子负荷的高低以及其他拟合指数做出判断； f 2 ) 构建包含不同类别个数以及不同因子个数的 f mm。从简单的单因子两类别 f mm 开始，在固定单因子个数的情形下逐渐增加类别数，类别数的上限为 l c a所得到的最佳方案。待类别数增 b i c 指数是一种信息指数，值越小表明模型拟合越好： l mr 是一种对数似然比检验，采用两嵌套

35、模型对数似然值差异的近似分布，显著的 p值表明 k个类别模型拟合优于 k 1 个类别模型： b l r t也是一种对数似然比检验，与l mr不同， b l r t 基于 b o o t s t r a p原理构造对数似然值差异的分布，显著的 p值表明 k 个类别模型拟合优于 1 个类别模型。至上限时，考虑两因子两类别模型，依照上述方式循环，直至因子个数与类别个数各自达到上限为止。f mm 模型比较的标准与 l c a类似。 ( 3 ) 模型比较方面，特别是 f mm 比较时是否应该考虑测量不变性( mi ) ，研究者尚未达成共识 ( b e m

36、s t e i n e t a 1 ， 2 0 1 0 ；k i m， b e r e t v a s ，& s h e r r y ， 2 0 1 0 ； mu t h 6 n&as p a r o u h o v ， 2 0 0 6 ) 。 c l a r k等( 2 0 0 9 ) 建议将表 1中 f mm 的 5种变式都纳入每一种组合( 如单因素两类别) 的模型中进行比较，并指出在满足强等值时才可进行类别间的比较。 ( 4 ) 在 f mm 的最佳模型确定之后，将 l c a、 f a以及 f mm 三种最佳模型进行比较，参考的依据同样是 b i c指数以及模型的可解释性(

37、cl a r k e t a 1 ， 2 0 0 9 ) 。总而言之，模型比较与选择是一个综合考虑的过程，统计指标固然是一个重要的参考标准，但模型本身的可解释性同样不容忽视。 4 2 f mm 的分析软件目前，常用的 s e m建模软件 mp l u s 中已有分析 f mm 的模块。在使用时需注意一些关键的设置。首先，an a l y s i s 指令下，一方面需加入 t y p e = mi x t u r e ，用于指定模型分析类型为混合分析。另一方面，由于混合模型在参数估计过程中采用基于极大似然估计的迭代算法，容易产生局部解(

38、 1 o c a l s o l u t i o n ) 而非总体解( g l o b a l s o l u t i o n ) ，且两种解之间的差异较大，因此还需提供不同的初始值( mc l a c h l a n&p e e l ， 2 0 0 0 ) 。其次，mo d e l 命令方面，o v e r a l 1 下面的语句用于定义适用于各类别的模型，同时可限定模型内参数存在跨类别不变性；c 1 用于说明第一个类别不同于其他类别的特定方面；此外， mp l u s 中默认最后一个类别的因子均值为 0( c l a r k e t a 1 ， 2 0 0

39、 9 ) 。 5 应用举例下面用一个实际例子来演示 f mm 的分析过程，数据来自 4 0 0名大学生关于社会面子意识的测量结果，社会面子意识意指个体在社会关系中希望提升面子或是害怕失去面子的需要。测量工具为 z h a n g ， c a o和 g r i g o r i o u( 2 o i l ) 编制的社会面子意识量表，按 7点记分，从“ 完全不符合” 到“ 完全符合” 。其中 0 5 的被试含缺失数据，采用 e m 算法进行填补，分析软件为 mp l u s 7 0 。第 3期陈宇帅等：因子混合模型：潜在类别分析与因子分析的整合 5 3 5

40、按照前文描述的分析步骤。第一步，对数据进行 l c a分析，确定调查群体合适的类别数。由于本例中l c a分析属于探索性研究，因此参考邱皓政( 2 0 0 8 ) 提出的探索性 l c a 的分析步骤，即从单一类别开始，逐渐增加类别数，通过拟合指数比较决定最佳模型。表 3给出了从一个类别到五个类别各模型的拟合结果，可以看到，随着类别个数的增加，模型的 b i c 指数呈单调递减趋势，依据 p e t r a s和 ma s y n( 2 0 1 0 ) 研究中的建议，将各模型的 b i c指数描绘成图，寻找出可能的拐点。图3显示拐点出现在两类别处， b i c指

41、数支持两类别模型。但是，l mr在三类别模型中达到了显著性水平，而在四类别模型中未达到显著性水平，表明 l mr 支持三类别模型。此时，需要通过 b l r t指数来进一步判断，从表 3 可以看出， bl r t 在三类别模型中达到了显著性水平，因此，确定三类别为合适的类别数，将该模型记为 m，。图 4刻画了各类别在问卷上可能的应答模式，其中类别 1包含了 2 3 8 的被试，这类被试在 1 1 个条目上均倾向于选择低分，表明类别 1的被试并非好争面子，也不害怕失去面子，因此可命名为“ 低面子关注群体” ；类别 2 包含了5 7 8 的被试，这类被试关注自己

42、面子的获得与失去，但这种倾向性仅处于中等程度，因此可命名为“ 中等面子关注群体” ；类别 3包含了 1 8 3 的被试，这类被试在所有条目上均倾向于选择高分，表明被试既希望获得面子，又害怕失去面子，因此可命名为 “ 高面子关注群体” 。第二步，对数据进行 f a分析，竞争模型包含单因子以及两因子模型，从表 3可以看出， b i c指数支持两因子模型，其他拟合指数方面，两因子模型同样比单因子模型拟合更好，因子负荷均达到了显著性水平，因此，确定两因子为合适的因子数，将该模型记为 m2 。第三步，构建包含不同类别不同因子个数的 f mm，并将 f mm 的 5 种变

43、式均纳入模型比较中。从表 4可以看出，三类别两因子 f mm 4的b i c值最小， l mr、bl r t均达到了显著性水平，表明三类别模型相比两类别模型拟合更佳，因此，确定三类别两因子 f mm 4为 f mm的最佳模型，记为 m3 。第四步，比较 ml 、m2 和 m3 。结合拟合指数发现，m3 的 bi c值最小，因此，本例中选取三类表 3 l ca和 f a模型拟合指数汇总表模型对数似然值自由参数个数 r ms e a c f i t l i b i c l mrp值 b l r tp值单类别两类别三类别四类别五类别单因子两因子 -

44、7 5l 6 5 - 7 4 0 6 6 潜在类别分析 1 6 3 1 2 5 1 5 5 78 4 1 5 3 67 6 1 5 2 91 9 1 5 2 7 46 因子分析 0 1 3 2 0 7 8 7 0 7 3 3 1 5 2 3 0 8 0 0 7 2 0 9 3 8 0 9 21 l 5 01 69 00 0 0 00 0 4 00 9 6 l 6 4 o 0 l 6 2 o 0 1 6 o 0 o 1 5 8 0 0 1 5 6 0 0 1 5 4 0 0 1 5 2 0 0 1 5 0 o o 1 48 0 0 1 46 o o 图 3 bi c折线图图 4 三类别

45、lc a剖面图 3 4 o 2 6 o 7 6 2 7 9 8 4 7 2 o 6 5 4 4 8 7 7 7 7 一一一一一 5 3 6 理科学进展第 2 3 卷表 4 f mm 各模型拟合指数汇总表注：模型不收敛别两因子 f mm 4为最佳模型，表明调查的4 0 0 名大学生中关于社会面子意识方面不仅存在质的差异，同时每个类别中还存在程度上的差异。所有 4 0 0名大学生可区分为三个类别。而社会面子意识问卷共测量两个维度，分别为“ 希望获得面子” 和“ 害怕失去面子” ，因子负荷在三个不同类别均一致，表明三类群体享有相同的因子结构。类别的

46、命名与解释参考图 5 。类别 3包含了 2 5 5 的被试，从整体趋势上看，这类被试得分为三类中最高，他们对面子的关注程度最为强烈，因此可命名为“ 高面子关注群体” 。类别 2包含了 5 8 的被试，这类被试相对类别 3 而言，他们对面子的关注程度稍显降低，因此可命名为“ 中等面子关注群体” ；类别 1则包含了 1 6 5 的被试，这图 5 三类别两因子 f mm 4剖面图类被试虽然在第 1 、2 、4题中得分倾向于处于中等水平，表明被试有些许获得面子的期待，但整体而言，在大部分题目上均倾向于选择低分，因此可命名为“ 低面子关注群体” 。比较图 4和图 5 发

47、现，增加了f a的 f mm在潜在类别概率以及答题模式上相比 l c a 均发生了明显的变化。l c a模型将本应只存在程度差异的个体视为质的差异，使得可能同属一个类别的个体被强制性地划分在两个类别中：而 f mm 考虑了量的差异这一因素，避免了上述分类的出现，从而也导致了两类模型归类的差异，如原本在 l c a 中从属于类别 2的个体在 f mm 中被划分在类别 3中。本例结果也很好地印证了 mu t h 6 n和 as p a r o u h o v( 2 0 0 6 ) 所述 l c a与 f mm 的潜在类别构成存在差

48、异这一说法。 6 结语如前文所述，结合了两种分析方法特性的 f mm 有着许多自身的优势。一方面，它既能够像 l c a 一样探讨样本潜在的异质性问题，了解可能存在的潜在类别个数，并估计出每个被试从属于各类别的可能性：另一方面也保留了 f a 所具有的功能，能够对各类别内观测变量之间的关系进行建模，估计各类别内的参数( 如因子负荷、截距以及因子均值等) 并允许其跨类别变化，避免了 f a 忽视样本潜在的异质性可能导致的错误结果，使不同潜在类别之间的比较成为了可能。诚然， f mm 作为一种新的分析技术拥有广阔的前景，但值得注意的是， f mm 并非总能与

49、数据达到最佳的匹配( c l a r k e t a 1 ， 2 0 0 9 ) ，因此传统的 f a与 l c a 技术同样不应舍弃。此外， f mm还存在着许多问题有待研究者们进一步探讨。第一，模型建构方面。本文描述的 f mm 模型中 f a 部分均只限于 c f a模型，即每个指标仅在 5 5 54 5 352 51 5o 5 4 3 2 1 o 露第 3 期陈宇帅等：因子混合模型：潜在类别分析与因子分析的整合 5 3 7 各自因子上有负荷，因子分析的另一种形式 e f a 与 l c a模型的结合，有待研究。第二，模型拟合方面。f mm 在实际分析过程中需要拟合

50、的模型数目较多，特别当因子或潜在类别个数较多时，分析将变得更加繁琐。而且，每一模型在拟合数据的过程中，需要不断更改始值的设定来避免获得局部最大化解，这在很大程度上降低了 f mm 分析的灵活性。因此，f mm 分析过程的简化还需加以改进。第三，模型评价方面。尽管 ny l u n d等( 2 0 0 7 ) 研究中推荐使用 b l r t检验，但在实际分析过程中， bl r t检验通常情况下并不敏感，容易出现显著的结果；而且当 b i c指数随着类别数的增加逐渐减少但无明显拐点时，模型将变得难以取舍。因此，有关拟合指数方面还需要更多的研究。第四，f mm

51、作为一种新的统计分析技术，还有一些细节问题值得继续探讨。例如，传统的 c f a 能够提供测验信度和效度的相关信息，而 f mm 作为考虑了群体异质性的 c f a模型，能否用来更好地评价测验信度和效度?又如，虽然 f mm 与 l c a 均可实现对被试的分类，但两者分类精确性谁高谁低尚无定论。还有，对于一些复杂的模型，如多水平 f mm模型，有待研究。参考文献邱皓政 ( 2 0 0 8 ) 潜在类鄹模型的原理与技术北京：教育科学出版社王孟哉 ( 2 0 1 4 ) 潜变量建模与mp l u s应用：基础篇童茯l 重庆大学出版社温忠麟刘红云，侯杰泰( 2

52、0 1 2 ) 花应 l应分北京：教育科学出版社 be r n s t e i n ，a ，s t i c kl e ，tr ，zv o l e n s k y ,m j ，t a y l o r ,s ， ab r a mo wi t z ，j ，& s t e wa r t ，s ( 2 0 l o ) di me n s i o n a l ， c a t e g o r i c a l ，o r d i me n s i o n a l - c a t e go r i e s ：t e s t i n g t h e l a t e nt s t r u c t u r e

53、of a nx i e t y s e n s i t i vi t y a m o ng a d u l t s u s i n g f a c t o r - mi x t u r e mo d e l i n g be h a v i o r t h e r a p y ,4 1 ， 5 1 5 -5 2 9 cl a r k， s l ， m ut h 6 n， b， ka p r i o ， j ， d on o f r i o ， b m ， vi k e n ， r ， r o s e ， r j ， s ma l l e y , s l ( 2 0 0 9 ) mo d e l

54、s a n d s t r a t e g i e s ， f a c t o r mix t u r e a n a l y s i s t w o e x a m p l e s c o n c e r n i n g t h e s t r u c t u r e u n d e r lyi n g p s yc h o l o gi c al di s o r d e r s re t r i e v e d m a r c h 1 5 ，2 01 4 ，f r o m h t t r l ： www s t a t mo d e 1 c o r n d o wn l o a d fm

55、 a 2 0 pa p e r _ v1 4 2pd f f e r r a n d o p j ( 2 0 0 5 ) f a c t o r a n a l y t i c p r o c e d u r e s f o r a s s e s s i ng s o c i a l d e s i r a b i l i t y i n b i n a r y i t e ms m u l t i v a r i a t e be h a v i o r al re s e a r c h ，4 0 ， 3 3 1 -3 4 9 j e d i d i ，k ，j a g p a l ，h

56、s ， de s a r b o ，ws ( 1 9 9 7 ) fi n i t e mi x t u r e s t r u c t u r a l e q ua t i o n mod e l s fo r r e s p o ns e b a s e d s e g me n t a t i o n a n d u n o b s e r v e d h e t e r o g e n e i t y ma r k e t i n g s c i e n c e ,1 6 ，3 9 -5 9 ki m，s h ，b e r e t v a s ，s n ，& s h e r r y ，

57、ar( 2 0 1 0 ) a v a l i d a t i o n o f t h e f a c t o r s t ruc t u r e o f oq- 4 5 s c o r e s u s i n g f a c t o r mi x t u r e mo d e l i n g m e a s u r e me n t a n d ev al u a t i on i n co u n s e l i n g a n d de v e l o pme n t , 4 2 ， 27 5 2 95 ku o ，p h ， ag g e n， s h ，p r e s c o t t ，ca ， ke n d l e r ,k s ， & ne a l e ，mc ( 2 0 0 8 ) us i n g a f a c t o r mi x t u r e mo d e l i n g a p p r o a c h i n a l c o h o l d e pe n d e n c e i n a g e n e r a l p o p u l a t i o n s a mpl e dr u g a

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

因子混合模型：潜在类别分析与因子分析的整合

文档简介

温馨提示

最新文档

评论

因子混合模型：潜在类别分析与因子分析的整合

文档简介

温馨提示

最新文档

评论

相关文档