(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf_第1页
(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf_第2页
(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf_第3页
(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf_第4页
(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(基础心理学专业论文)fifa方法及其与clfa方法在epq因素分析中的比较研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

f i f a 方法及其与c l f a 方法在e p q 因素分 析中的比 较研究 摘要 内 容摘要 ; 全息项目 因素分析方法是项目 反应理论在因素分析中的一个应用。 本文系统地介绍了二级记分全息项目 因素分析的 数理基础及其在因素分析上相 对于传统因素分析的优越性。本文通过模拟研究证实, 全息项目因素分析克服 了 传统线性因素分析高估维度、低估负荷的缺陷,并能在因素分析中考虑猜测 猜 测参 数。 针 对 全息 项目 因 素 分析中 x 2准 则的 缺点 , 本文 提出了“ 类 特 征 根” 准则,该准则不仅在理论上是可行的, 通过模拟研究,我们证实“ 类特征 根” 准则在实践上也简便可行。作为全息项目 因素分析的一个应用,本文首先 对2 3 1 1 名大学生艾森克人格问 卷的作答数据做验证性因素分析,发现艾森克人 格问卷的理论假设未能得到证明。在此基础上,本文比较了全息项目因素分析 方法和传统线性因素分析方法对艾森克人格问卷 ( 成人) 进行因素分析的结 果,发现全息项目 因素分析方法较好地克服了 传统线性因素分析高估维度数, 低估因素负荷等缺陷。使用全息项目因素分析方法对e p q 进行因素分析,得出 六个公共因素,且各因素都得到合理的解释。 关键词:传统线性因亲分析全息项目因素分析“ 类特征根”准则艾森克 人格问卷 f i f a 方法及其与c l f a 方法在e p 9 因素分析中的比 较研究 ab s t r a c t c o n t e n t : t h e f u l l i t e m f a c t o r a n a l y s i s ( f i f a ) m e t h o d i s a n a p p li c a t io n t h a t t h e i t e m r e s p o n d s t h e t h e o r i e s i n f a c t o r a n a l y z e . t h i s t e x t in t r o d u c e d s y s t e m a t i c a l l y t h e a n a l y t i c a l m a t h e m a t i c s f o u n d a t i o n o f t h e f u l l i t e m f a c t o r a n a l y s i s m e t h o d f o r b in a ry i t e m a n d i t s s u p e r i o r t o t h e c la s s i c a l l i n e a r f a c t o r a n a l y s i s ( c l f a ) . t h r o u g h s i m u l a t i o n s t u d y , w e f i n d f i f a c a n o v e r c o m e c l f a s d i s a d v a n t a g e t h a t i s t o o v e r e s t i m a t e t h e d i m e n s i o n a n d t o u n d e r r a t e l o a d i n g s . b e s i d e s t h a t , t h e f u ll i t e m f a c t o r a n a l y s i s c a n h a n d l e w it h g u e s s p a r a m e t e r s . a i m i n g a t t h e w e a l m e s s o f t h e c h i - s q u a r e s t a n d a r d in t h e f u l l i t e m f a c t o r a n a l y z e s , t h i s t e x t p u t f o r w a r d a s t a n d a r d o f q u a s i - e i g e n v a l u e . t h a t s t a n d a r d n o t o n l y i s v i a b l e t h e o r e t i c a l l y , a n d t h r o u g h s i m u l a t i o n s t u d y , w e c o n f ir m t h e s t a n d a r d i s p r a c t i c a b l e . a s a n a p p l i c a t io n o f f i f a , s t r u c t u r a l e q u a t i o n m o d e l i n g w a s f i r s t l y a p p li e d i n t h e d a t a b a s e d o n 2 3 1 1 c h i n e s e c o l l e g e s t u d e n t s r e s p o n s e t o e y s e n c k p e r s o n a l i t y q u e s t io n n a ir e ( e p % a n d n o e v i d e n c e w a s f o u n d t o s u p p o r t t h e h y p o t h e s i s o f e p q . o n t h i s f o u n d a t i o n , w e u s e d f i f a a n d c l f a t o e x p l o r e t h e s t r u c t u r e o f e p q , a n d fo u n d t h a t t h e f i f a m e t h o d o v e r c o m e s t h e f a u l t s o f c l a s s i c a l l i n e a r f a c t o r a n a l y s i s , s u c h a s o v e r e s t im a t i n g d i m e n s i o n n u m b e r , l o w e s t i m a t i n g f a c t o r ia l lo a d i n g a n d s o 。 二t h ro u g h t h e f i f a m e t h o d , w e f o u n d t h e r e w e r e s i x f a c t o r s i n e p q a n d t h e s e f a c t o r s w e r e e x p la i n e d we l l . k e y w o r d s : c l a s s i c a l l i n e a r f a c t o r a n a l y s i s , f u l l i t e m f a c t o r a n a l y s i s , s t a n d a r d o f q u a s i - e i g e n v a l u e , e y s e a c k p e r s o n a l i t y q u e s t io n n a i r e f i f a 方法及其与c l f a 方法在e pq因素分析中的比 较研究 1 问 题 的 提 出 t i传 统 线 性 因 素 分 析 方 法 ( c l f a )的 原 理 用来调查心理测验的维度的各种方法中, 最敏感、 信息量最大的方法是项 目水平上的因素分析方法。它能同时分析相对大的数量的项目,当找到多个因 素时,它能将各项目 指配给各个因素. 目 前, 项目 水平上的因素分析方法即传统线性因素分析方 法 ( c l a s s i c a l l i n e a r f a c t o r a n a l y s i s , c l f a ) 的 基 本思 想是 根据 变量间 相 关大 小 把变 量分 组,使得同组内的 变量之间 相关较高,但不同组的变量相关较低。每组变量代 表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用 最少个数的 潜在的所谓公共因子的线性函数与特殊因子之和来描述原来观测的 每一个分量。 因素分析的具体数学方法很多,比 如有形心法,主轴法等,分析过程相 同,计算结果大体一致。各种方法的因素,都要从实测数据出发,都要从测验 所包含的各试题上所有被试分数矩阵出发。首先求出 各试题间相关系数构成的 相关矩阵。 其次再求初始因素矩阵。最后通过旋转各因素轴使得各变量在旋转 后轴上的投影尽可能地向 最大或最小两极端分 化。 第三步中求出转轴后的因素 矩阵。 最后为对主轴进行定义并加以解释。 各个主轴定义得是否准确, 解释是 否恰当,不但取决于因素分析是否做得成功,而且在很大程度上取决于测验编 制者对测验项目 性质的认识和对测验品质的认识以及他的概括能力. c l f a 对心理学的贡献是巨大的,尤其为心理学家提供了一种技术, 把项目 分成相对同 质的组和独立的类, 这种分组促进了 根据经验效标的效度研究,使 得对特定效标的 预测分数进行更有效的 组合并 有助于 构念的界定n 。 大大 地简 化了 心理学家们的工作, 将多个变量简化为富有代表性的少数几个主因素。在 一般情况下, 用少数几个主因素取代众多变量,仍能保持其基本信息量, 这不 但使测盘的结果更加清晰,而且从科学研究的方法上也达到了以简去繁,去芜 存著的目的,而且使得不同的研究结果可以相互比较, 1 . 2传 统 线 性 因 素 分 析 方 法 ( c l f a )的 缺 陷 传统线性因素分析方法,实际上其中 暗含着多个假设,使用上受到多重限 制。其中的一个就是各因素间是线性相关的, 或者说它假定量表中的 项目 与潜 在特质间存在线性函数关系, ( 正是在这个意义上,c l f a 又经常被称为线性项 目 反应模型。)对于大多数人格和态度量表而言,c l f a 并不恰当,因为人格中 人 格 特质 与 项目 间 存在 着非 线性 相关, 。 比 如, 有人以 下 题 测量 人 们的自 尊水平: ( 夕 岔 经右动友感人力穷呼ay夕 f i f a 方法及其与c l f a 方法在e pq因素分析中的比 较研究 1 问 题 的 提 出 t i传 统 线 性 因 素 分 析 方 法 ( c l f a )的 原 理 用来调查心理测验的维度的各种方法中, 最敏感、 信息量最大的方法是项 目水平上的因素分析方法。它能同时分析相对大的数量的项目,当找到多个因 素时,它能将各项目 指配给各个因素. 目 前, 项目 水平上的因素分析方法即传统线性因素分析方 法 ( c l a s s i c a l l i n e a r f a c t o r a n a l y s i s , c l f a ) 的 基 本思 想是 根据 变量间 相 关大 小 把变 量分 组,使得同组内的 变量之间 相关较高,但不同组的变量相关较低。每组变量代 表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用 最少个数的 潜在的所谓公共因子的线性函数与特殊因子之和来描述原来观测的 每一个分量。 因素分析的具体数学方法很多,比 如有形心法,主轴法等,分析过程相 同,计算结果大体一致。各种方法的因素,都要从实测数据出发,都要从测验 所包含的各试题上所有被试分数矩阵出发。首先求出 各试题间相关系数构成的 相关矩阵。 其次再求初始因素矩阵。最后通过旋转各因素轴使得各变量在旋转 后轴上的投影尽可能地向 最大或最小两极端分 化。 第三步中求出转轴后的因素 矩阵。 最后为对主轴进行定义并加以解释。 各个主轴定义得是否准确, 解释是 否恰当,不但取决于因素分析是否做得成功,而且在很大程度上取决于测验编 制者对测验项目 性质的认识和对测验品质的认识以及他的概括能力. c l f a 对心理学的贡献是巨大的,尤其为心理学家提供了一种技术, 把项目 分成相对同 质的组和独立的类, 这种分组促进了 根据经验效标的效度研究,使 得对特定效标的 预测分数进行更有效的 组合并 有助于 构念的界定n 。 大大 地简 化了 心理学家们的工作, 将多个变量简化为富有代表性的少数几个主因素。在 一般情况下, 用少数几个主因素取代众多变量,仍能保持其基本信息量, 这不 但使测盘的结果更加清晰,而且从科学研究的方法上也达到了以简去繁,去芜 存著的目的,而且使得不同的研究结果可以相互比较, 1 . 2传 统 线 性 因 素 分 析 方 法 ( c l f a )的 缺 陷 传统线性因素分析方法,实际上其中 暗含着多个假设,使用上受到多重限 制。其中的一个就是各因素间是线性相关的, 或者说它假定量表中的 项目 与潜 在特质间存在线性函数关系, ( 正是在这个意义上,c l f a 又经常被称为线性项 目 反应模型。)对于大多数人格和态度量表而言,c l f a 并不恰当,因为人格中 人 格 特质 与 项目 间 存在 着非 线性 相关, 。 比 如, 有人以 下 题 测量 人 们的自 尊水平: ( 夕 岔 经右动友感人力穷呼ay夕 f i f a 方法及其与c l f a 方法在e p q 因素分析中的比 较研究 a是b 不是 这个项目与自 尊水平间就存在非线性关系:自 尊水平低的被试可能会因为自卑 这一负面情感而不会主动与熟人打招呼,自 尊水平高的人可能会因为自负而不 会主动与熟人打招呼,中等水平的人则更可能主动与熟人打招呼。因此,在这 种环境下使用线性因素分析模型并不恰当。如对二级记分项目 而言,传统线性 因素分析一般从p h i 相关矩阵出发进行因素分析,在存在非线性相关的情况 下 , t. 4 3 1- y) 这 种 仅 仅 是 根 据 选“ 是”与选 “ 不是”的人数来 计算相关的方法显然是有欠缺的。 许多文献认为由于各个题目的难度不同,使用线性因素分析模型会产生虚 假因素,m c d o n a l d和a h l a w a t ( 1 9 7 4 ) 则成功地证明所谓的“ 难度”因素并 不仅仅是项目 难度本身造成的,而是因为传统线性因素分析忽略了项目一 特质 回归呈非线性,换句话说,只要各项目 难度或区分度不同,使用传统线性因素 分析方法都可能会出现虚假因素。传统的从p h i 相关系数矩阵出发多元因素分 析方法虽然计算较为直接,但它可能会引进虚假因素。应用二级记分的项目乃 至三点或四点l i k e r t 人格态度问卷进行人格研究时,c l f a 常会产生虚假因素, 或者即便能抽取出恰当数目的因素,对一些乃至所有的项目的因素负荷的估计 也会产生偏差1 c l f a 的另一个前提假设是假定各记分点之间是等距的,被试的分数是连续 变量,而实际上是离散的. , , 各记分点间之间 仅是一个不等距的等级序列。比 如,下面一个探查学业成就方面的自我效能感题目: c 夕奈寿笋习进质谴一岸声移笋。 1丰艘不鼠彦2 *佩蔚 3淤4属彦 5丰藏鼠渝 以上五个选项前的数字即为各选项的记分,但我们很难说这里各记分点之间是 等距的。也就是说这五个选项间只有程度上的递进或递减,它们仅仅是一个不 等距的等级序列。 第三,线性项目反应模型很难提供在整个特质全域上同样敏感、可靠的量 表,使用线性模型编写的量表对处在编写量表时所使用的样本的中等水平被试 能够进行较为可靠、精确的特质水平的估计。而对于接近特质分布的两端的被 试就会有较大的误差14 1 。 我们仍以二级记分为例,在下图图1 中,x 轴代表个体在人格特质上的差 异, y 轴代表个体选择两个选项中所期望的那个选项的概率。被预测的项目 作 答反应值能被解释为随机选出的具有给定的 潜在特质水平的被试在该项目 上的 答对概率。因此,图中三种项目 反应模型也即是三种因素分析模型。图中函数 a 代表古特曼量表曲线,该曲线是一种阶梯函数,答对概率或者为0 或者为 f i f a 方法及其与c l f a 方法在e p q 因素分析中的比 较研究 1 , 在临界点处发生显著变化。 心理项目 倾向于 在整个特质连续体上变化,使 用确定性模型并不适合。 函数c 是一种线性项目 反应模型,它假定量表中的项目与潜在特质间存在 线性函数关系,这种线性项目反应模型实际上是一种线性因素分析模型。函数 c 这个线性回归线表明线性因素分析模型用于二级记分人格项目 是不恰当的。 从图1 我们可以看到,依据线性因素分析模型,在特质分布的两端,计算出的 选择特定选项的概率会大于1 . 0 0 或小于0 . 0 0 . 决一 l i n e a r 瞬 . d 内n e lpis 肠mr e s 详 ”了 抽 阅牛 a 夺 一 一 s l e p f u nc ti o n 砚 g n 加 . . s c a l e ) |1.奋 b 千jl|1|月|.!.ij ,on000 ,趁。甘世1长1.节重万.召左 之一 , i i 了 抽如: t r a i t l e v e l 此外,数据信息是否被充分挖掘与利用是评价统计方法好坏的一个客观指 标,c l f a 是从成对观察变量间的相关矩阵或协方差矩阵出发进行的因素分析方 法,仅利用了成对观察变量间的相关或协方差信息,而非作答矩阵的全部信 息。信息的丢失难免会使分析的结果走样。 总之,应用二级记分的项目 乃至三点或四点l i k e r t 人格态度问卷进行人格 研究时, c l f a 常会产生虚假因素,或者即便能抽取出恰当数目的因素,对一 些乃至所有的项目的因素负荷的估计也会产生偏差。b e r n s t e i n 等人的研究表 明 在三点人格态度问 卷应用 线性因 素分析时 会导致扭曲 的结果“ , ; w a l l e r 等人 的研究也发现,应用二级记分的项目 进行人格研究时,使用标准的c l f a 编制负 性 情感问 卷会导 致潜在的 误导们 。 因 此, 在 这种环境下使用线性因 素分析 模型 或古特曼模型并不恰当。 2 全 息 项 目 因 素 分 析 ( f i f a )介 绍 2 . 1全 息 项 目 因 素 分 析 ( f i f a )的 数 理 基 础 f i f a 是一种直接以项目反应理论 (i t e m r e s p o n s e t h e o r y ,以下简记为 f i f a 方法及其与c l f a 方法在e p q 因素分析中的比 较研究 1 , 在临界点处发生显著变化。 心理项目 倾向于 在整个特质连续体上变化,使 用确定性模型并不适合。 函数c 是一种线性项目 反应模型,它假定量表中的项目与潜在特质间存在 线性函数关系,这种线性项目反应模型实际上是一种线性因素分析模型。函数 c 这个线性回归线表明线性因素分析模型用于二级记分人格项目 是不恰当的。 从图1 我们可以看到,依据线性因素分析模型,在特质分布的两端,计算出的 选择特定选项的概率会大于1 . 0 0 或小于0 . 0 0 . 决一 l i n e a r 瞬 . d 内n e lpis 肠mr e s 详 ”了 抽 阅牛 a 夺 一 一 s l e p f u nc ti o n 砚 g n 加 . . s c a l e ) |1.奋 b 千jl|1|月|.!.ij ,on000 ,趁。甘世1长1.节重万.召左 之一 , i i 了 抽如: t r a i t l e v e l 此外,数据信息是否被充分挖掘与利用是评价统计方法好坏的一个客观指 标,c l f a 是从成对观察变量间的相关矩阵或协方差矩阵出发进行的因素分析方 法,仅利用了成对观察变量间的相关或协方差信息,而非作答矩阵的全部信 息。信息的丢失难免会使分析的结果走样。 总之,应用二级记分的项目 乃至三点或四点l i k e r t 人格态度问卷进行人格 研究时, c l f a 常会产生虚假因素,或者即便能抽取出恰当数目的因素,对一 些乃至所有的项目的因素负荷的估计也会产生偏差。b e r n s t e i n 等人的研究表 明 在三点人格态度问 卷应用 线性因 素分析时 会导致扭曲 的结果“ , ; w a l l e r 等人 的研究也发现,应用二级记分的项目 进行人格研究时,使用标准的c l f a 编制负 性 情感问 卷会导 致潜在的 误导们 。 因 此, 在 这种环境下使用线性因 素分析 模型 或古特曼模型并不恰当。 2 全 息 项 目 因 素 分 析 ( f i f a )介 绍 2 . 1全 息 项 目 因 素 分 析 ( f i f a )的 数 理 基 础 f i f a 是一种直接以项目反应理论 (i t e m r e s p o n s e t h e o r y ,以下简记为 f i f a 方法及其与c l f a 方法在e p q 因素分析中的比 较研究 1 , 在临界点处发生显著变化。 心理项目 倾向于 在整个特质连续体上变化,使 用确定性模型并不适合。 函数c 是一种线性项目 反应模型,它假定量表中的项目与潜在特质间存在 线性函数关系,这种线性项目反应模型实际上是一种线性因素分析模型。函数 c 这个线性回归线表明线性因素分析模型用于二级记分人格项目 是不恰当的。 从图1 我们可以看到,依据线性因素分析模型,在特质分布的两端,计算出的 选择特定选项的概率会大于1 . 0 0 或小于0 . 0 0 . 决一 l i n e a r 瞬 . d 内n e lpis 肠mr e s 详 ”了 抽 阅牛 a 夺 一 一 s l e p f u nc ti o n 砚 g n 加 . . s c a l e ) |1.奋 b 千jl|1|月|.!.ij ,on000 ,趁。甘世1长1.节重万.召左 之一 , i i 了 抽如: t r a i t l e v e l 此外,数据信息是否被充分挖掘与利用是评价统计方法好坏的一个客观指 标,c l f a 是从成对观察变量间的相关矩阵或协方差矩阵出发进行的因素分析方 法,仅利用了成对观察变量间的相关或协方差信息,而非作答矩阵的全部信 息。信息的丢失难免会使分析的结果走样。 总之,应用二级记分的项目 乃至三点或四点l i k e r t 人格态度问卷进行人格 研究时, c l f a 常会产生虚假因素,或者即便能抽取出恰当数目的因素,对一 些乃至所有的项目的因素负荷的估计也会产生偏差。b e r n s t e i n 等人的研究表 明 在三点人格态度问 卷应用 线性因 素分析时 会导致扭曲 的结果“ , ; w a l l e r 等人 的研究也发现,应用二级记分的项目 进行人格研究时,使用标准的c l f a 编制负 性 情感问 卷会导 致潜在的 误导们 。 因 此, 在 这种环境下使用线性因 素分析 模型 或古特曼模型并不恰当。 2 全 息 项 目 因 素 分 析 ( f i f a )介 绍 2 . 1全 息 项 目 因 素 分 析 ( f i f a )的 数 理 基 础 f i f a 是一种直接以项目反应理论 (i t e m r e s p o n s e t h e o r y ,以下简记为 f i f a 方法及其与c l f a 方法在 四因素分析中的比 较研究 i r t ) 为基础的探索性因素分析方法,i r t 模型能根据被试的作答矩阵同时估 计出难度、区分度等项目 参数以及被试的能力 ( 或潜在特质,下同)参数,并 具有被试的能力估计不依赖于测验项目 的特殊选择,项目 参数的估计独立于被 试样本, 项目 难度参数与能力参数定义在同 一量 表上等优点川 。“ 全息” 即 取 义于这样一个事实:与c l f a 仅仅基于协方差矩阵或相关矩阵中的信息相对照, 基于工 r t 的 f i f a 直接使用“ 被试一项目 矩阵”即所有被试对全部项目 的作答反 应矩阵, 最大限度地利用了反应数据载荷的 可用信息。 全息项目 因素模型本身有一个有简单到复杂的发展过程,对于我国 绝大多 数读者来说它还是一个较为陌生的模型, 本文主要研究二级记分全息项目 因素 模型的推导、 统计方法及应用。 2 . 1 . 1棋型基本假设 b o c k和a it k in ( 1 9 8 1 )将t h u r s t o n e 的多元公共因素模型用来描述被 试 对项目 刺激的反 应过程阁 , 该模型为: , 。 = a;,01, + a ,20 ., + + a ,a i + 。 一 。 t 9 : + : 。(1 ) 式( 1 ) 中 的 c i, 服 从 n ( 0 , o i) 的 不 可 观 测 的 随 机 变 量 , 。 是 一 个 m 维 服 从 多 元 正 态 分 布 的 潜 在 特 质 , 权 重 a 为 因 素 负 荷 , 因 变 量y ii并 非 表 示 连 续 型 的 观测 变 量, 而 是表示 被 试i 对 项目j 的 一个不 可观 测的 反 应过 程变 量, 项 目 j 的 闷 限( t h r e s h o ld ) 记 作 y i, 当 乓二 , , 时 , 被 试i 对 项目 j 产 生 正 确 反 应 , 记 作 今= 1 ; 当 为 均时 , 则 反 应 错 误 , 记 作 凡一 q 假设8 , y , 服从多元正 态分 布,即 b 口 n ( 0 , 1 ) ( 2 ) , 口 n ( o , i ) ( 3 ) ; 口 n ( o , d) ( 4 ) 则 能 力 为 0 , = ( e 0z i. . . . o iw .)的 被 试i 答 对 项目i 的 条 件 概 率 是 : dy y ; 一a a 气 p ( z 。 二 1 b i ) 口了 。 , ( 0 i ) ( s ) f i f a 方法及其与c l f a 方法在 四因素分析中的比 较研究 i r t ) 为基础的探索性因素分析方法,i r t 模型能根据被试的作答矩阵同时估 计出难度、区分度等项目 参数以及被试的能力 ( 或潜在特质,下同)参数,并 具有被试的能力估计不依赖于测验项目 的特殊选择,项目 参数的估计独立于被 试样本, 项目 难度参数与能力参数定义在同 一量 表上等优点川 。“ 全息” 即 取 义于这样一个事实:与c l f a 仅仅基于协方差矩阵或相关矩阵中的信息相对照, 基于工 r t 的 f i f a 直接使用“ 被试一项目 矩阵”即所有被试对全部项目 的作答反 应矩阵, 最大限度地利用了反应数据载荷的 可用信息。 全息项目 因素模型本身有一个有简单到复杂的发展过程,对于我国 绝大多 数读者来说它还是一个较为陌生的模型, 本文主要研究二级记分全息项目 因素 模型的推导、 统计方法及应用。 2 . 1 . 1棋型基本假设 b o c k和a it k in ( 1 9 8 1 )将t h u r s t o n e 的多元公共因素模型用来描述被 试 对项目 刺激的反 应过程阁 , 该模型为: , 。 = a;,01, + a ,20 ., + + a ,a i + 。 一 。 t 9 : + : 。(1 ) 式( 1 ) 中 的 c i, 服 从 n ( 0 , o i) 的 不 可 观 测 的 随 机 变 量 , 。 是 一 个 m 维 服 从 多 元 正 态 分 布 的 潜 在 特 质 , 权 重 a 为 因 素 负 荷 , 因 变 量y ii并 非 表 示 连 续 型 的 观测 变 量, 而 是表示 被 试i 对 项目j 的 一个不 可观 测的 反 应过 程变 量, 项 目 j 的 闷 限( t h r e s h o ld ) 记 作 y i, 当 乓二 , , 时 , 被 试i 对 项目 j 产 生 正 确 反 应 , 记 作 今= 1 ; 当 为 均时 , 则 反 应 错 误 , 记 作 凡一 q 假设8 , y , 服从多元正 态分 布,即 b 口 n ( 0 , 1 ) ( 2 ) , 口 n ( o , i ) ( 3 ) ; 口 n ( o , d) ( 4 ) 则 能 力 为 0 , = ( e 0z i. . . . o iw .)的 被 试i 答 对 项目i 的 条 件 概 率 是 : dy y ; 一a a 气 p ( z 。 二 1 b i ) 口了 。 , ( 0 i ) ( s ) f i r方法及其与c l f a 方法在e p q 因素分析中的比 较研究 于 是 反 应 错 误 的 概 率 p ( x i; 一 1 1典 ) 一 1 一 中 , ( 乓 ) 。 也 既 是 说 , 条 件 作 答 概 率由正态肩型模型给出,可注意到方程5 是一个互补模型:在这一维度的高能 力可以弥补在其他维度上的能力的不足,当然,这种方法也可以应用于包含交 互作用的模型如: , 。 一 a ;19 1, + a ;2 e z ; + + a p z e li e 2t + + a ;, p e . ;e p ; + : 。 ( 6 ) 2 . 1 . 2 项目闭限与因寨负荷的 估计 与 对观察变量采用极大似然估计的因素分析一样,b o c k - a it k i n 方法在估计 项目 反应模型的参数时也假定数据从一个多元分布的能力总体中抽样而来,且 b 口 n ( o , i ) , 但 容 许 因 素 相 关 和 呈 非 正 态 分 布 。 按 因 素 分 析 惯 例 , 假 设 y j 数学期望为0,方差为1 ;则有 一 一 乏 a ( 7 ) 基于 这 些假 设, 二级 作 答 模式x 1的 边际 概 率由 多重 积分 给出 : a 一 p 一 x)= f 二 i w 立 , ,“ ,“ 一 , j (19 ),-,j“ “ ,“ “ 一 工 ( b ) g ( 9 ) d 9 式 中 f - 亦 j im !;_1 一 , j (e )1-, 部 分 为 似 然 函 数 , g (e ) ( 8 ) 为先验概率密 度。 这个不定积分的数值逼近可用m 重g a u s s - h e r m i t e 积分法求取, p e一 -. le(x )a (x $ ) ( x , ) -a (x , ) (9 ) 式中x 是m 维空间的积分节点, 其对应的权重为各维度积分权重的积,式s 仅 能应用于各因素不相关的 情况。 这就是数值积分中所谓 “ 乘积方程”( p r o d u c t f o r m u l a ) 的一例,它的不利之处是项数的总和 ( t h e n u m b e r o f t e r m i n t h e s u m ) 是维度数的指数,幸运的是每个维度的节点数随着维度数的增加而减 少,同时又不会影响其精度9 。 例如,五因 素的因素分析中每个因素有三个节 点运算结果的精度就较好了, 3 5 = 2 4 3个积分节点,普通计算机即可满足其计 算要求。 假定 样 本容 量为n , 项目 总 数 为n , 作 答 模 式r , 的 频 数 , 显 著的 模 式 ( d i s t i n c t p a t t e r n s ) 数 为 s s m in ( 2 , 二 , 这 种 样 本 的 概 率 为 f i r方法及其与c l f a 方法在e p q 因素分析中的比 较研究 于 是 反 应 错 误 的 概 率 p ( x i; 一 1 1典 ) 一 1 一 中 , ( 乓 ) 。 也 既 是 说 , 条 件 作 答 概 率由正态肩型模型给出,可注意到方程5 是一个互补模型:在这一维度的高能 力可以弥补在其他维度上的能力的不足,当然,这种方法也可以应用于包含交 互作用的模型如: , 。 一 a ;19 1, + a ;2 e z ; + + a p z e li e 2t + + a ;, p e . ;e p ; + : 。 ( 6 ) 2 . 1 . 2 项目闭限与因寨负荷的 估计 与 对观察变量采用极大似然估计的因素分析一样,b o c k - a it k i n 方法在估计 项目 反应模型的参数时也假定数据从一个多元分布的能力总体中抽样而来,且 b 口 n ( o , i ) , 但 容 许 因 素 相 关 和 呈 非 正 态 分 布 。 按 因 素 分 析 惯 例 , 假 设 y j 数学期望为0,方差为1 ;则有 一 一 乏 a ( 7 ) 基于 这 些假 设, 二级 作 答 模式x 1的 边际 概 率由 多重 积分 给出 : a 一 p 一 x)= f 二 i w 立 , ,“ ,“ 一 , j (19 ),-,j“ “ ,“ “ 一 工 ( b ) g ( 9 ) d 9 式 中 f - 亦 j im !;_1 一 , j (e )1-, 部 分 为 似 然 函 数 , g (e ) ( 8 ) 为先验概率密 度。 这个不定积分的数值逼近可用m 重g a u s s - h e r m i t e 积分法求取, p e一 -. le(x )a (x $ ) ( x , ) -a (x , ) (9 ) 式中x 是m 维空间的积分节点, 其对应的权重为各维度积分权重的积,式s 仅 能应用于各因素不相关的 情况。 这就是数值积分中所谓 “ 乘积方程”( p r o d u c t f o r m u l a ) 的一例,它的不利之处是项数的总和 ( t h e n u m b e r o f t e r m i n t h e s u m ) 是维度数的指数,幸运的是每个维度的节点数随着维度数的增加而减 少,同时又不会影响其精度9 。 例如,五因 素的因素分析中每个因素有三个节 点运算结果的精度就较好了, 3 5 = 2 4 3个积分节点,普通计算机即可满足其计 算要求。 假定 样 本容 量为n , 项目 总 数 为n , 作 答 模 式r , 的 频 数 , 显 著的 模 式 ( d i s t i n c t p a t t e r n s ) 数 为 s s m in ( 2 , 二 , 这 种 样 本 的 概 率 为 f i r方法及其与c l f a 方法在e p q 因素分析中的比 较研究 _ , _ _ 、n!二 二二 lm = r tx = 丽 蔽 几 矛 , -v22, y =r ?,r2 i, ; r ! ( 1 0 阂限和因素负荷的极大似然估计就是能使方程1 0 最大的值。 区 分度是测量能否测到个别差异的一个指标, 如果测验中的某一项目( 或 试题)的公共因素方差愈大, 说明这个项目 测量被试对象在测验所能侧量到的 内容 ( 即公共因素代表的内容)方面上的个别差异的能力就愈大,因此, 项目 的公 共因 素方差与区分度之间 有着必然的联 系 ; 3 , 而项目 的 公共因 素方差为该 公共因素的负荷的平方和。为简化似然方程的 表达,可以用反应函数的截距和 斜率来表达这个模型,项目 的闽限越大,则难度越大,截距越小;项目的区分 度越大,则斜率越大,故有 一 竺 里 业一 。 ,+ 咬 q ikg ti 仃 户 丫 ( 1 1 ) 由 c ;和。 jk的 边 际 极 大 似 然 估 计( w e ) 1 - ; ( e ) 1(e嘿g (b)de i - n p , ( g ) j b 4, , 画i - 4) ; (e )x碧g (6)de (15 ) 、j、.少 u7 八铲石v 卜 今 r,- ,l , (b j翻 p n 一 今 r.l t (8 ) 侧p 这个方程中的多元积分在数值上可以由下列重复的g a u s s - h e r m i t e积分 r 1 4 ig 2 , , 一 n 9 ig a 二 , , 中 , ( x) , , ( x ) ! 一 , , ( x ) 。v乙如 。v乙勺 中舰。v二肠 式求 a (d , (x )a v : , ( x 4l ), (x ,2 ) , (x ,二 ) k (1 8 ) 期 望 频 数 凡 。、是 一 个 穿 维 数 组 中 的 一 个 信 息 单 元 , 它 给 出 各 点 x 上 正确作答的数量,而这个数组中的每一个元素都与一个给定的项目 的积分节点 的m - t u p i e 相对应。期望频数是给定的样本中能力等于向 量x 的 被预期能答对 该题的被试的数量。 f 工 f a 方法及其与c l f a 方法在e p q 因紊分析中的比较研究 数 量 iy s 、是 这 一 数 组 在 各 题 上 相 加 求 得 的 极 限 , 它 是 能 力 为x 的 被 试 的期望的数量并被根据样本的大小正态化。 这些方程与d e m p s t e r , l a i r d 和r u b i n 1 9 7 7 年给出的m m l 估计中的e ” 算法中 的步骤相对应, 其中方程1 6 和1 7 构成e 步, 在e 步中 在不完全数据的基础上计 算出 完全数据的统计童的期望,方程1 8 是m 步, 它通过使用期望替代完全数据 的统计量来算出传统的极大似然估计, 因为期望值取决于待估参数,计算需迭代运算。给定各参数的初值,通过 将 各点x 上 作 答 模 式x s的 后 验 概率 作 为 权 数, 对 各 项目 分 数 加 权, 并 分 配 给 相 应 的 项 目 , 从 而 建 立 起 期 望 频 数 乙 击 。 , 的 q 0 表 ; 类 似 地 n $ $ 、 由 各 点上的权重的总和求得。通过这些统计,改进了在m 步中的项目参数的的估 计,在m 步中将适当的极大似然估计方法运用于与被估项目 相对应的表。任何 用于多概率单位分析 ( m u l t i p l e - p r o b i t a n a l y s i s )的标准方法都将满足m 步。 这个方法对于所有的项目 反应模型都具有普遍意义,如果应用逻辑斯蒂克 模型, 则m 步中 会出 现多l o g i t 分析。 2 . 1 . 3主成分分析在全息项目因素分析中的 运用 传统上,e m算法的收敛速度很慢,因此要用各种各样的方法如 r a m s a y 等加速方法来加快其计算速度。加快其计算速度,这里使用了设置初值等方 法。获得初值的一个好的策略是对正在研究的项目 的四分相关矩阵进行主成分 分析、 共同 度迭代,四分相关矩阵应该进行猜测系数和缺失数据矫正, 应该使 之正定。 这种策略可以省略大量的全息项目 因素分析, 主成分因素分析的因素正交时, 他们的负荷在转化为项目 截距和斜率后适 合于全息项目 因素分析方法。 基于全息项目 因素分析方法的项目 截距和斜率又 可转化为因素负荷。最终的全息因素模型可以正交方差极大旋转,也可进行斜 交旋转, 2 . 1 . 4猜浏问题的 矫正 c a r r o ll 反对将多项选择题中的猜测引起的 假象引入项目 因素分析之中,为 减 少 这种 影响, 他 提出 对 计算四 分 相关的四 格 表 ( fo u r - f o ld t a b le s ) 进行 矫 正 。 在 全 息 项 目 因 素 分 析 中 一 个 类 似 的 结 果 是 用 带 有 低 渐 进 线 g ;的 猜 测 模 型 替代正态肩形反应函数: d i ( 8 ) 二 g ; + 1 一 g 启 (d i (0 ) (1 9 ) 如果在全息项目因素分析中使用带有猜测参数的项目反应模型,用于计算 参数初值的四分相关矩阵就必须加以 矫正,因为猜测在主成分分析之前。如果 用 g i和 g j 分 别 表 示 项 r i 和.l 的 猜 测 成 功 的 概 率( th e p r o b a b ilit y o f c h a n c e s u c c e s s ) , 用 -t il 表 示 原 始 2 x 2表 中 的 观 察 概 率 , 弓 表 示 矫 正 后 的 f 工 f a 方法及其与c l f a 方法在e p q 因紊分析中的比较研究 数 量 iy s 、是 这 一 数 组 在 各 题 上 相 加 求 得 的 极 限 , 它 是 能 力 为x 的 被 试 的期望的数量并被根据样本的大小正态化。 这些方程与d e m p s t e r , l a i r d 和r u b i n 1 9 7 7 年给出的m m l 估计中的e ” 算法中 的步骤相对应, 其中方程1 6 和1 7 构成e 步, 在e 步中 在不完全数据的基础上计 算出 完全数据的统计童的期望,方程1 8 是m 步, 它通过使用期望替代完全数据 的统计量来算出传统的极大似然估计, 因为期望值取决于待估参数,计算需迭代运算。给定各参数的初值,通过 将 各点x 上 作 答 模 式x s的 后 验 概率 作 为 权 数, 对 各 项目 分 数 加 权, 并 分 配 给 相 应 的 项 目 , 从 而 建 立 起 期 望 频 数 乙 击 。 , 的 q 0 表 ; 类 似 地 n $ $ 、 由 各 点上的权重的总和求得。通过这些统计,改进了在m 步中的项目参数的的估 计,在m 步中将适当的极大似然估计方法运用于与被估项目 相对应的表。任何 用于多概率单位分析 ( m u l t i p l e - p r o b i t a n a l y s i s )的标准方法都将满足m 步。 这个方法对于所有的项目 反应模型都具有普遍意义,如

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论