




已阅读5页,还剩46页未读, 继续免费阅读
(基础心理学专业论文)个人拟合指标应用于人格测验的有效性.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
捅要 内容摘要: 个人拟合指标( p e r s o n f i ts t a t i s t i c s ,以下简称p f s ) 是指衡量某一个 体在测验中的得分模式与某一i r t 模型预测的项目得分模式是否一致,或与样本 中其他个体项目得分模式是否有显著差异的统计指标,是对心理测验中偏差行为 鉴别的一种新方法。p f s 以g u t t m a n 理想模型和项目反应理论为基础。当前的个 人拟合研究主要集中于能力测验和计算机自适应测验。p f s 对于提高测验的有效 性,保证教育测验的公平性,提高计算机白适应测验的安全性和排除人员选拔中 的无关因素等具有重要的意义。人格测验中同样存在多种类型的偏差行为,但以 往人格测验中的个人拟合研究较少,主要原因有三点:1 人格测验维度众多,且 各维度之间相互影响,很难满足i r t 的单维性假设;2 人格测验多采用1 i k e r t 量表形式,而当前使用的p f s 均适用于二级记分测验;3 人格测验中的偏差反应 与能力测验存在很大差别。本研究从上述三点出发,寻找适用于人格测验的p f s 。 研究l 考察了c 术、u 3 、1 z 和e c l 4 z 四个个人拟合指标( p f s ) 对艾森克人格问 卷信效度的影响,以及各指标与正反向题回答不一致项目数的相关。结果表明。 删除不同比例拟合程度不好的个体后,测验的信效度明显提高。四个p f s 对异常 得分模式个体的鉴别具有不同程度的有效性。其中1 z 对异常得分模式鉴别的敏 感性最高,c 术也很好,其他两个指标u 3 和e c l 4 z 略差。 研究2 采用m o n t ec a r l o 数据模拟方法,使用模拟数据考察l z 应用于l i k e r t 量表的有效性。结果表明,l z 在l i k e n 量表中同样接近正态分布,可以将1 6 5 作 为检测拟合个体和偏差个体的临界值:1 z 对各类型偏差个体均具有较好的检测 效果;l z 的得分及分布形态受偏差类型、偏差个体比例和偏差项目比例的影响。 而l z 的检测效果受偏差类型和偏差项目比例的影响。 两个研究虽然在研究内容和研究方法上各有不同,但二者共同证明了同一结 论p f s 应用于人格测验具有有效性。但本研究只是个人拟合指标应用于人格 测验的一个初步探索过程,还存在很大的局限性,其有效性也受很多因素的影响, 其中包括样本容量、项目长度、偏差项目比例、偏差项目出现的位置、项目反应 理论的参数估计方法、量表评定等级数等,这些都需要在以后的研究中迸一步探 讨。 关键词:个人拟合指标项目反应理论人格测验偏差反应m o n t ec a r l o 数据模 拟 a b s t r a c t c o n t e n t :p e r s o n f i ts t a t i s t i c s ( p f s ) r e f e rt ot h ec o n s i s t e n c yo fa ni n d i v i d u a l s r e s p o n s ep a t t e r n ,e t h e rw i t hag i v e nm e a s u r e m e n tm o d e lo rw i t ho t h e r e x a m i n e e s r e s p o n s ep a t t e r n sw i t h i nag i v e ns a m p l e t h e yw e r eas e r i e so fn e wk i n d so fm e t h o d t od i s c r i m i n a t et h ea b e r r a n tr e s p o n s e sb e h a v i o r si np s y c h o l o g i c a lt e s t sw h i c hb a s e do n g u t t m a nm o d e la n di t e mr e s p o n s et h e o r y i fw ec a nd i s t i n g u i s ht h ea b e r r a n ti t e m s c o r ep a t t e r n s ,t h et e s ts c o r ew i l lb em o r ei n t e r p r e t a b l e ,a n dt h er e l i a b i l i t ya n dv a l i d i t y w i l lb eh e i g h t e n e d n o w a d a y sm o s to ft h er e s e a r c h e si np e r s o n - f i ts t a t i s t i c sw e r e c o n c e n t r a t e do na b i l i t yt e s t sa n dc o m p u t e ra d a p t i v et e s t s ,b u tl e s s i np e r s o n a l i t y q u e s t i o n n a i r e s l o o k i n gf o ra p p r o p r i a t ep f so fp e r s o n a l i t yq u e s t i o n n a i r ea n dr a i s i n g t h e e f f e c t i v e n e s s o fp f si n p e r s o n a l i t yq u e s t i o n n a i r ew i l lm a k es e n s et o t h e d e v e l o p m e n to fp e r s o n a l i t yt e s t s t h ef i r s tr e s e a r c hh a das p e c i a ld e s i g nt og e tt h ep o s i t i v e l ya n dn e g a t i v e l yw o r d e d e p qq u e s t i o n n a i r ef o rt h es a m eg r o u po fp a r t i c i p a n t s c h o o s et h en u m b e ro fi t e m s w h i c ht h er e s p o n s ev e c t o ri np o s i t i v e l yw o r d e di t e m si s u n e q u a lt ot h a t i nt h e n e g a t i v e l yw o r d e di t e m s ( c a l l e du n e q u a li n d e xy 1a st h ec r i t e r i o no fe s t i m a t i n gt h e p e r s o n f i ts t a t i s t i c s f o u rp e r s o n f i ts t a t i s t i c ss u c ha sc + 、u 3 、l za n de c l 4 zw a s c h o s e nt oi n v e s t i g a t ei n f l u e n c e st ot h er e l i a b i l i t ya n dv a l i d i t yo ft h et e s t s ,a n da n a l y z e t h ec o r r e l a t i o nb e t w e e nt h ef o u rp e r s o n f i ts t a t i s t i c sa n du n e q u a li n d e xyt h e nt h e e f f e c t i v e n e s so fp f si np e r s o n a l i t yq u e s t i o n n a i r ew e r ei n v e s t i g a t e d a n dt h ep o w e ro f t h ef o u rp e r s o n 一矗ts t a t i s t i c sw a sc o m p a r e d a ss h o w ni nt h er e s u l t a f t e rd e l e t i n gs o m e p e r c e n t a g eo fa b e r r a n ti n d i v i d u a l s ,t h er e l i a b i l i t y , c r i t e r i o n r e l a t e dv a l i d i t ya n dt h e c o n s t r u c tv a l i d i t yw e r eh e i g h t e n e d ;t h er e l i a b i l i t y , c r i t e r i o n r e l a t e dv a l i d i t ya n dt h e c o n s t r u c tv a l i d i t yo ft h eh a l fo ft h eg o o d f i tp a r t i c i p a n t sw e r eh i g h e rs i g n i f i c a n tt h a n t h a to ft h eb a d f i tp a r t i c i p a n t s ;t h ef o u rp f sh a dd i f f e r e n tc o r r e l a t i o nl e v e l sw i t hy t h ec o r r e l a t i o nc o e f f i c i e n th e t w e e nl za n dyw a st h eh i g h e s t ;c o m p a r i n gt h ef o u r p e r s o n f i ts t a t i s t i c s ,l za n dc + w e r e t h em o s ts e n s i t i v et ot h er e l i a b i l i t ya n dt h ev a l i d i t y s ow ec o n c l u d e dt h a tp f sc a nr e c t i f yt h er e l i a b i l i t ya n dv a l i d i t y i tm e a n tt h a tp f s w e r es u i t a b l et op e r s o n a l i t yt e s t sa n dl zb a s e do ni r ta n dc 9b a s e do nc t tw e r et h e m o s ti d e a l i nt h es e c o n dr e s e a r c h ,w es i m u l a t e dal a r g es c a l eo fd a t ab ym o n t ec a r l o s i m u l a t i o nm e t h o dt oi n v e s t i g a t et h ea d a p t a b i l i t yo fl zi nt h el i k e r ts c a l e a ss h o w ni n t h er e s u l t l zw a sn o r m a ld i s t r i b u t i o n 。一1 6 5c o u l db es e e na st h ec r i t e r i o nt o d i s c r i m i n a t en o m a a lr e s p o n s ep a t t e r n sa n dt h ea b e r r a n tr e s p o n s ep a t t e r n s i tw a sg o o d i na l lk i n d so fa b e r r a n tr e s p o n s ep a t t e r n s t h ed i s t r i b u t i o no fl zw a si n f l u e n c e db yt h e c a t e g o r y o f r e s p o n s ep a t t e r n s ,t h ep r o p o r t i o n o f a b e r r a n ti n d i v i d u a l sa n dt h e p r o p o r t i o no fa b e r r a n ti t e m s t h ev a l i d i t yo fl zw a si n f l u e n c e db yt h ec a t e g o r yo f r e s p o n s ep a t t e r n sa n dt h ep r o p o r t i o no fa b e r r a n ti t e m s t h o u g ht h ec o n t e n ta n dt h em e t h o dw e r ed i f f e r e n to ft h e s et w or e s e a r c h e s ,t h e y p r o v e dt h es a m ec o n c l u s i o nt h a tt h ep f sw a se f f e c t i v ei np e r s o n a l i t yq u e s t i o n n a i r e s t h i sr e s e a r c hw a sj u s ta ne x p l o r a t i v ep r o c e s s t h e r ew e r em a n yl i m i t a t i o n si ni t f o r e x a m p l et h ee f f e c t i v e n e s so fp f sw a si n f l u e n c e db ym a n yf a c t o r ss u c ha st h el a r g eo f s a m p l e ,t h en u m b e ro fi t e m s ,t h ep r o p o r t i o no fa b e r r a n ti t e m s ,t h ep o s i t i o no fa b e r r a n t i t e m s ,t h ep a r a m e t e r se s t i m a t i o nm e t h o do fi r ta n ds oo n ,a l lo ft h e s em u s tb e i n v e s t i g a t e di nf u r t h e rs t u d y k e yw o r d s :p e r s o n f i ts t a t i s t i c s ,i r t , p e r s o n a l i t yq u e s t i o n n a i r e ,a b e r r a n tr e s p o n s e s , m o n t ec a r l od a t as i m u l a t i o n 个人拟合指标应用于人格测验的有效性 学位论文独创性声明 本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文中 除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表过的研究 成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论文中做了明确 的声明并表示谢意。 学位论文作者签名 王赐 日 期:0 7 王万 学位论文版权的使用授权书 本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及学 校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借阅。 本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关数据库并进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。保密的学位论 文在解密后使用本授权书。 学位论文作者签名z 职 指导教师签名:磊磊秆 日 期破j 夕 个人拟合指标应用于人格测验的有效性 第一部分问题提出 1 引言 心理测验中通常是以总分( i l 盯的能力估计值可视为对总分的替代) 作为对个体心理特质水平的评估。但由于种种原因总分中却可能包含与所 测特质无关的信息。如在能力测验中某一个体可能由于抄袭他人答案或猜 测而幸运地得到了高分;在计算机自适应测验( c a t ) 中,个体可能事先 获得题目信息而使总分得到提高;人格测验中的说谎行为、社会期望性反 应( s d r ) 等非量表能力( u n s c a l a b i l i t y ) 也使被试得分不能代表真实水平。 以上情况的存在使被试对测验题目的回答与预期的不一致( 如答对难题而 答错容易的题,对两个相互矛盾的问卷都回答了“是”等) ,或存在异常 的反应模式( a b e r r a n ti t e ms c o r ep a t t e r n s ) 。如能将存在异常反应模式的个 体区分出来,则测验得分对被试就更有鉴别力,测验的信度和效度也就能 得到提高。 个人拟合( p e r s o n f i t ) 又被称作适应性测量( a p p r o p r i a t e n e s s m e a s u r e m e n t ) ,反应偏差( r e s p o n s ea b e r r a n c y ) 、个体一致性( i n d i v i d u a l c o n s i s t e n c y ) 、符合标准( n o r mc o n f o r m i t y ) 等1 1 1 。个人拟合指标( p e r s o n f i t s t a t i s t i c s ,以下简称p f s ) 是指衡量某一个体在测验中的得分模式与某一 i r t 模型预测的项目得分模式是否一致,或与样本中其他个体项目得分模 式是否有显著差异的统计指标【2 1 。p f s 源于g u t t m a n 提出的测量模型【3 1 。 上世纪8 0 年代,随着项目反应理论的广泛应用,越来越多的研究开始关 注个体异常得分模式的鉴别。l e v i n e 和r u b i n ,w r i i g h t s t o n e ,v a nd e rf l i e r 等首先提出使用p f s 来鉴别个体异常得分模式【4 1 。目前个人拟合的研究主 要集中于四个方面:( 1 ) 提出更好的p f s ,并对其分布特征和性能进行检 验;( 2 ) 对比不同指标在不同l 类错误率时对异常得分模式的检出率;( 3 ) p f s 与项目拟合( i t e m f i t ) 方法的对比研究;( 4 ) 将p f s 用于经验研究1 4 】。 个人拟合研究具有重要的理论和实践意义,首先它可以提高测验的准 确性,即提高测验的信度与效度;其次,它可以保证教育测验的公平性; 第三,它可以增强计算机适应性测验的安全性;第四,它可以排除人员选 拔测验中的无关因素。 近些年来,p f s 被广泛的应用于能力测验和计算机适应性测验中。大 部分人格测验都是用于科学研究,参加测验的个体具有较低的动机,因此 人格测验中的偏差得分模式更为普遍。传统方法通常使用测谎量表或社会 期望量表来对这些非量表能力进行考察,但人格测验中的偏差得分模式不 仅仅包括这两种,而且很多被试会巧妙的掩盖自己的偏差行为而不影响测 个人拟台指标应用于人格测验的有效性 谎量表或社会期望量表的得分人格测验中的个人拟合研究对提高人格测 验的准确性具有重要的意义。但人格量表通常包括多个维度,且每个维度 包含的项目数较少,从而降低了p f s 在人格测验中的可行性。因此,寻找 适合于人格测验的p f s ,提高p f s 在人格测验中的有效性,无论是对个人 拟合研究的发展,还是对人格测验准确性的提高都具有重要意义。 2 文献综述 2 1 个人拟合的研究背景 个人拟合研究最早可追溯于上个世纪四十年代。1 9 4 4 年,统计学家 g u t t m a n 指出i 引,心理测验可以被看作是一个线性标尺,每个个体都可以 在该标尺上找到各自的能力点理想状态下,个体在能力点以下所有相对 简单项目上的得分向量应为1 ,在能力点以上所有相对较难项目上的得分 向量应为0 ,他进一步用数学公式来表示他的这一假设,这就是著名的 g u t t m a n 模型。在该模型的基础上,g u t t m a n 提出通过计算g u t t m a n 符合 对g 来考察个体的得分模式的异常程度,这就是最早的p f s 。 6 0 年代末期,相关分析开始被应用于个人拟合研究。d o n l o n & f i s c h e r ( 1 9 6 8 ) 提出用点二列相关r p b i s 作为个人拟合统计指标。r p b i s 是将测 验中的所有项目按被试的得分情况分成正确组与错误组,再计算这两组项 目在整个样本中正确率的相关【5 j 。同年,他们又提出了用二列相关r b i s 作 为p f s ,r b i s 与r p b i s 的区别就在于它假设每个项目的反应都是由连续的 正态分布变量构成的虽然后来的研究证明r p b i s 和r b i s 对于偏差行为的 鉴别并不是很理想,但它们却为个人拟合研究开辟了新思路,当前的很多 p f s 都会使用到的相关分析或协方差分析 8 0 年代以后,一方面,g u t t m a n 理想模式得到了越来越多的研究者的 认可,但他们发现仅用g 指标来评价个人拟合情况缺乏说服力;另一方面, 项目反应理论的广泛应用导致对被试能力的估计不再依赖于特定的测验 题目,从而使深入的p f 研究成为可能。因此,现代意义的p f s 开始出现, 个人拟合研究开始进入鼎盛时期。研究者们主要通过模拟数据来考察各指 标自身的特点、对偏差行为的检测效果及其影响因素。 当前个人拟合研究更加具体、直观,更具实用性。很多研究者提出了 专门针对于某种偏差行为的特殊的p f s ,例如,对作弊行为和泄露题目行 为的鉴别已经成为当前研究的热点,曲线图形作为一种新兴的个人拟合方 法以其独有的直观性受到了广泛的关注。研究者们更是重视p f s 的实用价 值,努力将这些指标应用于实际数据,使它们在实践中得到检验,并进一 步完善。 2 个人拟合指标应用于人格测验的有效性 2 2 个人拟合研究的理论基础 2 2 1g u t t m a n 模型 个人拟合研究源于统计学家g u t t m a n 于1 9 4 4 年和1 9 5 0 年提出的 g u t t m a n 理想模型。g u t t m a n 理想模型被定义为 0 6 j p z ( 口) 一0 ,0 6 o 尸i ( 一) - 1 其中。表示被试的真实能力,8 。表示答对某一项目g 所需的能力载荷, p g ( 0 ) 表示能力为0 的被试在项目g 上的正确反应概率。若将测验中的 所有项目按其难度由小到大排列,g 表示相对容易的项目,h 表示相对困 难的项目,即g p t ,则个人拟合函数被定义 为; ,i y w s y x s w s g - l l 一 了w i i y 蜀 爿 筹+ 1 其中代表一个适应往函数,不同的团体特征个人拟合法中的w 。是不相 同的。k 表示项目数,以为被试得分留= 1 ,乒) ,f 为被试编号, f = 1 ,n ,为被试答对的项目数【1 引 预警指标c 是用协方差比率来计算某一个体项目得分模式偏离完美 模式( p e r f e c tm o d e l ) 的程度。但c 没有上界,而修正预警指标m c i 则在 c 的基础上确定了c 的取值范围【0 ,1 】,m c i 是两个协方差之比,这两个 协方差分别是得分而和完美模式的协方差,五和完全偏差模式 ( p e r f e c t l y - i n c o n s i s t e n tp a t t e r n ) 的协方差。u 3 的形式与m c i 相似,只是 将协方差之比变为对数之比。z u 3 是u 3 的标准化形式,它接近于正态分 个人拟合指标应用于人格测验的有效性 布。h 1 是一个相关系数,它是计算个体竹的得分向量与其他1 个个体得 分向量的相似程度。一致性指标a 与不一致指标d 分别计算墨与p 。的一 致程度和不一致程度,可靠性指标e 则是a 与p 。之和的比 非参数p f s 虽然比参数p f s 更具自由性,但它们也同样存在着弊端。 通常的非参数p f s 研究只局限于有限的数据组,大部分统计方法的l 临界值 随着项目和测验特征的变化而改变。理想状态下,这些方法应该存在固定 的分布特征,但由于项目反应的背后不存在参数模型假设,因此,建立起 项目得分模式的概率分布模型是很难实现的,即使是u 3 ,研究者们也并没 有得到完全一致的分布特征。由于无法确切地得出非参数p f s 的检出率, 因此也就无法确定究竟哪种方法对偏差得分模式的检测更有效。 2 3 2 曲线图形法与回归分析法( g r a p h i c a l p e r s o n f i t a n a l y s i sa n d l o g i s t i c r e g r e s s i o na n a l y s i s ) 传统的p f s 通常很难对具体的偏差行为做出鉴定,虽然以单维性假设 为基础的指标在一定程度上弥补了这方面的缺陷,但研究表明第一类错误 率对能力分布和项目参数过于敏感,对偏差得分模式的检测效果并不理想 忙“。因此,近几年,很多研究者都在努力寻找能够获得更多偏差信息的新 的个人拟合方法。建立在个人拟合函数( p e r s o nr e s p o n s ef u n c t i o n p r f ) 基础上的曲线图形与回归分析就是研究较多的两种新的方法。 p r f 是指能力为0 的被试,答对某些项目的概率是这些项目难度的函 数,即y v ( 6 ) - p ( 岛- 1 1 6 ) p j ,它可以被看作是一种违背局部独立性假设的非 参数个人拟合指标1 2 “。k e r n e l 平滑曲线与l o g i s t i c 回归是p r f 的常用分析方 法。 k e r n e l 平滑曲线是一种非参数回归技术,首先在i i o 的基础上,将测验 项目从易到难排列作为横坐标,将个体的正确反应概率作为纵坐标,从而 得到一条平滑曲线,e m o n s 设计出了专门用于p r f 平滑分析的程序。平滑 曲线可以将个体测验行为的背景信息很好地与个人拟合研究相结合。例 如,若某一个体从他人那里抄对了较难项目的答案,则他的项目得分曲线 应呈u 形;某一个体由于考试焦虑答错了容易项目的答案,则他的项目曲 线应呈钟形;某一个体若随机猜测答案,则他的项目曲线应接近一条水平 直线。但若要确定个体的项目得分曲线是否来自该偏差行为,则必须获得 更多的背景信息【2 0 】1 2 5 1 。 l o g i s t i c 回归是对平滑曲线技术的一种补充,用来考察实际曲线形状与 理论曲线形状的一致性程度。由于p r f 是单调非递增函数,因此可以用一 元线性回归来考察,当回归系数为负数时,表明于p r f 的趋势相一致,因 8 个人拟合指标应用于人格铡验的有效性 此被认为是正常模式,而回归系数为正数时则被认为是偏差模式。而一些 偏差曲线图形也可以用曲线回归来表示,例如呈u 形曲线的抄袭行为,其 回归模型可被看作是二次函数,当二次项系数为正时,则证明与预测的曲 线模型相一致。无论是直线回归模型还是曲线回归模型,若以回归系数为 零作为虚无假设,则回归系数可被转化为f 分布的形式,因此通过第一类 错误率下的回归系数值,可对模型的拟合程度进行检验【2 7 1 。 2 3 3 特殊p f s 研究者为了提高p f s 的敏感性和实用性,提出了很多更具针对性的 p f s ,这些指标主要集中于对智力测验中抄袭行为和c a t 中记题行为的检 测。 检验抄袭行为的p f s 的基本思想是将被试进行配对比较,来考察他们 的得分模式是否具有一致性。其中最具代表性的是9 2 1 2 引、w 【2 卅和k 【3 0 儿3 。 虽然这些专门统计方法的检测效果要好于一般的p f s ,但他们也同样存在 一些缺陷。例如,当口用口的极大似然估计值( 箩) 来代替时,会导致结 果的偏差,k 和w 的检验效果受样本容量的影响,无法鉴别抄袭者与被抄 袭者等,要解决这些问题还需要进一步研究。 , c a t 是指根据被试的能力水平来选择测验的项目,一般性p f s 并不适蠡 用于c a t ,原因有以下几点:首先,c a t 的项目数要比纸笔测验中少;其 次,p f s 要求项目难度分布范围较广泛1 3 2 j 。专门应用于c a t 的p f s 中最著名 的两种方法是m c l c o d 和l e w i s 提出的z c 【3 3 】以及v a nk r i m p e n - - s t o o p 和 m e i j e r 提出的t p ”。z c 通过比较容易项目残差均值与困难项目残差均值来 考察记题行为,但使用z c 时,要求存在两种难度范围的项目,若一个测验 者在容易项目上或较难项目上一道题也没答对,z c 就无法得到结果。因此, 这就要求测验编制者在设计项目时或者将所有项目区分为两大类,去掉中 等难度的项目,或者测验中包含一道所有被试都能答对的容易项目。t 是 以正态累积分布( c u s u m b a s e d ) 为基础的指标。但c u s u m 同样存在缺 陷:其临界值依赖于模拟数据的平均值,因此,当数据库和测验长度不同 时,临界值很难确定【”】。另外c u s u m 临界值还随着占的水平不同而改变。 因此,未来研究需要考虑对每进行校正,从而使其与使用真实的口时临界 值具有一致性。 2 4 p f s 的影响因素 当前的个人拟合研究仍处于探索阶段,该领域还很难找到大规模的应 用研究。其主要原因就在于每一种个人拟合方法都会受到各种各样无关因 素的影响,这些无关因素主要包括以下几个方面 个人拟合指标应用于人格测验的有效性 第一,测验长度。模拟研究表明,长测验( k 王8 0 ) 和短测验中p f s 的分布情况并不相同,通常长测验的检测效果要好于短测验,因此p f s 在 能力测验中的应用价值要好于人格测验和c a t 第二,样本容量。研究表明样本容量的大小以及偏差得分模式个体在 样本中所占比率都会影响p f s 的检测效果。在p i r t 中,样本容量的大小 会直接影响p f s 的分布特征,只有当样本容量很大时p f s 才接近规则分布; 在n i r t 中,样本容量的大小会对项目顺序不变假设产生影响。另外,很 多研究表明,当样本中存在的偏差得分模式所占比率较小时,如5 或1 0 时容易被检测出,社会期望效应不易被检测,正是因为它是一种普遍存在的 行为。 第三,偏差类型、偏差项目数及偏差行为出现的位置。g e o r g e 研究表 明h o 和d ( 0 ) 对欺骗行为和粗心行为较敏感,h 。o 、d ( 0 ) 和e i 对猜 测行为较敏感,而r p b i s 、c i 、m c i 等很多指标都能有效地鉴别出随机反 应【3 州。偏差项目数及偏差行为出现的位置也会对个人拟合的检测效果产生 影响,而这种影响随着偏差类型的不同而改变。 第四,个体能力水平。高能力者的考试焦虑比低能力者更容易鉴别。 h e n d r a w a n 等使用模拟数据对p f s 进行研究时将被试分为高能力组口兰0 和低能力组口0 ,研究发现,对于猜测行为和记题行为,高能力组更容 易被鉴别p ”。 第五,参数i r t 的不同模型及口的不同估计方法。如前所述,参数p f s 研究的缺点就是受不同模型及p 估计方法的影响【3 8 1 1 2 。很多研究表明,在 r a s c h 模型中f 用其极大似然估值百来代替会增加拟合指标的敏感性 3 7 1 1 3 9 。 第六,项目区分度。研究表明,项目区分度较高时偏差得分模式更容 易被检测到【4 。 2 5 p f s 的评价标准 在众多p f s 中,如何选择合适的、有效的指标是个人拟合研究的一个 关键性问题。因此p f s 评价标准成为推动个人拟合研究的根本动力。 2 5 1 各指标自身特征 优秀的p f s 应该具有规则的分布特征、良好的稳定性与适应性和较强 的针对性。规则的分布特征有利于确定第一类错误率下指标的临界值,从 而对偏差得分模式给予明确的划分。因此,标准化指标l z 和z u 3 的研究 最为广泛。但以往研究表明即使l z 和z u 3 也并不是标准正态分布,它们 也没有确定的临界值;良好的稳定性与适应性是指指标的检测结果受无关 l o 个人拟合指标应用于人格翻验的有效性 因素的影响较少。如何增强p f s 的稳定性与适应性是个人拟合研究亟待解 决的问题;较强的针对性是指个人拟合方法可以对偏差行为类型作具体的 分类,除了特殊f f s ,p r f 在该方面显示出了强大的优势 2 5 2 与总分的相关 个入拟合研究的目的就是获得除畏l 验总分外更多的信息,因此,p f s 若与总分的相关越高则表明该方法所能提供的额外信息越少。理想的p f s 与总分的相关应该不显著。研究表明,参数p f s 与总分的相关要低于非参 数及团体特征p f s 。但p f s 与总分的相关会随着测验项目和样本的不同而 改变。 2 5 3 测验的信效度 测验的信效度,特别是测验的效度是衡量测验准确性的核心指标。存 在偏差行为的个体会使测验的准确性降低。因此,测验的信效度可以作为 评价f f s 的标准,从而实现c t t 与i r t 的良好结合。对于效度,研究者 们主要使用效度的结构方面和外部方面来对各p f s 进行评价【4 1 1 【4 2 】。 2 5 。4 经验信息 经验信息是个人拟合研究最重要的评价标准是对个人拟合研究最真 实的评价。当前的个人拟合研究在计算指标的检出率时通常使用模拟擞 据,但模拟数据与真实数据之间存在很大的差距。以p r f 曲线图形为例, 模拟数据中的随机行为近似于一条平行直线。但低能力者的考试焦虑和高 能力者对考试的严重恐慌都可能造成该图形的出现1 2 ”。要将这些偏差行 为区分开就必须获得更多的经验信息。 2 6 个人拟合研究的意义 随着个人拟合研究的深入,p f s 开始在实践中显示出它们的潜在价值, 最突出的表现有以下四方面。 2 ,6 ,1 提高测验效度 效度是评价测验准确性的核心指标,但当前的效度分析都仅仅是对效 度的简单评价而没有提出提高效度的方法。p f s 的出现为测验效度的提高 开辟了一条崭新的思路。不拟合得分个体是影响测验效度的一个重要因 素,而剔除这些不拟合个体可以使测验结果更真实地反映出被试的量表能 力。当然,测验效度的提高仅靠个人拟合研究是不够的,还需要项目拟合 研究者的共同努力。 2 6 2 保证教育测验的公平性 教育测验是用于测量被试在学业学习中习得知识和技能的测验,是评 估学生发展、学科教学的重要工具在我国。各类教育测验特别是升学考 1 l 个人拟台指标应用于人格测验的有效性 试几乎成了决定学生命运的重要砝码。然而,随着教育测验重要性的增强, 测验的公平性问题也受到了越来越多的质疑p f s 特别是w 、k 等专门性 指标为教育测验的公平性提供了有效的保障。但当前这些指标的研究还处 于探索阶段,因此。这些指标只能用于为监考者观察到异常行为之后提供 额外的证据,或用于给教育者提供适当的教学建议。但随着f f s 研究韵深 入,将这些指标应用于大规模的教育测验必将成为可能。 2 6 3 增强c a t 的安全性 近些年来,c a t 成为一种受到普遍欢迎的新的测验形式,但由于c a t 采用的是题库选题形式,随着题目曝光度的增加,泄露题目的可能性也随 之掘大,从丽降低了c a t 的安全性,丙专门针对于c a t 的z c 和t 等可 以对记题行为进行有效的检测。m c l e o d 和l e w i s 通过模拟g r e 考试中的 记题行为发现,z c 相对于一般p f s 有较好的检测效果【2 8 】【33 1 。但要提高c a t 的安全性,仅仅通过检验是不够的,在检验出可疑被试后还需要适当的解 决办法。例如,选择曝光率较低的项目对被试进行重测,或选择那些较容 易的项目让被试完成测验。因此。p f s 为c a = r 安全性的提高奠定了良好的 基础通过个人拟合研究者和测验编纂者的共同努力,c a t 将在各类教育 与心理测验中显现出更广阔的应用前景。 2 6 4 排除人员选拔中的无关因素 在人员选拔测验中,被试为了获得某一职位可能会做出更符合职位需 求而违背自身人格特征的反应。因此,社会期望效应、自我完善倾向性等 非量表能力在人员选拔测验中表现得更为明显。p f s 为选拔铡验中非量表 能力的鉴别提供了一种新的方法。z i c k a r 曾将l z 用于实际人员选拔测验中, 他对比了申请职位者和在职者人员选拔人格测验中的个人拟合情况1 4 ”,虽 然结果并没有显著差异,但这种新的方法和新的研究思路为未来人员选拔 测验的研究提供了启发。随着个人拟台研究的深入,特别是人格测验专门 性指标的出现,将使人员选拔的有效性得到显著提高。 2 7 人格测验中的个人拟合研究 对测验得分的解释是人格测量的关键性问题。人格测验在心理统计学 上的适应性要低于能力测验,这是由于人格测验中通常包含多个因素,除 了项目的内容,它还会影响被试的得分模式。除此之外,研究表明项目反 应会在很大程度上影响人格测量的结果。因此,越来越多的研究者关注于 人格测验的得分是否能反应所要测量的人格特征,或其他一些特征包括非 量表能力的影响。传统方法通常使用测谎量表或社会期望量表来对这些非 量表能力进行考察,但人格测验中的偏差得分模式不仅仅包括这两种,而 个人拟合指标应用于人格测验的有效性 且很多被试会巧妙的掩盖自己的偏差行为而不影响测谎量表或社会期望 量表的得分。因此,人格测验中的个人拟合研究逐渐受到了研究者们的重 视。 大多数的p f s 都是建立在i r t 模型的基础之上,研究表明在众多的i r t 模型中,二参逻辑斯蒂模型( 2 p l m 更适合于人格测验。原因主要有两 点:首先人格测验中的项目对于人格特质具有不同的区分能力,因此r a s c h 模型并不适用于人格测验,另外,猜测参数对人格测验意义不大,因此没 有必要在人格测验中使用三参模型1 4 4 i 。 研究表明,在适用于各种二参模型的p f s 中,标准化逻辑似然指标l z 较适合于人格测验。但这并不表明l z 是完美的,而只能说明在以往的比较 研究中它的适应性要好于其它指标。k 应用于人格测验的关键问题就在于 p f s 究竟测得的是哪种类型的偏差行为,智力测验中的偏差行为很容易定 义,而影响人格测验的非量表能力很多,例如,通常的人格测验都用于基 础研究参与者对结果的准确性并不感兴趣,缺乏系统性的回答、随机选 择答案、漏题、涂错答题卡等现象可能会经常发生。因此,偏差行为的确 定是个人拟合研究应用于人格测验的难点。 以往将i z 应用于人格测验实际数据的研究主要有以下几方面:p f s 的 稳定性和人格特征之间的一致性,遗传因素对量表能力模式的影响,对于 随机反应所造成的非量表能力的检测,个人拟合对测验效度的影响。; r c i s c & w a l l e r ( 1 9 9 3 ) 用l z 对多维人格问卷( m p q ) 的经验数据进i 诊 析,探讨异常得分模式与低量表能力( 1 0 ws c a l a b i l i y ) 之间的关系,研究 发现低量表能力并不造成偏差得分模式根源【4 5 1 。 z i c k a r 和d r a s g o w ( 1 9 9 6 ) 4 6 j 检验了p f s 对人格测验中的不诚实行为 的鉴别能力。研究者将被试分成来年两组,一组被要求尽量诚实作答,而 另一组被要求尽量表现得更高。他们对比了p f s 与社会期望量表的评价结 果。研究发现,p f s 可以鉴别出不诚实行为,但检测率并不高。f e r r a n d o 和e l i s e o ( 2 0 0 1 ) 4 4 1 进行了相似的研究,发现p f s 的检测效果并没有社会 期望量表和测谎量表好,他们认为这是由于存在不诚实行为的被试站总人 数的比率过高 p o n o c n y 和k l a u e r ( 2 0 0 2 ) 4 7 l 考察了r a s c h 模型对人格测验偏差行为 的捡测效果,发现r a s c h 模型的p f s 也同样可以应用于人格测验。但必须 对测验的结构进行认真的分析,同时还必须掌握可靠的关于诚实与不诚实 反应的信息。模拟研究和实际研究都表明,在合理的研究设计和实测环境 中,p f s 可以达到较理想的检测效果 个人拟合指标应用于人格测验的有效性 2 8 常用p f s 及其研究 当前被广泛使用的p f s 有很多,本文选择较具代表性的三个p f s 进行 研究 1 9 7 9 年l e v i n e 和r u b i n 提出了似然估计个人拟合法i 【8 j ,其表达式为 ,- 五l np | p ) + ( 1 一x s ) i n 1 一p l ( 口) n 。 ( 1 ) 局 。 d r a s g o w , l e v i n e & w i m o n s 于1 9 8
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训部总结与规划
- 城市交通规划合同管理著作权咨询重点基础知识点
- 地震安全评估师重点基础知识点
- 营销产品培训大纲设计
- 河北钉钉协议书
- 公务用车车辆租赁合同
- 民间标会协议书
- 超市部分承包合同协议
- 土地合作居间服务合同
- 产品质量保障与赔偿协议
- S22天天高速安庆至潜山段(凉亭至月山)环境影响报告书
- 某厂蒸汽管道安装吹扫及试运行方案
- 清华大学出版社机械制图习题集参考答案(课堂PPT)
- 安徽金轩科技有限公司 年产60万吨硫磺制酸项目环境影响报告书
- 儿科护理学智慧树知到答案章节测试2023年石河子大学
- 两篇古典英文版成语故事百鸟朝凤英文版
- GB/T 37573-2019露天煤矿边坡稳定性年度评价技术规范
- GB/T 19634-2021体外诊断检验系统自测用血糖监测系统通用技术条件
- GB/T 119.1-2000圆柱销不淬硬钢和奥氏体不锈钢
- 劳动保障监察执法课件
- 国际贸易理论发展及评述-国际贸易
评论
0/150
提交评论