结构化面试与无领导小组讨论信度分析的概化视角.pdf

上传人：q*** IP属地：河南上传时间：2020-03-10 格式：PDF 页数：47 大小：2.19MB 积分：24 举报 版权申诉

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

辽宁师范大学硕士学位论文结构化面试与无领导小组讨论信度分析的概化视角姓名董婉玲申请学位级别硕士专业基础心理学指导教师郭庆科 20090501 结构化面试与无领导小组讨论信度分析的概化视角中文摘要摘要本研究的目的是运用多元概化理论对人事测评的两种主要方法进行信度分析首先是通过概化研究的各种技术指标分析结构化面试信度并比较结构化面试中行为性与情境性两类面试问题的信度其次是用同样的方法对无领导小组讨论的信度进行分析证实多元概化理论在人事测评的信度分析当中的应用价值研究运用模拟真实情境的方式进行了结构化面试和无领导小组讨论的研究其中结构化面试针对6 8 名本科生在9 个能力维度上进行评价并区别了行为性面试问题与情境性面试问题无领导小组讨论针对1 4 组共5 8 名被试在7 个能力维度上进行评价使用多元概化理论的方法和程序对以上三部分研究进行信度分析得到结果如下 1 使用多元概化理论对结构化面试的信度进行研究结果表明被试能力的变异是总变异的主要来源评分者题目及交互作用的变异均较小 9 个维度的信度均达到了O 8 4 以上结构化面试总的信度为0 9 5 3 1 4 2 在行为性面试与情境性面试信度的比较中多元概化分析的结果显示行为性面试的信度 0 9 8 1 4 1 要稍高于情境性面试的信度 0 9 4 6 9 9 并且从各维度的方差协方差分量以及误差项分析行为性面试与情境性面试适合测量的能力维度不同这一点提示我们测试要根据所需测量的能力的不同选择合适的种类 3 使用多元概化理论对无领导小组讨论的信度进行研究结果显示被试能力的变异评分者的变异及交互作用的变异对总变异的贡献差别不大被试能力的变异对总变异的贡献要稍大于评分者的变异交互作用的变异最大测评中7 的维度的信度都偏低但研究总体的信度 0 8 1 3 8 4 可以接受研究证实了在表现性评价当中多元概化理论在变异来源和信度分析上存在着优势有很大的实用价值论关键词多元概化理论信度结构化面试行为性与情境性面试无领导小组讨结构化面试与无领导小组讨论信度分析的概化视角 A b s tr a c t T h ep u r p o s eo ft h i sr e s e a r c hi ss t u d y i n gr e l i a b i l i t yo ft w om a i np e r s o n n e l a s s e s s m e n tm e t h o d sb yu s i n gM G T F i r s t t h r o u g ht h et e c h n i c a li n d e x e so fM G T w ea n a l y z et h er e li a b il it yo ft h es t r u c t u r a l i n t e r v i e w a n dt h e nc o m p a r et h e r e l i a b i l i t yo fb e h a v i o ri n t e r v i e wa n ds i t u a t i o n a li n t e r v i e w T h i r d w ea n a l y z e t h er e l i a b i l i t yo fL G Db yu s i n gt h es a m em e t h o d T h i sr e s e a r c hi sai m i t a t i o no fr e a lo n e sw h i c hm e a n st oc o n f i r mt h e a p p l i c a t i o nv a l u eo fM G Ti np e r s o n n e la s s e s s m e n tp r o g r a m W ec h o s e n6 8o n g r a d u a t e sa st h et e s t e e so fi m it a ti o ns t r u c t u r a li n t e r v i e w a n dt e s t e dt h e mo n 9v a r i a b l e so fe a c hk i n do ft h eb e h a v i o ra n ds i t u a t i o n a li n t e r v i e w s L G Ds t u d y b a s e do n1 4g r o u po ft e s t e e s t o t a l5 8 a n d7v a r i a b l e s B yu s i n gM G Ta n a l y s e s w eg o tt h r e ec o n c l u s i o n s 1 T h er e l i a b i l i t ys t u d y o fs t r u c t u r a li n t e r v i e ws h o w e d t h ev a r i a t i o no ft h et o t a ls c o r em o s tc a m ef r o m t h ev a r i a t i o no ft h et e s t e e s A n dt h ev a r i a t i o n so fr a t e r sa n di t e m sw e r et o t a l l y s m a l l T h er e l i a b i l i t yo fe a c ho n eo ft h e9 i sa b o v e0 8 4 a n dt h ee n t i r e r e l i a b i l i t yo fs t r u c t u r a li n t e r v i e wi s0 9 5 3 1 4 2 T h er e l i a b i l i t yc o m p a r i n go f b e h a v i o ra n ds i t u a t i o n a li n t e r v i e ws h o w e d t h er e l i a b i l i t yo ft h eb e h a v i o r i n t e r v i e w 0 9 8 1 4 1 i Sal i t t l eh i g h e rt h a nt h es i t u a t i o n a l i n t e r v i e w 0 9 4 6 9 9 T h r o u g ht h ev a r i a n c ea n dc o v a r i a n c ea n a l y s e so fe a c ho ft h e 9v a r i a b l e sa n dt h ee r r o ri t e m sa n a l y s e s i tt o l dU St h a tt h ep r o p e rt e s t i n g v a r i a b l e so fb e h a v i o ra n ds i t u a t i o n a li n t e r v i e wa r ed i f f e r e n t t h a tm e a n s r e s e a r c h e r ss h o u l dc h o o s et h er i g h tk i n do fa s s e s s m e n t sa c c o r d i n gt ot h e c o m p e t e n c e st h e yw a n t 3 T h es t u d yo ft h er e li a b i1it yo fL G Ds h o w e dt h a tt h e r e a r en oo b v i o u s l yd i f f e r e n ta m o n gt h et e s t e e sv a r i a t i o n r a t e r sv a r i a t i o na n d i n t e r a c t i o nv a r i a t i o n T h ev a r i a t i o no ft e s t e e si Sa1 i t t l eh i g h e rt h a nt h e t a t e r sv a r i a t i o n a n dt h ei n t e r a c t i o nv a r i a t i o ni st h eh i g h e s ti nt h i sp a r to f r e s e a r c h T h er e li a b i1 it yo fe a c ho n eo ft h e7v a r i a b l e si so nt h el o ws i d e b u tt h ee n t i r er e l i a b i l i t yo ft h eL G D 0 8 1 3 8 4 i sa c c e p t a b l e T h i sr e s e a r c hc o n f i r m e dt h ea p p l i c a t i o nv a l u eo fM G Tu s i n gi np e r s o n n e l a s s e s s m e n tm e t h o d s t h e r es h o u l db em o r ep r a c t i c a la p p l i c a t i o ni nt h ef u t u r e K e yW o r d s M u l t i v a r i a t eG e n e r a l i z a b i l i t yT h e o r y R e l i a b i l i t yS t r u c t u r a l i n t e r v i e wB e h a v i o ra n dS i t u a t i o n a li n t e r v i e w L e a d e r l e s sG r o u pd i s c u s s i o n 2 学位论文独创性声明本人承诺所呈交的学位论文是本人在导师指导下所取得的研究成果论文中除特别加以标注和致谢的地方外不包含他人和其他机构已经撰写或发表过的研究成果其他同志的研究成果对本人的启示和所提供的帮助均已在论文中做了明确的声明并表示谢意学位论文作者签名查塑鲤型主学位论文版权的使用授权书本学位论文作者完全了解辽宁师范大学有关保留使用学位论文的规定及学校有权保留并向国家有关部门或机构送交复印件或磁盘允许论文被查阅和借阅本文授权辽宁师范大学可以将学位论文的全部或部分内容编入有关数据库并进行检索可以采用影印缩印或扫描等复制手段保存汇编学位论文并且本人电子文档的内容和纸质论文的内容相一致保密的学位论文在解密后使用本授权书学位论文作者签名墨塑垒暨指导教师签名签名日期砂伽7 年上月孑日结构化面试与无领导小组讨论信度分析的概化视角 1 引言 1 1 测评的概化理论 1 1 1 概化理论产生的背景概化理论 G T 是当今最有影响力的三大测量理论之一在G T 理论产生之前人们通常使用C T T 对测量误差进行分析传统的C T T 又称为真分数理论真分数指在测量中不存在测量误差时的真值或观察值实际的观察值等于真分数加上误差即 X T E 其中X 为观察分数 T 为真分数 E 为误差真分数理论的三个基本假设是 1 误差分数的平均数是零 2 误差分数和真分数相互独立 3 两次测量的误差分数之间的相关为零信度是测量可信程度或一致性的表示在C T T 中信度是一组测验分数中真分数方差与观察分数方差的比率信度系数往往随测量设计的不同而不同而事实上误差变异并非单一结构 C T T 对误差来源的笼统划分与控制成为它在实际应用中最为突出的缺陷 C T T 的另一个突出的局限在于严格平行测验 s t r i c tp a r a l l e lt e s t 的理论假设即要求子测验在内容均数变差信效度方面完全相同这在实际的测验情景中很难满足n 1 鉴于C T T 理论存在的不足 G T 理论应运而生 1 9 6 3 年克龙巴赫 C r o n b a c h R a j a r a t n a m G l e s e r 1 9 6 3 等人在英国统计心理学杂志上发表了论文概化理论信度理论的丰富和发展 T h e o r yo fG e n e r a l i z a b i l i t y Al i b e r a z a t i o no f r e l l a b i l i t yt h e o r y 这标志着G T 理论的诞生但正式提出这一理论的是C r o n b a c h 等人在1 9 7 2 年出版的行为测量的可靠性一书至I 1 9 8 3 年该理论开始走向成熟各种术语等开始走向规范和统一相关的计算机软件也开发成功当年出版的布瑞南 B r e n n a n 1 9 8 3 的专著概化理论纲要以及相应的软件G E N O V A 对G T 理论的发展起了很大的推动作用同一时期谢伟森和韦伯 S h a v e l s o n W e b b 1 9 9 1 也出版了自己的专著概化理论入门 2 0 0 1 年布瑞南重新出版了概化理论专著该书大量增加了不平衡设计和多元G T 理论的内容并同时推出了相应的软件包口1 随着研究水平的提高 G T 理论的范围越来越大目前 G T 理论不仅被用于标准化的常模参照性测验而且还被广泛用于标准性参照测验非标准化测验表现性评价等多方面对教师的教学评价和人事测评中的面试均有直接的帮助 1 1 2 概化理论的优缺点 G T 理论的优越性在于首先在理论假设上 G T 扬弃C T T 的经典平行测验假设而代之以随机平行测验假设从而使分析问题的条件较容易得到满足其次在具体方法上 G T 利用方差分析技术将测验变异分成几个部分每个部分对应于特定的误差来源从而更便于测量误差的控制最后 G T 最显著的特点是强调测量的具体情境它认为结构化面试与无领导小组讨论信度分析的概化视角测量的根本目的并不是为了获得特定条件下的测量结果而是要以此来推断更广泛的条件下可能得到的测量结果以寻求最优化的测量设计改进并指导实际的测量工作比1 G T 理论虽然具有许多独特的优点但要用它来解决有关实际问题还必须弄清楚该理论的局限性以便使G T 理论在实际测量中得到合理的应用在基本思想上 G T 理论注重所测心理特质的单维性因此在实际应用中同样要强调试题样组的同质性在计量方法上 G T 理论对各类误差源的考察是以方差分析为基础通过方差分量的估计来实现但由于数据结构的复杂性方差分量估计有时还会出现负值这是一个困惑人心的统计理论问题在时间测量研究中就更难解释了在测量应用上 G T 理论用于实测数据的事后分析是比较理想的但用在事先指导时就要逊色一些因为概化分析基于随机抽样模型由于抽样的异变性一次抽样数据的分析结果仅是测验统计规律的描写其可靠性严重依赖于实测数据的完备性因此研究者必须有较高的测验设计水平和实测控制能力即便如此在将预测数据分析的结果应用到实际测验的编制时也应充分注意到随机误差的影响比1 1 1 3 概化理论的主要概念和研究设计 1 1 3 1 概化理论中的主要概念概化理论认为测量的情景关系由测量目标 o b j e c t 和测量侧面 f a c e t 构成测量目标就是研究者通过测量以及测验分数所试图描述刻画揭示和研究的某个心理特质心1 测量侧面就是除了测量目标外凡是会影响和制约最后测验分数的所有条件和因素乜k 测量侧面有水平的不同侧面的水平是指一个测量侧面所包含的个别状态它还可分随机侧面和固定侧面如果侧面的水平是该侧面所有可能的众多水平中的一个随机样本则该侧面是随机侧面如果每次所采用的侧面水平都相同固定不变则该侧面是固定侧面乜1 在一定条件下根据测量目的不同随机侧面和固定侧面可以相互转换测量目标和测量侧面也可以相互转换固定侧面越多所得结果的信度就越好但固定侧面越多就会使测量目标受更多的限制如果所有的侧面都固定测量目标将变的毫无意义所以应用G T 时至少有一个面是随机的随机侧面越多从条件样本得到的一些测量结论就越能推广到普遍的条件总体上去啦观测全域 u n i v e r s eo fa d m i s s i b l eo b s e r v a t i o n s 是指实际测量活动中所有测量侧面条件全域的集合其中一系列相同的测验情景称之为一个侧面晗1 同一个被试可以在多个不同的测验情景下进行测量这种情景的结合叫做随机平行 r a n d o m l y p a r a l l e l 随机平行的前提是大规模题库的存在所有可能的随机化平行组合构成了可推论全域可推论全域包括可观察全域中所有或部分情境但是不可能超出它所包含的情境乜1 G T 理论认为观察分数方差可以分成多个部分分别是由测量目标和由观测情景造成的并可用方差分析的方法将他们分别计算出来嘲 2 结构化面试与无领导小组讨论信度分析的概化视角为了进一步分析方差误差 G T 还提出了相对误差和绝对误差的概念前者指测量设计中的侧面和测量目标之间的交互作用的方差分量后者是指所有侧面的主效应和侧面及测量目标之间的交互效应的方差分量 G T 理论用概化系数和可靠性系数作为刻画误差的指标用相对误差估计出来的信度系数是概化系数 G 系数是测量目标的有效变异占有效变异与相对误差变异之和的比值用绝对误差估计出来的信度系数是可靠性系数或巾系数是测量目标自身的分数变异在全体分数变异中所占的比率概化系数和可靠性系数代表了测验信度的高低它们分别表示常模参照测验和标准参照测验中的信度水平随机误差由测量的目标自身的稳定性以及各种因素间的交互作用引起统误差则由各个测量侧面引起概化系数和可靠性系数的开方等于实得分数与其真实水平之间的相关其值越高则测验信度就越高位 3 1 1 1 3 2 概化理论的基本研究方法概化理论研究分为G 研究和D 研究两个部分前者是测量程序的开发过程主要任务是尽可能多地挖掘出各种潜在的测量误差来源并估计出它们的变异分量大小后者是测量工具的应用过程主要任务是根据决策的需要以概化研究的方差分量估计值为基础在改变测量情境关系某些方面使得测量误差趋于最小从而提高测量信度和效度乜1 G 研究 g e n e r a l i z a b i l i t ys t u d y 又称概化研究是指在观测全域之上研究者需对所有侧面和测量目标以及他们间的交互作变异分量估计 G 研究在特定测量情境下进行收集资料设计并实际进行试验性测试获得实测数据尽可能多地估计测量过程中所有误差来源变异分数口1 D 研究 D e c i s i o ns t u d y 又称决策研究是指在概括全域或概化全域上对各测量面或测量对象或它们之间的交互作用的研究 D 研究是为了某种特殊的决策需要以G 研究所得到的方差分量估计值为基础在改变测量情境关系某些方面的情况下如调整各个侧面样本的大小调整各个侧面之间的关系等使得测量误差趋于最小从而提高测量信度 D 研究是对G 研究的推广使研究者不必等到以后正式进行的测量工作就可以做出优化决策实现预控调节 G 研究和D 研究是G T 中的两个研究过程简单地说 G 研究是测量程序的开发过程 D 研究是测量工具的应用过程口1 具体来说二者的主要区别是 1 两者所涉及的条件全域可以有所不同 G 研究中测量的条件全域是观测全域 D 研究中所涉及的条件全域则是概括全域或推论全域 D 研究的主要目的在于根据特定的决策需要来推论或解释测量结果因此其概括全域可以与观测全域相同也可以不同心1 2 两者任务不同 G 研究的主要任务是在研究设计上尽可能多地挖掘出各种潜在的测量误差来源并估计这些误差来源变异分量的大小 D 研究的任务是根据决策的需要利用G 研究的结果重新构建多种概括全域在样本均值的层面上估计各种变异二l 结构化面试与无领导小组讨论信度分析的概化视角分量的大小进而估计各种测量误差和测量精度指标等为改进测量提供有价值的信息一般地 D 研究通过三个方面来重新构建新的概括全域即调整全域中各个侧面的样本容量调整测量的模式调整测量结构口1 1 2 结构化面试研究的回顾结构化面试 S t r u c t u r e dI n t e r v i e w 在员工的招聘选拔和任用中发挥着越来越重要的作用从企事业单位的人才招聘到党政领导干部的公开选拔结构化面试成为使用最为广泛的人才测评方法之一 1 2 1 结构化面试的含义结构化面试是指在面试内容程序和评价三个方面进行结构化的一种面试形式包括内容结构化程序结构化和评价结构化三个方面n 加结构化指面试设计参照职位要求应试者特征对面试题目评价标准作适当裁剪目的是减少考官评价偏差提高面试信度和效度结构化是一种重要的缓冲变量结构化面试比无结构化面试具有更高的信度和效度n 蚰 1 2 2 行为性面试与情境性面试行为面试 B e h a v i o rD e s c r i p t i o nI n t e r v i e w 和情景面试 S i t u a t i o n a lI n t e r v i e w 是结构化面试的两种重要形式行为面试假设过去行为是未来行为的最好预测指标通过应聘者对过去某种行为的追忆和表述从而捕捉应聘者的个性特征行为面试的实现途径主要通过应聘者对过去行为事例的回忆和表述从而了解应聘者已具备的行为素质其实现途径是 1 识别岗位工作的关键性要求 2 使用过去的行为预测未来的行为 3 探测应聘者的行为事例并做出评价 4 内容程序评价三方面结构化情景面试基本原理是届标设置理论假设对未来的意图和设想是未来行为的有效预测指标主要通过求职者对某种假设情景的设想联想假设和分析来捕捉其某些能力或其他个性特征n 引行为面试和情景面试是两种有效的面试方法它们各自的信度和效度并不存在显著区别 C a m p i o n 等 1 9 9 4 研究发现行为面试和情景面试相关系数为O 7 3 P 0 0 1 平均数和变异量相似考官间信度分别为0 9 4 和0 9 7 两类面试与上级评价绩效问相关较低行为面试略高于情景面试但不显著n6 1 又如M c D a n i e l 等 1 9 9 4 运用元分析技术发现情景面试和行为面试平均效度系数为O 2 7 和0 2 1 校正后为O 5 0 和0 2 9 n 刀虽然以往的研究表明行为面试和情景面试在信度和效度上并不存在显著差异但也有研究发现行为面试的效度显著高于情景面试而情景面试的信度高于行为面试如研究发现行为面试与上级评价的工作绩效相关显著而情景面试则不显著H 副许多研究者把这些差异归结三个方面原因操作不同情景面试适合逐题打分而行为面试适合末尾打分反应不同求职者对假设的情景作简单反应而对经历的行为反应丰富细腻 4 结构化面试与无领导小组讨论信度分析的概化视角所需时间不同行为面试时间较长情景面试时间较短但进一步的研究发现情景面试和行为面试适用于招聘选拔不同职位的员工以往情景面试信度和效度较高的原因是因为研究数据来源于简单的基层职位离开职位层次和职位特征来探讨结构化面试的信度和效度毫无意义 P u l a k o s 和S c h i m t t 1 9 9 5 在研究美国联邦调查局人才选拔面试中发现情景面试不适合用于联邦调查局这样复杂的部门和职位的人才选拔并认为行为面试比情景面试在选拔复杂职位和高层次人才时更为有效n 引 A l l e n 等 2 0 0 1 的研究验证了情景面试的局限性认为情景面试之所以在高层次人才选拔面试中应用效果不好可能是因为以下几方面原因面试题目长度有限难以设计复杂情景复杂情景具有动态性特征运用关键事件编成的情景试题生态效度大打折扣求职者对情景作简单的反应使得试题区分度低n 町职位层次和职位特征是一种重要缓冲变量面试设计和研究必须建立在职位层次和职位特征基础之上 1 2 3 结构化面试进展及其误差的研究近些年来随着人们多认识测评重要性认识的不断加深人事测评技术得到了飞速的发展人事测评的主要技术包括履历分析心理测验情景模拟结构化面试等其中结构化面试几乎在所有的招聘中都会被用到H 3 而且在汇总各项测评结果做出最终决定时面试结果所占比重也越来越大可以说结构化面试已经成为人员招聘中使用最为广泛的方法u 钔面试是一个或多个考官与一个求职者之间在有限时间内的人际互动旨在鉴别求职者的知识技能能力和行为等方面的特征这些特征将用于预测求职者在未来工作上的成功研究对这种成功的操作性定义包括工作绩效培训晋升任期等方面的指标啪3 面试按标准化程度可分为结构化面试半结构化和非结构化面试三种所谓结构化面试是指面试的内容方式评委构成程序评分标准及结果的分析评价等构成要素按照统一制定的标准和要求进行的面试砼长期以来较低水平的评分者一致性一直被认为是人事面试的一个重要的缺陷 W a g n e r 第一个全面地总结了与人事面试有关的研究综述心副得出面试的评分者一致性从 0 2 3 到0 9 7 W a g n e r 总结道面试的信度和效度或许存在高度的情境特异性和考官特异性乜引从W a g n e r 开始一直到当代学者瞳劓对面试研究的总结反复提到下述评分误差对比效应 c o n t r a s te f f e c t s 至少考生的部分面试成绩受到紧邻的在他前面面试的考生的质量的影响与我类似效应 s i m i l a rt om e 第一印象偏差 f i r s ti m p r e s s i o n e r r o r 晕轮效应 H a l o 首因一近因效应 p r i m a c y r e g e n c ye f f e c t s 考官刻板印象考官心目中理想的成功面试者的形象顺序效应 o r d e re f f e c t s 考官对考生的个人感情 P e r s o n a lf e e li n g s 信息偏好考官在面试的早期一般是面试的前4 分钟已经做出了最终决定与来自考生的积极的信息相比考官更看重消极的 5 结构化面试与无领导小组讨论信度分析的概化视角信息等等关于面试误差的这些研究结果意味着评分往往在一定程度上反映的是面试过程的特征或者考官个人的评分技能而不是被试与工作相关的特征因此这种来自情境的误差变异损害了面试的潜在效度和效用 2 5 o 随着面试形式的进步阱1 面试数据结果的信度和效度有所提高嘶1 这些进步包括首先面试的结构化不断增加而研究发现面试结构化的程度与效度系数是相关的盥其次面试题目是基于工作分析而得到的第三对评委进行培训第四在面试过程中实行笔录第五使用评委组进行面试第六使用行为锚定等级量尺来评价被试的回答啪3 等等这些方法的使用在很大程度上提高了面试的效度和信度 M c D a n i e l 等对1 0 6 个研究进行元分析以工作绩效为效标得到的校正后的平均效度为0 4 5 2 4 o 这样在各种主要人事选拔技术中面试已经成为仅次于认知能力测验的有力选拔工具认知能力测验的效度为0 5 3 评价中心的效度为O 4 3 传记式资料的效度为0 3 7 基于一系列的元分析 S c h m i d t 和H u n t e r 在回顾了8 5 年的人事选拔研究之后得到这样的结论面试是工作绩效培训效果等变量的最好的预测变量之一同时他们还认为面试的这种效度可以概化到不同的工作效标以及组织例总之选拔面试能够较好的预测工作绩效评定尽管这种有效性受到面试内容面试的结构化程度等变量的调节H 1 需要明确的是面试本身作为一种工具的有效性并不能保证其在具体的面试实践中的有效性由于面试具有主观性大面试考官容易出现偏差等缺点如何不断提高结构化面试的规范化结构化精细化和科学化仍受到研究者的日益重视关于面试误差的研究从很多方面展开面试误差的来源有很多方面H 1 面试题目的有效性面试实施的各个环节面试评委的培训面试记分维度的设定以及面试评分量表的设计等等研究者主要集中在两个方面的研究以降低面试过程中的情境误差提高实际面试的效度和信度第一种方法关注面试的内容获取信息的维度的标准化从而使得考官尽可能在相同的工作相关信息的基础上对考生进行评价最终提高评分的一致性近年来随着现代测量理论的发展越来越多的研究者尝试使用现代测量学的方法通过统计校正改进面试评分技术提高面试信度和效度但是在我国对于面试中各种误差的研究还停留在比较初级的阶段大多数面试研究仍局限于经典测量理论 C l a s s i c a lT e s tT h e o r y C T T 的研究方法H 1 3 无领导小组讨论研究的回顾无领导小组讨论 L G D 是评价中心的主要方法之一谈及这种方法的发展就不得不介绍评价中心的发展脉络上世纪2 0 年代德国军队建立了用以选拔军官的多项评价程序 A s s e s s m e n t C e n t e r sa n dM a n a g e r i a lP e r f o r m a n c e b yW i1lJ a mC B y n a m e 其中包含的实际操作的作业成为了评价中心发展的基础后来英国美国的军方也在德国的基础上建 6 结构化面试与无领导小组讨论信度分析的概化视角立了自己的评价中心用以选拔情报人员二战后这种方法被军事心理学家和军官带到了工业企业中评价中心最早在企业中的应用是上世纪5 0 年代美国电话电报公司 A T T 实施的管理发展研究 m a n a g e m e n tp r o g r e s ss t u d y 在该项目中运用了小组讨论情境模拟面试和心理测验等活动心理学家和有经验的工作人员按照 2 5 条标准对公司的几百名员工进行了多次的评价和长期的评估结果显示在被提升到中级管理岗位上的人当中8 0 的人当时的评价鉴定是正确的而在未被提升的人当中9 0 左右在八年前就预测到了随后标准石油 I B M 通用电气等企业纷纷效仿A T T 评价中心在工业组织中得到了迅速的传播在德国菲律宾新加坡南非澳大利亚英国日本等不同文化的国家均得到接受和广泛的使用 T h o r n t o n 1 9 9 2 据估计 1 9 8 0 年仅美国就至少有2 0 0 0 个组织使用了评价中心直到2 0 世纪8 0 年代评价中心技术才逐渐在我国开始了较为系统的介绍进入9 0 年代有些学者将评价中心作为选拔管理人员的方法运用于企业中梁开广等 1 9 9 1 宗月琴 1 9 9 2 取得了良好的效果随后我国的政府部门也开始使用评价中心选拔政府官员 1 9 9 6 年国家人事部考试录用司在为原地矿部选拔局级领导干部时运用了评价中心取得了令人满意的结果 1 9 9 7 年后在公务员录用考试北京市的领导干部高级管理人员选拔考试中也在尝试着运用评价中心中某些情境化测验如文件筐测验无领导小组讨论等总之评价中心在我国已得到初步的发展但同时许多测评的方法和技术还有待进一步的完善n 评价中心是一种综合的人事测评方法它是在对目标岗位的工作分析的基础上确定出该岗位所需要的关键能力特质或者维度然后创设一系列与工作高度相关的模拟情境再要求被试在这种模拟的工作情境下完成各种相应的管理工作然后由多个评分者对被评价者的行为进行观察和评分评价中心主要包括的方法有文件筐测验无领导小组讨论搜索事实演讲模拟面谈模拟会议等模拟活动不同的组织在使用评价中心进行选拔或其他的人事测评时可以进行适当的选择n 无领导小组讨论是一种评价中心常用的方法经常用于各种组织的人才选拔这种方法在国外人才测评选拔中有广泛的运用在国内对这种方法也有一定的研究苏永华柴雪丁玉洋的无领导小组讨论 1 e a d e r l e s sg r o u pd i s c u s s i o n 简称L G D 技术实施中的信度与效度问题研究吴谅谅等人的无领导小组的应用等都对L G D 的信效度评价者等作了一系列的实证研究可还有一些问题没有取得令人满意的结果在各方面还有待进一步的完善还有大量的问题需要解决n 无领导小组的评分是一个非常复杂的过程它是由多个评分者按照预先设计好的维度从被评价者所表现出的诸多行为中辨别筛选记录其典型行为评分者通过集中讨论使评分结果达成一致或者用统计的方法对评分结果进行整合最终得到被评价者行为表现的综合评价观察和评价的过程需要在很短的时间内完成这些对评分者的 7 结构化面试与无领导小组讨论信度分析的概化视角要求是非常高的而且这也是无领导小组讨论的一个难题因此如何使评分者的评分更加准确一直是研究者们关心的问题 B i t n e r 1 9 4 8 就认识到对评分者进行培训能提高评分有效性的这种潜在的价值n 1 3 1 国内外对L G D 的研究国外对L G D 的研究主要是它在评价中心当中的应用对它的设计实施信度和效度等的专门研究不是很多大部分研究是把L G D 与评价中心的其他方法结合起来进行研究的还有就是通过L G D 对整个评价中心进行效度的研究 J e f f r e y N e a l 1 9 9 2 L a n c e N e w b o l t G a t e w o o d e r a l 2 0 0 0 S h o r e T h o r n t o n G e o r g e 1 9 9 0 K u d is e h l a d d 1 9 9 7 表1 国外L t D 研究现状M 由于L G D 兼具人力资源评价和培训开发的双重功能其在全球范围内得到广泛应用这些年以来 L G D 技术在我国的人才选拔应用广泛国家公务员考试开始将它列为面试的内容之一有些省市区已经在实际选拔公务员或领导干部时运用L G D 技术例如广东省就将L G D 的技术运用于省副厅级领导干部的选拔公开选拔领导干部以来 L G D 技术受到广泛关注 2 0 0 3 年广东省公开选拔1 0 0 名副县级领导干部就启用L G D 评价程序这是我国公开选拔领导干部实践中的创新尝试公开选拔领导干部对L G D 提出了很高的要求 2 0 0 0 年初中共中央组织部颁发了全国公开选拔党政领导干部考试大纲试行详细地阐述了L G D 的含义和操作程序公开选拔领导干部对评价技术提出了更高的要求如何运用L G D 评价技术选拔高层次管理人才如何开发具有中国特色的L G D 评价工具是我国人才评价技术研究者面临的挑战我国对L G D 研究主要在下面几个方面首先比较多的文章是对L G D 内容特点过程等的介绍 1 其次关于L G D 的实证研究中比较有代表性的是彭平根等人的 L G D 在选拔企业高级管理人才方面的实证研究啼1 苏永华柴雪丁玉洋的 L G D 技术实施 8 结构化面试与无领导小组讨论信度分析的概化视角中的信度与效度问题研究关培兰等人的无领导小组在人才招聘中的作用 1 黎恒等人的无领导小组的实物操作中层管理人才选拔案例口1 吴谅谅等人的无领导小组的应用川8 1 等这些文章都对L G D 的信效度评价者等作了一系列的实证研究为我国L G D 技术的发展起到了推动的作用国内L G D 研究现状具有以下几个方面特征n 1 1 1 分析思路单一运用传统的测量理论分析L G D 的信度和效度总的来看我国研究证据表明 L G D 是一种具有较高信度和效度的人才评价方法但对过程效度关注不够对影响信度和效度的关键缓冲变量的研究有待进一步加强研究关注L G D 与其他测验的关系但对测验之间的增量效度尚未有实证分析 2 研究设计思路单一局限于特质导向设计思路特质导向的设计思路既忽略了行为也忽略了结果强调考官的客观观察和主观判断因此习惯运用等级评价量表对被评价者的各个特质进行总体评价特质导向的设计思路和等级评价量表是中国传统评价思路的典型反映特质导向设计思路容易导致测量构思偏移评价目标从而使得测验的构思效度缺失 3 L G D i 9 l t J 评要素设计缺乏理论支持和实证依据测评要素数量比较多增加了评价者的认知负荷致使测评要素之间相关过高缺乏辨别效度但在构思测量上也取得了系列研究成果如研究发现与个性品质方面的评价相比 L G D 在评价个人的能力特征方面更有优势射 1 3 2 国内外对L G D 信度的研究 L G D 是由多个评价者对被评价者进行评价所以评价者的内部评分内部一致性也成为L G D 评分可靠性的一个重要指标n 在国内外众多L G D 的研究中很多都采用了评分者一致性作为L G D 的信度指标从这些对L G D 的研究结果来看L G D 的评价者内部一致性是比较好的 B a s s 1 9 5 4 报告评价者内部一致性在 0 6 1 0 8 4 之间 B r a y G r a n t 1 9 6 6 对两个不同的L G D 进行研究其评分者的内部一致性是O 6 0 和0 7 5 等级的一致性是 0 6 9 和0 7 5 在一个相似的研究中 G r e e n w o o d M c N a m a r a S 1 9 6 7 对1 2 组不同的L G D 进行研究信度等级在O 4 8 0 8 4 之间 C 1i n g e n p e e l 1 9 7 9 对两组L G D 的研究结果显示评分者内部一致性是0 7 2 和0 6 9 当然还有用其他的作为信度指标的 R o b e r t G a t e w o o d G e o r g eC T h o r n t o n H a r r yW H e n n e s s e yJ r 在1 9 9 0 年的一项对L G D 的研究中显示评分者内部一致性在O 6 9 0 9 9 之间组间信度在0 6 6 0 8 4 之间同样也比较好然而复本信度却不是很理想两组不同的L G D 中同一个评价者对被评价者的评价之间的相关是0 5 5 0 6 2 之间对于评分者内部一致性 J o n e s 1 9 8 1 的研究发现评分者通过讨论达成的综合评价对评分内部一致性产生影响讨论前的一致性系数为 0 4 2 0 5 3 而讨论后的一致性系数是0 5 9 一O 7 4 这个差异显示讨论后一致性系数的提高是由于社会压力对评价的影响而不是基于基准分数 t r u es c o r e 所达成的一致 9 结构化面试与无领导小组讨论信度分析的概化视角 H e r r i o t C h a l m e r s W i n g r o v e 1 9 8 5 发现社会因素会影响评分者内部一致性讨论后的评分会显示出更高的内部一致性被评价者人数影响L G D 的评价信度n B a s s 和N o r t o n 研究L G D 不同分组条件下评价者信度发现六人组信度最高一致性系数为0 8 2 两人组评价者信度最低一致性系数为0 7 2 国内也有很多研究者对L G D 的信度进行了研究吴谅谅 2 0 0 2 用肯德尔w 系数作为评分者的信度指标研究表明评价者的内部评分内部一致性趋于一致彭平根的研究表明无领导小组讨论信度指标W 系数除了基本都达到真诚维度略低是0 3 8 3 P O 0 5 外其他的W 系数都在0 5 2 3 0 7 9 3 p O 0 1 表明评分者信度一致性较好他的而且他在研究中发现对能力方面的素质特征评价一致性略高于个性的评价体系唐忠明在他的评分者一致性研究中也显示肯德尔W 系数均达到显著最低达到0 5 6 0 最高达到了 0 8 7 3 说评分者的一致性较好他还对不同评价者评分内部一致性进行了比较结果显示有人事经验的与没有人事经验的评价者在倾听能力上评价不一致其他的维度趋于一致 1 3 3L G D 的评分者及维度研究如何提高评分者的评分质量一直是研究者所关心的问题而提高评分者评分的质量最有效的方法就是在评分之前对评分者进行系统的培训 C e n t e rG u i d e l i n e s 1 9 8 9 指出了评价中心的基本原理和活动其中之一就是对评价者全面的培训 B i t t n e r 1 9 4 8 就指出培训给美国军队的官员提供了军队评估量表的绩效维度提高了官员对士兵的评分质量培训提高了评分者的进行主观评估的知识和技能并且激励评分者在评分过程中使用在培训中获得的知识和技能 M c I n t y r e S m i t h H a s s e t t 1 9 8 4 H i l l D a v i d W a t s o n 对评价者自身的主观因素对评分的影响进行了研究他们认为L G D 的评分结果容易受到评分者主观倾向经验态度风格及评分者的个性特征等因素的影响而产生较大差异 L o w r y 对评分者特征对评分的影响的研究也表明评分者的工作经历年龄性别受教育程度种族是否参加过评价中心的活动管理经验任职时间的长短等都会对评分内部一致性有很大的影响国内也有一些关于评分者的研究唐忠明在他的硕士论文中发现参加过L G D 活动的评价者再创新能力综合分析能力上的评分显著高于未参加过L G D 活动的评价者其他

人人文库> 全部分类> 生活休闲 > 面试求职

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

结构化面试与无领导小组讨论信度分析的概化视角.pdf

文档简介

温馨提示

最新文档

评论

结构化面试与无领导小组讨论信度分析的概化视角.pdf

文档简介

温馨提示

最新文档

评论

相关文档