版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、、人事考核的素质测评、一、误差、(一)误差的意思、二层的意思:其中,误差是由与测定目的无关的因素引起的第二个是误差是不正确或不一致的测定结果。 一种是随机误差,也称为可变误差,这是由与测定目的无关的偶然因素造成的难以控制的误差,是使多次测定产生不一致的结果。 这种误差的方向和大小的变化完全随机,可以服从不规则。 (二)误差的主要表现形式,另一种是系统误差,也称为稳态误差,这是由于与测量目的无关的因素造成的一定且有规律的效果,稳定存在于每次测量中,此时测量值一致但不准确。 系统误差只影响测量值的精准性,而随机误差同时影响精准性和一致性。 (3)人事考核的误差类型,第一类是来自人事考核工具自身的误
2、差,第二类是来自评价的实施过程的误差,第三类是来自评价实施者的误差,第四类是来自被试验者的误差。 1、评价工具和方法的要素是物理、化学评价工具精密,评价方法越科学误差越小相反误差越大。 人事考核与物理、化学上的测量不同,人的才能、个性、人品等许多特性不能直接测量,人事考核往往有主观因素。 因此,人事考核工具和方法产生的误差远远大于物理化学测量。 评价工具和方法造成误差的主要原因,(1)评价工具评价的行为和特性与目标上想要评价的行为和特性之间的不一致。 例如,做评估情绪稳定性的所有评价主题都应该只评价情绪稳定性,但实际上,也测定了情绪稳定性以外的特性,这些个的特性成为妨碍因素,成为评价误差的根源
3、。 (2)评价指标和测量问题采样的代表性,一般来说,评价指标、测量问题越多越有代表性,误差也越小。 由于经济、可行性等原因,与所有评价目的相关的所有指标不能作为评价的指标,所有相关的测量问题也不能作为测试主题,只能选择代表性的指标、代表性的测量问题样本用于评价。 测量问题的内容和难易度分布是测量问题的代表性重要指标。 (3)测量问题的格式和用语、评价计程仪等要素,有些问题格式(例如非问题)是有推测性的一些主题格式(所有主观的主题)是评价主观的测量问题的用语有模糊性,或者用语不正确成为评价误差的原因。 2、评价具体实施过程中的偶然因素,随着计算机等评价工具的使用,评价实施越来越标准化,评价实施产
4、生的误差也越来越少。 然而,评价的具体实施过程还有许多意想不到的偶然因素。 意外的偶然因素的种类,(1)环境干扰作用。 做评估环境温度、换气、噪音、照明、突然地供电中断等要素时,会产生误差。 (2)做评估纪律的计算机特罗尔很差。 做评估纪律的计算机特罗尔不严格,有时会作弊(如代考、仿造、相互交流等),泄露评价主题等,导致评价误差。 (3)误操作。 有误读指导语、误理解指导语、误答(如果自己回答的答案是a,则选择c )、误记、记录评分错误等主要原因。 3、被评价者要素、被评价者要素被评价者是活人,人是非常复杂的,很多大姨妈、心理要素都会成为妨碍人事考核目的的要素。 (1)导致人事考核误差的被评价
5、者的主要原因是大姨妈因素。 身体健康因素、饥饿和过度饱和、疲劳程度、大姨妈周期等都会影响人格测验的结果。 (2)动机水平每个被实验者都有参加评价的目的,这个目的与被实验者有意隐藏自己,安装或安装的倾向的回答相关,其结果,不能反映被实验者的实际情况。 因为被实验者的动机水平不同,所以复盖的程度也不同。动机水平不同,被评价者的应激状态也不同,动机过强会引起被评价者的评价不安,动机不足会引起被评价者对评价采取适当的态度。 在人格、态度、动机等的评价中,被评价者的动机水平往往是被评价者的因素中产生误差的最重要的因素。 (3)接受教学水平价值观等文化因素。 受试者的教学水平不同,其成长的文化背景不同,价
6、值观不同,受试者对测定问题的理解、解答态度、回答偏好等不同,从而导致评价误差。 (4)关于经验。 如果在进行评估之前,被评估者已经有过评估的经验,例如,经历过类似的测试或同一类型的测试,了解相关的解答策略,则可能会对评估结果产生很大影响。 有人做了实验,让5名知道其智力水平的学生大量练习感知和图形推理,然后进行瑞文图形智力测试,结果远高于他们的实际智力。 4、主考要素、主考以貌取人,对被评价者有偏见,可能引起评价误差。 主考试的不良言行会给受试者的心理状态带来干扰作用、暗示、误解,从而造成误差。 主要评分标准不一致,先松弛,先松弛,突然升高,或者有意修改评分标准,对某人特别照顾,可能会引起误差
7、。 总而言之,评价误差一般可以分为随机误差和系统误差两种。 由于随机误差是由偶然因素引起的,其发生是随机不规则的,因此其数值的大小也是随机变化的,是不确定的。 这是引起评价不一致的因素,导致信任度的评价。 也称为系统误差、稳态误差或偏差。 这是与试验目的无关的因素引起的一定的系统变化,其数值大小具有一定的规定性和稳定性。 与评价的有效性有关的习惯上把随机误差称为观察误差或者评价误差。 在这种意义上,由概念评估误差指示的误差仅仅是评估得分中包括的误差(随机误差和系统误差)的一部分(即随机误差)。 (1)信任度的基本概念、信任度也称为信任度,对用一种评价方法得到的结果前后的一致性水平进行分析,以该
8、一致性水平为指标来判断评价的可靠性。 试验结果的可靠性与试验结果受误差影响的程度密切相关。 在人才评价中误差是免不得的。 只有尽量追求高精度,把误差控制在一定范围内。 这样,测定的结果比较稳定可靠。 信任度实际上是随机误差的测量值。 (2)信任度系数以及估计方法、信任度指标都以信任度系数的形式表现。 所述信任度系数是同一样本的两个不同时间、不同条件或两个不同评估材料的评估结果之间的相关系数。 不同的误差源有不同的信任度决定方法。 通常有重测信任度、复制信任度、内部一致性信任度、评分者信任度等多种类型。 1 .重新测量信任度和重新测量信任度也称为稳定性系数,它做评估了跨时间的一致性程度,即在相同
9、测试中,在两个不同时间对同一组执行两次,这两个测试分数的相关系数是重新测量系数。 一个测试的重测系数越高,表示评价的稳定性越好,评价不受随机因素的影响。 得到再测量系数时最需要注意的是,必须根据测试的性质和目的控制合理的时间间隔。 时间间隔变长时,受验者的心理特征根据学习、经验、教育训练等要素而发生发展变化,降低相关系数的时间间隔变短时,初次评价时的练习效果和记忆效应的影响变大,引起假性高的相关。 2 .复印信任度、复印是指在内容、数量、格式、难易度、平均数、标准差等各方面与原来的评价相同的评价,即功能等值但主题内容不同。两个当且仅当的测试是互相复制的。 复印的信任度也被称为当且仅当性系数,是
10、做评估形式间的整合性,即评价被试验者后隔一定的时间,使用复印再次评价而得到的复印相关系数。 拷贝的信任度高度反映了两个测试拷贝在内容上的等效程度。 复制可靠性的优点:适用于长期跟踪研究,以及调查某些干扰作用变量对测试成绩的影响,从而降低指导和作弊的可能性。 当然,复制副本相关系数也是有限的:另一方面,在现实中,制作理想的复制副本往往是困难的,许多评估都没有复制副本。 另一方面,复印评价也受到练习的影响。 3 .需要使用内部整合性信任度、再测定相关系数和复制相关系数,进行2次做评估,不仅需要很多劳力,而且被试验者受到练习的影响而第2次的评价会失真。 内部一致性系数不同,只需做评估1次,通过分析同
11、一评价项目间的相关系数来推定信任度系数。 内部一致性系数反映了测定问题间的一致性,即内部各部分间的统一律性做评估了有木有。 内部一致性信任度分为半信任度、统一律性信任度和系数。 (1)划分半个信任度,使得半个信任度系数的方法将一个评估分成两个最等效的一半,校正各个受验者在半个测试中的得分,获得这两个得分的相关系数,并且估计整个评估的信任度。 因为一半的系数只是基于原测试问题的一半主题,信任度的大小和测试的长度有关,所以一半的系数大多比原测试的信任度低。 rxx :估计或修正的信任度,其中rxx=2rhh/(1 rhh ),通常使用rhh :半个测试的相关系数来校正该差异。 (2)统一律性信任度
12、、统一律性信任度无需将评价分成两半,意味着测试内部的各主题考察了多少相同的内容。 所谓统一律性,是所有测试主题测量的是单一的属性或内容,表现为所有测试主题得分的一致性。 常用的纠正算法是库德理查森的估计方法。 修正算式中有库德理查森20号式(简称为kr20 )和21号式(kr21 )。kr20式,n是测试题目数,pi是通过i题目的人数的比例qi是未通过该题目的人数的比例pi qi=1; piqi是所有问题正解与回答数的百分比之积的总和。 库德理查森信任度系数的运用需要满足几个条件:所有的度量问题采用对分法分数,都采用0,1分数,正确答案为1分,回答错误0分记录试验的项目工程难易度在比较接近的项
13、目工程之间组间的相关相等。 (3)如果测试项目采用多分数(例如人格测试、态度尺度),则系数不能运用库德理查森信任度。 克伦巴赫提出了适合各种评分情况的系数来估计信任度。 其中si是每个项的方差,sx是测试的总得分的方差。 4、评价者的信任度、人事考核中,不同评价者的观察角度、注意力、对受试者的偏见等使评价结果不一致,评价者的评价也是误差的来源之一。 评分者的信任度指的是不同评分者评定同一对象的一致性。 具体而言,2个评分者对同一被试样组进行评分,并且求出2个评价分数的相关系数。 这样的相关系数的校正运算可以使用积差相关法,也可以使用斯皮曼类相关法。 评分者在3人以上且采用等级分数时,采用肯德尔
14、调和系数求出评分者的信任度。 其中k是评估人数,并且ri是评估人数或答案数,其中ri是每个对象排名。 (3)影响信任度系数的主要因素,1 .测试长度:其他条件相等时,测试长度(主题的多寡)越长,信任度值越高。 因为测试越长,主题采样和内容采样就越一盏茶,结果越可靠,而且也越不推测主题的影响。2 .样本组的性质:一般来说,在其他条件不变的情况下,样本组的分数分布范围越大,变异性越大,信任度系数越大。 样本组的异质性越大,信任度系数越高。 3 .考试难度:考试难度对信任度也有影响。 一个考试的难易度太低的话,大部分的被试验者都能简单地回答题目,考试的分数非常集中在高分的边缘。考试的难易度太高的话,
15、很多被试验者只能用推测来回答,所有的分数都集中在低分上。 这将导致测量的分数分布过于狭窄,降低信任度。 三、有效性、(一)有效性的含义、人事测定的有效性是指测定的有效性,即采用的评价工具测定了应该评价的特性的程度。 一个是妥当性对于试验结果。 二是对于有效的特定评价目的而存在。 三是有效性是连续性的,关于程度的估计。 (二)有效度的类型和估计方法,一般把有效度分为内容有效度、构思有效度和有效度的相关有效度三种,这些个三种有效度相互关联,一个好的评价通常可以用一个或一个以上的效度表示。 1 .内容效度、内容效度是测试内容是否符合该类人员的功能特点,即测试内容是在需要测量的行为区域的代表性抽样检查
16、有木有的指标。 要素的设定订正和标准的制定是鉴定评价有效性的内容。 一般方法: (1)通过对照内容范围,(2)评价者的关信任度;(3)统一修订分析;(2)构想的有效性、构想的有效性,是指测试能够测定理论上的构想和特质的程度。 想法是抽象的假设概念、特性或变量。 例如智力、创造力、语言的流畅性、焦虑、动机等。 想法不能直接测量,需要用一定的评价工具来反映。 想法的有效性估计方法有很多种,但大致可分为测试内部的方法和测试之间的方法两种。 3、效果标关联有效度、效果标关联有效度用评价点数和有效度基准之间的相关系数表示评价有效度的高低,表现进行预测的有效度。 这里所谓效果标记,是考察测试效用的外部参照
17、标准,是可以直接独立测定的行为。 通常,对一般员工来说,其效果必须是产量和质量,对科技人员要有效地标记发明、创造及技术成果的数量和效益,对管理者要有效地标记工作效率,对员工的积极调动程度和经济效果,对引导者要发展人才,对局面和社会、经济效果(3)影响有效性的因素;(1)受试者的样本在一个测试中适用于不同的样本,有效性因受试者的年龄、文化程度及经验背景的不同而不同,因此选择受试者的样本是考察有效性的重要因素。 样本容量的大小和有效度系数的高低也有一定的关系。 样本容量越大,检验误差越容易抵消,有助于提高测试和效果测量的信任度,同时提高有效度系数。 (2)效果指标选择适当的效果指标是统一有效性的前
18、提条件。 在一个测试中,根据采用的效果标志的不同,其有效性可能会有很大差异。 此外,由于效果标记的选择错误,可能无法测量测试的有效性。 通过以上分析,我们对信用度和效度的分析是对直接评价结果质量的考察,一个测试的信用度和效度在很大程度上依赖于该测试的主题残奥仪(难度和区分度),建立和筛选具有合适残奥仪的主题是改善测试信用度和效度的前提。 我们根据考试问题的结果,分析了构成考试的各个题目,对题目的好坏进行了评价。四、难度分析、(一)难度概念、难度是指测试试题目的难易度,也是测试试题对被试知识和能力水平的适合度指标。 难易度是相对的概念,难易度的高低与被实验者的水平直接相关。 在说易于测定的时候,我们应该面向具体的实验对象。(2)难易度的补正算、1、如果用正确率来推测难易度的问题是对分法反应得分项目,则p值可以用通过率式来补正。 在p=r /n中,p是问题的难易度。 r是正确回答问题的人数n是参加考试的人数的订正。 受验者数多时,用极端的分组法求问题的难易度,首先按照考试总分的高低排序,然后将受验者分为分数高的27%的受验者分为高组,分数低的27%的受验者分为低组,中间46%的受验者分为中间组这3组分别校正高报文分组和低报文分组的通过率,求出问题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江省金华市金东区重点达标名校2026年初三年级模拟考试(一)语文试题含解析
- 标准化运营管理制度建设模板全面兼容
- 特色自然景观维护承诺函3篇
- 乡村振兴项目质量保障承诺书4篇范文
- 2026年广东省韶关市名校初三下学期第二次阶段性反馈英语试题含解析
- 供应商资质升级申请确认函(6篇范文)
- 信息资料完备与可靠公开承诺书(7篇)
- 绿色农业智能供应链优化方案
- 企业财务核算标准流程指南
- 项目成功实施成果承诺书(3篇)
- 醛-亚胺-壳聚糖水凝胶的构筑及性能研究进展
- 无人机行业信息安全培训
- 管理会计学 第10版 课件 第4章 经营预测
- HACCP计划年度评审报告
- 2023年华南师范大学教师招聘考试历年真题库
- 长春版小学一年级语文上册写字表虚宫格写法教学提纲教学课件
- 2023年新改版教科版五年级下册科学全册练习题(一课一练)
- 耳尖放血课件完整版
- GB/T 3292.1-2008纺织品纱线条干不匀试验方法第1部分:电容法
- GB/T 16177-2007公共航空运输服务质量
- GB/T 12149-2017工业循环冷却水和锅炉用水中硅的测定
评论
0/150
提交评论