第七章测验等值_第1页
第七章测验等值_第2页
第七章测验等值_第3页
第七章测验等值_第4页
第七章测验等值_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、测验等值测验等值心理测量学心理测量学测验等值概述测验等值概述1常用等值资料采集方法设计常用等值资料采集方法设计2测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法3心理测量学心理测量学测验等值概述测验等值概述1心理测量学心理测量学测验等值概述测验等值概述测验等值的含义测验等值的含义测验等值的条件测验等值的条件等值误差等值误差测验等值的含义测验等值的含义什么是测验等值?什么是测验等值? 为什么进行测验等值?为什么进行测验等值?所有测验都可以进行等值么?所有测验都可以进行等值么?理论基础是什么?理论基础是什么?测验等值如何进行?测验等值如何进行?心理测量学心理测量学测验等值的含义v我们想

2、要知道数学能力在小学一年级和二年级的差我们想要知道数学能力在小学一年级和二年级的差异情况。应该怎么比较他们的数学成绩?异情况。应该怎么比较他们的数学成绩?v研究生入学考试某个地区的英语泄题了,最后采用研究生入学考试某个地区的英语泄题了,最后采用了副卷进行考试,那么,最后算总分的时候,依然了副卷进行考试,那么,最后算总分的时候,依然采用几门科目成绩之和算总分?采用几门科目成绩之和算总分?v我们要建立一个题库,希望试测数百个乃至成千个我们要建立一个题库,希望试测数百个乃至成千个试题。显然、这些试题决不能同时在一个考生组上试题。显然、这些试题决不能同时在一个考生组上来试测,我们可能要同时测许多考生组

3、。虽然其中来试测,我们可能要同时测许多考生组。虽然其中的第一组跟第二组,或第二组跟第三组间是有若干的第一组跟第二组,或第二组跟第三组间是有若干共同试题的,但每一组的考生都只接受很少一部分共同试题的,但每一组的考生都只接受很少一部分试题的测试。这样得到的难度和区分度可以直接应试题的测试。这样得到的难度和区分度可以直接应用吗?用吗?v通过前面的几个例子我们知道,不同测验形通过前面的几个例子我们知道,不同测验形式之间的分数或成绩不能直接比较,因为他式之间的分数或成绩不能直接比较,因为他们是处在不同的评价系统上的,没有可比性们是处在不同的评价系统上的,没有可比性。所以在应用之前必须把分数转换到同一评。

4、所以在应用之前必须把分数转换到同一评价系统之上。这样,就需要将具有不同难度价系统之上。这样,就需要将具有不同难度、分数分布的试卷的分数转换到一个统一的、分数分布的试卷的分数转换到一个统一的量尺之上,采用统一的量尺对应考者进行测量尺之上,采用统一的量尺对应考者进行测量。量。测验等值的含义测验等值的含义 测量学上把所有不同测验形式的分数都转换测量学上把所有不同测验形式的分数都转换到同一个分数系统上的一套专门技术称为到同一个分数系统上的一套专门技术称为测测验等值验等值(Test Equating)。)。 测验等值的实质就是通过对考核同一种心理测验等值的实质就是通过对考核同一种心理品质的多种测验形式作

5、出测量分数系统的转品质的多种测验形式作出测量分数系统的转换,进而使得这些来自不同测验形式的测验换,进而使得这些来自不同测验形式的测验分数之间具有可比性。分数之间具有可比性。心理测量学心理测量学测验等值的条件测验等值的条件心理测量学心理测量学 测验等值必须满足的要求与条件测验等值必须满足的要求与条件u测验所测心理结构或特性的同一性测验所测心理结构或特性的同一性u等信度等信度u测验等值转换关系的公平性测验等值转换关系的公平性u测验等值转换关系的可递推性测验等值转换关系的可递推性测验等值的条件测验等值的条件心理测量学心理测量学 测验等值必须满足的要求与条件测验等值必须满足的要求与条件(续)(续)u测

6、验等值转换关系的对称性测验等值转换关系的对称性u测验等值转换关系对总体的惟一性或称样测验等值转换关系对总体的惟一性或称样本不变性本不变性 在测验等值处理中,如果待等值测验能在测验等值处理中,如果待等值测验能完全符合上述完全符合上述6个条件,则等值的结果将个条件,则等值的结果将令人满意。令人满意。等值误差等值误差心理测量学心理测量学 等值完成后必须对等值结果进行评价。评等值完成后必须对等值结果进行评价。评价等值关系可靠性与准确性的指标是等值关价等值关系可靠性与准确性的指标是等值关系中所包含等值误差的大小。等值误差有两系中所包含等值误差的大小。等值误差有两类:随机等值误差与系统等值误差。测验误类:

7、随机等值误差与系统等值误差。测验误差不可避免一样,等值误差也是不可避免的。差不可避免一样,等值误差也是不可避免的。等值误差等值误差v随机误差发生在用样本统计量来预测总随机误差发生在用样本统计量来预测总体参数的情况下。体参数的情况下。v系统误差是由于违背了数据收集设计或系统误差是由于违背了数据收集设计或等值方法的假设或者条件所造成的。等值方法的假设或者条件所造成的。v研究结果表明,并非在任何情况下等值都是最好的研究结果表明,并非在任何情况下等值都是最好的处理。如果有证据表明两份试卷的难度差异很小,处理。如果有证据表明两份试卷的难度差异很小,就没有必要进行等值。就没有必要进行等值。v在实际的测验等

8、值过程中我们无法知道等值是否必在实际的测验等值过程中我们无法知道等值是否必要。因此,我们只能为了控制测量误差而采取等值要。因此,我们只能为了控制测量误差而采取等值方法。尽管在有的情况下进行等值处理可能增大了方法。尽管在有的情况下进行等值处理可能增大了测量误差,但总体来讲,等值处理仍然是必要的。测量误差,但总体来讲,等值处理仍然是必要的。心理测量学心理测量学常用等值资料采集方法设计常用等值资料采集方法设计2常用等值资料采集方法设计常用等值资料采集方法设计1单组设计单组设计2随机等组随机等组设计设计3锚测验锚测验非等组非等组设计设计单组设计 单组设计:单组设计:即把想要等值的两个或多个测验即把想要

9、等值的两个或多个测验同时向同一被试组施测,然后借助于同一被同时向同一被试组施测,然后借助于同一被试组把拟予等值的测验联系起来,这时两组试组把拟予等值的测验联系起来,这时两组测验分数的差异主要是由于两个测验的难度测验分数的差异主要是由于两个测验的难度不同而引起的,因而从理论上来说这种等值不同而引起的,因而从理论上来说这种等值设计既简单又无抽样误差。但实际上由于练设计既简单又无抽样误差。但实际上由于练习效应、疲劳及厌倦等因素的影响,会给等习效应、疲劳及厌倦等因素的影响,会给等值结果带来误差。值结果带来误差。心理测量学心理测量学随机等组设计 随机等组设计:随机等组设计:从同一总体中随机抽取两组从同一

10、总体中随机抽取两组考生,这两组考生被认为在能力分布上是相考生,这两组考生被认为在能力分布上是相同的或很接近,让这两组考生分别接受两份同的或很接近,让这两组考生分别接受两份不同测验不同测验X和和Y,然后估计两测验形式的等值,然后估计两测验形式的等值关系。这种设计方案可克服练习效应和疲劳关系。这种设计方案可克服练习效应和疲劳等因素的不利影响。这种数据采集设计有一等因素的不利影响。这种数据采集设计有一个假设,即两被试样本的总体分布是相同的个假设,即两被试样本的总体分布是相同的。由于从同一总体抽样,因此,不考虑两组。由于从同一总体抽样,因此,不考虑两组之间的差异,这一假设比较容易得到满足。之间的差异,

11、这一假设比较容易得到满足。心理测量学心理测量学锚测验非等组设计 锚测验锚测验非等组设计:非等组设计:在测验编制时另外编在测验编制时另外编制一组测验试题,这些试题被称为共同题,制一组测验试题,这些试题被称为共同题,也称为锚(也称为锚(anchor)题。在数据采集时,)题。在数据采集时,锚测验题既对第一组被试施测,又对第二组锚测验题既对第一组被试施测,又对第二组被试施测。被试施测。心理测量学心理测量学等值设计方法图示单组设计单组设计样本样本测测 验验X YP 随机等组随机等组设计设计样本样本测测 验验X YP1 P2 锚测验锚测验非等组非等组设计设计样本样本测测 验验X V YP1 q1 心理测量

12、学心理测量学心理测量学心理测量学测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法3测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法心理测量学心理测量学v线性等值线性等值v等百分位等值等百分位等值v锚测验非等组设计下的等值关系计算锚测验非等组设计下的等值关系计算方法方法线性等值原理线性等值原理心理测量学心理测量学 在单组设计或随机等组设计下的两个分在单组设计或随机等组设计下的两个分数,一个在测验形式数,一个在测验形式x x上,另一个在测验形上,另一个在测验形式式y y上,对于任何一个被试团体,如果它们上,对于任何一个被试团体,如果它们的标准分数相等,这两个分数就被认为是等

13、的标准分数相等,这两个分数就被认为是等值的。值的。线性等值线性等值心理测量学心理测量学 用数学公式表示,所谓测验分数用数学公式表示,所谓测验分数x x等值于等值于测验分数测验分数y y,即有下式成立:,即有下式成立: 改写为:改写为: 其中:其中:等百分位等值原理等百分位等值原理心理测量学心理测量学 在单组设计或随机等组设计下的两个分在单组设计或随机等组设计下的两个分数,一个在测验形式数,一个在测验形式 x x上,另一个在测验形上,另一个在测验形式式 y y上,如果这两个分数有相同的百分等级,上,如果这两个分数有相同的百分等级,那么这两个分数就被认为是等值的。按照这那么这两个分数就被认为是等值

14、的。按照这个原理,寻找与个原理,寻找与 x x 分数等值的分数等值的 y y 分数,只分数,只要找到与要找到与 x x 分数有相等百分等级的分数有相等百分等级的y y分数就分数就可以。可以。等百分位等值等百分位等值心理测量学心理测量学 对于测验对于测验x x的每个一分数,可根据公式的每个一分数,可根据公式在在x x测验分布中先求出与其对应的百分等级,测验分布中先求出与其对应的百分等级,然后在然后在y y测验上求取具有该百分等级的分数。测验上求取具有该百分等级的分数。即在两个测验上就有相同百分等级的分数就即在两个测验上就有相同百分等级的分数就是等值分数。是等值分数。等百分位等值等百分位等值心理测

15、量学心理测量学百分等级计算公式为:百分等级计算公式为:根据百分等级计算测验分数公式为:根据百分等级计算测验分数公式为:锚测验非等组设计计算锚测验非等组设计计算心理测量学心理测量学 让两个被试组分别参加两个形式的测验,让两个被试组分别参加两个形式的测验,在两个测验中有部分项目是共同的在两个测验中有部分项目是共同的锚题,锚题,这样两组被试被锚题锚接在一起。使用该设这样两组被试被锚题锚接在一起。使用该设计可以采用线性等值方法来完成等值计算。计可以采用线性等值方法来完成等值计算。锚测验非等组设计计算锚测验非等组设计计算心理测量学心理测量学锚测验非等组锚测验非等组设计线性等值方法计算公式如下:设计线性等

16、值方法计算公式如下: 其中,其中, 是是x x测验向全体被试测验向全体被试t t施测时的平均施测时的平均数与标准差的估计值,数与标准差的估计值, 是是y y测验向全体测验向全体被试被试t t施测时的平均数与标准差的估计值。施测时的平均数与标准差的估计值。心理测量学心理测量学如果两组被试能力差异不大,四项估计值为:如果两组被试能力差异不大,四项估计值为: 其中,其中, 与与 是只参加测验是只参加测验x x被试的平被试的平均数和标准差,均数和标准差, 与与 是只参加测验是只参加测验y y被试的平均数和标准差,被试的平均数和标准差, 与与 是锚测是锚测验向全体被试验向全体被试t t施测得到的平均数和

17、标施测得到的平均数和标准差,准差, 与与 是既参加测验是既参加测验x x又参加锚又参加锚测验被试的平均数和标准差,测验被试的平均数和标准差, 与与 是即参加测验是即参加测验y y又参加锚测验被又参加锚测验被试的平均数和标准差,试的平均数和标准差, 是测验是测验x x对测对测验验v v的回归系数,的回归系数, 是测验是测验y y对测验对测验v v的的回归系数。回归系数。心理测量学心理测量学 其中,其中, 与与 是只参加测验是只参加测验x x被试的平均数和标被试的平均数和标准差,准差, 与与 是只参加测验是只参加测验y y被试的平均数和标准被试的平均数和标准差,差, 与与 是锚测验向全体被试是锚测

18、验向全体被试t t施测得到的平均施测得到的平均数和标准差,数和标准差, 与与 是既参加测验是既参加测验x x又参加锚测又参加锚测验被试的平均数和标准差,验被试的平均数和标准差, 与与 是即参加测验是即参加测验y y又参加锚测验被试的平均数又参加锚测验被试的平均数和标准差,和标准差, 是测验是测验x x对测验对测验v v的回归系数,的回归系数, 是是测验测验y y对测验对测验v v的回归系数。的回归系数。心理测量学心理测量学如果两组被试能力有差异,这四项估计值为:如果两组被试能力有差异,这四项估计值为:式中,式中, 、 、 与与 分别是各个测验的信度系数。分别是各个测验的信度系数。 本章小结心理

19、测量学心理测量学 测验等值是测验公平性的保证,其在测验测验等值是测验公平性的保证,其在测验实施、编制与结果分析,题库的建立,不同单实施、编制与结果分析,题库的建立,不同单位、地区、时间所测学科成绩的比较等方面,位、地区、时间所测学科成绩的比较等方面,都是极为必要的。都是极为必要的。本章小结心理测量学心理测量学 如果不进行等值处理,不同时间举行的考如果不进行等值处理,不同时间举行的考试的成绩之间不具备可比性,评价标准或证书试的成绩之间不具备可比性,评价标准或证书授予标准会受到试卷难度起伏的影响。这种状授予标准会受到试卷难度起伏的影响。这种状况,不仅影响到选拔效率和人员素质,而且对况,不仅影响到选

20、拔效率和人员素质,而且对考生也是很不公平的。考生也是很不公平的。本章小结心理测量学心理测量学 等值研究的意义并不局限于保证考试公平。等值研究的意义并不局限于保证考试公平。今天,为了避免命题和试卷编制中的盲目性和今天,为了避免命题和试卷编制中的盲目性和偶然性,国内许多考试机构都在致力于建设题偶然性,国内许多考试机构都在致力于建设题库。实现基于项目反应理论(库。实现基于项目反应理论(Item Response Item Response TheoryTheory,简称,简称IRTIRT)的题目参数等值是建设科)的题目参数等值是建设科学化、大规模题库的前提。学化、大规模题库的前提。 本章小结心理测量学心理测量学 基于经典测验理论(基于经典测验理论(Classical Tesing Classical Tesing TheoryTheory,简称,简称C CT TT T)之上的等值方法只能实现)之上的等值方法只能实现不同试卷之间的等值,满足不同试卷之间的等值,满足“试卷库试卷库”建设的建设的需要,很难实现在统一的量尺上标定试题难度需要,很难实现在统一的量尺上标定试题难度和区分度的任务,很难满足大规模题库建设的和区分度的任务,很难满足大规模题库建设的需要。需要。v经典测验理论的试题参数依赖于样本,试题参数随经典测验理论的试题参数依赖于样本,试题参数随考生的群体不同而变化。考生的群体不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论