第四章 教育测量的质量指标-效度_第1页
第四章 教育测量的质量指标-效度_第2页
第四章 教育测量的质量指标-效度_第3页
第四章 教育测量的质量指标-效度_第4页
第四章 教育测量的质量指标-效度_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、效度的意义一、效度的意义 效度(效度(ValidityValidity)测量结果测量结果的的准确性准确性和和有效性有效性的的程度程度 一个测验或量表实际能测出其所要测量的特性的程度 记为:r rxyxy一、效度的意义一、效度的意义 第一,效度始终是针对一定的测量目的而言的。第一,效度始终是针对一定的测量目的而言的。 第二,效度是针对测量结果而言的。第二,效度是针对测量结果而言的。 第三,效度只有高或低的程度上的差异。第三,效度只有高或低的程度上的差异。 第四,评价一个测量是否有效要多角度、多方第四,评价一个测量是否有效要多角度、多方面地收集证据。面地收集证据。 第五,教育测量中,效度问题比

2、在其他领域的第五,教育测量中,效度问题比在其他领域的测量中更为重要。测量中更为重要。一、效度的概念一、效度的概念 这是因为:这是因为: 教育测量的对象大多是精神现象,只能通过对其教育测量的对象大多是精神现象,只能通过对其具有可测性的外部表现(如语言或动作等)的测量,具有可测性的外部表现(如语言或动作等)的测量,以间接认识其心理活动、心理特征或知识水平等。以间接认识其心理活动、心理特征或知识水平等。 学生的心理活动、心理特征与其外部表现之间,学生的心理活动、心理特征与其外部表现之间,一般仅具有相关关系而无函数关系,外部行为并不一般仅具有相关关系而无函数关系,外部行为并不能准确无误地反映某种心理状

3、态。能准确无误地反映某种心理状态。 教育测量的对象不是物而是有主观能动性的人。教育测量的对象不是物而是有主观能动性的人。人能有意识地调节自己的外部行为,掩盖自己的内人能有意识地调节自己的外部行为,掩盖自己的内心活动,这就增加了认识其精神现象的难度。心活动,这就增加了认识其精神现象的难度。二、效度的统计定义及其与信度的关系二、效度的统计定义及其与信度的关系1 1、效度的统计学原理、效度的统计学原理w在实际测量中,影响效度的主要因素是系统误差。在实际测量中,影响效度的主要因素是系统误差。因而在讨论效度时,还必须把真分数方差分解为两因而在讨论效度时,还必须把真分数方差分解为两个部分,一是潜在真分数方

4、差(个部分,一是潜在真分数方差(V V2 2),另一部分),另一部分是系统误差分数方差(是系统误差分数方差(I I2 2) ,它与由随机误差引,它与由随机误差引起的变异(起的变异(E E2 2)不同。)不同。) 22() 12(2222222公式因而,公式EIVxIVT公式即:)之比,)实得分数方差(潜在真分数方差(定义为所以可以将效度222222222222x2V) 32(1)(xIxxxEIxEIxxVxyxyrrr2 2、效度与信度的关系、效度与信度的关系V2I2E2V2I2E2V2I2E2根据公式(根据公式(2-22-2)和()和(2-32-3),可将效度与信度的关),可将效度与信度的

5、关系图解于后:系图解于后:根据分析,可得结论如下根据分析,可得结论如下:1)1)高信度是高效度的必要条高信度是高效度的必要条件,而非充分条件。件,而非充分条件。2)2)效度系数不会大于信度系数的效度系数不会大于信度系数的平方根。平方根。可以用下式表示:可以用下式表示:)公式(42xxxyrr高效度、高信度高效度、高信度低效度、高信度低效度、高信度低效度、低信度低效度、低信度三、效度的类别与分析验证法三、效度的类别与分析验证法 19741974年美国心理学会发行的年美国心理学会发行的教育和心教育和心理测量的标准理测量的标准一书将效度分为三大类:一书将效度分为三大类: 内容效度:侧重于测验题目取样

6、的代表性,内容效度:侧重于测验题目取样的代表性,考查这些题目对所欲测量的内容和行为反应考查这些题目对所欲测量的内容和行为反应测量的有效程度。测量的有效程度。 结构效度:侧重于一个测验的能够测量到心结构效度:侧重于一个测验的能够测量到心理学和教学理论上的抽象概念和特质的程度。理学和教学理论上的抽象概念和特质的程度。 效标效度:侧重于测验分数预测我们所关心效标效度:侧重于测验分数预测我们所关心的外在行为的准确程度。的外在行为的准确程度。三、效度的类别与分析验证法三、效度的类别与分析验证法 琳恩和格朗兰德提出效度的四个向度,琳恩和格朗兰德提出效度的四个向度,即内容即内容内容效度、效标关联效度、构想内

7、容效度、效标关联效度、构想效度和效度和结果效度结果效度。(一)内容效度及其分析方法(一)内容效度及其分析方法 内容效度内容效度(Content validityContent validity)又称合理效度或逻辑程度,是指测验内容或行又称合理效度或逻辑程度,是指测验内容或行为取样的代表性和适当程度;即实测内容和预为取样的代表性和适当程度;即实测内容和预定测验内容之间的一致性程度。定测验内容之间的一致性程度。 估计内容效度的方法:估计内容效度的方法: 逻辑分析法(定性的方法)逻辑分析法(定性的方法) 统计分析法(定量的方法)统计分析法(定量的方法)(一)内容效度及其分析方法(一)内容效度及其分析

8、方法 逻辑分析法(定性的方法)逻辑分析法(定性的方法) 依据教材内容、教学大纲的范围以及教学目标分析测验内容,依据教材内容、教学大纲的范围以及教学目标分析测验内容,检查测验内容究竟在体现教材内容和教学目标方面达到多大程检查测验内容究竟在体现教材内容和教学目标方面达到多大程度度 对每一道题目逐一进行审查,以此形成对每一道题目逐一进行审查,以此形成“题目双向细目表题目双向细目表” 与与“命题双向细目表命题双向细目表”加以对照,以确定试卷的效度加以对照,以确定试卷的效度 统计分析法(定量的方法)统计分析法(定量的方法) 克龙巴赫法(两套测验试题,对相同被试实施测试后,计算得克龙巴赫法(两套测验试题,

9、对相同被试实施测试后,计算得分的相关系数)分的相关系数) 评分一致性考查法(不同评分者之间评分的一致性程度,即考评分一致性考查法(不同评分者之间评分的一致性程度,即考查评分者信度)查评分者信度) 前后测对比法(根据前后两次测验的差异显著性,确定测验的前后测对比法(根据前后两次测验的差异显著性,确定测验的内容效度)内容效度)(二)结构效度的验证方法(二)结构效度的验证方法 结构效度结构效度是指一个测量能实际测量出理论上的是指一个测量能实际测量出理论上的构想或心理特性的程度。它的目的在于用心理构想或心理特性的程度。它的目的在于用心理学的概念来说明分析测验分数的意义,也就是学的概念来说明分析测验分数

10、的意义,也就是说从心理学的理论观点就测验的结果加以解释说从心理学的理论观点就测验的结果加以解释和探讨。和探讨。 这里的这里的结构结构的含义是心理学理论所涉及的抽象的含义是心理学理论所涉及的抽象而属假设性的概念、构想、特性或变量,如智而属假设性的概念、构想、特性或变量,如智力、焦虑、机械能力倾向、成就、动机等。力、焦虑、机械能力倾向、成就、动机等。(二)结构效度的验证方法(二)结构效度的验证方法 建立理论框架建立理论框架 从理论框架出发,提出各种假设从理论框架出发,提出各种假设 根据假设编制测验根据假设编制测验 以逻辑及实证的方法,检验结果是否符合心理学的理以逻辑及实证的方法,检验结果是否符合心

11、理学的理论框架及其假设论框架及其假设 比如:中学生数学能力的研究比如:中学生数学能力的研究 数学能力由分析能力、综合能力、归纳和演绎能力、数学能力由分析能力、综合能力、归纳和演绎能力、运算能力、空间想象能力构成;数学能力与早期教运算能力、空间想象能力构成;数学能力与早期教育有关;数学能力与智力正相关。育有关;数学能力与智力正相关。 编制测验,施测并收集测验结果编制测验,施测并收集测验结果 分析测验结果,考查测试的结构效度,考查测验结分析测验结果,考查测试的结构效度,考查测验结果是否支持理论构想果是否支持理论构想(三)效标关联效度的估计方法(三)效标关联效度的估计方法 效标:检验测验效度的外在的

12、、客观的标准,效标:检验测验效度的外在的、客观的标准,即效度的标准即效度的标准 效标效度,也称为效标关联效度,也称为实证效标效度,也称为效标关联效度,也称为实证效度效度 验证方法是指一个测验对处于特定情境中的个验证方法是指一个测验对处于特定情境中的个体行为进行预测时的有效性体行为进行预测时的有效性 例:例: 高考成绩预测大学学习成绩高考成绩预测大学学习成绩 能力倾向测验预测工作成效能力倾向测验预测工作成效(三)效标关联效度的估计方法(三)效标关联效度的估计方法 分类:分类: 同时效度:测验分数与效标资料的取得约在同一时同时效度:测验分数与效标资料的取得约在同一时间内连续完成,这两种资料的相关系

13、数即为同时效间内连续完成,这两种资料的相关系数即为同时效度度 目的:诊断现状目的:诊断现状用全国高考的成绩作为效标来检验高中毕业生会考的成绩,计用全国高考的成绩作为效标来检验高中毕业生会考的成绩,计算两者之间的相关系数就是会考的同时效度算两者之间的相关系数就是会考的同时效度 预测效度:测验分数取得一段时间后才获得效标资预测效度:测验分数取得一段时间后才获得效标资料,计算这两种资料间的相关系数料,计算这两种资料间的相关系数 目的:预测某个个体将来的行为目的:预测某个个体将来的行为而用大学一年级的成绩作为效标来检验高考的成绩,计算两者而用大学一年级的成绩作为效标来检验高考的成绩,计算两者的相关系数

14、就是高考的预测效度。的相关系数就是高考的预测效度。效标效度的估计方法 相关法相关法直接计算测验分数与效标分数的相关系数直接计算测验分数与效标分数的相关系数 积差相关、等级相关、二列相关等积差相关、等级相关、二列相关等 显著差异法显著差异法根据效标测量将被试分为两个极端组,检验这两个组测验分数是根据效标测量将被试分为两个极端组,检验这两个组测验分数是否具有统计学上的差异显著性否具有统计学上的差异显著性 命中率命中率当测验用作取舍决策时,常使用命中率当测验用作取舍决策时,常使用命中率相关概念:总命中率、正命中率、负命中率相关概念:总命中率、正命中率、负命中率总命中率高,则测试的效度高总命中率高,则

15、测试的效度高例:例: 7070人参加的考试,通过测验选取了人参加的考试,通过测验选取了5050人,淘汰了人,淘汰了2020人;选出的人中有人;选出的人中有4040人合格,淘汰的人中有人合格,淘汰的人中有8 8人不合格。该测验的总命中率、正命中率人不合格。该测验的总命中率、正命中率和负命中率分别是多少?和负命中率分别是多少?1 1、用积差相关系数的方法估计效度、用积差相关系数的方法估计效度 积差相关积差相关,是计算两个变量线性相关的一种方法,由英国统计,是计算两个变量线性相关的一种方法,由英国统计学家学家皮尔逊皮尔逊提出,因此也称为皮尔逊提出,因此也称为皮尔逊(Pearson)(Pearson)

16、相关。要使用相关。要使用积差相关必须同时积差相关必须同时具备如下几个条件具备如下几个条件: 两个变量都是由测量获得的连续性数据,即等距或等比数据。两个变量都是由测量获得的连续性数据,即等距或等比数据。 两个变量的总体都呈正态分布,或接近正态分布,至少是单两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称分布,当然样本并不一定要正态。峰对称分布,当然样本并不一定要正态。 必须是成对的数据,而且每对数据之间是相互独立的,即各必须是成对的数据,而且每对数据之间是相互独立的,即各自互不影响,本条件是难以检验的。自互不影响,本条件是难以检验的。 两个变量之间呈线性关系。一般用描绘散点图的方式来观

17、察,两个变量之间呈线性关系。一般用描绘散点图的方式来观察,最好是先各自转化为最好是先各自转化为Z Z分数,单位会统一些。分数,单位会统一些。例:例: 某中学数学教研组的教师积多年的教学法经验,认为刚入某中学数学教研组的教师积多年的教学法经验,认为刚入高中的学生学习立体几何感到困难的主要原因是空间想像力高中的学生学习立体几何感到困难的主要原因是空间想像力弱。弱。 为了证明这个论点,他们让刚入高中的为了证明这个论点,他们让刚入高中的103103名学生作名学生作1010道道题,测量其空间想像力。为避免知道了某些学生的刚入高中题,测量其空间想像力。为避免知道了某些学生的刚入高中时的成绩影响以后考试的评

18、分,试卷暂不评阅。立体几何学时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学完后,进行考试,按得分多少把成绩分为五等(完后,进行考试,按得分多少把成绩分为五等(A A、B B、C C、D D、E E)分别得)分别得5 5、4 4、3 3、2 2、1 1分。这时才评阅入学时的试卷,统分。这时才评阅入学时的试卷,统计出期末得计出期末得5 5、4 4、3 3、2 2、1 1分者在入学测验中分别答对分者在入学测验中分别答对1 1道题道题至至1010道题的人数(见表道题的人数(见表2-12-1)。)。 就现有资料,用什么方法可以判断教师们的意见是否正确?就现有资料,用什么方法可以判断教师们的意见是否

19、正确?表2-1:(答对的题数)1 2 3 4 5 6 7 8 9 10 所评的等级ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 1解:(1)设期末考试的等第为y,空间想像力测验答对的题数为x,列出二重交叉次数分布表:X(答对的题数)1 2 3 4 5 6 7 8 9 10 Y所评的等级ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 1w1 3 2 1 11 1 2 1 125313296合计2 4 10 14 20 20 17 9 5 2103(2)用

20、积差相关系数公式计算效度系数:验的得分和的题数与期末测是指刚入学测验中答对标准差。是期末测验各人得分的对题数的标准差,是刚入学的测验各题答人得分平均数,是期末测验中的人数的平均数,道题道题到是刚入学的测验中答对式中公式fxySSyxssyxNfxyryxyx103101)42(/12. 1/)(58. 3103619232331425510394. 1103/ )55. 510(2)55. 52(4)55. 51 (255. 5103210591034221101/)(22222 NyyfSSyySxxNxxfSSyyxxx标准差。是期末测验各人得分的)(人得分平均数,是期末测验中)(道题的人

21、数的平均数,道题到是刚入学的测验中答对对题数的标准差,是刚入学的测验各题答式中预测效度,前者对后者有一定的学习成绩有较高的相关体几何间想像力测验成绩与立相关系数较大,表明空) 3(699. 012. 194. 158. 355. 5103/22032203) 15( 1) 510(2) 59(4) 58 ( 5) 57(10) 56( 3) 55( 1 xyrfxy二列相关二列相关 适用于两个变量就其实际含义而言是适用于两个变量就其实际含义而言是等距或等比数据,它们服从正态分布,等距或等比数据,它们服从正态分布,其中一列人为地划分为两类。其中一列人为地划分为两类。时的纵高。中从左到右概率值为指

22、的是在整个正态曲线。比,的次数占总次数的百分是二分称名量表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式pypqpSXXypqSXXrtqptqpb1015)-(2 点二列相关点二列相关 适用于一列数据为等距或等比且总体服从正态分布(实适用于一列数据为等距或等比且总体服从正态分布(实际上只需要单峰对称分布,如分布),另一列变量是际上只需要单峰对称分布,如分布),另一列变量是按事物的性质划分为两类的变量,也可以是一个双峰分按事物的性质划分为两类的变量,也可以是一个双峰分布,人为划分为两类,如文盲与非文盲。这种相关系数布,人为划分为两类,如文盲与

23、非文盲。这种相关系数多用于测验中评价题目的区分度。对选择题、判断题在多用于测验中评价题目的区分度。对选择题、判断题在整个测量中作用作出判断。整个测量中作用作出判断。 基本计算公式:基本计算公式:。比,的次数占总次数的百分是二分称名量表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式pqpSXXpqSXXrtqptqppb1016)-(2 例:有一位教师自编了一套测验题,用来预测学生例:有一位教师自编了一套测验题,用来预测学生一年后的某科成绩,自编测验按百分制评分,一年一年后的某科成绩,自编测验按百分制评分,一年后考试评分只把学生分为及格者和不及

24、格者。试就后考试评分只把学生分为及格者和不及格者。试就所获资料估计自编测验的预测效度。所获资料估计自编测验的预测效度。 解:解:1)1)把两次测验成绩成对排列:把两次测验成绩成对排列:被试者被试者1 12 23 34 45 56 67 78 89 91010 1111121213131414自编测验自编测验的成绩(的成绩(X X)6767 1010 20 44 60 43 61 10 26 23 30 18 35 2320 44 60 43 61 10 26 23 30 18 35 23一年后考一年后考试成绩(试成绩(Y Y)1 1 1 0 0 1 1 0 1 0 0 1 1 11 1 1 0

25、 0 1 1 0 1 0 0 1 1 12)计算出二列相关公式所需统计量计算出二列相关公式所需统计量:绩。不能用来预测学生的成极低,个测验结果的预测效度相关系数极小,说明这)代入公式计算得:。比,的次数占总次数的百分是二分称名量表中一种量值的标准差。是该例连续变量全部变平均数。”相对应的连续变量的”或“是二分名称变量中“或公式0.007 36. 064. 0125.1840.3367.33336. 01,64. 01491125.1840.335302310604467.33923351067016)-(2 pbttqpqptqppbrpqppqpSSXXXXpqSXXr四、提高效度的方法四、

26、提高效度的方法 (一)各种效度系数的要求(一)各种效度系数的要求 (二)影响效度的因素(二)影响效度的因素 (三)提高效度的方法:(三)提高效度的方法: 1、控制系统误差、控制系统误差 2、精心编制量表、精心编制量表 3、妥善组织测验、妥善组织测验 4、扩充样本的容量和代表性、扩充样本的容量和代表性 5、合理处理效度和信度的关系、合理处理效度和信度的关系 6、适当增加测验的长度适当增加测验的长度表表2.1 测验长度与信度和效度的关系测验长度与信度和效度的关系题数题数与原测验题数之比与原测验题数之比信度系数信度系数效度系数效度系数1020306012014048012361214480.3000

27、.4620.5620.7200.8370.9110.9540.4000.4960.5480.6190.6680.6790.713第三节 难度及其计算 一、难度的概念一、难度的概念 1 1、难度是指测量试题的难易程度。、难度是指测量试题的难易程度。 在教育测量中,客观题的难度一般用正确回在教育测量中,客观题的难度一般用正确回答试题的人数与参加测验的总人数的比值来答试题的人数与参加测验的总人数的比值来表示。其公式为:表示。其公式为: 例如:在例如:在100100个学生中,答对第一题的个学生中,答对第一题的3030人,人,答对第二题的答对第二题的6060人,这两道题的难度分别是人,这两道题的难度分别

28、是多少?多少?NRp 2 2、难度对测验的影响、难度对测验的影响 1)测验难度影响分数的分布形态。 难度值越接近0,测验的难度就越大,测验分数就越是集中在低分端,其分数分布越呈现正偏态;反之,难度值越接近1.00,其难度就越小,测验分数越集中在高分端,分数分布呈负偏态。 2)测验难度影响测验分数的离散程度 测验难度过大过小,都会造成测验分数偏离正态分布,从而使分数的全距缩小,使测验分数的离散程度变小。 3)测验难度影响测验的鉴别能力 在测验中,考生之间相互配对比较的可能性越多,就越有利于准确地鉴别考生的不同能力。3 3、测验的适宜难度、测验的适宜难度 难度在难度在0.500.50左右的试题能组

29、成考生之间最多的左右的试题能组成考生之间最多的配对比较次数,能使测验分数的离散指数达到配对比较次数,能使测验分数的离散指数达到最大值,并能有效地造成测验分数的正态性。最大值,并能有效地造成测验分数的正态性。这有两层意思:这有两层意思: 一是测验中的各试题的难度,均应在一是测验中的各试题的难度,均应在0.500.50左右;左右; 二是测验中的试题的难度在二是测验中的试题的难度在0.2-0.80.2-0.8之间,平之间,平均难度应在均难度应在0.500.50左右。左右。二、难度的计算 (一)计算难度的基本公式(一)计算难度的基本公式 3 3、整个试卷的难度计算、整个试卷的难度计算 试卷的难度是指一

30、份试卷的总体难易程度,其试卷的难度是指一份试卷的总体难易程度,其由试卷中每道题的难度决定。由试卷中每道题的难度决定。 其计算办法为:将每道题目的难度与满分值相其计算办法为:将每道题目的难度与满分值相乘的积相加,然后将其总和除以试卷的满分值,乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的难度。所得的商即为整个试卷的难度。二、难度的计算 (一)计算难度的基本公式(一)计算难度的基本公式 1 1、客观题难度的计算、客观题难度的计算 NRp 2 2、主观题难度的计算、主观题难度的计算表示此题的满分。)题上的平均得分,表示所有考生在某一道(KKXXp P表示难度指标,N表示参加考试的总

31、人数,R表示答对某道客观题的人数。(二)用极端分组法计算试题的难度(二)用极端分组法计算试题的难度 1 1、用极端分组法计算客观题的难度、用极端分组法计算客观题的难度 具体步骤如下:具体步骤如下: 1 1)先按测验总分的高低,按由高到低的顺序依次排)先按测验总分的高低,按由高到低的顺序依次排列试卷。列试卷。 2 2)从得分最高的一份试卷开始依次向下选出全部试)从得分最高的一份试卷开始依次向下选出全部试卷的卷的27%27%作为高分组;从得分最低的一份试卷开始依作为高分组;从得分最低的一份试卷开始依次向上选出全部试卷的次向上选出全部试卷的27%27%作为低分组。作为低分组。 3 3)按计算公式计算

32、难度)按计算公式计算难度为低分组的难度)为高分组的难度,(L2pppppHLH例题例题:在在100100名学生中,高分组与低分组名学生中,高分组与低分组各有各有2727人。其中高分组答对第一题的有人。其中高分组答对第一题的有2020人,低分组答对第一题的有人,低分组答对第一题的有1010人。这人。这道题的难度为多少?道题的难度为多少?计算计算 解:依据客观题极端分组法计算公式解:依据客观题极端分组法计算公式0.56 227102720 2LHppp2 2、用极端分组法计算论文试题难度、用极端分组法计算论文试题难度步骤如下:步骤如下:1 1)按测验得分排列试卷,确定高分组与低分组,)按测验得分排

33、列试卷,确定高分组与低分组,各占总人数的各占总人数的25%25%(方法同前)。(方法同前)。2 2)分别为高分组、低分组编制每道试题的分析表。)分别为高分组、低分组编制每道试题的分析表。3 3)按下列公式计算难度,)按下列公式计算难度,为最低分。是这道题的最高分,表示总人数的为低分组得分总和,为高分组得分总和,LH%25X)(22LnXLHnnLXXpHLH例:某道论文题,高分组得分总某道论文题,高分组得分总和为和为4040分,低分组得分总和为分,低分组得分总和为1515分,有分,有4040人参加考试,这道题最人参加考试,这道题最高得分为高得分为8 8分,最低得分为分,最低得分为2 2分,分,

34、则此题的难度为多少?则此题的难度为多少?(0.125)计算计算 解:依据主观题极端分组法计算公式解:依据主观题极端分组法计算公式 =0.125 28%254022%254021540 )(22LHnnLXXpLH第四节区分度及其计算 一、区分度的意义一、区分度的意义 (一)区分度(一)区分度(Discrimination)是指测验对考)是指测验对考生实际水平的区分程度,用符号生实际水平的区分程度,用符号D表示。又叫鉴表示。又叫鉴别力,它是评价试题质量,筛选试题的主要指标别力,它是评价试题质量,筛选试题的主要指标与依据。与依据。 区分又分为正(或积极)区分(区分又分为正(或积极)区分(D0),零

35、区分),零区分(D0)和负(或消极)区分()和负(或消极)区分(D0)。)。 区分度的高低直接影响到测验的信度和效度。区分度的高低直接影响到测验的信度和效度。(二)区分度与测验信度、难度的关系 1 1、区分度与信度的关系(见下表、区分度与信度的关系(见下表2.22.2) 这里是假定全部试题的难度均为这里是假定全部试题的难度均为0.500.50时所预测的信度系数。时所预测的信度系数。 区分度指的是平均值。区分度指的是平均值。 可见,要想达到理想的测验信度,提高区分度是一可见,要想达到理想的测验信度,提高区分度是一 个好办法。个好办法。区分度区分度信度信度0.12250.12250.160.160

36、.200.200.300.300.400.400.500.500.000.000.420.420.630.630.840.840.9150.9150.9490.949(二)区分度与难度的关系 表表2.32.3D D的最大值与试题难度的关系的最大值与试题难度的关系 由上表可知,难度适中,可使区分度达到最大值。由上表可知,难度适中,可使区分度达到最大值。难度难度区分度的最大值区分度的最大值1.001.00.90.90.70.70.50.50.30.30.10.10.00.00.00.00.20.20.60.601.001.00.60.60.20.200000二、区分度的计算 (一)用极端分组法计算

37、区分度(一)用极端分组法计算区分度 1、客观题区分度的计算:、客观题区分度的计算: DPH PL注:将被试依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组。) 2、主观题区分度的计算:、主观题区分度的计算:为最低分。是这道题的最高分,表示总人数的为低分组得分总和,为高分组得分总和,LH%25X)(LnXLHnXXDHLH二、区分度的计算 (一)用极端分组法计算区分度(一)用极端分组法计算区分度 1 1、客观题区分度的计算:、客观题区分度的计算: DPH PL(D D为区分度,为区分度,PhPh为高分组通过率,为高分组通过率,PlPl为低分组为低分组通过率。

38、)通过率。)(注:将被试依照总分从高到低排列,然后将总(注:将被试依照总分从高到低排列,然后将总分最高的分最高的27%27%和最低的和最低的27%27%的被试分别定为高分的被试分别定为高分组和低分组。)组和低分组。)二、区分度的计算二、区分度的计算 (一)用极端分组法计算区分度(一)用极端分组法计算区分度 3、整个试卷的区分度计算 试卷的区分度是指一份试卷总体对学生的区分程度。 其计算办法为:将每道题目的区分度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的区分度。(二)用内部一致性系数计算区分度(二)用内部一致性系数计算区分度 极端分组法分析通常只在教师编制的课堂测

39、绘极端分组法分析通常只在教师编制的课堂测绘中使用。在标准化的或大规模的测验中,多采中使用。在标准化的或大规模的测验中,多采用相关法分析试题的内部一致性。用相关法分析试题的内部一致性。 由于测验总分属于连续变量,测验项目(试题)由于测验总分属于连续变量,测验项目(试题)多属二分称名变量(对、错或通过、不通过),多属二分称名变量(对、错或通过、不通过),所以,用相关法计算区分度时,多采用点二列所以,用相关法计算区分度时,多采用点二列相关、二列相关、相关、二列相关、系数等方法计算相关系数。系数等方法计算相关系数。P80P80页第页第1414题题某学科测验,某学科测验,1010名被试得分情况如表名被试

40、得分情况如表3-203-20所示:所示: 被试被试题目题目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8P80P80页第页第1414题题某学科测验,某学科测验,1010名被试得分情况如表名被试得分情况如表3-203-20所示:所示: 1 1、

41、计算第、计算第1 1、5 5题的难度与区分度;题的难度与区分度; 2 2、用高低分组法计算第、用高低分组法计算第2 2、6 6的难度与的难度与区分度。区分度。 3 3、计算该测验的信度。、计算该测验的信度。P80P80页第页第1414题题某学科测验,某学科测验,1010名被试得分情况如表名被试得分情况如表3-203-20所示:所示: 被试被试题目题目01 02 03 04 05 06 07 08 09 10123456782 2 0 2 0 0 2 0 2 20 2 2 0 2 0 0 2 0 20 0 2 2 2 0 2 0 0 00 2 0 0 2 0 0 2 2 05 7 4 6 6 2

42、 4 5 3 46 5 5 4 7 1 6 2 4 511 14 9 10 16 5 12 8 10 1310 16 8 12 15 6 15 11 9 8总分总分34 48 30 36 50 14 41 30 30 34P80P80页第页第1414题题某学科测验,某学科测验,1010名被试得分情况如表名被试得分情况如表3-203-20所示:所示: 被试被试题目题目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4总分总分34 48 30 36 50 14 41 30 30 341、计算第、计算第1、5题的难度与区分度;题的难度与区分度; P1=R/N=6/10=0.6;P5=4.6/7=(假定这道题的满分为7分) 被试被试题目题目01 02 03 04 05 06 07 08 09 10152 2 0 2 0 0 2 0 2 25 7 4 6 6 2 4 5 3 4总分总分34 48 30 36 50 14 41 30 30 345 . 08 . 981.9410/ )3 . 67 .203 .153 . 137 . 43 .1327 . 0(5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论