




已阅读5页,还剩347页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,教育统计与测量2014年1月,.,2,本讲义教材,1.王孝玲、赵必华:教育统计学,北师大出版社,2008年版。2.王孝玲:教育测量,华东师大出版社,2005年修订版。3.黄光扬:教育测量与评价,华东师大出版社,2002年版。,.,3,本讲义主要参考书目:1.扈涛:教育统计学,河南大学出版社,2004年版。2.张奇:SPSSforWindows在心理学与教育学中的应用,北京大学出版社,2009年版。3.戴海崎、黄光扬:教育统计与测量自学辅导,广东高等教育出版社,2000年版。4.黄光扬:教育统计与测量评价综合教程,福建科技出版社,2003年版。5.张厚粲、徐建平:现代心理与教育统计学,北师大出版社,2003年版。6.胡中锋、李方,教育测量与评价,广东高等教育出版社,1999;7.王汉澜主编,教育测量学,河南大学出版社,1987;8.漆书清:教育统计与测量,广东高等教育出版社,1999年版。9.金娣、王刚:教育评价与测量,教育科学出版社,2002年版。10.王景英:小学教育统计与测量,人民教育出版社,2002年版。11.周谦、李国岚:教育评价与统计,科学出版社,1997年版。12.雷新勇:大规模教育考试:命题与评价,华东师范大学出版社,2006年版。13皮连生:学与教的心理学,华东师范大学出版社,1997年版。14广东省考试中心:2004年广东高考年报,广东高等教育出版社,2005年版。15广东省考试中心:2005年广东高考年报,广东高等教育出版社,2005年版。16.魏华忠、周仁来、马健生:教育统计与测量,辽宁师范大学出版社,2003年版。17.宋志刚、谢蕾蕾、何旭洪:21世纪高等学校计算机规划教材SPSS16实用教程,人民邮电出版社,2008年版。18.张文彤等:SPSS统计分析基础教程,高等教育出版社,2004年版。19.郑日昌等:心理测量学,人民教育出版社,1999年版。20.RobertL.LinnNormanE.Gronlund著,国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组译,教学中的测验与评价,中国轻工业出版社,2003年版。,.,4,引用案例中的主要文献:1希建华、赵国庆:“概念图”解读:背景、理论、实践及发展,开放教育研究,2006年1期。2张丽萍、王嫣:用概念图解读合作学习,比较教育研究,2008年1期。3陶美重:高等教育消费市场发展趋势,大学教育科学,2008年3期。4石欧、周本回:我国研究生教育快速发展背景下的结构缺陷及其对策,现代大学教育,2008年4期。5王芳、杨培:寄宿制与非寄宿制高中生社会适应性的比较,现代中小学教育,2008年2期。6吴根洲:高考综合科目考试科学性之实证研究,上海教育科研,2008年8期。7王晓华:论高等教育自学考试试题难度的控制,中国考试,2008年1期。8张晋军:国家职业汉语能力测试题材型效度分析研究,中国考试,2008年2期。9廖平胜:论考试的本质与功能,考试研究,2002年1期。,.,5,本讲义引用案例中的主要参考文献:1.西南大学周玲老师的讲义教育统计学。2.福建师大黄光扬老师的讲义教育统计与测量评价。3.人大经济论坛调查问卷专版,详细出处参考:/bbs/viewthread.php?tid=4124082.小组-游戏-竞赛法TGT(图4);3.切块拼接法Jigsaw(图5);4.共学式LT(图6);5.小组调查法GI(图7).四、结语,.,40,.,41,.,42,.,43,.,44,.,45,.,46,.,47,高等教育消费市场发展趋势,一、学生(或家庭)高等教育消费趋于理性二、适龄人口下降意味着生源市场在缩小(表1)三、大学学费的不断樊升使得居民家庭支付能力相对减弱(表2、表3应为图、表4)四、非传统教育机构的不断涌现,.,48,.,49,.,50,.,51,.,52,我国研究生教育快速发展背景下的结构缺陷及其对策,前言(表1)一、我国研究生教育之结构缺陷(一)在学位层次上,硕士研究生教育发展不够(表2);(二)在学位类型上,存在一定程度的重科学学位,轻专业学位;(三)在培养方式上,在职研究生教育发展不够;(四)在学位专业上,存在一定程度的与社会发展脱节(图1、图2);(五)在区域布局上,学位点分布和研究生培养不平衡(表3、表4);,.,53,我国研究生教育快速发展背景下的结构缺陷及其对策,二、克服我国研究生教育结构缺陷的几点对策(一)大力发展硕士教育,适度发展博士教育(表5、表6);(二)大力发展专业学位和非全日制研究生教育;(三)积极调整区域布局,加强西部地区研究生教育。,.,54,.,55,.,56,.,57,.,58,.,59,.,60,.,61,.,62,第一讲描述统计,五、集中量数(一)集中量数定义表示一组数据典型水平或集中趋势的量。它反映频数分布中大量数据向某一个量集中的情况。,.,63,第一讲描述统计,上图中,A、C两曲线的中心位置一致,而B曲线的中心位置位于A、C曲线右侧。描述曲线中心位置的量即集中量。,.,64,第一讲描述统计,(二)算术平均数定义所有观察值的总和除以总频数所得之商。,.,65,第一讲描述统计,(三)加权平均数定义是不同比重数据(或平均数)的平均数。或:,.,66,第一讲描述统计,练习1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期中考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?练习2:某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩?,.,67,第一讲描述统计,练习1解:练习2解:,.,68,第一讲描述统计,六、差异量数(一)差异量数定义差异量就是表示离散趋势的量。可用于表示一组数据的离散或变异的程度,反映数据分布范围的情况。,.,69,第一讲描述统计,(二)方差和标准差方差:是一组数据离差平方的算术平均数,即方差可由离差的平方和除以数据个数所得。标准差:是方差的算术平方根。,.,70,第一讲描述统计,.,71,第一讲描述统计,例:某班甲组在一次测验中的成绩分别为65,68,71,72,74。求其标准差。,.,72,第一讲描述统计,解:,.,73,第一讲描述统计,(三)差异系数差异系数是一个相对差异量,当平均数相差较大时,要使用相对差异量比较数据的差异程度。差异系数:是指一组数据的标准差与算术平均数的百分比。它是没有单位的相对数。用CV表示差异系数。,.,74,第一讲描述统计,(四)平均数与标准差、差异系数的应用(1)平均数之间可以进行横向(班与班、班与年级等)或纵向比较。但需要注意在进行纵向比较时测验的难度要相同或相近,否则不宜直接比较。(2)平均数相同时,可以用标准差比较数据的差异程度;平均数相差较大时,可以用差异系数比较数据的差异程度。(3)合理解释、运用差异系数,结合优秀率、良好率、合格率(优率+良率+合格率及格率)、不及格率等指标,对改进教学提出建议。,.,75,第一讲描述统计,例如:假设有A、B两班,每班各50人,两班的平均分相同,差异系数B班大于A班。如何解读(教学建议)?,.,76,第一讲描述统计,B班减小差异系数的做法:提高及格率。A班:提高优秀率。(思考:是为了保持小的差异系数而保持现状,还是宁愿差异系数大些,也要提高优秀率?),.,77,.,78,第一讲描述统计,对箱体图的说明:1.成绩分布非正态时,考查数据的离散程度。2.还可以了解不同题型或不同大题学生成绩的离散情况,有针对性地指导。3.平均数不同时,差异是否显著要进行统计检验(常用t检验、方差分析),但需要满足抽样分布的条件,并注意样本容量的选择。比如,可以比较两个班级某科平均成绩的差异,比较某班与年级某科平均成绩的差异,抽样比较两校或多校某科平均成绩的差异,等等。,.,79,第一讲描述统计,七、地位量数(一)地位量数的意义描述或确定某一观测值在全体数据中所处的位置的量数,就叫地位量数。,.,80,第一讲描述统计,(二)正态分布的意义一种连续型随机变量的概率分布。,.,81,.,82,标准正态分布曲线的特征,(1)正态曲线在横轴上方(Z=0)均数处最高,Y值最大;(2)正态分布以Z=0为中心,左右对称。(3)正态曲线从Y最高点向左右缓慢下降,并无限伸延,但永不与基线相交。Y值永远不为0。(4)曲线的平均数Z=0,标准差=1时,基线上曲线包含从Z=-3到Z=3之间几乎有6个标准差的距离;(5)曲线在1处各有一个拐点,在该点内向下向内弯;在该点外向下向外弯。(6)正态曲线下的面积分布有一定的规律。,.,83,采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计算总体单位分布及其标志值变异范围的主要依据,下图说明了这一点。,(1)变量值在【-,+】之间的概率为0.6826。(2)变量值在【-2,+2】之间的概率为0.9546。(3)变量值在【-3,+3】之间的概率为0.9973。,.,84,第一讲描述统计,(三)标准分数的定义以标准差为单位标准,某一分数离开团体均数的距离。,Z=,或Z=,.,85,第一讲描述统计,对标准分数的理解:Z分数大于零,表示分数X在平均数以上;Z分数小于零,表示分数X在平均数以下;Z分数等于零,表示分数X与平均数相等;Z分数的绝对值表示某分数与在此分布上的平均数的距离,绝对值越大,表示某分数离开均数的位置越远。,.,86,第一讲描述统计,练习:东东和西西在语文和数学的测试中所得分数如下表,已知样本的平均数和标准差,试求东东和西西语文和数学成绩的标准分数。,.,87,第一讲描述统计,.,88,第一讲描述统计,东东和西西谁学习好呢?继续:东东数学80分,语文80分,西西数学90分,语文70分。已知样本平均分数学80分,语文60分,数学标准差5分,语文标准差10分。谁学习好呢?思考1:不同学科的原始分数可比吗?思考2:不同学科的标准分数可比吗?思考3:不同学科的原始分数直接相加在什么情况下会与标准分数的评价结果趋于一致呢?,.,89,第一讲描述统计,(四)标准分数的应用1.可将原始分数转换成标准分数(如上例)2.可用于确定分数线练习:某一考区考生为20万人,决定录取4万人,考试成绩平均分为450分,标准差为59.52分,问录取分数线应该定为多少?569分以上的有多少人?,.,90,第一讲描述统计,解:=4/20=0.2,要录取20%的考生。查表,=0.3时,=0.84,450+0.8459.52=500(分),录取线为500分。=(569-450)59.52=2,=0.47725(0.5-0.47725)200000=4550(人),.,91,3.学习能力平面图,.,92,.,93,第一讲描述统计,讨论:原始分与标准分孰优孰劣?,.,94,第一讲描述统计,原始分较适合目标参照性测验,表示目标达成程度。不足之处:不能准确地表达某一成绩在全体考生中所处的相对地位,不同课程的考分、不同次的考分不能直接比较。标准分的优点在于可以精确地表示某一考生的考试成绩在全体考生中所处的相对位置,原始分转化为标准分,学生可以根据标准分对自己的考试成绩进行横向和纵向比较,而比较时无需考虑考试的难易程度及考分的离散程度。标准分更适合于选拔性考试的记分。不足之处:标准分存在负数和小数;标准分是相对分数,不能用于表示教学目标达成程度,一般的水平测试也不一定需用标准分来表示。,.,95,第一讲描述统计,八、相关量数(一)相关量数的概念反映两列变量相互变化一致性程度的量数叫相关量数。(二)相关关系的概念两个变量之间不精确、不稳定的变化关系称为相关关系。,.,96,第一讲描述统计,(三)相关关系的分类1.按变化方向分正相关、负相关、零相关2.按变化的密切程度分高度相关、中度相关、低度相关(四)相关系数1.定义:用来描述两个变量相互之间变化方向及密切程度的数字特征量,用r来表示。2.数值范围:-1r+1最常用的是积差相关系数。,.,97,第一讲描述统计,(五)积差相关1.积差相关的概念当两个变量都是正态连续变量,而且两者之间呈线性相关时,表示这两个变量之间的相关称为积差相关。2.积差相关的使用条件(1)连续性数据两列变量都是由测量获得的连续变量;(2)呈正态分布两列变量的总体呈正态分布,或接近正态分布;(3)数据必须成对,数据与数据间独立;(4)呈线性关系;(5)样本容量要大于等于30。,.,98,第一讲描述统计,3积差相关系数的计算(1)定义公式:,r=,.,99,.,100,.,101,第一讲描述统计,(2)原始分数公式,.,102,第一讲描述统计,(六)等级相关1.等级相关的概念等级相关是指以等级次序排列或以等级次序表示的变量之间的相关,这种相关方法对变量的总体分布不作要求,因此又称这种相关为非参数相关。其主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。,.,103,第一讲描述统计,2斯皮尔曼等级相关的概念及使用条件当两列变量值是以等级次序排列或以等级次序表示时,且两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。由于这种相关是英国心理学家、统计学家斯皮尔曼根据积差相关推导出来,因此人们把这种等级相关称为斯皮尔曼等级相关,故有人认为斯皮尔曼等级相关是积差相关的一种特殊形式。,.,104,第一讲描述统计,3斯皮尔曼等级相关系数的计算方法,.,105,例:对8名教师进行了两项测验,两项测验的成绩分别记为X、Y,这是8名教师在两项测验上的名次(见表11-1),他们两项测验成绩的等级相关系数是多少?,解:,.,106,第二讲推断统计,一、假设检验(一)假设检验的基本思想1小概率原理(实际推断原理):认为概率很小的事件在一次试验中实际上不会出现,如果小概率事件在一次试验中出现了,就被认为是不合理的。,.,107,第二讲推断统计,2基本思想:先对总体的参数或分布函数的表达式做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的(条件)小概率事件。如果试验或抽样的结果使该小概率事件出现了,这与小概率原理相违背,表明原来的假设有问题,应予以否定,即拒绝这个假设。若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个假设,表明试验或抽样结果支持这个假设,这时称假设与实验结果是相容的,或者说可以接受原来的假设。,.,108,第二讲推断统计,3显著性水平与否定域小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取=0.05,0.01等。为检验的显著性水平(检验水平)。在假设检验过程中,描写小概率事件的统计量的取值范围称为该原假设的否定域(拒绝域),否定域的边界称为该假设检验的临界值。否定域的大小,依赖于显著性水平的取值,一般说来,越小,否定域也越小,这时原假设就越难否定。,.,109,双侧检验的P值,双侧检验的P值,.,110,第二讲推断统计,(二)假设检验的步骤1提出待检验的原假设和备择假设H0:某一数值H1:某一数值2选择检验统计量,并找出在假设成立条件下,该统计量所服从的分布,形如:3根据所要求的显著性水平和所选取的统计量,确定一个合理的拒绝H0的条件(常用的值有0.01,0.05)4由样本观察值计算出统计检验量的值,若该值落入否定域,则拒绝原假设,否则接受原假设5.结论。回应检验结果,说明把握率及失误率,.,111,第二讲推断统计,(三)总体平均数的显著性检验(一个总体均值的显著性检验)1.已知时,Z检验统计值公式:,.,112,第二讲推断统计,练习1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7分。现以同样的试题测验应届毕业生,并从中随机抽18份试卷,算得平均分数为69分。问该校应届与历届毕业生汉语拼音测验成绩是否一样?,.,113,第二讲推断统计,.,114,第二讲推断统计,练习2:一名英语教师在其任教的二年级随机抽取一个班进行新教学方法改革实验,该班48名学生用新教学方法教学,其他各班用原教学方法教学。学期结束,全年级考试平均成绩为74分,标准差为12分。该实验班平均成绩为78分。试检验该教师用新教学方法教学的效果。,.,115,第二讲推断统计,.,116,第二讲推断统计,练习3:某区进行一次外语考试,全区平均成绩为73分,标准差为13分。对参加考试的一所重点学校随机抽查81名参加考试学生的成绩,平均成绩为77分。请检验该重点中学的平均成绩与全区平均水平差异是否显著?,.,117,第二讲推断统计,2.未知时,t检验(单一样本t检验,实践中多为t检验)统计值公式:,.,118,第二讲推断统计,例:已知4岁正常男童平均体重为15.6千克,从某幼儿园中随机抽取20名4岁男童,其平均体重为16千克,标准差为1.76千克,试问该幼儿园4岁男童的体重与4岁正常男童平均体重有无显著性差异?,.,119,第二讲推断统计,.,120,.,121,第二讲推断统计,(四)平均数差异的显著性检验(两个总体均值的显著性检验)1.两个独立样本平均数差异的显著性检验独立样本:指随机抽取的两个样本之间没有关系。,.,122,第二讲推断统计,(1)已知时,Z检验统计值公式:,.,123,第二讲推断统计,例:高考结束后,从A省抽取80名考生,数学平均成绩84分,从B省抽取100名考生,数学平均成绩79分,已知A省标准差12分,B省标准差11分。试问两省数学高考成绩有无显著差异?,.,124,第二讲推断统计,.,125,第二讲推断统计,(2)未知时,t检验(两个总体方差一致或相等,否则不行。是否齐性是需要先行检验的。)(独立样本t检验)统计值公式:,.,126,第二讲推断统计,例:某校进行一次速度测验,选择男生22人、女生18人参加。男生测验平均分为72分,标准差为8分,女生测验平均分为70分,标准差为7.6分。试问男女生速度测验的平均结果有无显著性差异?,.,127,第二讲推断统计,.,128,.,129,第二讲推断统计,2.两个相关样本平均数差异的显著性检验(n是成对个数)1已知时,Z检验统计值公式:,.,130,第二讲推断统计,例:某地两年内进行了两次物理竞赛,两次竞赛的标准差分别为12分和14分,某校有10名学生先后两次都参加了竞赛,成绩分别为74分和70分,这10名学生竞赛成绩的相关系数为0.76,试问该地两次物理竞赛成绩有无显著性差异?,.,131,第二讲推断统计,.,132,第二讲推断统计,2未知时,t检验(相关系数已知)(相关样本t检验)统计值公式:,.,133,第二讲推断统计,例:某实验小组进行一项学习方法实验,在实验前,经过精心匹配,分成两个组,一为实验组,一为对照组,各组均为20人。实验结束后,对两组均进行了智力测验,经计算,其智商成绩分别为,实验组平均智商为109,标准差为16;对照组平均智商为104,标准差为15,两组测验的相关系数为0.75,试问该学习方法对提高智力是否有显著影响?,.,134,第二讲推断统计,.,135,.,136,第二讲推断统计,二、方差分析(一)方差分析的基本原理方差分析依据的基本原理是变异的可加性,即把实验数据之间的总的差异分解为若干个不同来源的分量。具体地说,它是将总的离差平方和分解为n个不同来源的离差平方和,然后根据每个离差平方和的大小来确定它们对总的离差平方和的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。方差分析主要用于推断多个总体均数之间有无显著差异。,.,137,第二讲推断统计,(二)单因素完全随机设计方差分析举例例:研究者从某年级四个平行班中各随机抽取若干名被试进行英语课外辅导训练(每班用一种训练方法)。训练后期进行统一测试,结果如下,问四种训练方法的效果是否有显著性差异?,.,138,.,139,第二讲推断统计,.,140,.,141,第二讲推断统计,.,142,第二讲推断统计,.,143,.,144,第二讲推断统计,三、2检验(一)2检验的意义1.2检验的定义2检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。2.2检验的基本公式,.,145,第二讲推断统计,32检验的类型(1)配合度检验(2)独立性检验(二)配合度检验1配合度检验的意义主要用于实际观测次数与某理论观察次数是否存在显著性差异的分析。它适用于一个因素分为多个水平(分类)的计数数据。,.,146,第二讲推断统计,2.配合度检验的基本步骤(1)建立假设:H0:f0-fe=0或f0=feH1:f0-fe0或f0fe(2)理论次数的计算:根据概率和经验计算(3)确定自由度:k为分类数或组数dfk1(4)计算2值(5)作出推断,.,147,第二讲推断统计,举例:经民意调查,得到市民对某措施的意见呈赞成、不置可否和反对三种,其抽样情况分别如表:市民对政府意见的情况表,.,148,解:(1)提出假设Ho:持三种态度人数相等;H1:持三种态度人数不相等.(2)由于按态度分成三类,总人数为600人,所以,各类人数平均为:600/3=200。(3)df=3-1=2(4)2=117.25(怎样计算出来的?)(5)统计决断由df=3-1=2,查2分布值表:2(2)0.01=9.21,2=117.259.21=2(2)0.01;P0.01,拒绝零假设,接受备择假设。,.,149,.,150,第二讲推断统计,(三)独立性检验1独立性检验的意义主要是检验两个或两个以上因素多项分类的计数资料是独立还是相关的问题。2独立性检验的步骤,.,151,.,152,第二讲推断统计,举例:某班45名男女生全部参加大学英语四级水平考试,其结果如表所示,问男女生在英语学习水平上有无显著性差异?男女生四级英语考试成绩比较表,.,153,解:(1)提出零假设Ho和备择假设H1;Ho:男女生在英语学习水平上没有显著性差异;H1:男女生在英语学习水平上有显著性差异;(2)根据计算理论频数的公式,计算出各个实际频数相对应的理论频数,在表中小括号内;男女生四级英语考试成绩比较表,.,154,(3)df=(3-1)x(2-1)=2(4)选择检验统计量公式,并计算其值:,=1.658(5)结果与解释由df=(3-1)x(2-1)=2,查2分布值表:2(2)0.05=5.99,2=1.6585.99=2(2)0.05;P0.05,拒绝备择假设,接受零假设。男女生在英语学习水平上没有显著性差异.,2=,=,.,155,.,156,.,157,.,158,.,159,.,160,.,161,.,162,.,163,.,164,.,165,.,166,.,167,.,168,.,169,.,170,.,171,.,172,.,173,.,174,.,175,寄宿制与非寄宿制高中生社会适应性的比较,一、引言二、研究方法1.研究对象(表1)2.研究工具(1)青少年社会适应性问卷(SAQ)(2)SPSS11.5统计软件包三、结果1.寄宿制学生和非寄宿制学生社会适应性的差异比较(表2、表3)2.年级间的差异比较(表4、表5)3.男女生的差异比较(表6、表7)四、讨论,.,176,.,177,.,178,.,179,.,180,.,181,.,182,.,183,第三讲教育测量基本问题,一、教育测量(一)测量的定义测量是根据法则给事物分派数字。(史蒂文斯)测量这一定义包含了三个要素:1法则给事物的属性分派数字的依据2事物属性测量的对象或目标3数字描述事物属性的符号,.,184,第三讲教育测量基本问题,例:对学生的数学运算能力进行测量,.,185,第三讲教育测量基本问题,(二)测量量表1测量三要素(1)参照点:为测定事物的量,事先确定的计量起点参照点有两种:绝对零点和相对零点(2)单位:单位是我们用于计算的标准(3)量表:量表一般称为测量的工具,它是具有一定单位和参照点的连续体,.,186,第三讲教育测量基本问题,2四种测量量表(1)名称量表(类别量表)最低水平的一种量表(2)等级量表(顺序量表)(3)等距量表(4)比率量表最高水平的一种量表,.,187,第三讲教育测量基本问题,讨论:(1)五级记分表示的操行评定属于何种测量量表?允许哪些算术运算?(2)百分制分数表示的学科成绩从理论上来说属于何种测量量表?允许哪些算术运算?(3)教育测量的结果属于哪一种测量量表?,.,188,第三讲教育测量基本问题,(三)教育测量的定义1教育测量的概念广义概念:测量的对象包括教育领域内的所有现象或问题。狭义概念:测量的对象仅仅局限于学科知识或技能。教育测量,就是针对学校教育影响下的学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。,.,189,第三讲教育测量基本问题,2教育测量的特点(1)测量的间接性和推断性(2)测量对象的模糊性和测量误差的不可避免性(3)教育测量具有明确的目的性,.,190,第三讲教育测量基本问题,二、教育测量的质量指标衡量教育测量的质量,可采用四个指标:信度主要对整个测量而言效度难度主要对测量的项目而言区分度,.,191,第三讲教育测量基本问题,(一)信度1信度的定义所谓测验的信度就是同一个测验(或相等的两个、多个测验)对同一组被试施测两次或多次,所得结果的一致性程度。也即测验的可靠性。一个测验的信度一般是以两次测验结果的相关系数来表示。,.,192,第三讲教育测量基本问题,2信度的估计方法(1)再测信度以同一个测验对同一组被试先后施测两次,所得结果的相关系数就是再测信度。计算再测信度的基本模式为:测验A1-适当时距-测验A2,.,193,第三讲教育测量基本问题,练习:用一个算术四则的速度测验12个小学生,得分记为X1,为了考察测量结果的可靠性,于3个月后再测一次,得分记为X2,问测验结果是否可靠?学生123456789101112X1202021222323232425262627X2202121202323252526262729,.,194,.,195,.,196,.,197,第三讲教育测量基本问题,注意:信度的取值范围为0,1,当信度值较大时,说明前后两次测量结果比较一致;两次测验之间的时间间隔要适宜。应由测验的性质、测题类型、测题数量和被试特点所决定;再测法适用于速度测验而不适用于难度测验;应注意提高被试者的积极性。,.,198,第三讲教育测量基本问题,再测信度的优点:它最符合重复测验的涵义,是重复测验最简单最明确的方式。首测和再测只需要一套测验题目,比编制两套等值测验题目要省力、省时。同一套题目无论施测几次,所测量的属性完全相同。,.,199,第三讲教育测量基本问题,再测信度的缺点;同一组被试对同一个测验先后两次作答相互之间是不独立的。如果两次施测的时间间隔较长,在此期间被试身心的发展,新知识的获得,都会使两次测验结果不相同。同一个被试对同一个测验先后作答两次,一般来说,在第一次作答时,测验对被试的吸引力较大,而第二次作答时,往往由于被试对测验失去了兴趣而造成两次测验结果的不相一致。,.,200,第三讲教育测量基本问题,被试在两次施测时的主观状态,如身体健康、疲劳、睡眠、测验焦虑、态度、情绪等,不可能完全相同。两次施测的环境,如温度、湿度、光线、通风等条件不同,也都是产生测量误差的因素。,.,201,第三讲教育测量基本问题,再测信度的适用范围:再测信度适用于异质性测验;再测信度适用于速度测验;再测信度适用于运动技能测验,.,202,第三讲教育测量基本问题,(2)复本信度同一组被试在复本测验上所得结果的相关系数就是复本信度。所谓复本测验是指在性质、内容、题型、题数、难度等方面都一致(相等)的两份或多份测验。计算复本信度的基本模式为:测验A1-最短时距-测验A2,.,203,第三讲教育测量基本问题,练习:以A、B两型英语复本测验对初中三年级10个学生施测,为避免由测验施测顺序所造成误差,其中5个学生先做A型测验,休息15分钟后,再做B型测验;而另5个学生先做B型测验,休息15分钟后,再做A型测验。10个学生A型测验结果记为X1,B型测验结果记为X2,其测验的复本信度如何?学生12345678910X119191817161515141312X220171818171513151212,.,204,.,205,根据公式(3l),计算表32的第4、5、6列,并将有关数据代入公式(31),则初三英语复本信度(即等值系数)为:,.,206,第三讲教育测量基本问题,注意:复本信度使用前提条件要有两份或以上真正平行的测验,即在题目内容、数量、形式、难度、区分度、指导语、时限以及所用例题、公式和测验等其他方面都相同或相似;被试有条件接受两个测验。,.,207,第三讲教育测量基本问题,复本信度的优点:由于测题数目的增加,对于与所欲测量的属性相联系的行为总体的代表性增强。测验的两个复本,如果在不同的时间使用,其信度既可以反映在不同时间的稳定性,又可以反映对于不同测题的一致性。它反映了两个层面的信度。两个复本在同时使用时,可以避免再测信度的一些缺点。,.,208,第三讲教育测量基本问题,复本信度的缺点;编制两个完全相等的测验是很困难的。被试同时接受性质相似的两个测验,可能减少完成测验的积极性。虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。,.,209,第三讲教育测量基本问题,复本信度的适用范围:复本信度适用于难度测验;复本信度适用于速度测验。,.,210,第三讲教育测量基本问题,(3)内在一致性信度测验内部(即测题之间)的一致性信度,也称为内在一致性系数。分半信度分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则,将试题分成两半,或者将从易到难排列的测题,按照测题序号,奇数测题为一组,偶数测题为一组,分成两半;然后计算每个被试在两个分半测验分数的积差相关系数;再用斯皮尔曼布朗公式加以校正。斯皮尔曼布朗公式为,.,211,例:一个测验向15名被试施测,被试在奇偶分半测验上的得分如下表所示,计算该测验的分半信度系数。,15名被试在奇偶分半测验上的得分,.,212,第三讲教育测量基本问题,解:计算两个“半测验”得分的积差相关系数为0.86。代入公式得:所以,该测验的分半信度系数为0.92。,.,213,第三讲教育测量基本问题,.,214,第三讲教育测量基本问题,克龙巴赫(cronbach)系数当测验题型较多、并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计算公式为:式中,表示所有被试在第i题上得分的方差,表示所有被试各自总分的方差,为题目数。,.,215,第三讲教育测量基本问题,注意:分半信度使用前提在施测一次或没有复本的情况下使用;一个测验分半方法多,所以会有多个分半信度。,.,216,第三讲教育测量基本问题,内在一致性信度的优点:对同一组被试只要施测一次就可以求出信度系数,应用时既方便又可以避免再测信度的缺点。折半测验的两个部分,相当于一个测验的两个复本。所以折半信度具有同时性复本信度的优点,只不过是测题经过折半后,数量减少了。,.,217,第三讲教育测量基本问题,内在一致性信度的缺点;将一个测验分成内容、形式、题数、平均数、标准差、测题间相关、分布形态都相等的两部分,实际上是很困难的。分半的方法不同,估计出的信度系数也有所不同。若用斯皮尔曼一布朗公式对折半信度进行校正,会高估了测验的信度。,.,218,第三讲教育测量基本问题,内在一致性信度的适用范围:内在一致性信度适用于同质性测验;内在一致性信度适用于难度测验。,.,219,第十一章教育测量与评价的质量特性,(4)评分者的信度以评分者所评分数之间的相关系数来表示的信度,故称为评分者的信度。评分者之间的信度有三种估计方法。积差相关或等级相关估计法,.,220,第十一章教育测量与评价的质量特性,如果每一份测验结果都是由两位评分者按照各自的评分标准记分,其评分者的信度,可以用每份测验结果两个分数之间的相关系数来表示。若两位评分者都是以连续性分数记分,则可以用积差相关系数来计算。,.,221,第十一章教育测量与评价的质量特性,如果每一份测验结果,是由两位评分者以等级进行评定,其评分者之间的信度,可以用每份测验结果的两个等级之间的等级相关系数来表示。其计算公式为(斯皮尔曼等级相关系数):,.,222,第十一章教育测量与评价的质量特性,肯德尔和谐系数当K个评分者对n个测验结果进行评定时,可以用肯德尔和谐系数(多列等级相关)表示K个评分者信度。计算公式为:,.,223,第十一章教育测量与评价的质量特性,系数估计法当两个以上评分者用连续性记分法对一组被试的测验结果评定时,评分者的信度可用系数来估计。,.,224,第十一章教育测量与评价的质量特性,评分者的信度与其它几种信度的区别评分者的信度是两个或几个评分者之间对于同一组测验结果评定的一致性程度。再测信度是被试对同一个测验先后两次测验成绩的一致性程度。它反映的是被试的信度。复本信度是被试在两个等值测验上成绩的一致性程度。它反映的是测验的信度。内在一致性信度与复本信度相似,反映的也是测验的信度。,.,225,第三讲教育测量基本问题,3提高信度的方法(1)影响测量信度的主要因素被试方面主试方面施测情境方面测量工具方面两次施测的间隔时间方面,.,226,第三讲教育测量基本问题,(2)提高测量信度的常用方法测验应保持具有一定的长度;测验的难度适当;测验具有较好的区分度;测验的评分要客观;测验程序统一;增加被试之间的差异。,.,227,第三讲教育测量基本问题,(3)信度系数达到多少才可接受一个测验只有在很多情况下被证实有较高的信度时,才可以说该测验是可靠的;一般能力和学业测验要到达0.9以上;兴趣、人格等要达到0.80-0.85。,.,228,第三讲教育测量基本问题,(二)效度1效度的定义效度指的是测量的有效性,即一个测验或量具能够测量出其所要测量的东西的程度。在教育测量过程中,效度问题尤为重要。这是因为:效度始终是针对一定测量目的而言的;效度只有程度上的差异;效度是针对测量结果而言的;评价一个测量是否有效要多角度、多方面地收集证据。,.,229,第三讲教育测量基本问题,2效度的估计方法(1)内容效度内容效度是指测验对所要测量的内容的代表性程度。内容效度的分析方法主要有:逻辑分析法其工作思路是请有关专家对测验题目与原定内容范围的吻合程度作出判断。,.,230,第三讲教育测量基本问题,反映测验内容与测验目标关系的双向细目表统计分析法对同一组被试用一个测验的两个复本在某一学科教学或训练前后实施测验,该测验内容的有效性可以由两次测验成绩差异的显著性来加以判断。,.,231,第三讲教育测量基本问题,表面效度与内容效度表面效度指的是在被试或非专业人士看来,测验表面上是否在有效地测量着应测特质的程度。,.,232,命题双向细目表示例1,.,233,命题双向细目表示例2,.,234,第三讲教育测量基本问题,(2)结构效度结构效度是指测验对于人的心理特性或理论概念测量到的程度。,.,235,第三讲教育测量基本问题,建立结构效度的步骤:A提出理论假设;B根据假定结构拟定测题,编制测验;C以测验结果为根据来验证假设结构中的各种因素是否成立。,.,236,第三讲教育测量基本问题,结构效度的验证方法实验法通过控制某些实验条件,观察其对测验分数的影响,从而获得结构效度的信息。,.,237,第三讲教育测量基本问题,举例构想:考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”。有一个焦虑测验,考察这测验是否有构想效度。设计几种试验情境:,.,238,第三讲教育测量基本问题,设计1:比较不同重要性考试时该测验的分数:按照构想,重要考试时焦虑分数高平时考试中实施此焦虑测验重要考试之前实施该焦虑测验比较两次分数,如重要考试前的焦虑分数显著提高,就说明这个测验对测量考试焦虑是有效的。,.,239,第三讲教育测量基本问题,设计2:举行两场考试,使被试相信一场考试关系重大,一场考试无关要紧;挑选两组被试,高焦虑组和低焦虑组;比较考试成绩,出现下述情况,说明测验有构想效度:焦虑分数高组学生,如在第一场考试中成绩比平时有所下降,在第二场考试中却能正常发挥。焦虑分数低组学生,无论在哪场考试都发挥正常。,.,240,第三讲教育测量基本问题,设计3:收集被试在经历一场重大考试时的生理心理参数作为焦虑的指标;将其同焦虑测验分数比较;相关高证明焦虑测验测量了焦虑这个特质。,.,241,第三讲教育测量基本问题,(3)效标关联效度效标关联效度是指测验分数与作为效标的另一独立测验结果之间的一致程度。这里所说的“另一独立测验结果”是用以估计本测验的效度的标准,故称效标。效标关联效度分为两种:效标与本测验分数同时获得的,称为同时效度或并存效度;效标在本测验之后相当时间获得的,称为预测效度。,.,242,第三讲教育测量基本问题,效标关联效度的估计方法主要有:积差相关法二列相关法点二列相关法等级相关法列联相关法命中率,.,243,第三讲教育测量基本问题,3提高效度的方法(1)影响测量效度的因素测验的构成(要素)测验实施方面(过程)被试主观状态方面估计效度所依循的效标样本方面,.,244,第三讲教育测量基本问题,(2)提高测量效度的方法控制系统误差;精心编制量表;妥善组织测验;扩大样本容量;合理处理信度与效度的关系;适当增加测验的长度。,.,245,第三讲教育测量基本问题,(3)效度系数达到多少才可接受两种不同的标准测验之间的效度系数或者两种不同的智力测验之间的效度系数应达到0.60-0.80之间;智力测验分数与教师对学生智力等级评定之间的效度系数应在030-050范围内;相同科目的标准测验成绩与教师对学生名次排列之间的效度系数应达到060-0.70之间。,.,246,4.信度与效度的关系,信度是对测量的一致性程度的估计,效度是对测量的准确性程度的估计。一致性与准确性的关系可以用射击靶环来说明。假设有A、B、C三支枪,对准靶面中心固定位置后各射9次,所得结果如图:,.,247,第三讲教育测量基本问题,A枪弹着点十分分散,说明一致性和准确性都不好;B枪弹着点虽然比较集中,但偏离靶心,说明一致性好,准确性差;C枪弹着点全部集中在靶心,说明一致性和准确性都好。信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。信度低,效度不可能高。信度高,效度未必高。效度低,信度很可能高。效度高,信度也必然高。,.,248,第三讲教育测量基本问题,(三)难度1难度的定义难度是指测题的难易程度。表示测题难易程度的数量,称为测题的难度指数,一般用P来表示。2难度的计算(1)客观题难度的计算P=,.,249,第三讲教育测量基本问题,(2)主观题难度的计算P=(3)高低分组法(包含0、1记分及非0、1记分)(4)整卷难度P=平均分/整卷满分P各题难度指数的加权平均数(权数:各题满分值),.,250,第三讲教育测量基本问题,练习:某区域1000人参加考试,试卷第一题高分组180人答对,低分组60人答对,求该题难度?如果该题满分为10分,高分组得分总数为2100分,低分组得分总数为830分,求该题难度?,.,251,第三讲教育测量基本问题,3.试题难度的一般评价标准P0.9,非常容易;0.7P0.9,偏易;0.3P0.7,适中;0.1P0为正区分,D0为负区分,D=0为零区分。,.,259,第三讲教育测量基本问题,2区分度的计算(1)高低分组法(包含0、1记分及非0、1记分)D=PH-PL(2)点二列相关法(3)二列相关法(4)积差相关法,.,260,第三讲教育测量基本问题,3区分度的一般评价标准0.2以下应淘汰;0.20.3合格题目,可能需加以改进;0.30.4良好;0.41性能颇佳。,.,261,第三讲教育测量基本问题,4区分度与难度的关系,.,262,第三讲教育测量基本问题,5提高区分度的方法(1)使题目的难度适中,使整个考试难度适中。(2)着重考察复杂的学习结果。(3)掌握区分度的评价标准。,.,263,第三讲教育测量基本问题,五、选择题的选项分析(一)步骤1.根据被试的测验总分排序2.由排序结果确定高分组与低分组3.以表格的形式分别统计高分组、低分组在每个选项的人数或比例,.,264,第三讲教育测量基本问题,.,265,第三讲教育测量基本问题,(二)分析1.正确选项的选答率平均应在0.40.6之间,若选答率过高或过低则可能影响区分度2.干扰项应均有被试选择,若某干扰项选答率过低,则可能错的太明显;反之,若某干扰项选答率过高,则可能是正确答案错误或有两个正确答案3.在正确选项上,高分组得分应明显高于低分组;而在干扰项上,低分组选答率应明显高于高分组4.若某题未作答的人数太多,或各个备选项选答率接近,则说明该题目过难或题意不清,被试无法做答,.,266,第三讲教育测量基本问题,(三)举例某次语文考试有370人参加,四道选择题统计结果如下,试对其选项进行分析。注:37027%100人,.,267,第三讲教育测量基本问题,.,268,.,269,.,270,.,271,第四讲教育考试基本问题,一、教育考试的考试大纲与课程标准的关系二、教育考试与学校教材的关系三、教育考试的方法与学校教学活动的关系四、教育考试的内容与学校教育内容的关系五、考试的目的六、考试的测量目标七、考试的内容领域及行为目标八、考试的题型,.,272,第四讲教育考试基本问题,一、教育考试的考试大纲与课程标准的关系课程标准是考试机构制定考试大纲的基本依据,是教育考试命题的基本依据,但其不能替代考试大纲的作用。考试大纲是教育考试命题的直接依据,也是考试与考生联系的唯一渠道。国家课程标准是国家对学生在某一方面或领域应该具有的素质所提出的基本要求,是一个面向全体学生的标准。,.,273,第四讲教育考试基本问题,每门课程的课程标准均包括以下基本内容:1.本门课程的性质、目标和内容框架;2.指导性的教学原则和评价建议;3.同阶段学生在知识与技能、过程与方法、情感态度与价值观方面应该达到的基本要求。,.,274,第四讲教育考试基本问题,课程标准体系具有三个方面的基本特征:1在课程目标上,要求从知识与技能、过程与方法、情感态度与价值观等多方面设计具体的课程。2在课程内容上,注重密切联系学生的生活和社会经验以及社会、科技发展的现实,强调学生经验、学科知识和社会发展三个方面内容的整合。,.,275,第四讲教育考试基本问题,3在课程要求上,课程标准不仅仅结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学语文阅读策略教学与课外阅读资源开发研究论文
- 高中物理实验教学中的学生自主探究与创新能力培养论文
- 高中化学概念理解与形成性评价体系构建论文
- 中国医用海藻酸盐伤口敷料行业市场前景预测及投资价值评估分析报告
- 艾梅乙质控管理制度
- 苗圃栽培及管理制度
- 茶籽油生产管理制度
- 触电事故应急救援演练方案
- 课程学习心得(20篇)
- 行政案例分析第七章 行政运行案例分析
- 高速铁路客运服务专业人才培养方案
- 《商业银行信用卡业务监督管理办法》试卷及答案
- 常用应用文写作格式
- 空调检测报告
- 变压器实验报告
- 游乐场合作经营合同书
- 神经生理治疗技术
- 浙江温州高速公路瓯北片区招聘高速公路巡查人员考试真题2022
- 江苏苏州工业园区苏相合作区管理委员会机关工作人员招聘13人告5204笔试题库含答案解析
- 三年级下学期音乐复习题
- 电网调度自动化系统调试报告模板
评论
0/150
提交评论