版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教学测量与评价,主 讲 人 杨振曦 化学与生命科学学院 College of Chemistry ,例: 5名被试在某测验上的得分情况,题号,学生,估计同质性信度的方法:,(4) 荷伊特信度,方差分析的思想贯穿其中,测量标准误与测验信度的关系 测量标准误指测验中所得测值偏离真分数的程度,记为SE,它与测验信度系数之间存在如下关系: 式中,rxx表示测量的信度系数,Sx表示观察分数的标准差。 根据测验的信度系数求出测量标准误,从而正确解释各被试的测验分数,是测验信度系数的一个重要应用。 例: 假设某被试在上述测验中得分为70分,根据统计学中区间估计的原理,可以推断出该被试的真正分数有68.26的
2、可能性落在70SE之间,即位于67.32,72.68 之间,同理,有95的可能性落在701.96SE之间,即位于64.75,75.25 之间。,评分者信度 含义:指多个评分者给同一批人的答卷进行评分的一致性程度。 教育与心理测量工作中,客观题无所谓,主观题常常存在误差,有时误差甚至较大。 评分者信度的计算 当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评分数的相关系数,依据数据形式,采用不同的相关系数计算方法。,评分者信度的计算,当评分者人数多于两人时,评分者信度可用肯德尔和谐系数进行估计。 肯德尔和谐系数是表示多列等级变量 相关程度德一种方法,资料的获取采用等级评定的方法
3、,即让K个评价者对N个被试的试卷(或作品)进行等级评定,每个评价者都能对N份试卷(或作品)排出一个等级顺序,于是得到K列等级顺序变量。其计算公式为:,式中,W为肯德尔和谐系数,K为评价者的人数,为被评价的试卷(或作品)个数, S为每一个被评价对象的K个等级之和的离均差平方和,即: Ri为第i 个被评价对象的K个等级之和。,例:肯德尔和谐系数计算说明,可根据K和N查“W显著性检验临界值表”进行检验,评分者信度的计算,等级评定时,若遇到两个或两个以上事物的等级相同,计算肯德尔和谐系数采用下面的修正公式:,式中, , n为相同等级的数目。,例:有相同等级时肯德尔和谐系数的计算,二、测验的效度,衡量测
4、验结果有效性的重要指标,它是指一个测验是否能准确地测量出它所要测量的特质或功能的程度。,效度是指“测验结果”的有效性程度,而不是指测验工具本身,为了方便起见,我们常说“测验的效度”,但实际上应该说“测验结果的效度”更为恰当。 测量的效度愈高,表示测量的結果愈能显现其所欲测量對象的真正特征 效度是针对某种特殊的用途而言的,而不可认为具有普遍性,任何测验都是为了某种特殊的目的而设计的,没有一种测验是对任何测量目的都是有效的。,1.效度的意义,2.效度与信度的关系 效度高,则信度高;信度高,效度未必高,3.效度的类型,内容效度是指测验的试题能否充分代表其所要测量的内容范围,它的检验方法一般是靠专家来
5、评测。 效标关联效度,是指测验成绩对目前或未来某一行为表现的预测力的高低。所谓效标是指检验效度的标准,是某种足以显示测验所欲测量的对象特征的变量。 结构效度,是指测验的结果能以心理学的属性解释的程度,一般用于心理测验。,内容效度 是指测验的试题能否充分代表其所要测量的内容范围,它的检验方法一般是靠专家来评测。 提高内容效度的方法 1、分别列出教材内容的各项重点和所要测量的各类学习结果。 2、根据各项教材重点和各类行为改变的相对重要性而决定它们的权重。 3、编制一个命题双向细目表 4、根据命题双向细目表来编制测验。,效标关联效度,效标关联效度的基本概念 1、效标 (1)效标的定义。效标的检验效度
6、的参照标准,它是指测验所要测量的或所要预测的行为特质,这一行为特质通常均以另一种测验分数或活动来表示。 (2)效标的种类和选择。教育和心理测量中的一些常用效标有:,A、成就测验的效标,可以是学年的平均成绩,教师的评定结果,学习量,对所学知识的应用能力,评判知识的批判能力,自学能力等等。 B、智力测验的效标,可以是学科的成绩,教师的评定结果,学生的总成绩等等。 C、能力倾向测验的效标,可以是特殊课程或特殊训练的成绩,工作或学习中的成绩。 D、职业兴趣的效标,是很难找到的,只能按主试者的主观标准来衡量,或以被试以后或临床资料作为效标。,(3)效标的测量。所谓效标,是成功作为的总体观念,也可以称为观
7、念效标。这个概念必须加以操作上的定义才能进行实际的测量,从而决定测验的效度。 2、预测效度和同时效度 我们可以将效标关联效度进一步区分为预测效度和同时效度。如果效标测量的结果要经过一段时间后才能收集到,就称为预测效度,通过测验分数来预测效标分数,原先的那个测验称为预测原。,如果效标分数和测验分数可以同时得到,那么,称为同时效度。由于效标分数可以同时得到,因而,测验的目的是为了决定测验分数是否可取代效标资料的收集。如果测验分数和效标分数的相关很高,而且测验比实际收集效标资料更有效或更经济,那么,这种取代是有价值的。,三、测试题目的难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,
8、它和区分度共同影响并决定试卷的鉴别性。 难度的计算: (1)P=1x/w x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。 (2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。 (3)极端分组法 P=(XH+XL)2W XH:高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。,四、测试题目的区分度 区分度是区分应试者能力水平高低的指标。 试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。 区分
9、度的计算方法: (1)高低分组法:DPHPL(D代表区分度指数, PH、PL代表高分组和低分组在该题目上的得分率)。 (2)相关法,小组活动:,2010初中科学学业水平考试分析 分小组进行 以小组为单位分析某一类型试题,问题情景:,小明成绩单上的数学测验成绩为92分,科学测验成绩为80分,英语测验成绩76,父母们对此是如何评价的? 学校领导在学期结束时的总结会上说你的教学效果不好,其依据是该学期学生的科学考试平均成绩低于其他学科,你可以为自己辩解吗? 有老师对学生说,你上次科学测验的的成绩是88分,这一次测验就考70分,你为什么退步了?,在教育测量学中,测验直接得到的分数称为“原始分数”,各次
10、测验所得的“原始分数”是不宜直接比较的,更不能由此得出孰优孰劣的结论。,为什么不能用原始分数直接进行比较?,原始分数的两个主要缺陷: 原始分数的起点0是没有明确意义的 学科知识测验得0分并不代表该学生一点知识都不掌握 80分只能说明他在此次测验中答对了80左右的测题内容 分数并不能确切说明考生对知识掌握了多少 测验分数单位的大小无法固定,即不同次测验的每“1”分的价值不同。 一个完整的教育测量过程,最后一个步骤是对测验分数进行转化、解释。 要正确的解释、评价和使用测验的分数,必须借助于某种参照标准才能解释测验分数的含义,从而作出正确的评价。,参照测验的常模资料对被试的测验结果进行解释和评价是最
11、常用的方法。,第四章 教育测验结果的分析,第一节教育测验的常模及其建立方法 第二节 教育测验的标准及其建立方法,一、什么是常模?,在教育测量学中,测验的常模指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上得分的分布状况与结构形式。 例如:在某地区范围内按一定的方法选取600名初中三年级学生科学实验技能测验,据此得到这个测验的常模资料。 参照测验的常模,对测验的分数进行解释与评价实质是通过考查个体的心理特质在某一群体所有成员中的相对位置,来衡量和评价该个体的心理特质。,常模即解释测验分数的参照系,常模的作用,常模是解释分数的参照系 不同学科领域中的表现 能力
12、与成就发展在其团体中的位置 在不同时期的发展变化情况 为建立有意义的常模,需要: 获取一个有代表性的常模团体 常模资料的统计学描述 导出分数 以常模团体的原始分数为基础,用统计学方法,导出一种新的具有特定意义的能反映个体发展在其团体中相对位置状况的分数量表或符号系统,测验常模的主要类型:,发展常模 指某类个体正常发展过程中各个特定阶段的一般水平。包括年龄常模和年级常模。 组内常模指关于一个与被试同类的群体,在某种测验所测特性上的一般表现水平。可以反映每一个体在其同类群体中的相对位置。包括百分等级常模和标准分数常模。,二、年龄常模,年龄常模指某个年龄组所有个体的某种能力特性的正常发展水平。 建立
13、年龄常模资料的方法: 1)基于不同年龄组测试所得的平均分,并与相应的年龄当量联系起来构成年龄常模资料。例如:如果10岁零2个月的常模团体在某个记忆能力测验上平均得24分,则24分被指定为年龄当量102。 2)用一组能使某年龄大多数被试都通过的题目来代表该年龄组的发展水平。例如:8岁小学生中大多数能通过的一组题目,归于8岁年龄组;9岁小学生中大多数能通过的一组题目,归于9岁年龄组,依次类推,即可建立测验的年龄常模。,三、年级常模,1)年级常模的概念:指不同年级学生在某种测验上的正常的一般的表现水平。 2)建立方法:利用某年级学生在某一测验上的平均分和相应的年级当量之间的对应关系来描述该测验的年级
14、常模。 例如:刚上小学四年级的一个有代表性的学生样组在某一“语文阅读技能测验”所得平均分为68分,则给这个分数安排一个4.0的年级当量;刚上小学五年级的一个有代表性的样组,在该测验上的平均分为76分,则给76分安排一个5.0的年级当量。,三、年级常模,年级当量通常用两位表示,第一位为年,第二位为月。若假定1年有10个月在校接收教育,则四年级的年级当量范围为4.0-4.9。 一系列的原始分数(平均值)和与之对应的年级当量便构成了该测验的年级常模表。,三、年级常模,利用年级常模表将原始分数转化为年级当量,如此可通过测验来了解和评价学生的发展。 例如:假定某学生四年级中期的算术、语文、阅读、外语四门
15、学科成就测验的年级当量如下: 算术5.5、语文5.0、阅读6.0、外语4.5 相当不错! 在建立年级当量常模或年龄当量常模时,由于受到条件限制,使得各年级样组间或各年龄样组间的年月跨度较大,为了得到更加细化甚至连续性的常模表,可以采用插值计算和曲线拟合的方法。,例:编制一个包括小学三年级到初中二年级在内的阅读内容的成就测验常模,建立年级常模,就要从6个年级中抽取到代表性被试样组实施测验,如果我们在12月初对全体被试进行一次施测,于次年5月末在对这些被试施测一次,得到如下数据:,3至8年级阅读测验分平均数,例:,曲线拟合 插值计算,阅读测验的年级常模,四、百分等级常模,一个分数的百分等级PR是指
16、在常模团体中低于这个分数的人数的百分比。例如,某测验分数的百分等级是90,这表示在常模团体中有90的人低于此分数。 通过百分等级我们可以了解被试的能力发展在其所属团体中的相对位置。对于同时施测的若干个不同的测验来说,利用各自的百分比常模,可以比较被试在不同科目上的发展状况。 克服了原始分数不能直接比较的缺陷,基于非归类数据建立百分等级常模的方法:,对常模团体施测,得到原始分数,将原始分从大到小依次排列; 进行不同得分点的次数统计; 从低分开始向高分方向,计算各个得分点分数以下的累计次数; 计算各个得分点分数以下的累计次数占总次数的比例; 确定各得分点分数的百分等级PR,即将上一步得到的比例值乘
17、上100。,基于非归类数据建立百分等级常模的方法:,把原始分栏和百分等级PR栏数据提取出来,用一个专门的表来安排这两栏数据,就形成了测验的百分等级常模表。 于是根据常模表,用插值公式计算出任意一个原始分数所对应的百分等级,反之亦可以为任一已知的百分等级,确定其相对应的原始分数。,基于分组归类数据建立百分等级常模的方法:,求测验原分数42分所对应的百分等级PR:,52名学生拼写测验成绩次数分布统计表,五、标准分数常模,标准分数是以标准差为单位表示测验成绩与平均分数之间的距离。即:,与S分别表示常模团体中的N个被试在该测验上的平均分数和标准差。 从定义式可知:标准分数是一种以平均数为参照,以测验分
18、数的标准差来衡量原分数在其常模团体中地位高低的评定方法。,其中,,例:,甲乙丙丁四人在某次语文考试中的得分为:72、60、48、90分,全班的平均成绩为60分,标准差为12分。求四人的标准分数? 某校高二学生期末语文、数学、英语成绩的平均数是80、70、85分,标准差分别是10、15、12分。某学生的三科成绩分别是85、82、90分,问该生三科成绩哪一科最好?,标准分数的线性转换:,标准分数常模的建立方法:,所谓标准分数常模,即通过上述公式在原始分数序列 和标准分数序列 之间或者与标准分数 之间,建立起对应关系,从而形成某种测验的标准分数常模,以便解释其他分数。,标准分数常模示例,标准分数Z的
19、性质和特点,任何一批原始分数,转化为Z分数后,这批Z分数的平均值为0,标准差为1。Z0表示测验成绩在平均数之上,Z0表示测验成绩在平均数之下,Z=0表示测验成绩与平均数相等。 标准分数Z的取值范围在-3到+3之间,Z分数的意义可以用正态分布曲线下的面积比例作出最好的解释。,34.13%,34.13%,13.59%,2.14%,72,0.13%,13.59%,2.14%,0.13%,48,平均分60,96,84,24,36,例:平均分60 标准差12,标准分数Z和百分等级PR之间的关系,测验成绩服从正态分布的情况下,其对应的百分等级PR与一个以标准分数Z为界点的正态曲线左尾部面积比例数相对应。这
20、个对应关系可通过查正态分布表确定。 例:Z=-1时,PR=15.87。Z=1时,PR=84.13 Z=0时,PR=50。Z=1.75时,PR=95.994 ,Z=1.25时,PR=?,标准分数在我国高考中的试点应用,现状:我国现存两种分数制度 原始分数制度 高考标准分制度 原因 高考标准化的重要环节 高考中使用原始分数的局限性 不能反映考试分数相对于团体的位置信息 不同科目/同科不同次考试之间分数可比性差 原始分数制度中,各科分数标准差的大小对各个科目分数在录取中的比重也有一定的影响。,高考标准分制度:,是根据教育统计、教育测量、教育评价等科学原理,按照一定规则把原始分数转化为具有相同意义、相
21、同单位和共同参照点并能刻画考试分数在总体中位置的分数制度。 由常模量表分数(包括全国常模和省常模)、等值量表分数组成。由于高考是全国统一考试,分省录取,故标准分数转换有两种情况。 能准确刻画考生成绩在总体中的位置,使不同学科的成绩能够进行比较,高考成绩通知单,在现行试点使用的高考标准分转换方案中,一律采用正态化转换方案。具体转换步骤如下: (1)将同类考生的学科原始分数从大到小进行排序。 (2)计算每一个分数Xi以下的考生占考生总数的百分比Pi或百分等级PRi。 (3)由每个原始分数对应的百分比Pi或百分等级PRi,利用正态分布表,经过简单计算,即可确定所对应的正态分数Zi,从而得到每一个原始
22、分数所对应的标准分。 (4)进行线性变换,我们确定的量表平均分为500,标准差为100,线性变换公式为: D=500+100Zi 从而得到常模量表分数。,高考标准分转换方法:,讨论:你认为高考录取分数使用何种记分方式更好?说出你的理由。,第二节 教育测验的标准及其建立,教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。,一、对标准参照测验及其“标准”的再认识,心理学家波帕姆提出的定义:标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对被试的测验成绩作出解释的一类测验。 标准参照测验主要关心的问题是要获得严格而精确的领域
23、规范或行为领域规范。,对波帕姆定义的理解,首先在这个领域中像目标、能力及技巧等术语是可以互相换用。 其次标准参照测验所测的内容、行为目标或能力技巧等,必须是明确而详细的。 第三,在一次中测验中测量几种不同的能力时,应该分类。 第四,并不以某个切断分数为参照,通常是把标准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求进行比较。,从定性方面讲,“标准”一词指的是测试的内容或行为的范围,而这个范围是测验分数所参照的,它将通过“内容领域规范”得到明确。 从定量方面讲,从客观上需要确定一个切断点作为分类决断的依据。不管哪一类切断点,它在一定程度上体现“标准”一词的在测量评价功能的定量
24、标准。,常模参照测验与标准参照测验的对比1、两者的共性,(1)都要求说明要测量的成绩的范围 (2)都有恰当的和有代表性的测验题样本 (3)都使用了相同种类的测验题,(4)编制题目的规则是相同的(除题目难度之外) (5)都用同样的质量指标加以判断(效度和信度) (6)都对教育测量与评价是有用的,2、两者的差异,(1)目的有所不同 (2)对题目统计量的考虑有所不同 (3)对描述内容领域规范详略不同 (4)对测量同一学习任务或目标所用题目数量不同 (5)对分数的解释方法有所不同,二、认识几个与标准参照测验相关的概念,第一、领域参照测验是建立一套完整的题目汇编或内容领域规范汇编基础上用以检查被试的素质
25、及发展水平的测验。 第二、目标参照测验是包含和目标相适应的一组题目所构成的测验。 第三、掌握测验是建立一组教学和行为目标上的测验,主要是用于判断学生是否掌握某组给定的教育目标。,测验分数的解释除了常模参照测验解释方法之外,还可以参照的标准对分数进行解释。标准参照测验分数的解释,允许相对独立地描述学生的测验成就而不必参照其它学生的测验表现。,三、标准参照分数的解释,(一)正确百分数,正确百分数是以学生在标准测验中答对题目的比例来解释测验分数或描述学生取得成就的方法。 正确百分数的计算公式: 正确百分数(答对题目数/总题目数)*100,使用正确百分数需要考虑的问题,(1)测验所要测定的内容范围必须
26、明确,而且测验题目组能够成为代表性良好的样本。 (2)在标准参照测验中,可以针对整个测验确定每个学生确定其答案的正确百分数,对学生的内容掌握程度作出判断。,(3)在课堂教学评价以及其它资格证书里面,为了对多层次的测验结果作出解释和描述,需要分别对每一教育目标或内容板块去选择题目组构成总测验。 (4)可以利用学生测验的原始分数和测验总分数之间的关系,计算学生个人所得分百分数,即:得分百分数(测验原始分数/测验原始总分)*100,(二)掌握分数,无论针对每一教学单元的形成性测验,还是针对一门课程的终结性测验,如果要了解与判断学生是否掌握已经学习的内容,要编制一份有内容效度的教育测验来进行测量,这就
27、是所谓的标准分数。,(三)内容等级分数,为了更好的解释教育测验的分数,人们把标准参照测验和常模参照测验结合起来形成的教育测验。,四、标准参照测验的定性标准,测验内容领域规范(书P174) 考试大纲(书P177) 我国高中毕业会考标准的建立模式(书P177),五、标准参照测验的定量标准,专题 调查问卷的设计与实施,教学目的: 1、掌握调查问卷设计的技巧和规则 2、能够设计一份调查问卷 3、能够识别调查问卷的好坏 4、开展问卷调查,第一节 问卷的类型和结构,一、调查的类型与方法 1、调查的定义 对研究对象的历史和现状进行考察,从中获得调查对象的直接资料的方法 2、调查的类型 按目的分: 常模调查、
28、比较调查 按内容分: 事实调查、态度调查 按对象分: 全面调查、抽样调查 按范围分: 综合调查、专题调查 3、调查的方法 访问、问卷、个案、文献,二、问卷的类型及其特点 1、问卷调查的定义 根据研究课题需要 编制成的一套问题表格 由调查对象自填回答 问卷既是一种收集资料的工具 也可作为测量个人行为与态度倾向的测量手段 2、问卷的类型 无结构型问卷 开放式问卷,问题的设置和安排没有严格结构形式,被试可依据本人的意愿作答。 有结构型问卷 封闭式问卷,问题设置和安排具有结构化形式,问卷中提供有限的答案,被试选择作答。,二、问卷的类型及其特点 3、问卷的特点 被试经过思考后才对问卷作出反应 问卷调查适
29、应于大样本和小样本的情况 有利于获得定量资料,三、问卷基本结构,封面信: 指导语: 问题和答案: 其他资料:,一封致被调查者的短信,旨在向被调查者介绍说明调查者身份、目的等内容,用来教被调查者如何正确填答问卷,主体部分,根据具体情况,包括问卷编码、编号、发送和回收日期、调查或审核员名字、被调查者住址等,示例:中小学教师教学设计情况调查问卷 (自然学科),(一)封面信,调查的主办单位或者个人身份(开头或落款处) 调查的内容和范围(概括、明确) 如:我们正在进行XX方面的调查 调查目的(恰当、合理) 如:为了探索解决XX问题的规律,我们举办了此次调查 调查对象的选取方式,加上保密承诺,减少被调查者
30、的 心理压力 如:我们从全市各工厂中随机抽取了一部分工人作为调查对 象 问卷的填答方法、回收方式,致谢,封面信一般说明以下问题:,(一)封面信,亲爱的同学: 您好!我们是06级科学教育班的同学,为了了解大家对我院图书馆的使用情况,我们特邀您参加此项调查,您宝贵的意见和建议将成为我们学习资源建设的重要参考材料。本次调查采取随机抽查不记名的方式,我们对您的回答将予以保密,我们期待能收到您填写完整的问卷,谢谢。,例子大学生留学市场调查问卷封面信,例子我院学生图书馆使用情况调查问卷封面信,亲爱的同学: 您好!AA出国留学服务中心为了了解大学生的出国留学意向,特进行这次问卷调查,请您提供宝贵的意见,它将
31、帮助我们以后为您和您的亲友更好的提供服务,请您在您认为合适的答案的标号上打“”,您所提供的情况,我们将严格保密,谢谢您的合作。,(二)指导语,指导语分为: 卷头指导语:属于“填表说明” 卷中指导语:一般针对具体某个问题作指示,如:请在每一个问题后适合你自己情况的答案序号上划圈,或在“_”处填上适当的内容,如:(可选多个答案),例子: 注: 无特殊说明的情况下,一律只选一项 ! 您心中理想的出国留学或就业地(可以选多种答案):,(三)问题,问题的类型: 有关行为方面的问题 有关态度或者看法方面的问题 有关个人背景的问题,思考一:请判断以下各问题属于哪类问题 1、你家订了几份报纸 2、你认为选择职
32、业最重要的标准是 3、年龄、性别、文化程度、年收入、职业,思考二:三类问题在问卷中的顺序排列上应注意什么,(三)问题,问题的形式 开放式问题:不提供答案;如“您的建议_” 封闭式问题:提供答案以备被调查者选取,思考: 开放式问题与封闭式问题相比各自的优缺点?,(三)问题,1、封闭式问题,又包括以下类型: A.按答案选项的项目分,两项式:答案只有两种,回答者其中选择一项即可,多用于民意测验 如:您是否知道我院每周五晚上播放露天电影?(只选一项) 1.知道 2.不知道 多项选择式:给出的答案至少在两个以上,回答者根据要求选择其一或者选择多项,问卷中最常用的方式 如:您在周末的时候通常都做些什么?(
33、可选多项) 1.看电影 2.上网 3.逛街 4.看电视 5.上图书馆 6.外出打工 7.呆在宿舍 8.不一定,B.按答案回答方式分 顺序式:要求被调查者从备选答案中选出部分或全部答案,并按一定原则进行排序。,例 以下是几个选择出国留学国家的标准,它们在您心目中的重要程度如何?第一重要_,次重要_,第三重要_ 1 生活环境好 4 社会治安良好 2 留学费用合理 5 教学质量高 3 就业率高 6 社会福利好,(三)问题,(三)问题,等级式:对两个以上分成等级的答案进行选择,只能从中选择出一项。常用于满意度(三、五、七项式都可以,一般用五项式)或者一些程度调查,矩阵式/表格式:当询问若干个有相同答案
34、 形式的问题时,可以将这些问题集中在一起 构成一个问题的表达方式,等级式 如:您所教的学生对科学课学习兴趣的状况如何? 有强烈的兴趣 比较有兴趣 兴趣不大 没有兴趣,表格式/矩阵式: 例:,相倚问题:有些问题只适用于样本中的一部分对象,而某个被调查者是否需要回答这一问题常要依据他对前面某个问题的回答结果而定,这样的问题即相倚问题,例:三、您喜欢观看我校的露天电影吗? (只选一项) 1.喜欢 2.一般(请跳至第六题开始) 3.不喜欢 四. (第三题回答“喜欢”者回答:)您喜欢观看我校露天电影的原因? (可选多项) 1.可以促进同学之间的友谊 2. 充实课余生活 3. 既然交了电影费,就去看看 4
35、. 对播放的影片感兴趣 5、喜欢露天播放的形式 五. (第三题回答“不喜欢”者回答:)您不喜欢观看我校露天电影的原因? (可选多项) 1. 电影的时间安排不合理 2.电影播放效果不够理想 3. 电影播放设备不齐全 4.不喜欢露天这种形式 5. 放映环境糟咂,影响观看 5. 对电影的内容不感兴趣,2.开放式问题 3.半封闭式问题,例:您在设计教学时,感到困惑较多的是哪些环节?(可多选) A教学目标的细化 B不了解学生 C教学方法的选择 缺乏资料和条件 E评价方式的设计F教学内容的分析和把握 G 教学目标、内容、策略、评价的整体搭配设计 H其他,请写出_ _,(三)问题,练习:请判断下面这些问题设
36、置的好坏,并说明 你判断的原因,如何修改? 科学发现的过程与人类的创造性有关,你认为是吗? 你是否赞成基础教育不进行改革? 有人认为应提高教师工资待遇来减少乱收费现象,你同意吗? 你所在城市属于什么类型? 你认为目前职工的平均工资水平是否应提高? 您对学校近年来情况的感受是? 你周末用于学习的时间长吗? (单选)(多选),4、问题的语言和提问方式设计的规则,(三)问题,4、问题的语言和提问方式设计的规则 尽量用简单的语言,避免专业术语和抽象概念 问题尽量简短 避免问题含糊,定义不清的情况 避免双重或者多重含义问题 问题不可以带有倾向性,应保持中立态度 不能以否定形式提问,以免误会产生 不问回答
37、者不知道的问题 不直接问敏感性问题,要间接、委婉 问题的参考框架要明确 注意问题的提法,别让回答者有考试之感 语言中的毛病,要保证答案具有穷尽性和互斥性 善于使用“其他” 问题和答案设计要协调,答案设计的要求,1、开学以来,在学校你总体感觉如何? A、精力充沛 B、未感到疲劳,但也没有多余的精力 C、有点疲劳 D、很容易疲劳 选C/D的同学请继续回答第(1)小题 (1)为什么感到疲劳? A、学习任务太重 B、作息时间不合理 C、压力大导致失眠 D、其它 2.在新环境里,你的学习兴趣有何变化? A、兴趣更加浓厚 B、没什么变化 C、厌学情绪加重,问卷问句设计要有艺术性,避免对填卷人产生刺激而不能
38、很好地合作。如下面两级问句: A:您至今未买电脑的原因是什么? (a)买不起 (b)没有用 (c)不懂 (d)软件少 B:您至今未购买电脑的主要原因是什么? (a)价格高 (b)用途较少 (c)性能不了解 (d)其他显然B组问句更有艺术性,能使被调查者愉快地合作。而A组问句较易引起填卷人反感、不愿合作或导致调查结果不准确。,一、您常看哪类报刊书籍(只选一项) 1、经常看 2、偶尔看 3、从不看 二、对于对话节目,你觉得(只选一项) 1、非常好 2、好 3、一般 4、不好 5、非常不好 三、 您家庭的平均月收入状况 (只选一项) 1、1000元以下 2、 1000-3000元 3、3000-50
39、00元 4、5000元以上 5、不知道 四. 您最希望以何种方式获知影讯? (只选一项) 1.校园网 2.校园海报 3.校园广播 4.班委通知 五. 您觉得我校播放电影最合适的地方应该是? (只选一项) 1.灯光球场 2. 霞湖球场 3. 其它(请注明)_,练习:请判断以下答案设计好坏,改进方案,数目 数目依据研究内容、样本性质、分析方法、拥有的人力、物力和财力等因素定 一般来说,不应太长,以回答者能在15-20分钟内完成为宜,至多不超过30分钟 如研究经费充足,并付给回答者一定的报酬和礼物,问卷本身质量高,回答者对内容比较有兴趣的情况下,问卷稍长一些无妨。,问题的数目和顺序安排技巧,顺序(请
40、判断以下哪些放在问卷前面合适) 熟悉、简单?生疏、难回答 引发回答者兴趣的问题?引起回答者紧张顾虑的问题? 开放式题应放在问卷前部还是后部 行为?态度?个人背景? 按时间顺序排列问题,或将询问同一类事物的问题要尽量安排在一起(体现逻辑顺序),问题的数目与排列,问题的数目: 问题不能过多,问卷不宜过长,一般控制在20分钟以内回答完毕; 问题的排列要有一定的逻辑次序,层次分明: 熟悉问题在前,生疏问题在后; 简单易答问题在前,复杂、难答问题在后; 泛指问题在前,特定问题在后; 感兴趣的问题在前,紧张顾虑的问题在后; 行为的问题在前,态度、观念的问题在后; 封闭式问题在前,开放式问题在后;,第二节
41、问卷的设计原则,一、把为被调查者着想作为问卷设计的出发 点。,二、对阻碍问卷调查的因素有明确的认识 (一)主观障碍 (二)客观障碍,三、从不同角度来考虑问卷的设计工作,问卷设计中的理论构思,问卷设计的原则 (1)、相关原则调查问卷中除了少数几个提供背景的题目外,其余题目必须与研究主题直接相关。 (2)、简洁原则调查问卷中每个问题都应力求简洁而不繁杂、具体而不含糊,尽量使用简短的句子,每个题目只涉及一个问题,不能兼问。 (3)、礼貌原则调查问卷中尽量避免涉及个人隐私或隐私的问题,如收入来源;避免那些会给答卷人带来社会或职业压力的问题,使人感到不满。问题的措辞礼貌、诚恳,人们才能愿意合作。 (4)
42、、方便原则调查问卷中题目应该尽量方便调查对象回答,不必浪费过多笔墨,也不要让调查对象觉得无从下手,花费很多时间思考。 (5)、定量准确原则调查问卷中如果要收集数量信息,则应注意要求调查对象答出准确的数量而不是平均数。例如,“在您的班级中六岁入学的有几人”和“在您的班级里学生平均几岁入学”,前者能够获得班级六岁入学儿童的准确数字,而后者则无法得到这样的信息。,(6)、选项穷尽原则调查问卷中题目提供的选择答案应在逻辑上是排他的,在可能性上又是穷尽的。 (7)、拒绝术语原则调查问卷中避免大量使用技术性较强的、模糊的术语及行话,以便使被调查对象都能读懂题目。违反这一原则的例子如“您认为您的孩子社会智力
43、如何?” (8)、适合身份原则调查问卷中题目的语言风格与用语应该与调查对象的身份相称。因此在题目编拟之前,研究者要考察调查对象群体的情况,如果对象身份多样,则在语言上尽量大众化;如果调查对象是儿童、少年,用语要活泼、简洁、明快;如果调查对象是专家、学者,用语应该科学、准确,并可适当运用专业语言。 (9)、非导向性原则调查问卷中所提出的问题应该避免隐含某种假设或期望的结果,避免题目中体现出某种思维定势的导向。例如:“作为教师,您认为素质教育能够更好地促进学生的健康成长吗?”,第三节 问卷的设计步骤,一、设计问卷初稿,以下两种方法:,卡片法:步骤、优点、缺点 框图法:步骤、优点、缺点 综合法:步骤
44、,第三节 问卷的设计步骤,二、试用和修改,试调查不能不做 试用的具体方法两种: 客观检验法 主观评价法 三、定稿、印刷,第五章 教学评价,第一节 教学评价概述 第二节 学生课业发展评价 第三节 课堂教学评价,教学评价,学生学业的评价 课堂教学的评价,第一节 教学评价概述,一、教学评价 根据教学目的和教学原则利用所有可行的评价技术对教学过程及其预期的一切效果给予价值上的判断。,为什么评? 评什么? 谁来评? 用什么评? 怎样评?,二、当前教学评价发展的基本特点,评价对教学起着重要的导向和质量监控的作用。随着课 程的改革,教学评价的功能,指标、方法、重心等都在发生 变化。具体表现在如下几点:, 选
45、拔和甄别功能 (选拔适合教育的学生) 学生成长和进步,促进学生的发展的功能(创造适合学生的教育),1、评价功能, 重视发展,淡化甄别与选拔,实现评价功能的转化。 表现在:,2、评价指标,重视综合评价,关注个体差异,实现评价指标的多元化,3、评价方法,强调质性评价,定性与定量相结合,实现评价方法的多样化,4、评价主体,强调参与互动,自评与他评相结合,实现评价主体的多元化,5、评价重心,注重过程,终结性评价与形成性评价相结合,实现评价重心 的转移。,第二节 学生课业发展评价,评价方法的调查,评价方法的调查,评价的方法,普通高中课程方案指出:“实行学生学业成绩与成长记录相结合的综合评价方式。学校应根
46、据目标多元、方式多样、注重过程的评价原则,综合运用观察、交流、测验、实际操作、作品展示、自评与互评等多种方式,为学生建立综合、动态的成长记录手册,全面反映学生的成长历程。” 如表现性评价、苏格拉底式讨论评价、档案袋评价等。,质性评价之一:表现性评价,表现性评价(performance assessment)是在20世纪90年代,美国兴起的一种评价方式。它是在学生学习完一定的知识后,通过让学生完成某一实际任务来评价学生的学习状况,包括表现性任务和对表现的评价。它的评价方式有别于传统的纸笔测验评价,是对学生能力行为进行直接的评价。,表现性评价的特点: 1、 评价时要求学生演示、创造、制作或动手做某
47、事。 2、 要求激发学生高水准的思维能力和解题技能。 3、 使用有意义的教学活动作为评价任务。 4、 唤起真实情景的运用。 5、 人工评分、人工评判而不是机器评分。 6、 要求教师在教学和评价中担任新的角色。,操作/表现性评价,形式 实验操作 表演活动 讨论答辩 小制作 小发明 ,特点 方法的开放性 内容的真实性 标准的多重性 评价的主观性 评价的即时性 结论的模糊性,探究/操作/表现式评价的维度,从科学的角度认识问题(任务)的水平 从社会的角度认识问题(任务)的水平 掌握科学方法/技能的水平 个人技能的发展水平 科学概念的掌握水平,需要关注的表现,兴趣与关注 兴趣和注意,提出课题,制订计划
48、调查与收集证据 聆听他人讲述,书面阅读理解,灵活运用资料,采访,用问卷调查,观察、实验、体验,选择信息 报告与交流 叙述,交谈,写作,记录、整理资料,发表意见,评价 自我评价,相互评价 交际与合作 与同学合作学习,与各种类型的人交往 信息收集与应用 运用计算机,运用信息技术设备,运用英特网,鉴别和选择有效信息,与学习任务相结合的评价(例),标题:应不应该吃生肉? 教学目标:学生应能够 从各个角度证明吃生肉或不熟的食物是人的权利; 识别并消灭肉类中的寄生虫; 在小组中相互合作和交流; 向政府和有关部门反映自己的想法; 解释什么是寄生虫及其与肉类的关系,解释食物的营养价值; 科学概念 寄生虫 微生
49、物高繁殖率 毒素和寄生物对人体的危害 食物污染,任务: 找出生蛋白质中的寄生物(如:观察解剖鲤鱼的实验); 讨论生肉里寄生物的情况及其对影响健康的可能性; 安排时间收集资料,分组进行讨论,并对因吃生肉引起中毒的实例和数据进行整理; 写出一些论点说明限制吃生肉的必要性,准备就该论题进行辩论; 参加辩论; 小检测:回答一组有关吃生肉是否公众的权利的问题。,广东实验中学的案例1,实验探究:“影响原电池的因素” 任务: 1、构成一个原电池需要哪些条件? 2、影响原电池电流大小的因素有哪些? 3、这些因素是怎么影响电流大小的? 以上探究性实验案例中,实验方案由学生设计,没有现成的实验步骤供参考。学生在实
50、验前、中、后都要求依据“实验表现性评价记录表”进行记录与填写。,活动的五个环节,思考与讨论 讨论三个任务,设计实验方法,分工 实验 记录人根据探究活动记录表记录实验数据。 归纳与整理 处理数据,分析问题,得出结论,提出疑问。 交流与分享 先由一组的代表做主要发言,其他组同学自由补充。 反思与评价 先进行组内反思与自评,然后,自由发言,评价别人,评价本组,谈感受。,药品清单:锌片(2片)、铜片、碳棒、铁片、铜线、蒸馏水、稀硫酸、水、酒精、食盐水、水果 实验设计说明(课间思考,课后填写): 实验前的想法: 实验方案梗概: 对某些实验的说明:,数据记录表:(可不填满,可补充),实验结论:(可不填满)
51、,小组反思与评价: 对发言小组的工作,我比较赞赏的是什么? 创造力 观察力 灵活性 效率 我认为他们存在的不足是什么? 我们的差距在哪里? 我们有更好的吗? 我们有些什么样的感受? 自评与他评的结合,在比较中进行反思,发现优点和差距.,反思:(课后写),自评、互评表,教师在活动过程中观察各小组的表现,并做简单记录。教师与部分学生代表协商评分标准和评分细则,再由各小组自己评,然后学生代表评,最后教师评。评价标准主要包含:实验设计合理(修改后)、实验成功、对实验中出现问题合理解决、分工合理、全员参与、富有创造性、反思和自我评价恰当等项目。 教师评定等级: 教师评语:,活动设计一定要明确,学生一看就
52、知道他们该做什么、评价什么、思考什么,这样才能起到“评价引导教学”的作用. 以上评价表,根据具体情况,可以在课堂上完成,也可以部分留待课下完成, 评价表在班上的“评价与反思”专栏中展示与交流,让大家共同学习。,老师的总结认为:评价已经成为课堂教学的一部分,在解决实际问题过程中让学生学会学以致用、学会分工合作与探讨、通过反思掌握学习方法。评价标准起到了推动和引导学生去思考去探索的作用,评价成为学习的动力之一,使学生在评价中学会学习,喜欢学习。,由于实验探究评价活动新颖有趣,表现才华的机会很多,学生普遍持欢迎态度,评价活动效果很好。有学生在“感想与体验”一栏写了:“实验不是单纯的依瓢画葫芦,而是需
53、要在事前和过程中都不断思考的, 只有事先考虑好可能出现的情况并在过程中随机应变才可以保证实验顺利成功地进行”。,广东实验中学案例2,喷泉实验的问题评价案例 在学习氨气的性质时,教师按左图所示装置演示喷泉实验,实验很成功。然后把学生以四人组成一组,围绕该实验讨论,设计问题并填写下表(一组一张),每个组一个同学负责记录组员提出的问题。几分钟后两组互换表格,回答对方的问题。再换回自己原来的那张表,看对方回答的情况。然后老师把一些小组的表格投影出来,引导学生对问题进行评价(评价表如下)。最后进行组间互评。,问题 答案 记录表,评 价 表,在活动中因为知道要进行评价,学生都很积极,提出了一些很好的问题。
54、如“氨气可以形成喷泉,其它气体呢?”,“形成喷泉的关键条件是什么?”,“没有滴管怎么形成喷泉?”等。这些问题亦催生了许多新的喷泉设计方案。如“把烧瓶换成塑料水瓶,就可以挤出氨气,造成负压。”,“用热毛巾包住烧瓶,赶走部分氨气,再换成冷的毛巾,就会形成喷泉”等。 活动反思:有问有答,有合作有竞争,思考的热情高涨,不服输的劲头十足,更重要的是懂得了如何去发现问题,如何挖掘问题的内涵和外延。,表现式评价活动形式,演讲(二氧化碳的是非功过) 陈述(准备一个有意义的化学方程式带到课堂上,并说明与所学知识点的关系以及选择的理由) 设计(如设计新型的CO2灭火器)、 探究实验(空气中二氧化硫浓度的测定)、
55、调查报告(汇报化学实验室的试剂室中化学药品的摆放、提出建议)、 展板(自然界中CO2的循环)、 反思性小结(实验失败原因分析)、 头脑风暴(说出尽可能多的置换反应) 辩论、学生主导会议、书写方程式比赛等等.,实施表现性评价时要注意的问题,对学生先入为主的印象 由于阶级、地域、种族、经济等偏见带来的偏见 评价指标不恰当导致推论的逻辑错误 评价信息的不足 对个别事件的关注不细 注意防止几种常见的评价倾向 宽松误差 严格误差 集中趋势误差,质性评价之二: 学生成长记录袋,学生成长记录又称档案袋,是由学生学习过程中的各种作品汇集成的作品集,主要用来展示学生的学习进步或展示学生最佳作品的样本。 成长记录
56、袋评价是一种重要的质性评价方法, 是由学生和教师有系统地收集相关材料,以检查学生的努力、进步、过程和成就,并对很多正式测验的结果作出相应的解释。,成果型档案袋 过程型档案袋 结构型档案袋 非结构型档案袋,成长记录袋的类型,建立每个学生的成长记录。成长记录 应收集能够学生学习过程和结果的资料, 包括学生的自我评价、最佳作品(成绩记 录及各种作品)、社会实践和公益活动记 录、体育与文艺活动记录,教师、同学的 观察和评价,来自家长的信息,考试和测 验的信息等。,学生是成长记录的主要记录者,成长记录袋始终体现诚信的原则,要有教师、同学、家长开放性的参与,使记录的情况典型、客观、真实,档案袋评价的目的,
57、(1)利用档案袋评价促进学生的学习 与其他评价方法一样,在日常教学中使用档案袋评价的目的也是为了促进学生的学习档案袋能提供学生作品的实际样本,可以比较学生在不同方面的作品和取得的进步,可为学生提供对自己作品进行评价和反思的机会,还能向有关人员传递有关学习的清晰证据,并提高学生对学习过程的参与程度。 (2)利用档案袋帮助学生提高对自己学习的责任心 为了帮助学生提高对自己学习的责任心,教师可要求学生积极参与选择档案袋包含的样本,参与评价档案袋条目的质量,利用档案袋反思学习收获以及如何提高自己的学习。开始时,教师可为学生参与档案袋评价的活动给予必要的指导,但学生逐渐掌握独立学习能力后,应逐步减少对学
58、生的指导和控制。,档案袋的条目,(1)具体的档案袋条目:如果档案袋评价的目的限制在某个具体的方面(如熟练使用天平进行称量的技能),档案袋条目的类型可限制在一种类型的作品上,如纯文字性的电子文档,插入图表、图示等的电子文档等,也有可能包括不同主题或者某个特定主题的电子文档,如某一研究性学习专题的研究报告。而且,往往会将作品的初稿和最后的定稿都记录在档案袋中 (2)综合性档案袋的条目:更综合的档案袋则包括某个教学领域内各种不同类型的学生作品样例。例如,在评价学生信息素养的档案袋评价中,档案袋条目可以包括学生搜集到信息的记录、研究方案和作品设计方案、制作的素材、利用素材制作的作品等。 (3)学生的反
59、思:每种档案袋的条目都应配有学生的反思,教师可以设计一个简单的表格提出问题,要求学生进行反思并在表格中留出空白供学生记录反思的结果。例如要求学生回答和记录“我做了什么?”“我学到了什么?”“哪些方面我还没有掌握”“我该如何改进?”等。 (4)其他评价资料:除了上述各种类型的档案袋条目外,档案袋还可以包括学生的测验分数、利用行为检核表进行评价的结果、等级量表评价结果以及其他评价学生学习的相关资料。,档案袋的维护和使用,(1)档案袋的维护:每个条目在放入档案袋时都应注明准确的日期并贴上标签,档案袋应分类并有序排放,应编制档案袋的目录,以便于查找和使用。应组织学生积极参与档案袋的维护,提高学生对档案袋的认同感。 (2)档案袋的使用:应组织师生交流会定期检查档案袋。在师生交流会上,学生可以和教师一起浏览档案袋内容、比较评价、讨论学生的学习进展以及需要改进的地方。也可在家长会上通过档案袋展示和讨论学生的学习成绩,利用学生的实际作品让家长了解学生的学习。,成长记录袋设计步骤,确定评价对象 明确评价目的 确定收集材料的类型、时间、次数 制订和 指导学生积极参与的有效方法 确定评分方法 制订评价结果交流与分享的计划,档案袋结构的一般性标准,A.是否清晰地阐述了档案袋的目的? B.是否提供了关于学生各种类型学习的证据? C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生产过程质量控制体系创新创业项目商业计划书
- 有机芥花籽油礼品盒创新创业项目商业计划书
- 编程电子鼓企业制定与实施新质生产力项目商业计划书
- 汽车变速箱维修创新创业项目商业计划书
- 美术教育创意工具创新创业项目商业计划书
- 虚拟现实社交创新创业项目商业计划书
- 拉伸应力和环境介质协同作用下有机涂层性能劣化行为与机制研究
- 浙江安全员b证考试题库及答案
- 长春省实验分班考试题目及答案
- 农宅建筑方案设计说明模板
- 脑电图及临床应用
- Creo数字化建模技术(微课版)课件 2.0 Creo 6.0草绘环境
- 统编版道德与法治小学三年级上册教学设计
- 国家安全与青年担当
- 第十四章其他原因引起的语言障碍讲解
- 船舶机舱进水的应急处理
- 大学生化学实验竞赛试题及答案
- 班级管理(延边大学)知到智慧树章节答案
- 湘教版九年级上册数学期中考试试卷及答案解析
- 带班育人方略班会-《从“埋头苦干”走向“抬头巧干”》【课件】
- 心肌梗死患者的便秘护理
评论
0/150
提交评论