中学生物学教育评价.ppt_第1页
中学生物学教育评价.ppt_第2页
中学生物学教育评价.ppt_第3页
中学生物学教育评价.ppt_第4页
中学生物学教育评价.ppt_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章 中学生物学教育评价,教育评价是指一系列系统的、科学的和专业的过程,在这个过程中,包括鉴别、获取和提供教育或教学决策之需的资料、意见和价值判断。 教学决策是指在教学中所做的各种决定。 资料不仅包括评价所获得的学生成绩或名次,还包括事实的描述、记录和报告等; 意见指看法、思想和观点; 价值判断包括对某一事实或做法的批评、价值评估等;,第一节 生物学教学评价概述,在学科教育中,教育和教学是融为一体的,所以学科的教育评价也就是教学评价。 生物学教学评价包括2种过程: 生物学教学中的评价:评价对象是学习过程,即学习过程中学生的学习状况。 生物学教学的评价:评价的对象是教学过程,即教学过程中教师的工作状况。,评价在教学中的地位,一、教学评价的目的,1.了解学生起点行为,适当配置学生 2.规划教学活动,调整教学进度 3.诊断学习困难,激发学习动机 4.评定学习成就,报告学业成绩,研究预测功能、反馈调节功能 促进激励功能、评定选拔功能,二、教学评价的种类,(一)根据实施评价时所使用的工具和形式来分, 1.纸笔测验 指以书面形式的测验工具,主要侧重于评定学生在学科知识方面学习成就高低或在认知能力方面发展强弱的一种评价方式。 包括:传统的考试、教师自编成就测验以及标准化成就测验或其他作为教学评价辅助工具用的各种心理测验等。 共同特征是都使用纸张印刷品即测验卷来呈现要学生回答的试题,并要求学生以各种书写工具在该测验卷上填写适当的答案,因此被称为纸笔测验。,2.实作评价 这是指使用多种工具或形式,评定学生在实际情景下应用知识的能力,以及在情感态度和动作技能领域学习成就的一种评价方式。 评价工具或形式包括:观察与轶事记录、表演、作品、评定量表、检核表、档案袋、社交测量或投射测验等。,(二)从教学评价的直接目的来划分 l.配置性评价 旨在了解学生的背景、性格和学习兴趣,以便根据学生的个别差异,安排适当的学习过程,施予适当的教学和辅导. 2.诊断性评价 旨在发掘、鉴定学生的学习困难或教学缺失,供调整教学方案参考.,3形成性评价 旨在了解学生的学习进展状况以及教学的可能缺失,作为调整课程、改进教学和学习的依据. 4终结性评价 旨在评定学习的进展和成就,作为成绩报告或教育决策的参考.,(三)从教学评价的标准来划分 1.效标参照评价(绝对评价) 指以预先设定的、期待的教育目标为评价基准,来衡量评价对象达到程度的一种评价。 评价的重心是在于:学生能做些什么与不能做些什么,是否达到了教育目标。学校内的教学评价多属效标参照评价。,2.常模参照评价(相对评价) 是指在某一集团中(班级、学校、地区或国家),以这个集团的平均状况为基准,来评价被评对象在这个集团中所处的相对位置的评价。 评价的重心在于:学生之间的比较,而与教育目标没有直接的关系。 适用竞争性的选拔考试。,三、教学评价的基本原则,1依据教学目标:根据行为目标决定 2兼顾多重目标:不同种类、不同层次 3采用多元方法:重心是形成性评价 4进行多次评价:减少误差 5重视反应过程:分析反应组型 6善用评价结果:改进教学和学习的参考,第二节 教师自编成就测验:命题,自编测验多属于成就测验: 随堂测验 定期测验 终结测验,一、测验编制计划的制定,(一)明确测验目的和目标 测验目的是要解决测验结果用来做什么的问题,是为了诊断教学缺失、学习困难还是评定学生等级?,教师一般所编制的纸笔测验,多半仅能适用于认知目标的评价,对于情感态度与动作技能目标的评价,则多采用实作评价的方法。,好的测验目标应该: 以学生为中心 表述一个结果,而不是一项活动 具有可测性 明确、清晰,布鲁姆“教育目标分类法”,1识记:这是最低等级的认知目标,它指对具体事物和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。 2理解:这是低层次的理解,以一种语言或一种。交流形式被译述或转化成另一种语言或另一种交流形式时的严谨性和准确性为依据,对材料进行初步的重新整理与排列,指出材料包含的意义和趋势。因此理解包括三个心理过程:转译、解释和推断。 3运用:指在某些特定的和具体的情景里使用抽象概念只是对所学知识的初步运用,而非综合的、创造性的运用。,4分析:指将材料分解成各种组成要素或组成成分,弄清各种观念的有关层次,或者明确所表达的各种观念之间的关系,阐明材料各要素的组织原理即对材料内容组合起来的组织、系统和结构的分析。 5综合:指对各种要素或组成成分加工,形成新的结构整体或新的模式;制定出合理的工作计划或操作步骤;确定一套抽象关系,用以对特定的资料或现象进行分类或解释;或者从一套基本命题或符号表达式中演绎出各种命题关系。 6评价:这是认知领域教育目标的最高层次,是指为了特定目的对材料和方法的价值及符合准则的程度作出定量的和定性的判断。,(二)设计双向细目表 教师根据测验目的及教学目标的需求,以教学目标为横轴,而以教材内容为纵轴,画出一个二维度的分类表,且平均分配好试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编拟成就测验试题的设计蓝图,这样的一个二维度分类表便叫做双向细目表(two-way specification table)。 双向细目表是命题、编制试卷的蓝图,它具体规定了各部分教学内容考核的目标和要求,规定了各部分考核内容应该占的权重或分值。,教师在设计双向细目表时必须注意: 第一,命题的范围在教学过的教材内容范围之内;没有教学过的教材内容范围,不应该有试题被命题出来。 第二,双向细目表边缘小格中的数字,不可以为零,也就是说,双向细目表中列出的教材内容或教学目标不能没有适当的试题。 第三,教师可以针对自己的命题及评分的习惯,选定双向细目表中所陈述的测验题型,变化或增减所预拟的试题题数或分值。,(三)选定测验的题型,客观性试题 (选择型试题),选择题 是非题 配合题 填空题 解释性习题,客观试题与主观试题比较,二、编拟测验试题,(一)编拟试题的一般原则(P210) 1试题取材均匀,并具有教材内容的代表性。 2试题的叙述应力求简明扼要,题意明确。 3各个试题宜彼此独立,互不牵涉,并避免含有暗示答案的线索。 4试题宜有公认的正确答案或相对较佳的答案。 5试题中某些错误,虽不影响答案的选择,也应当避免。 6凡具有争议性的试题,应该注明命题参考资料的来源。 7若要测量学生的高层次认知能力,则试题不一定要有固定答案。 8试题的叙述应重新组织,避免直接抄课文或原来教材。 9试题应重视重要概念或原理原则的了解与应用,要避免偏难琐碎及零碎知识的记忆。 10避免使用与测验无关的叙述,增加作答困难。 11命题不要超过单元教学的评价目标。 12提早命题,以预留时间进行试题审查或修正。 13命题数量尽量多一些,作为备用试题。,(二)主观型试题的命题原则(P211) 1尽量使问题的预期答案在内容和形式上都能明确界定,避免使用缺乏明确内容要求的试题。 2在问题中明确指出学生应回答的范围。 3预期答案不要太长。 4在每一试题之后,注明回答该题所需的时间和该题的分数,让学生能够根据命题者建议的时间和题分斟酌其答案的繁简和内容的深度。 5命题完毕后,自己先试做一遍,以确定不会有题意不清或答案太繁的情况。 6不提倡选题作答。,(三)选择题的命题原则(P211) 1题干本身是一个具有完整意义的句子。请比较下列两个例题。 2题干要简洁,但要将题意表达清楚,不要包含不必要的信息,造成费解。 3除非拟评价非常重要的科学概念,一般情况下,题干不使用否定。必须使用否定时,应在否定词下划线或加着重号,以提醒学生注意。否则学生因疏忽否定字眼而答错该题,并不是评价成就的本意。 4每一题的选项以四或五个为宜,其中应有而且最好只有一个正确的或最佳的答案。 5每一选项在语法、语气和句子长度等方面,尽可能保持一致。 6所有的选项都应合理,不可不合逻辑,否则便失去诱答效果,学生也就会很容易猜出何者是正确答案。 7正确答案的出现次序应是随意的,不可为了阅卷方便而以一定次序排列。否则,学生很容易猜对答案。 8可适当使用“以上都对”或“以上都错”为选项。,选择题,适用于: 应用 分析 综合 评价 优点: 效度较高 适用于各种不同认知层次(通用性强) 书写量小 猜测几率降低 知识覆盖面广 不足 编制较判断题要有一定的困难 编制似是而非的选项较为困难,例题1,例题:山楂果实中富含糖分和维生素C,常食用的功效主要是( ) 消食健胃 止咳化痰 降血压 补气益血 应考查核心概念,例题2,2003年,我国部分地区出现了较为严重的非典型肺炎疫情,经过科研人员研究确认引起非典型肺炎的病原体是一种冠状病毒,为了控制非典疫情的传播,我国政府采取了一系列的措施。请问下列属于非典传播途径的是( ) A. 空气传播 B. 血液传播 C. 水源传播 D. 接触传播,题干应简捷明了 避免套话空话,例题3,北方果树由根系吸收的水分主要用于( ) A 光合作用 B 蒸腾作用 C 植物的生长 D 果实的形成,避免无用信息的干扰,例题4,下列为成年人有关血液的正常生理数值,其中正确的是( ) A 白细胞:500010000个/毫升血液 B 红细胞:男子平均为500万个左右/毫升血液 C 血红蛋白:女子平均为12克/10毫升血液 D 血小板:1030万个/毫升血液,例题5,例题:下列哪项是正常成年女子血液中红细胞的数量( ) A 7109/升 B 100109个/升 C 150109个/升 D 4000109个/升,题目之间不能前后提示 (self-contained),例题6,以下说法正确的是哪项? A. 房室瓣位于心房与心室之间 B. 条件反射的反射弧是固定不变的 C. 寄生是一种生物生活在另一种生物体内的现象 D. 病毒通过不断地分裂来繁殖后代,题干意思明确,一个题目应围绕一个主题或思想,例题8,_是人类的主要能源物质。 维生素 脂肪 蛋白质 糖类,空格不应放在句首,例题9,下列关于病毒的形态结构和生命活动特点的描述错误的一项是_。 病毒比细菌小得多 由蛋白质外壳和核酸组成的核心构成 通过不断分裂来繁殖后代 离开寄主细胞后不能独立生活,尽量避免使用否定式题干,若一定使用,则需将否定词用着重符凸出显示,例题10,下列哪些能够更准确地表示在降雨循环中水与太阳热能之间的关系? B. C. D. 关照一杯冰红茶 时,杯子外壁上 有水珠凝集,各选项应保持格式一致,例题11,下列哪些能够更准确地表示在降雨循环中水与太阳热能之间的关系? 关照用玻璃片覆盖的 水槽时,玻璃的下表 面有水珠凝集 B. 光照密封的纸盒,里面 的植物偏向照光的一侧,C. 阳光照在人的脸上, 当他运动时,他的 脸上会形成汗滴 D.关照一杯冰红茶时, 杯子外壁上有水珠凝集,例题12,研究人员测出玉米的体细胞中有20条染色体,那么受精卵中染色体的条数是_条。 20 10 40 30,选项应按一定的顺序排列(如时间先后,数字大小等),例题13,下列有关寄生的叙述正确的是_。 寄生是一种生物取食另一种生物的现象。 寄生是一种生物生活在另一种生物体内的现象。 寄生是一种生物生活在另一种生物体内、体表、或体外并获取营养维持生活的现象。 寄生是一种生物生活在另一种生物体表的现象。,选项长度和复杂程度保持一致,避免提供暗示,例题14,鸡的品种很多,但它们的祖先都是原鸡。原鸡被培育成现在各种良种鸡的正确原因是_。 原鸡产生了多种不遗传的变异,经自然选择变异逐代积累而形成各个品种。 原鸡产生了多种可遗传的变异,经自然选择变异逐代积累而形成各个品种。 原鸡产生了多种不遗传的变异,经人工选择变异逐代积累而形成各个品种。 原鸡产生了多种可遗传的变异,经人工选择变异逐代积累而形成各个品种。,使用学生熟悉的词语,例题15,下列结构属于植物细胞的是_。 细胞壁 细胞膜 细胞核 液泡 以上都正确,下列关于动物在自然界中的作用叙述正确的是( ) A 可维持生态平衡 B 可帮助植物传粉和传播种子 C 可维持维持碳氧平衡 D 以上都正确,例题16,尽量不要过多使用“都正确”“都不正确”作为选项,例题17,绿色植物合成有机物、贮存能量的生理过程是_。 呼吸作用 光合作用 蒸腾作用 同化作用,避免选项之间相互包容,(四)是非题的命题原则(P213) 1避免使用一般性叙述来命题,而应尽量详细说明题意,以免题意不明,学生无法明确判别。 2避免零碎、不重要或纯记忆性的命题。 3避免使用否定,尤其是双重否定的命题。 4避免以冗长而复杂的叙述来命题。 5除非有因果关系存在,在同一命题中,应避免包括两个或两个以上的科学概念。 6答案为是与非的命题应约各占一半,否则相差太多时,有考试技巧的学生便可借助是与非出现的频率来猜题,使评价结果信度偏低。,判断题,适用于: 回忆和识记; 有两种选择的概念(或对或错) 优点 量大 答题速度快,每分钟可完成3-4题 不足 容易作答 区分度问题 猜测答案 信度较低,例题1,蛇无四肢,体表有鳞片,能够感受温度的变化。 应考查核心概念(key concept),例题2,养鱼缸内充满了水,养了一些水生植物和小鱼,缸内还加了一些浮游动物,将鱼缸密封后放到有阳光的窗台上,经过一段时间,鱼缸就成了一个平衡系统。其中水生植物是生产者。 应简捷明了(concise),例题3,出芽生殖是由母体生出形态结构与母体相似的芽体,芽体长大后与母体脱离,形成新个体。 不能从课本上直接引用原话,例题4,所有的变异都是有害的。 只有绿色植物才是生产者。 避免具体的限定词,例题5,两只雄盘羊为争夺食物而发生的争斗不属于攻击行为。 蕨类不是无维管束植物。 尽量避免否定式陈述,如果需要,应将否定词用着重符标示出来,例题6,转基因食品对人类有害,我们应该拒绝食用。 应尽量避免有争议的话题(controversial issues),例题7,农业上若施肥过多,易造成烧苗现象,这是因为土壤溶液的浓度小于作物根毛细胞的细胞液的浓度。 细菌的个体一般比真菌小。 神经元的基本结构包括细胞体和轴突两部分。 静脉血管的特点是管壁薄、弹性小,血流慢。 生物的变异是定向的。 一对夫妇生了一个色盲男孩,那么下一个孩子则不一定是色盲。,应避免答案的规律性,(五)配合题的命题原则(P213) 一组配合题,通常可分为前提和选项两个部分。是在要求学生寻求两件事实或叙述之间的关系。 1在一配合题中,前提与选项的内容均应是同质的,不可将不相关的内容勉强凑合。 2前提与选项的数目应不同,同时应说明清楚选项可以使用的次数,如:每一个选项只能使用一次或两次或两次以上或一次都不选。 3前提的句子通常应比选项长,而且将选项置于右方。 4选项应依合理或合乎逻辑的方式排列,避免与前提之间有任何顺序上的相关存在。 5每一配合题应附一作答说明,使学生对作答方式能一目了然。 6同一配合题的所有前提和选项应置于同一页内,不要分开在两页上,以免增加学生答题时翻页的麻烦,甚至因疏忽而造成错误。,匹配题,适用于 知识 理解 优点 覆盖面广,占用空间小 对事实性知识较为适用 不足 费时 不利于测查高阶思维能力,填空题,优点 知识覆盖面广 考查低阶认知能力 猜测几率大大降低 不足 编制困难:让学生清楚所要考查的内容 考查的能力低 容易包含与答案相关的暗示 评分耗时,例题1,鸟类有很多结构适于飞翔,如胸肌_、直肠_,不能储存粪便、前肢_等。 以下属于鸟类适于飞翔的结构特征有_ 胸肌发达 前肢变为翼 长有绒羽 长有爪 身体呈流线型,要考查核心概念,例题2,维生素_与_的代谢有关,缺乏时,会 产生_病。 维生素D与人体内_的代谢有关。,留有足够的答题信息,例题:开始使用杀虫剂时,对某种害虫效果显著,但随着杀虫剂的继续使用,该害虫表现出越来越强的抗药性。实验证明害虫种群中原来就有存在具抗性的个体。这证明: (1)害虫种群中个体抗药性的_体现了生物的变异一般是_的。 (2)杀虫剂的使用对害虫起了_作用。而这种作用是_的。,设问不明确,限定不严密,第一空有“作用”一词限定,题意明确。而第二空则指令不强,缺少限定。,(六)简答题的命题原则(P214) 1命题题意要明确,限定要严密。 2不能从教科书上直接摘录一段句子来命题。 3一般来说,问题型的命题比填空型的命题对答案的要求更明确。 4假如期望的答案要带有单位,应将单位标示出来。 5假如题干使用填空型,原则上以一题一空格为原则,尽量不要在一个题目内,要求学生填两个或两个以上的空格。因为空格愈多,通常题意愈模糊。,(七)解释题或实验题的命题要领(P215) 制作这类型试题时,应先设计或转录一段科学概念、科学实验结果或图表等,再根据其内容,设计一些客观型试题,综合题,适用于 应用 综合 评价 优点 不能猜测 可使学生展示能力以组织知识,表达观点等 可激励进一步的学习 不足 考查的知识面窄,效度较低 编制难度较大 主观性,评分的可信性 评阅耗时,三、试题与测验的审查,教师必须对试题进行审查、剪辑,再汇编成正式的测验卷。 逻辑的审查:评阅试题与教学内涵(或教学目标)间的关联性,又可称作形式审查; 实证的审查:评阅学生的反应组型是否是所期望的,又可称作客观审查。,逻辑的审查,(一)逻辑的审查 1测验的一致性(试题与教学内容是否一致) 试题是否能代表所要测量的行为目标? 试题是否与教学目标一致? 试题是否与教学的呈现方式相一致? 请校内任教相同科目的其他同仁过目,以学科专家的眼光去察看各试题是否与上述三项审查重点相符合。,逻辑的审查,2测验的适当性 检查重点在于查验试题的格式、问题陈述的方式以及其他可能的影响因素,是否能够适当地反映出试题所要测量的行为目标。 试题内容、题数、范围是否遵照双向细目表的计划,试题类型是否符合应有的命题原则? 题意表达是否清楚? 试题呈现方式与作答说明是否明确,试题是否代表所要测量的行为目标; 问题的叙述有无前后矛盾、提供暗示答案的线索或重叠出题等等。,(二)实证的审查 以实证的方法审查测验试题,主要是试题功能的分析和教学敏感度的分析。 通过预试的方式进行实证的试题审查,1试题分析 试题分析的目的在于审查试题品质是否符合所要测量的学习领域和测量理论的要求,以一些量化的指标作为挑选试题的依据。 难度是指试题答对人数占总人数的百分比,亦即是指试题正确反应的几率。 区分度则是指试题能够区别答对和答错人数的百分比,也是指试题能够区别高低不同能力组群的功能。,2教学敏感度分析 教学敏感度是指不同难度的试题具有代表教学效能的倾向,它可以用来判定教学是否有错误或试题本身是否有暇疵及不适当之处。 教学敏感度是评判试题鉴别功能好坏的参考指标。,较常用教学敏感度指标是前后差异指数(pre-to-post difference index,简称PPDI), 定义: PPDI=(后测的难度)-(前测的难度) 该指数的值域介于-1.0到1.0之间。在正常的教学情境里,PPDI指数值介于0.10到0.60之间。 PPDI指标被用来帮助教师检查每个试题与教学之间的品质关系,以便作出下列三种决定之一:保留;删除;修改该试题。,四、试题与测验的分析,大规模的或正式的标准化成就测验必须经过严谨的试题分析和测验分析后才能使用。 试题分析是针对每一个试题的分析,其内容主要包括:难度的分析;区分度的分析;诱答力的分析等。 测验分析是针对整个测验试卷的分析,其内容主要包括:信度的分析;效度的分析;差异度等基本描述性统计分析。,五、试卷的编辑,试卷编辑是依据测验目的将适当的优良试题编辑成一整份测验试卷。,(一)试卷的长度 试卷长度是针对测验题数的多少而言。 可以考虑下列六个因素。 1.测验的目的:单元应比整学期少;形成性评价比终结性评价多;效标参照测验比常模参照测验的多。 2.试题的类型:客观测验应比主观测验多;选择型比补充型多。 3. 信度的高低:宜增加复本试题的数目。 4.学生的年龄:年龄愈小应愈少。 5.学生的能力:适用于能力较低学生的比较高学生的少。 6.作答的时限:速度测验比难度测验的题数多。,(二)试题的难度 测验试题的难度选择,取决于测验的目的。 常模参照测验,使用难易适中的试题,而淘汰太难或太易的试题。 效标参照测验,决定试题的难度因素是学习材料与学习涵盖的范围。,(三)试题的排列 1根据试题难度来排列 将简单的试题排列在前,困难的试题排列在后,以符合作答的心理原则 2根据试题类型来排列 3根据教材内容来排列 4根据教学目标或测量能力来排列,(四)编制试卷指导语 说明包括:测验目的;作答时间;记分方法;答题要求;试题分数的分配,猜题是否扣分;是否可以携带及使用教科书、讲义、笔记、尺、圆规、或计算器等;答案纸与试题册是否分开作答,分别交卷;是否允许学生在答案纸或试题册上注记或补充说明事项;考试中途是否可以举手发问等,以及其他需要特别说明的事项。,第三节教师自编成就测验:阅卷和评价结果的统计分析,一、试卷的评阅,(一)评阅主观题应注意的原则(P221) 确定明确的分值 给分系统:计点法、分级法 阅卷中保持平行,减少误差 (二)评阅客观题应注意的原则(P222) 客观题是否倒扣,二、试题分析,试题分析是对试卷中单个试题的测试结果进行分析,从而确定试题的品质。 可以作为正式试卷确定前预试阶段的一项基础性工作,作为实证审查的组成部分, 可以在正式测试后作为整个测试工作评价的一个方面。 内容包括:难度分析;区分度分析;针对选择题的诱答力分析。,(一)试题分析的步骤(P223) 1将试卷按得分的高低排列。 2由最高分向下取全部试卷数的27%或1/3,称为高分组。 3再由最低分向上取与高分组相同份数的试卷,作为低分组。 4分别计算高、低分组,选答各试题每一选项的人数,记录在试题卡上, 5计算各试题的难度(P),以百分比表示,其计算方法如下: 难度(P)=(RU + RL)/2N RU:高分组答对该题人数 RL:低分组答对该题人数 N:高分组或低分组人数,6计算各试题的区分度(D),其计算方式如下: 区分度(D)=(RURL)/N 7评价每一试题的选项的有效性或诱答力。 作为选择题中一个有效的选项,应该做到:至少有一位低分组学生选择该不正确选项;选择该不正确选项的低分组学生人数应该比高分组学生人数要多。 8将所有试题依其难度与区分度制作综合分析表.,(二)如何评价和改进试题 制作试题卡 简便方式,三、试卷分析,试卷分析是对整个测验的品质作出分析。 通过试卷分析确定本测验是否达到测验目的,是否真实有效可信。 试卷品质的分析包括试题分析、基本的描述性统计(descriptive statistics)分析,以及信度和效度分析。,(一)试卷的综合分析 计算出测验试卷的每个试题的难度(P值)和区分度(D值),然后分别以试题的P值和D值两个维度作坐标,根据各试题的P、D值,将题号填人坐标内的空格,形成一个综合分析表。 综合分析表可以简单明了地了解在某一次测验评价中,有多少试题和那些试题的P、D值达到理想,那些试题的P值或D值或两者都没有达到理想而需要改进。,1难度(P)分析 常模参照评价中,希望将受试者的得分尽量分散开来,以便比较学习成就的优劣。难度以在50%左右为最好。 实施学习成就评价时,希望学生的平均得分落在满分与机遇得分的中间,理想的P值以“期望平均得分”为准。,P0.8 试题太易; P0.8 、P0.4、0.6的中等难度试题应占60%。 整套试卷平均难度在0.40.6之间。,2. 区分度(D)分析 D值是介于-1与1之间。理想的试题应该是所有高分组的学生都答对,而低分组的学生都答错,此时,D值为1;相反则D值为-1; 常模参照评价而言,D值愈大,学生得分便愈分散,相应地,试卷标准差(SD)也比较大,试题品质较高,信度也较大。 在学习成就评价上,我们通常以一定的标准来评价(P227表10-5)。,(二)试卷的基本描述统计分析 1平均数(mean) 2标准差(standard deviation) 3相关性分析(correiation Study),(三)试卷的信度分析 信度是指评价的结果(分数)与其拟评测的学习成就的一致性。 评估信度的资料来自评价的结果而非评价工具本身。 当我们要评估某一评价工具所测得的结果(分数)的信度有多大时,便往往通过观察本次评价结果(分数)是否与其他类似目标的评价结果,(即另一次评价的分数)一致来判断,若一致性颇高(即高分者仍得高分,低分者仍是低分),便可认为该评价结果(分数)应可测得学生的真正学习成就。,影响评价结果信度的因素: 试题的数量 分数的分散度 试题的难度 试题的区分度 评价工具的客观性,2信度系数的估算方法 (1)重测法 :以同一份试卷测一群学生两次 (2)对等法 :制作两份在内容、难度和题型上尽可能类似的试卷 (3)分半法:在实施测验之后,将每一份试卷的奇数和偶数题分别计分 (4)库李法 :KR20和KR21,提高测验信度的方法 适当增加测验长度; 与能力有关的测验,其难易程度要适中; 测验的内容不应过于复杂; 测验的实施和评分方法要标准化。,(四)试卷的效度分析 效度(validity)是指测验分数的正确性。就是指一个测验能够测量到它所想要测量的特质的程度。 就学习成就评价的范围来说,所谓效度是指评价工具是否精确地测出了该工具期望评测的成就。,评定内容效度的方法 首先,请所测学科的专家检查双向细目表是否符合课程大纲或课程标准的要求,各章节的内容比例是否合理; 然后,然后对测验题目与双向细目表进行比较,如果吻合程度高,则内容效度高。,实际工作中需要注意下列事项(P230): 1. 答题说明应明确详尽,使学生不至于有任何混淆或误会。 2编题所用的词汇和句子不可艰涩深奥,以致学生因无法看懂而无从下笔答题。 3语意要清楚明确,不可稍有模糊。 4试题数量不可太少。 5编题时不可有意无意地在题目中提供任何与答题有关的线索,导致学生猜题。 6试题难度应适当。 7试题应尽可能评侧重要的概念、思考过程、知识的理解、分析和综合,而不宜故意设置陷阶,评测一些琐碎、零星的记忆性知识。 8试题的排列次序应先易后难,以免学生花大多时间在较难的题目上,以致时间不足而放弃了一些容易的试题。 9信度是效度的必需条件,因此,效度高的评价、首先信度要够。 10同一试卷重复使用多次,效度会逐渐降低。,第四节 实作评价,实作评价可定义为:具相当评价专业素养的教师,编拟与学习成果应用情境相类似的仿真测验情境,或真实的测验情景,让学生表现所知、所能的学习成果的评价过程。 实作评价的重点,通常是放在实际表现的过程、作品或这两者的组合上,具体情况视实际表现活动的性质而定。 在教学之初,教师会比较重视正确的表现过程;学生逐渐熟悉正确的表现过程后,则会将注意力逐渐转移到强调完成作品的品质上。 介于评价认知能力所用的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论