(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf_第1页
(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf_第2页
(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf_第3页
(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf_第4页
(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(计算机软件与理论专业论文)基于uml的支持教学效果评价的考试系统应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆大学硕士学位论文中文摘要 摘要 传统的考试基于纸和笔,存在出题、改卷、统计工作量大,不易实现教考分 离、人为的因素对考试成绩的影响较大等诸多弊端。在各类各级学校教学改革的 中,试题库建设、教考分离是非常重要的工作,这迫切需要一种高效、快捷、科 学的试题库、自动组卷、网上考试和形成性教学评价集成系统。 本论文依据现代教育科学基础理论,采用面向对象的软件开发方法,利用计 算机和网络技术,设计并实现了一个试题库、自动组卷、网上考试和形成性教学 评价集成系统。这套系统的优点主要体现在以下几个方面: 试题与课程能力标准紧密相关。根据专业能力标准制定课程能力标准,使 试题紧扣课程能力标准,使其具有较高的针对性和测试有效性。 试卷紧扣测试目标,出卷方便快捷。只要输入考卷的考核点分布、难度级 别、试卷的题型题量分布等约束条件,利用遗传算法,软件会自动生成符合设定 目标的最优试卷,可以有效实现教考分离。 阅卷和成绩分析统计准确快速。通过客观题计算机自动判卷和主观题教师 改卷相结合,可以大大减轻教师阅卷的工作量,提高教师的工作效率,同时提高 阅卷的准确性。 系统自动分析学生答题的各种信息,快速地给出科学的形成性教学评价数 据。依据现代教育科学的评价测量理论,通过系统的应用,科学的分析在线考试 或练习的答题时问、得分,提取学生答题时间、原始得分数据中蕴藏的教学过程 的反馈信息。教师通过系统得出的s - p 表的注意系数、s _ t 表的集体反应曲线和 t - r 平面数据,进一步分析异质学生和异质试题,进一步分析试题的难度、学生 学习的整体情况和知识点的掌握情况,从而调整教学方法,提高教学质量。 在论文中,首先描述了系统的需求,并得到了面向对象的需求模型。然后, 由需求模型演化出面向对象的设计模型,并用c 撑实现了系统。最后,对系统的优 缺点进行了分析,并提出了今后改进的方向。论文的创新之处在于用面向对象技 术分析、设计并实现了融入现代教育科学的测量评价理论的实用系统。 关键词:面向对象,遗传算法,形成性评价,考试系统 重庆大学硕士学位论文 英文摘要 a b s t r a c t t r a d i t i o n a lt e s ti sb a s e do np a p e ra n dp e n , w h i c he x i s t st h ec o m p i l a t i o no ft e s t q u e s t i o n , r e v i s i n go x l m j n a t i o np a p e r , t h om a n ys t a t i s t i c a lw o r kl o a d i n g ,n o te a s yt o i e i l l i z i t h es e p a r a t i o no ft e a c h i n ga n dt e s t i n g , t h ea r t i f i c i a lf a c t o rt ot h et e s tr e s u l t i n f l u e n c ea n ds oo nm a n ym a l p r a e t i c 圯i ne a c hk i n do fa l ll e v e l so fs c h o o le d u c a t i o n a l r e f o r m , t h ee o m 缸u e t i o no ft h e t e s tq u e s t i o nb a s ea n dt h es e p a r a t i o no ft e a c h i n ga n d t e s t i n g 躺e x t r e m e l yi m p o r t a n tw o r k , w l a i e l au r g e n t l yl l e e d so n ek i n dh i g h l ye f f e e t i v o t h es c i e n c et r i a lq u e s t i o nb a j 】l 【, t h ea u t o m a t i cm a :k ee x a m i n a t i o np a p e r , t h eo n l i n et e s t a n df o r mt e a c h i n ga p p r a i s a li n t e g r a t i v es y s t e m t h ep a p e ri s0 1 1b a s e do nm o d e me d u c a t i o ns c i e n t i f i cb a s l et h e o r ya n du t i l i z e s o b j e c t - o r i e n t e ds o t t w a r em e t h o do fe x p l o i t a t i o n u s i n gc o m p u t e rn e t w o r k , t h ep a p e r d e s i g n e da n dh a s l e a l i z c das e to f q u e s t i o nb a n k , t h ea u t o m a t i cm a k ee x a m i n a t i o np a p e r , a n dt h eo l l l i l l et e s ta n df o r m st e a c h i n ga p p r a i s a li n t e g r a t i v es y s t e m t h i s 嘲o fs y s t e m m e r i tm a i n l ym a n i f e s t si nf o l l o w i n gs e v e r a la s p e c t s : t h et e s tq u e s t i o na n dt h ec u r r i c u l u ma b i l i t ys t a n d a r di sc o n n e c t e de l o s d y a c c o r d i n g t os p e c i a l i z e da b i l i t ys t a n d a r dw e 啪f o r m u l a t ec u r r i c u l u ma b i l i t ys t a n d a r d a n dw e 啪c a u s ct h et e s tq u e s t i o nt ot h r e a du pt h ee m r i e u l u ma b i l i t ys t a n d a r d , e n a b l e i th i g hp o i n t e da n dt e s tv a l i d t h ea “啪缸n a 垃o np a p e rt h r e a d su pt h et e s tg o a la n dt h ec o m p i l a t i o no f t e s tq u e s t i o n i sc o n v e n i e n tq u i c k l y s ol o n ga sy o ui n p u te x a m i n a t i o np a p e ri n s p 删o nd i s l r i b u t i o a , d i t t i e u l t y 瑚n l c ,e x a m i n a t i o np 叩惯c o n s t r a i n tco n d i t i o n sa n d 蛆t o p i cq u a n t i t y d i s t r i b u t i o n , w i t hg e n e t i ca l g o r i t h m , t h es o f t w a r e np r o d u c ea u t o m a t i c a l l yt h em o s t s l l p e r i o l - e x a m i n a t i o np a p e rw h i e l ac o n f o r m st oh y p o t h e s i sg o a l i t na l s or e a l i z et h e s e p a r a t i o no f t e a c h i n ga n dt e s t i n ge f f e e t i v d y e x a m i n i n gt h et e s tp a p e r sa n da n a l y z i n gt h es t a t i s t i c a lr e s u l ti sa c c u r a t eq u i c h y t h ec o m p u t e ra u t o m a t i c a l l yr e v i s e s 砌n i n a t i o np a p e rf o rt h eo b j e c t i v eq u e s t i o n 羽】d t h et e a e l a e rr e v i s e se x l m l i n a t i o np a p e rf o rt h es u b j e c t i v eq u e s t i o n a n d8 0i tc g r e a t l y r c d u c cw o r kw l a i e ht h et e a c h e ra 妇m i n e st e s tp a p e r s8 r i de l l l h a n c 它t e a c h e r sw o r k i n g e f l f i e i e n e y 觚dt h ea c c u r a t ef o re x a m i n i n g t e s tp a p e r s t h es y s t e m 啪a u t o m a t i c a l l ya n a l y s i se a e l ak i n do f i n f o r m a t i o no f t l a ea l l s w 口sa n d p r o v i d eq u i e l d yt h es c i e n c ef o r m a t i o nt e a c h i n ga p p r a i s a ld a t a b a s e do nt h em o d c r a e d u c a t i o na p p r a i s a lt h e o r y , t h r o u 曲t h es y s t e ma p p f i c a t i o na n dt h es c i e n t i f i ca n a l y s i so f 重庆大学硕士学位论文 英文摘要 o n l i n et e s to rt h ep r a c t i c ea n 蝌e ft i m ea n dt h e 鲥:o 蛾t h es y s t e mw i t h d r a w st h ef e e d b a c k i n f o r m a t i o nw h i c ht h ed a t ao ft h e 锄w 盯t i m ea n dt h es c , o y ec o n t a i n s t h r o u g ht h e a t t e n t i o ni n d e xo ft h es - pt a b l e , t h ec o l l e c t i v er e s p o n s eo l y v ea n dt h et - rp l a n ed a t ao f t h es - tt a b l e , t h et e a c h e ra n a l y z e st h eh e t e r o g e n e o u ss t u d e n ta n dt h eh e t e r o g e n e o u st e s t q u e s t i o n , a n a l y z e st h eo v e r a l ls i t u a t i o no f t h es t u d e n ts t u d ya n dt h ek n o w l e d g eg a s p i n g s i t u a t i o na n dt h et e s tq u e s t i o nt h ed l m c u l t y t h u st h ea d j u s t m e n tt e a c h i n gm e t h o d , e l t h a n c o sq u a l i t yo f t e a c h i n g a t 雠t h ep a p e rd e s c r i b e ds y s t e md e m a n da n do b t a i n e dt h eo b j e c t - o r i e n t e d d e m a n dm o d e lt oa s k s e c o n d l yt h ed e m a n dm o d e le v o l v e dt o t h eo b j e c t - o r i e n t e d d e s i g nm o d e l a n dt h ep a p e rh a s r e a l i z e ds y s t e mb yc 撑t h i r d l yt h ep a p e rh a sc a r r i e d 0 1 1t h ea n a l y s i st ot h es y s t e mg o o da n db a dp o i n t s , a n dp r o p o s e dn e x ti m p r o v e m e n t d i r e c t i o n t h ei n n o v a t i o no ft h ep a p e rl a y si nu s i n gt h eo b j e c t - o r i e n t e dt e c h n i c a la n d n a l y z i n g , d e s i g n i n ga n dr e a l i z i n gt h es u r v e ya p p r a i s a lt h e o r yp r a c t i c a ls y s t e mw i t h i n t e g r a t i n gt h em o d e m e d u c a t i o ns c i e n c e k e y w o r d s :o b j e c t - o r i e n t e d , g e n e t i ca l g o r i t h m f o r m sa p p r a i s a l ,t e s ts y s t e m h i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重废太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者硌孙己 签字日期沙) 耵月巧日 学位论文版权使用授权书 本学位论文作者完全了解重麽太堂有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。本人授权重庞盍堂可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 保密() ,在年解密后适用本授权书。 本学位论文属于 不保密( ) 。 ( 请只在上述一个括号内打“4 ”) 学位论文作者签名:匀百酞易 签字日期:赫刀年几z ;日 :移 签字日期乒钔7 年j 月7 f t ?, 重庆大学硕士学位论文l 绪论 1 绪论 1 1 论文选题的背景 传统的基于纸和笔的考试,教师要花费大量的时间和精力出题、改卷、统计 分数等,存在诸多弊端:工作量大、周期长、反馈能力弱、人为的因素影响考试 成绩。随着教学改革的不断深入,特别是网络教学、远程教学的开展,考试作为 检验教学质量和学生能力的重要手段,也需要进行改革。现代化教学手段的应用, 迫切需要一种高效、快捷、科学的试题管理、网上考试和形成性的教学评价系统。 利用计算机对数据库的并发存取功能和网络传输特性,实现高效、准确和科 学的试题管理、网上考试和形成性的教学评价将成为现代教育方式中的一种重要 手段【l 】1 2 。它的优点主要体现在以下几个方面: 试题标准化。根据专业能力标准制定课程能力标准,使试题紧扣课程能力 标准,从而准确测试学生的能力形成与否,实现教考分离。 出卷方便快捷。通过现成的题库系统,只要输入考卷的难度级别、试卷的 题型题量等约束条件,软件会自动生成符合要求的试卷,简便、快捷、公平。 阅卷准确快速。通过计算机自动判卷自动分析和教师改卷相结合,可以大 大减轻教师阅卷的工作量,提高教师的工作效率,同时提高阅卷的准确性; 成绩分析统计科学直观。成绩分析统计由计算机自动完成,可以方便地统 计及格率、优秀率和每题的得分情况等。 形成性的教学评价快速、科学。 教学实践中,教师讲授一个单元以后,往往进行测验并通过成绩的分析来了 解学生的学习情况、教师的教学情况和教学日标、教学方法的可行性情况。在学 生的成绩中蕴涵了很多教学过程以及学习过程方而的信息,这些信息对于改进教 学和学习有着重要的参考价位,如果能够及时挖掘出测验成绩中蕴含的深层次的 信息,对于提高教学评价水平有实质性的帮助。鉴于此。考试系统将试题、考试 和形成性评价集成起来。测验成绩的分析主要从以下两个方而进行【3 】: 学生分析 通过分析试卷中各题的得分和应答时间分析学生的进步情况,异质反应、 学习障碍、知识点的掌握情况等。确定需要单独辅导的学生。 教学分析 通过分析学生己掌握的知识点和未掌握的知识点来找出教学的薄弱环节为 改善下一步的教学工作提供线索与方向。 总之,主要思路就是通过对各题得分和反应时间的分析,展开形成性评价为 重庆大学硕士学位论文l 绪论 改进教学和学习服务。 1 2 论文的实用意义和目的 考试系统将试题管理、考试和形成性的教学评价集成起来,从出题,组卷,考 试,阅卷,成绩分析,教学反馈均由计算机通过网络来完成。 考试系统包含三个子系统:试题库管理子系统,考试子系统和教学评价子系 统。主要作用如下: 试题库管理子系统 主要是针对以往由人工出卷存在的种种弊端:自教自考、所考的知识点不全 面、考前漏题等情况,同时试卷的编辑、整理占了很大的工作量,出现大量的重 复劳动,这样造成了时间和人力资源的大量浪费。根据以上种种分析,希望借助 计算机强大的数据处理功能,由计算机逐步代替传统的人工出卷,建立一套实用、 便于操作的试题库管理系统。 考试子系统 考试子系统极大地减轻教师出题和判卷等繁重的工作量,实现无纸化考试, 使学生能配合教师的讲课进行有效的练习,及时检测自己的学习效果。系统基于 题库操作,通过w e b 页面实现在线录人试题、在线进行题型设计、在线动态随机 组卷和教师手动组卷、在线考试或练习、计算机自动判卷自动分析和教师改卷相 结合等重要功能。 教学评价子系统 依据现代教育科学的测量评价理论,通过系统的应用,科学的分析在线考试 或练习的成绩,提取学生原始得分数据中蕴藏的教与学过程的反馈信息。教师通 过s p 表、s - t 表、集体反应曲线,对各题的得分和反应时间进行有针对性的评 价并提供重要的信息【4 】。一方面可以避免某些教师简单的以测验总分数来评价学生 学习效果的现象,另一方面也可以减少教师分析试卷应答情况所花费的时间,使 教师可以有更多的精力关注教学的设计和过程的组织。 本文的研究目的是;适应现代高等职业教育的迅速发展所要求的高效、方便、 客观的出题、网上考试方式和教学评价,利用计算机创建试题库模型,建立具有 较高查询效率的试题库组织结构,使得试卷的自动生成并逐步积累,形成有效的 试题库,使试卷管理、考试工作更科学更高效,可以实现真正意义上的教考分离; 依据现代教育科学的测量评价理论,通过系统的应用,科学的分析在线考试或练 习的成绩,提取学生原始得分数据中蕴藏的教与学过程的反馈信息。 由于各类学校正在推行网上办公、推广现代化教育手段,网络教学,通过研 究希望建立一个有效的支持教学评价的考试与试题库管理系统,以供教师教学、 2 重庆大学硕士学位论文1 绪论 学生练习或自学之用,而且一定程度上的减轻教师的负担,提高教学质量,为教 学改革及教学质量的提高做出一点贡献。 1 3 论文研究的主要内容及论文的组织 第一章绪论 本章介绍该论文的研究背景以及意义和目的。 第二章相关的理论问题 介绍教育测量与评价理论和形成性教学评价的s _ - p 表和s _ _ t 的基本原理。 第三章系统的需求分析 介绍对系统的总体方案进行分析,包括考试系统所要完成的功能描述,面向 对象建模的相关知识和考试系统的业务模型、用例模型,对软件估计进行了描述。 第四章软件架构与系统设计 介绍软件架构,软件设计模式。系统功能划分,面向对象设计的静态建模和 动态建模和组件设计;还介绍了数据库设计,形成数据库的物理模型。 第五章系统的关键技术组卷算法 分析了组卷的基本策略,介绍了遗传算法,实现了基于遗传算法的组卷功能。 第六章系统实现与测试 用a s e n e t2 0 ( 选用c # 语言) 与飘1 a ls t u d i o2 0 0 5 开发环境中实现了考试相 关类和基于遗传算法的组卷算法。 第七章总结与展望 3 重庆大学硕士学位论文2 教育测量与评价理论 2 教育测量与评价理论 本论文依据现代教育科学基础理论,采用面向对象的软件开发方法,利用计 算机和网络技术,设计并实现了一个试题库、自动组卷、网上考试和形成性教学 评价集成系统。为了准确测试学生对知识的掌握程度,教学方法是否恰当,教学 目标是否达到,所以首先讨论现代教育测量与评价的相关概念与理论。 2 1 核心概念的界定 考试系统支持知识性内容教学的形成性评价,所以“认知学习”、情感学习”、 动作技能学习”、诊断性评价”、形成性评价”、“总结性评价”,这六个概念 要进行清晰的界定【习。 学习目标的分类理论有多种,其中布鲁姆的学习目标分类最具影响力。他把 学习目标分为三类:认知、情感、动作技能。 认知学习 认知学习是对知识、智力技能和解决问题的能力的学习,其特点是知识的获 得和应用。 情感学习 情感学习是学习者对于事物的看法和采取的行为。情感类学习内容可分为态 度类和品德类两种。 动作技能学习 动作技能的学习是一种习得的能力,学习的结果表现为身体的迅速、精确、 流畅和协调的动作。 诊断性评价 很多情况下诊断性评价往往是教师在教学前来实施的。其目的在于了解学生 在开展教学前是否具有新的教学单元目标所必需具备的基本能力和技能。根据诊 断性评价的结果,教师可以确定教学的起点,安排教学计划。 诊断性评价不是为了给学生评分数或排名次,而是以发现错误为目的,以便 分析、诊断学习状况,采取补救措施,使学生更加顺利的学习。 形成性评价 形成性评价是指教学过程当中实施的教学评价,是在学生学习了一段时间之 后进行的,有督促学生学习和改进教师教学的作用。它具有监督的功能,以原来 预定的发展目标作为评价依据。形成性评价主要以平时的小测验、期中考试、作 业等测量手段进行。测验完成之后,教师根据一定的评价理论,得出教师的教学 4 重庆大学硕士学位论文2 教育测量与评价理论 应该在哪个方面进行改进,学生应该注意哪些知识点的学习。其目的对教师而言 是借此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特 点、学习困难等信息,了解学生学习的情况及所存在的问题或缺陷。通过形成性 评价,教师可以知道哪些目标尚未达到,哪些方面还存在难点,从而对教学工作 进行调整,使所有学生都达到教学目标的要求。同时,形成性评价还应对学生的 学习提供反馈信息,学生根据反馈的结果获知自己学习后的表现情况,从而肯定 或修正自己以后的学习方式。通常,形成性评价有以下三个方面的作用: 1 ) 通过形成性测验调节学习活动。 2 ) 通过学习成果的确认而进行进一步的强化,使学生在完成学习目标后得到 一种满足感,对学生的学习起促进作用。 3 ) 可判断学习上的难点,提供矫正学习的方法和途径,使今后的学习方向更 为明确。 总结性评价 总结性评价是指在教学结束时进行的教学评价,这种评价的目的主要用于评 定学生对一学年、学期或一个学习单元的教学目标达到的程度,判断教师所用 教学方法是否有效,并全面评价学生的学习结果。 总结性评价一般是在学期末进行的,根据学期末和学年末各科学习测验与考 试的结果进行评定。这种评定除了了解学生学习结果外,还对学生以后的学习有 预测、评估的作用。 2 2 教育测量与评价理论 教学测量与评价技术的运用,为诸多教育教学决策提供了重要依据。下面给 出测量和评价理论中有几个核心概念的定义旧【刀。 2 2 1 测量、测验、考试、评价概念的界定 测量 测量( m e a s u r e m e n t ) 就是对客观事物的某种属性,依据某种法则赋予某个数值 的过程。这里,客观事物的属性指的是测量目标,法则指的是测量工具及其操作 规范,数值是测量的结果,三者是一个测量的三个方面,缺一不可。 在心理和教育测量中,有人( w e i t z e n h o f f e r ,1 9 5 1 ) 认为测量是“观察者对物理世 界施加的操作”,在s t e v e n s ( 1 9 4 6 ) 看来,测量是“按规则给客体或事件赋值”,罗德 和诺维克( 1 9 6 8 ) 以及t o r g e r o n ( 1 9 5 8 ) 注意到,测量只是作用于客体的特性,而不是 作用于客体自身,从而使s t e v e n s 的定义更加精确( c r o c k e ra n d a l g i n a , 1 9 8 6 ) 。“狈i 量就是给人的特定属性或特性赋值,以此揭示人在被测属性上表现出来的关 系 ( n i t k o ,1 9 s 3 ) 。b a c h m a n ( 1 9 9 0 ) 给测量下了这样一个定义:在社会科学中,测量 5 重庆大学硕士学位论文2 教育测量与评价理论 就是按照严格的程序和规则对人的特性进行量化的过程。 客观事物的属性,不仅包括事物的物理特性,而且还包括那些不被人的感官 直接感觉到的心理属性,只不过前者比较直观,后者比较抽象。 关于测定事物的法则,可以从两个方面进行理解,其一是测量工具,其二是 工具的使用方法或操作过程。一个测量是否准确在很大程度上取决于有没有一个 好的测量工具,有了好的工具以后则有赖于工具的使用是否恰当。一般地,良好 的测量工具必须满足两个条件,其一是要有一个恰当的零点,其二是要有一个良 好的单位系统( 制度系统) 。 关于测量的数字,它是用来描述事物属性多少的标志。它可以有四种不同层 次的理解。其一是将它理解为称名量表意义上的数字,如学生的学号、考号等。 这种数字只是事物的一种标记,并无大小之分,更不可以进行加、减、乘、除运 算。其二是将它理解为顺序量表意义上的数字,如体育比赛中的第一名、第二名 等。这种数字只表明事物间的先后顺序,没有相同的单位,也没有绝对的零点, 不能进行加、减、乘、除运算。其三是将它理解为等距量表意义上的数字。如通 常状态下的温度等。这种量表具有相等的单位,但有相对的零点( 如摄氏温度为0 并不表示没有温度) ,所以这种数字只能进行加、减运算。其四是将它理解为比率 量表意义上的数字,如人的身高、体重等。这种量不仅有相同的单位,而且具有 绝对零点( 如,高度为0 表示没有高度) ,故这种数字可进行加、减、乘、除运算 真正的测量是可以重复的,即可以由不同的人、在不同的场合、在同一类对象的 不同个体上重复进行,也就是说,测量要求不同的人要按一定的程序把共同的标 准用于不同的场合和不同的个体。因此,测量和伪测量”的区别就在于是否有严格 的程序和规则。 测验 测验( c a r r o l l ,1 9 6 8 ) 是一套设计好的程序,这套程序可诱导出某些行为,并可 以从这些行为中推断出人的某些特性。 测验( n i t k o ,1 9 8 3 ) 是一套系统的程序,它以一个数字量表或一个范畴系统的 辅助,可用来观察和描写人的一个或多个特性。测验的这个定义非常宽泛,学校 使用的所有描写学生行为的系统的程序,差不多都可以包括进来,这些程序有: 问卷、面谈、期末论文、考试等。 测验0 3 a c h m a n ,1 9 9 0 ) 是用于在个人的行为中得出一个特定样本的测量工具。 作为一种测量,测验必须按严格的程序量化个人的特性,测验和其他测量形式的 区别在于,测验要获得一个行为的特定样本。 在b a c h n m n 看来,有没有特定的行为样本是测验和其他测量形式的重要区 别。测验是一种测量,测验需要特定的具体样本,以便从中得出某些结论。 6 重庆大学硕士学位论文2 教育测量与评价理论 考试 考试有广义和狭义之分,广义的考试,泛指人类社会一切测度或甄别人的身 心各个方面之群体或个体差异的活动。狭义的考试,则指由主试根据一定社会的 需求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、才、 学、识、体诸多方面或某方面所进行有组织、有目的测度或甄别的活动。 考试和测验有时指同一件事有时又有区别,但区别在哪儿,专家说法不一。 有人认为大的叫考试,小的叫测验,也有人按主观客观去划分( p i l l t n e r ,1 9 6 8 ) ;有 时人们根据时间限制来区别,考试”一般在两三个小时以上,铡验”一般是半小时 到一小时;有时按等级划分,大学叫考试,小学叫测验;考试一般是主观的,测 验一般是客观的。 考试是测量,因为考生最后得到一个分数;考试也是测验,因为它收集一个 考生行为的样本;考试还是评价,因为人们根据分数确定一个考生的优劣,或者 用人单位( 大学、企业) 等根据分数选择人才,所以,考试是有评估目的的测验。 评价 广义地讲,评价泛指衡量、判断人物或事物的价值。评价活动的过程是对人 物或事物的价值进行分析、衡量和判断的过程。 我们所追求的评价是科学的评价,是在人们的主观认识最大程度地符合客观 现实的情况下所作出的价值判断。因而,这种评价结果是比较客观、比较合理、 比较公正的。做到这一点的前提条件是要求评价者有共同的价值标准【引。 笔者的论文中采用了布鲁姆的观点,因为他是从教育应用的角度提出来的。 形成性评价往往发生在教师讲授一个知识点或者单元以后,通过以上对测量、测 验、考试的定义的界定,本论文中采用的是铡验”。 下面将基于布鲁姆的教育测量与评价理论来讨论现代教育测量技术的s - p 表 和s - t 的基本原理。 2 3s p 表和s t 的基本原理 2 3 1s p 表基本原理 s - p 表是一种简便且实用的形成性测验数据分析工具,它可为学习的诊断、教 学的评价提供很多重要的信息。由s p 表得出的注意系数,可以定量地描述学生 及问题的反应模式异质程度【9 】。 s p 表是一种将测试、练习的得分数据排成一览表,并对学生和问题的特性以 视觉化的图表进行结构分析的方法。s - p 表是以学生( s t u d e n t s ) 数据作为纵轴,问题 ( p r o b l e m s ) 数据作为横轴做成一览表,该表去学生和问题的第一个字母,故称之为 s - p 表。 。 s - p 表的数学模型 7 重庆大学硕士学位论文2 教育测量与评价理论 设有n 名学生,通过对n 个问题的测验,其得分可以用n 行n 列的原始得分x 矩阵表示: x = k 】_ 而l而2 x 2 1 x - n 而。 而。 lx n 2 靠 ( 式2 1 ) 其中,而是第i 号学生对第j 个问题的得分。在实际应用场合,各问题的分 数取值可以任意指定,不失一般性,本文仅讨论二元取值的情况,即答对记为“1 ”, 答错记为“0 ”。第i 名学生的总分由靠= 给出,某个问题j 的总分由 t ,= 罗粕进行计算。 4 卣得分矩阵( 式2 1 ) 可计算出每个学生的总分和每个问题的总分。根据每个 学生总分的高低,由上至下进行排列,再根据每个问题的总分的高低,将问题自 左向右地进行排列。如果以y 矩阵表示经过变换后的得分矩阵,即有: y = k 】= ) ,h y 2 8 y 科 其中,y 0 表示第i 号学生对第j 个问题的得分。r y 。= 均表示第i 号 j i 学生的测验得分,只,= e y f 表示第j 号问题的答对人数。 i = 1 经过这样的变换后,所得到的排列表格为s - p 表。如图2 1 所示: p 2 p 5 1 3 p 6p 7 p 4 p 8p 1 0p 1 p 9 总分 s 9111llllll11 0 s 71ll1lll11o9 s 31l1olllllo8 s 51l1lll01108 s 1 31l1l11o1018 s 1 511l1l l1 0018 s 4l1lll llo o07 s 801011l11107 s 1 21l1ll010017 s 11l1l0 o10 016 s 1 l11011 10 100 6 s 1 0 11 l10000105 s 2 11 100100004 s 1 411101 00 o00 4 s 610100 01 00 03 总分 1 41 41 3l l1 1 1 09 76 5 图2 1s - p 表示例 f i g2 1d e m o n s t r a t i o no f s - p t a b l e 儿坨 重庆大学硕士学位论文2 教育测量与评价理论 s - p 表示一种按总分的多少进行有序排列的分数表格。s p 表的左上方1 的分 布较集中,右下方0 的分布较集中。 2 ) s 曲线和p 曲线的绘制方法: 将s - p 表的左上顶角处作为s p 平面的原点,横轴为x 轴,方向从左向右。 纵轴为y 轴,方向自上而下。 s 曲线的制作: 1 ) 设定y = i ,由y 。= y v 计算第i 个学生的总分,将它以s 劬表示; 2 ) 在s - p 平面上的s 筋和s t y ) + l 之间划入一条短的横向分界线; 3 ) 对于y = l n 的每一个y 值,按上法求出s t y ) ; 4 ) 同样,在每一个s t v ) 和s o 卜1 之间划入一条短的横向分界线; 5 1 由1 1 个分界线可以连成一条阶梯陷线,称之为s 曲线,如图2 2 中的实线。 p 曲线的制作: 1 ) 设定x = j ,由计算第j 个问题的总分,将它以p ( x ) 表示; 2 ) 在p ( x ) 和p ( x ) + l 之间划入一条短的横向分界线; 3 ) 对于x = l n 的每一个x 值,按上法求出p ( 办 4 ) 同样,在每一个p ( x ) 和p ( x 卜l 之间划入一条短的横向分界线; 5 ) 由n 个分界线可以连成一条阶梯曲线,称之为p 曲线,如图2 2 中的虚线。 p 2p 5p 3p 6p 7p 4p 8 p i o p 1p 9 总分 s 911ll11l11l1 0 s 71l1lll1l1 厅9 s 31l101111l0 8 s 5l1ll1101l08 s 1 31ll1l101ol8 s 1 51l1llll00i18 _ - _ - - _ _ 一 s 4 111l1l1l00o7 l s 8010l111illo7 l s 1 2ll 1110 1 0 0l7 - - - _ j s 111 1100 i 10 ol 6 :i s l l11011i1 1 01o06 7 “ _ 一 $ 1 0111i10 0 00105 ;r _ j s 211 1 i 0j0100 o0 4 :7i s 1 41 1 ;1 0i1000004 - - :。_ j s 6101000 l0 o0 3 总分 1 41 4 1 31 1 1 1 1 09765 图2 2 s 曲线和p 曲线示例 f i g2 2e i e 皿k m 翻瞳日l i 0 咀o f s - c u r v ea n dp - c u r v e 9 重庆大学硕士学位论文2 教育测量与评价理论 注意系数的计算 注意系数是用于s p 分析的重要参数。是指实际的反应模式与完全反应模式 的差异程度。即:注意系数i l o 】: i _ 1 一塞堕星窒塑塞皇茎壅堑箜堡查董f 肯,、 实际计算时,往往利用以下的方式求注意系数: 第i 学生的注意系数为: ,口一垮问韪的正答人数之和 jl 各问题正答人数之和j ( 式2 4 ) 慕鬻蓊娑麓紫卜蝴蛳篇呈黝i 左侧每问题的正答人数之和j ”7i 平均正答载l 第j 问题的注意系数为: 。i 的各学生的总成绩之和ji 的各学生的总成绩之和j ( 式2 5 ) “f 辫好1 - 鐾册隔 ip 曲线上侧各学生的卜l :竺! | = 二l l 二:l i 总成绩的之和j 、一一v 一 注意系数的计算示例如图2 2 所示。 当学生的注意系数大时,说明该学生作错了对于学生整体而言较容易的题目, 而作对了对于学生整体而言是较难的题目。当问题注意系数过大时,表示该题被 成绩较好的学生作错,而被较差的学生作对了,说明该题的区分能力低,从分等 的意义上讲它的使用价值降低。 注意系数本质上是个体与整体量化的比较对于教学中的问题分析,学生的 个别指导有重要的参考意义。 使用注意系数时应注意的问题 在实际使用s - p 表时,注意系数的判定准则是根据经验确定的,它只是一个 大致的标准。某问题或学生的注意系数值较大,只是一个警告信息,它提醒使用 者:“该问题或学生的反应模式与整体的反应模式差异颇大,是否需要检查? ”学 生注意系数大时,说明该学生作错了对于学生整体而言较容易的题目,而作对了 对于学生整体而言是较难的题目。问题注意系数过大时,表示该题被成绩较好的 学生作错,而被较差的学生作对了,说明该题的区分能力低,从分等的意义上讲 它的使用价值降低。 如果出现注意系数过大或者是过小时,教师就要注意以下一些问题:( 经验表 明不论是问题注意系数还是学生注意系数,当它们小于o 5 时,可以不予理会; 1 0 重庆大学硕士学位论文2 教育测量与评价理论 而当大于0 5 并小于o 7 5 时,就要提醒注意;当大于或等于0 7 5 时就要对这个 学生或问题进行详尽的分析,应给以特别的注意) 1 ) 学生是否存在粗心大意现象; 2 ) 学生的能力是否稳定; 3 ) 学生是否具备回答问题的基础知识,是否存在“蒙题”的情况; 4 ) 学生对该坷题的理解是否与其他学生有明显的区别; 5 ) 学生平常的成绩如何; 6 ) 对问题应更多关注共性,以便确定下一步的教学。即哪些问题是大多数同 学都掌握的;哪些问题是大多数同学都不会的,需要巩固或重新讲解; 刀对学生应更多关注特殊性即个性,哪些同学在哪些方面或哪些问题上需要 特别的指导。 当然,如果一个问题的注意系数高,其原因既有异质学生也有正常学生,那 么到底是学生的问题还是题目的问题,就要根据具体问题具体分析。 当问题的个数很少( 例如少于1 5 ) 或学生人数很少( 例如少于2 0 人) 时,注意系 数在统计上就欠稳定。在这种情况下就没有必要计算注意系数,只要观察项目反 应模式本身就可以分析反应情况。 一般来说,不同s - p 表的注意系数是不可以比的。注意系数是只能在同一个 s p 表中比较异质程度大小的团体依存型数值。 注意系数本质上是个体与整体量化的比较,对于教学中的问题分析,学生的 个别指导具有重要的参考意义。 2 3 2s t 的基本原理 s t 分析是对每个学生对每道问题做出反应的时间给予记录并进行分析的一 种方法。应用s - t 分析可以对问题进行简单的分析,当然它不像项目反应理论对 问题刻画得那么精细1 川【1 l 】 它用时间反应矩阵来表示( 水平方向是t u n e ,垂直方向是s t u d e n t ) 。 集体反应曲线的形成 集体反应曲线就是对某一个测验问题,在规定的时间内,回答人数随时间变 化的积累曲线。如图2 3 表示: 重庆大学硕士学位论文2 教育测量与评价理论 乞响应曲线 图2 3 集体反应曲线 丘g2 3c o l l e c t i v er e s p o n s ec i m t 图2 1 中:t i 一提出问题的时刻, k 一第一个学生回答问题的时刻, t d 一某一个学生回答问题的时刻, t e 一停止回答的时刻, t n = k t i 非回答时间, w e = t d t i 一某人回答所需要的时间。 集体反应曲线可以分为两类:响应曲线和正答曲线。 响应曲线:它记录在规定的时间之内,每个学生反应时间积累曲线,不考虑 这一反应是否正确,即不考虑学生的得分情况。 正答曲线;它只记录在规定时间之内正确回答者的反应时间的累积曲线,即 同时考虑学生的得分情况。正答曲线也和响应曲线一样具有逐步上升的趋势,缓 慢程度取决于问题的难易程度。 利用集体反应曲线,我们可以对问题的类型、难度以及学生的反应时间做出 分析。根据正答曲线的形状。我们可以进行如下的分析: 如果曲线起始部分较陡,说明大部分学生做出正确的反应,表明问题过于简 单。 如果曲线起始部分较缓慢,那说明许多学生要经过一段时间才能做出正确反 应,表明问题有一定难度,学生存在程度差别。 如果曲线分为两段,表明问题难度不大,但学生中存在程度不同的集团。 t -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论