(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf_第1页
(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf_第2页
(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf_第3页
(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf_第4页
(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf_第5页
已阅读5页,还剩79页未读 继续免费阅读

(计算机软件与理论专业论文)基于轻量级j2ee的网络考试测评系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 随着计算机技术、网络通信技术、多媒体技术的飞速发展,将计算机和网络 技术引入我国远程教育领域,已成为现代远程教育发展的需要和必然趋势。特别 是随着i n t e m e t 和i n t r a n e t 向着宽带、高速、多媒体方向的发展以及2 l 世纪我国教育 体制的转变一建立教育终身制,培养创新人才,使得远程教育成为我国发展教育 事业的一项重要战略决策。 考试是教育实施中的一个重要环节。基于b s 结构的网络考试测评系统,有很 多传统考试所不具有的优越性。它不但可以节省大量的人力、物力,还可以提高 考试的效率和质量,己成为现代远程教育保证教学质量的重要手段。本文所做的工 作是对基于b s 架构的网络考试测评系统的研究、设计与开发。 论文的主要内容简述如下: 第一章从理论和实践两个方面对网络考试测评系统的现状作了分析,梳理了 网络考试系统的发展脉络,并从技术的角度分析了当前的技术现状,针对目前网络 考试系统的不足和现有的开发技术,提出了一个基于b s 的网络考试测评系统,该 系统具有良好的可扩展性、可维护性、通用性、先进性,适合多学科、多层次的 考试。 第二章从教育测量和教育统计的角度出发,介绍了题库建设理论,并对题库 建设中涉及到的经典测量理论和项目反映理论做了分析和比较,将经典测量理论 作为本系统开发的理论依据。详细地介绍了相关系数在考试质量分析中对试卷、 试题、考生能力上的应用,作为考试质量分析的方法依据。 第三章简要介绍了统一建模语言r o m e ) 和统一开发过程( r u p ) ,对比分析传统 j 2 e e 框架和轻量级j 2 e e 框架的优缺点,详细地介绍了s t r u t s 框架、s p r i n g 框架、 h i b e r n a t e 持久化技术。 第四章采用u m l 建模工具结合r u p 统一开发过程,对系统建立了需求模型、 静态结构模型、动态行为模型和物理模型,提出了基于s t r u t s 、s p r i n g 、h i b l e m a t e 框架的四层体系架构,作为网络考试测评系统的技术框架。同时给出了系统的功 能结构图,包括题库管理、权限管理、在线考试、统计分析等子系统。对数据库 进行了详细的设计。 第五章网络考试测评系统进行了实现,以评价子系统为例详细阐述网络考试 测评系统的开发过程,并给出了相关系数在统计分析模块上的实验结果,验证了算 法的有效性和实用性。对系统的安全问题做了分析,提出了解决方案。 第六章对所取得的成果进行总结,并分析论文的不足之处和今后的研究方向。 关键词:j 2 e e ,l m i 模型,教育测量与统计,考试题库 英文摘要 a b s t r a c t t h ec o m p u t e r , c o m m u n i c a t i o na n dm u l t i m e d i at e c h n o l o g yi s w i d e l ya p p l i e dt o m a n yf i e l d s i tb e c o m e sac r y i n gn e e da n da i li n e v i t a b l et r e n dt od e v e l o pm o d e m d i s t a n c ee d u c a t i o nb yu s i n gc o m p u t e ra n dn e t w o r kt e c h n o l o g y f u r t h e r m o r e ,w i t ht h e d e v e l o p m e n to fi n t e m e ta n di n t r a n e ti ns e v e r a ld i r e c t i o n sa n dc h i n a sc r o s s c e n t u r y e d u c a t i o n a ls y s t e mr e f o r m ,m o d e md i s t a n c ee d u c a t i o nb e c o m e sa l li m p o r t a n ts t r a t e g i c p o l i c y f o rt h ed e v e l o p m e n to f e d u c a t i o n e x a m i n a t i o ni sa l li m p o r t a n ta s p e c ti ne d u c a t i o n c o m p a r e dw i t ht h et r a d i t i o n a l e x a m i n a t i o n , t h en e t w o r ke x a m i n a t i o ns y s t e mb a s e do i lb sh a sm a n ya d v a n t a g e s i tc a n n o to n l ys a v eh u g eh u m a na n dm a t e r i a ll * e s 0 1 1 l c e $ ,b u ta l s oi m p r o v et h ee f f i c i e n c ya n d q u a l i t yo f e x a m i n a t i o n s oi ti s 缸i m p o r t a n tm e a n s t og u a r a n t e et h eq u a l i t yo f t e a c h i n g t h em a i nc o n t r i b u t i o n so f t h i sp a p e ri n c l u d et h er e s e a r c h , d e s i g na n di m p l e m e n t a t i o no f t h en e t w o r ke x a m i n a t i o ns y s t e mb a s e do nb s t h eg e n e r a lc o n t e n t so ft h et h e s i s 辨 s u m m a r i z e d 舔f - 0 1 1 0 w s : i nc h a p t e r1 ,i ta n a l y z e st h ec u r r e n ts i t u a t i o no ft h en e t w o r ke x a m i n a t i o ns y s t e m , a n di n t r o d u c e st h ed e v e l o p m e n tp r o c e s so ft h en e t w o r ke x a m i n a t i o ns y s t e m t h e ni t a n a l y z e st h es t a t eo f t h et e e l a n o l o g y b e c a u s eo f t h el a c ko f c u r r e n tn e t w o r ke x a m i n a t i o n s y s t e ma n dt h ep r e s e n tt e c h n o l o g y , an e t w o r ke x a m i n a t i o ns y s t e mb a s e do nb si s p r o p o s e d w h i c hc a np r o v i d ea s e to f e x c e l l e n tf e a t u r e s i nc h a p t e r2 ,i ti n t r o d u c e st h et h e o r yo fi t e mb a n kf r o me d u c a t i o nm c a s l 1 r ea n d s t a t i s t i c sa s p e c t s t h e ni tc o m p a r e st h ei t e mr e f l e c t i o nt h e o r yw i t ht h ec l a s s i c a lm e a s u r e t h e o r y , w h i e l ap r o v i d e s at h e o r yb a s i sf o rt h i s t h e s i s f i n a l l yi tp r e s e n t st h e e o r r e l a t i o i l - c o e 伍c i e n tm e t h o di nd e t a i l i ne l a a p t e r3 ,u m la n dr u pf l t l r es u m m a r i z e d , a n dt h e ni tc o m p a r e st h et r a d i t i o n a l j 2 e ea n dt h el i g h t w e i g h tj 2 e e f i n a l l yi tm a k e sd e t a i l e di n t r o d u c t i o n st ot h es t r u t s , s p r i n ga n dh i b e r n a t et e c h n o l o g y i nc h a p t e r4 ,v a r i o u ss y s t e mm o d e l sa g eb u i l tb yu s i n gu m la n dr u p i tp r e s e n t sa f o u r - l a y e rs y s t e ma r c h i t e c t u r eb a s e do ns t r u t s ,s p r i n ga n dh i b e r n a t e i ta l s op r o v i d e s t h ed i a g r a mo f t h es y s t e ms t r u c t u r ea n dt h ed e s i g no f t h ed a t a b a s e i nc h a p t e r5 ,t h en e t w o r ke x a m i n a t i o ns y s t e mi sd e s i g n e da n dr e a l i z e d t a k et h e e v a l u a t i o n s u b s y s t e mf o ri n s t a n c e , t h ed e s i g na n di m p l e m e n t a t i o np r o c e s s e sa 糟 d e m o n s t r a t e da t l e n g t h f i n a l l y , i tp r e s e n t st h ee x p e r i m e n t a l r e s u l t so ft h e l i i 重庆大学硕士学位论文 c o r r e l a t i o n ,c o e f f i c i e n tm e t h o d ,a n dt h er e s u l t ss h o wt h a tt h es y s t e mi se f f e c t i v ea n d p r a c t i c a l i nt h el a s tc h a p t e r , f i r s t l yi ts u m m a r i z e st h em a i nw o r ko f t h et h e s i s t h e ni tp o i n t s o u ti n s u f f i c i e n e i e sa n df u t u r er e s e a r c hd i r e c t i o n k e y w o r d s :j 2 e e ,u m lm o d e l ,e d u c a t i o nm e a s u r ea n ds t a t i s t i c ,i t e mb a n k i v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重麽盔堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作,明确的说明并表示谢意。 学位论文作者签名:劫式锌签字日期:即7年r 月b 日 学位论文版权使用授权书 本学位论文作者完全了解重庆太堂有关保留、使用学位论文的 规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许 论文被查阅和借阅。本人授权重废太堂可以将学位论文的全部或部 分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存、汇编学位论文。 保密() ,在年解密后适用本授权书。 本学位论文属于 不保密( ) 。 ( 请只在上述一个括号内打“4 ”) 学位论文作者签名:多l 武硝 签字日期:妒哆年r 月p 日 导师签名 签字日期:n 司年j 月弦日 1 绪论 l 绪论 考试是教学中的一个重要环节,也是人类社会一种特有的测量、评定人的知 识、技能、能力、性格等个体差异特征的社会活动【。设计科学的、合理的考试内 容,采取公正的、合适的考试形式,不仅可以全面地、客观地评价学生的学习效 果,而且能够正确引导学生学习的方向,有效地激发学生的学习兴趣,使学生在 学习的同时,培养独立思考和解决问题的能力。 1 1 研究和开发的背景 1 9 9 7 年教育部1 5 5 号文件“加强非计算机专业计算机基础教学工作的几点意 见”,对于各高校的计算机基础教学工作的改革和建设起到了非常重要的作用。为 了进一步推动高校计算机基础教育工作的改革和发展,教育部计算机基础课程指 导委员会2 0 0 3 年相继给出了白皮书以及大学计算机基本要求。随着大学生对于计 算机基础课程学习需求的提高,计算机基础课程的改革势在必行。然而,计算机 基础课程改革的具体实践不仅要有高水平的师资队伍,而且需要一系列的保障措 施,其中一个重要的措施就是建立一套网络教学平台。 为了响应教育部关于计算机基础教学改革文件精神,为教师积极开展教学管 理、教学模式的研究以及为学生开展自主学习的需求提供一个良好的基础和环境, 在2 0 0 5 年,重庆大学计算机学院以曾一教授为课题组长设计并研发了一套可用于 全校非计算机专业计算机基础系列课程考试的网络平台。该平台包括网络考试子 系统、课件子系统、在线答疑子系统和系统管理子系统,可满足日常的教学和考 试的需求。 随着教学改革的不断深入,对教学理念和教学方法的认识有了进一步提高, 意识到该平台在网络考试测评这个方面有待进一步的研究和开发。考试测评在整 个教学活动中有着非常重要的意义,既是教学活动不可缺少的环节,也是教学活 动重要的调控阀,它有助于提高考试工作的质量,改进教师教学,从而促进学习 效果的提高。作为网络考试平台的后续版本,又研制开发了网络考试测评系统。 本人参与了前期的需求分析、整体设计、和项目的部分实现等工作。 1 2 网络考试测评系统的研究现状 1 2 1 理论研究 针对计算机考试系统研究,国内外目前已经有很多相关的显著理论成果,如 题库理论、经典测量理论、项目反应理论、概化理论、考试统计学理论、自适应 重庆大学硕士学位论文 测试理论等。这些对网络考试测评系统提供了有益的指导。 在网络考试测评系统开发规范与标准的研究方面,国内外有许多标准化组织 或机构制定的网络教育资源标准里面都涉及到了有关网络考试系统的相关内容, 其中影响较大的有:i e e el t s c ( l e a r n i n gt e c h n o l o g ys t a n d a r d sc o m m i t t e e ,学习 技术标准委员会) 的l o m ( l e a r n i n go b j e c tm e t a d a t a :学习对象元数据) , o c l c ( o n l i n ec o m p u t e rl i b r a r yc e n t e r ) d u b l i nc o r e 的d u b l i n c o r e 元数据标准,i m s 的l e a r n i n gr e s o u r c em e t a d a t a ( 学习资源元数据规范) 和q t i ( q u e s t i o n & t e s t i n t e r o p e r a b i l i t ys p e c i f i c a t i o no 我国教育部高教司于2 0 0 0 年5 月推出了现代远程教 育资源建设技术规范( 试行本) ,其中对网络题库、考试系统的建设规范进行了定义。 2 0 0 2 年,全国信息技术标准化技术委员会教育技术分技术委员会通过跟踪国际标 准工作和引进相关国际标准、分析国际上关于教育信息技术标准的研究线索,特 别是参照i e e e1 8 4 8 的框架,根据我国教育实际情况修订与创建各项标准,最终形 成了有中国特色的网络教育技术标准体系( c h i n e s ee l e a m i n gt e c h n o l o g y s t a n d a r d s ,简称c e l t s ) 【2 】。其中涉及到网络考试的标准有:练习测试互操作 ( c e l t s 1 0 ) 、平台与媒体标准引用( c e l t s 1 7 ) 、教学资源评价( c e l t s 2 2 ) 等。 虽然这些理论和规范标准对网络考试系统的建设提供了理论指导,但是其本 身也是处在不断实践、完善的阶段当中。我国的c e 【t s 目前也是处于试行当中, 符合这些标准的网络考试系统特别少,目前一些关于网络考试的商业方面的产品 与这些标准也有一定的差距。 1 2 2 实践应用 目前,计算机网络考试在国内外得到了广泛的应用。 国外有许多专门的考试机构采用计算机辅助测试对参加考核的对象进行评价。 著名的考试机构有美国思而文学习系统有限公司( s y l v a nl e a r n i n gs y s t e m si n c ) ,它 是一家从事教育和计算机化考试服务的专业公司,它在世界的6 大洲1 4 0 多个国 家和地区有2 2 0 0 多个考试中心,可用2 5 种语言提供近百个不同类型、一千多种 考试。每年全球参加计算机化考试的人数约4 0 0 万。世界上最大的考试机构一美 国教育考试服务中心( e t s :e d u c a t i o n a lt e s t i n gs e r v i c e ) 从1 9 9 3 年开始在g r e ( 研究 生入学考试) 采用自适应考试模式,同时逐步减少纸卷笔试为基础的考试。2 0 0 0 年开始,t o e f l 考试在中国采用计算机自适应考试模式。总的看来,国外的考试 特别是技术资格认证的考试,都逐步采用了计算机辅助测试的方法,且自适应考 试的形式开始广泛地运用。 国内相对来说起步比较晚,但随着教育信息化力度和深度的加大,涌现出一 批具有代表性的组织和机构。 无忧软件公司,是较早专门从事考试软件开发的公司,其用户遍布全国,但其 1 绪论 组卷方案是基于试卷级的,每次考试由软件开发者与用户商量,以确定每套试卷 知识点与题量的分布即组卷方案,将其写入代码中,其操作题答案的设计,是采 用“规约方式”,它是该公司自创的一套规则表示方式,类似于“正则表达式”,其识 别与正确性、一致性存在一定的难度,对于跨知识点、跨应用软件的试题难以评 测。 中邦国大在线考试系统,其试题方式也是:单选题、多选题、判断题、填空 题、简答题、论述题,试题中可插入图形以显示公式、特殊字符,题库的导入只 能通过e x c e l 进行。试卷可由出卷人员预先定义,也可随机抽题,也可人工组卷。 考试完成后,自动改卷,系统将自动判分( 除填空、简答、论述题型需要人工阅卷) 【3 1 , 缺点就是不能考操作题,组卷方案不能按现在的人工出卷的流程去处理。其答卷 一次提交,网络的负担可能加大,缺乏对考试质量的分析评价。 另外,国内还有一些商业软件公司也在积极研制,比较著名的有英时软件公 司的p o w e r e x a m 、清华豪泰的科教2 0 0 0 ,点控科技的点控考试平台等。 1 2 - 3 存在问题 通过分析国内外网络考试系统应用的现状,笔者认为主要存在如下问题: 单一客观题的考试题型限制了应用范围。长期以来网络考试系统试题题型 以客观题为主,没有充分发挥计算机的优势。同时由于考查的主要是客观题,考 生容易产生侥幸心理,缺乏对主观题的考查,很难对考生的综合运用能力作出评 价。 缺乏对考试的系统分析与评价。很多网络考试系统只注重考试,提供了对 考试成绩简单的统计,缺乏对学生和整体的情况进行有效的分析评价。这使得教 师不能及时掌握学生的学习效果,也不能掌握试题和试卷的质量,对教学的促进 不大。 系统可扩展、可维护性差。 缺乏对资源建设标准的支持。目前大多数网络考试系统对现行的各种规范 标准都不支持,缺乏标准性和通用性。 大多考试科目单一,只适于某一课程的考试。 1 3 技术研究现状 随着网络技术、应用开发技术不断的蓬勃发展,各种需求开始不断出现,应用 系统的功能需要变的更加强大,而且应用系统的开发和维护则需要不断的降低其 成本。目前很多应用系统是建立在w e b 基础上,建立依托w e b 的企业应用平台已 经成为目前大部分企业应用的首要选择,b s 框架成为目前主流的企业应用系统的 开发体系,基于b s 结构的w e b 应用程序也成为i n t e r n e t 上使用最为广泛的应用开 3 重庆大学硕t 学位论文 发技术,因其具有易用性、通用性和良好的可扩展性等优点而迅速发展,它支持 实时的信息发布,动态的用户交互及与后台系统灵活安全的连接。因此构造功能 更加强大、应用更为灵活的、开发更为简便的w e b 应用程序成为当前i n t e m e t 技术 发展的热点。 1 3 1j 2 e e 平台 j 2 e e 平台的成熟,为w e b 应用程序更进一步的发展提供了更广阔的空间。目 前,大部分用过程语言( a s p 、p h p ) 开发出来的w e b 应用,初始的开发模板就是混 合层的数据编程,开发速度往往比较快,但由于数据页面的分离不是很直接,因 而很难体现出业务模型的样子或者模型的重要性。与这些传统的开发方法相比, j 2 e e 是一种企业级的应用,有着严格的规范,更能够胜任迅速开发一个灵活而又 功能强大的w e b 信息系统。 1 3 2m v c 设计模式 在面向对象的编程中,软件编程人员更加注重以前的代码的重用性和可维护 性。设计模式使人们可以更加简单方便的复用成功的设计和体系结构,为开发者 提供了好的设计经验。设计模式的思想是将程序中可能变化的部分与不变的部分 分离,尽量减少对象之间的耦合,当某些对象发生变化时,不会导致其他对象都 发生变化。 其中m v c 模式是一种目前广泛流行的软件设计模式,随着j 2 e e 的成熟,它 正成为j 2 e e 平台上推荐的一种设计模型,将业务处理与显示分离,将应用分为模 型、视图以及控制层,增加了应用的可扩展性。 1 3 3j 2 e e 多层架构上的框架 目前,j 2 e e 多层架构上已经开发出了很多框架,这大大减轻了开发人员的负 担,开发者可以将不同层上的框架整合到一起,从而能够从繁杂的底层编码中解 脱出来。 在构建w e b 应用时,用户请求的处理、业务逻辑处理以及数据的持久化是必 须仔细考虑的因素,而且也是大部分应用必须具有较为复杂的职责。因此目前针 对表示层、业务层、数据持久层这三方面人们开发了很多框架,如s t r u t s ,w e b w o r k s , s p r i n g ,h i b e r n a t e ,i b a t i s 等,其中s t r u t s ,s p n n g ,h i b e r n a t e 作为一个开源的框架, 在各行业的企业中有着广泛的应用。 1 4 研究内容与主要工作 本文研究的主要内容有: 本文从网络考试的重要性以及网络考试测评系统建设的必要性入手,调研 国内外各种网络考试系统的研究现状: 4 1 绪论 对教育测量和统计理论、题库建设、开发规范与标准等进行研究和分析, 作为本文研究的重要理论依据; 详细地研究了系统开发方法和技术手段,如u m l ( 统一建模语言) 、r u p ( 统一开发过程) 、轻量级j 2 e e 框架s p r i n g 、m v c 模式的s t r u t s 架构、数据持久 化技术h i b e m a t e ; 重点研究网络考试测评系统的设计与开发。根据某高校的实际情况,实现 一个易维护、跨平台、可扩展性好等优点的网络考试测评系统。该系统将采用目 前的主流b s 结构,以轻量级j 2 e e 多层框架为基础。系统分为权限管理子系统、 题库管理子系统、在线考试子系统与统计分析子系统: 1 ) 权限管理子系统实现用户管理、权限管理、角色管理; 2 ) 题库管理实现试题的批量导入导出、试题的增、查、删、改; 3 ) 在线考试子系统实现人工组卷、自动组卷、随机组卷、含主观题的在线测试、 在线阅卷等功能; 4 ) 评价子系统实现考试成绩的自动统计与分析、学生能力的评价、试题及试卷 的评价。 5 ) 对网络考试测评系统中统计分析模块使用的相关系数算法,进行实验分析, 来验证算法的有效性和实用性。 6 ) 对系统的安全问题进行研究。 1 5 研究的意义 网络考试测评系统的运用,对转变传统教育思想和观念、提高师资队伍的素质、 改进考试手段和教学方法,加速教育手段和管理手段的现代化起着有力的作用, 对深化基础教育改革、全面提高教育质量和效益,促进素质教育的发展,因此深 入地讨论和研究网络考试系统的设计和开发问题,尽快付之实践具有重大的意义。 推进教学模式改革。信息时代,传统的教育观念、教育体制、教育结构、 考试方法和考试手段已相对滞后,借助多媒体技术和网络技术,改革传统的考试 模式势在必行。网络考试系统作为网络教育资源的重要组成部分,由于其所具有 的时空不限、资源共享、良好的人机与人际交互、即时更新等显著特点,必将通 过其在教学过程中的应用创建新型教学模式,从而加速传统教学模式的改革。 推进创新人才培养。以计算机技术和网络技术为代表的信息技术的飞速发 展,对高等教育的人才培养产生了极其深刻的影响。全面推进素质教育,培养大 批创新人才已成为高等教育的紧迫任务。网络考试测评系统可以给学生创造出一 个更加全面、独特、可亲的开放式学习环境。提高学生的学习兴趣,激发学生的 学习动机,它特别适合学生进行“自主发现”、“自主探索”式学习,因此对培养具有 重庆大学硕士学位论文 创新能力和合作精神的一代新人有着重要的意义。 促进资源共享,避免重复建设。资源共享是信息化社会的重要特征,通过 教育资源的共享可以提高教学资源的质量,避免重复建设,从而节省人力物力, 加快我国的教育信息化进程。目前,许多科研机构、公司、学校都在建设自己的 考试系统,但由于技术原因或缺乏理论指导,开发的产品实用性不强,造成资源 的低水平重复建设。因此,从理论上、实践上探索开发适应多学科多层次、具有 一定通用性的网络考试系统,对于教学资源的合理开发与使用,减少资源的浪费 具有重大的实际意义。 提供筛选试题的依据,指导课程题库的建设。试题是试卷的组成元素,故 试卷的质量是由每一道试题的质量共同决定的。所以,我们还要对每一道试题进 行难度和区分度的分析,并以此作为维护、筛选试题的依据,也就是将高质量的 试题予以保留以备今后继续使用,而对质量不高的试题予以修改或淘汰。这对于 提高今后的命题组卷水平,保证测验的高质量,实现测验的科学化均具有重要的 意义。 及时有效提供教学反馈信息,改进教学工作。通过对考试结果的统计分析, 教师可以对整个考试结果进行全面地检验。获得各种反映试题及考试质量指标的 数据,以判断考试是否可靠有效,是否符合规定的考试目的。同时,找出教学过 程的薄弱环节及存在的问题,提出改进措施。使今后的教学更具针对性,从而提 高教学质量和教学效率。 将计算机技术应用于试卷分析中,可提高效率和精度。试卷分析的公式繁 杂,数据繁多,计算量大,如果单纯采用手工计算,既要花费大量的时间,又难 以保证分析结果的准确。目前计算机技术已广泛应用于教学的各个领域,因此根 据教育测量学原理开发试卷分析系统是十分必要的,这样,不仅提高了工作效率, 而且提高了计算的精度,为教育教学工作提供有效的工具。 1 6 本章小结 本章介绍了研究和开发的背景,从理论和实践应用两个方面分析和探讨了网络 考试测评系统的现状,介绍了目前使用的主流技术,指出了目前网络考试系统还 存在哪些不足,然后介绍了本文研究的主要内容和所做的主要工作,并分析了研 究网络考试测评系统的意义。 2 相关教育理论研究 2 相关教育理论研究 网络考试系统的设计和开发离不开教育测量理论、教育统计理论、题库理论 的指导,教育测量和教育统计是考试的基础,是考试研究中的重要问题,传统考 试只是为了取得分数而不注重对试卷的分数进行整理和分析,因此,它不能对试 卷的原始分数作出合理的解释。学生的考分就是“信息源”,通过对分数的收集、整 理、分析研究,对一个考试试卷做出全面统计分析,并把经过加工管理的信息运 用到教育管理中,从而为教育决策提供了事实根据或数量依据。考试质量分析既 是现代考试流程中的一个重要步骤,也是促进考试走向科学化、规范化必不可少 的手段。 2 1 教育测量理论 教育测量的基本原理是借鉴物理测量的思想,力求减少误差,尽可能准确地 反映人在知识、能力等方面的真实水平。它有广义和狭义之分:广义的教育测量 泛指运用测量手段对教育活动所进行的数量化的测定。它涉及的范围很广,凡是 需要并能够测量的、与教育有关的活动均在研究之列。狭义的教育测量专指按一 定规则和程序对学生的知识、智能、个性发展、思想品德等所进行的数量化的测 定。我们通常所提及的多指狭义上的教育测量【5 】。考试作为一种教育测量的术语, 是对教学效果最直接的测量,其公正性、权威性、有效性是毋容置疑的。为使考 试科学化,必须以教育测量为基础,具体说,教育测量就是研究考试从命题、阅 卷、分析到评价等一系列工作的全过程。它从教育学的微观范畴,以客观的定量 分析代替传统考试方法的主观随意性,为测量和考试提供了测量工具以及评价工 具的理论和模式,如测量工具的效度、信度、区分度等,使考试在选才、育才和 用才上更为有效。 教育测量理论主要包括经典测量理论和项目反应理论。 2 1 1 经典测量理论 经典测验理论( c l a s s i c a lt e s tt h e o r y ) 及其方法,起源于斯皮尔曼在本世纪初有 关智力和智力测验的著名研究,至今已有七八十年的历史。目前流行的一些心理 测验和有关测量信度与效度的方法,都是以经典测验理论作为基础的。经典测验 理论包括一些不同的理论模型,其中影响最大的是斯皮尔曼的分数模型。 斯皮尔曼的分数模型提出嘲:任何心理测验所得到的分数( x ) ,都是由反映对 象稳定的一c , , t t 特征的“真分数”( d 和由随机因素造成的误差分数( e ) 这两种成分所 构成。斯皮尔曼的分数模型表示为:x :t 十e 。 7 重庆大学硕士学位论文 这个分数模型对测验分数的意义和性质所作的解释建立在三个基本假设之 上: 测验的观察分数x ,可看作真分数t 和测验误差分数e 的线性组合,模型 中的真分数( t ) 是稳定的,对相同对象多次重复测量的误差分数( e ) 里正态分 布; 误差分数的数学期望为零; 真分数和误差分数是相互独立、互不相关的,两者之间没有显著相关,任 何两次测验所产生的误差相互独立。 在这些假设基础上,经过了近百年的发展,经典测试理论建立了一系列题目 分析的公式,如表示难度的p 值、表示区分度的题目与测试相关系数,估计分数 真值的标准误差及由此推算出来的信度公式等。其理论模式的发展已为时甚久, 所采用的计算公式简单明了、浅显易懂,适用于大多数的教育与心理测验数据、 以及社会科学数据的分析,为目前测验学界使用与流通最广的理论依据。 经典测量的重要内容: 平均分 平均分数是用得最多的一种集中量数。所谓集中量数是指反映分数集中位置 这个特征的数值,它代表一批分数,反映一批分数的典型情况,因此常用它进行 不同分数组之间的比较。集中量数的形式有多种,如算术平均数、中位数、众数 等。算术平均数则是最常用的一种。 设一组分数分别用x 1 ,x 2 ,x n 表示,则这组有n 个分数的分数组的平均 分为: y z x = 导 ( 2 1 ) 、 标准差 对于一批分数,除了要了解它的集中量数外,还应了解它的差异量数,即分 数的分散程度或离散程度。差异量数的形式也有多种,标准差是最重要的差异量 数。 若有n 个分数x 1 ,x 2 ,x n ,这组分数的标准差定义为: s =医而 1 面丁 ( 2 2 ) 试题的难度分析 试题的难度,是指试题的难易程度,该指标与平均分密切相关,确定试题难 度的方法有多种,其中一种常用的方法是利用式 2 相关教育理论研究 p j = i - 詈 其中p j 、s j 、f i 分别表示第j 题的难度,考生的第j 题的平均分和第j 题的满分分 数。如果有n 个考生,则可利用式2 4 x 只= 1 一圭l _ - ( 2 4 ) j n f 。 由考生在第j 题上的得分直接求得第j 题的难度。其 x j i 表示第i 个学生在第j 题 上的得分。由上面的式子可知p j 的最大值是l 表示无一人答对该题,该题的难度高。 最小值是0 ,表示每个学生都答对了该题,则该题的难度低。 试卷的难度 试卷的难度可用各题的难度加权平均求得: p 2 专善只形 ( 2 5 ) 其中w i 为各题的满分值,p i 为各题的难度,w 为试卷的总分,m 为试卷的题目数。 试卷区分度分析 区分度( d i s c r i m i n a t i o n ) 是用来判断试题具有多大能力把成绩较好和较差的学 生档次分开来的指标,即衡量考生掌握各类知识能力水平的指标【1 4 1 。区分度好的 试题,水平高的学生可获高分,而水平低的学生得分低。计算区分度的方法有多 种,用得比较普遍的一种方法是两端分组法。它是比较得分在高、低两端的受试 者通过该题目的比率。把全体考生的成绩从高分到低分逐个排列,把处于前2 7 的考生列为高分组,处于后2 7 的考生列为低分组。假设p h 和p l 分别为高分组 和低分组通过某个题目的百分比,则区分度的计算公式为:d = p h p l ,式中d 为 区分度,d 的值在1 和l 之间。d = i ,表示高分组全部答对,而低分组全都答错; d = 1 则与上面的情形相反,低分组的全部答对,高分组的却全都答错;d = 0 ,则 表示两个分数组的通过率相等。一般认为,d 在0 4 以上就非常好了。 2 1 2 项目反应理论 作为现代测量理论主要代表的项目反应理论是建立在潜在特质理论基础之上 的,它所描述的考生和测验题目之间的关系与经典测量理论是完全不同的。在项 目反应理论中,“项目特性曲线”是项目反应理论的一个中心概念。所谓“项目特性 曲线”就是表征被试的能力或特质水平与其对一个测验项目的正确反应概率之间 关系的二维曲线图,所有关于项目反应理论的研究工作,诸如各类项目反应模型 的提出以及相应参数的估计方法等,都可以看成是围绕这一中心概念而展开的。 项目反应理论的基本假设主要有三种:单维性假设、局部独立性假设、项目 特性曲线假设。 9 重庆大学硕士学位论文 项目反应理论是计算机自适应测验的基本理论。计算机自适应测验从题库的 建设到测题的选择再到最后的评分,都是以项目反应理论为指导进行的。但是, 项目反应理论也存在局限与不足: 对数学模型与实测数据的拟和要求较高。 项目反应理论是一维性假设,是对任何数学模型的共同假设,这是因为测 验编制者都希望提高测验分数的可解释性。但到目前为止,尚没有一种能验证一 维性假设的方法【n 。 2 2 题库理论 题库( i t e mb a n k ) 是“按照一定的教育测量理论,在计算机系统中实现的某个学 科题目的集合”,它是严格遵循教育测量理论,在精确的数学模型基础上建立起来 的教育测量工具。建立题库是一个复杂的系统工程,首先要建立系统的数学模型, 然后确定试题的属性指标以及试题的组成结构,再组织大批量的优秀学科教师编 写试题,为了保证这些试题的科学性和有效性,还要组织大量的被试样本,进行 抽样测试,对试题参数标注的有效性进行校正,编写和测试试题的工作量无比巨 大【引。 在教育测量中,题库是一项理论性强,实际意义重大的基本建设。它的设计 的好坏直接关系到网络考试系统质量的好坏,因此,在进行题库设计过程中,必 须由正确的题库理论进行指导。 题库建设是一项系统工程,它涉及到教育科学与学科教学以及计算机软件技 术的紧密结合,要建设水平较高、规模较大、功能较全的题库,目前仍有一些理 论与实践问题以待解决。 2 2 1 题库优点 题库使标准化考试进一步地完善,具有以下优点【s 】: 提高命题工作的效率 题库是由许多适用于不同目的、知识、技能需要的试题所组成的,如果题库 中包括了学科中所有内容的高质量试题,则命题者的工作就会变得简捷而卓有成 效,同时命题所花费的时间也会减少。 提高了平行试卷的一致性 题库中,由于试题的各种参数经过统一标准的严格核正,用这些试题构成的 平行试卷,其相关程度较高,可以使用不同试卷的内容、难度稳定。 灵活性组卷 由于试题是题库的最小单位,针对不同内容、难度要求,题库很容易生成不 同试卷,因此具有灵活性。从而克服了在没有题库前,标准化试卷修订困难,内 1 0 2 相关教育理论研究 容、难度不一定适合特定要求等问题。 高效性 由于题库中的题目是大量命题工作者的智慧,题目都附有参数,因此可以重 复使用,节省了大量人力、物力和时间。因此我们可以说题库更经济。 保密性能好 传统的大规模考试保密工作是个关键问题。考生如果在考前知道了题目,考 试就不能达到预期的目的。题库,由于题量大,即使题目公开,不靠掌握光靠死 记也很难得高分;再者,由于题库可以因时生成几个平行试卷,一旦泄密也可很 快补救。 总之,从国内外建设题库的经验来看,题库可以从两个方面显示出其优越性 来。第一是题库管理学上的优越性,也就是能做到高效、灵活、经济和高度的保 密性;第二是题库测量学上的优越性,由于对考试范围、能力层次、难度等有严 格的要求,从而使我们根据题库生成的试卷质量更高,统计特性可比,性能更加 稳定一致。 2 2 2 题库建设理论 由于题库建设是个系统工程,整个工作必须建设在坚实的科学的理论基础上, 因此,题库建设的理论是很广泛的,它至少包括以下几个理论:学科体系与教学 目标分类理论、题型功能与命题技术理论、项目分析理论、参数等值理论、试卷 生成理论等【s 】。 学科体系与教学目标分类理论是命题的依据,将决定着整个题库及其生成试 卷的内容与结构难度,题库的学科框架就是要依据它设计和实现的。 题型功能与命题技术理论提供了命题的原则、方法、也提供了评价题库结构 的根本标准,它直接影响到题库中题目的编写、筛选、评价与比例配置等等,所 以是题库建设理论的一个重要方面。 项目分析理论是科学地修订、筛选和调取使用试题的重要理论基础。不进行 项目分析,试题没有参数指标,就不会有科学地筛选、修订和调取使用试题的工 作。但是,项目分析如果不加上等值化处理,试题也无法组成一个有统一质量系 统的题库。 参数等值理论包括试卷总分等值和试题参数等值两部分。试题参数等值理论 是题库建设理论的重要基础。试题参数等值不仅可以将不同质量系统上的试题都 转化到同一个质量系统上来,还可以为今后题库随着测量理论的变化而变化到新 的质量提供了可能。 试卷生成理论是题库生成试卷所必需的理论基础。任何考试,对其施测后的 结果都会有自己的要求,即会提出平均分、标准差、分数分布状态、信度等要求, 重庆大学硕士学位论文 要保证达到这些特殊要求,就必须对题量、质量、赋分等提出要求,这样就必须 建立试卷与试题的某种统计关系,依据它来实现考核的目的。 2 3 教育统计理论 此外,考试作为教育工作的重要环节,运用教育测量的方法对其进行分析离 不开教育统计的理论和方法。教育统计是运用数理统计学的原理和方法研究教育 现象,具体的说,就是研究如何收集、整理、分析推断教育现象中的数据,对教 育科学进行定量分析,用以发现和表明教育现象的某些特征和规律。测量中的“四 度”即难度、区分度、信度、效度指标不过是统计中百分数、平均数、标准差、相 关系数的结果,测量结果的分析和评价离不开统计的估计和检验方法。因此,为 使考试的分数更能反映教育本质特征,使分数更加有效、可靠,在运用教育测量 方法的同时,也应注重教育统计的技术和手斟”。 2 4 相关系数 相关系数是用来描述两个变量( x 与y ) 之间线性关系的性质( 或方向) 和 密切程度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论