基于遗传算法的试题库管理及自动组卷系统的研究_第1页
基于遗传算法的试题库管理及自动组卷系统的研究_第2页
基于遗传算法的试题库管理及自动组卷系统的研究_第3页
基于遗传算法的试题库管理及自动组卷系统的研究_第4页
基于遗传算法的试题库管理及自动组卷系统的研究_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

山东农业大学硕士学位论文基于遗传算法的试题库管理及自动组卷系统的研究姓名杨峰申请学位级别硕士专业机械设计及理论指导教师刘贤喜20080315山东农业大学硕士学位论文摘要试题库管理及自动组卷系统是计算机辅助教学CAI的重要组成部分,它的主要功能是通过计算机建立不同课程的试题库,并根据组卷策略自动生威规定格式的试卷和参考答案。该系统不仅可以减轻教师的工作量,提高工作效率,增强考试的科学性和客观性,而且对提高教学质量、促进考教分离的实施有重要意义。本课题在对试题库理论和自动组卷算法研究的基础上,围绕开发环境选择、后台数据库设计、系统模块开发、组卷算法改进等方面进行研究,设计开发了一套基于遗传算法的试题库管理及自动组卷系统。本系统的功能模块主要包括用户管理模块、课程管理模块、题型管理模块、试题信息管理模块、自动组卷模块和试卷管理模块。阐述了试题库的理论和试卷质量的基本特性,对试题库建设的过程进行了深入的研究和分析,初步构建了机械制造工艺学、新能源的开发与利用、农业工程概论、农业机械学、计算机网络基础及INTERNET应用、创新学六门课程的试题库。采用面向对象的程序设计方法和基于模块的结构技术,构建了试题库管理及自动组卷软件平台,对系统各模块进行了研究,完善并优化了数据存储结构。实现了包含图形、公式和文字的试题的录入,生成了不同课程不同题型的试题库,并实现了对试题信息的查询、修改、删除,而且能够自动生成规定格式的试卷和参考答案,并可以通过WORD排版、打印。引用VB中的PDCHTEXTBOX控件,结合ACCESS中的MEMO数据类型,实现了试题中图文混和信息和公式信息的存取,扩大了系统的应用范围。运用SQL查询语句,结合动态建立数据表的理论,实现了动态添加题型并生成对应题型试题表,打破了传统试题库固定题型的限制,增强了系统的可扩展性。介绍了自动组卷的数学模型和主体思想,讨论了运用遗传算法求解一定约束条件下的多目标参数优化问题,提出了功能块的概念,将组卷的难度、章节、题型和分值等约束条件转化为目标函数,采用自然数编码方案,把改进的遗传算法运用到系统中,优化了组卷策略。通过对六门课程的试题信息的管理,以及自动组卷等功能的测试运基于遗传算法的试题库管理及自动组卷系统的研究行,结果表明,本系统操作方便、运行稳定,扩展性好,较好地满足了山东农业大学对考试考卷的要求。关键词试题库;自动组卷;遗传算法N坐奎奎些奎兰堡主兰垡笙茎一_I_一一ABSTRACTTHETESTBANKMANAGEMENTANDAUTOMATICTESTPAPERGENERATIONSYSTEMLSANIMPORTANTCOMPONENTOFCOMPUTERAIDEDTEACHINGITSMAINFUNCTIONISCONSTRUCTINGTESTBANKOFDIFFERENTCOURSESBYUSINGCOMPUTERANDGENERATINGTESTPAPERANDANSWEROFREGIMENTEDFORMATAUTOMATICALLYUSINGTHISSYSTEM,WECANLESSENTHEREPEATEDWORKOFTEACHERS,IMPROVETHEEFFICIENCY,INCREASETHEOBJECTIVITYOFTEST,IMPROVETHEQUALITYOFTEACHINGANDEMBODYTHEPRINCIPLEOFSEPARATIONOFTEACHINGFROMEXAMINATIONBASEDONTHETESTBANKMANAGEMENTANDAUTOMATICTESTPAPERGENERATIONALGORITHM,THECHOICEOFOPERATINGSYSTEMPLATFORM,THEDESIGNOFBACKGROUNDDATABASEANDTHEIMPROVEMENTOFALGORITHMINGENERATINGTESTPAPERALESTUDIEDTHEFUNCTIONSMODULESOFTHESYSTEMINCLUDEUSERMANAGEMENT,COURSEMANAGEMENT,TYPEMANAGEMENT,TESTQUESTIONMANAGEMENT,TESTPAPERGENERATIONANDTESTPAPERMANAGEMENTTHEORIESOFTESTBANKANDTHEBASICCHARACTERISTICOFTESTPAPERARCEXPOUNDEDANDTHECOURSEOFTESTBANKCONSTRUCTIONARESTUDIEDANDANALYZEDDEEPLYTHETESTBANKINCLUDESSIXCOULSESSUCHASTECHNOLOGYOFMECHANICALMANUFACTURE,DEVELOPMENTANDUTILIZATIONOFNEWENERGYSOURCES,INTRODUCTIONTOAGRICULTURALENGINEERING,AGRICULTURALMECHANICS,BASICCOMPUTERNETWORKANDINTERNETAPPLICATIONANDSCIENCEINNOVATIONPRELIMINARILYBYADOPTINGTHEOBJECTORIENTEDDESIGNMETHODANDTHESTRUCTUREWITHTEMPLATETECHNOLOGY,THEPLATFORMOFTHETESTBANKMANAGEMENTANDAUTOMATICTESTPAPERGENERATIONSYSTEMISCONSTRUCTEDSEVERALFUNCTIONMODULESARESTUDYEDANDTHEDATASTRUCTUREISCONSUMMATEDALLTESTSINCLUDINGCHARACTER,GRAPHICSANDFORMULACANBEENTEREDAUTOMATICALLYANDTESTBANKCANBEGENERATEDOFDIFFERENTCOURSESANDTYPESTESTSFROMDIFFERENTCOURSESCANBEINQUIRED,MODIFIEDANDDELETEDANDTESTPAPERANDARLSWEROFREGIMENTEDFORMATCANBEGENERATEDAUTOMATICALLYANDCANALSOBESETTEDTYPEANDPRINTEDTHROUGHW6RDIII基于遗传算法的试题库管理及自动组卷系统的研究THERICHTEXTBOXCONTROLOFVISUALBASICISCOMBINEDWITHTHEMEMODATATYPEOFACCESSANDTHESTORAGEOFPICTURE,TEXTANDFORMULAINFORMATIONISREALIZEDTHEAPPLICATIONEXTENSIONOFTHESYSTEMISEXPANDEDAPPLYINGSQLANDTHETHEORYOFESTABLISHINGDATATABLEDYNAMICALLY,ADDINGTHETYPEOFTESTANDGENERATINGTHECORRESPONDINGDATATABLEAREREALIZEDTHETRADITIONALFORMATWITHLIMITEDTYPEOFTESTISBROKENANDTHEEXPANSIBILITYOFTHESYSTEMISSTRENGTHENEDTHEIDEASOFTHEMATHEMATICALMODELANDTHEMAINIDEASOFTHEAUTOMATICTESTPAPERGENERATIONAREINTRODUCEDTHEMULTIOBJECTPARAMETEROPTIMIZINGPROBLEMWHICHISSOLVEDWITHGENETICALGORITHMISDISCUSSEDANDTHECONCEPTOFFUNCTIONBLOCKISPUTFORWARDPARTOFTHERESTRICTINGCONDITIONOFPAPERFORMINGSUCHASDIFFICULTY,CHAPTER,TYPEOFTESTANDMARKARECONVERTEDTOOBJECTIVEFUNCTIONNATURALNUMBERCODINGISADOPTEDANDTHEIMPROVEDGENETICALGORITHMISUSEDINTHESYSTEMTHROUGHOUTGAANDIMPROVEMENTUPONTHETRADITIONALGA,COMPOSITIONPAPERSSTRATEGYCANBEOPTIMIZEDTESTQUESTIONSOFSIXCOURSESAREMANAGEDANDAUTOMATICTESTPAPERGENERATIONISINTEGRATEDANDDEBUGGEDTHECONSEQUENCESHOWSTHATTHESYSTEMISCONVENIENT,STEADYANDEXPANDABLEITCANSATISFYTHEREQUIRESOFTESTPAPERANDEXAMINATIONOFSHANDONGAGRICULTURALUNIVERSITYKEYWORDSTESTBANK;AUTOMATICTESTPAPERGENERATION;GENEFICALGORITHMIV关于学位论文原创性和使用授权的声明本人所呈交的学位论文,是在导师指导下,独立进行科学研究所取得的成果。对在论文研究期间给予指导、帮助和做出重要贡献的个人或集体,均在文中明确说明。本声明的法律责任由本人承担。本人完全了解山东农业大学有关保留和使用学位论文的规定,同意学校保留和按要求向国家有关部门或机构送交论文纸质本和电子版,允许论文被查阅和借阅。本人授权山东农业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。保密论文在解密后应遵守此规定。论文作者签名导师签名日期山东农业大学硕士学位论文1绪论1。1研究背景和意义考试一直是教学过程中不可或缺的部分,是对学生所学知识和能力的一种评价,也是检验教师教学成果的种手段。目前许多考试的实施过程并不完全科学,考试手段落后,命题内容、评分标准等由于受各种人为因素的干拢,缺乏普遍的可比性,考试信度较低。例如,传统的考试是由任课教师分别主持,命题原则不同,评分标准和评分方法不同,带有较大的主观性,不够客观和准确。随着计算机科学和网络技术的迅速发展和广泛应用,计算机技术已进入现代教育领域并形成一门新兴的边缘科学计算机辅助教学CAICOMPUTERAIDEDINSTRUCTION。利用计算机建立试题库,实现计算机自动选题组卷,是CM工程的重要组成部分,是实现考试规范化、科学化的重要措施,更是实现考教分离的一个重要手段【L】。利用计算机组卷,不仅能节省教师的时间,提高工作效率,而且能消除命题入主观意志的影响,使考试更加标准化,更加客观、真实、全面地反映教学的实际效果,有利于促进教学质量的提高。建立了试题库系统后,可实行考教分离,促使任课教师按照教学大纲的要求认真备课,认真组织教学内容,改进教学方法,对提高教学质量和整体教学水平有着非常重要的意义。每次考试后,还可以利用计算机对试卷和考试分数进行分析和评价,减少了教师的工作量,提高了效率和精确度,而且也使考试这一教学环节更加科学化。我们山东农业大学自2005年本科评估和整改以来,不仅对试卷的质量提出了更高的要求,而且还要求在成卷的同时要有对应的标准答案、评分标准等,这势必给教师增加了更大的工作量,而且不能保证出题的科学性和全面性,进而不能准确反映学生的学习效果。为充分检验教学情况,提高师生的积极性,学校明确提出推进考教分离的建议。为促进我校的教学改革,顺应考教分离,提高教学水平,本研究在VB编程环境下通过对试题库系统的构建和遗传算法的改进,开发了一套基于遗传算法的试题库管理及自动组卷系统。该系统不仅能录入包含图基于遗传算法的试题库管理及自动组卷系统的研究形、公式和文字的试题,生成不同课程不同题型的试题库,并实现了对试题信息的添加、查询、修改、删除,而且能够自动生成规定格式的试卷和参考答案,并可以通过WORD排版、打印。系统的建立不仅可以促进考教分离的顺利实行,节省大量的人力物力,而且可以提高命题的科学性、规范性,增加试题的保密性,将成为教师搞好教学、提高教学质量的有力工具。12国内外发展及研究现状121试题库的国内外发展及研究现状试题库是“按照一定的教育测量理论,在计算机系统中实现某个学科题目的集合“,它是遵循教育测量理论,在一定数学模型的基础上建立起来的一种测量工具【2J。试题库在教学实践中有很多特点,而管理上的特点和测量上的特点较为突出,在管理上它可以实现数据管理的高效、经济、灵活和保密等优势,在测量上能够实现高质量、高效率和高性能。因此,利用计算机试题库系统可以实现试题考试的随机性、公平性、多态性和综合性,从而提高考试的可信度和教学的质量。国际上对试题库的定义、优点和评价指标体系做了认真的研究,并对建库理论、建库工具、库的结构和库的校正等做了探讨【3】。在建库理论方面,心理测量专家们提出了各种理论模型和参数估计方法,并探索各种理论模型在实践中的应用条件与实例。国外大型试题库的建设是从二战后开始的,如今发达国家的考试专业机构都根据自己承担的职能建立起大型题库,没有试题库的考试机构很难体现出其应有的专业性。由于基于计算机的考试的蓬勃发展和试题库研究的不断深入,美国心理协会APA在1986年出版了关于如何开发、使用计算机化考试以及解释考分的指南,这成了考试和软件开发者和出版商的事实标准41。投入实际使用的例子有,1982年采用远距离教育方式的美国学院AMERICANCOLLEGE开始用计算机进行测验,当时被称为“点播测验EOD”,学员可以在认为准备好的任何时候参加某F7课程的考试【5】;1993年ETS实现了计算机适应性ORE考试;从1994年开始,美国护理证书考试全在计算机上进行。目前,国外许多大型测验出版机构、地区教育主管部门、地区学校以及工业2山东农业大学硕士学位论文和专业资格认证机构都以某种测量理论为指导建立试题库、编制试卷等进行各种相关研究16】。在我国,华东师范大学、北京师范大学、江西师范大学等高校都在进行教育测量理论应用于试题库建设方面的研究【_71。北京师范大学电子系已完成了七五科技攻关项目“面向大专CAI开发环境工具”的子项目“通用题库生成系统的研究“硕士论文,并通过机电部的技术鉴定;清华大学和北京理工大学分别主持完成了国家教育科学七五项目“具有中国特色的高等教育评估制度的研究与实践“子课题中高校工科“大学物理“和“高等数学“两门课程的试题库系统【8】。作为我国最大规模的对外考试类别,汉语水平考试HSK也在积极探索建立计算机试题库的可能性,并以此为基础实现计算机化的考试。另外,国家教育委员会考试中心还主持召开了有关题库理论和应用的研讨会,并且组织编写了文献,为我国试题库事业的发展打下了一定的基础。随着计算机事业在我国的发展,试题库在我国的应用也越来越广泛。很多单位结合自己的学科教学、职业培训和职业技能鉴定等实际需要,纷纷建成了试题库。然而,由于每个单位建设试题库的需求和目的不同,目前存在的试题库管理系统还有很多局限性,主要表现在1有的试题库是以整张试卷为单位把试题存放在试题库中,仅仅是把历史上使用过的试卷电子化保存,无法实现自动组卷和考试分析,题库的利用率不高。2就使用范围而言,有很强的封闭性,不能根据自己学科的实际情况进行调整,缺乏可扩充性和灵活性。3有的试题库仅仅是以题目为管理对象的数据库功能的简单扩展,试题库结构设置不合理,没有对录入试题的基本特性的分析,不能保证库中试题的质量。4往往只有固定的题型,不能动态添加,无法保证系统的可扩展性,进而不能实现系统的通用性。5忽略了试题存在图形、公式等非文本信息的问题,往往只能输入纯文本信息,不能满足工科课程的需要。6组卷策略一般采用随机出题或随机参数选择,该方法具有很大基于遗传算法的试题库管理及自动组卷系统的研究的随意性和不确定性,无法从整体上把握题库不断变化的要求,不具有智能性。因此,为了更好地普及计算机成卷,有必要研制一个通用的采用先进的组卷方法的试题库成卷系统。为此,本文着重对试题库结构设计和组卷算法进行研究,应用试题库的理论、试卷质量的基本特性和教育测量学的理论,对试题库建设的过程进行了详细研究和分析,通过建立一个数学模型,结合遗传算法理论,把改进的遗传算法应用到系统中自动组卷模块中,应用VISUALBASIC语言生成一个面向多学科的试题库管理及自动组卷系统。12。2CAI的现状与发展方向计算机辅助教学COMPUTERASSISTEDINSTRUCTION,CAI是将计算机应用于教育领域的主要方面,是以计算机帮助或替代教师执行部分教学任务,传递教学信息,对学生传授知识和训练技能,提高教学效率和增强教学效果为目的的现代教学技术【91。它是计算机科学、教育学、心理学、学科知识等多学科交叉形成的一门新兴学科。在国际上始于20世纪50年代末,在20世纪70年代后期已有CAI专著问世,形成了CAI课程【LO】。20世纪80年代初,我国也逐步开展对CAI的研究,经过几十年的发展,逐渐形成了自己独有的理论研究和开发应用范畴,产生了一套专门的概念、教学模式、工作方法和常用技术【111。随着计算机技术、教育理论及教育的发展,CAI应用已经由少数学科发展到几乎每一学科,并已在大、中、小学全面铺开,对现代教育产生了革命性的影响。以计算机为核心的CAI是一种新的教学方式,体现了新的教学思想,它进行的是个别化教学,具有交互性和因材施教的能力,这为培养高质量的人才提供了活动空间和先进的教学手段,新的教育思想和教学原则也逐步在新的计算机环境中确立起来【12。13】。目前CAI的形式主要表现为1CAI智能化以认知学为理论基础,将人工智能技术应用于CAI,是智能化的CAI即ICAIT悼15】。1970年CARBONEL与他的同事们开发出教授南美洲地理简单概况的SCHOLAR系统【16】,该系统研究了许多教学法策略和人们的推理,4山东农业大学硕士学位论文他们成功地把人工智能技术引入到系统设计中,它开创了ICAI研究的先例。1973年,BROW和BURTON设计成功的SOPHIE系统,用电子线题库系统中试卷生成与分析的研究线路仿真的方法【171,1975年,STANFORD大学的SUPPES和他的同事开发出EXCHECK系统IL引,该系统通过自然推理自动生成课题,可开设逻辑学、集合论和定理证明方面的完整的大学水平课程。1977年,MLT的GOIDSTEIN和CARR设计成功的“计算机教练“系统,建立了学生模型和教师模型【L刿。1981年,南巴黎大学KOFFMAN成功设计出教“微分“的ICAI系统。ICAI在上世纪末的研究十分活跃【201。1993年8月国际计算机教育促进会AACE在爱丁堡主办了第一届人工智能与教育国际会议AIED93,会上协作型教育模式、认知学生模型的建造、智能超媒体辅助教学系统是最新的研究热点。目前,ICAI教学正朝着网络化、多媒体化、虚拟化和国际化方向发展。在INTEMET和WWW上研究与开发适于教学训练的ICAI课件,形成有效的虚拟校园,这已成为当前国际上的研究热点之一。英、美等许多国家的普通高校都相继建立了虚拟大学VIRTUALUNIVERSITY,积极进行网上教学的试验与研究,例如英国的CVU项目和加拿大的NBCC虚拟校园【2L】。2CAI多媒体化这种形式的CAI广泛应用了90年代兴起的多媒体技术,综合处理和控制文字、声音、图形、图像、动画和活动视频等多种形态的媒体信息,并按照教学活动的需要在诸多媒体元素之间建立起一题库系统中试卷生成与分析的研究一定的逻辑关联目前广泛以超文本超媒体方式来实现,从而把它们有机组合并呈现出来,同时完成一系列随机性的人机交互式操作,在这个交互过程中实现教学目树团。多媒体课件形式多样生动活泼、高度交互因材施教、信息量大、重现力强、界面友好、操作简便,因此目前许多学校都相继建立了多媒体教室,运用多媒体课件辅助教学。3C触网络化这是当前最盛行的CAI方式。网络和多媒体技术与教育理论结合的CAI环境,改变了学生和教师在教学中的地位,实现了“学生为主体,教师为主导”的现代教育思想,给学生提供了生动、完善的教学环境,打破了时空范围,实现了资源共享,获得最佳的教学效果。这种新型的教学环基于遗传算法的试题库管理及自动组卷系统的研究境是以校园网教学系统为代表。一般学校常用的应用系统有多媒体网络教室、多媒体电子阅览室、网络多媒体课件制作系统、课件点播系统、远程教学系统等。利用计算机建立试题库,实现自动组卷,是CAI工程的重要组成部分,是实现考试规范化、科学化的重要措施,更是实现教考分离的一个重要手段。CAI对试题库建设的促进作用是巨大的,带来的变革和进步促进教育的跨越式发展。123考教分离与试题库建设所谓考教分离就是把考试和教学分开,根据培养目标、教学目的和教学大纲建立不同类型的题库、命题、阅卷评分等较为完整的考核管理系统2A25】。就目前我国高校已经实施的考试类型来看,大致可分为轻度、中度和全考教分离类型。与传统的考教合一方式相比较,它正在显现出其优势,当然这种考试形式还有一些不足,但与考教合一等传统考试形式进行相比较却是利大于弊,它将成为我国高校考试改革的必然趋势。1能充分发挥考试的监控作用。传统的考试都由任课教师自己出题,主要目的在于评定学生的学习成绩。虽然也有一定的自我检查作用,但有很大的随机性、主观性。不同教师间,甚至同一教师的不同次考试间,所得的结果都很难用来作为相互比较的依据。从而给评定教学质量、分析教学状况带来困难。由学校或更大范围的组织的统考,则能真正起到监控作用,进而促进学风、教风根本好转。2有利于促进学风、教风好转。考试成绩是评定学生学习的主要依据【261。只有当考试成绩是客观而公正的时候,才能引导学生努力学习。但现行考试制度常为不正之风开方便之门。少数学生受社会上不良风气影响,平时学习不努力,考试时找老师划重点,探考题,严重败坏了学风、校风。成绩评定失去公正,结果助长了歪风,伤害了刻苦学习的学生的积极性。实行考教分离,从制度上杜绝了这种可能性,也为教师解脱许多麻烦。考教分离也有利于引导学生主动、全面地去掌握所学知识,不再只是围着教师转【271。单纯地记笔记、背笔记,考前突击一下的学习方法,很难6山东农业大学硕士学位论文获得优异成绩必须系统复习所学课程,并广泛阅读参考文献,才有可能取得优异成绩。3能为教学管理提供可靠、科学的依据。传统的考试方法,命题的水平取决于任课教师一人。由于教师的水平、工作态度等方面的差异,导致并非所有的考试都具有一定的信度和效度【281。利用这样的考试结果反馈,教学管理部门很难作出客观的分析,很难提出有效的措施来改进教学。只有使用科学命题的试卷,统一考试、统一评卷,才能为教学管理提供可靠的、科学的依据。因此,实行考教分离,有必要建立校级管理的试题库【29。301。可以说,实行考教分离的目的,只有通过建立科学的试题库才能实现。而试题库质量的高低,也直接关系到考教分离的效果。因此,为使考教分离真正发挥应有的作用,必须首先按一定的命题要求,构建好试题库。13本文的研究内容和结构安排131本文的研究内容1试题属性的分析利用数理统计原理对试题进行理论分析,主要是从试题本身的属性以及试题所要测量的等级上进行研究与说明,以便进行科学的试题筛选与录入等工作。本系统实现了试题属性的分析,主要有信度计算、效度计算、难度计算和区分度计算等。2试题库的设计在对试题属性进行分析之后,确定试题库设计算法,以便于试题库的操作和维护。在进行试题库设计时主要进行了试题库内表关系的分析与建立和试题库表信息的定义等工作。3系统框架设计及各个模块的设计利用面向对象的方法设计系统框架,完成各个模块的开发。系统框架设计从总体上是由六个模块组成的,分别是用户管理模块、课程管理模块、题型管理模块、试题管理模块、自动组卷模块和试卷管理模块。4确定各个模块的程序实现在进行各个模块的总体设计之后进行模块的程序实现,在进行程序实7基于遗传算法的试题库管理及自动组卷系统的研究现时,主要从程序语句的优化性、可移植性和快速性方面进行分析、设计与实现。5图文混和信息的处理本系统解决了包括图形、公式等图文混和信息的输入,输出。在排版上,本系统主要探究了如何使得图文混和信息输入到试题库中,并在抽取试卷的过程中输出到WORD中,从而解决了纯文本信息和图文混和信息的存取。6自动组卷模块算法的实现自动组卷模块是系统的核心模块,本论文讨论了运用遗传算法求解一定约束条件下的多目标参数优化问题,提出了功能块的概念,将组卷的难度、章节、题型和分值等约束条件转化为目标函数,采用自然数编码方案,把改进的遗传算法运用到自动组卷模块中,较好地实现了组卷策略。7系统的安全性分析与设计系统增设用户权限管理,增强了试题库的安全性。132本文的结构安排本文第一章简单介绍了课题研究背景和意义、国内外发展和现状以及课题研究内容和本文的结构安排。本文第二章主要介绍自动组卷系统的理论依据,包括教育统计与教育测量理论、影响试卷质量的因素、影响试题质量的因素以及各因素之间关系的分析等。本文第三章分析了系统选用的开发语言、数据库以及整个系统的需求。阐述了系统的总体设计,主要包括试题库的结构设计、试题库字段属性,并以本系统的主窗体为例介绍了用VB编程所涉及的基本概念,并详细介绍了数据库中所有表的设计。本文第四章介绍组卷算法设计,包括对组卷的策略的分析、遗传算法的理论研究、遗传算法的改进以及改进遗传算法在组卷中的应用。本文第五章为系统各个模块的具体设计与实现,包括系统的总体结构设计、系统功能模块的划分、系统的主要界面、采用的关键技术和部分主要功能实现源代码等。本文第六章是对全文的结论和展望。8山东农业大学硕士学位论文14本章小结本章分析了当前试题库存在的问题,简述了基于遗传算法的试题库管理及自动组卷系统产生的背景,综述了试题库的发展历史、国内外研究现状以及成功开发的案例,结合计算机辅助教学、考教分离与试题库建设的关系,阐明了试题库建设的必要性,总结了试题库建设与自动组卷实用化的技术要点,明确了本课题的研究内容、目的和意义。9基于遗传算法的试题库管理及自动组卷系统的研究2自动组卷系统的理论基础21教育统计与教育测量理论自动组卷的目的是进行有效的教育测量。教育测量要符合教育规律J它是以教育统计与教育测量理论为理论基础。教育测量的基本原理是借鉴物理测量的思想,力求减少误差,尽可能准确地反映受测者在知识、能力等方面的真实水平【30】。它有广义和狭义之分广义的教育测量泛指运用测量手段,对教育活动所进行的数量化的测定【3L】。它涉及的范围很广,凡是需要并能够测量的、与教育有关的活动均在研究之列,如教育投入、教育过程各要素、教育的效果等。狭义的教育测量专指按一定规则和程序对学生的知识、智能、个性发展等所进行的数量化的测定。我们通常所提及的多指狭义上的教育测量。考试是指通过二定的试题对受测者所引起的行为样本的测量,是对教学效果最直接的测量,其公正性、权威性、有效性是毋容置疑的。为使考试科学化,必须以教育测量为基础,具体地说,教育测量就是研究考试从命题、阅卷、分析到评价等一系列工作的全过程【32】。它从教育学的微观范畴,以客观的定量分析代替传统考试方法的主观随意性,为考试提供测量工具,以及评价工具的理论和模式,如测量工具的效度、信度、区分度等。考试作为测量工作的重要形式,运用教育测量的方法对其进行分析就离不开教育统计的理论和方法。教育统计是运用数理统计学的原理和方法研究教育现象,具体地说,就是研究如何收集、整理、分析推断教育现象中的数据,对教育科学进行定量分析,用以发现和表明教育现象的某些特征和规律。测量中的“四度”即难度、区分度、信度、效度指标皆是统计中百分数、平均数、标准差、相关系数的结果,测量结果的分析和评价离不开统计学的估计和检验方法【3334】。因此,为使考试的分数更能反映教育本质特征,使分数更加有效、可靠,在运用教育测量方法的同时,也应注重教育统计的技术和手段。试卷作为考试运行的真正载体,其内容决定着考试的质量。科学地编制试卷,真实地反映教学水平和有效地测定学习效果,这是教学工作的重要环节,也是本文研究的重点。LO山东农业大学硕士学位论文22影响试卷质量的因素组卷就是按照给定的组卷策略,从试题库中抽取适当的题目组成一份符合要求的试卷。根据教育测量理论,衡量试卷质量的基本因素是试卷的信度和试卷的效度。221信度1信度的定义信度RELIBAILITY指的是测量结果的稳定性程度,简单地说就是测量结果的可信程度。如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫信度【361。各种类型的测量,无论是物理测量还是教育测量,先后向同一对象施测后,所得数值很难做到绝对一致。每次测量结果实际上包含了被测量特质对象的实际水平和测量误差两部分。如果每次测量结果中误差部分都很小,那么测量结果必然是稳定的。在进行测量时,误差是难免的,这就使得真实值和测量值之间是不可能完全一致。可以用下式表示真实值和测量值之间的关系。XTBE丁表示真实值,B表示偏差即系统误差,E表示测量误差即随机误差。由于系统误差很难分解,因而有些书中的分解式将系统误差包括在真实值之中,因而X可以简单地概括为X丁E对于测量误差E,一般假定它的期望值是0,却与真实值相独立,在此假定下,可以证明EXET,即实得分数和真分数的总体均值相等。盯2X盯2T仃2E,即实得分的方差等于真分数的方差与误差方差之和。2信度的类型信度系数越大,表明测量的可信程度越大。在实际应用中,信度主要有以下几种类型重测信度法TESTRETESTRELIBAILITY重测信度指的是同一量表测验或评价表对同一组被试施测两次所基于遗传算法的试题库管理及自动组卷系统的研究得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。重测信度假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。因此,重测信度的服务体系也用于估计测验结果以测验分数表示经过一段时间后,是否仍然维持稳定、一致的特性。复本信度法ALTERNATEFORMSRELIABILITY复本信度是以两个等值,即题型、题数、难度、区分度等指标都一致,但具体内容不同的试卷,在短时间内对同一个应试群体先后实施两次考试,将两组分数的相关系数作为信度,其实质是通过平行考试来求信度。而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。折半信度法SPLITHALFRELIABILITY折半信度法是将考试试卷分为对等两半,计算两半得分的相关系数,进而估计整个考试试卷的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。3影响信度的因素信度是测量过程中随机误差大小的反映。随机误差大,信度就低,随机误差小,信度就高。测量过程能引起随机误差的因素,比如被试、主试、测试内容、施测情景等都会影响测量信度。被试者个体差异的程度由于被试者之间的差异,其真分数也就参差不齐。表示这种差异情况的统计量是全距和方差,当全距较大时,说明真分数大小差异悬殊,其方差也就较大反之,当全距较小时,说明真分数大小比较整齐,其方差也就较小。根据信度公式可知,信度也将随之变化。试卷的长度试卷的长度主要是指试卷所包含题目的多少。题目越少,则考试得分就越容易受试题抽样偶然性的影响,因而考试信度也越低。一般情况下,加大试卷的长度就能提高考试的信度。试卷内容的同质性程度一般地,内容性质相同或相近的试卷,和内容性质不同或相差较远的试卷比,前者信度往往较高,后者信度往往偏低。12山东农业大学硕士学位论文试卷的难度尽管试卷的难度对信度没有直接的关系,但它却对考试的分数分布状态发生直接的影响,当考试难度过高或过低时,分数分布呈偏态分布。此时得分大部分集中在低分段或高分段,分数分布的范围和分数之间的差异较小,从而求得的可观察分方差也较小,根据信度公式可知,此时的信度也就小。222效度1效度的定义效度VALIDITY,就是一次测量的有效程度,是指一个测验或量表实际能测出其所要测量的特性的程度137。测验或量表是测量使用的工具,如果测量能测出其所要测的特性,我们就认为这个测验或量表是有效的。效度指标是测量质量的一个重要的方面,测量工具效度太低,就失去了存在的价值。效度是反映一项考试实现其既定目标的成功程度的指标。考试效度指的是根据考试分数做出推论或预测的准确性程度,是程度上的概念。评价试卷效度的高低,主要看它达到既定目标的程度。2仃效度YRR的定义为Y盯DX其中,仃,2为潜在真分数方差,仃R2为可观察分数方差。2影响效度的因素从效度的定义式分析,影响效度的因素主要是系统误差。除系统误差外,影响效度的因素还有以下几方面考试内容的同质程度对于效度来说,试题之间的同质程度越高,内在一致性系数越大,则效度就越低。因为一个试题测量了因素A,若其它试题也同质,即有较高的内在一致性,那么它们测量的也是因素A,而其他因素则没有测到。应考者差异程度与信度一样,效度与应考者的差异程度也有一定的关系。因为当应考者相对差异较大时,其潜在真分数差异也相应增大,从而带动潜在真分数方差的增大,使效度提高。反之,当应考者相对差异较小,总体水平较接基于遗传算法的试题库管理及自动组卷系统的研究近时,效度就较低。试卷的长度试卷的长度题量不但与信度有关,也与效度有关,在其它条件不变的情况下,若增加题量,则对提高效度有益。3效度与信度的关系试题的信度和效度,是表征考试质量的两个重要指标,两者并不是相互独立的【38】。信度是考试实施过程中从命题到评分准确性的量度,而效度则是包括考试设计、实施、测试数据使用的整个考试测量真实性的度量。信度是反映多次实施相同测试其结果的稳定性、一致性的指标,而效度则是反映考试符合的目的性、考试结果实现目标的程度的指标。信度是通过两个相同测试的结果的相关程度来表示的,而效度则是通过一项考试与代表目标的标准考试结果的相关程度来表示的。它们之间的联系可以说信度是效度的一个必要条件,即对一个测验来说,如果没有相当的信度即不可靠,那就无效度可言了。但若有信度,那也未必有效度。因为信度高的测验并不一定能表示测验结果是正确的。23影响试题质量的因素根据教育测量理论,影响试题质量的因素主要是试题难度和区分度。231难度1难度的定义难度通常就是指被试完成题目或项目任务时所遇到的困难程度。它可分为绝对难度和相对难度两种。绝对难度又称认知难度,是指项目本身固有的难度;相对难度又称统计难度,是学生实测后,经计算得到的难度指标。被试学生作答一个题目所遇到的困难程度的量数,就叫题目的难度系数,也常称为难度值,用符号G表示。D公式表示为G,1一二甩其中,G。为试题F的难度系数,足为该题平均得分值,甩为该题满分值。2难度的性质14山东农业大学硕士学位论文难度主要有三个特性,即相对性、计量性和区问性。相对性指试题的难度大小是相对于特定的考试和特定的应考者而论的。换言之,同一个试题,对不同的应考者,其具体的难度值是不同的。也就是说,难度指标具有样本依赖性。正因为如此有人提出了相对难度与绝对难度的概念。计量性指难度是一个明确的、量化的指标。平时,在谈论题目的难或易时,是一种定性的、模糊化的判断,而在经典测量理论中,难度是具体的指标,其具体数值是来自测试或考试后的统计分析。区间性指难度的取值范围是一个0至1之间连续变化的闭区间,当难度值为0时,意味着某个试题对特定的对象某应考者群体而言,是最容易的试题;反之,当难度值为1时,则是最难的试题。3难度和分数的关系试卷的难度指一份试卷的总体难易程度,显然试卷的难度是由试卷中每道题目的难度来决定的。试卷的难度中等时,考生的分数分布呈正态分布。试卷难度较大时,考生的分数较低,低分区出现高峰,呈负偏态分布。试卷难度较小时,考生的分数较高,高分区出现高峰,呈正偏态分布【391。试卷难度与分数的关系示意如图21所示。试卷的难度与平均分之间的关系X矿1一尸其中X为所有考生的平均分,形为试卷的满分,P为试卷难度。考生频数图21试卷难度与分数的关系示意图FIG21DIAGRAMOFRDATIONBETWEENMARKANDDIFFICULTY分数基于遗传算法的试题库管理及自动组卷系统的研究2。32区分度1区分度定义试题的区分度是衡量某试题对于不同水平应考者的鉴别能力程度的指标,是区别被试能力的量度,常记为D。区分度高的题目能有效地区分水平不同的学生,区分度低的题目则不能有效地区分水平不同的学生。测量专家把试题的区分度称为测验是否具有效度的指示器,并作为评价项目质量、筛选项目的主要指标与依据。具有良好区分度的试题,对应考者有较强的鉴别能力,在这些试题上,水平高的得高分,水平差的得低分。反之,区分度低的试题,对应考者的鉴别能力差。2区分度的计算估计区分度的方法采用分组法【柏】,操作过程如下第一步,分组。将所有被试按总分顺序排列从高到低,从低到高都可以,然后将这些被试分为三组从最高分开始的总人数的27分为一组,称为高分组;从最低分开始的总人数的27分为一组,称为低分组;余下的46为一组。第二步,统计。假设要计算A题的区分度,统计分为两步计算高分组中A题的得分率,用符号晶表示;计算低分组中A题的得分率,D用符号表示。其中,P等塑。分第三步,计算。A题的区分度公式为D岛一昱例如,表21为计算山东农业大学20042005学年第一学期机械制造工艺考试试卷中各试题的区分度情况。表21某次考试试卷中各试题的区分度计算TAB21DIACRITICALDEGREEOFTESTQUESTIONESINATESTPAPER16山东农业大学硕士学位论文研究表21发现,第1题和第2题区分度低,第3题区分性能较好,第4题区分度过高。由计算公式可知从理论上说区分度是从O到1之间的一个数,难度接近于0很容易的题和难度接近于1很难的题区分度都低。3试题区分度与信度的关系试题的区分度与试卷的信度有密切的关系。试题的区分度越高,它对提高试卷信度的贡献就越大,试题的信度就越好。4试题区分度与难度的关系试题的难度和区分度有密切的关系。调整试题的难度是提高试题区分度重要方法。一般地说,试题具有中等程度的难度O306,试题的区分度较大。试题的难度不仅影响着试题的区分度,影响考生成绩的相对分布,还直接决定着考生成绩的绝对值,决定全体考生平均分数的高低。有时为了满足不同的考试目的,对试卷的难度与区分度要做适当的选择,例如,对于选拔少数优等人才的择优考试,除了试卷的难度要大之外,试卷的区分度也要大;对于考查学生的学习效果的考察性考试,一般要求大多数人通过,试卷的难度和区分度都不选太大值;对于某些科类的资格考试,试卷的难度要较大,而区分度要适中,保证一定的过关率。通过对难度和区分度的调整使试卷适用于不同目的得考试要求。24本章小结本章运用教育测量和教育统计的基本原理和方法,分析研究了影响试卷的因素,并讨论了信度和效度的原理及相互关系。对于组成试卷的基本元素试题,本章探讨了影响其质量的两个重要因素,试题难度和试题区分度。通过对试题难度和区分度的认识和分析,研究清楚它们之间的关系以及对整体试卷的作用,为自动组卷系统中试题库的设计和算法的设计提供理论依据。17基于遗传算法的试题库管理及自动组卷系统的研究3系统的开发工具和总体结构设计31数据库理论基础311数据库的基本概念数据库是数据管理的最新技术,是在文件系统的基础上发展起来的。早期的数据处理系统是由大量的文件构成的【411。这些文件的数据是面向应用的,一个文件对应一个或几个应用程序,数据冗余度大;不便于多用户共享;对数据的维护也非常困难;而且要修改数据时要多处去改动,容易造成数据的不一致性;文件不便扩充,不能表述复杂的数据模型。因此在20世纪60年代末,随着数据量增大,共享性要求高,产生了数据库。数据库中的主要概念如下数据数据库中存储的基本对象,文字、图形、声音、档案记录等都是数据,我们把描述事物的符号记录称为数据DATA。数据处理就是利用计算机对数据进行输入、输出、整理、存储、分类、排序、检索、统计等加工过程。数据库DATABASE,简称DB是以一定的组织方式存储在一起的相关的数据集合,它是一有组织地、动态地存储大量关联数据,方便用户访问的计算机软、硬件组成的系统。即数据库是按一定数据方式组织、存储和管理数据的仓库。数据库管理系统DATABASEMANAGEMENTSYSTEM,简称DBMS为数据库的建立、使用和维护而配制的软件,使在操作系统支持下运行的。数据库应用系统在某种DBMS支持下开发的数据库应用软件。数据库系统DATABASESYSTEM,简称DBS是数据库、数据库管理系统、数据库应用系统的统称。数据库是现代管理信息系统不可缺少的一部分。同文件系统相比,数据库系统具有数据的最小冗余性、数据的共享性、数据的统一管理与控制等特点。312数据库系统的特点1实用性强一个精心设计、性能优良的数据库系统,能够反映整个企业单位或18山东农业大学硕士学位论文组织的世纪运作情况,满足企业内各种用户不同要求,提供企业详细的数据资料,使企业信息利用高效率、高效益。2数据集中控制在数据库系统中,每个数据对所有部门具有相同语义,数据可以充分共享,数据的冗余减少到最低程度。由于对数据实行集中控制,还可以方便地采用各种有效措施对数据实施保护。对每个用户赋予一定使用权限,保证数据库免遭损害和非法使用。对数据实施完整性检查,保证数据正确、有效、相容一致。3灵活性高不管是增加新的用户,还是原有用户增加新的应用需求,数据库都很容易实现扩充,适应新的要求。同时,数据库也容易移植,以适应新的硬件环境和更大的数据容量。4方便程序设计和程序维护设计数据库结构时,尽量不影响已有的应用程序,减少了程序维护的工作量。5有利于推广标准化随着信息处理自动化的进展,信息的标准化越来越重要。DBS的使用能够促进整个企业乃至社会数据表示的标准化和设备使用的标准化。313数据模型数据模型是指构造数据以及对数据操作时所遵循的规则,即表示实体类型和实体之间联系的模型。支持数据库系统的有四种数据模型,分别是层次模型、网状模型、关系模型和面向对象模型【42删。1层次模型HIERARCHICALMODEL用树形结构表示实体类型及实体之间的联系的数据模型称为“层次模型”,这种模型有且仅有一个结点无父结点称为树的根结点,其他结点有且仅有一个父结点。2网状模型NETWORKMODEL用网状结构表示实体类型及实体间的联系的数据模型成为“网状模型“。这种模型允许结点有多于一个父结点,可以有一个以上的结点无父结点。19基于遗传算法的试题库管理及自动组卷系统的研究3关系模型RELATIONALMODEL,简称RDBS关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。1970年美国国际商用机器公司即IBM公

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论