本创项目结题材料汇编样板.doc_第1页
本创项目结题材料汇编样板.doc_第2页
本创项目结题材料汇编样板.doc_第3页
本创项目结题材料汇编样板.doc_第4页
本创项目结题材料汇编样板.doc_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2009年江苏科技大学本科生创新计划项目结题材料汇编作品名称: 基于模糊数学评阅主观题的算法 学院名称: 数理学院 申报者姓名: 凌宏杰 指导老师: - 共青团江苏科技大学数理学院委员会2009年江苏科技大学本科生创新计划作品申报书 作品名称: 基于模糊数学评阅主观题的算法 学院名称: 数理学院 申报者姓名: 凌宏杰 类别:自然科学类学术论文 哲学社会科学类社会调查报告和学术论文 科技发明制作创业计划书 项目名称基于模糊数学评阅主观题的算法项目类型( ) 个人项目 ( ) 团队项目申请人或申请团队姓名所在学院年级、专业联系电话E-mail主持人凌宏杰数理学院06信息与计算科 成 员安琪数理学院06信息与计算科潘汪霞数理学院06信息与计算科张营数理学院06信息与计算科学13815479196413220403导 师姓名某某年龄单位数理学院职称主要成果 指导老师多年来一直从事模糊数学的教学。目前在江苏科技大学学报等期刊发表论文多篇,具备了较好的理论研究素质。一、申请理由(包括自身具备的知识条件、自己的特长、兴趣、已有的实践创新成果等)学生目前为江苏科技大学数理学院信息与计算科学专业的学生,已顺利完成数学分析、高等代数、概率论、常微分方程、解析几何、VC+、VFP等课程并取得了优异成绩,目前正在学习数学建模、运筹学、数理统计、应用回归分析、SPSS、模糊数学等课程。进入大学以来,学生对为主观题自动阅卷和评分有一定了解,也经常通过互联网了解相关研究的现状。他们对根据实际问题写算法,编程序有着很浓的兴趣,并具有较强的动手能力,能编写程序,实现一些简单算法。二、项目方案(包括项目的训练目标、前期准备、组织实施、过程管理、实践环节、教师指导、项目结题等)1.训练目标在理论上探讨实际可操作的主观题评分算法,并用计算机语言加以实现,并能举例应用。以论文形式加以总结,其中理论推导、算法程序及结果分析整理成结题报告。2. 前期准备,(1)搜集国内外相关资料,了解主观题评分算法的研究现状。(2)掌握模糊数学基础知识,能将一些模糊现象进行定量研究。(3)熟悉项目中所用的理论知识,对项目的进程指定好计划。3.项目执行的主要环节(1)前期工作:学习模糊数学的基础知识,培养分析模糊现象并将其量化的能力。(2)搜集资料:通过搜集近年来阅卷评分技术的进展情况,讨论分析其可行性与优缺点,了解主观题评分的依据和影响得分的主要因素。(3)项目实施:在理论上探讨实际可操作的主观题评分算法,用计算机语言加以实现,并能举例应用。(4)撰写报告:对所得较好的算法,分析是否可以在界面上实现,撰写结题报告。4.教师指导(1)在项目执行过程中指导教师定期向学生了解项目研究进度,指导学生采集处理实际数据。(2)指导老师积极参与具体的研究过程,对算法的推导完善提出建设性建议;帮助学生举例对编好的程序进行调试。(3)指导学生总结整理研究成果,指导学生撰写项目研究论文和结题报告;5.项目结题学生在指导老师的帮助指导下,将该项目的算法理论推导、程序编写和结论进行分析整理,撰写结题报告。三、预期成果1、在理论上探讨实际可操作的主观题评分算法,给出具体算法推导;2、 编写算法程序,并能举例应用;3、 发表论文1篇;4、提交研究报告1份;四、经费预算(1)小型设备购置费:1200元;(2)文献收集、数据采集及差旅费:1800元;(3)数据测试及文印费:500元;合计:3500元五、导师推荐意见该项目的选题具有较强的实际应用背景,研究结果有实际意义。四名学生均已顺利完成了信息与计算科学专业的大部分主干课程,具有较扎实的理论基础和较强的动手编程能力,态度端正,勤奋刻苦。同时,对所研究的问题也有较深入的了解,相信一定能够按期完成该项目,并能取得预期成果。 签名:* 2009年 3月 5日六、学院推荐意见学院负责人签名: 学院盖章: 年 月 日 本科生创新计划项目中 期 检 查 表项目所属类别 自然科学类学术论文 项 目 名 称 基于模糊数学评阅主观题的算法计划完成时间 2009-12-20 项目负责人 凌宏杰 指 导 教 师 * 填 表 时 间 2009-10-8 江苏科技大学团委制一、截止目前所完成的主要工作(以条文式列述)对于本次创新计划,我们小组成员已经历了以下3个阶段:1、 在徐老师的指导下搜集了国内外相关资料,了解主观题评分算法的研究现状,对项目的研究进程制定了具体的方案:(1)主观题评阅算法的改进;(2)权重的科学设定;(3)将提出的算法编写成程序;(4)以论文形式对研究成果进行总结。2、 通过搜集近年来阅卷评分技术的进展情况,讨论分析其可行性与优缺点,了解主观题评分的依据和影响得分的主要因素。在此基础上提出了一套简单可行的算法用于解决主观题的评阅问题。3、 上述算法已经用matlab编写成相应的程序,可以通过程序的运行得出的结果验证算法的可行性。4、 针对每一个主观题都采用了多指标综合评判(一个指标对应于标准答案中的一个关键词)。5、 对于算法中提到的专家对各关键词的权重的设定,采用了标准离差法提高其可靠性。二、已取得阶段性成果会(以条文式列述)1主观题评阅算法的改进已经完成。2权重设定方法已经确定。3改进后的主观题评阅算法已经编写成可视化的程序。三、前阶段工作体会通过对大量资料的查询和阅读,提升了自身对主观题评测算法的理解。比对各种主观题评测算法,综合它们各自的优缺点,结合自己的理解提出了一套自己的算法。通过这段时间对这个课题的研究提升了我对未知问题的分析和解决的能力,对模糊数学这门学科有了新的认识,清楚地认识到很多学科之间的紧密联系。要想解决一个实际问题,往往不是单独一门学科就可以解决的,要综合应用多门学科。徐老师的细心指导,使我受益匪浅。四、经费使用情况(1)小型设备购置费: 400元;(2)文献收集、数据采集及差旅费:600元;(3)数据测试、办公文具及文印费:300元; 五、下一阶段研究计划1查阅有关计算机智能理解语句含义算法的资料,了解计算机智能识别的本质,在此基础上,进一步修正这套适合本课题的算法2将此计算机智能理解语句含义的算法编写成代码,并且将此代码整合到已有的算法程序中去。六、 下一阶段拟取得的主要成果1、提出一种使用计算机智能的理解语句含义的算法。2、完善现有程序代码。3、最后的研究成果形成论文。项目负责人(签名):凌宏杰2009年 10 月 8 日七、指导教师指导意见及建议该课题进展顺利,已做出有效算法雏形,客观上较好地改进了已有的主观题评阅算法,同意继续完善该算法,进行下阶段研究工作。指教教师(签字)_* 2009 年 10 月 10 日 八、学院审查意见学院负责人(签字)_年 月 日 八、学校评审组意见评审组负责人(签字)_年 月 日江苏科技大学本科生创新计划项目结题验收书项目名称基于模糊数学评阅主观题的算法所在学院数理学院指导教师姓名移动电话固定电话Email徐维wy_学生名单姓名专业年级联系方式Email凌宏杰0640501215952813981安琪0640501115952813919潘汪霞0640501215952856530张营0640501213815479196413220403胡璇0640602115952813826一、创新计划的成果简介:(主要解决的关键技术与创新点,主要技术与经济指标完成情况,项目实施的绩效等,包括代表性成果介绍,说明其水平和影响,并简要阐述其科学意义或应用前景等。)(1)修改采用拆分关键字为单个字符进行比对的现有方法为关键字整体比对的方法,三种顺序同时定位最终取大的新方法使得主观题阅卷的精度大为提高;(2)大胆创新引入了智能化思想,提高了计算机评阅主观题的可行性和说服力;(3)改进权重设计为专家参与设置原始权重,标准离差处理,最后设定修正值方法,使得权重设置更为合理,提高主观题阅卷的合理合情性。二、研究中使用的具体材料:(含参阅的书籍和论文目录,使用的检索目录)1 Yasuhiro Ajiro, Kazunori Ueda.Kimai. An Automator Error Correction System For Concurrent Logic Programs. Automated Software Engineering J, 2002, 9(2): 67-94.2张运良,张全,基于HNC理论的语义相似度计算方法J。计算机工程与应用,2005,34(5):5-7. 3李明阳,贾电如,基于模糊理论的主观题自动评分算法研究与实现J。微计算机应用,2008,29(10):17-20.4 孙卫,基于模糊理论的自动阅卷算法, 福建电脑2007 年第5 期5高思丹, 袁春风. 主观试题的计算机自动批改技术研究J. 计算机应用研究,2004,(2)6 张燕姑.论模糊概念的度量J. 计算机工程与应用, 2004 , (14)7 张小艳.基于自然语言的主观题自动阅卷技术J.西北大学学报(自然科学网络版), 2005,3(8)8 黄思先. 程序设计考试中填空题的自动评分J. 福建电脑, 2003,(7)9 况姗芸. 网络课程中主观题在线评阅系统设计与实现J.中国电化教育,2004,206(3)10 王永生. 计算机阅卷中主观题型的单层模糊综合评判J.青海大学学报,2000,18(3)三、创新计划的成果形式及数量:(需提供附件)1.文献资料综述( 1 )份;2.调查报告( )份;3.论文 ( 1 )份;4.软件 ( )份;5.设计 ( 1 )份;6.硬件研制( )份;7.专利 ( )份;8.心得体会( 1 )份;9.其他 ( )件,名称: 四、经费使用情况:支出科目金额备注(注明经费支出时间)五、项目成果(用附件形式):附件1:文献资料综述附件2:论文附件3:设计附件4:心得体会六、实施本科生创新计划项目工作存在的问题和建议:七、诚信承诺:我承诺在本科生创新计划活动中遵守学校有关规定,恪守学术规范,本人项目成果中除特别注明和引用外,均为本人观点,不存在剽窃、抄袭他人学术成果,伪造、篡改实验数据的情况。如有违规行为,我愿承担一切责任,接受学校的处理。学生签字: 2009年11月30日江苏科技大学本科生创新计划项目研究总结报告项目名称: 基于模糊数学评阅主观题的算法 项目类型: 自然学术论文 项目等级: 重点 一般 项目负责人: 凌宏杰 联系电话: 指导教师: 联系电话: 基于模糊数学评阅主观题的算法项目总结报告 一、项目的研究意义、价值在线考试与评价系统是网络教学系统的重点和难点,特别是主观题的自动评分时整个系统中的一个关键技术。由于自然语言的复杂性,主观题评阅自动化还存在着许多困难,我们引入了模糊数学中的单向贴近度来描述主观题阅卷中贴近程度的得分,实现了可调的自动评分算法,开拓了一条现实可行的途径,尽管还有不少缺陷,但作为一种辅助手段,在多学科之间的主观题自动评分阅卷方面是很有意义的。二、项目的目标、主要任务及完成情况项目的目标是以单项贴近度为基准,通过标准答案与考生答案之间的关键字比对,从而实现精准可行的主观题自动评测程序。我们的主要贡献是在前人的基础上做出了总共三部分的大改进,包括算法改进、智能化思想的提出和权重设计三项重要改进。在算法设计上,针对这一课题,我们通过比对和提炼已有资料文献,找出现阶段已有算法的不足与缺陷之处,进行了调整与改进。现有算法大多数采用拆分关键字为单个字符进行比对的方法,这个算法缺陷是明显的,为此,我们改进算法为关键字的整体比对。在我们的算法微调下,避免了关键字整体信息流失的影响,但随之而来,如何准确定位考生答题信息中的关键字变成了重中之重。如若关键字定位失败就注定了该算法不具有实用性。为了解决定位准确性问题,我们共同苦思冥想,最终成功解决了这个问题。那就是在文章中提到的采用三种顺序同时定位,最后进行取大运算的新的算法。定位一个关键字采用三种定位方法对其操作,显然提高了定位精度。智能化思想的提出:已有的关于这方面的文章,大多数在智能化这个方面都没有渉略,本文中我们大胆的提出了一种相对智能化的算法,提高了计算机评阅主观题的可行性和说服力。权重的设计中遇到的问题:针对各个关键字进行加权,权重设置的优劣直接影响最后的评分的结果。若权重设置不合理,可能会导致计算机评阅的成绩和人工评阅的成绩相差甚大。权重设定的方法我们尝试了很多种方法,但是最后的结果都不尽人意。苦苦搜寻一个好的权重设定方法,最后根据实际情况,我们自己设计了一套权重方法,专家参与设置原始权重,再用标准离差法处理,最后设定修正值。采用这种方法解决了权重的设定问题。三、项目的研究过程及创新点1、相关定义为解决考生答案中的关键词与标准答案库中的关键词的贴近度表示问题,把各个关键词都看成字符串,对单向贴近度的概念进行定义。把关键字看成字符串,把字符串分解成单个的字符并把它们构成的有序集合称为一个模糊集,称为论域,论域上的全体模糊子集组成的集合记作(也叫模糊幂集)。为度量两模糊集的接近程度,引入单向贴近度的概念。定义1:设,。若映射:,满足条件:(1);(2);(3)若,则。称为A贴近于B的单向贴近度。定义2:设A、B是字符串,A中包含个字符,表示A贴近于B的单向贴近度;按照从左到右的顺序,集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,则。按照从右到左的顺序,集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,则。按照从中间到两边的顺序,集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,则。令。容易验证,它满足单向贴近度的定义。2、算法设计该算法先对考生的答题信息的提取,保存为A字符串,A中包含个字符,表示A贴近于B的单向贴近度,集合B为标准答案中包含个关键语句,其中每个关键语句中包含个字符,对各个关键语句根据重要性进行加权依此为;将标准答案看成一个整体在考生的答案中寻找切入点(切入点的标记是:以开始相同的两个字符)进行整体比对;按照从左到右的顺序,集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,;按照从右到左的顺序,集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,则;按照从中间到两边的顺序(切入点的标记:若标准答案字符数为偶数以中间的两个字符相同为准,若为奇数个则以中间的三个字符相同为准),集合A中的每个元素在集合B中对应关键字出现的有效次数分别记为,则;。实现计算机智能化的算法:假设一个关键语句:表述相同意思的方法有种,其他表述不够准确的方法有种,表述不够准确的即使答得完全相同也不能认为这个得分点答得完全没有问题,所以我们要给这些答得不够准确的表述方法相应的加权(),表述相同意思的答得完全相同我们认为完全达到了得分点。具体的比对方法及单项贴近度的计算采用算法定义;其中种表述不够准确的方法求得的单向贴近度要与它们对应的权重相乘才这个关键语句最后的单向贴近度。计算机判断考生答案的语句连贯性:假设一个主观题中设置了个关键语句,单向贴近度;其中表示所处位置相同的标记个数。则,其中,为该题语句连贯性的权重。因此该题的评分公式设计为:其中F为该题的标准分值,为考生答题信息与标准答案的单向贴近度。针对上面的算法,下面有几点补充:若该题所设置的标准答案中关键字中没有涉及到英文字母或者数学公式,则上述所给的算法可以实现自动评分,且所得的分数应该比较合理。若涉及英文字母或者数学公式时,则上述的单向贴近度的算法就会产生不合理的方面,此时则需要对其进行修正。我们可以对含有英文字母或者数学公式的关键字的单向贴近度设定为:只有考生答案中对应的英文字母或者数学公式等必须和标准答案的完全相同,才可以设定这个关键字的贴近度为1,否则设定为0(也就是说这样的关键字对应的是一个分明集)。考生答题时,不能在输入文字中随意的敲空格键,因为该系统通过得分点的关键字和考生答案进行比对得出单向贴近度的,如果关键字中间出现空格的现象,会影响系统对其的评算。这里的关键字即是此题的主要得分点,所以老师或者专家在设置标准答案的时候,要注意不能过于繁琐。因为如果标准答案的一个得分点过长的话,当计算机识别出考生答案中有和标准答案相同的语句时,由于答案的表述不能和标准答案完全相同,从而使考生的得分与实际应该得分的出入较大。由于在一个题目标准答案设置的全过程中,可能有的关键字是部分相同的就可以得分,有的关键字必须是完全相同的才可以得分。所以在设计系统时,针对每一个题目我们都要有普通关键字输入区(关键字部分相同的就可以得分)和特殊关键字输入区(关键字必须是完全相同的才可以得分)。对于单项贴近度的算法做了一些改进,由原来的单一的从左到右的贴近,现在改进为从右向左和从中间到两边的顺序,然后对于这三个贴近度进行取大运算。因为这三种顺序的比较都是为了找出考生答案和标准答案的贴近度的,所以我们要选取最大的为标准。这样就可以让考生答案的得分点信息能够更加准确的被计算机所捕捉,减少因考生表达方式或者答案不全面而影响得分的公正性。可以更大程度的抓住考生的得分点,给考生一个合理的分数。3、核心程序流程图核心程序框架图如下:将考生的答题信息读入系统记为集合A专家对关键语句加权标准答案的设置进行字符串的比较零分满分对其进行修正计算出计算出D标记 特殊关键字输入区标记 普通关键字输入区从左到右的顺序从右到左的顺序从中间到两边的顺序标记 普通关键字输入区表述相同意思的语句表述意思相近的语句对其加权4、程序实现根据上述算法, 用matlab 设计了函数Approch, 该函数的功能是计算A 贴近于B 的单向贴近度。该函数代码如下:Function Approch (A,B)a=length(A); % 计算考生答案A的长度b=length(B); % 标准答案中一个关键语句B的长度C1=; C2=;C3=; %设置一个空矩阵C1,C2 ,C3k3=0;t3=0;approach =0;for i=1:a-1 %正序查找标准答案在考生答案中的切入点 if B(1)= A(i)&B(2)=A(i+1)if b=a-i %切入点以后标准答案长度小于考生答案所剩字符 C1=(B(1:b)=A(i:i+b-1); %标准答案与考生答案的比较形成0、1矩阵 else C1=(B(1:a-i+1)=A(i:a); %形成0、1矩阵end endendfor i=a-1:1 %逆序查找标准答案在考生答案中的切入点 if B(b)= A(i)&B(b-1)=A(i+1)if biC3=(B(b/2-i+1:b)=A(1:i+b/2)elseif iiC3=(B(b-1)/2-i+1:b)=A(1:i+(b+1)/2)elseif i0 k(1)=k(1)+1; %统计出矩阵C1中为1的个数 end end if k(1)=0 t(1)=0;else t(1)=k(1)/b; endc(2)=length(C2); %计算矩阵的长度for i=1:c(2) %查找矩阵C2中为1数 if C(i)0 k(2)=k(2)+1; %统计出矩阵C2中为1的个数 end end if k(2)=0 t(2)=0;else t(2)=k(2)/b; endc(3)=length(C3); %计算矩阵的长度for i=1:c(3) %查找矩阵C1中为1数 if C(i)0 k(3)=k(3)+1; %统计出矩阵C1中为1的个数 end end if k(3)=0 t(3)=0;else t(3)=k(3)/b; endif t(1)=t(2) &t(1)=t(3)approach=t(1) ; %确定最终的贴近度approachelse t(2)=t(1)&t(2)=t(3)approach=t(2) ;else approach=t(3) ;end5、权重系数的选择5.1 确定原始权重对标准答案中语句连贯性和各关键词(以下称为指标)设定权重集,表示语句连贯性的权重;邀请若干专家,让他们根据自己的理解和判断,对该主观题的关键语句的权重予以评分,不妨称之为原始权重。设表示第个专家对于第个指标的原始权重,要求所有指标的原始权重之和必须等于1,即对于任意,有: (1)5.2 计算关于每个指标的平均权重这里计算第个指标的平均权重,我们引入数学期望的概念: (2)式(2)中:表示第个指标的平均权重,其中是专家的总人数。5.3 计算权重的偏移量这里引入方差来衡量偏移量。第个专家,第个指标的偏移量为: (3)式(3)中表示原始权重的偏移量。个专家对该题各关键语句方差: (4)设定一个值(分界点),当时,即的方差很小,即位专家对这些关键语句的权值分配的意见很一致;当时,即方差比较大,也就是说位专家对第个关键语句的权值分配的意见有所不同,在这情况下我们需要对这样的平均权重进行修正。设定修正值为: (5)修正后的权重: (6)5.4 归一化归一化系数: (7)归一化后的每个指标对应的权重: (8)式(8)中表示指标的新权重。6主观题综合评定假设一题的标准答案有个关键语句,其中有个是分明集中的关键语句()。这个关键语句对应的权重为。令利用公式 其中表示该题的满分,表示0或者1(当第个关键语句与标准答案完全匹配时为1,否则为0)。得到该主观题的评定分数,结合编程把该种算法通过计算机实现自动评阅主观题。四、项目的研究成果及实例分析为了清楚地说明上述算法, 本文设计了一个算例。设: 问题Q=什么是算法;标准答案B=算法是问题求解规则的一种过程描述( 即计算机解题的过程) 。它具有5 个基本性质: 确定性、有穷性、可行性、输入和输出。( 48 个字符) ;得分点的关键词 K1=问题求解 K2=过程 K3=确定性 K4=有穷性 K5=可行性 K6=输入 K7=输出,设关键词对应的权重为:K1,K2,K3,K4, K5, K6, K7=0.2,0.1,0.14,0.14,0.14,0.14,0.14学生答案A=算法是一种问题求解的过程, 它具有逻辑性、可计算性、穷尽性、输入、输出。( 30 个字符)。用已编好的系统运行得到结果如下:五、项目的应用前景由于算法设计引入了单向贴近度概念,比单纯的使用关键词进行简单的比较的方法更加确定的反应了自动评分的结果。在权重系数的选择中使用了专家参与加回归分析和修正计算,使得系数比较客观准确。该算法考虑了单个关键词在一题主观题所占的不同权重,明确了答题的关键性,减少了人为因素,保证该算法计出数来的分数客观性和准确性。该算法具备普通性和易推广性。实际考试中,涉及到政史的中文文科性考试、关于理化的理科类考试,及部分综合考试均可以应用此模型来进行求解。涉及到政史的中文文科性考试简介,因为此种类型所设置的标准答案中关键字中没有涉及到英文字母或者数学公式,则上述所给的算法可以实现自动评分,且所得的分数应该比较合理。关于理化的理科类考试简介,涉及英文字母或者数学公式时,则上述的单向贴近度的算法就会产生不合理的方面,此时则需要对其进行修正。我们可以对含有英文字母或者数学公式的关键字的单向贴近度设定为:只有考生答案中对应的英文字母或者数学公式等必须和标准答案的完全相同,才可以设定这个关键字的贴近度为1,否则设定为0(也就是说这样的关键字对应的是一个分明集)。依次,修正过的算法可以实现自动评分,且所得的分数应该符合实情。部分综合考试简介,由于在一个题目标准答案设置的全过程中,可能有的关键字是部分相同的就可以得分,有的关键字必须是完全相同的才可以得分。所以在设计系统时,针对每一个题目我们都要有普通关键字输入区(关键字部分相同的就可以得分)和特殊关键字输入区(关键字必须是完全相同的才可以得分)。据此,算法可以实现自动评分,且所得的分数应该比较妥当。综上,我们可知,现实生活中的各类大小主观题考试在一定程度上均可以拆分为关键字或词得分点加权,从而达到基本客观评阅,自动生成考生的答题得分。六、收获和体会通过对本课题的研究探讨,对主观题自动评分问题有了深入了解,对如何应用贴近度比对和多指标综合判断实现主观题自动评分问题的原理及其过程有了更为深刻的认识,更总要的事,通过对Matlab的使用,我们对Matlab的程序设计环境应用更加的熟练了,在这种学科间的穿插运用中,使我们能够更好的把所学的知识应用于实践,做到融会贯通,在此基础上,能够很好的创新尝试、尝试创新,不断前进不断收获。七、项目进一步研究的设想通过总结,设计上的改良:在确保标准答案及评分标准的组织与成功比对学生答案的标准答案贴近度的前提下,是否能人性化地作出对学生答题内容的语言通顺与连贯性考察也是一个至关重要的问题。计算机作为非人工智能处理工具,在机械比对答案的过程上精准高效,但在理解和分析考生答案的含义上效果很低,若可以提升计算机的理解能力,加强对考生答题内容的语言通顺与连贯性考察将大为提升此算法的广度和深度效用:广度上,几乎所有的主观题均可以有成效有可能地被客观主观评阅;深度上,对具体一道复杂的综合性主观题,将做到全能高效,有条不紊。此为,对算法的改良亦可使自动评阅系统准确率提高,主要的改进方式包括:(1)设计更为全面而精准的考生答题信息与标准答案中关键语句之间的比对。(2)解决如若考生需要在答题中键入空格的不能实现问题。(3)计算机评阅主观题算法涉及到得学科比较广,此文主要针对文科类考试,对理学类考试仍需有进一步改进。八、致谢 在此项课题研究中,给予我们帮助和指导的徐维艳老师表示衷心的感谢!几次培训给我们输入了崭新的思想,引发出了我们许多灵感,从而带来了许多可行的方法,使得课题研究取得了可喜的成绩。文献资料综述1 Yasuhiro Ajiro, Kazunori Ueda.Kimai. An Automator Error Correction System For Concurrent Logic Programs. Automated Software Engineering J, 2002, 9(2): 67-94.2张运良,张全,基于HNC理论的语义相似度计算方法J。计算机工程与应用,2005,34(5):5-7. 3李明阳,贾电如,基于模糊理论的主观题自动评分算法研究与实现J。微计算机应用,2008,29(10):17-20.4 孙卫,基于模糊理论的自动阅卷算法, 福建电脑2007 年第5 期5高思丹, 袁春风. 主观试题的计算机自动批改技术研究J. 计算机应用研究,2004,(2)6 张燕姑.论模糊概念的度量J. 计算机工程与应用, 2004 , (14)7 张小艳.基于自然语言的主观题自动阅卷技术J.西北大学学报(自然科学网络版), 2005,3(8)8 黄思先. 程序设计考试中填空题的自动评分J. 福建电脑, 2003,(7)9 况姗芸. 网络课程中主观题在线评阅系统设计与实现J.中国电化教育,2004,206(3)10 王永生. 计算机阅卷中主观题型的单层模糊综合评判J.青海大学学报,2000,18(3)基于模糊数学评阅主观题的算法凌宏杰,徐维艳(江苏科技大学 数理学院, 江苏 镇江, 212003 )摘 要:本文通过分析人脑评阅主观题的思维方法,引入了贴近度和多指标综合评判的思想,基于模糊数学中单向贴近度的理论,设计并实现了一种评阅主观题的带权单向匹配算法。算例说明该算法能有效提高主观题自动评阅的精确度。关键词:标准答案,单向贴近度,权重,多指标中图分类号:TP311 文献标识码:A Arithmetic of Subjective Tests Automated Assesment based on fuzzy MathematicsLING Hong-jie XU Wei-yan(School.of Mathematics and Physics, Jiangsu University of Science and Technology, Zhenjiang Jiangsu, 212003; School of Mathematics and Computer Science, Nanjing Normal University, Nanjing Jiangsu, 210097)Abstract: This paper analyzed the way of assesmenting subjective tests with the humans brain, by introducing the one-way close-degree of fuzzy stes and multi-index comprehensive evaluation of the idea, we designed and implemented a one-way matched algorithm with weight to assess the Subjective Test. An example showed that the algorithm can effectively improving the Subjective Tests Automated Assesment. Key Words: Standard answers, One-way close-degree, weight, Multiple index0 引言在线考试快速高效,具有广阔的应用发展前景。虽然在线考试系统中客观题自动评阅技术已经很成熟,但主观题评阅由于涉及到人工智能、模式识别和自然语言理解等目前亟待解决的技术难点,一直束缚着计算机自动阅卷技术的应用与发展。国外比较典型的应用有英国诺丁汉大学开发了计算机语言智能阅卷系统Course Master1。国内还没有较为成熟的可以应用的系统,文献2以语义相似度计算为基础提出的主观题阅卷算法的设计与实现;主观题答案以文本方式存储,文本表示方法是自动评阅主观题算法的关键,文3借鉴矢量空间模型4-5的思想,提出基于人工智能的主观题自动评阅算法;文献6提出一种基于模糊数学7理论中贴近度的模式识别方法来计算网络考试系统中主观题自动评阅的算法。鉴于这种仅考虑字符串单方向匹配的算法中字符串比对的单方向性使得处理主观题评分效率不够高,而且不能灵活识别同义语句,本文在此基础上设计并实现了一套算法。预先设定标准答案中各个关键字(词)的权重,将考生的答题信息与标准答案中的关键语句进行比对,然后用贴近度进行体现,算出的贴近度与相应的关键词预先设定的权重系数进行相乘,得到考生该题的得分比例,然后把得分比例与该题的总分相乘,最后得出考生该题的得分。同时还初步解决了计算机智能化理解同义语句的问题。算例表明这套算法较符合人的思维方式,增强了计算机评阅主观题的客观高效性。1 基本概念 为解决考生答案中的关键词与标准答案库中的关键词的贴近度表示问题,把各个关键词都看成字符串,对单向贴近度的概念进行定义。定义1 设在论域上给定映射,则称确定了上的一个模糊子集,记为模糊集。称为对模糊集的隶属度。把关键字看成字符串,把字符串分解成单个的字符并把它们构成的有序集合称为一个模糊集,称为论域,论域上的全体模糊子集组成的集合记作(也叫模糊幂集)。为度量两模糊集的接近程度,引入单向贴近度的概念。 定义2 设,。若映射:,满足条件:(1);(2);(3)若,则,称为模糊集A贴近于模糊集B的单向贴近度。注:设A、B是字符串,A中包含个字符,表示A贴近于B的单向贴近度;按照从左到右的顺序,集合中的每个元素在集合中对应关键字出现的有效次数分别记为,则;按照从右到左的顺序,集合中的每个元素在集合中对应关键字出现的有效次数分别记为,则;按照从中间到两边的顺序,集合中的每个元素在集合中对应关键字出现的有效次数分别记为,则。令,容易验证,它满足上述定义,记为模糊集贴近于的单向贴近度单向贴近度。2、算法设计分析本文所提出的算法以读取考生答题信息与标准答案库中的参考答案的贴近程度作为评判的依据,标准答案以关键词(或关键语句)的形式给出,即得分点,因为这是计算机衡量考生得分多少的主要依据。对于单项贴近度的算法3做了一些改进,由原来的单一的从左到右比对文本的贴近度计算,改进为分别从左向右、从右向左和从中间到两边的顺序比对得出单向贴近度,然后对于这三个贴近度进行取大运算。因为这三种顺序的比较都是为了找出考生答案和标准答案的贴近度的,所以我们要选取最大的较为准确。这样就可以让考生答案的得分点信息能够更加准确的被计算机所捕捉,减少因考生表达方式或者答案不全面而影响得分的公正性,可以更大程度的抓住考生的得分点,给考生一个合理的分数。此外我们实现了这些关键语句的智能识别,即要计算机智能识别考生答题语句连贯性的判断,因为标准答案的设置是按照各关键语句出现的先后顺序依次挑选出来的,所以计算机实现智能化的识别考生语句的连贯性也就落在这些关键语句上面。我们依次给这些关键语句进行编号作为标记,然后采用所给算法对考生答案进行处理,三种比对方法都进行完毕时,我们将这三种比对方法得到的贴近度选出最大者把这个关键语句的编号插入到考生答案与标准答案贴近度最大相应的地方,依次进行,直到全部比对完毕。然后重新遍历考生的答案寻找其中的各个标记,然后把重新遍历得到的标记编号的顺序和开始记录的顺序进行比对计算出单项贴近度。下面本文就实现计算机智能阅卷设计了一套算法。2.1算法描述第一步,提取考生的答题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论