




已阅读5页,还剩78页未读, 继续免费阅读
(计算机应用技术专业论文)纸卷数字化和图像识别在网上阅卷中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
弘! k 卜l o _ , , 亡 叫 沁 l v p 、 一 - 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 、签名:垒监至鍪日期:弘f 口年r 月2 日 关于论文使用授权的说明 本学位论文作者完伞了解il i 于科技人0 t 有关保留、使, + 1 j :学位论文 的规定,有权保留并向围家行关部| j 或机构送交论丈的复q j f :t 不n 磁彘, 允许论文被查阅和借阅。本人授权电子科技人学可以将学位论文的全 部或部分内容编入有关数据库进行检索,口j 以采剧影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:垒堕蝴导师擞:一 日期:y 归年f 月砂日 , k p 毒 , 彝妒孓 毫 h 叼“ 摘要: 近年来随着计算机网络技术、信息数字化技术的快速发展,计算机的处理能 力和运算速度也都越来越快。正基于此,网上阅卷作为一种以计算机网络技术和 电子扫描技术为依托,、实现考试高效率,高准确性以及公平性原则为最终目标的 新型阅卷方式,受到越来越多人的欢迎,并得到了迅速的推广和使用。 目前,各类型的考试都由客观题和主观题两大部分组成。相应的,网上阅卷 也就由纸卷数字化系统以及网上评阅系统这两大部分组成。纸卷数字化负责对试 卷准考证和客观题部分进行自动评阅,要求有快的识别速度以及高的识别准确性。 而网上评阅系统则主要针对是主观题部分的评阅,要求能尽量的控制人为评分误 差的影响。 本文主要针对的是网上阅卷系统中纸卷数字化系统的自动评阅部分。文章首 先介绍了当前网上阅卷的现状以及当前数字图像处理的一些基本概念和技术原 理。包括描述了图像的数字化过程,灰度化处理以及一些相应的去除噪声相关基 本的技术 其次试卷在扫描时,通常都会因为人为以及扫描仪本身的机器因素造成试卷 图像产生一定的倾斜和偏移。这也会对以后的识别产生重大的影响,造成识别结 果的重大偏差。针对这问题,本系统实现了对试卷的答题卡图像参考点模式的 纠偏,解决了参考点选择的优化问题。使得试卷的图像可以获得比较好的纠偏效 果。 再者试卷的客观题部分通常都是由o m r 组成的。而在识别中很重要的一个 步骤就是二值化处理。现在常用的二值化处理方法都有一定的局限性,并不能很 好的适应试卷图像的各种各样的变化。针对试卷的图像质量会容易随着环境的变 化而变化的特点,本系统提出了一个根据图像的质量而获取自适应阀值的方法, 也详细的描述了此方法的设计思想和实现技术。 最后部分描述了本系统中关于o m r 码的客观题识别系统的原理以及设计实 现过程,根据大型考试所要求的速度特点以及o m r 码本身图像所独有填涂的特 性。采用了模板定位加模糊搜索的技术使之能快速定位并识别,在保证识别速度 的同时也得到了较好的识别效果。 摘蛰 关键词:纸卷数字化系统,参考点,局部a 适麻阀值,光学标记阅读的识别 1 , ,j p d y 7 冬 h , - a b s t r a c t a b s t r a c t t h es p e e do fc o m p u t e rp r o c e s sa n do p e r a t i o na r eb e c o m i n gf a s t e ra n df a s t e r ,w i t h t h er a p i d l yd e v e l o p m e n to fc o m p u t e rt e c h n o l o g ya n di n f o r m a t i o n b e c a u s eo ft h o s e f a c t o r s ,t h ea p p l i c a t i o n so fo n l i n em a r k i n gs y s t e m ( o m s ) a r eb e i n gs p r e a da n da p p l i e d r a p i d l y o m si sb a s e do nn e t w o r kt e c h n o l o g ya n de l e c t r o n i cs c a n n i n gt e c h n o l o g y ,w i t h p r i n c i p l eo fh i g hr a t eo fa c c u r a c ya n dr e a l i z a t i o no ff a i r n e s si nt h ee x a m i n a t i o n n o w ,t h e r ea r es u b j e c t i v eq u e s t i o n sa n do b j e c t i v eq u e s t i o n si na l lk i n d so f e x a m i n a t i o n s s o ,o m sa r ec o m p o s e do fp a p e rd i g i t i z a t i o ns y s t e ma n do n l i n e s u b j e c t i v eq u e s t i o n sm a r k i n gs y s t e m p a p e rd i g i t i z a t i o ns y s t e mi su s e dt om a r k i n g o b j e c t i v eq u e s t i o n sa u t o m a t i c a l l y , a n di tm u s th a v eh i g hr a t eo fa c c u r a c y t h ep u r p o s e o fo n l i n es u b j e c t i v eq u e s t i o n sm a r k i n gs y s t e mi st or e a l i z et h ej u s t n e s sa n df a i m e s si n t h ee x a m i n a t i o n t h i st h e s i si sf o c u s e do na u t o m a t i cm a r k i n gs y s t e mi nt h ep a p e rd i g i t i z a t i o n f i r s t l y ,c u r r e n ts i t u a t i o no fo m sa n dt h e o r yo fi m a g ep r o c e s sa g ei n t r o d u c e d t h e s et e c h n o l o g i e si n c l u d et h ep r o c e s so fp a p e rd i g i t i z a t i o n ,i m a g eg r a y s c a l ea n ds o m e m e t h o d su s e dt oe l i m i n a t en o i s e s e c o n d l y , d u r i n ge x a m i n a t i o np a p e r ss c a n n e d ,s o m ep a p e r sw i l lb er o t a t e db y h u m a nf a c t o ro rt h eq u a l i t yo fs c a n n e r t h o s ef a c t o r sw i l lh a v eg r e a ti m p a c to nr a t eo f m a r k i n ga c c u r a c y t h e r e f o r e ,h o wt of i n dam e t h o dt os o l v et h o s ep r o b l e m si sv e r y i m p o r t a n t i nt h i st h e s i s ,w eu s e ds o m es p e c i a lb l o b si nt h ee x a m i n a t i o np a p e r sa s r e f e r e n c ep o i n t st or e c t i f yi m a g ea n dt of i n dt h em o s to p t i m u mc o m b i n a t i o no fr e f e r e n c e p o i n t sa tt h es a m et i m e t h i r d l y ,t h em o s ti m p o r t a n tp r o c e s so fo b j e c t i v eq u e s t i o n s ( o m r ) r e c o g n i t i o ni s b i n a r i z a t i o n a c c o r d i n gt o t h ef e a t u r eo fp a p e r sq u a l i f i c a t i o n sw i l lb ei m p a c t e db y s u r r o u n d i n ge n v i r o n m e n t ,w eo f f e ran e wm e t h o dt og e ts e l f - a d a p t i v et h r e s h o l dv a l u e a n dd e s c r i b e si nd e t a i lt h et h e o r ya n dt e c h n o l o g yo ft h i sm e t h o d f i n a l l y ,t h et h e o r ya n dm e t h o do fo m rr e c o g n i t i o ni sd e s c r i b e di n t h i st h e s i s b a s e do nt h ed e m a n do ff a s ts p e e da n dh i g ha c c u r a c yr a t eo fr e c o g n i t i o n ,aw a yt h a tu s e i i 1 0 崎 a b s t r a c t p a p e r st e m p l a t ea n df u z z ys e a r c ht e c h n o l o g yt o r a p i dl o c a t i o na n dr e c o g n i t i o ni s i n t r o d u c e d u l t i m a t e l y ,t h er a t eo fo m rr e c o g n i t i o ni sa c c u r a t e k e y w o r d s :p a p e rd i g i t i z a t i o ns y s t e m ,r e f e r e n c ep o i n t s ,l o c a ls e l f - a d a p t i v et h r e s h o l d , o m r r e c o g n i t i o n i v ! , 。 童q & 目录 目录 第一章绪论1 1 1 选题的背景及意义1 1 1 1 选题的背景l 1 1 1 选国内外研究现状2 1 1 2 选题的意义3 1 2 课题研究的任务4 1 3 课题研究的任务4 第二章网上阅卷分析6 2 1 网上评卷的流程和框架6 2 1 1 网上评卷的流程:6 2 1 2 网上阅卷的系统框架7 2 2 纸卷数字化8 2 2 1 纸卷数字化简介8 2 2 2 纸卷数字化框架及功能流程9 2 3 本章小结1 2 第三章数字图像处理技术、1 3 3 1 数字图像处理技术概念1 3 3 2 图像数字1 3 - 3 2 1 数字图像概述1 3 3 2 2 图像的灰度化1 4 3 3 图像预处理;1 4 3 3 1 灰度直方图均衡化1 5 3 3 2 灰度图像的平滑1 7 3 3 3 形态学1 9 v ,0m 目录 3 4 本章小节:2 l 第四章图像的纠偏处理;2 2 4 1 图像纠偏的基本概念和方法! 2 2 4 2 参考点模式2 3 4 2 1 参考点的选取2 3 4 2 2 参考点纠偏的计算2 4 4 3 试卷图像纠偏的设计与实现2 4 4 3 1 参考点模式纠偏的功能流程2 4 4 3 2 参考点的模式的数据结构2 6 4 3 3 参考点纠偏的实现2 7 4 3 4 参考点测试识别数据及分析3 0 4 4 试卷的校正3 4 4 5 本章小结3 5 第五章试卷图像特征的提取及识别二3 6 5 1 试卷图像的目标区域:3 6 5 1 1 条形码( b a r ) 3 6 5 1 2o m r 码:3 7 5 2 试卷图像的目标区域的特征提取3 8 5 2 1 图像二值化的基本概念4 0 5 2 2 试卷图像的阀值特征提取4 0 5 3 阀值测试卡4 1 5 3 1 测试卡概念4 1 5 3 2 测试卡应用功能模式的设计4 2 5 3 3 测试卡数据模型4 4 5 3 4 测试卡模式的功能流程及实现4 4 5 3 5 测试卡模型的技术实现4 9 5 3 6 测试卡模型数据结果4 9 5 3 7 测试卡模型数据的更新趴 5 4 阀值测试模型的识别应用:5 3 5 4 1 建立客观题模板:5 4 5 4 2 试卷答题卡的识别5 7 5 4 3 客脱题图像的识别功能流程6 0 5 4 4 客观题的识别结果呈现6 l v i 矗 h 目录 5 4 5 批量测试识别数据6 2 5 4 6 识别结果分析;6 3 5 5 本章小节:6 5 ; 第六章全文总结:6 6 6 1 论文总结6 6 6 2 进一步所需的研究工作6 7 致谢6 8 参考文献6 9 攻硕期间的成果7 1 v l l 囊o,鲞 第一章绪论 第一章绪论 考试作为选拔人才的一种方式已经被大众所普遍接受,也正因为考试功能的 特殊性,考试就必须保证公平公正以及准确,否则其人才的选拔功能就会被质疑 乃至削弱。试卷的评阅是考试中的最后环节但也是最重要的环节,评阅工作的好 坏直接影响着考生考试的成绩,甚至会对考生的将来产生极大的影响。传统的手 工评阅的方式很容易受到评阅者主观的上的因素( 例如:个人经验,能力水平以及 个人的主观意向等等) 以及一些客观条件的制约。如何保证考试成绩的公正准确, 将主观人为因素的影响降低到最小是一个亟待解决的问题。 近年来随着计算机网络技术、信息数字化技术的快速发展,计算机的处理能 力和运算速度也都越来越快,购买成本和运行维护成本也在大幅下降。正基于此, 网上阅卷作为一种以计算机网络技术和电子扫描技术为依托,实现考试公平准确 性原则为最终目标的新型阅卷方式,正受到越来越多人的欢迎,并得到了迅速的 推广和使用j 1 1 选题的背景以及意义 1 1 1 选题的背景 考试作为国家进行人才挑选的重要手段,是关系国家稳定和未来长远发展的 大事。为了实现评卷的公平公正,国家在( ( 2 0 0 3 2 0 0 7 年教育振兴行动计划文件 中的重点工程之一“实施新世纪素质教育工程”中明确提出了完善高等学校招生 网上远程录取系统和网上阅卷系统,建设招生信息化管理与服务平台的指导思想 拉j 。通过国家的文件以及相应的教育部领导官员在公开场合上的讲话,能够表明这 类项目将是国家重点支持和发展的,具有很大的市场价值。 与传统的人工手动阅卷形式不同,试卷的网上评阅应用了最新的科学技术, 涉及到图像处理、网络技术、软件工程等多方面的技术应用。在网上评阅过程中, 考生的答题卡通过扫描仪将图像转换为数字图像,所有考生答卷的文档图像存储 在网络服务器中。试卷答题卡通常由主观题和客观题两部分组成,客观题则被归 电f 科技人学硕十学何论文 类并专门分发到专用的机器上进行识别评阅,而主观题部分则由阅卷系统根据一 定的调度选择算法将这些图像匿名的分配给阅卷教师,由教师在网上进行评阅, 最后将两部分的得分结果进行统计相加,并最终存储在网络数据的服务器中【3 】。这 类先进的阅卷模式具有安全、高效、可控等优势,克服了以往以纸介质为载体的 管理方法所具有的固有缺陷,将古老的阅卷方式提升到现代化管理水平。 网上阅卷系统目前已经普遍应用于我国的各类的大型考试中,尤其是普通高 考入学考试、成人高考、自学考试以及c e t q ,c e 6 等大规模考试领域中。据中 华人民共和国教育部的数据,在2 0 0 9 年高考的招生公众,全国有超过2 0 个省、 市、地区使用了网上阅卷系统来辅助阅卷和招生工作【4 】。在广东,江西,北京等地 方,已经实现高考科目的全部网上评阅,参与阅卷的教师达数千名之多,同时, 评阅地点分散在各大高校,由互联网加以连接,并取得了较好的应用效果。 本课题重点关注网上阅卷中的自动化评阅部分。 1 1 2 国内外研究现状 网上阅卷中的自动化评阅的评阅方式又可分为光标阅读机评阅以及图像识别 评阅。光标阅读机评阅虽然有着评阅速度快,评阅准确的特点,但同时也存在着 要求答题卡的纸张质量比较好,这也就大大的增加了考试的成本。同时由于一台 机器只能评阅特定格式的答题卡以及采用机械校正的方式,使得考试的方式极其 不灵活,并增加了后期维护的不方便性。而图像识别评阅则有着评阅灵活,成本 低,维护方便等的特点而得到迅速的推广应用。 国内外已经有多家公司从事网上阅卷系统的设计与研发,如山东的欧码,深 圳的海云天等等的系统。这些产品也都在国内的各类考试中得到了一定的运用, 虽取得了比较好的效果,但也都有一定的限制性。如在纠偏时,所采取的方式固 定,不灵活。在识别时,大多都采用固定经验阀值或者o s t u 法以及选项之间的 平均灰度的比较匹配等等的方法,这也就要求试卷图像的一致性要比较好并且背 景和物体有良好的区分度。这在实际过程中维护起来也就比较不方便。不能很方 便的适应实际情况中各种各样的变化。 国外的有r e m a r k o f f i c e 的软件,遵守标准化的评阅的流程。但对模板就有特 定的要求,如所要求的填涂区域形状是圆形而非国内的方形等等【5 1 。由于中国和国 外的教育有着比较大的差异,因此在国内的使用方面也就存在着一定的限制。 “学子a ”招生考试数字化系统”正是在国家这样的政策支持和相应的市场 重 p 一 f ; 心 第一章绪论 需求的背景下于2 0 0 4 年立项,并得到国家科技部2 0 0 7 年科技型技术创新基金 ( 0 7 c 2 6 2 2 5 1 0 18 7 4 ) 、成都高新区科技型技术创新基金及成都软件产业发展专项基金 的支荆6 1 ,并通过四川省科学成果的鉴定。 纸卷数字化是“学子a ”招生考试数字化系统”项目中的一个重要组成部分, 主要负责处理网上阅卷中的自动化评阅部分,也就是对准考证和客观题的自动评 阅,同时也遵循着标准化的考试评阅流程。本人作为该项目的研发人员参与其中 的研发。 1 1 3 选题的意义 当今社会,教育已经大众化,受教育的人也越来越多,如何在公平性的基础 上提高效率已经成为了当代教育的一个主要目标。众所周知,高考等大型考试在 有非常大的影响力,是关系到国家选拔人才,关系到稳定大局的重要工程。尤其 是高考,每年都有上百万考生参加考试,也牵动着吸引着上千万望子成龙的家长 的心,高考的成绩好坏,甚至可以直接关系到每个考生以后的韵途和命运f7 1 。如何 保证阅卷的公平性和准确性以及效率。这一直都备受考生,家长以及社会的关注。 传统的手工阅卷存在着成本大、效率低、手工误差大等等的缺点。而网上阅 卷则能够极大的克服这些缺点。网上阅卷的优点: 1 实现了考试的管理的信息化 考生的所有答题情况和相关数据信息全部存储在计算机系统里,并可以建立 相关评阅老师的档案,进一步提高考试题目的命制和评阅工作的 2 实现试卷评阅的专业化 实现了将试卷的评阅分割为客观题部分的自动评卷以及主观题部分的网上评 卷功能。全过程采用计算机进行管理操作,更能有效的提高评阅的速度和准确度【8 】。 3 提高了阅卷的公平公正性。 自动评阅部分采用自动扫描识别方式,在提高了评阅准确性的同时,更保证 了评阅的公平性,排除了人为的干扰的因素影响。提高了评分的公信度和公正性。 4 方便信息查询。 采用传统阅卷方式时,如果需要查找某份试卷的信息,需要人工手工动的去 翻卷和查卷,费时费力。网上阅卷可以将考l 答卷信息都保存在数据库服务器中, 查询起来方便快捷,更有利于永久保存和存档。 6 便于数据分析,可为学校对考试提供更为科学的决策依据。 电子科技人学硕十学伊论文 由于计算机有着强大的数据处理和分析能力,能够快速的评阅试卷以及对主 观题部分的阅卷工作提供强大的数据分析处理功能,可以快速方便的生成数据的 统计和分析报表,这可将为学校的提供更为合理也更为科学的相关的决策依据【8 1 。 1 2 课题研究的任务 虽然网上阅卷极大提高了阅卷工作的效率,但是毕竟也会存在着一定的误差。 如何在保证效率的基础上,提高识别的准确度,一直都是业界研究的热点。 在考生的答题卡进过扫描仪扫描成为数字化图像到得到最终的识别结果最终 要经过以下这2 个主要步骤。 ( 1 ) 在进行扫描时,由于扫描时试卷的放置位置不准或者由于扫描仪的本身的 问题,会使得到后的图像产生一定的旋转和偏移,这将对之后图像的识别将会产 生巨大的影响,会让识别不诈确或者是试卷图像根本无法识别。如何对此时的偏 转图像进行纠偏校正,以及纠偏效果的好坏,都将对后续的识别阶段起着重要的 作用。 ( 2 ) 图像的二值化处理能够将实体和背景相分离,这对于提取图像中的信息非 常重要的环节,二值化阀值选取的好坏直接影响到后续的识别结果。如何根据千 差万别图像的不同信息选取一个自适应的阀值,并在选取阀值的基础上进行o m r 码的客观题识别是本文的研究方向。 1 3 论文的结构安排 本论文共分六章 第一章绪论。主要介绍了本论文的选题背景,国内外的研究现状以及研究任 务。 第二章介绍了网上阅卷系统的基本框架和历程,以及纸卷数字化系统的系统 结构和各个子系统功能。+。 、 第三章阐述了图像数字化的基本概念和图像预处理中的关于对于去除噪声 的相关技术。 第四章针对试卷在图像成像时会发生偏转的特点,设计了并详细分析了参考 _ i 模式纠偏和校正的实现原理和过程。 4 第一章绪论 第五章针对试卷图像由于受到各种各样干扰而引起质量下降的特性,设计了 图像特征对应阀值的二维数据模型,并在o m r 客观题的识别部分进行了实现。 第六章对本文的工作和当前的工作进度进行了总结,并分析了下一步需要继 续研究的工作。 , 电子科技人! 学硕十学何论文 第二章网上阅卷分析 2 1 网上评卷的流程和框架 2 1 1 网上评卷的流程 1 加载考试的相关信息 将考生的相关报考信息和分配到的准考证号相关联并一起录入到数据库中, 并同时进行相应的考试场地的分配。 2 考试题目的命制和答题卡的生成 运用相应的考试试卷的命题机制进行题目的命制,整个考试卷由试卷题目和 答题卡这两部分组成。在进行在印制试卷时,将试题与答题卡部分分开,即试题 部分不再给考生留有空间进行作答,所有主观题和客观题的作答区域都印制在答 题卡上。考生在答题时,客观题部分只需在答题卡上相对应的填涂区域的位置涂 黑即可,而主观题部分在答题卡的相应区域内作答。 3 对答题卡的评阅 考试结束后,所有的答题卡则统一送到专门的部分进行扫描。将这些答题卡 进行扫描转化为相应的图像数据。则根据不同的部分分类处理: ( 1 ) 客观题部分, 此时所有的准考证和客观题部分的图像都会根据之前所分配的原则分到相应 的机器上进行图像处理,并进行识别,将所识别得到的结果与数据库中的答案相 对比,得到相应的结果分数。 ( 2 ) 主观题部分 按照之前划分好的题块部分,对每份答题卡试卷进行图像的切割,根据之前 分配好的教师阅卷原则,将这些切分后的图像分发出去,分配给每个相应的评阅 老师的机器上进行评阅。评阅老师则在自己的机器上根据评分准则对试卷进行评 判打分。当教师之间所给出的分数超出误差值时,服务器将自动将这份试卷随机 发放给另外的评阅教师进行评阅。如果评分的结果都大于规定的误差值,服务器 6 第二章网上阅卷分忻 则将该考生该题的答题图片发给评卷组长【9 1 。评卷组长可以单独根据评分标准给 分,也可以根据之前评阅的结果选择最终的合理分数、查阅i i 三个评卷教师的评 分结果,选择一个合理的分数作为最后分数。 4 分数的统计以及合成 当评阅完成后,计算机将自动将客观题部分和主观题部分的分数进行合成统 计,并给出相应的统计数据,分数和报表。 2 1 2 网上阅卷的系统框架 现在广泛适用的阅卷系统大多都是采用了由服务器支撑的b s 架构三层结构 模式,即是:底层的数据库、中间的应用服务器和用户端。其中应用服务器应用并 维护了一个具有动态连接池连接的数据库,并能够在用户的并发访问时重用连接, 随着并发量变化,减少资源消耗,而连接池技术能够对数据库中的数据进行缓存, 有效减少对数据库产生的压力。 基于此应用三层架构中,应用通常以组件形式部:署在应用服务器中,维护升 级容易,能在不停机的方式进行热部署。当负载超出一个服务器能力极限时,可 通过简单的添加服务器的方式来获得更大计算能力,服务器而应用服务器的负载 均衡器能自动将用户的请求分发到各即使服务器群中有服务器失效也不影响系统 的服务,从而获得高可靠性【9 】。系统框架如下所示: 7 电子科技人:学硕十学伊论文 2 2 纸卷数字化 2 2 1 纸卷数字化简介 图2 1 网上评卷的系统框架图 纸卷数字化是指从考生的答题卡封装后,到扫描仪处进行扫描,再进行试卷 图像的分发,到最后对答题卡的客观题部分进行机器评阅的全过程。 在“学子a 招生考试数字化系统”中,在调用考务总指挥进行考生信息的 录入和考试所在场地等等必要的信息设置并且在考试完成后,此时则进入纸卷数 字化子系统环节。纸卷数字化子系统采用各种先进的图像处理方法提前所需的关 键数据,提出了影像合成提取关键信息为特色的信息采集方案,有着图像更清晰, 文件存储空闻更小的优点。 , p 一 第二章网上阅卷分析 2 2 2 纸卷数字化框架及功能流程 纸卷数字化作为整个招生考试系统中重要的一个子系统,由测试卡系统,答卷 分割模板及初始化,小批量主客观题分步测试,大批量扫描及其识别,客观题自 动评卷计分,主观题大批量分割存档,问题卷分类及分类处理这7 大子模块组成。 其系统框架如下图所示: 图2 2 纸卷数字化系统框架图 纸卷数字化系统子模块的主要功能为: 1 测试卡系统 测试卡是针对准考证或者是客观题所特有的图像信息,进行各种各样的图像 效果变化,以达到现实中可能出现的图像效果的图像集合。次系统主要用于对准 考证和客观题部分的测试卡进行识别测试,提取出测试卡试卷中所包含的图像特 征及其相对应的二值化阀值的信息,建立二维映射模型,为以后的图像识别建立 基础的模型数据。 2 答卷分割模板及初始化 此子模块系统主要用于建立试卷答题卡的模板信息,包括:准考证的位置大 d 、信息,客观题的区域大小以及选项大小和个数的信息,及其主观题部分的题块 区域的位置信息,为后续的答题信息识别建立基础数据。 q 也f 科技人学硕十学位论文 3 小批量主客观题分步测试 小批量主客观题分步测试能够对考试答卷中的考生信息的准确性, 客观题答 案的准确性和主观题分割后的相关区域的正确性进行小批量的检测和验证,并有 着良好的人机交互界面。 4 大批量扫描及识别 启动高速扫描仪,对大批量的试卷的答题卡信息进行高速扫描,扫描的方式 以试卷袋也基本单位,可在单袋试卷扫描结束后同步进行对考生的身份信息识别, 并在传输之前对考试答题卡卷进行加密以及m d 5 防篡改验证,有着高速和高可靠 性和安全性的保证。 5 客观题自动评卷 客观题自动评卷能够根据之前模板设置的相关信息对考生的答题卡试卷中的 客观题部分进行自动的评阅以及对结果分数的汇总,以试卷袋为其评阅识别的基 本单位。 6 主观题大批量分割存档 主观题大批量分割存档根据之前的设置的主观题题库的模板信息对考生的答 题卡区域按照题块的方式来对图像进行切割和划分,以试卷袋为其分割操作的基 本单位。 7 问题卷分类及分级处理 问题卷分类及分级处理能够对因为答卷本身的质量问题或是由于扫描质量不 佳而引起不能被识别或者分割的答题卷进行实时、分类处理。 纸卷 纸卷数字化模块功能的详细流程图如下所示: 1 0 第二章网上阅卷分析 图2 - 3 纸卷数字化功能流程图 1 1 电子科技大学硕士学位论文 在本论文中,主要关注的是纸卷数字化部分中的测试卡系统,答卷分割模板 及初始化以及小批量主客观题分步测试这三个子系统中的核心原理实现。后续的 几个子系统的识别原理与此相同。 2 3 本章小结 本章分析了网上评卷的功能流程以及其系统框架,也分析了在“学子a + + 招 生考试数字化系统中纸卷数字化子系统的框架和详细的功能流程,以及在整个 的网上评卷系统中所起的作用。 1 2 第二章数字图像处理技术 第三章数字图像处理技术 3 1 数字图像处理技术概念 图像处理指的是对指定的图像进行分析,加工处理( 包括去除噪声,增加,复 原等等的技术) ,使其满足人们的视觉及其他要求的科学技术。目前大多数的图像 都是以数字的形式进行的存储【lo 】,因而图像处理在多数的时候指的是数字图像处 理。 由于近些年来计算机技术的发展,计算机处理和运算速度越来越快,存储量 也越来越大,再加上离散数学的发展,图像的数字化处理技术得到了迅猛的发展, 而研究所涉及的领域也越来越多( 如数学,生理学,医学,电子信息学科等等) , 如今,对图形数字出来的研究已受到各国的极大重视,相关技术也得到迅速发展, 同时对社会科技的进步也起着重要的推进作用。 从纸制纸卷到最后得到识别结果,其中的主要过程如下图所示: 。 图廉僦图像嬲图嬲0 3 2 图像数字化 图3 - 1 图像的处理主要过程 纸制答题卡试卷从通过扫描仪仪器转化为可以被计算机识别处理的形式的数 据即称之为图像数字化 3 2 1 数字图像概述 在我们生活的社会中,我们能看到的任何自然界的风光和图像都是连续的模 拟图像。色度学理论认为,任何颜色都由红( r e d ) 、绿( g r e e n ) 、蓝( b l u e ) 三种基 本颜色按照不同的比例进行相加混合得到,斟此红、绿、蓝被称为三原色。因此, 电子科技人学硕十学伊论文 图像中的任何颜色都可以由这三维颜色函数来表示。其数学表达式为: g ( x ,y ,z ) = f ( r e d ) ,f ( g r e e n ) ,f ( b l u e ) )公式( 3 1 ) 其中f 函数表示在相应的颜色坐标空f h j 相对应颜色的分量值。这些函数都是 其相应的值空间内都是连续的,即是在值域内的每一个值都有相应的颜色与之相 对应。红、黄、绿这三种颜色按照不同的颜色组合就可以得到不同颜色效果的图 像【1 。 3 2 2 图像的灰度化 在考试结束后,试卷答题卡图像在经过扫描仪时都会扫描成灰度图像,以进 行后续图像的识别。 在计算机领域里,数字化图像的就是以像素为基本单位。一个面积为m * n 大 小的图像,就有m * n 个不同的像素组成。灰度图像( g r a yi m a g e ) 就是指是图像 的每个像素只包含有一个采样颜色的图像,只含有亮度信息,而不再含有相关色 彩信息。图像显示为从最暗黑色到最亮的白色。就正像我们在平时看到的连续变 化的,零度由暗到明的黑白图片。因此,要能表示灰度图像的特征,就需把其相 对应的亮度值进行灰度化等级划分。通常划分的等级为0 到2 5 5 ,其中0 代表最暗 ( 黑色) ,而2 5 5 代表最亮( 全白) 。把相应r g b 颜色色彩图像要转化为灰度图像的 对应关系式是: g r a y = o 2 9 9 r + 0 5 8 7 g + 0 1 4 4 b 公式( 3 2 ) 其中g r a y 代表最终得到的灰度等级,r 代表此刻r g b 颜色表中对应的红色彩 值,g 表示相应的绿色的色彩值,而b 则代表的是相应颜色表中蓝色所对应的色彩 值【1 2 】。 3 3 图像预处理 每一类图像都有自己所独特的信息和特点。因此,每一类的图像都应该根据 其本身的图像特点进行不同的图像预处理。由于在实际操作中,试卷的答题卡图 像在经过扫描仪转化为狄度图像时,图像质量都会因为受到各种各样的干扰( 例如 噪声点,扫描仪本身的灰尘等等) 而下降。所以我们在对试卷进行识别之f 、订,都需 1 4 第二章数字蚓像处理技术 要对试卷的答题卡图像进行预处理,以更加有利于提取出我们所感兴趣的图像信 息。 图像的预处理实际就是对图像进行纠偏,滤波和切割等等的操作,以使图像 能更平滑,并减少图像中的噪声点【b j 。预处理效果的好坏,对后续的图像识别有 着重要的影响。图像预处理的流程如下: 3 3 i 灰度直方图均衡化 图3 2 图像预处理过程 直方图均衡化是指利用统计得到的直方图数据,对其直方图数据进行修改, 改变图像里各点的灰度值,来达到增强图像对比度的目的,直方图均衡化的“中 心思想”就是把原灰度图像的直方图从在某个范围内比较集中变成在灰度范 围内的均匀分布【1 4 l 。 如果用变量r 来表示图像中某个像素的灰度等级,并对r 做归一化处理,即 使得o = r = 1 ,其中r = o 代表黑,r = l 代表白。 对一幅灰度图像来说每个像素在变化空间 0 ,1 区间内的值都是随机的。此 时的r 就是一个随机变量,因此我们可以用概率密度函数( p r ( r ) ) 来表示此时图像 的灰度分布。下图就是一幅用直角坐标系来表示的灰度直方图: olr 图3 3 原始图像的灰度直方图 电子科技人学硕十学伊论文 其中横轴表示图像的做了归一化处理的灰度等级r ,纵轴表示其相应的概率密 度函数p r ( r ) 。从这幅图像的灰度分布来看,图中大多数像素都比较偏暗,所以整 幅图像的都比较按,对比度和亮度都不强。 - 为使图像清晰,我们可以把灰度分布等级拉开,使灰度分布均匀。这相当于 增大了图像对比度。理想的直方图均衡化是使处图像灰度直方图中各灰度级具有 相等的频率,如下图所示: p r ( r ) l 0 ,1 r 图3 4 理想直方图均衡化后的直方图 因此我们就需要有一种变换的函数关系s = t ( r ) ,能够对图像进行均衡化处理。 我们知道可以以r 的累积分布积分可作为变换函数,即 s = t ( r ) = i :p r ( x ) d r 公式( 3 3 ) 式中x 是积分变量,而p r ( x ) 就是r 的累积分布函数。图像在经过此变换后的 概率密度在其函数的定义域内是均匀相等的,也就实现了灰度直方图的均衡化处 t 里 1 5 1 。 为了有利于实现图像数字化处理,我t 1 3 5 i 入离散形式。在离散情况下,用p r ( r i ) 来代表离散级灰度,则此时有下公式成立: p r ( r i ) - - n i ni = l ,2 - - - , l - 1公式( 3 4 ) 上面公式中n i 为图像中这种灰度级的像素数,n 则是图像中的所有的像素总 数,n i n 就是概率频度,l 为图像的灰度等级。 在离散形式下,把c 作为对应于灰发的累计概率函数,定义为: 上 c ( i ) = :p r ( j )公式( 3 5 ) 面 此时我们创建y = t ( x ) 的变化,对于原始图像中的每个灰度值,都会相应得 到一个y ,此时y 的累计概率函数就在其所有值的范刚内进行变化,转换公式为: l 第三章数字图像处理技术 y i = t ( x i ) = c ( i )公式( 3 6 ) 由于进行了归一化处理,为使得将这些值映射回它们最初的值域,需再进行 以下变换【1 : y ( i ) = y ( i ) 牛( l m a x l m i n ) + l m i n 公式( 3 7 ) 上式中y ( i ) 表示在最初灰度值域时,经过均衡化后的相应像素点相应的灰度 值,l m a x ,l m i n 则分别表示在最初灰度值域里最大的灰度等级和最小的灰度等级。 在离散灰度情况下,直方图的累计概率函数只能近似趋近于连续时的密度函 数,也就自然很难获得理想的均衡直方图。但在此时的直方图仍然比原始直方图 要均衡,图像的对比度也就得到相应的提高。 3 3 2 灰度图像的平滑 试卷图像的平滑处理也就是对试卷图像中所存在的噪声的消除。任何一幅图 像在现实中的传输及其操作的过程中,都会受到各种各样因素的干扰而产生噪声。 这些噪声会使得图像本身的质量下降,图像特征模糊,对后续图像的分析将产生 不利的影响。为了降低噪声干扰,改善图像质量而进行的操作处理被称为图像的 平滑【16 1 。 在灰度的图像中的噪声主要有以下几种: 1 ) 加性噪声 此类噪声和图像信号强度是无关的。比如图像在传输过程中的信道的噪声和 在扫描图像时所引起的噪声等等。带有加性噪声的图像f ( x ,y ) 可看成是无噪声图 像g ( x ,y ) 以及噪声n ( x ,y ) 之和。 2 ) 量化噪声 量化噪声是数字化的图像的主要噪源之一,其噪声的数值大小能够表现出数 字图像与原始图像之问差异的大小,在灰度图像中减少这种噪声的最好办法就是 增大灰度等级的量化量。 3 ) 乘性噪声 乘性噪声一般由信道不理想引起,会随着图像信号量的变化而发生改变,因 此是和图像信号相关的。如电视机会出现的于二l 描光栅、一般胶片中的颗粒噪声等 等都属于乘性噪声。 电子科技人学硕十学何论文 4 ) 椒盐噪声 此类噪声是在图像中经常会见到的一种噪声,它其实就是一种随机的白点或 者是黑点。 灰度图像的平滑处理属于图像增强的范畴,是一种十分有用的图像的预处理 技术。其主要目的就是为了减少灰度图像中的噪声,使得图像的质量得到提高。 灰度图像的平滑处理通常是可分为空间域法和频率域法两大类【9 】。在一般的情况 下,在空间域内我们可以使用平均领域法来减少相应的噪声:而在频率域,由于其 噪声的频谱通常在高频,在此时就可以采取各种形式的低通滤波的方式来相应的 减少其相关的噪声。 在图像处理系统中,滤波方法有很多,如中值滤波和高斯滤波等等。 中值滤波,是指在以某点( x ,y ) 为中心的小窗口内,把所有象素按照其灰度值 从大n d , 的顺序进行排列,并将中间值作为此时( x ,y ) 处的灰度值( 如果此窗口中 有偶数个的象素,则可以取两个中间值的平均) 【1 7 】。中值滤波是一种典型的低通滤 波器,它的主要目的就是在保护图象边缘的同时并将噪声去除。 中值滤波的效果如下所示: j 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0-000 0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 延边自治州中石油2025秋招笔试模拟题含答案油品分析质检岗
- 国家能源伊春市2025秋招面试专业追问及参考计算机与自动化岗位
- 国家能源鹤壁市2025秋招电气工程类面试追问及参考回答
- 中国移动枣庄市2025秋招笔试行测题库及答案通信技术类
- 赣州市中储粮2025秋招面试专业追问题库信息技术岗
- 白城市中石化2025秋招笔试提升练习题含答案
- 2025年材料成型考试题及答案
- 2025年厨房消毒考试试题及答案
- 2025年公文办理考试题及答案
- 采购内勤考试试题及答案
- 2025重庆明德商业保理有限公司招聘1人考试参考试题及答案解析
- 仁怀市中小学校长绩效考核的实施方案a
- 2025年七年级语文上册《陈太丘与友期行》文言文对比阅读训练含答案
- 2025年气象系统公务员录用考试面试真题模拟试卷(结构化小组)
- 风力发电项目审批流程及要点梳理
- 跨境电商第三方物流合作中的三方保密协议及责任划分
- 医院污水站维护方案(3篇)
- 2019ESCEAS血脂异常管理指南2025重点更新解读
- 视频监控考核管理办法
- 《现代传感与检测技术》教学大纲
- StarterUnit3Wele!SectionB1a1e(教学设计)人教版七年级英语上册
评论
0/150
提交评论