(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf_第1页
(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf_第2页
(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf_第3页
(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf_第4页
(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf_第5页
已阅读5页,还剩82页未读 继续免费阅读

(计算机应用技术专业论文)网上阅卷中信息提取与识别技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i 4 d , 多 峄 i h _ 1 3 j 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意。 签名:罩丑0 牛 日期:扣,o 年岁月x 2 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:辎比驻砑 导师签名: 日期:如l 口年j 月l 】日 泔嘲+ 。蜥瑚p “撕一觯 计却,懈h 小+汕4 t 廿叭 # 。臼棒,w f t 。一。,t 卅j ,铆,一t “f ”。一赣掰t 峨p 雌如t j 。础一山,卿一、:、j 帆静 咖 t 孵群4p 蚺。 z c 0 摘要 煳聊 摘要 近年来我国教育事业现代化步伐逐步加快,标准化考试已进入到社会各个行 业的人才选拔过程当中。目前所使用的一些网上评卷系统由于受投资、成本、功 能及技术的限制,一直以来无法直接进入学校等小规模考试领域应用。本文在分 析网上阅卷流程之后以研究自动化阅卷环节的相关技术为切入点,使用以数字图 像处理技术为支撑的图像识别软件替代o m r ( o p t i c a lm a r kr e a d e r ) 机器来完成网 上阅卷中自动阅卷任务,不仅可以大大降低阅卷成本,同时系统的高度灵活性可 以使得这种阅卷方式深入到更细微的领域,弥补了大规模网上阅卷系统的不足。 本文在开始对目前在自动阅卷中所使用的两种主要的阅卷方法进行了概述。 一个o m r 阅卷机阅卷,另外一个是计算机软件阅卷,分析了两者的阅卷原理与流 程,最后分别提出了目前这两种阅卷方式还存在的不足以及应用限制性。本文所 研究的内容也属于计算机软件阅卷,但与以往不同的是以应付大批量的任务处理 为重心。+ 条形码的识别和o m r 信息卡的识别是本文的两个核心内容。在c o d e l 2 8 条 形码处理系统的设计与实现中,本文探讨了条形码图像的预处理技术,并在最后 给出了一种比较适用的预处理流程。在图像二值化方面使用了通过构建阀值模型 来对阀值进行预存,再从模型取值的新方法,相比自适应阀值系统运行效率有所 提高。最后在条形码的宽度测量与译码方面分别介绍了目前应用比较多的两个方 法:平均值法和相似边距离测量法,在条形码处理系统中两种方法都得到了应用。 最后展示了条形码处理系统的实际处理效果。 在o m r 信息卡处理系统的设计与实现中本文对o m r 识别的图像预处理,目 标点定位等关键技术进行了重点论述。在图像预处理流程中使用形态学对目标点 进行提取,并将各目标点的位置等特征信息保存。在目标点的定位方面也介绍了 两种方式,一个是使用灰度投影,另外一个是使用参考点。并对两种方法的优劣 以及使用前提条件进行了说明。最后展示了o m r 信息卡处理系统的实际工作效 果,并对多种纠偏方法的纠偏性能进行了分析。 在本文的最后总结了本文所设计的两个系统还存在的一些不足和有待遇改进 的地方,并对未来工作进行了展望。 h叶qj 关键词:网上阅卷,条形码识别,o m r ,信息卡识别 7 p 7 1 岫w 叫南删 和螂d h 女“c 、忡辨,一社辄 * 哪一中 ? 删 - 一_ 苹- ,州 杆川,* ,屯:w 咏* * 咏 ,一即_ 州。一,。州 i 毒 0 弋l 多 0 a b s t r a c t a b s t r a c t i nr e c e n ty e a r s ,t h ep a c eo fm o d e r n i z a t i o no fc h i n a se d u c a t i o ni ss p e e d i n g 印 s t a n d a r dt e s t sh a v eb e e na p p l i e dt os e v e r a lo fs o c i a lt a l e n ts e l e c t i o np r o c e s s e s 1 1 l e t r a d i t i o n a lo n l i n et e s ts y s t e mh a sn o tb e e na d o p t e db ys c h o o l sa n do t h e rs m a l l - s c a l e f i e l da p p l i c a t i o n sb e c a u s eo ft h eh i g hc o s ta n dt e c h n i c a lc o n s t r a i n t s t h i st h e s i st a k e s a u t o m a r k i n ga m e n d i n gs y s t e mt or e p l a c et h eo m r m a c h i n e s ,w h i c hu s e sd i g i t a li m a g e p r o c e s s i n gt e c h n o l o g y o fi m a g er e c o g n i t i o ns o f t w a r et o c o m p l e t et h ea u t o m a t i c m a r k i n g t h i sm e t h o dc a nn o to n l yr e d u c et h ec o s to fs c o r i n gb u ta l s oc a nd e e pi n t ot h e s u b t l ef i e l dt om a k eu pt h ed e f i c i e n c i e so fl a r g e - s c a l eo n l i n em a r k i n gs y s t e mb e c a u s eo f h i g l ld e g r e eo ff l e x i b i l i t y t h es u m m a r yo fa u t o m a t i cm a r k i n gi sg i v e na tt h eb e g i n n i n go ft h i st h e s i s ,o n eo f t h em a i nm a r k i n gm e t h o d si so m rm a c h i n e ,a n dt h eo t h e ri sc o m p u t e rs o f t w a r e d e f i c i e n c i e sa n dt h er e s t r i c t i o no fa p p l i c a t i o no ft h et w om e t h o d sa r ep r o p o s e du n d e r a n a l y s i so fp r i n c i p l ea n dp r o c e s so fm a r k i n gf i n a l l y n ec o n t e n to fs t u d yi nt h i st h e s i s a l s ob e l o n g st o 、c o m p u t e rs o f t w a r em a r k i n g b u ti tf o c u s e so nh o wt oc o p ew i t ht h et a s k o f l a r g eq u a n t i t i e sh a n d l i n g t w oc o r ee l e m e n t so ft h i st h e s i sa r e0 m ri n f o r m a t i o nc a r da n db a r c o d e i d e n t i f i c a t i o n b a r c o d ei m a g ep r e p r o c e s s i n gt e c h n o l o g yi sd i s c u s s e di nt h ec o d e12 8 b a r c o d ep r o c e s s i n gs y s t e md e s i g na n di m p l e m e n t a t i o n a tl a s tam o r ea p p l i c a b l eo f i m a g ep r e p r o c e s s i n gf l o wi sg i v e no u t c o m p a r e dt ot h es e l f - a d a p t i v et h r e s h o l d ,t h e o p e r a t i o n a le f f i c i e n c yo fs y s t e mi si m p r o v e dw i 戗1an e wm e t h o do fu s i n gat h r e s h o l d m o d e lw h i c hb u i l d so nt h es t o r e dt h r e s h o l da n dt h e ng e t sv a l u ef r o mt h em o d e lf o r i m a g eb i n a r i z a t i o n f i n a l l yt h et h e s i si n t r o d u c e st w om e t h o d so ft h eb a r c o d e w i d t h m e a s u r e m e n ta n dd e c o d i n gi nt h ec u r r e n ta p p l i c a t i o n :t h ea v e r a g ed i s t a n c em e t h o da n d s i m i l a r - e d g ed i s t a n c e m e a s u r e m e n t a l lo ft h e mh a v eb e e na p p l i e di nt h eb a r c o d e p r o c e s s i n gs y s t e m t h ea c t u a lp r o c e s s i n ge f f e c to fb a r c o d ep r o c e s s i n gs y s t e mi ss h o w n l a s t l y i nt h ed e s i g na n dt h ei m p l e m e n t a t i o no fo m ri n f o r m a t i o nc a r dp r o c e s s i n g s y s t e m ,i m a g ep r e p r o c e s s i n ga n dt a r g e tp o i n tp o s i t i o n i n ga n ds o m eo t h e rc r i t i c a l ! i i n一,螺。 a b s l 良a c t t e c h n o l o g i e sa r es t u d i e di nt h i st h e s i s m a t h e m a t i c a lm o r p h o l o g yi su s e di nt h ei m a g e p r e - p r o c e s s i n gt oe x t r a c ta n dl o c a t et h ef e a t u r eo ft a r g e tp o i n t s t h e r ea r ea l s oe x i s t e d t w ow a y sf o rt a r g e tp o i n tp o s i t i o n i n g :g r a y s c a l ep r o j e c t i o na n dt h er e f e r e n c ep o i n t a d v a n t a g e s ,d i s a d v a n t a g e sa n dp r e c o n d i t i o n so f t h et w om e t h o d sa r ed i s c u s s e d e f f e c t s o fp r a c t i c a lw o r ka r es h o w nf i n a l l y ,a n dt h et h e s i sa n a l y z e st h ep e r f o r m a n c eo fav a r i e t y o fc o r r e c t i v em e t h o d s i nt h ee n do ft h i st h e s i s ,af e wo fa r e a sf o ri m p r o v e m e n ta n ds o m ed e f i c i e n c i e so f t h et w os y s t e m sa r es u m m a r i z e d ,i n c l u d e st h ep r o s p e c t so ff n t u r ew o r k k e y w o r d s :o n l i n em a r k i n g ,b a r c o d ei d e n t i f i c a t i o n ,o m r , i n f o r m a t i o nc a r d i d e n t i f i c a t i o n ,冲一,巾p 。 一删m和蛳啐 , 小柑 一。4 。 精4 扣她。“喇糯肌、1 彳 下1 0 h , “ , 目录 目录 第一章绪论1 1 1 研究背景及意义1 1 2 网上阅卷简介3 1 2 1 什么是网上阅卷3 1 2 2 系统构成4 1 2 3 工作流程4 1 2 4 发展现状5 1 3 本文研究内容与任务:6 1 4 论文组织安排7 第二章自动化阅卷技术概述8 2 1 自动化阅卷的任务8 2 2o m r 机器阅卷1 0 2 3 计算机软件阅卷1 1 2 4 本章小结13 第三章图像采集与处理? 1 4 3 1 数字图像相关概念1 4 3 1 1 数字图像定义1 4 3 1 2 图像类型1 5 3 1 3 图像分辨率1 5 3 1 4 图像文件格式1 6 3 2 图像采集一l6 3 3 图像处理1 7 3 4 本章小结l8 v 、;砖 目录 第四章条形码识别技术研究与应用1 9 4 1c o d e l 2 8 条形码概述1 9 4 1 1c o d e l 2 8 组成1 9 4 1 2c o d e l 2 8 编码规则2 0 4 1 3 条形码识别2l 4 2 条形码处理系统的设计与实现2 2 4 2 1 系统需求2 2 4 2 2 系统总体结构2 2 4 2 3 条码处理模块的设计2 3 4 2 3 1 图像预处理o 。2 3 4 2 3 2 条码的识别3 0 4 2 3 3 条码生成3 9 4 3 系统应用3 9 4 3 1 训练模式4 0 4 3 2 应用模式4 5 4 3 3 实际应用分析k 。4 6 4 4 本章小结4 8 第五章o m r 信息卡识别技术研究与应用4 9 “” 5 1 7 信息卡简介o :? 。- :- :一- j j :_ j 4 9 5 2o m r 信息卡处理系统的设计与实现5 0 5 2 1 系统概述5 0 5 2 2 基于参考点的标记定位识别:5 0 5 2 2 1 图像预处理5 l 5 2 2 2 目标分类与特征提取5 3 5 2 2 3 填涂点逻辑关系构建5 4 5 2 2 4 信息卡识别。5 5 5 2 3 基于灰度投影的标记定位识别5 8 5 3 系统应用。6 3 5 3 1 模板建立6 3 誓 , 了 - 白 - 目录 5 3 2 识别性能分析6 5 5 4 本章小结6 7 第六章总结与展望i 6 9 致谢7 1 参考文献7 2 攻硕期间取得的研究成果7 5 v 1 1 、 ,1 * 一。晰渺“许、w 。,目pt - ,一叶,叫m 4一“,p ,q jv 肿一曲一、一撕妒,“ - 岫晰斜 f 霄。p # 岫i,* 啪嘲,柏蛳m 。-机脚t 州 v ,; 卜0 h i , 白 第一章绪论 第一章绪论 在信息技术高速发展的今天,以高新技术为内核的技术创新和变革推动着科 学的发展,信息技术的普及和应用,使得整个人类社会信息的生成、传播和使用 的方式发生了巨大改变。在教育考试领域内,我国的教育水平日益提高,考试模 式也早己开始与国际标准接轨,同时随着国家九年义务教育的普及和当前各大高 校的大规模扩招,每年参加各类考试的人数也急剧上升,这致使考试结束后教师阅 卷的工作变得越来越繁琐和沉重,因此如何改进阅卷方式、减轻教师负担、提高 阅卷质量、提升教学水平已成为各级教育主管部门和学校共同关注的热点问题, 也是教育测量信息化专业研究机构主攻的方向i l j 。 随着计算机科学技术的飞速发展,计算机的数据处理能力和信息交换能力都 有了较大的提高,硬件环境和软件环境得到持续改善,另外系统的持有成本和运 营成本也逐步下降,再加上扫描仪设备的不断普及和信息电子化的趋势,快速信 息录入的成本、可靠性和效率逐渐为用户所接受。这使得借助计算机来进行判卷 工作变得可行,而且也将成为提高教学质量,促进教育管理现代化的一种必要手 段。 1 1 研究背景及意义 考试是现代社会选拔人才的重要方式,阅卷工作是其中的一个重要环节。近 年来,我国在大部分省市实行的高考计算机网络评卷工作取得了显著成效,也已 逐步为各级教育主管部门和教育工作者所认识。然而,学校考试的人工阅卷与高 考的计算机网络评卷相比,不但形式上不同,而且还存在着质量与效率的巨大差 异。众所周知,计算机网络评卷可以为考试部门带来质量与效率的好处,但是, 高考计算机网络评卷系统由于受投资、成本、功能及技术的限制,过去一直无法 直接进入学校应用;即使是目前部分学校在使用的阅卷机( o m r 光标阅读器) 也 由于其只能解决客观题阅卷而不能进行主观题评卷的功能不足和需要使用精制答 题卡的限制,在学校考试业务中也无法得到广泛的推广与使用1 2 j 。 如今教育信息化发展使得许多学校已经具备了校园网多媒体教室教学管理 系统等硬件条件,同时以人为本的管理理念促使也学校在提高教学质量的同时积 气搿 t i 电子科技人学硕十学位论文 极寻找减轻教师负担的途径。在教育测量与评价的信息化越来越受到重视情况下, 传统的阅卷方式及统计分析手段不能再满足学校同益增长的实际工作需要,现代 化需求追在眉睫。? 随着我国教育事业改革步伐的加快,各级、各类考试的组织管理和实施工作, : 正向着标准化、现代化、规范化、电子化的方向发展。从普通考试到高考网络评 卷,原有的管理模式和方法,显然已经不能再适应需求。推行和使用现代化的阅 卷、存储和管理手段,无论是从战略的高度,还是从现实工作的角度,都有非常 积极的意义。 、 考生手写棱怠l j ( jl 考生答题注意攀顾一jl 贴条码隧 _ _ - _ - - - - _ _ _ _ _ _ - 一,。_ j + 一 r “_ 7l 2 0 0 7 筇海熊宙静满麓梭藕畿譬零缝一誓谖簦锈筹耪书一特j 徐辩二臻器 + 。”t i 一,d i m , i ! p 4 :;? ;磐。嚣g “嚣譬i : $ * oi t 4 + 薛烈馘磷裂i : ”4 一1 - 名护靠口p *4 - 1 , 霉广 ”j j ? 毽i7 ,f f 一扣4 l5 f 舭* l t ,值, ,l0 量 ,# 碍辨瞳 lf tt 鬻mr :董 ,jt 带f 1f i i ;r j ”i 蕾嘣l 。i 缸” ,藏t tii 耳嚣h q ,ltf 射麓掣嚣鹫l ,z 王前,嚣锰蔗t 。t ,瓣“m 童点童l 篙 t 霹佴i l 谨p f l” 罐,r 薯h 1 ,r 辫抖辄z r 涂答题区l ”土群l ;fp 髫+ l 霄誊- 墨撒嘶臻“ t 崔斌糖1 tf 管 j l j ,、缸群嚆i ,to l f :最:射,l ,廉* x # ;靴,;舢譬t : 1 r ;5 馐, l # * 瑾:lf 轩 ft 7 薹: “x 藏、瓤 # 知j j ,l4 土量山t l 罐矗- 五山伸 矗:t 皤f p 赫崔j ,l ,* 吖甓1 r t- 馕鲋! 馐j 讲lo b 0 - 穗t p “j l ;t ,iil :,“# i i ,:l j l j :t :rl ;:;,目辫。lj 蕾il 挂馐 :嚣j ”i f l t ! q ,埘ttr 船q ,墙艟;+ r t 甲# 0 o $ l l jil*“,:射私t = 上:嚣- 蠡引堵j 妒t 抖t 群,til ”。b 图l - 1 标准答题卡示例 2 o 、一4 一。 - 一r , ,f,、 f p k 一 _ 第一章绪论 目前国内各级教育机构内的教学测评等活动均己实现了标准化,如在命题方 面按客观题和主观题组织试卷,制卷方面题卷和答卷分离,而且各科目的答卷都 制成特定规格的如图1 1 ,在考试实施方面都按照一套既定的流程执行等等。在标 准化考试的大趋势之下,利用高速扫描仪和图像识别技术,将各种考试答卷转换 成电子影像文档,使用光学涂点识别、智能字符识别、条形码技术、图形分割、 图形压缩等技术提取试卷上各种需要的信息点( 信息区域) ,然后根据不同的需求 来处理各种考试业务已经成为现代阅卷系统的一种趋势,而且这种方式不仅仅可 以大大提高工作效率,降低工作强度,同时对减少和有效控制评卷误差、监控评 卷质量也将会起到积极作用。 一直以来,受计算机技术的约束,我国考试管理普遍采用光电设备,但随着 我国考试阅卷管理系统的改革和信息数字化时代的到来,规划和实施新一代的考 试阅卷系统,已经是摆在眼前的切实课题。 本文研究内容隶属于企业项目“学子a + + s o f l 招生考试数字化系统”,该项 目已得到国家科技部2 0 0 7 年科技型技术创新基金( 0 7 c 2 6 2 2 5 1 0 1 8 7 4 ) 、成都高新区 科技型技术创新基金以及成都市软件产业发展专项基金支持。 1 2 网上阅卷简介 计算机网上阅卷是从2 1 世纪初逐步发展起来的一种新型阅卷方法,是考试技 术变革的产物【3 1 。自从1 9 9 9 年在广西高考中首次应用到现在为止发展了已有1 0 年, 而在这l o 年间,伴随着计算机技术和信息科学技术的快速发展,网上阅卷技术也 不断完善和成熟起来,并在教育部考试中心的提倡和推广之下得到了很大的普及, 目前已应用到普通高考,成人高考和自学考试等大规模考试领域内,而其他更多 的小规模考试领域也正在加速阅卷信息化进程。 1 2 1 什么是网上阅卷 网上阅卷又称网络阅卷,网上无纸化评分【5 】。它以计算机网络技术、数据库技 术和图像处理技术为依托,采取客观题由计算机自动阅卷判分,主观题由不同的 阅卷教师通过网络在计算机上对考生答卷的电子图像分别进行评分,最后再由计 算机系统自动进行核分和成绩校验1 6 j 。 网上阅卷将人工评卷和计算机技术相结合,既保留了多年纸笔阅卷积累的丰 富经验,又以计算机技术为辅助来控制评分误差,更好地为实现考试评卷的的公 、;0 i 电子科技大学硕士学位论文 平、公正服务。同时,网上阅卷的实施,省去了人工计算核分、抱卷上机登分等 环节,从而节约了大量的人力、物力和财力。 1 2 2 系统构成 一套完整的网上阅卷系统主要由考务管理系统、电脑纸卷系统、纸卷数字化 系统和网上评卷系统等功能模块组成。如图1 2 纸卷数化系统 完成对考试的答卷从纸质形式转 换到电子化归档的过程处理,同 时完成考生信息提取,客观题的 自动评分以及图像的分割 电脑制卷系统 根据考务管理系统的命题决策, 设置试题卷的具体题目内容,设 计题卷核答卷的布局和样式 网上评卷系统 实现答卷主观题的在线评阅过程 与结果质量监控 图1 - 2 网上阅卷系统组成 所需硬件为评卷p c 机,服务器,试卷扫描仪评卷机,打印机和相应的网络设 备。 1 2 3 工作流程 制卷与考试。首先按计算机网上阅卷的要求设计并分别印制试题卷和答题卡, 所有主客观题的作答区域都印制在答题卡上。考生在答题时,客观题在答题卡上 相应位置涂黑,主观题部分在答题卡的相应区域内作答。 答题卡扫描录入。考试结束后将考生的答题卡收回,采用高速扫描仪将答题 卡片快速批量扫描输入计算机,在得到清晰、准确、完整的试卷图像文件后用经 过条码或其它方法识别后的准考证号建立索引,并与考生答题卡的完整原始图像 一一对应,同时系统通过对试卷进行加密,屏蔽掉考生的个人信息,利用图像分 割技术把每个考生的主观题答题部分按照特定的评卷需求进行切分并存放在文件 服务器上。 客观题评卷。客观题评卷是采用o m r 识别软件或光标阅读机,把考生涂点信 息转换成数据库信息的过程。通过o m r 识别软件或光标阅读机能自动采集考生的 4 k 。 , 乒 p 蠢 k q 第一章绪论 客观题答题信息,并与标准答案信息对比,得到考生的客观题成绩,然后记录在 数据库中,最终将与主观题的成绩进行汇总统计。 主观题评卷。在评阅主观题时服务器端程序通过网络将分割好的题块图像随 机分发给不同的评卷终端,阅卷教师通过计算机屏幕上显示的原始图像信息来进 行判卷,阅卷教师的给分结果将实时保存到数据库,在阅卷结束后由系统自动完 成成绩的合成发布和统计分析工作。 如图1 3 所示: 0 丰现题教卿秘1 - 评卷 1 2 4 发展现状 打印,印鳝l 试卷j 餮题箝 图l - 3 网上阅卷流程图 符题批麓手1 攒 存档 霭硗题i 毡脑自动评卷 在国外网上阅卷技术的研究比国内起步要早,而且作为网上阅卷中的一项重 要设备光标阅读机在国外也是发展十分成熟,技术方面也领先于国内,目前 在如托福等大型考试中都已有相应的网上阅卷系统产品投入使用,但这方面详尽 的资料难以获取,另外据我所了解,因教育水平以及体制的差异性的存在,在国 外考试所走的业务流程以及考试所采用的标准试卷与国内有一定的区别,如客观 题的填涂方式以及类型,所以国外的一套系统难以适应国内的应用环境。在国内 忙 曼一 电子科技大学硕十学位论文 现在市面上也出现了不少网上阅卷系统产品,但大多使用光标阅读机来对客观题 进行评分和考生信息提取,这种方式在如高考等少数大规模考试领域中有较多应 用,而对于使用图像识别方法来进行阅卷的新技术则基本处于一种研究与发展的 状态,少数成型的产品也是由于存在诸多的限制条件和缺乏一定的灵活性而难以 推广使用。 1 3 本文研究内容与任务 本文关注重点是阅卷流程中自动化阅卷这一环节,网上评卷中由于之前考生 的答题卡识别一直主要采用机器阅读的方式,基于图像处理的阅卷系统是近几年 才开始在市场上出现,而且一些成型的产品出于商业保密考虑,其关键技术没有 公开,因此本文将从阅卷中数字图像处理技术的应用与关键识别技术的研究展开, 一方面分析和研究基于数字图像处理的条形码和o m r 填涂识别技术,解决网上阅 卷自动化阅卷环节中考生信息的提取以及通用机读卡的辨识,另一方面从降低系 统成本出发,改进方法,使得识别系统能对图像质量做一个广泛的适应,在提高 系统工作效率的同时提高识别率。本文内容涉及到网上评卷中图像数字化处理的 整个流程和内容、图像采集、数字图像处理相关理论和方法、图像预处理、图像 信息提取、条形码识别以及o m r 识别。最后从工程应用的角度出发,使用开发工 具将理论技术通过编程实现,分别开发出条形码制作与识别系统和o m r 信息卡采 集与识别系统。同时对关键的识别算法封装成库以应用到商业软件“学子a + + 软 件招生考试与数字化系统。 条形码处理系统。该系统主要用来识别考试中考生贴在答题卡上的条形码准 考证( 主要针对于c o d e l 2 8 码) ,该系统能够适应一般印刷质量的答题卡,支持 单张识别与快速批量处理,并将识别结果存储到数据库中以供查询。另外系统还 支持条形码的制作,在制作完成后即可在普通的纸张上打印出来使用,相对于专 业的条形码打印标签纸来说成本得到了降低。 o m r 信息卡处理系统。该系统主要用来处理填涂式信息卡,包括基本信息的 采集和批量识别等功能。该系统对信息卡格式与纸张质量不做严格要求,识别处 理主要针对于市面上的标准信息卡,同时也兼容用户自己制作的非标准卡。批量 识别完成后所有结果保存到本地数据库,可以对结果进行查询以及导出到e x c e l 文件。 6 l k 。 i o 第一章绪论 1 4 论文组织安排 本文一共分为六章。 第一章为绪论部分,简要阐述了本课题的研究背景和意义并对网上阅卷做了 简单的介绍,包括阅卷系统构成与工作流程等内容。 第二章主要对网上阅卷流程中自动化阅卷环节进行了概述。介绍了自动化阅 卷的任务,重点分析了目前在自动化阅卷中所采取的两种主要方法的特点。一种 在大规模阅卷领域使用较多的o m r 机器阅卷,比如高考网上阅卷系统就是采取的 这种方式。另外一种是使用图像处理技术和计算机技术的软件阅卷,这是一种近 年来刚刚发展起来的阅卷新模式,目前对这种新型阅卷方法众多学者与研究机构 都已经展开了广泛的研究,而且这也是将来的一种趋势。 第三章主要论述了图像采集与图像处理的基本理论和相关技术。首先对数字 图像的一些基本概念进行了简单介绍,而后阐述了图像采集的方法并对本论文中 所使用的佳能高速扫描仪进行了介绍。最后对数字图像处理中的一些基本内容进 行了概述。 第四章是本文的主要内容之一。在该章中分析并介绍了条形码识别的相关技 术,首先是c o d e l 2 8 码简介,然后对本论文的工作任务之一条形码处理系统的设 计与实现进行了重点介绍。包含了系统整体的工作流程,功能结构,条形码图像 的预处理,条形码的宽度测量与译码。最后对系统运行的实际结果进行了分析。 第五章是本文的第二个主要内容。在该章中主要介绍了填涂式信息卡识别的 相关技术,并对本论文的工作任务之二o m r 信息卡处理系统的设计与实现进行了 重点论述。包括使用数学形态学对图像进行滤波降噪以及目标点特征的提取。在 模板信息构造方面使用了信息卡信息结构模型,在识别方面分别介绍了基于灰度 投影的标记定位识别技术与基于参考点的标记定位识别技术并对两种方法的应用 做了对比,最后给出了以参考点对图像进行纠偏的实际应用结果。 第六章为本文的工作总结与对未来的展望,在文章的最后对已经实现的两个系 统还存在的问题和仍需改进和提高的地方进行了概括和总结。 7 电子科技大学硕士学位论文 第二章自动化阅卷技术概述 自1 9 8 9 年推行标准化考试改革以来,考试的某些环节( 如命题、考试的组织、 客观题的评分等) 逐步地科学化、标准化了【2 1 ,比较重要的是试题被分为客观题和 主观题两类,特别是客观题的推出,使得机器代替人工阅卷的自动化阅卷技术得 以在考试评卷中得到应用和发展,光电扫描技术和图形图像处理与识别技术的成 熟也为自动化阅卷提供了客观技术支持。 2 1 自动化阅卷的任务 在自动化阅卷过程中,机器主要对答题卡上的考生的个人身份信息( 主要指 准考证号) 进行提取,同时对客观题部分进行评分。 目前在大多数考试中考生准考证号在答题卡上的表现形式主要为三种: 1 ) o m r 型准考证,如图2 1 准考证号( 从左向右顺序填涂) 圆圈啊d 】凹圈凹啊四叨圈皿 旺l 田田田卫田田圈圈田团 窿团四四l 四四团团圆囝四 团四团衄团固团团团圆衄 团团团团团圆团四团团田团 r i l l 田四四四圆圆团圆四团圆 圃团圆田团圆圈囤田田圆 圆囝四_ 四团回团口囱四四 f i n 四四田田四田团圆圈 团圆团圆团团田圆圆团圆r l r l 图:2 - 1o m r 准考证示例 这种类型准考证与客观题类似,使用铅笔在对应的数字区域按照填涂标准进 行填涂,目前应用相当广泛。 2 ) 条形码准考证,如图2 2 k “ 第二章自动化阅卷技术概述 图2 2 一维条形码准考证不例 条形码准考证一般使用一维c o d e l 2 8 编码方式,在教育领域也有较多的应 用。它事先要使用专用的条形码机器制作,每个条形码标签与唯一的一个考生对 应,在考试的时候分发给考生并由考生自行贴到卡片指定的位置,成本相对与o m r 型准考证来说高一些,在管理上也比较复杂。 最近几年也出现了使用最新技术的二维条形码来表示考生身份信息的准考证, 如图2 3 ,二维条形码相对于一维条形码码不仅具有信息容量大,抗磨损,同时自 我纠错能力也大大增强,但由于其技术上实施起来比较复杂,目前只有少数应用。 图2 - 3 二维条形码准考证 3 ) 数码管准考证;如图2 4 淼圃匝亚圄薤亚皿弼 图2 - 4 数码管准考证示例 该类型准考证在使用时需按照标好的轨迹涂写相应的数字,已逐渐被o m r 和 条码形准考证所取代。 客观题多为选择题,在答题卡中也以o m r 的形式出现,但布局具有多样性, 如选项可以横排也可以竖排,每道题的选项个数可以为3 个、4 个、5 个甚至更多。 这对于制卡和阅卷机器的灵活性都有很高的要求。 9 文疆强阴敢哪螂刖n 踯 科疆暾盈m 侧iil莹rlll证 illl等 il-lo、 1il啦啦 电子科技大学硕士学位论文 2 2o m r 机器阅卷 o m r 机器即光学标记阅读机,它是一种使用光学扫描的方法来识别按一定格 式印刷或书写的标记信息卡信息,将其变换成计算机能接受的电信号的设备。6 0 年代,o m r 最初由欧美几个发达国家为解决计算机数据信息输入的“瓶颈”问题 而研制,在国内o m r 是随着8 0 年代推行标准化考试的需要而逐渐发展起来的, 虽然起步较晚,但经过几十年的发展,o m r 技术日益成熟并且在各行业得到了广 泛的应用,特别是在教育领域,业界内也推出了相关标准。现行的高考,自考, 成考,计算机等级考试,大学英语四六级考试等许多大型考试所使用的都是基于 o m r 的标准化试题阅卷技术。 o m r 在识别时主要依靠光电传感器这个核心部件,它由多个电眼组成。每个 电眼有两个半导体发光管和一个半导体光敏接受管组成( 如图2 5 ) 所示,利用光 电转换的原理完成识别,半导体发光管发射的光照射在信息卡上,半导体光敏管 半 半导体发光管 半导体发光管 图2 5 电眼示意图 接收信息卡上照射位置的反射光,在信息卡照射位置涂黑或者未涂黑。反射光的 强度就不同。涂黑后光敏管接受的光信号弱,反之则强。这时光敏管内产生的光电 流就有强弱变化,这信号经电脑处理后达到对涂点的识别。一个电眼识别一个涂 点,若干个电眼排列起来组成光电头可完成对一排涂点的识别i 刀f 8 】。 在自动化阅卷中o m r 光标阅读机与计算机配合使用,先使用o m r 光标阅读 机读取答题卡上考生的填涂信息,然后送入计算机由相应的阅卷程序进行判分。 使用o m r 机器判卷的优势是阅读准确,处理速度快,减轻了人的工作量。由于 o m r 阅卷过程是一个电测量的过程,根据测量学理论,不可避免的存在误差f 9 1 。 为了解决客观题目判分误差,o m r 光标阅读机充分利用了电子测量理论中的平均 1 0 v , 覆 “ 第二章自动化阅卷技术概述 值数字滤波、极限滤波等电子次测量理论和方法,使o m r 的准确程度( 误码率) 尽量降低到最低。基于对考生负责的高度责任心,许多地区招生部门都用o m r 对 所有的答题卡阅读两遍。产生两个卷面记录,然后对两个卷面记录进行比较,从 中发现误差并且消除之。这样就可以将o m r 对所有答题卡的测量过程产生的误差 及时消除,同时也使电脑阅卷的工作量和进度都增加一倍以上。对于考试和录取 之间非常有限的宝贵时间而言,这也是不得已的事情。为了及时得到考生准确而 公平的成绩并且按时发放,阅卷现场经常是夜以继日的连续工作。为了解决这个 问题,o m r 光标阅读机研制人员根据上面处理误差的思想研制出了双读o m r , 但是不管怎么改进,它还是存在以下不足: 1 ) o m r 机是靠纸边的同步信号块定位,对答题卡的印刷精度要求较高,需要 专门印制规定尺寸和固定版面格式的答题卡,通用性和灵活性受到一定的限制。 2 ) 对识别结果缺少后期校验手段,没有原图信息,发现错误只能抽原纸质卡 校验,极不方便。 3 ) 由于不同的信息卡需要采用不同的核心信息采集程序,这在一般的环境中 工作人员是不能胜任的。现在o m r 光标阅读机生产商会针对每种不同的信息卡提 供不同的核心信息采集程序,发布在他们公司的主页上,供不同的使用者下载使 用,导致使用操作比较繁琐。 4 ) 由于o m r 光标阅读机是一种专门负责采集涂点信息的机器,功能单一, 除了做这个以外别无他用,硬件资源使用率过低。 5 ) o m r 光标阅读机器采用的是专用的信息采集卡,由于这些信息采集卡只 能由一些专门的单位或者部门制作,导致了市场垄断,使得信息采集卡的印刷成 本非常高,普通a 5 的信息采集卡就要o 0 8 元一份左右,而o m r 机器本身硬件组 成部件复杂,价格昂贵,使用成本高,使其应用普及受到一定的限制。 2 3 计算机软件阅卷 由于o m r 机器阅卷所存在的不足,再加上图像采集和处理技术的不断成熟, 使得计算机软件阅卷方法得以产生。计算机软件阅卷主要借助于以文档图像扫描 技术、图像处理技术、模式识别技术作为支撑的图像识别软件对答题卡图像进行 分析和处理,最终从中提取考生信息与客观题答题信息。目前,国内外一些科研 机构和公司对基于图像识别技术的自动阅卷方案展开了广泛探讨和研究,有些已 经生产出了产品,国外如英国r e m a r ko f f i c e 等,国内如深圳海云天网上评卷系统, 电子科技大学硕士学位论文 北京华育迪赛纸

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论