(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf_第1页
(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf_第2页
(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf_第3页
(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf_第4页
(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(信号与信息处理专业论文)基于dsp的印刷号码自动识别系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性申明 秉承祖国优良道德传统和学校的严谨学风郑重申明:本人所呈交的学 位论文是我个人在导师指导下进行的研究工作及取得的成果。,尽我所知, 除特别加以标注和致谢的地方外论文中不包含其他人的研究成果。与我 一同工作的同志对本文所论述的工作的任何贡献均已住论文中作r 明确的 说明并已致谢。 本论文及其相关资料若有不实之处。由本人承担一切相关责任 论文作者签名:习姿9 年 ; 月,牛日 保护知识产权申明 本人完全了解西安理工大学有关保护知识产权的规定,即:研究生在 校攻读学位期间所取得的所有研究成果的知识产权属西安理工大学所有。 本人保证:发表或使用与本论文相关的成果时署名单位仍然为i 【安理工大 学无论何时何地,未经学校许可,决不转移或扩散与之相关的任何技术 或成果。学校有权保留本人所提交论文的原件或复印件,允许论文被查阅 或借阅;学校可以公布本论文的全部或部分内容,可以采用影印,缩印或 其他手段复制保存本论文。 ( 加密学位论文解密之前后,以上申明同样适用) 论文作者签名:料导师签名:驰m ,年 弓月悼日 摘要 题目:基王墅墨里的卫昼9 曼塑自动迟剔丕统班窒 学科名称:信曼生信息处理 作者姓名:胡至捌 ( 签名:理j 盘! ! j ) 导师姓名:韭三虚 ( 签名:纽二睑一) 导师职称:教援 答辩时间: 2 0 0 5 3 摘要 票证广泛地应用于人们的日常活动中,为了防伪这些票证都统一印制了号码, 每个印刷号码对应唯一的票证印品。对印刷号码的检查普遍都是人工完成,在长时 间的检查工作中,很容易出现检测差错而且效率低下。因此,对印刷号码自动检 测识别系统进行研究是很必要的。印刷号码自动检测技术能降低企业生产成本,增 强企业竞争力,具有很大的社会经济效益前景。 本课题对人民币号码进行了分析研究,对采集来的人民币号码视频图像进行预处 理、二值化、号码定位、单字符分割和字符归一化处理之后,自动识别图像号码得 到识别结果。文中的图像二值化算法效果明显。运算速度快,易于编程实现。提取出 来的字符特征明显,易于识别。在字符识别算法中使用了模板匹配法和字符特征识别 法,并引入了置信度概念,混合使用模板匹配法和特征识别法,较大地提高了字符识 别率。识别算法计算量小、效率高,能较好地满足识别系统的实时性要求。 本课题是选用基于t m s 3 2 0 c 6 4 1 6 高性能数字处理器的视频开发平台作为d s p 开 发工具,使用c c s 6 0 0 0 软件编写d s p 程序,将图像预处理、二值化、号码定位算法、 归一化和识别算法移植到d s p 程序中,建立了基于d s p 的印刷号码自动识别系统。 本研究得到西安理工大学青年教师攻读硕士学位科学研究基金的资助。 关键词:号码识别,特征提取。图像分割,d s p a b s t r a c t s u b j e c t : r e s e a r c ho fp r i n t e dn u m b e ra u t o m a t i cr e c o g n i t i o n s ! ! 磐壁垒呈亟q 壁坠苎 s p e c i a l t y : a u t h o r : i n s t r u c t o r : d a t e : p r o f z h a n ee r - h ui :s i g n a t u r e : 2 0 0 5 3 a b s t r a c t c o u p o n sa r ew i d e l ya p p l i e dt oo u rd a i l ya c t i v i t i e sn o w a d a y s o nt h e s ec o u p o n s ,t h e r ea r e p r i n t e ds e r i a ln u m b e r sf o ra n t i - c o u n t e r f e i tp u r p o s e e a c hs e r i a ln u m b e rc o r r e s p o n d st oo n e c o u p o no n l y t h ep r o c e s so fe x a m i n i n gt h e s es e r i a ln u m b e r si sg e n e r a l l yf i n i s h e dm a n u a l l y d u r i n gt h i sp r o c e s s ,i ti sv e r ye a s yf o rw o r k e r st om a k em i s t a k e s ,a n dt h ep r o d u c t i v i t yi s v e r yl o w t h e r e f o r e ,i ti sv e r ye s s e n t i a lt os t u d yt h ep r i n t e dn u m b e ra u t o m a t i cr e c o g n i t i o n s y s t e m b yu s i n gt h i sa u t o m a t i cd e t e c t i o nt e c h n i q u eo fp r i n t i n gn u m b e r , a ne n t e r p r i s ec a n r e d u c ei t sp r o d u c t i o nc o s t ,s t r e n g t h e ni t sc o m p e t i t i v ea d v a n t a g e s ,a n dp r o d u c eg r e a t e rs o c i a l e c o n o m i cb e n e f i t s t h i sp r o j e c tr e s e a r c h e sa n d a n a l y s e st h er m b s e r i a ln u m b e r s b yg a t h e r i n gr m b n u m b e rv i d e oi m a g e s ,a n db yp e r f o r m i n gn o i s er e m o v i n g ,i m a g eb i n a r y , n u m b e rl o c a t i o n , c h a r a c t e rs e g m e n t a t i o na n di m a g en o r m a l i z a t i o n ,t h ep r i n t e dn u m b e rc a nb er e c o g n i z e d a u t o m a t i c a l l y t h ei m a g eb i n a r ya l g o r i t h m sm e n t i o n e di nt h i sa r t i c l eh a v eaf a s to p e r a t i o n s p e e d ,a n dt h er e s u l t sa r er e m a r k a b l e a l s o 。t h e ya r ee a s yc oc o d e t h ep r i n t e dn u m b e r s u n i f o r ma n ds t a n d a r df e a t u r e sa l l o wi n f o r m a t i o nt ob ed r a w no u tc o n v e n i e n t l y at e m p l a t e m a t c h i n gm e t h o da n daf e a t u r em a t c h i n gm e t h o da r eu s e di nn u m b e rr e c o g n i t i o na l g o r i t h m a n dac o n c e p to fd e g r e eo ft r u s ti sa l s oi n t r o d u c e di nt h i sp a p e r b yu s i n gt h et e m p l a t e m a t c h i n ga l g o r i t h ma n df e a t u r ei d e n t i f i c a t i o na l g o r i t h mt o g e t h e r , t h en u m b e rr e c o g n i t i o n r a t ec a nb ei m p r o v e ds i g n i f i c a n t l y ;t h ec o m p u t a t i o na n do p e r a t i o nt i m ec a nb er e d u c e d d r a m a t i c a l l y , a n di tc a nw e l ls u f f i c et h er e q u i r e m e n to fr e a l - t i m eo ft h er e c o g n i t i o ns y s t e m t h i sp r o j e c ts e l e c t st h ev i d e od e v e l o p i n gp l a t f o r ma si t sd s pd e v e l o p i n gi n s t r u m e n tt h a t i sb a s e do nt m s 3 2 0 c 6 4 1 6 , w h i c hi sah i g h - p e r f o r m a n c ed i g i t a ls i g n a lp r o c e s s o r , a n dt h e c c s 6 0 0 0s o f t w a r ei su s e dt ow r i t et h ed s pp r o c e d u r e b yt r a n s p l a n t i n gi m a g ep r e p r o c e s s , b i n a r y , n u m b e rl o c a t i o na l g o r i t h m ,n o r m a l i z a t i o na n dr e c o g n i t i o nm g o r i t h m st ot h ed s p p r o c e d u r e ,t h ep r i n t e dn u m b e ra u t o m a t i cr e c o g n i t i o ns y s t e mi se s t a b f i s h e d t h ep r o j e c ti sf u n d e db yt h ef u n do fy o u t h f u lt e a c h e rw i t ham a s t e r sd e g r e ei nx i a n u n i v e r s i t yo f t e c h n o l o g y k e y w o r d s :n u m b e rr e c o g n i t i o n ,f e a t u r ee x t r a c t , i m a g es e g m e n t a t i o n ,d s p 1 绪论 1 绪论 目前,各种票证广泛地应用于人们的日常活动中,例如银行货币、支 票、税务发票和有价证券等。出于需要,这些票证都统一印制了号码。 另外,智能数码防伪技术的广泛使用,使得号码印刷的应用更加地普遍。 票证号码一般是由冠字和一定位数的阿拉伯数字组成。冠,取首之意, 其位置一般多排在票证中的阿拉伯数字之前,常见的冠字一般采用罗马 数字、英文字母或汉语拼音字母,比较广泛采用的是英文字母。此外, 票证上的冠字与数字号码还能起到分辨印品的印制时间、地点、顺序和 数量等要素的标识作用。这种标识作用,既体现在号码的印制生产过程 中,也体现在它的流通过程中。 1 1 号码检测的意义 票证印品上号码具有唯一性,也就是说不能把号码放在印版上进行号 码印刷,号码只能通过后续加工工序打号,从而给票证印品印上号 码。传统的打号机采用机械滚动式打号,将打号机安装在印刷机的特定 位置,依靠纸张的传动来带动号码机转动进行打号。这种方式的优点是 成本低廉,装置简单,缺点就是容易出现印号错误,例如机械传动故障、 号码磨损等,导致出现错号、跳号和残号等。对于高档的票证印品,多 采用喷墨机印号,该种方式具有印号幅面广、自动化和智能化高等优点, 相对机械式印号方式,错误率较低。但是这种方式依然会出错,在部分 喷嘴堵塞的情况下,就会出现残号、错号等。 此外,从整个票证印刷的工艺过程来看,号码印刷是印刷工艺的最后 一道工序,在此之前,印品已完成了8 5 以上的印刷工作量,大部分生产 成本( 油墨、纸张等) 已经发生,一旦出现残号、错号、跳号等,将造成 大量的印刷废品,带来巨大的经济损失。除此之外,票证作为特殊印刷 品是由指定印刷厂印刷的,印刷后的票证号码必须是唯一的,不应该有 缺号、重号、错号和残号。如果号码印刷过程中出现以上问题,而没有 1 西安理工大学硕士学位论文 被及时地检查出来,把一些废品甚至重号票证流入社会,将有可能给印 刷厂家和国家带来严重损失,造成极坏的社会影响。所以,印刷号码自 动识别检测技术在票证印刷过程中有着十分重要的应用价值。 1 2号码检测的现状及发展趋势 目前,对印刷号码的检查普遍都是由人工完成的。由于人工检查是 重复性的劳动,视觉非常容易疲劳,在每天长时间的检查工作中,出现 差错的概率非常大。同时,人工检查费时费力,且是在印品完成之后进 行检查,不能够实时跟踪检查。 为了提高票证印刷的质量,降低票证印刷的废品率,从而降低印刷 企业的生产成本,提高企业的市场竞争能力,实现印刷号码自动检测是 很必需的。号码检测的自动化是未来的发展趋势,将机器视觉、数字图 像处理技术应用于票证号码检测无疑是一个新的发展方向,在科技发达 的今天,印刷号码自动检测所需要的理论知识和技术以及硬件技术已经 十分成熟。此外,印刷号码具有字体统一、大小一致和印制清晰的基本 识别特征,且组成票证号码的字符集较少,一般包括1 0 个阿拉伯数字、 2 6 个大写英文字符和1 0 个罗马数字,易于识别。再有就是当今的计算 机技术无论是在软件方面还是在硬件方面都有突飞猛进的发展,执行效 率高、处理速度快、实时性强和功耗低的d s p 芯片层出不穷,因此印刷 号码自动检测系统是可以实现。 国内外有不少的公司和厂家都正致力于开发和推出针对不同种类 的印刷质量自动检测系统,像北京大恒视觉技术分公司、洛阳圣瑞机电 技术有限公司以及德国的捷德公司( g i e s e c k e d e v r i e n t ,简称g d ) 等,其中有专门针对银行存折号码自动检测的,也有针对钞票号码进行 号码自动检测的,这些检测系统除了具有号码检测功能之外,还针对印 刷过程中出现的一些其它印刷质量问题进行检测,例如瑕疵、套印、网 点扩大等的检测。 i 绪论 北京大恒视觉技术分公司开发有存折号码识别检测系统 ( d h - 1 9 9 2 - a 型) ,利用c c d 摄像机拍摄存折号码图像,经过图像处理 分析,判断出存折上的号码。可以对一定数量( 5 0 本或i 0 0 本) 的存折号 码和冠字识别后,统计是否有因为印刷机故障或其他原因造成的重号、 漏号或号码不合格( 如模糊、花自、号码笔划连接错误) 等情况发生。 在各种有价票证中,人民币是很具有普遍性的一种,流通性大,防 伪要求极高。在人民币的印制过程中,号码印制是重要的环节之一。北 京大恒视觉技术分公司针对人民币号码的印制,开发出了人民币号码、 荧光及水印质量在线检测系统( 阴一2 0 0 0 3 一a 型) ,用于在生产过程中对 每小开人民币的号码、荧光的印刷质量作全面、精确的检查,发现问题 及时报警处理。在号码、荧光和水印同时检测的情况下,最高检测速度 可达到1 0 0 0 0 张小时。号码和荧光检测实现对每一小开都进行检测并 确保无漏检,在图像采集后的瞬间即可给出检测结果,以便及时处理或 报警。此系统已经在我国印钞行业全面推广应用,被确定为印钞行业生 产必备的设备。 洛阳圣瑞机电技术有限公司的新产品e e 8 8 0 0 智能识别监控系统具 有号码识别、条形码识别、图形模式匹配、错误报警等功能,能够适时 地监测号码和条形码的印刷质量,并在发生错误时,及时报警。该系统 能较好的解决票据号码、条型码印刷错号和漏号等严重错误。极大地提 高印刷质量和效率。并将印刷废品率降到最低。 德国捷德公司( g i e s e c k e d e v r i e n t ,简称g & d ) 于1 8 5 2 年在德国 莱比锡正式创立。现今g & d 公司钞票事业部为世界上7 0 多个国家的中央 银行印制钞票。该公司开发的b p s 2 0 0 0 ( b a n k n o t ep r o c e s s i n gs y s t e m ) 钞票处理系统不仅可以对钞票的号码进行自动化检测,而且可以进行钞 票的其它印刷缺陷检测,对有号码错误及缺陷的钞票进行清除分离,同 时对印刷完好的钞票进行自动化打包处理( 每1 0 0 0 张钞票打一包) ,是 目前世界上最先进的号码及缺陷检测系统之一。 西安理工大学硕士学位论文 1 3 课题研究内容和思路 本课题针对票证印刷过程中重要的号码印刷环节进行研究,重点研究 快速、高效、实时性强和应用性较广的印刷号码检测识别算法并在d s p 上进行实现。本课题研究内容与上节介绍的质量检测系统有较大的不同, 本课题研究侧重于对采用轮转印刷方式进行在线实时检测识别,上节介 绍的检测系统针对的是单张印刷方式,这种方式的印刷速度较慢。事实 上很多票证印刷都是采用轮转印刷方式,快速连续地进行印制,印刷图 像移动的速度很快,对检测系统的实时性要求必然很高,检测系统要能 在很短的时间内对错号做出反应,并进行相应的处理,减少纸张、油墨 等的浪费。也就是说检测系统要有很高的实时性,因此本课题选用t i 公 司的6 4 1 6 芯片,该芯片运算能力极强,速度很快,是目前高速数字信号 处理器( d i g i t a ls i g n a lp r o c e s s o r ) 中性能优越的一款数字信号处理 器。 为了保证实时性,那么相应的图像处理算法就不能太复杂,并且算法 处理效果要好。具体说来就是算法的运算量要小,不包含比较复杂的计 算。本课题是按照图卜1 所示的步骤进行开发研究的。 圈卜1 课题开发步骤 由于票证号码印刷种类比较多,受课题时间限制,不能够实现对多种 印刷号码的自动识别,另外还考虑到票证样本是否容易收集,因此在本 课题研究中选用了比较广泛的人民币作为识别对象进行研究。至于其它 票证号码,和人民币号码的识别原理类似,可以推而广之。 4 2 印刷号码图像中号码的定位及分割 2 印刷号码图像中号码的定位及分割 在本章里,主要研究印刷号码图像的预处理,包括有噪声去除、灰度 拉伸等,以及多种图像的二值化算法、号码定位算法与字符分割方法。 2 1 图像的预处理 2 1 1 噪声去除 在使用摄像头进行视频采集以及数据传输过程中,受到电子器件的影 响,使得视频图像中的一些像素点的灰度值与周围临近像素的灰度值有 比较明显的差异,称之为噪声点,这些噪声点一般呈现孤立离散性分布。 噪声的存在恶化了图像的质量,使图像模糊,甚至淹没了特征信息,给 图像分析带来了困难。因此,噪声去除是很必要的图像预处理步骤。在 课题研究中,所获得视频图像中包含的噪声大多属于随机孤立噪声点, 不含有分布面积较广的椒盐噪声,所以选用的噪声去除算法都是针对随 机孤立噪声的简单高效算法。 a 均值滤波法”1 设图像中像素的灰度值为a ( i ,) ,以该像素为中心,在其周围窗口的 像素组成邻域像素点集a ,集内像素数为m ,经过邻域均值滤波处理后, 该像素对应的输出为: 川) 2 百1 警刚) q 。1 即用窗口像素的平均值g a ,) 代替中心像素的原值g ( i ,) 。邻域选择的 方法有很多种,综合考虑图像去噪效果和图像边缘特征信息的保留, 西安理工大学硕士学位论文 课题中选择3 3 滤波模板的八点邻域,模板如图2 - 1 ( a ) 所示,中间大 黑点表示中心像素,中心点八个方向的邻近点为中心点邻域像素。与 模板对应的有权值系数矩阵,均值滤波法的权值系数如图2 - 1 ( b ) 所示 然而均值滤波法在去除噪声的同时,也减少了图像灰度的尖锐度,导 致图像边缘特征有一定程度的模糊。作为对均值滤波法的改进,权值 系数调整为图2 - 1 ( c ) ,采用加权均值滤波法。 o 0 一j :, ( a ) 邻域 加权均值滤波法的计算为公式( 2 - 2 ) ,w 0 ,t ) 是权值系数。 州刈,:盗竺! 竺竺 。, w o ,f b 中值滤波法2 1 中值滤波法和均值滤波法类似,围绕中心像素g ( f ,) 选取一定的邻 域,将中心像素和邻域像素按照灰度值大小进行排序,选择中间的值作 为中心像素g ( f ,) 的新值。 g a ,) = m i d d l e a l ,a 2 ,口3 a n ) ( 2 3 ) 在图像处理中,尽管中值滤波法也会使得图像有一定程度的模糊,但 与均值滤波法相比,它不会产生新的灰度值,同时还能很好的保留图像 的边缘特征信息,综合处理效果要明显优于均值滤波法。课题中中值滤 波法的邻域选择使用图2 - 1 ( a ) ,即3 3 模板。图2 - 2 给出了三种噪声滤 波算法的处理结果,从总体处理效果来讲,中值滤波的效果优于加权均 值滤波算法,加权均值滤波算法的处理效果优于均值滤波算法的效果。 1 2 1 数系 2 4 : 砒波滤 u 他n 权 胁 一m 如 1 1 1 散系值 1 1 1 权波雠 均 1 9 2 印刷号码图像中号码的定位及分割 ( a ) 原图 ( c ) 加权均值滤波处理 ( b ) 均值滤波处理 ( d ) 中值滤波处理 圈2 - 2 滤波算法噪声去除的效果 2 1 2 图像边缘锐化处理2 1 锐化的目的在于突出图像中的细节或者增强被模糊了的细节,比如印 刷图像中号码边缘就是必须要增强的特征信息。在此,选用拉普拉斯算 子作为边缘增强算子,选用3 3 模板,如图2 1 ( a ) 。各个像素点的权值 如图2 3 所示: 0 1 0 1 4 1 0 1 0 ( a ) 中心元素为负数的算子( b ) 中心元素为正数的算子 图2 - 3 拉普拉斯锐化算子 7 0 1 0 斗 1 1 1 1 0 1 0 西安理工大学硕士学位论文 拉普拉斯算子是一种各向同性微分算子,它的应用强调图像中灰度的 突变以及降低灰度慢变化的区域。拉普拉斯算子计算公式为: v 2 g = c o + 1 j ) + g ( 1 1 ,) + g ( f ,j 一1 ) + g ( j ,+ 1 ) 一4 c ( i ,) ( 2 4 ) v 2 g = 4 g q ,) 一【g ( f + 1 ,j ) + g ( f - 1 , j ) + g ( i ,一1 ) + g ( f ,+ 1 ) ( 2 5 ) 由公式( 2 4 ) 或公式( 2 5 ) 可产生一幅边缘信息组成的图像,如图 2 - 4 ( a ) 再将原图像和处理过后的图像简单地对应叠加在一起,这样即可 以保护拉普拉斯锐化处理后的效果,同时又能复原原背景信息。若使用 的拉普拉斯算子为公式( 2 4 ) ,那么使用拉普拉斯变换对图像增强的方法 表示为: g ( f ,j ) = g ( i ,) 一v 2 c ( i ,) ( 2 6 ) 若选用公式( 2 - 5 ) ,则拉普拉斯变换对图像增强的方法表示为: g ( f ,) = g ( i ,) + v 2 c ( i ,) ( 2 7 ) 图2 - 4 ( b ) 是经过公式( 2 - 7 ) 处理过后的效果,该图像的细节明显比原 始图像图2 - 2 ( a ) 清晰,图像中灰度突变处的对比度得到提高,小细节部 分也得到了增强并保留了图像的背景色调。 ( a ) 拉普拉斯算子处理图像( b ) 用公式( 2 - 7 ) 增强后的图像 图2 - 4 拉普拉斯边缘增强 2 印刷号码图像中号码的定位及分割 2 1 3 图像灰度线性拉伸 在用摄像头采集号码图像时没有使用标准光源,都是在自然光照的情 况下进行的。结果发现,号码的灰度级集中在暗调区域,其它图案部分, 尤其是背景灰度级,属于亮调区域。同一种算法对多次采集来的不同样 本号码图像的处理效果相差很大,尽管多次采集来的图像视觉效果几乎 没有区别,但是算法处理的效果却相差很大。为此,需要对图像的灰度 进行调整,加强图像灰度级对比度。 本课题采用图像灰度整体线性拉伸的方法来增强灰度对比度。首先找 到图像最小灰度级r 。和最大灰度级r 。,然后通过线性拉伸变换至饱和 范围 0 ,l - 1 共l 级灰度。转换公式为: 戤:三土r ,( 2 - 8 ) 。 r 。一r m r 为图像中的灰度级,月。为r 经过公式( 2 8 ) 转换后的新值。图 2 5 ( a ) 是图2 2 ( a ) 的灰度直方图分布,图2 - 5 ( b ) 则是经过灰度线性拉伸 变换之后的灰度直方图分布。 薹硅l ( a ) 线性拉伸前的灰度直方图( b ) 线性拉伸后的灰度直方图 图2 - 5 灰度线性拉伸前后灰度直方圉 2 1 4 图像高亮调压缩 人民币号码和定额发票号码都是使用深色油墨印制的,第五套人民币 号码主要就使用了黑色油墨( 如百元、五十元纸币上水印旁边的号码) 、 红色油墨( 如五十元纸币上右边的号码) 和蓝色油墨( 如百元纸币上右 边的号码) 印制号码,有些号码采用红色和黑色油墨共同印制号码( 如 西安理工大学硕士学位论文 二十元水印旁的号码) ;定额发票使用黑色油墨。这些号码在图像中的灰 度级属于暗调,也就是说要提取的图像信息主要集中在暗调,亮调部分 属于背景信息。为此亮调部分就可以被忽视。 在求得图像灰度级平均值t 后,将图中像素逐个与t 作比较,凡是小 于t 的像素灰度级不变,大于等于t 的像素灰度级设为t 。 州,= g 撩; 。, 2 2 图像的二值化1 假设一幅灰度图像的大小为m 行n 列,用f ( x ,y ) ( o i 一m a x g r a y 结束循环。 得到最佳阈值t h r e s h o l d ,与图像所有像素点灰度进行比较来实现二值 化操作。该方法适应性较强,对相当多的图像进行处理都能获得较为满 意的效果。 2 2 5k i t t l e r 简单统计二值化法9 1 该方法是全局阈值二值化法中的一种,确定阈值t 的计算公式是 t =! 幽蚴 e ( f ,) ( 2 一1 9 ) 其中e ( f ,) = m a x i e j | 一枷( 2 - 2 0 ) e = g q 一1 ,j ) 一c ( i + 1 ,j ) ,e i = g ( f ,j 一1 ) 一g ( i ,j + 1 ) ( 2 2 1 ) 实验表明,p ( f ,) 计算公式也可改为公式( 2 2 2 ) ,二值化效果也很好。 e ( i ,j ) = l g ( i - l , j - i ) - v ( i + 1 ,j + 1 ) i + i g ( f - 1 , j + o - g q + 1 j - i ) i ( 2 2 2 ) 对于非均匀图像的二值化,单纯地用简单统计法或其它固定阈值常造 成字符笔画丢失,为此可采用简单统计法与r o b e r t s 边缘检测相结合的方 法就能较好地解决这个问题1 9 1 r o b e r t s 边缘检测算子为: 西安理工大学硕士学位论文 r ( i ,j ) = l g ( f - 1 , ) 一g ( f ,j + 1 ) l + l g ( f 一1 + 1 ) 一g ( f ,j ) i ( 2 2 3 ) 一般来讲,边缘点在图像中具有如下的特点t 1 0 ( 1 ) 边缘点相对于其他非边缘点具有较高的r 值; ( 2 ) 边缘点的数量相对于整幅图像的像素数来讲具有较低的比例,一 般不超过2 ; ( 3 ) 以图像像素点的r 值为横坐标,以具有r 值的像素数在整幅图像 像素数中所占的概率p ( r ) 为纵坐标,作r o b e r t s 概率图,具有很 好的单峰性。 计算灰度图像中每一像素点的r 值及对应的概率p ( r ) ,在求得最 大r 值为m a x ,满足公式( 2 2 4 ) 的r 值r 即为边缘检测点的闽值。e 是边缘点在整幅图像中所占的比例,一般取值在0 0 2 左右。 荟p ( 尺) e ( 2 - 2 4 ) 在得到阈值t 和边缘检测点阈值r 之后,对于像素点灰度级a ( i ,) , 若g ( i ,) s t 或者其对应的r 值大于等于r ,则将该像素置为黑点,否则 置为白点。图2 - 6 是前面介绍的各种二值化算法处理后的效果图。 ( a )原图 ( c )期望二值化 ( d ) 局部动态二值化 2 印刷号码图像中号码的定位及分割 ( e ) 动态全局二值化 ( f ) k i t t l e r 简单统计二值化 ( g ) k i t t l e r 与r o b e r t s 二值化( h ) 迭代二值化 图2 - 6 各种二值化算法处理效果 2 3 印刷号码定位n 玎 所有样本号码图像都是通过同一个摄像头拍摄来,使用相同的焦距和 物距。所以,号码图像的大小几乎一样,没有很大的变化。人民币号码 由2 位大写英文字母和8 位阿拉伯数字组成,在号码样本图像中占有一 定的宽度和高度,宽度w 和高度h 的值可以比较容易地获得。号码定位 的本质就是在图像中找到一个像素点p ,即确定该像素点p 在图像中的 坐标位置( x ,y ) ,如图2 7 所示,p 点具有如下的特点: ( 1 ) p 点的像素值是白色,即是背景点: ( 2 ) 从p 点的横坐标x 开始,水平到横坐标x + w ,共有w 个白点; ( 3 ) 从p 点的纵坐标y 开始,垂直到纵坐标y + h 。共有h 个白点: ( 4 ) p 点的对角点q ( x + w ;y + 哟,从q 点的横坐标( x + w ) 开始水平向 左统计该行的背景点数目,直到w 。共有w 个自点。从q 点 西安理工大学硕士学位论文 的纵坐标( y + h ) 开始垂直向上,直到y ,共有h 个白点; ( 5 ) 统计以p 点为左上顶点的矩形区域,其长度为w ,高度为h , 在这个矩形区域内黑点的分布数量应不低于k ; ( 6 ) 统计以p 点为左上顶点的矩形区域,长度为w ,高度为h ,在 这个矩形区域内的字符个数应不少于1 0 个。 、图2 7 号码定位不葸图 判断字符的方法是在可能的号码区域内,从该区域左边缘至右边缘依 次从上至下读取每一个竖行的灰度级,如果所读取的这一竖行上的灰度 级都是白点,即背景色,则认为该行位于两个字符之间;若在这一竖行 上读到了黑点,即信息色,则这一行就不能作为字符的边界。当第一次 从上到下地在某一行上读到全是信息色,则认为这一行是一字符的左边 界。在此之后,当第一次在一竖行上读到的都是背景色,则认为这一行 是该字符的右边界,从而确定了一个字符存在。为了降低字符错判率, 左、右边界横坐标值之差的绝对值应大于某个门限值,这样就可以避免 错将一些噪声点认为是字符的情况发生。 号码定位过程中有两个重点,一是待确定号码区域内黑点占有率的估 算,二是待确定号码区域内字符数目个数的确定。在确定了纯号码区域的 经验宽度和高度( 依赖于拍摄号码图像时的焦距) 之后,号码区域内黑点占 有率可以通过对多幅二值化后的号码图像进行人工分割统计,黑点占有率 要选择较小的值,这样可以减少将正确的号码区域当做非号码区域的机率。 在本课题中,号码图像的尺寸是3 5 2 2 8 8 像素,号码区域的尺寸设为2 1 2 1 6 2 印刷号码图像中号码的定位及分割 x 4 0 个像素,黑点占有率不少于1 0 。人民币号码是由2 个英文字母和8 个阿拉伯数字组成共1 0 个字符,待确定号码区域内是否有不少1 0 字符是 号码定位中最重要的条件。对于字符的判定方法的是:在方形区域从上到 下逐竖行统计每个竖行内黑点的个数,从而形成了一个垂直投影图。然后 从左往右逐行读取每个竖行,遇到这么一个竖行s ,它当前黑点个数为0 , s + l 行具有不少于1 个的黑点,则认为s 是一个可能字符的左边界;然后接 着向右扫描,直到遇到这么一个竖行t ,具有不少于1 个的黑点,t + l 竖行 的黑点个数为零,则认为t 是这个可能字符的右边界。若t - s 大于零,则 基本确认这是一个字符。但是实际中二值化后的图像中号码附近可能会存 在一些噪声斑点,可能会将噪声斑点误认为是一个字符,从而导致识别错 误。再有就是在百元和五十元人民币右边竖号的下边有一个“l ”形状的 图案,该图案不是人民币号码中有效字符,但是却经常误被认为是一个有 效字符。为了消除噪声斑点和“l ”的影响,需要对t - s 的值进行分析。 噪声斑点的宽度一般不会超过4 ,而“l ”的宽度远远大于有效字符的宽度 ( 2 0 ) 。所以当t - s 大于等4 且小于2 1 时,就认为是一个有效字符。但是有 时候数字l 的宽度会小于4 个像素,为此当t - s 小于4 时,再判断t - 1 或 t - 2 竖行中黑点的个数是否大于1 6 ,若大于1 6 则认为是数字1 ,是一个有 效字符,反之,则是噪声斑点。 2 4 单字符的分割方法“2 1 在从数字图像中分割出号码子图像之后,从该子图左边缘至右边缘依 次从上至下读取每一个竖行的灰度级,如果所读取的这一竖行上的灰度 级都是白点,即背景色,则认为该行位于两个字符之间;若在这一竖行 上读到了黑点,即信息色,则这一行就不能作为字符的边界。对于一个 字符的左右边界是这样确定的:当第一次在从上到下的竖行上读到信息 色,则将这一行作为该字符的左边界,并记录该竖行的横坐标值;在此之 后,当第一次在一竖行上读到的都是背景色,则将这一行作为该字符的右 1 7 西安理工大学硕士学位论文 边界并记录该竖行的横坐标值1 1 3 1 。此分割方法称之为垂直投影法,此方 法对2 6 个英文字母和0 9 这十个阿拉伯数字进行分割没有问题,因为这 3 6 个字符笔画间都没有出现断笔情形。图2 - 8 是一个号码图像单字符分割 示意图,图2 - 8 ( a ) 是定位成功的图像,号码图像部分被一个黑色矩形框包围。 图2 - 8 c o ) 是分割出来的号码图像,其中包含有2 个英文字母和8 个阿拉伯数 字。图2 - 8 ( c ) 是图2 8 ( b ) 像素数目垂直投影分布图,可见字符间有明显的 间隔,利于单字符分割。 r f73 340i42 ( b ) 分割出的号码图像 ( c ) 垂直投影直方圈 ( a ) 定位成功的图像 图2 - 8 号码定位及字符分割 在印刷号码定位之后,就将2 1 2 4 0 像素大小的号码区域从样本号码图 像中分割出来,形成号码分割图像。单字符分割指的就是将分割出来的图 像中的2 个英文字母和8 个阿拉伯数字再进一步细分成单字符图像。单字 符分割方法的大体过程和上面介绍的字符判定方法类似,只不过除了要判 定字符之外还要记录字符的左右边界,以便从分割图像中分割出单个字符。 那么在这里同样要注意不能将噪声斑点错认为是有效字符。误判的结果可 能会导致程序中途终止,这和程序事先假定只有1 0 个字符有关,噪声斑点 的误判会导致该图像中出现至少1 1 个字符的出现,从而致使程序内存读写 出错。要避免这种错误出现就要对可能字符的宽度进行分析,分析它是有 效字符,还是噪声斑点。方法和上节介绍的类似。另外。还需要注意的地 方是在图像归一化处理中,调整图像高度时也要考虑类似的噪声斑点的影 响,以免错将噪声点认为是有效信息,导致图像不能居中,妨碍数字的识 别。 3 号码数字的识别 3 号码数字的识别 在本章里,主要介绍单字符图像归一化处理和数字的识别方法。字符 的归一化处理就是将不同大小的字符图像规范成同一大小的图像,消除 数字大小等因素带来的字符在尺度和位置上的变化以及给识别带来的影 响。数字识别主要使用了模板匹配法和基于特征匹配识别法两类识别方 法。 3 1 数字的归一化处理 数字归一化包括两种含意,一种是位置归一化,即将字符放置在图像 的中心,另一种就是字符大小归一化,即将字符规范成统一大小的图像。 3 i i 位置归一化 在单数字字符分割处理过程中得到的单数字图像。数字未必刚好处在 图像中心,经常出现偏左或偏下的情形。这样会影响后续识别算法和特 征的提取,因为本课题中使用的模板匹配法和特征提取法对字符是否在 中心位置依赖很大。为此,需要从水平方向和垂直方向对图像进行位置 归一化处理。 a 垂直方向调整 从第一行开始,从左向右逐行统计每行中背景点数量,一旦i 行全为 背景点时,且i + 1 行不全是背景点时,记录该行行号为圪。若再次遇到 某行j 全是背景点,且j 1 行不全是背景点时,记录该行行号为巧。那么 就找到了字符在垂直方向上的信息内容( 圪行到k 行之间) ,不改变信息 内容,将这些信息另存为一幅图像,新图像的高度是k 巧+ 1 。从而使得 1 9 西安理工大学硕士学位论文 字符在垂直方向上居中。 b 水平方向调整 在字符水平中心调整之前,还需要对字符图像的宽度进行扩充,目的 是为了避免数字1 在大小线性归一化时失真变形。具体做法是在分割单 个数字号码时,统计该组号码中( 2 个字母和8 个数字) 单个字符分割时 最大的图像宽度,然后将该组每个单字符图像宽度都扩展到, 将单个字符图像的字符信息在水平方向居中。先找到图像信息最左边的 横坐标值日,和最右边横坐标值日,方法原理类似于图像垂直方向的调 正。不改变信息内容,重新这些信息另存为高度不变且宽度是的新 图像。假若现有一个分割出来的单字符图像宽度是1 2 ,而该组的是 1 6 ,那么就要将该字符图像宽度扩展到1 6 。首先求出日,和日,即旧图 像中只有日,与日,之间的列像素信息是有用信息。为了使字符居中,在 新图像中第1 列到第( 1 6 ( 日,日,+ 1 ) ) 2 列填充为背景色。同样 ( 8 + ( ,h ,+ d 2 ) n 第1 6 列也填充为背景,中间部分则逐列拷贝旧图像 中的像素值。 3 1 2 大小归一化“钉 在图像大小归一化方面,使用的是简洁、高效的二维线性伸缩插值法。 目标图像中的每一点用线性映射函数来映射到源图像中的像素点。归一 c x ,- ,= c u v ,1 2 蓍亳 ;i 其中岛跏分别是x 轴方向和y 轴方向上的缩放率,大于1 时放大,大 于0 且小于1 时缩小。让d ,和见分别表示目标图像的宽度和高度,和 墨分别表示源图像的宽度和高度。为了减少插值运算中的计算量,经过 2 0 3 号码数字的识别 推导得到全是整数参加运算的插值运算公式: p2 ( b n ( 只一b p c + p d ) + d 。n b + 巩b b + ( 仉d 一岛b 一巩n ) p d ) ( 仉d ) 1 3 2 ) 只、b 、忍和昂分别是点( u ,v ) 周围的四个( 左上、右上、左下和右下) 源图像邻近点的灰度级。b 和n 的计算公式是: b = 见一x 乱三n = d h ys hd ( 3 3 ) 图3 - 1 是单字符分割后的图像,( a ) 图是分割过后没有进行位置和大小 归一化的字符,可见这些字符没有处于图像的中间,中心位置有些偏左和 偏下。( b ) 图是经过位置和大小归一化处理过后的数字图像,归一化效果很 好。 目圉囵囝囝1 日目曰固固团回国固 ( a ) 分割单字符图像( b ) 位置和大小归一化处理 图3 - 1 单字符分割 位置归一化对数字l 的影响很大,图3 - 2 中( f l , ) 图是未进行任何处理的 分割字符,( b ) 图是在没有进行位置归一化的情况下进行了大小归一化处 理。可见数字1 明显发生了形变,不利于识别。而( c ) 图是先进行位置归一 化处理再进行大小归一化处理后的效果。 口 ( a ) 原分割字符( b ) 位置未归一化( c ) 先位置后大小归一化 图3 - 2数字l 的形变 3 2 模板匹配法n 钉1 2 1 1 在识别前要建立一个包含0 9 十个阿拉伯数字的标准数字模板库。 人民币号码的字体是一种特殊的字体,不好直接获得。从所有样本号码 西安理工大学硕士学位论文 图像中分割出的单字符中选择出一些笔画饱满、带毛刺少、位置正中的 字符作为数字标准模板,模板字符图像的大小也是2 0 x 3 2 。图3 3 所列 出的一组标准字符是经过k i t t l e r 简单统计二值化法处理得到的模板: 画图固曰国国同囤囤 图3 - 3 数字模板 将经过分割、归一化处理过后的待识别单字符图像逐个与模板字符进 行比较,比较时把待识别图像的左边与字符图像的左边对齐,这样待识 别图像就与模板字符重叠在一起,统计两个图像对应位置的像素值不同 的数目s ,相当于对两幅图像求异或,然后统计逻辑值为真的数目。待 识别图像与每个模板图像匹配后都会得到一个值s ,找到1 0 个值中最小 的值s ,与之对应的模板图像的数字就是识别结果。模板匹配法操作简 单,没有大的计算量,适用于识别字符集小、字符齐整及实时性要求高 的应用场合。在本课题识别中,粗略统计识别率达到8 7 左右。常见的识 别错误有:6 识别成8 或5 ,8 识别成9 ,7 识别成1 ,8 识别成5 等,即 大多是一些字形相近的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论