




已阅读5页,还剩69页未读, 继续免费阅读
(系统工程专业论文)传真收件人姓名字符识别技术研究与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 传真文件收件人姓名自动识别系统属于专用o c r 系统开发范畴。专用o c r 系 统的开发,将在很大程度上拓宽o c r 技术的应用领域,提高相关应用领域的自动 化程度。同时,由于系统所要处理的对象是特定的,在系统的实现过程中所遇到 的一些新问题和所采用的新方法,对于o c r 技术的研究具有一定的理论价值。在 专用o c r 系统中,传真收件人姓名字符的识别技术具有较好的应用前景及实用价 值。 本文针对传真收件人姓名字符的识别技术进行了研究与应用。在字符图像预 处理方面,除对传统方法的研究外,根据传真收件人姓名字符图像的特殊性,经 过多次实验,选取了适合于传真字符图像的二值化、噪声过滤、倾斜校正、字符 大小归一化及细化等方法;针对传真收件人姓名字符可能存在书写线的特点, 对书写线的检测和去除方法进行了分析,使用了一种基于数学形态学的书写线去 除方法;在字符切分上,对于规格比较统一、字符分离清晰的字符区域使用最常 用的基于投影分析的波峰一波谷法对字符图像进行切分,以便进行字符识别,针 对投影法无法切分的粘连字符块,采用了一种根据字符笔画信息,寻找合适的分 割点和分割路径的分割方法。 在文字识别方面,本文基于不同的网络模型有其自身特点,利用多神经网络 集成技术,建立了一种利用多特征的多级混合神经网络的识别系统来处理字符识 别问题,并提高其识别率。识别系统的分类器由字符粗分类和细分类两级组成, 本文的自组织聚类网络可以很好地给出模式在多维空间的概率分布估计,结合字 符的笔划复杂性指数、四边码、粗外围轮廓等特征可以较好估计出字符的粗分类 结果。b p 网络有着优秀的非线性映射特征和对输入矢量的分类能力,使用b p 网 络和字符的轮廓特征、笔划穿越密度特征构建字符的二级细分类器可以分析相似 字符的细微差别。实验结果表明,使用混合神经网络的传真收件人姓名字符识别 方法对大字符集样本的识别率达到了9 1 左右,比使用单一神经网络提高了8 。 在字符识别方面,本文还着重研究了支持向量机。支持向量机是属于商维数 小样本的学习识别机器,这样在给出了更多特征维数后,可以由少量的样本,就 可以达到很高的识别率。结合特征提取方法,我们提取了多达几百维的特征,用 传真收件人姓名字符的识别技术研究与应用 支持向量机识别,取得了较高的识别率。文中对四种常用的核函数分别进行了实 验,选取了对姓名字符具有较高识别率的径向基内积函数,同时对核函数的不同 参数进行了测试,根据测试结果本文系统选取盯2 为0 5 作为径向基内积函数的 参数值,其识别率达到了9 4 0 8 左右。 同时,本文针对传真文件使用上的灵活性及中文传真的特殊性,提出了一种 用于解决中文传真收件人姓名自动识别的方案,并部分实现了传真收件人姓名自 动识别系统。 关键字:图像预处理;模式识别;神经网络;支持向量机;传真 a b s t r a e t a b s t r a c t f a xr e c i p i e n t sn a n l ea u t o - r e c o g n i t i o ns y s t e mb e l o n g st ot h ea r e ao fs p e c i a lo c r s y s t e md e v e l o p m e n t t h ed e v e l o p m e n to fs p e c i a lo c rs y s t e mw i l lw i d e nt h e a p p l i c a t i o nf i e l do fo c rt e c h n o l o g yi ng r e a td e g r e ea n di m p r o v et h ea u t o m a t i o n d e g r e eo f r e l a t i v ea p p l i c a t i o nf i e l d m e a n w h i l e , s o m en e wp r o b l e m sa n dn e wm e t h o d s e n c o u n t e r e di nt h es y s t e mi m p l e m e n t a t i o np r o c e s sh a v es o m et h e o r e t i c a lv a l u ef o rt h e r e s e a r c ho fo c rt e c h n o l o g ya st h eo b j e c tp r o c e s s e db yt h es y s t e mi ss p e c i a l i n s p e c i a l o c rs y s t e m ,t h et e c h n o l o g yo ff a x r e c i p i e n t s n a m er e c o g n i t i o nh a s c o n s i d e r a b l ea p p l i c a t i o nf u t u r ea n dp r a c t i c a lv a l u e t h ef a xr e c i p i e n t sn a n er e c o g n i t i o nt e c h n o l o g yi sr e s e a r c h e da n da p p l i e di nt h i s p a p e r i nt h ea s p e c to fc h a r a c t e r s i m a g ep r e t r e a t m e n t ,a c c o r d i n gt ot h es p e c i a l i t yo f f a xr e c i p i e n t sn a m ec h a r a c t e r s i m a g e ,s o m em e t h o d ss u c h a st h eb i n a r i z a t i o n , d e n o i s i n g ,s k e wc o r r e c t i o n ,s i z en o r m a l i z a t i o na n dt h i n n i n ga p p r o p r i a t ef o rt h ef a x c h a r a c t e r si m a g ea r ea d o p t e db e s i d e st h er e s e a r c ho ft r a d i t i o n a lm e t h o di nt h i sp a p e r ; a n dt h ea n a l y z ei si m p l e m e n t e df o rt h ed e t e c t i o no f u n d e r l i n ea n dr e m o v i n gm e t h o d 髂 i ti sp o s s i b l et oh a v eu n d e r l i n eu n d e rf a xr e c i p i e n t sn a l t l ec h a r a c t e r s ,a n dam e t h o d b a s e do nm a t h e m a t i c a lm o r p h o l o g yf o rr e m o v i n gu n d e r l i n ei su t i l i z e d ;a n du t i l i z i n g c r e s t - t r o u g ha n a l y s e s ,t h em e t h o df o rd i v i d i n gc h a r a c t e r sd i v i d e sc h a r a c t e r s i m a g e i n t os i n g l ec h a r a c t e r s ,a n da tt h es a m et i m e ,ad i v i d i n gm e t h o da c c o r d i n gt ot h e i n f o r m a t i o no fc h a r a c t e r ss t r o k e st os e e kf o ra d a p t e dd i v i d i n gp o i n t sa n dp a t h si s a p p l i e di nt h i sp a p e rb e c a u s eo f c o n g l u t i n a t e dc h a r a c t e r s i nt h ea s p e c to fc h a r a c t e r sr e c o g n i t i o n ,b a s e do nt h e i ro w nf e a t u r e so fd i f f e r e n t n e t w o r km o d e l sa n d u s i n gm u l t i p l en e u r a ln e t w o r k si n t e g r a t i o nt e c h n o l o g y , a r e c o g n i t i o ns y s t e ma p p l y i n gm u l t i p l eh y b r i dn e u r a ln e t w o r k sw i t hm u l t i p l ef e a t u r e si s b u i l tt od e a lw i t ht h e s ep r o b l e m sa b o u tc h a r a c t e r sr e c o g n i t i o na n dt h er e c o g n i t i o n a c c u r a c yi si m p r o v e di nt h i sp a p e r t h ec l a s s i f i e ro f r e c o g n i t i o ns y s t e mi sc o m p o s e d o fr o u g hc l a s s i f i c a t i o na n ds u b - c l a s s i f i c a t i o n t h es e l f - o r g a n i z i n gc l u s t e r i n gn e t w o r k i nt h i sp a p e rc a nw o r ko u tt h ep r o b a b i l i t yd i s t r i b u t i n ge s t i m a t i o no ft h ep a t t e r ni n m u l t i d i m e n s i o ns p a c e ,a n dt h e n , c o m b i n i n gs o m ef e a t u r e ss u c ha st h ei n d e xo fs t r o k e c o m p l e x i t yo fc h a r a c t e r s ,f o u r - s i d ec o d e sa n dr o u g hc o n t o u r , e s t i m a t et h er e s u l to f r o u g hc l a s s i f i c a t i o no fc h a r a c t e r s b pn e t w o r kh a se x c e l l e n tn o n l i n e a rm a p p i n g f e a t u r ea n dc l a s s i f y i n gc a p a b i l i t yf o ri n p u r e dv e c t o r s ,t h u st h es u b - r a n kc l a s s i f i e rf o r 传真收件人姓名字符的识别技术研究与应用 c h a r a c t e r sc o n s t r u c t e db yu s i n gb pn e t w o r k ,c o n t o u rf e a t u r eo f c h a r a c t e r sa n dd e n s i t y f e a t u r eo fs t r o k e sc a nd i s t i n g u i s ht i n yd i f f e r e n c eb e t w e e ns i m i l a rc h a r a c t e r s a n dt h e r e s u l to fe x p e r i m e n t sp r o v e dt h a t ,t h er e c o g n i t i o na c c u r a c yo ff a xr e c i p i e n t sn a m e c h a r a c t e r sr e c o g n i z i n gm e t h o du s i n gh y b r i dn e u r a ln e t w o r kc a nr e a c h9 1 w h i c hi s 8 m o r et h a nu s i n gu n i t a r yn e u r a ln e t w o r k i nt h ea s p e c to fc h a r a c t e r sr e c o g n i t i o n ,t h es u p p o r tv e c t o rm a c h i n e ( s v m ) i s r e s e a r c h e dw i mm o r ee m p h a s i si nt h i sp a p e r s v mb e l o n g st ot h es t u d ya n d r e c o g n i t i o nm a c h i n ew i t hh i g hd i m e n s i o n sa n ds m a l ls a m p l e sw h i c hm a k ei tp o s s i b l e t or e a c hh i 曲r e c o g n i t i o na c c u r a c yb ys m a l ls a m p l e si fg i v e nm o r ec h a r a c t e r d i m e n s i o n s c o m b i n i n gf e a t u r ee x t r a c t i o nm e t h o d ,w ee x t r a c t e dm o r et h a nh u n d r e d s o fc h a r a c t e rd i m e n s i o n sa n da c q u i r eg o o dr e c o g n i t i o na c c u r a c yr e c o g n i z e db ys v m f o u rc o m m o nk e r n e lf u n c t i o n sa r ee x p e r i m e n t e ds e p a r a t e l y , r a d i a lb a s i sf u n c t i o n 、聃也 h i g hr e c o g n i t i o na c c u r a c yt on a m ec h a r a c t e r si s s e l e c t e da n dm e a n w h i l e ,d i f f e r e n t p a r a m e t e r so f k e r n e lf u n c t i o n sa r et e s t e d a c c o r d i n gt ot e s tr e s u l t ,t h ep a r a m e t e rv a l u e 盯2o fr a d i a lb a s i sf u n c t i o ni ss e l e c t e da so 5i nt h i sp a p e ra n dt h er e c o g n i t i o n a c c u r a c yc a nr e a c h9 4 0 8 m e a n w h i l e ,as c h e m ef o rc h i n e s ef a xr e c i p i e n t sn a m ea u t o - r e c o g n i t i o ni s p r e s e n t e da c c o r d i n gt ot h ef l e x i b i l i t yo ff a xa n ds p e c i a l i t yo fc h i n e s ef a xa n dt h ef a x r e c i p i e n t sn a l n ea u t o r e c o g n i t i o ns y s t e mi sp a r t l yi m p l e m e n t e di nt h i sp a p e r k e y w o r d s :i m a g ep r e p r o c e s s i n g ;p a t t e r ni d e n t i f i c a t i o n ;n e u r a ln e t w o r k ; s u p p o r t v e c t o rm a c h i n e ;f a x 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研究成 果。本人在论文写作中参考的其他个人或集体的研究成果,均在 文中以明确方式标明。本人依法享有和承担由此论文产生的权利 和责任。 声明人( 签名) :勿彳饱 诉月才日 厦门大学学位论文著作权使用声明 本人完全了解厦门大学有关保留、使用学位论文的规定。厦 门大学有权保留并向国家主管部门或其指定机构送交论文的纸 质版和电子版,有权将学位论文用于非赢利目的的少量复制并允 许论文进入学校图书馆被查阅,有权将学位论文的内容编入有关 数据库进行检索,有权将学位论文的标题和摘要汇编出版。保密 的学位论文在解密后适用本规定。 本学位论文属于 l 、保密() ,在年解密后适用本授权书。 2 、不保密( 矿 ( 请在以上相应括号内打“”) 作者签名:锄甸名 导师签名: 日期:2 旃月才白 日期:年月e t 第一章绪论 1 1 选题背景及其意义 第一章绪论 传真以其独有的特点在互联网盛行的今天依然拥有着其原有的地位,并且凭 借其技术的不断进步,得到了市场和用户的认可和喜爱,在办公自动化领域占有 重要位置。尽管e m a i t 以其方便廉价的特性受到普遍欢迎,对传统的传真技术造 成了一定的冲击,但传真独特的硬拷贝特性有着无可替代的优势。 传真文件自动识别系统属于专用o c r 系统开发范畴。专用o c r 系统的开发, 将在很大程度上拓宽o c r 技术的应用领域,提高相关应用领域的自动化程度。同 时,由于系统所要处理的对象是特定的,在系统的实现过程中所遇到的一些新问 题和所采用的新方法,对于o c r 技术的研究具有一定的理论价值。在专用o c r 系 统中,传真收件人姓名字符的识别技术具有较好的应用前景及实用价值。 1 2 相关技术的研究状况及应用 1 字符识别技术 ( 1 ) 二值化及字符分割方法 无论采用何种字符识别方法,目前的研究对象绝大部分都是对于单个字符而 言的,因此,对于采集到的含有多个字符的图像要经过一系列的前期预处理,把 单个字符分割出来。除了直接用图像的灰度值作为特征,其它特征的抽取大多是 针对灰度二值化后的图像进行,二值化的效果直接影响到后期的识别效果。目前 用得最多的二值化方法主要有基于门限化的方法、基于边缘检测的方法、基于形 态学区域增长的图像分割法、基于人工神经网络的方法等。如文献吼卜中介绍 了各种方法的实际应用并针对不同图像获得较好的二值化效果。至于把单个字符 切割出来则多数情况要根据所处理的图像特征,如现在研究较多的车牌字符切割 问题,多是先找到车牌的边缘,再通过车牌的先验知识用投影的方法进行分割 。叭3 ”“。有的文献提出运用区域生长算法和连通特性直接把字符二值化并从背景 中提取出来啪“,这种方法可以不考虑先验知识,具有一定的通用性,但计算过 程相当费时。 传真收件人姓名字符的识别技术研究与应用 ( 2 ) 特征的提取与分析 特征抽取是模式识别的一个重要环节,抽取稳定且有效的特征是识别系统成 功的关键。除了神经网络的方法,结构特征和统计特征都反映了字符的物理特性。 如今对结构特征的研究主要集中在用不同的方法来抽取骨架网,提取宽度与高 度,分析交叉点嘞1 等能够反映字符拓扑结构的特征点与线。用得更多的是统计特 征,如字符的投影特征洲,轮廓特征。”“,矩特征呻1 ,尤其对于矩特征的研究 已经从一些经典的矩运算发展到针对字符改进的矩运算,如文献 6 0 探索了一种 对随机噪声不敏感的矩运算。有的时候人们把多种特征综合起来使用以期达到特 征互补的效果。 ( 3 ) 分类器的选择与设计 在早期的字符识别研究中大多是用模板匹配的方法来完成分类,该方法对噪 声非常敏感。随着神经网络研究的快速进步,目前,神经网络用于分类是模式识 别研究领域的一大热点,其中,研究重点主要集中在各种网络与字符特征结合使 用及寻找更优化的算法“。6 。但神经网络有许多众所周知的弱点,如;初始权 值及步长等参数的设置,容易陷入局部极小点,需要大量样本训练等,支持向量 机( s u p p o r tv e c t o rm a c h i n e ) 。”1 是一个类神经网络,但它从根本上克服了神 经网络的诸多弱点,是近些年来在统计学习理论的基础上发展的新的模式识别方 法,它在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并 能够推广应用到函数拟合等其他机器学习问题中。 2 传真信息自动识别技术 目前,国内直接针对传真文件自动识别技术的研究较少,还查不到相关材料, 但国内关于o c r 技术的研究已经有了相当成熟的技术基础,同时也开发了很多不 同种类、适合不同条件的o c r 产品,这些o c r 技术为传真文件收件人自动识别系 统的依据和实现奠定了坚实的理论基础。 国外已经有较多学者正在进行传真文件自动识别术的研究: ( 1 ) j e n c h y o u ,l i i 和s a r g a rn s r i h a r i 早在1 9 9 5 年就探讨了在一 个文本分析系统中识别传真封面信息,以便传真可以像邮件一样进行自动分发, 在文献 1 3 中报道了他们在这方面研究的部分成果,讨论了如何在传真封面上定 位传真收件人的姓名和地址,并在姓名和地址的字符区域被定位并提取出来后, 送到一个地址解析模块进行识别。 第一章绪论 ( 2 ) l a u r e n c el i k f o r m a n - s u l e m 在文献 1 4 中介绍了在包含手写体字符 的传真封面上定位姓名字符区域的方法。同时提出了一种基于空间视觉等提示 信息的传真姓名字符区域定位方法。 ( 3 ) n o u r aa z z a b o ua n dl a u r e n c el i k f o r m a n s u l e m 在文献 1 5 中提 出了一种基于图像分析( o c r 识别、物理块选择) 和文本分析( 最优化查询、基 本的语法规则) 的传真封面特殊信息( 如收件人姓名) 识别和提取方法。同时介 绍了如何使用神经网络将图像分析和文本分析这两种不同方法最优结合以达到 最好结果。 ( 4 ) a l a mh e ta 1 在文献 1 6 中介绍了一个传真助理分发系统,该系 统在识别所有字符( 包括印刷体和手写体) 的基础上使用文本分析。其图像分析 步骤简化为根据每个姓名字符所在位置而判定该姓名字符为系统所求姓名字符 的可能性。由于传真收件人姓名字符具有较普遍的版面分布规则,所以该系统对 传真收件人姓名字符识别的准确率达到了9 6 至9 9 7 ,同时,其恢复率( r e c a l l ) 根据传真类型的不同( 仅印刷体或既有印刷体又有手写体) 在5 6 至7 8 之间。 1 3 课题主要研究内容 ( 1 ) 字符图像预处理 计算机图像处理技术由于各方面的应用需求成为当前的热门领域。字符图像 预处理是图像处理技术的一个重要应用,预处理效果直接影响后续处理方法的难 易及处理结果的准确性。本文在字符图像预处理方面,除对传统方法的研究外, 根据传真收件人姓名字符图像的特殊性,经过多次实验,选取了适合于传真字符 图像的二值化、噪声过滤、倾斜校正、字符大小归一化及细化的方法;针对传真 收件人姓名字符可能存在书写线的特点,对书写线的检测和去除方法进行了分 析,使用了一种基于数学形态学的书写线去除方法:采用波峰一波谷分析的字符 切分方法将字符图像切分成单个字符,同时,文中针对粘连字符块,采用了一种 根据字符笔画信息,寻找合适的分割点和分割路径的分割方法。 ( 2 ) 基于混合神经网络的手写体字符识别方法 由于不同的网络模型具有其自身的限制,单独使用某一种神经网络和某种特 征进行脱机手写体字符识别无法取得非常好的识别效果。因此多方案集成识别系 传真收什人姓名字符的识别技术研究与应用 统成为近年来文字识别领域的一个主要研究方向,任何一种特征、任何一种识别 方法都有其优点和局限性,借鉴印刷体字符识别的成功经验,走多特征组合、多 方案集成的道路,是脱机手写体字符识别系统走向实用化的有效途径。本文基于 不同的网络模型有其自身特点,利用多神经网络集成技术,建立了一种利用多特 征的多级混合神经网络的识别系统来处理字符识别问题,并提高其识别率。 多级混合神经网络识别模型由汉字字符特征输入、自组织聚类网络粗分类 器、b p 网络细分类器等部分组成。自组织聚类网络由于其自身的自组织和聚类 特性可以很好地给出模式在多维空间的概率分布估计,可以较好地估计出字符的 粗分类结果。b p 网络有着优秀的非线性映射特性和对输入矢量的分类能力。使 用b p 网络构建字符的二级细分类器可以分析相似字符的细微差别。在进行字符 识别时,首先对汉字字符提取粗分类特征,送入初级识别网络中进行汉字字符的 粗分类。从而有效的降低后期处理的运算负担提高运算效率。初级识别系统选用 本文的自组织聚类网络,特征经聚类网络计算后,将字符粗分类,并根据距离最 近原则,计算选择待识别字符的若干个候选类别。在网络的第二级,根据系统给 出的各候选字符类别,送入改进的b p 网络进行具体识别。实验结果表明,使用 混合神经网络的传真收件人姓名字符识别方法对大字符集样本的识别率达到了 9 1 左右,比使用单一神经网络提高了8 。 ( 3 ) 基于支持向量机的手写体字符识别方法 支持向量机( s u p p o r tv e c t o rm a c h i n e ) 是近些年来在统计学习理论的基础 上发展的新的模式识别方法,它在解决小样本、非线性及高维模式识别问题中表 现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。 本章我们着重研究了支持向量机。支持向量机是属于高维数小样本的学习识 别机器,这样在给出了更多特征维数后,可以由少量的样本,就可以达到很高的 识别率。结合特征提取方法,我们提取了多达几百维的特征,用支持向量机识别, 取得了较高的识别率。文中对四种常用的核函数分别进行了实验,选取了对姓名 字符具有较高识别率的径向基内积函数,同时对核函数的不同参数进行了测试, 根据测试结果本文系统选取盯2 为0 5 作为径向基内积函数的参数值。 ( 4 ) 传真收件人姓名自动识别方案 虽然国外对传真收件人自动识别方法已经进行过一些研究,但是这些研究仅 针对英文或法语,而且很多技术并没有公开,不能照搬。为此,本文针对传真文 第一章绪论 件使用上的灵活性及中文传真的特殊性,提出了一种用于解决中文传真收件人姓 名自动识别的方案,并对该方案的一些关键技术进行了研究,部分实现了传真收 件人姓名自动识别系统。 1 4 论文组织结构 第一章主要介绍了本课题的研究背景和意义,概述了本课题相关技术的研究 现状,阐述了本文研究的主要内容及关键技术。 第二章讨论了图像预处理技术,介绍了适合于传真字符图像的二值化、噪声 过滤、倾斜校正、字符大小归一化及细化等方法,并给出了相应的实验结果。 第三章针对传真姓名字符图像可能存在书写线的特点,对书写线的检测和去 除方法进行了分析,使用了一种基于数学形态学的书写线去除方法;对于规格比 较统一、字符分离清晰的字符区域使用最常用的基于投影分析的波峰波谷法对 字符图像进行切分,以便进行字符识别,对于投影法无法切分的粘连字符块,采 用了一种根据字符笔画信息,寻找合适的分割点和分割路径的分割方法。 第四章提出了一种基于混合神经网络的传真收件人字符识别方法。该方法主 要应用于大字符样本集,实验证明该方法适合于传真收件人姓名字符的识别。 第五章提出了一种基于支持向量机的传真收件人字符识别方法。文中对四种 常用的核函数分别进行了实验,选取了对传真收件人具有较高识别率的核函数, 它有利于实现传真收件人的自动识别。 第六章对识别系统进行了简要的介绍,给出了系统流程以及识别实例的流程 截图。 第七章对全文进行了总结,并对进一步的工作进行了展望。 传真收件人姓名字符的识别技术研究与应用 第二章字符图像预处理 图像预处理是把一个不理想的原始文档图像转变为较理想的二值图像。一般 说来,由于受到种种条件的限制和随机干扰,被观测的图像中包含有各种各样的 噪声和畸变。对原始图像进行灰度校正、噪声过滤和畸变校正、二值化都是文档 图像处理的主要内容。预处理效果直接影响后续处理方法的难易及处理结果的准 确性,所以预处理在字符识别中是很重要的一步。 2 1 字符图像去噪 噪声可以理解为“妨碍人们感觉器官对所接受的信源信息理解的因素”。在扫 描录入过程中,纸张的厚薄、洁白度、光洁度以及油墨深浅、印刷质量都造成字 型畸变,产生污点、飞白、断笔、交连等干扰和噪声。所以在进行识别前,要对 整个带有随机干扰噪音的灰度输入图像进行去噪。一般情况下,在空间域内可以 用邻域平均法来减少噪声。而在频率域内,因为噪声频谱多在高频段,因此可以 采用各种形式的低通滤波的办法来减少噪声。 2 1 1 字符图像中的常见噪声 图像中的噪声种类很多,对图像信息的影响十分复杂。有些噪声和图像信息 互相独立,不相关,有些是相关的,噪声本身之间也有些相关。因此要减少图像 中的噪声,必须针对具体情况采用不同的方法,否则,难以获得满意的效果。图 像中常见的噪声一般有四类。1 : ( 1 ) 加性噪声 加性噪声和图像信号强度是不相关的,如图像在传输过程中引进的信道噪 声、电视摄像机扫描图像的噪声等。这类带有噪声的图像g 可看成为理想无噪声 图像f 和噪声n 之和,即g = f + n 。 ( 2 ) 乘性噪声 乘性噪声和图像信号是相关的,往往随图像信号的变化而变化,如飞点扫描 图像中的噪声、电视扫描光栅、胶片颗粒噪声等,这类噪声与图像的关系 是:g = ,+ 。 第二章字符图像预处理 ( 3 ) 量化噪声 量化噪声是数字图像的主要噪声源,其大小显示出数字图像和原始图像的差 异,对这种噪声的减少最好办法就是采用按灰度级概率密度函数选择量化级的最 优化措旖。 ( 4 ) “椒盐”噪声 椒盐( s a l ta n d p e p p e r ) 噪声经常出现在图像中,当摄像机中包含一些失效的像 素时,所采集的图像就会出现这类噪声,椒盐噪声因在图像中表现为黑白相间的 斑点而得名。 图像中的噪声往往和信号交织在一起,尤其是乘性噪声。如果平滑不当,就 会使图像本身的细节如边界轮廓、线条等变得模糊不清,从而使图像降质,所以 图像去噪的过程总是要付出一定细节模糊代价。 2 1 2 中值滤波法 本文所处理的字符图像中,各种常见噪声都可能出现。常用的去噪方法”1 有 在空间域平滑中的邻域平均法、中值滤波法等,在频率域平滑中的理想低通滤波 器、b u t t e r w o r t h 低通滤波器、指数低通滤波器、梯形低通滤波器等,本文采用中 值滤波法。 中值滤波是一种非线性信号处理方法,与其对应的中值滤波器当然也就是一 种非线性滤波器。中值滤波器是在1 9 7 1 年由j w j u k e y 首先提出并应用在一维信 号处理技术( 时间序列分析) 中,后来被二维图像信号处理技术所引用。中值滤 波在一定条件下,可以克服线性滤波器如最小均方差滤波、平均值滤波、平滑滤 波等方法所带来的图像细节模糊,而且对滤波脉冲干扰及图像扫描噪声最为有 效。在实际运算中并不需要图像的统计特性,所以使用也较为方便。 中值滤波就是用一个含有奇数点的滑动窗口,对窗口正中点的值用窗口内各 点的中值代替。设有一个一维序列,( 1 ) ,( 2 ) ,f q ) 。取窗口长度为所( m 为奇 数) ,对此一维序列进行中值滤波。就是从输入序列中相继抽出坍个数 f ( i v ) ,f ( i 1 ) ,( 吐厂( 1 ) ,( f + v ) :其中,( 0 为窗口中心点值, v = f 坍一1 ) 2 。再将这个m 值按其数值大小排序,取其序号为正中间那个数作为 滤波输出。中值滤波法的公式为: 传真收件人姓名字符的识别技术研究与应用 g ( f ) = m e d f ( i v ) ,厂( f ) ,厂( f + v ) ) ( 2 1 ) 其中v = ( 州一1 ) 2 i z 二维中值滤波可表示为: y f = 岣d 矗 ( 2 2 ) 其中:a 为窗口; 六。 为二维数据序列。 二维中值滤波的窗口形状和尺寸设计对滤波效果影响较大。不同的图像内容 和不同的应用要求,往往采用不同的窗口形状和尺寸。常用二维中值滤波窗口形 状有线型、方型、圆型、十字型以及圆环型等。窗口尺寸一般采用3 再取5 逐步增 大,直到滤波效果满意为止。通常情况,对于有缓变的较长轮廓线物体的图像, 采用方形或圆形窗口为宜。图2 1 给出了中值滤波几种常用窗口: 图2 1 中值滤波的几种常用窗口 图2 2 截取后姓名字符图像图2 3 去噪后的字符图像 2 2 文档图像二值化 所谓二值图像,就是指图像上的所有点灰度值只有两种可能,不为0 ,就 为“2 5 5 ”,也就是整个图像呈现出明显的黑白效果。为了得到理想的二值图像,一 般采用阈值分割技术,它对物体与背景有较强对比的图像的分割特别有效,它计 算简单而且总能用封闭、连通的边界定义不交叠的区域。所有灰度大于或等于阈 值的像素被判决为属于物体,灰度值用“2 5 5 ”表示,否则这些像素点被排除在物 体区域以外,灰度值为0 ”表示背景。这样一来物体的边界就成为这样一些内部 点的集合,这些点都至少有一个邻点不属于该物体。如果感兴趣的物体在内部有 第二章字符图像预处理 均匀致的灰度值,并且其处在一个具有另外一个灰度值的均匀背景下,使用阈 值法可以得到比较好的效果。如果物体同背景的差别不在灰度值上( 比如纹理不 同) ,可以将这个性质转换为灰度的差别,然后利用阈值化技术来分割该图像。 为了使分割更加鲁棒,适用性更强,系统最好可以自动选择阈值。基于物体、环 境和应用域等知识的图像分割算法比基于固定阈值的算法更具有普遍性和适应 性。这些知识包括:对应于物体的图像灰度特性、物体的尺寸、物体在图像中所 占的比例、图像中不同类型物体的数量等。其中图像直方图就是一种灰度特性, 通常被用来作为分割图像的工具。 这些方法划分成十类跚:( 1 ) 直方图方法与直方图变换法:( 2 ) 最大类问方 差法;( 3 ) 最小误差法与均匀化误差法,( 4 ) 共生矩阵法:( 5 ) 矩量保持法;( b ) 最 大嫡方法,( 7 ) 简单统计法与局部特性法,( 8 ) 概率松弛法;( 9 ) 模糊集方法,( 1 0 ) 其他方法。 下面介绍本文所采用的类间方差自动阈值法。“: 假定图像中只有灰度范围各异的目标和背景。只有在其灰度直方图选择合适 的门限,才可能将其划分成目标和背景。从模式识别理论来看,不同的门限值导 出不同的类别分离性能,只有合适的( 或最佳的) 门限值才能给出合适的( 或最佳 的) 类别分离性能。现在使用类别的方差来判别不同门限划分类别的分离性能, 并由此导出自动阈值。 设图像中的灰度范围为 0 , 1 ,一1 ,选择门限r 将划为两类: c o : 0 , 1 ,f ,c i : ,+ 1 ,t + 2 ,一1 。将直方图归一化,其有概率分布: p 。= 万n ae o ,萎i - i c = 1 ( 2 3 ) 其中为像素的个数,为灰度f 的像素个数。c 0 和c i 类的类出现概率及 均值层分别由以下给出: j c o o = p ( c o ) = 只= t o ( t ) , i = 0 且 ( 2 4 ) 胁= 褰氓,= 筹= 。薹嵋忙篙 d烈 一i = h m = 、jq( p 一一 以 传真收件人姓名字符的识别技术研究与应用 其中c o ( t ) = 只 卢( f ) = 啦 i = o f i u ,= ( ,- 1 ) = 妒 j = 0 对于任何f 值都能使下式成立: ,b + q l = r ,o + c o l = 1 c 。和c 类的方差可由下式求得: ( 2 ,7 ) ( 2 8 ) t ,一l 露= ( f 一硒) 2 # ,井= ( i - t i ) 2 q ( 2 9 ) j = o j - f + 1 按照模式识别的理论,可以求出两类的类内方差、类间方差和总体方差,先 选用下面的公式: 盯:= 0 3 0 0 :+ c o i o ?( 2 1 0 ) 盯;= c o o ( u o - t r ) 2 + 彩l ( 1 一声r ) 2 = c o o c o l ( , u i 一。)( 2 1 1 ) 盯;= ( f 一x r ) 2 鼻c o t ( 2 1 2 ) 且盯:+ 盯;= 2 , 组合分析这些类别方差,可以衡量不同门限导出的类别的分离性能。可选用 以下三个准则测量: 五= 考2 ,七= 毒,节= 毒 , 这三个准则彼此等效。注意到盯:和盯;是门限t 的函数,斫与f 无关。由于吒 是基于二阶统计特征,而以是基于一阶统计特征,所以选用口作为测量是最简 单的。极大化的过程就可以自动确定门限f ,所以最佳门限t + 应当为: ,a r g 。m m a f _ x l ,7 ( 2 1 4 ) 图2 4 为图2 3 经过二值化处理后的字符图像结果。 1 0 第二章字符图像预处理 2 3 倾斜校正 图2 4 二值化后的字符图像 文档图像可能由于各种原因发生倾斜现象。实际上即使页面发生0 1 度的倾 斜,人的肉眼也可以明显的觉察到:而且文档图像的倾斜,不仅影响文档分析与 理解过程的很多算法、字符识别阶段的算法的精确度,而且可能大大增加计算量。 图像的校正分为手工校正和自动校正。而靠人眼进行手工校正费时费力,因此扫 描图像的自动校正是一件非常有实际意义的工作,而扫描文档图像的特殊性使得 自动校正成为可能。 目前,倾斜检测的方法主要包括基于h o u g h 变换的方法、基于投影图的方法、 最近邻簇类方法以及基于f o u r i e r 变换的方法等五类。它们各有各的特点,本 文采用基于h o u g h 变换的方法对传真收件人字符图像进行倾斜校正。 h o u g h 变换是将笛卡儿坐标系中的( x ,y ) 映射到h o u g h 空间的点( p ,口) ,即 p = x c o s o + y s i n o ( 2 1 5 ) 一系列笛卡几坐标系中的点可以映射为h o u g h 空间的若干曲线。每当一条 h o u g h 空间的衄线与另一条曲线在( p ,0 ) 相交时,对应于( p ,0 ) 的直线在原来笛卡 儿空间存在的可能性就会增加。因此可设计一个二维的计数器( p ,0 ) 的,用于 记录这种可能性的增加,其维数对应于参数p 和口。将原始图像中的所有点映射 到h o u g h 空间并将结果记录于计数器中后,检查计数器的局部极大值,每个极大 值都对应了原始图像中存在的直线。在实际处理过程中,为了减少计算量,通常 选择一定范围内的p 和口进行计数,即原始图像中每个黑像素点对应的x 和y 值 只需应用于一定范围内的0 值,再计算出相应的p 值,并将结果存储予计算器。 由于h o u g h 变换是对图像中的每个像素进行考查。因此计算量非常大,使用 过程中通常采用修正的方法来降低计算的复杂度。 f a r r o w 等人以每2 0 个像素点为单位进行采用,再将重新采样的点利用h o u g h 变换的方法,对应于每个0 值,累加计算其p 值,并选择对应于结果平方的最大 传真收件人姓名字符的识别技术研究与应用 值的0 作为倾斜角。l e 等人首先抽取页面中某一文本区域中的连通区:由于字符 连通区的闭包盒底边通常于文本行的基线对齐,且基线方向平行于倾斜方向,因 而可将字符的底线作为样本点进行h o u g h 变换,求出倾斜角。文献。“将文档的分 辨率由3 0 0 d p i 降致7 5 d p i ,以行程编码方式表示图像:并将原始图像中每个连续 黑段的端点都由该行程的像素点个数取代:在此基础上,应用h o u g h 变换,计算 一1 5n + 1 5 度之间,以0 5 为分辨率0 值对应的p 值;最后选取计算器的最大值 对应的0 的倾斜角。层次式h
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度出纳人员聘用及财务数据处理合同
- 餐饮行业环保设施建设合同
- 幼儿园大班读书角活动方案
- 防台风专项施工方案
- “学宪法讲宪法”主题活动演讲稿
- 银行情绪管理课件
- 铰链四杆机构说课课件
- 2025年中国电点火管行业市场深度分析及投资战略规划报告
- 2025年中国毛皮裁条机行业发展潜力预测及投资战略规划报告
- 六一儿童节系列活动总结
- 工伤预防宣传项目方案投标文件(技术方案)
- 干货 - 高中历史全套思维导图100张
- 小学中段语文课堂随文小练笔的策略探究
- 办公窗帘采购 投标方案(技术方案)
- 2025年永诚财产保险股份有限公司招聘笔试参考题库含答案解析
- 2025年度页岩气开采井钻探及技术服务合同2篇
- 2025年中铁水务集团有限公司招聘笔试参考题库含答案解析
- 蒸汽管道工程施工方案
- 夏季预防空调病宣传
- 营养指导员技能实践考试题
- DB41T 1338-2016 石窟文物三维数字化技术规范
评论
0/150
提交评论