




已阅读5页,还剩51页未读, 继续免费阅读
(检测技术与自动化装置专业论文)图像字符仿人认知特征的机理研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像字符仿人认知特征的机理研究 摘要 由于汉字数量结构的多样性和复杂性,使得汉字特征难以被完全统一的描 述;由于汉字形状字体的相似性和变异性,使得汉字字形难以被完整唯一的区 分。汉字自动识别系统始终无法达到或接近人类识别汉字的准确性、灵活性和 容错性。 本文研究人类识字机理与机器认知模式的有机结合,从人对汉字的识别过 程出发,使计算机尽可能模仿人的识别过程。以期尽可能接近人认识汉字的效 果。 本文主要涉及了以下工作: 1 ) 图像字符预处理。提出一种非均匀光照图像字符二值化方法。通过对图 像进行小波变换,在最佳尺度上寻找出图像字符的边缘点,再根据字符 边缘点处的灰度值来确定出二值化的阈值。该算法有效地克服了光照不 均噪声对二值化的影响,具有良好效果。 2 ) 图像汉字特征提取。提出了基于汉字结构和边缘轮廓的图像汉字笔划提 取算法该算法通过对图像汉字进行笔划结构的小波边缘轮廓检测,能 完整有效的从图像汉字中分别提取出横竖撇捺四类笔划;对提取的分类 笔划信息进一步提取与汉字拓扑结构相关的笔划关系信息和特征点信 息,为图像汉字的识别提供更多更丰富的信息。 3 )图像汉字编码。在研究多种汉字编码方案特点的基础上,以机器认知为 基点,依据提取构成汉字的笔划形态、形式、数量的结构与统计综合特 征,制定了图像汉字识别编码方案,提出了一种机器认知的十一形码汉 字特征编码方法。 本文研究表明,非均匀光照图像字符二值化方法有效地克服了光照不均 噪声对二值化的影响,具有良好效果:基于汉字结构和边缘轮廓的图像汉字 笔划提取算法能完整有效的从图像汉字中分别提取出横竖撇捺四类笔划:十 一形码编码方法能够表征汉字的本质特征。 关键词:图像字符汉字笔划提取特征提取汉字编码 t h e s t u d y o nt h em e c h a n i s mo fh u m a n o i d r e c o g n i t i o n c h a r a c t e r i s t i cf o r i m a g e c h a r a c t e r a b s t r a c t d u et ot h e v a r i e t y a n dc o m p l e x i t yo ft h ec h i n e s ec h a r a c t e r ss t r u c t u r ea n d q u a n t i t y , i ti sd i m c u l t t od e s c r i b et 1 1 ec h a r a c t e r i s t i co fc h i n e s ec h a r a c t e r sc o m p l e t e l y a n du n i f o r m l y d h et ot h es i m i l a ra n dv a r i a b i l i t yo fc h i n e s ec h a r a c t e r ss h a p ea n d f o n t ,i ti sd i f f i c u l tt od i s t i n g u i s ht h ec h i n e s ec h a r a c t e r ss h a p ei n t e g r a l l ya n du n i q u e l y t h e v e r a c i t y , a g i l i t y a n d p e r m i s s i b i l i t y o ft h ec h i n e s ec h a r a c t e r sa u t o m a t i c r e c o g n i t i o ns y s t e ma l w a y sc o u l dn o tr e a c ho ra p p r o a c h t ot h o s eo f t h em a l l k i n d 。 p r o c e e df r o m p e o p l e sr e c o g n i t i o n c o u r s et oc h i n e s ec h a r a c t e r s ,t h i sp a p e rs t u d y t h eo r g a n i c a l l yc o m b i n a t i o no ft h em a n k i n d r e c o g n i t i o nm e c h a n i s ma n dt h em a c h i n e c o g n i t i v em o d e ,m a k e t h em a c h i n ei m i t a t ep e o p l e sd i s c e r n m e n tc o u r s ea n d a p p r o a c h t ot h ep e o p l e r e c o g n i t i o nc h i n e s ec h a r a c t e r se f r e c ta sm u c h a sp o s s i b l e t h e f o l l o w i n ga r et h em a j o r c o n t e n t si nt h et h e s i s : 1 1 i m a g ec h a r a c t e rp r e t r e a t m e n t ab i n a r ym e t l l o d6 f i m b a l a n c e di l l u m i n a t i o n i m a g ec h a r a c t e r s i s p r o p o s e d b yt h eb i n a r y w a v e l e tt r a n s f o n n i m a g e c h a r a c t e r se d g ep o i n t sc a nb ea t t a i n e di nt h eb e s ts c a l e i m a g ec h a r a c t e r s b i n a r yt h r e s h o l dc a nb es e l e c t e db ye d g ep o i n tg r a yv a l u e 1 1 1 ee x p e r i m e n t r e s u l ts h o w st h em e t h o di se f f e c t i v eo ni m b a l a n c e di l l u m i n a t i o n i m a g e b i n a r y 2 1 i m a g ec h i n e s ec h a r a c t e rc h a r a c t e r i s t i ce x t r a c t i o n a na l g o r i t h mo fs t r o k e e x t r a c t i o nb a s e do nc h i n e s ec h a r a c t e r ss t r u c t u r ea n de d g ei sp r e s e n t e d t h e a l g o r i t h mc o u l de f f e c t i v e l ye x t r a c tf o u rs o r t so f s t r o k e sf r o mi m a g ec h i n e s e c h a r a c t e rb yt h ew a v e l e te d g ed e t e c t i o no ft h ec h i n e s ec h a r a c t e rs t r o k e s t r u c t u r e 刀站s t r o k e sr e l a t i o na n dc h a r a c t e r i s t i c p o i n t s r e l a t et o c h i n e s e c h a r a c t e r st o p o l o g i c a ls t r u c t u r e ,c o u l de x t r a c tf r o mt h ef o u rs o r t so fs t r o k e s t h ea l g o r i t h m g e t sg o o d r e s u l ti nt h es t r o k ee x t r a c t i o nf o rc h i n e s e c h a r a c t e r s 3 、t h ec o d i n gf o ri m a g ec h i n e s ec h a r a c t e r b a s e do ns o m ec h i n e s ec h a r a c t e r c o d i n gs c h e m e sa n dm a c h i n ec o g n i t i v e ,c o m b i n e dt h ec h a r a c t e r i s t i c o f s t r u c t u r ea n ds t a to ft h ee x t r a c t e ds t r o k e s s h a p e ,f o r ma n dq u a n t i t y , a n e l e v e n s h a p e sc h i n e s e c h a r a c t e rc o d h a gi sp r e s e n t e d t h er e s e a r c hi n t h i sa r t i c l es h o w st h a t :t h eb i n a r ym e t h o di se f f e c t i v eo n i m b a l a n e e di l l u m i n a t i o ni m a g eb i n a r y ;s t r o k ee x t r a c t i o na l g o r i t h mc a ne x t r a c tt h e f o u rs o r t so fs t r o k e sf r o mc h i n e s ec h a r a c t e r ;e l e v e n s h a p ec o d i n gc a ne f f e c t i v e l y i n d i c a t et h et r a i to fc h i n e s ec h a r a c t e r k e y w o r d s : i m a g ec h a r a c t e r , c h i n e s e c h a r a c t e rs t r o k e e x t r a c t i o n , c h a r a c t e r i s t i ce x t r a c t i o n ,c h i n e s ec h a r a c t e rc o d e 合肥工业大学 本论文经答辩委员会全体委员审查,确认符合合肥 _ 业大学 硕士学位论文质量要求。 答辩委员会签名 拂:过增缸长栽簿 委觅幺石x 糠。撕易石x 仓汜。轧始 导师: 尚堤 教埂 引翻音爻 旅拔 草斗知 积敬 寸 定 谚 r 嗄 眺嚣节 独创性声明 本人声明所呈交的学位论文是本人在导师指导r 进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写 过的研究成果,也不包含为获得金壁工业盔生或其他教育机构的学位或证书而使 用过的材料。与我一同上作的同志对本研究所做的任何贡献均已在论文中作了明确的说明 并表示谢意。 学位论文作者签名: 签字日期:2 i 年f 片哼日 | 学位论文版权使用授权书 本学位论文作者完全了解盒蟹王些太堂有关保留、使用学位论文的规定,有权保留 并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权盒 蟹兰些,大堂可以将学位论文的全部或部分内容编入有关数据库进行检索。可以采甩影印、 缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: n 加 签字日期: d 1 :年;月呵日 i 学位论文作者毕业后去向: 工作单位:舍p 巴蜘7 五司 通讯地址:水“,每母、p j 导师签名 覆争 签字日期:蚺夕月二目 电话: 邮编:拼。+ , 致谢 论文是在王建平教授的悉心指导下完成的,从论文的开题到课题的结束, 都倾注了王老师耐一t s , 细致的指导与帮助。 王老师有着深厚的学术科研功底,开阔敏锐的科学思维,许多建设性意见 使课题研究豁然开朗,让我深深的体会到王老师独具匠心的栽培、受益非浅: 老师认真踏实的工作作风、严谨的治学态度、平易近人的生活态度、真诚友善 的处世态度以及非凡的敬业精神,为我今后的工作生活树立了楷模。毕业之际, 向王建平老师致以最真挚的谢意和祝福! 研究生期间,智能研究所的王金玲老师、罗国军老师、穆道明老师、郑洁 老师给了我工作和生活上的无私帮助。在此向各位老师表示真诚的感谢! 感谢好友钱自拓、秦剑、杨静在三年里给予我生活上和学习上的帮助,与 你们共度的这段充实而又快乐的学习时光,将是我人生中的美好回忆。 感谢钱波、后俊、秦枫、郭之辉、赵丽新、黄冉、季学锋、陈军、蔺菲、 赵丽、丘志刚等实验室同学给予我的关心和帮助。 感谢我的父母及家人,他们一直默默关心、支持着我,并鼓励我完成了三 年的学业,在此特别感谢我父亲,感谢他在物质上和精神上给我的巨大帮助。 感谢我的夫人聂晶在研究生期间给予我生活上的照顾和学习上的鼓励,感 谢她的理解和支持。 毕业在即,谨向所有关心和帮助过我的同学和朋友献上最美好的祝福! 作者:王竹林 2 0 0 5 年5 月 第一章绪论 汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民 族灿烂文化的形成和发展有着不可磨灭的功勋,并将继续发挥重要的、其它 文字形式难以取代的作用。 汉字识别,即运用计算机系统自动识别印刷或手写的图像汉字,进而转 换为计算机可以处理的编码技术。汉字识别是模式识别的一个重要分支,然 而,汉字是非字母化、非拼音化的文字,也是文字识别领域最为困难的问题, 它涉及模式识别、图象处理、数字信号处理、自然语言理解、人工智能、模 糊数学、信息论、计算机、中文信息处理等学科,也涉及到语言文字学、心 理学等学科,是一门综合性技术。在中文信息处理、办公室自动化、机器翻 译、人工智能等高技术领域,都有着重要的实用价值和理论意义,一直为人 们关注的一个重要应用研究课题。 1 1汉字识别及其技术现状 汉字是形、声、义有机组合的方块文字,与西文相比,汉字具有数量大 ( 汉字国标一、二级字库g b 2 3 1 2 - 8 0 有6 7 6 3 个) 、结构繁杂、字体字形变化 多等特点。因此,汉字识别的研究工作一直被看作是十分困难的模式识别问 题,并被视为字符识别研究的最终目的。 1 1 1 汉字识别研究的发展1 h 2 i i 3 】【” 文字识别很早就是人们的梦想,早在1 9 2 9 年,t a u s h c k 就在德国获得了 一项有关o c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) 的专利。欧美国家为了将浩如烟 海、与日俱增的大量报刊杂志、文件资料和单据报表等文字材料输入计算机 进行信息处理,从5 0 年代就开始了西文o c r 技术的研究,以便代替人工键 盘输入。 汉字的识别最早可以追溯到6 0 年代,1 9 6 6 年,i b m 公司的c a s e y 和n a g y 利用简单的模板匹配法识别了1 0 0 0 个印刷体汉字。7 0 年代以来,日本学者做 了许多工作,其中有代表性的系统有1 9 7 7 年东芝综合研究所研制的可以识别 2 0 0 0 汉字的单体印刷汉字识别系统;8 0 年代初期,日本武藏野电气研究所研 制的可以识别2 3 0 0 个多体汉字的印刷体汉字识别系统,代表了当时汉字识别 的最高水平。此外,日本的太平洋、松下、理光和富士等公司也有其研制的 汉字识别系统。这些系统在方法上,大都采用基于k l 数字变换的匹配方案, 使用了大量专用硬件,其设备有的相当于小型机甚至大型机,价格极其昂贵, 没有得到广泛应用。 我国对汉字识别研究工作始于七十年代末,主要有清华大学计算机系、 中科院自动化所、河北大学、南开大学、北京大学等单位。其研究工作大致 可以分为三大阶段: 第一阶段从7 0 年代末期到8 0 年代末期。这一阶段主要研究的是汉字识 别的算法和方案,研究人员提出了用于汉字识别的各种方法和特征,如特征 点方法、汉字周边特征、汉字的结构元特征等,并在此基础上研究成功一批 汉字识别系统,其中比较突出的有清华大学电子工程系研制成功的清华多字 体印刷汉字识别系统,沈阳自动化所研制的沈阳印刷汉字识别系统和北京信 息工程学院研制成功的北信单体印刷汉字识别系统。这一阶段是印刷汉字识 别成果倍出的时期。但是,这些成果还仅仅处于实验室阶段,没有转化为产 品来实际解决印刷汉字的自动输入问题。 第二阶段是九十年代初期开始,汉字o c r 技术进入了一个重要、蓬勃发 展的时期,即将实验室的研究成果推向市场,推向实用,在实际的汉字识别 输入应用条件下,检验和考查这些研究成果。 印刷体汉字识别系统的研究还要解决好实用汉字识别系统所必须解决的 一些问题,如版面的自动分析、行字切分、人机界面和良好的应用环境等等。 这一阶段,形成了一些初步实用的印刷体汉字识别系统开始进入市场。典型 的系统有:清华大学电子工程系完成的清华o c r ( t ho c 鼬,北京信息工程学 院完成的北信o c r ( b i o c r ) 和沈阳自动化所完成的沈阳o c r ( s y - o c r ) 。其中 清华o c r 以其较高的性能和良好的使用环境,颇受用户欢迎。 九十年代计算机硬件资源发生了巨大的变化,为手写体汉字识别提供了 相对充分的研究环境。更为重要的是,从8 0 年代开始,汉字o c r 的研究开 发就一直受到国家“8 6 3 计划”的很大资助,人而促进了许多o c r 重大成果 的获得。特别是在手写体识别方面。大量有关手写体o c r 方面的论文和系统 见诸于世。到了1 9 9 2 年后,一些手写体汉字识别系统逐渐向实用化发展。 1 1 2 汉字识别技术的新方法与发展趋势| 5 】| 6 】【7 1 九十年代以来,新的技术方法出现,促进了汉字识别技术的发展,最新 的研究包括以下几个方面: ( 1 ) 小波变换的广泛应用1 8 】 9 1 小波变换的多尺度分解特性更加符合人类的视觉机制,与计算机视觉中 由粗到细的认识过程十分相似,非常适于图像信息的处理。利用矩和小波对 信息进行处理,成为了一种模式识别发展的趋势。此外,小波与数学形态学 的结合使用,小波与神经网络的联合,也取得了不错的效果。 ( 2 ) 数学形态学的应用m 1 数学形态学的应用几乎覆盖了图像处理的每个领域,包括抑制噪声、特 征提取、边缘检测、图像分割、文字识别、图像编码压缩等图像处理问题。 数学形态学是一种非线性滤波方法,其特点是能将复杂的形状进行分解,并 将有意义的形状分量从信息中提取出来。 ( 3 ) 遗传算法的应用】 1 2 1 遗传算法将“适者生存”这一基本进化理论引入人工系统,模仿生物进 化的过程,使人工系统达到如生物系统那样的鲁棒性。将遗传算法用于图像 目标定位,结合对待检测区域的特征提取,不用搜索全部图像就能寻找到目 标,抗噪声强,适用范围广。 ( 4 ) 神经网络和模糊逻辑的结合应用【9 】 神经网络具有的并行计算、分布式信息存储、容错能力强以及具备自适 应学习功能等一系列优点,使得神经网络在模式识别方面得到了广泛应用并 取得很多成果。模糊逻辑是一种处理不确定性、非线性和其它不适定问题的 有力工具。将模糊逻辑与神经网络适当地结合起来,吸取两者的长处,则可 组成比单独的神经网络系统或单独的模糊系统性能更好的系统。由于实际图 像中的噪声、复杂的背景使汉字的定位、提取和识别都相对困难,这种情况 适合用模糊神经网络解决。 ( 5 ) 多方案集成的分层识别策略】 字符识别是一个非常复杂的多模式识别问题,多年研究的实践表明,单 一方法的效果是有限的,采用多方法的有机组合,使其优势互补,走多特征 融合、多方案集成的道路,是字符识别的一个发展趋势。常用的分类器集成 方法有投票法、概率法、d e m p s t e r s h a f e r 法、行为知识空间法、综合集成法、 基于置信度的神经网络集成法等。但多方案集成识别方法需要设计一个性能 良好的专家决策支持系统。 ( 6 ) 心理学研究成果在字符识别中的应用呷1 字符识别的心理学研究对字符识别具有启发意义。对人类汉字的认知心 理实验研究结果进行总结后,认为人的汉字识别是经由整字属性及分层结构 的多种途径复合而成的,其中多数都可以在字符机器识别中模仿应用。这方 面的研究虽然起步晚,尽管没有一个实际系统来验证,但却是一个值得注意 的新动向。 1 2图像汉字识别技术的研究与发展 报纸、图片、视频中的文本可以提供大量的信息,但现有的商业o c r 软 件不能识别含有复杂的背景的图像文本。主要有以下两种类型的图像文本。 1 ) 场景文字( s c e n et e x t ) 是指通过摄像机拍摄下来的图像中本身含有 的文字,如汽车牌照、街道路牌、帐单、t 恤上的字母等,主要应用 于导航、监视、跟踪以及己知物体的文本读取( 如一些商业文件的身 份认证) 等方面。 2 ) 视频图像文字( g r a p h i ct e x t ) 是指附加在视频上的文本图像,如新 闻标题、影片字幕和体育比赛积分等。主要应用于视频的检索,为视 频提供一些重要信息 图像汉字识别问题不同与文本汉字识别的实质是:文本汉字识别是超多 类模式分类,而图像汉字识别问题实质是图像理解问题。图像理解是机器视 觉的别名,是利用计算机来实现人的视觉功能,达到对目标对象的感知、识 别和解释,属于图像处理技术的高层。图像汉字识别是模拟延伸扩展人的视 觉认字识字,进而可对文字内容的合成、重构、分析和理解。图像汉字识别 技术实质是一门图像理解技术,它从某个特定的图像状态出发,寻求一系列 行为动作,并建立一个操作序列,直到求得目标汉字为止。这正成为继模糊 数学、专家系统、神经网络等人工智能研究方法之后的机器学习领域研究热 点。目前,图像汉字识别技术还处在实验室阶段。 图像字符仿人识别旨在抽取“高智商”人类认识汉字的认知心理,构造 “低智商”机器“认知”汉字的识别机制、模型和方法。使机器识别图像汉 字的“智商”提升到能仿人以图像汉字字形查字典认字的能力。研究能有效 提取图像汉字横、竖、撇、捺基本笔划的稳定算法,设计构建既能适合汉字 拆字规律的,又能使机器认知的字元集和字元码。研究能描述图像汉字拓扑 结构的二维分布特征的稳定算法,设计制定既能适合汉字构字规律,又能使 机器认知的取码编码规则。 总体来说,近几年国内对印刷体汉字识别的研究还是相当深入的,也取 得了很大成绩,使系统的识别率不断上升。但是,由于汉字是由古代象形文 字演变而来,由各种线条构成。各种线条的构成都有一定的意义。当前汉字 识别所采用的主要以传统模式识别为依据,采用各种匹配的方式,把汉字当 作普通的图像,未考虑汉字是由各种属性的线条( 笔划) 构成的,这与人的 识别方式大相径庭,也使得当前的汉字识别始终达不到人们所期望的程度。 纵观汉字可见,由于汉字数量结构的多样性和复杂性,使得汉字特征难 以被完全统一的描述;由于汉字形状字体的相似性和变异性,使得汉字字形 难以被完整唯一的区分。汉字自动识别系统始终无法达到或接近人类识别汉 字的准确性、灵活性和容错性。 1 4 论文研究的主要内容 本文在综合了相关文献资料研究成果的基础上,研究人类识字机理与机 器认知模式的有机结合,从人对汉字的识别过程出发,使计算机尽可能模仿 4 人的识别过程。以期尽可能接近人认识汉字的效果。本文作了以下主要工作: 1 )图像字符预处理。研究了灰度图像字符二值化。提出一种非均匀光照 图像字符二值化方法。通过对图像进行小波变换,在最佳尺度上寻找 出图像字符的边缘点,再根据字符边缘点处的灰度值来确定出_ 二值化 的闽值。该算法有效地克服了光照不均噪声对二值化效果的影响,能 很好地保持二值化后的图像字符细节。 2 ) 图像汉字特征提取。提出了基于汉字结构和边缘轮廓的图像汉字笔划 提取算法,该算法通过对图像汉字进行笔划结构的小波边缘轮廓检测, 能完整有效的从图像汉字中分别提取出横竖撇撩四类笔划;对提取的 分类笔划信息进一步提取与汉字拓扑结构相关的笔划关系信息和特征 点信息,为图像汉字的识别提供更多更丰富的信息。 3 ) 图像汉字编码。提出了一种机器认知的十一形码汉字编码识别方法。 该方法在研究多种汉字编码方法特点的基础上,以机器认知为基点, 提取构成汉字的笔划形态、形式、数量的结构与统计多种特征信息, 制定了机器认知的汉字子结构集、字元库和编码方案。并给出了提取 算法和编码方法。 1 5 本文的内容安排 第一章绪论。阐述国内外汉字识别的理论现状及发展,图像汉字识别技 术的研究与发展,本文的主要工作和内容安排: 第二章图像字符二值化方法研究。通过对图像字符二值化特征分析,利 用小波边缘检测出图像字符的边缘点。再根据字符边缘点处的灰度值来确定 出二值化的闽值,并对二值化图像进行了滤波。该算法有效地克服了光照不 均噪声对二值化效果的影响,具有良好效果。 第三章图像汉字特征提取。通过对汉字的特征分析,将图像汉字分解为 横竖撇捺四种基本笔划,通过对图像汉字进行笔划结构的小波边缘轮廓检测, 能完整有效的从图像汉字中分别提取出横竖撇捺四类笔划;对提取的分类笔 划信息进一步提取与汉字拓扑结构相关的笔划关系信息和特征点信息,为图 像汉字的识别提供更多更丰富的信息 第四章图像汉字编码。提取构成汉字的笔划形态、形式、数量的结构与 统计多种特征信息,制定了机器认知的汉字子结构集、字元库和编码方案。 并给出了提取算法和编码方法。 第五章小结与展望。 第二章图像字符二值化方法研究 本章针对图像字符二值化问题,根据图像字符的特征,提出一种基于小 波分析的图像字符二值化方法。通过对图像进行小波变换,在最佳分解尺度 上寻找出图像字符边缘点,根据字符边缘点处的灰度值的均值确定出局部二 值化的闽值。该方法应用于多噪声光照不均的图像中,能很好地保持图像字 符的细节。 2 1 图像字符二值化 实际中得到的图像一般为彩色或灰度图像。为了减少计算量,通常把一 幅多值字符图像转变成只有黑( 字符部分) 、白( 背景部分) 分布的二值图像,也 即二值化处理。设一幅大小为m n 灰度图像f ,f ( x ,y ) 表示其像素点的灰度 值( 1 x m ,l y n ) ,通常根据下列阈值处理公式来进行: m 功= 悟凳等 ( 2 一1 ) 式中:丁为二值化闽值。 ( 1 ) 当采样点( x ,y ) 的灰度值,( t y ) t 时,f ( x ,y ) = 1 ,表示字符部分; ( 2 ) 当采样点( 墨y ) 的灰度值f ( x ,y ) c r 时,f ( x ,y ) = 0 ,表示背景部分。 因此,图像字符的二值化问题可以归结为两类模式( 字符目标与背景) 的分 类问题,即对图像字符,判定其上任意一像素点是属于字符类,还是背景类, 从而最终把图像字符分成字符和背景两大类。 2 2 常用二值化方法 图像二值化经过多年的研究,许多方法被提了出来 1 2 0 1 ,其中大部 分是基于阈值的分割法,因为它不需要先验知识。目前,就处理范围而 言,阈值法可分为: 整体闽值法; 局部阈值法; 动态闽值法。 整体闽值法是指在二值化过程中只使用一个阂值丁的方法。典型的整体 闽值法有平均灰度值法、o s t u 2 4 1 算法等。局部阈值法则是由像素灰度值和像 素周围点局部灰度特性来确定像素阙值的。常用的局部阈值法有k a m e l z h a o 算法1 和b e r n s e n 算法口6 1 等。动态闽值法的阈值选择不仅取决于该像素灰度值 以及它周围像素的灰度值,而且还和该像素的坐标位置有关。整体阈值法优 点在于算法简单,但是由于对整幅图像使用同一闽值进行处理,对输入图像 6 存在量化噪声或在不均光照等情况下的抵抗能力差。局部闽值法相比而言有 较好效果,但也存在缺点和问题,如实现速度慢、刁i 能保证图像的连通性、 以及容易出现伪影( g h o s t ) 现象( 即在背景区域受噪声干扰得到图像结果) 等,但 是具有良好的二值化效果,因此被广泛应用。 23 图像字符二值化特征分析 ( 1 ) 一幅图像中,如汉字、英文字母及数字等字符,具有很强的轮廓性, 即边缘信息十分丰富。根据视觉生理和心理学研究的结果,边缘特征是视觉 系统最能强烈感觉到的少数几个图像特征之一。因此,依据边缘特征进行二 值化处理能有效地突显图像字符信息。 ( 2 ) 在实际的图像中,通常存在着大量随机因素造成全幅图像的不均匀 性,但对于图像的每一行( 或列) 认作是近似均匀一致的,可不失一般性。因 此对每一行( 或列) 进行局部的行列整体阈值的二值化处理能较好地保持图 像字符的细节。 ( 3 ) 依据全幅图像的垂直和水平投影灰度分布偏差,可找出图像是水平或 垂直不均匀性。然后根据每一行( 或列) 图像字符边缘点灰度值的均值来对图 像进行二值化处理,可取得满意的图像字符二值化结果。 人类视觉系统对信息的收集和处理是一个由粗到精的过程( 多层次处理) , 且具有选择性和层次性。为完成某个特定的任务,人眼首先粗略搜寻所获得 的所有信息并初步处理,确定出哪些信息与任务有关,哪些信息与任务无关。 然后,将任务无关的信息舍去,而专注于与任务有关的信息的收集,并对其 进行深一层次的处理,以达到完成任务的目的。 对于光照不均的现象,人类在识别过程中主要是根据图像字符的轮廓或 边缘特征来进行进一步的识别,因此我们以此为出发点进行图像字符的二值 化处理。 2 4 图像光照不均的检测 本文给出了一种灰度图像光照均匀度简便判断方法。 计算灰度图像每行灰度均值心与每列灰度均值,与整幅图像的灰度中 值肛的行偏差呀与列偏差毋的和与吼为: = 啄2 i a 。- - l a i x 2 1 ,m ( 2 2 ) 吧= 唧。l 以一川y = 1 ,n( 2 - 3 ) 当o h 吒时,确定为上下光照不均,以每行作为近似均匀进行二值化处 理: 当口h 吼时,确定为左右光照不均。以每列作为近似均匀进行二值化处 理。 25 图像字符边缘点的小波检测 由上分析可知,在对图像字符处理中,边缘信息代表着图像字符的最基 本特征,因此可以充分地利用上述特征来对图像字符进行二:值化处理,先寻 找出图像字符的边缘点,然后根据这些边缘点的信息( 灰度信息及位置信息) 来对图像字符进行二值化处理。 2 5 1 边缘检测的方法 图像的边缘是由灰度的不连续性反映的,边缘蕴含了丰富的内在信息( 如 方向,阶跃性质,形状等) 是图像识别中重要的图像特征之一,表现在图像函 数上是在某些点上呈现奇异性。一种最常用的边缘检测方法是对过零检测 ( z e r o c r o s s i n 9 1 ,它利用一个连续函数的二阶导数零点( 过零点) 必与原函数的 边缘相联系这一事实来检测。边缘种类可粗分为两种,其一是阶跃边缘,它 两边象素的灰度值有显著的不同。其二是屋顶状边缘,它位于灰度值从增加 到减少的变化转折点( 如下图所示) 。 l , 曲 y c f x0 图2 1 两种边缘点和边缘近旁图像灰度方向导数变化规律 其中:( a ) ( c ) 是阶跃边缘点灰度变化曲线和一、二阶导数,( d ) ( f ) 是屋顶状 边缘点左右灰度变化曲线和一、二阶导数。从图中可以看出,对阶跃状边缘 点p ,其灰度变化曲线的一阶导数在p 点达到极值,而二阶导数在p 点近旁 呈交叉,即边缘点两旁二阶导数取异号。对于屋顶状边缘点q ,其灰度变化 曲线的一阶导数在q 点近旁呈零交叉点,二阶导数在q 点达到极值。 常用的边缘算法总体上可分为两大类:一类是基于微分算子类的图像边 y a o v b o 缘检测方法;另一类是基于边缘拟合算予的检测方法,即先对图像的小区域 进行曲面拟合,再对拟合出的曲面使用如微分算子方法进行边缘检测。最典 型的有r o b e r t s 算子、s o b e l 算子、拉普拉斯算子、m a r r 算子等田儿2 ”。 咀上边缘检测算法中存在以下几方面的缺憾: ( i ) 检测效果不是十分理想,闽值问题是一个重要原因; ( 2 ) 有些算子,如拉普拉斯算子对点的响应比对线和边缘的响应更强烈, 对于这些算子,一旦图像含有噪声,处理的效果更不理想,一般采取的方法 是先平滑再锐化,但在平滑时易丢失高频的图像信息;并且,拉普拉斯算子 有时得到的边缘并非真正的边缘,特别是在图像的灰度变化比较平缓的区域, 因为这时小的噪声干扰就可能使二阶导数产生过零点输出; ( 3 ) 对于几个非线性算子由于涉及方向性,当图像较复杂和细节较丰富时, 也很难完全检测出边缘; ( 4 ) m a r r 、s o b e l 算子进行边缘提取过程中当模板取得较小时,抗噪能力 不明显,当模板取得较大时,抗噪能力有所改善,但计算耗时,且得出的边 缘较粗,因而对边缘的定位也不够准确。 2 5 ,2 小波变换2 1 心i 小波分析是一个新的数学分支,它是泛函分析、傅里叶分析、样条分析、 调和分析、数值分析完美结合的产物。在应用领域中,特别是在信号处理、 语音分析、图像处理、模式识别等领域中,近年来它被认为是在工具及方法 上的重大突破。 小波变换的基本思想是用一簇函数去表示或逼近一个信号,这一簇函数 称为小波函数系。它通过基本小波( 也称母小波) 的不同尺度的平移和伸缩构 成。 小波变换基本定义:设甲( z ) l 2 ( n ) ,若其傅里叶变换驴( 。) 满足允许条件 ( a d m i s s i b l ec o n d i t i o n ) :q :嘞 0 ( 2 4 ) 4 j t 7 l o 其中a 为尺度伸缩参数,b 为平移参数。由于尺度参数8 及平移参数b 是取连续变化的值,因此。( x ) 为连续小波函数。 连续小波变换:对于任意函数,r ( r ) 的连续小波变换为 w f ( a , 6 ) = ( ,g 础) = l a l “2k ,( x ) 甲掣坶 ( 2 5 ) 即信号厂( z ) 关于甲( z ) 的连续小波变换等于,( x ) 与小波匕。( x ) 的内积,式中 r 表示实数域。 离散小波变换:将连续小波变换中尺度参数a 及平移参数b 的离散化公 式分别取作a = a j ,b = k a j b 。,这里j z ,扩展步长1 是固定值。离散小波 函数可写作: w j k ( x ) :口t ( 三兰粤) :a 甲( a i x k b o ) ( 2 6 ) o ; 而离散化小波变换系数则可表示为 c 肿= 巴f ( x ) q j k ( x ) d t = ( 27 ) 注意:我们在此所说的离散化是针对连续的尺度参数a 及平移参数b 的 离散化而不是针对变量x 的离散化。 二进小波变换:尺度a 被离散化但平移参数b i 被离散化,同时尺度沿 着二进序列 2 j 。ez 平移为2 j k ,由此得到的小波: 甲1 k ( j ) = 2 1 “w ( 2 1 x k ) j ,t z ( 2 8 ) 称为二迸小波( d y a d i cw a v e l e t ) ,二进小波必须满足稳定性条件 2 1 。而函 数序列 h ,( 女) ) 。叫做f 的二进小波变换,其中 w j f ( k ) 2 ( m ) ,q 2 j ( z ) ) 2 古! m ) 甲( 2 - j x - k ) a k ( 2 9 ) 二进小波是介于连续小波与离散小波之间的一种半离散小波。它只是对 尺度参数进行了离散化,而对时间域上的平移参量保持连续变化,因此二进 小波不破坏信号在时间域上的平移不变量,这正是它同正交小波基相比所具 有的独特优点。同时二进小波变换是信号的一种超完备的、冗余的表达,因 此对小波函数的要求大大降低。 小波变换的多分辨率分解:在实际应用中信号的可测分辨率是有限的。 我们不可能计算所有的尺度,- m j + m 上的小波变换。我们把变换限定在j = o j 之间,2 0 表示最高分辨率,2 。表示最低分辨率。为建立小波变换的信号多分 辨率分解表示,引入具有低通特性的平滑函数中( x ) ,且其傅里叶变换满足条 件: l 庐( ) 1 2 = 莹iq ;( 2 j t o ) 1 2 ( 2 1 0 ) 定义平滑算子s 2 j ,( x ) = ,+ p 2 j ( x ) ( 2 - 1 1 ) 妒:小) = 2 1 妒( 砉) ( 2 m ) 其中:s z j ,( x ) 表示信号的低通平滑分量,o ) 表示信号的高频细节分 量。此时集合 ( s :,( z ) ) ,( ,( x ) ) _ 0 s 以称为信号,( z ) 的小波变换多分辨率表 1 0 示。这个变换为信号分析提供了一个清晰的分层框架。 2 53 小波边缘检测 小波变换能较好地解决时间和频率分辨率的矛盾。它利用非均匀分布的 分辨率,在低频段用高的频率分辨率和低的时问分辨率,而在高的频率段则 利用低的频率分辨率和高的时间分辨率,即具有“变焦”功能,被称为“数 学显微镜”。因此小波变换是检测突变信号强有力的工具,能很好地刻划突 变点的奇异性,使用小波利用奇异性检测的方法可以区分图像边缘,消除噪 声,较之传统的方法,小波变换检测具有很大的优越性,更可以通过多分辨 率分析来分析信号,以获得最满意的效果。 如果选取平滑函数作为基本小波,那么某一尺度下的小波函数与信号作 用后,信号中的跃变点就成为结果函数中曲率较大的光滑点;如选取平滑函 数的一阶导数作为基本小波,则该点成为结果函数中的极值点;如选其二阶 导数作为基本小波,则该点成为结果函数中的零交叉点。 2 5 4 多尺度边缘检测检测 多尺度边缘检测是在不同的尺度上先平滑原信号,再由平滑后的一阶或二 阶导数检测出原信号的勘变点。 设中( w ) 是二维平滑函数,满足j 中( w ) 出砂0 ,且i _ 中( w j = 0 。定义: i x l ,呻。 掣一( w ) :掣墨旦,q , y ( ) :塑譬盟 则:中。( x ,j ,皿= 0 ,:甲( j ,y ) d y = 0 ,即:掣( x ,) ,、壬,( x ,y ) 可作为基 本小波。 基于边缘检测算子的两类小波可按下式选取,设中:,幻) = 中( 砉,砉) ,并定 义 掣渺) :掣,缈炉1 棚0 2 j 厂( x , y ) 则对于二维图像函数f ( x ,y ) 在尺度2 。下的小波变换有两个分量: 沿x 方向:f ( x ,力。m ,y ) + ( x ,y ) 沿y 方向w 2 y ,m ,y ) 5 m ,y ) + 平 2( 2 - 1 7 ) 则n 。( f ) 在频率中的函数形式由( 2 1 6 ) 、( 2 - 1 7 ) 可得 r 口r 嘶= t 等”= e 半 莩 ( 2 1 8 ) l 亍j 为了构造有紧支集的样条小波,首先要构造平滑函数中( x ) ( 或尺度函数) , 对于b 样条函数来说其平滑函数中( x ) 的f o u r i e r 变换为 钗翻) = s i n ( c o 2 ) ” ( 2 1 9 ) 小波函数v ( x ) 的f o u r i e r 变换为: = f c o s i n ( c 。4 ) ” ( 2 2 0 ) 定义双尺度差分方程: q 力= z & 似2 x 一功,甲= 晶中( 2 x 一功( 2 2 1 ) 其f o u r i e r 变换 = 日呼) 睁,= ) ) ( 2 - 2 2 ) 为了使小波函数平( x ) 具有紧支集,选取m = 3 ,为使中( x ) 关于原点对称, ( x ) 关于原点反对称,移动参数t 选1 2 ,此时( x ) 是一个具有紧支集的二 次样条小波函数,它是平滑函数中( x ) ( 三次样条函数) 的一阶导数,如下图所示。 0 b 一2 一loi : ( 5 ) 一2 1ol2 t b 图2 2 小波函数及平滑函数 小波函数相对应的一组滤波器的传递由式( 2 - 1 8 ) 、( 2 - 1 9 ) 、( 2 - 2 0 ) 可得 g ( t o ) = 4 i e 。尼s i n ( t o 2 ) ,h ( t o ) = e 。7 2c o s ( c o 2 ) 3 r 2 2 3 ) 其中小波变换的数字滤波器h ,g 的有限脉冲响应为下表。 i k- 1012 l h0 1 2 50 3 7 80 3 7 5o 1 2 5 g o- 220 表2 i 小波变换滤波系数 其中:g ,h 分别对应于高通、低通滤波器系数。 3 次b 样条函数产生的小波函数甲( x ) 是具有紧支集的2 次b 样条小波函数 所形成的小波函数具有奇对称性,可有效用于图像汉字边缘检测。 2 5 6 图像字符边缘点检测算法 在对图像进行边缘提取时,用小波变换的小尺度参数的边缘检测算子能 检测出灰度发生的细变化,而大尺度参数的边缘检测算子能够检测出图像发 生的粗变化。 一幅灰度图像为了检测字符边缘信息,对行( 或列) 进行j 层小波变换1 4 4 】, js h j f ( 。,y ) 2 等h k s h j l ,( 。,y + 2 ) 1w h i f f 。,y ) 2 手g i s h j l 厂( 。,y + 2 。) 1一lj 其中:j 为小波变换层数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金融岗专业面试题及答案
- 服务熔断降级策略-洞察及研究
- 新任教师成长汇报
- 脊髓占位切除术教学课件
- 村团支部工作总结
- 极低出生体重护理查房
- 消防安全月线上培训课件
- 2025至2030中国质量空气流量传感器(MAF)行业产业运行态势及投资规划深度研究报告
- 识谱教学法课件
- 护士岗前培训小结
- 大数据治理与服务平台建设及数据服务运营实施技术方案
- 2024年深圳市工程建设领域绿色创新发展专项资金扶持计划(既有建筑节能改造项目)申报指南
- 消防工程验收自评报告
- 教育行业重难点分析及解决措施
- 雷暴哮喘治疗方法
- 行政执法工作培训
- 无人机集群控制技术-深度研究
- 合伙开工厂 合同范例
- 比亚迪秦EV新能源汽车整车控制系统
- 部编版小学道德与法治六年级上册配套表格式教案(全册)
- 商务星球版八年级地理上册4.1《因地制宜发展农业》听课评课记录
评论
0/150
提交评论