(管理科学与工程专业论文)手写数字识别的研究与应用.pdf_第1页
(管理科学与工程专业论文)手写数字识别的研究与应用.pdf_第2页
(管理科学与工程专业论文)手写数字识别的研究与应用.pdf_第3页
(管理科学与工程专业论文)手写数字识别的研究与应用.pdf_第4页
(管理科学与工程专业论文)手写数字识别的研究与应用.pdf_第5页
已阅读5页,还剩63页未读 继续免费阅读

(管理科学与工程专业论文)手写数字识别的研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西安建筑科技大学硕士学位论文 手写数字识别的研究与应用 专业:管理科学与工程 研究生:张捷 指导教师:黄光球教授 摘要 手写字符的识另峋院时冷时热,在过去几十年里,人们提出了许多识别方法和识别技术, 但由于识别的关键技术没有解决,再加上产品定位等方面的原因,使得已有的识别系统远不能 达到实际应用的要求,这其中有理论研究和技术实聊等多方面因素。手写体数字识别是字符识 别的个分支,问题虽痿瀚单,僦】有较大的实用价值。目前我国在信函通信时广泛使用了邮 政编码,用手写饰数字识别技术进行信函的自动分拣对减轻邮电职工的手工分捞j 作有很大意 义。手写数字虽然只有1 0 个种类,但很多情况下,对识别的黻要求非常高,而且,手写数字 的变动性非常大,在这种情况下,要想做到高精度的识别就不是那么容易了。 本论文首先阐述计算机字符识别技术的必要性,论述手写数字识别的意义:接替:寸论了手 写数字识别的预处理技术,包括二值化、行字切分、平滑、去噪声、规范化和细化等。二值化 时对整体阈值二值化、局部阈值二值化、动态阈值二值,比和利用空间信咸折阑值i 是取n 种常 用的阈值选取方溺捌论,特别对利用空间信息进行阈值选取进行了详细论述;在对通过对 基于数学形态学的细化的基础匕,讨论序贯同伦形态细化算法和保形的快速形态细化算法:然 后依据联机字符识别原理框图,分析了手写数字的结构特点,提出了基群割撇自柏e 意手写 数字在线识别技术和基于多级分类器任意手写数字在线识别技术,对其中涉及的笔划识另惝的 噪声处理、笔划间特征量的定义及识别、整字匹配的距离准贝q 进行了详细叙述;继而在对手写 数字的分割的基础下对h 觉机手写数字识另4 i 斩了研究,对基于最小距离分类器字符识别、基于 树分类器的字符识别、基于自适应共振( a r t ) 网络的字符识别分另蜥了详细讨论,并引入 置信度分析将多个分类器进行了混合集成;最后简单阐述了手写数字识别的典型应用,对其在 大规模数据统计、财务、税务、金融及邮件分拣中的应用进行了探索。 本论文对手写数字识别的原理、方法进行了深入的研究,提出的识别技术精度较高,可以 支妊0 实际应用的要求。本论文成果对于信息的自动化、国民经济信息网络的推广具有重要意义, 对于手写汉字识别的研究具有很高的参考价值。 关键词:手写数字识别,二值化,数学形态学,特缸啪取,分类器,置信度分析 论文类型:应用研究 西安建筑科技大学硕士学位论文 r e s e a r c ha n d a p p l i c a t i o n o f h a n d w r i t t e n d i g i tr e c o g n i t i o n m 缸l a 萨删& s c i e m e z l 瞌n g j i e t h e f e c 0 罂曲o i l r e s e a r c ho fh a n d w r i t t e n 吐卸洳s o m e t i m e sc o l da n ds o m e t i m e sk 丸o v e rt h e p a s td o m so fy e a r s , p e o p l ew o p o s ea l o to fr e c o g n i t i o nm e t h o da n dr e c o g n i t i o nt e c h n o l o g y , b 幢 b e c 踟s et h ek e yt h n o l o g yo f r e 0 0 粤1 i 七i o n 懈n o ts o l v e d , i n a d d i t i o n , s 血瑶a s o r 坞o f t h e 硒p e = c t a st h e 详d ( h 吣m a k ear e s e r v a t i o n , w h i c hm a d et h eo 【i s 吨豫c 0 霉1 i 七i o ns y s t e mb eu n a b l et om e e t 吐砖 r e q u i m e n to f w a c t i c a la p p l i c a t i o n t h e m a r ef a c t o r si nm a n y a s l z 吣,s u c h a st l 硷0 m t i c a lr e s e a r c ha n d t e c h n o l o g y , e t c h a n d w r i t t e n d i g i t r e c o g n i t i o n i s o i 嚣h 砌o f d 埘腑i e g 抵t h o u g h i t i s s i m p l e , t h e r ei sg r e a t e rp r a c t i c a lv a l u e a t p r e s e n z i p c o d e so f a i ee x 船i v e l yu s e di nl d m 瞳c o m m u m c a 虹n gi n o u rc o t m t r y a u t o m a t i c a l l ys o r t i n gl e t t e , w 洫h a n d w r i t t e n 喇r e c o g n i t i o nt 鲫h n o l o g yh a v ev e r y h e a v ym o n i n g t ol i g h t e n i n g i x l 6 tw o l k a s m a n u a l s o r d 玛h a n d 嘶t t e n n u m e r a lh a s1 0k i r f l so n l y , b u t i nal o to f s i t u a t i o r 毪r e c o g n i t i o np i 删o n h a v e v e r yh i g he x p e c t a t i o n s , i na d d i t i o n , t h ec h a n g eo f t h e h a n d w r i t t e nm m 确:a li s v e r yl a r g e i nt h i s s 岛i ti sn o ts oe a s ym a b l l g 涨t h a th i g h - a c c u r a c y r e c o g n i t i o n t h i st h e s i se x p l a i n st h en e c e s s i t yo f 妇c h a r a c t e a r e c o g n i t i o n 衄1 m o l o g yo f 吐1 cc o m p u t ha t 丘r 吼 d e s c r i b et h e m i n i n gi n w h i c ht h eh a n d w r i t t e nn 1 1 1 1 1 列d i s c c l m ;p 托由:e 刮n 聆i 吐t e c 2 m o l o g yo f h a n d w r i t t e n n u m a l r e c o g n i t i o n ,i n c l u d i n g t w o v a l u e 、l i n e s c 霉n a a t a t i o n 、w o r d s e g m e n m c m 、s m o o t h 、 r e m o v i n gn o i s i n g 、s b i x a i x i i z a f i o na n d 锄珊i n ga r e 拙:c l l s s 酿t w ov a l mc o n c r e t e l yd i s g u s s e s w h o l et h r e d a o l dv a l m , s o m et h r e s h o l d v a l u e d y n a m i ct h r e s h o l dv a l u ea n d m i l i z es p a c ei n f o r m a t i o nt 0 c a t t y o n t h r e s h o l d , w h i c ha r es e r i a lk i n d so f c o m m o nm e t h o do f 吐d 啦t h r e s h o l d v a l u e , e s p e c i a l l y u t i l i z es p a c ei n f o n n a l i o nt oc a r r yo i ll l 】鹏洲v a l u ei sd e s c r i b ei nd e t a i l ;a d o l m gt ot h ef o u n d a t i o no f t h i n n i n gb a s e d o nm a t h e a d a f i c sm o q 蚰l o g y , q h i n n i n 唱a l 孽幽o f s e r i a l s 涨甜d m m l l i 】呜a l g o r i l h m o f p r o t e c 堍s h a p e r r ed k s e u s s e d 二a n 目、 眺a c c o r d i n gt o p f i n c i p l e sd m g m m o f l 砖o n - l i n ed 柚r a 曲日 r e c o g n i t i o n , b ym 词蛔t h e s m a c t l a _ ef e a t u r eo f t i 砖h a n d w d t t e n m i 痢i ,t l 】担t h e s i sh a sp r o p o s e d t h e o n l i n e r e c o g n i t i o n t e c h n o l o g y o f t h e f r e e h a r x t w r i t t e n n u n 搬a l b a s e d o n t h es t r o k e f e a a a e a n d t h e o n l i l l e r e c o 鲫t i o nt e c h n o l o g yo ft h e 融h a n d w r i l m nn u i i 啪lb a s e do i ll h em u l t i s t a g ed a s :概d e v i c e 西安建筑科技大学硕士学位论文 d e t a i ln m m t e dn o i s er e m o v i n g , s t r o k ec h 印_ a d 鼍蛳cd e f i n i t i o na n dd i s c e m m e n t , d i f f t b n o ec d t e r i o no f w h o l ew o r dm a t c h ;t h e nt m d e rt h ef o u r d a f i o no fh m , t :h m i t t e n n u m e r a l s e 盟m n t a t i o n , o f f - l i n e l - m d w r i t t e nn t m a c r a lr e c o g n i t i o ni sr e s e a r c h e d e s p e c i a l l ym i n i m u md i s t a n c ec l a s s i f y i n gd e v i c e ,t r e e c l a 对睁i n g d g v i c ea n da d a p t i v e 臌n e t w o r k c l a s s i f c n gd e v i c ei sd i s c u s s e d a t t h es a m e t i m e , b e l i e v e sd e l 蓼x :ea n a l y s e s 雠i n t t t x t u c e d 幻i n t e g r m ea l o to f c l a s s i f y i n gd e v i c e s ;a tt h e 翩吐t h e t y p i c a la p p l i c a t i o no ft h eh a n d w r i t t e n 邛_ n 删r e c o g n i t i o nw a sb r i e f l yr 幽 a t e 4 i t s a p p f i e 2 l i o n i n e x t e n s i v e d a t a 删e s , f l i m r c i a l a t n r s , t a x , f i n a n c e a n d m a i ls o r t i n g h a v e b e e n e x p l o r e d t h i st h e s i sa e e p l yr e s e a r c h e di n t ot h ep r i n c i p l ea n dm e t h o do ft m n d w r i t t e nn u 州r e c o g n i t i o n t h e r e c o g n i t i o n 纰1 a n o l o g yp u t t e df o r w a r d i sr e l 址i v e l yh i # i n i x e c i s i o n , c a n m e e tt h e r e q u i r e m e n t o f p r a c t i c a la p p f i e a t i o n t h i s l a i e v t m a e n t o ft h e s i sh a ss i g n i f i c 砸tm e a n i n gt ot h ea u t o m a t i o no f i n f o r m a t i o na n d p o p u l a r i z a t i o n o f n a t i o n a le c o n o m i ci n f o m m t i o nn e t w o 吣m a dh a sv e r yh i g hi c 蠡沁 v a l u e t o t h e r e s e a r c h o f h a r d w r i t t e n c h i n e s e c h a r a c t = r e c o g n i f i o n k e y w o r d s : t h a i s 噼 h a n d w r i t t e n n u m e r a l r e e o g f i t i o n , t w o v a l u e s , 删c s m o r p h o l o g y , f e a t u r e c h o i c e , c h s s i f y i n g d e v i c e b e l i e v e d e g r e e a n a b m s a p p f i c a f i o n s t u d y 声明 本人郑重声明我所呈交的论文是我个人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含本人或其他 人在其它单位已申请学位或为其它用途使用过的成果。与我一同工作的同 志对本研究所做的所有贡献均已在论文中作了明确的说明并表示了致谢。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 论文作者签名: 关于论文使用授权的说明 日期:少,中乎一夕 本人完全了解西安建筑科技大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布 论文的全部或部分内容,可以采用影印、缩印或者其它复制手段保存论文。 ( 保密的论文在论文解密后应遵守此规定) 论文作者签聋驻导师签名鲁哦 注:请将此页附在论文首页。 2 哗牛可 西安建筑科技大学硕士学位论文 1 1 弓i 言 1 绪论 手写数字识别( n d 聃榆胁n l n 啪lr e c o g n i t i o n ) 是光学字符识别技术( o p f i c a lc h a m e t e r r e c o g n i t i o n ,简称o c r ) 的个分支“翊,它研究的对象是:如何利用电子计算机自动辨讨 手 写在纸张e 的阿拉伯数字。在整个o c r 领域中,最为困难的就是脱机手写字符的识别。到目 前为止, 暴管 们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一 定距离。而在手写数字识g 懂阶方向上,经过多年研究,研究工作者已经开始把它向各种实际 应用推广,为手写数据的高速自动输入提供了种解决方案。 计算机字符识别( c o m p u 心c h a r a c t e r r e c o g n i t i o n ) 指用电子计算机自动识别已经或正在写 在纸张等介质e 的字符。计算机字符识别在现实应用驱动下产生。经过数十年发展。逐渐成为 模式识别的个重要分支。然而,随着信息社会到来的步伐加快,字符识别技术的现状不能满 足迫切的现实需求p 胡。 手写数字识别识别技术,涉及至峭到积别和图像处理,人工智能,形式语言和自动机,统 计决策理论,模糊数学,绢合数学,信息论,计算机等学科;也涉及到语言文字学、心理学、 生物学等,是一门综合性的技术”咖。 字符识s 0 技术是佚爵识别技术的一个分支,传统的特征抽取与匹配仍然有着广泛的用途, 新技术又= 不断渗入,使这门综台性技术不断深入和完善。其识别对象自环断扩展,对文字印刷 质量和纸张质量的要求不断降低。版面分析多样化,对文字识别的研究也从原来对单字的识别 方法的研究发屐至埘词和 f j 用语言知识鞋行文字识另u 的研笋蹶段。总体来说,计算初字符识别 技术的水平在不断提高,主要表9 陡文字的正确读入率、读入速度、使用系统的工作稳定性和 柳界面灰囊醑呈度等。 然而,字符识别的问题还嘲i 能说已经解决。蕃酣潞口道,人眼可以灵敏的识别各种畸变或 模糊的字符,这过程是怎样实现的,却至今还是生理和心理学上的个谜。计算机识别的任 务,就是用机器算法的透明映射模拟 类识别过程的非透明映射。并努力达到人认字的正确率 和速度。然而,面对表现为不同的图形的同意义的符号,机器算法常常表现“不如人意”。 根据数据彩e 取方式,字符识别可分为两类,在线( 0 嘣m ) 字符识别和离线( o m 硫) 字符识别。 西安建筑科技大学硕士学位论文 前者黼思是笔在书写板上实时书写时的位置,后者则是由扫描仪等采集设备获取的图像。 离线识别的困难包括字符在图像中的定位及抗噪。显然,生活中以离线方式获取的待识别信息 占大多数。然而,目前情况来说离线识别中只能做到对印刷质量好的文件达到较高的识别率, 印刷质量稍差或纸质不好的印刷品识别难以实用,手写离线识别系统差距更大。 现实生活中,计算朝导箱识别的应用需求却是相当紧迫的。需要计算机自动处理的文字数 量非常大,而目前实b 示利用自动识别的文字量所占的比例非常小。随着识别技术的不断成熟, 计算机皮字识b 0 技术必獭地用于文件资料自动录入,金融税务系统数据统计,图像文本的 压缩储存,自动阅读器,盲 助读器等领域。计算胡字符识别的应用必然会得到较快的发展, 体现在以下几个方面: ( 1 ) 随着信息社会的加速到来,越来越多的数据要输入计算机系统。大量记载着悠久历 史的书籍和现今出版的杂志、报刊、文章、通知等等需要电子化,变成可供查询的数据库内容。 同时,现代化办公的高效率也要求文件处理的电子化和信息的高速汇总处理。我们知道,计算 机处理数据的速度是很快的,而输入却非常缓慢。因此,手工录入已成为系统效率的瓶颈,必 将被高速的自动录入取代。就目前使用情况而言,美国、日本和国内部分城市采用的邮件自动 分拣机,税务机关和车辆登记所采用的自动识别管理系统,虽然不比 认得准,很多模糊的待 识目标被拒识后,再由人工处理,但已被认为经济匕是合适的; ( 2 ) 自动识别技术应用于数据压缩,是传真电报,电子会议以编码的方式传送文字而不是 传送文字点阵,加快速度,降低剐通讯带宽的要求: ( 3 ) 计算机自动识别是智能计算朝接口的组成部分。智能计算机是在更高的程度e ,更完 善的模拟 类部分啮力劳动的全新代计算机。智能计算朝理解文字、图形、景物和语言,视 觉是智能计算柳接受外界信息的重要手段。 总之,信息时代离不开计算朝字符识别技术,自动识别技术必将与信息时代社会同步前进。 字符识另收哩的信息可分为两大类:一类是女等信息,处理的主要是用各国家、各民唉的 文字( 如:汉字,英文等) 书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向 成熟,并推出了很多应用系统;另类是数据信息,主要是由阿拉伯数字及少貅符号组成 的各种编号和绕汁数据,如:自髓编码、统计报表、财务报表、银行票据等等,处理这类信官、 的核心技术是手写数字识别。这,1 【年:来我国开始大力推广的“三金”工程在很大程度匕要依赖 数据信息的输入,如果能通过手写数字识别技术实现信息的自动录 ,无疑会促进这一事业的 进展。因此,手写数字的识8 峋防有着重大的现实意义,一旦研究成功并投 应用,将产生较 大的社会效益和经济效益。 西安建筑科技大学硕士学位论文 论文研究目的有( 1 屠找出种识别手写数字的最佳方法;( 2 ) 对手写数字和英文字母的识别 方法进行研究开发;( 3 研究手写数字的不同特征,找出种能区分不同手写数字的单特征或 复合特征。 手写数字识别作为模式识别领域的个重要问题,也有着重要的理论价值:( 1 5 可拉伯数字 是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各 国,各地区的研究工作者提供了个施展才智的j :舞台。在邀领h 驮家可以擗寸,比较名种 研究方法;( 2 ) 由于数字识别的类别数较小,有助于做深 分析及验证些新的理论。这方面最 明显的例子就是 工神经网络( 砧州) ,相当部分的a n n 模型和算法都以手写数字识别作为 具体的实验平台,验证理论的有效性,评价各种方法的优缺点:( 3 ) 尽管 们对手写数字的识别 已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的 认知能力相比,这仍是个有难度的开放问题( o p e n p r o b l d n ) ;( 4 ) 手写数字的识别方法很容易 推广到其它些相关问题,个直接的应用是对英文这样的拼音文字的识别。事实上,很多学 者就是把数字和英文字母的识别放在块儿研究的。 计算胡帮哼够唱0 的发展溶于字符识别的历史当中,它在很多方面有其特殊性:( 1 ) 实用化前 景的迫切性与可自彦性,我国国民经济信息网络的推广迫在眉睫,全国有大量的数据要输x 计算 机网络,前述的邮件分陈系统与税务统计系统即为典型的数字识别系统。从目前水平看,计算 机离线艾字识别技术离达蛩怜 满意的使用要习之j 融当距离,然而如果能在离线手写数字识 别技术顷i 艏先取得突破,将会打开非常广泛的应用市场;( z 精彩捌率及高识g 越度的要求, 在一实用系统中,高识别率的要求是必然的,若没有高识别率其应用的价值会大大降低。时间 就是金钱,只有有高的识男n 速度,才会占有市场。 数字的类别只有十种,笔划又简单,其识别问题似乎不是很困难。但事实上,些澳0 试结 果表明,数字的正确识别率并不如e 啸0 体汉字识别正确率高,甚至也不如联机手写体汉字识别 率高,而只仅仅优于脱机手写体汉字识别。这其中主要原因是:数字笔划简单,其笔划差舅9 相 对较小,字形相差不大,使得 隹确区分某些数字相当困难;第二,数字虽然只有十种,而且笔 划简单,但同数字写法千差万别,全世界各个国家各个地区的人都闻,其书写上带有明显的 区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。另外,在实 际应用中,对数字识别单字识别正确率的要求要比文字要苛亥儒多。这是因为,数字没有上下 文关系,每个謦字的识别都事关重要,而且数字识别经常涉及的财会、金融领唬其严格性更是 西安建筑科技大学硕士学位论文 不言而喻的。因此,用户的要求不是单纯的高正确率,更重要的是极低的、千分之一甚至万分 之一以下的误识率。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但 速度过 氐的方法是行不通的。因此,研究高性能的手写数字识别算法是个有相当的挑战性的 任务。 作为竹踢0 系统,我1 f 馒缎用巢墅瑚栅其性能的高f 氐,手写数筑只另u 也_ 刚外。 评价的指标除了借用般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。 对个手写数字识别系统,可以用三方面的指标表征系统的性能: 正确识别率a = 正确识别样本数俭部样本数1 0 0 : 替代取误识率ls = 误识样本数佳部样本数+ 1 0 0 ; 拒识率r = 拒识样本数全部样本数+ 1 0 0 ; 三者的关系是:a + s + r = 1 0 0 。 另外,在数字识别的应用中,人们往往很共b 的个指标是“识别精度”,即:在所有识别 的字符中,除去拒识字符,正确识别的比例有多大,因此可以定义:识别精度p = a ( a + s ) * 1 0 0 。 个理想的系统应是r ,s 尽量小,而p ,a 尽可能大。而在个实际系统中,s ,r 是相 互制约的,拒识率r 的提高总伴随着误识率s 的下降,同时正确识别率a 和识别精度p 也就 提高。因此,在评价手写数字识别系统系统时,我们必须综合考虑这n 价指标。另外,由于手 写数字的书写风格、工整程度可以有相当大的差别,因此必须弄清个指标在怎样的样本集合 下获得的。 以上多种因素使得不同系统的性能很难做绝对比较,根据作者从文献中所看到的私自乔嘲: 实践中的体会,可以认为目前手写数字识别研究的较高水平是:对自由书写的数字,在不拒识 时达到9 6 以上的识别率;在拒识率少于1 5 的样本时,误识率能降到0 1 以下。 手写数鞘册l i 在学科e 属予睛试硼蝴人工智自啪挪。在i 拉的四十年中,人f f 想出了 很多办法获取手写字符的关键特征,提出了许多识别力、法和识别技珂i t 1 3 1 。这些手段分谬b k 瀵: 全局分析和结构分析。对前者,我们可以使用模板匹配、象素密度、矩、特征点、数学变换等 技术。i 摸的特征常常和统计分类力秸卜。起使用。对后者,多半需要从字符的轮廓或骨架e 提 取字符形状的基本特征,包括:圈、端点、节点、弧、突起、凹陷、笔画等等。这些结构特征 往往与句法分萎叻谨衢拾使用。 多年的研究实践表明,对于完全没有限制的手写数字,几乎可以肯定:没有种简单的方 西安建筑科技大学硕士学位论文 案能达到很高的识别率和识别精度,因此,最近这方面的努力向着更为成熟、复杂、综合的方 向发展。研究工作者努力把新的知识运用到预处理,特征提取,分类当中。近年来,人工智能 中专家系统方法、人工神经网络方法已应用于手写数字识别0 4 奶1 。在手写数字识别的研究中, 神经网络技术和多种方法的综合是值得重视的方向。 针对模式特征的不同选择及其判别决策方法的不同,可将模式识别方法大致分为5 大类。 这5 种识别方法均可实现手写数字识别识别,但它们特点不同,必须根据条件进行选择。 ( 1 ) 统计模式法 这是以同类模式具有相同属性为基础的识别方法。用来描述事物属性的参量叫做特征,它 可以通过对模式的多个样本的测量值进行统计分析后按定准则来提取。例如:在手写数字识 别系统中,我们可以把每个数字的图形分为若干小方块( 图) ,然后统计每一小方块中的黑像素, 构成个多维特征矢量,作为该数字自孵寺征。必须注意的是:在选择特征时,用于代表各类模 式的特征应该把同类模式的各个样本聚集在起,而使不同类模式的样本尽量分开,以保证识 别系统能具有足够高的识别率。 ( 2 ) 句法结构方法 句法结构方法是以同类模式具有相似结构为基础的识别方法。所谓结构是指组成个模式 的基本单元( 简称基元) 之间的关系。例如,拼音文字的基元是字母,若干个字母按一定规律组 成个单字,在识别某个单字时,如果能判别组成这个字的各个字母阱及它们的( 结构) 关系, 就可以识另i 腿价字。基于这种原理,拼散字的识别系统中的“字典”应包括字母,以及由字 母归成单字的规律。在对某个单字进行识另u 时,则应先提取构脚蕾懈的字母并分析它的 结构,然后将它跟字典中所有已知单字的基元及其结构关系逐个加以比较,就可以确定待识单 字和哪一个已知单字属于同类别。这种识别方法跟英语句子的语法分析相似,因而有时也称之 为“句法识b u 法”。 般分为训i 练过程和识别过程:训练过程就是用己知结构信息的模式作为训练样本,先识 别出基元和它们之间的连接关系,并用数字符号表示它们,然后用构造句子的方法来描述生成 这些场景的过程,并由此推断出生成该场景的一种文法规则;识别过程就是对未知结构的模式 进行基元识目u 及其相互关系分析,然后用训练过程中获得的文法对其作句法分析,如果它自鲁波 已知结构信息的文法分析出来,则该模式具有与该文法相同的结构,否贝嘛e 可判定不是这种结 构。此方蝴q 方便,可从简单的基元开始,由简至繁,能反映横式的结构特征,能描述模式 的性质,对图像畸变的抗干扰能力较强,但当存在干扰及噪声时,抽取基元困难,且易失误。 ( 3 ) 逻辑特征法 就是其特征的选择对类模式识别问题来说是独无二的,即在类问题中只有1 个模式 具有某1 种( 或某1 组合的) 逻辑特征,l h = = 奇法建立了关于知识表示及组织,目标搜索及匹配 的完整体燕对需通过众多规则的推理达到识别目标的问题,有很好的效果,但当样品有欲损, 西安建筑科技大学硕士学位论文 背景不清晰,规则不明确甚至有歧义时,效果不好。 ( 4 ) 模糊模式方法 就是茁睫式识别过程中引入了模糊集的概念,由于隶属度函数作为样品与模扳柑f 以程度的 量度,故能反映整体的、主要的特性,模糊模式有相当程度的抗干扰与畸变,从而允许样品有 相当程度的干扰与畸变,但准确台哩的隶属瘦函势囝雠以建立。目前角萼睹茁;研究,并将其 引入神经网络方法形成模糊神经网络识别系统。 ( 5 ) 神经网络方法 就是使用人工神经网络方法实现模式识别。可处理些环境信息十分复杂,背景知识不清 楚,推理规则不明确的问题,允许样品有较大的缺损、畸变。神经网络方法的缺点是其模型在 不断丰富完善中,目前能识别的陡式羚丕不够多,神经网络方法允许样品有较大的缺损和畸变, 其运行速度快,自适应性能好,具有较高的分辨率。 t 述几种识别方法各有特点。结构法比较直观,能较好反映事物的结构特性:问题是基元 的提取很不容易,各基元的关系也比较复杂,抗干扰性能也较差;统计澌! i 用计算胡来抽取特 征, 随方便,抗干扰性能较好;缺点是没有充分利用模式的结构特性。近多年来把这两种识 别方法结合起来,派生出各种行之有效的结构法与统计法相结合的模式识别算法,取得了很好 的效果。 本课题的研究主要内容有: ( 1 ) 本文首先阐述计朝l 字符识别技术的必要性,论述手写数字识别的意义; ( 2 ) 研究手写识别的预处理技术,包括二值化、行字切分、平滑、去噪声、规范化和细化 等e i 究。二值化时对整体阈值二值、局部阈值二值化、动态阈值二值化手呀0 用空间信息进行阈 值选取月种常用的闽值选取方法进行讨论,特别对利用空间信息进行阈值选取进行了详细论述。 在对i 萄过对基于数学形态学的细化的基础上,讨论序贯同伦形态细化算法和傈形的快速形态细 化算法; ( 3 ) 对联杌手写识别进行了综合研究,主要论述了基于笔划及笔冕i 特征的联机手写数字字 符识别,对其中涉及的笔划识别前的噪声处理、笔划间特征量的定义及识别、整字匹配的距离 准则进行了详细叙述,对基于多级分类器的自由手写数字在线识别问题也进行了讨论; ( 4 ) 综合阐述了手写数字的分割技术。主要通过投影法和气泡法等方法综合说明; ( 5 ) 对基于最小距离分类器字符识别、基于树分类器的字符识别、基于自适应共振( a r t ) 网络的字符识别分另啦 l 行了详细讨论并引入置信度分析把多分类器进行了集成; ( 6 ) 研究了手写数字识别的典型应用,对其在刘辫魈畴统计、财务、税务、擞自附 分拣中的应用进行了探索。 西安建筑科技大学硕士学位论文 z 1 引言 手写数字识别时,首先将印( 写) 在纸上的字符,经光电扫描产生模拟电信号,再通过模 数转换把带灰度值的数字信号输入计算机。纸张厚度、洁白度、光洁度、油墨深浅、印刷或书 写质量都要造成字形畸变,产生污点、飞白、断笔、交连等干扰。输入设备的鉴别率、线形度、 光学畸变、量化过程也要产生噪声。所以,在单个字符识别之前,要对带有随机噪声的字符灰 度值数字信号进行预处理( 孙私o c e s s i i l g ) 。 预处理一般包括二值化、行字切分、平滑、去噪声、规范化和细化等。不同的识别方法, 对预处理的项目和要求有所差另1 1 。如结构识别方法,对字符的规范化预处理可以从简,其至不 要。有的识别方法对细化预处理要求很高,有的则不需要细化等。 预处理是字符识别的重要环,它可以把原始图像转换成识别器所能接受的形式( 二值化) , 消除些与类别无关的因素( 尺寸和位置的归化) 。由于般都在预处理后的图像e 提取特征, 因此如果这个步骤结果不理想,往往会给后面的识别环节带来无法纠正的错误。这里我们处理 的对象是在实际中可能出现的各种风格和书写条件下的手写数字,所以必须在预处理中考虑以 下n 种情况: ( 1 书写的倾斜矫正 人们在手写数字时往往带有不同的倾斜角度,如果不进行倾斜矫正,同字形在不同倾斜 角度下的图像将饰观为不同的模板,势必加大训练负 担,刚氐识别率。为了减弱这个因素的影响,采用了 倾斜矫正,使矫正后字的上端与下端水平位置对齐。 见图2 1 。 ( 2 ) 消除干扰 矫正前 矫正后 图z 1 倾斜矫正的效果 在实际图像中,干扰的存在是不可避免的。比如 在自刚【编码的获取中,信封自身的j 蕾包和定位纠勤阿滑的图像并不只是数字本身。尽管干扰 通常只慰剐、的部分,t 旦剖f 谢归影i 威胁:算剥扔蒯寸翩骖0 定字的外匿鼬框。 一旦归化出现大的偏差,识另口结果非常有可能出错,因此,在预处理中引 干扰消除算法, 在确定字形的外接边框时,做横向和纵向的投影直方图,擅方图上很低的部分作为噪声区域 滤除。图2 2 ( a ) 中显示出这个算法的效果。但这个步骤也可能把属于字形的部分笔划切除掉, 见图2 2 。 西安建筑科技大学硕士学位论文 圈圈测型 原始尺寸直接9 j 化去干扰后效果 ( a ) 希望自q 作用 囵囹 直接归化去干扰后效果 图2 2 去干扰的效果 为了解、决j 晰盾,把识别置信度分析引 预处理中,见图2 3 。 z 2 = 借化 图驺置信度分析的去干扰流程 类别及置信度 把数字灰度图像处理成二值( o ,1 ) 图像的过程,称为对数字图像的二值化( b i n a r i z a f i o n ) 。 对灰度图像二值化能显著的减小数据存储的容量,刚氐后续处理的复杂性。 设扫描、a d 转换后的数字图像点降为: c = ( f ( i ,脚i = 1 ,2 ,p ,i _ l ,2 ,q ( 2 1 ) 龆1 ) 中坪j ) 是像素蛳) 的灰窝直,有白笔画的部分,炳) 大,而黑背景部分,心) 则小。最简 单的二值化通过设定固定灰度值阈值t 完成,即当心,直比预定阕值t 小,看成背景,以“0 , 标志;否则看成数字笔画,以“l ”标志,如式口2 ) 所示。 西安建筑科技大学硕士学位论文 g c l ,= j; ! ;:; i = ,z ,p ,= ,z ,n ( 2 z , 由式q 2 ) ,b = ( g ) ) 即为字符二值化后的图像点阵。 对数字字符图像二值化,要求= 值化后的图像能忠实地再现原数字,基本要求为:( 1 ) 笔画 中不出现空白点;( 2 ) 二值化的笔画基本保持原来文字的结构特征。图像二值化的关键在于阈值 t 的选择,下面就介绍几种常用的阈值选取方法。 2 2 1 整体阈值二值化 仅由像素煎d 的灰度直f ( i 3 ) 确定黜方法j 陈为整体阈值送辫法。阈值t 表示为:t = t f ( i j ) 。常用的几种整体阈值选择方法嗍有: ( 1 ) 人工设定整体阈值。根据实验或 的先验经验,预先给定个固定阈值t ,当埂i j m ( i j ) 为数字笔画上的点,否则为背景下的点。这是种最简单的速度最快的二值化方法。当数字清 晰,轮廓明显,干扰很小时,它是种行之有效的二值化方法。人工设定整体闽值的缺点是: 不能根据每个文字确定它最佳的阚值;确定阈值t 后,光源等外界条件改变时,不能使阈 值随之改变; ( 2 ) 由灰度值直方图确定整体阈值。这是种根据图像和背景的灰度值自动确定整体阐值 法。灰度级直方图给出了幅图像灰强值的栩彭耐苗述。设期范化廖渡值g 的范围为o 球1 , g = o 为最黑,g = l 为最白。m 为灰度级数目,氐酗为第k 级灰度的概率,砜是在图像中出现的 灰度级为k 的次数,n 为图像中象数的总数。贿 p ( g o = 兰0 昏1 ,k = 1 , 2 ,m ( 2 3 ) 由式( 2 3 ) ,可以以幽j 为纵坐标,以段为横坐标作图形,;i ;6 & 塞样的图形为灰度级直方图。 数字图像的直方图般南谚n 峭,叶嘲雏驭啦塑致字笔画音盼,另呻峰值对应背景音5 分。 闽值应取在两个峰值的波谷处,波谷越深陡,二值化效果越好。 2 , 2 2 局部阈值二值化 根据像素的灰度值f ( i ,j 闸像素周围点局部灰度特性确定闽值的方法称为局部阈值选择法。 阈值t 表示为:t - - - - - t f ( i ,j ) ,n ( i ,j ) 】。对于书写质量差,干扰铰严重的数字,采用全局法对它 进行二值化,效果不太理想时,局部阈值选择法有可能得到较为满意的二值化结果,不同的局 部闽值法源于n 0 - j ) 的不同选择。 2 2 3 动态阚值= 值化 当阈值选择不仅取决于该像素阈值以及其周围各像素的灰度值,而目还和该像素坐标位置 西安建筑科技大学硕士学位论文 有关时,称之为动态阈值选择法。阈值t 表示为:t = t f ( i ,j ) ,n ( i ,j ) ,( i ,j ) 】。这种方法可 以女吲嘲瞧甚至单峰直方图图像。对数字图像而言,其笔画和背景的区分是b 匕较明显的,而 且,动态阈值法计算时间长,因此,在数字识别中很少采用。 局部阈值和动态闽值虽然能处理质量较差的数字,避免整体阈值法带来的不应有的失真。 但是,一则时间开销大,二则考虑到实际的局部阈值和动态闽值选择算法往往在图像的某些部 位匕产生整材碰解不会产生的失真,所以,在数字识另i j 中,般采用整体阈值法。 2 2 a 利用空间信息进行阈值选取 有了灰度信息加上空间信息,有可能使分割的效果更可靠。分害0 是个分类的过程,原来 只有灰度信息个特征,觋在再抽取某个含空间信息的特征,则成为有两个特征的分类问题, 可以用二维特征空间中的聚类分析算法来解决问题。这里需要用到二维直方图,它有两个自变 量:灰度值g 和某个空间信臣参量( 例如像素点的梯度值v g ) ,其因变量是像素个数。原来的 维直方图就是二维直方图在灰度轴g 方向上的投影,二维直方图上( i ,j ) 点的值表示灰度值 为i ,v g 两的像素个数。下面介绍三种具体做法。 ( 1 ) 灰度平均灰度法阅 设图像由两个灰度变动平滑的区域组成,两个区域的灰度平均值分别为g l ,9 2 。每个区域 的内点灰度值很按丘g l 或,但边界点的灰度值很可能介于g l ,9 2 之间,遍型维斑皑秣漱始 维直方图的谷点附近,使的峰不凸,谷不凹。但是,如果看二维直方图,其自变量为g ,h , 即取每个像素的空间平均灰度h 作为另个特征,则对于区域内点来说,g 和h 差别小,他们 集中在二维直方图中( g l , h 1 ) 及( 9 2 ,h 2 ) 点的附近,即在对角线上。而边界点的h 般和g 值不同, 边界点离对角线较远。如果只取在二维直方图中对角线附近的那些点向灰度轴g 作投影来重新 构成个新的维直方图,则新的直方图应该比原直方图更加峰谷分明。反之,如果只取远离 对角线上的点( 即边界上的点) ,这些点的灰度平均值也可以用来作为阈值以分割图像。 ( z ) 灰度梯度幅臣掰譬瑚1 本方法的原理和上述灰度一一平均灰度法类似,只不过在二维直方图中选用i v d 作为第二粥自。区域内点因为梯度帔小,者啦于横轴g 附近,而蚜点芭i 可r gi 较大的区域 内,故横糖做小的点构成的直方图应比原直方图有更明显的峰谷,而梯废值大的点的平均灰 度值也是个好的闽值 ( 3 ) 取合理边界的阈值暇法嗍 通常认为,合理的阈值应暇在区域边界e 变化最剧烈的地方。因此,可以把某个阈值t 所产 生的边界两边灰度对比度的大小作为衡量的标准,找出能够检出最大平均边界对比度的阈值来。 对某个阈值t ,先定义由边缘e 的点对的集合e ( t ) ,它包含了图像中所有又满足下列条件的 空间相邻点对。条件为点对中的个点,其灰度值小于或等于t ,而另个点的灰度值大于t , 西安建筑科技大学硕士学位论文 即e ( t ) = ( ( i j m i ) 槭相邻国血 鲥) ,g o ( 蛳i n a ) ( 薛j ) ,g 叫) 。其中( ( i j ) ,” 表示坐标为( i j 汗毗1 ) 的两个相邻的像素构成的点对。再定义由阈值t 检出的总对比发,如式( 2 4 ) 所示。 c ( r ) = ( ( “) ,( 赢e ( f ) m i n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论