




已阅读5页,还剩65页未读, 继续免费阅读
(信号与信息处理专业论文)基于arm7的自适应单字体多字号识别.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工程大学硕士学位论文 i- i_i _ii i i i 宣 摘要 嵌入式系统的存储器空间和寻址能力是有限的,采用计算机汉字字库存 储和识别机理必将限制嵌入式系统的工作性能。因此,研究基于嵌入式系统 的汉字存储与识别改进技术尤为重要。本文在深入探讨目前嵌入式系统的汉 字识别技术基础上,根据汉字字库技术中汉字字形变化的原理,提出了单字 号存储,可多字号识别的设计新思路,实现了基于单一字体的多字号识别技 术,大大节省了嵌入式系统的资源。 小波分析和人工神经网络相结合是字符识别领域的研究方向。目前大多 数学者利用一维小波变换实现了数字识别、西文字母识别、字体识别车牌识 别等,取得了很好的效果,但由于印刷体汉字自身的特点决定了目前以提取 汉字图像一维小波变换的低频分量识别汉字的局限性。二维小波在一维小波 变换的基础上增加了方向性,本文将二维小波应用于印刷体汉字识别过程, 利用脊波变换提取汉字图像横、竖、撇、捺方向的特征向量,并结合b p 人 工神经网络进行汉字识别取得了很好的效果,这在脊波变换的应用以及汉字 识别算法上都是一次创新。同时本文利用神经网络的自学习能力,训练宋体 单一字号,实现了宋体所有字号字的汉字识别,节省了系统资源,实现了与 本文背景设计的行列加权编码技术识别汉字的交接。 关键词:文字识别:脊波变换;b p 人工神经网络;汉字笔画特征;行列加权 值编码 哈尔滨工程大学硕士学位论文 i r = , fi-f_i - - = - = - = i i i 鼍 a b s t r a c t t h es t o r a g es p a c ea n da d d r e s s a b i l i t yo fe m b e d d e ds y s t e mi sv e r yv a l u a b l e i t w o u l db ear e s t r i c t i o nw h e nt h ec h e e s ef o n t ss t o r a g et e c h n o l o g ya n dc h i n e s e c h a r a c t e rr e c o g n i t i o ni nc o m p u t e rs y s t e mw e r eu s e di ne m b e d d e ds y s t e m s oi t w o u l db ev e r yi m p o r t a n tt os t u d y 、析t ht h ec h i n e s ef o n t ss t o r a g et e c h n o l o g ya n d c h i n e s ec h a r a c t e rr e c o g n i t i o nf o re m b e d d e ds y s t e m t h ei m p o r t a n c eo ft h e c h i n e s ef o n ti nt h ec h i n e s ec h a r a c t e rr e c o g r 止z et e c h n o l o g yb a s e do nt h ee m b e d d e d s y s t e mi sd e e p l yd i s c u s s e d t h em e t h o do f c h i n e s ef o n t sd e s i g ni ss u m m a r i z e d b a s e do nt h et h e o r yo ft h ec h i n e s ef o n tm o v e m e n ti nc h i n e s ef o n tt e c h n o l o g y a b o v ea l lan e wm e t h o dt or e c o g n i z ea l lt h ec h i n e s ei no d ef o n tw i t hf e w e r c h i n e s ef o n t si sp r o p o s e d i ti sa g o o dw a yt or e d u c et h ew a s t eo fr e s o u r c ef o rt h e e m b e d d e ds y s t e m n 屺c o m b i n a t i o no fw a v e l e tt r a n s f o n na n da r t i f i c i a ln e u r a ln e t w o r ki saf l e w m e t h o di nt h ec h i n e s ec h a r a c t e rr e c o g n i z ef i e l ds u c ha st h er e c o g n i t i o no f n u m e r a lc h a r a c t e r , l e t t e rc h a r a c t e r , f o n t , v e h i c l ep l a t e ,b u tt h i sm e t h o dh a s l o c a l i z a t i o nb e c a u s eo ft h ec h a r a c t e ro ft h ep r i n t e dc h i n e s ef o n t t h ed i r e c t i o n a l v e c t o ri sa d d e di nt h er i d g e l e tt r a n s f o r mb a s e do nt h en o r m a lw a v e l e tt r a n s f o r m e x t r a c t e dt h es t r o k e sv e c t o ro ft h ec h i n e s ec h a r a c t e r p i c t u r ei nt h ed i r e c t i o no f h e n g 、s h u 、p i e 、n a ,a n dp u tt h e s ev e c t o ri n t ob p n e u r a ln e t w o r kt or e c o g n i z et h e c h i n e s ec h a r a c t e ri nt h ef o n to f “s i m s u n ”t h i si st h ei n n o v a t i o no ft h ea p p l i c a t i o n i nr i d g e l e tt r a n s f o r ma n dt h ea l g o r i t h mo ft h ec h i n e s ec h a r a c t e rr e c o g n i t i o n t h e a r t i f i c i a ln e u r a ln e t w o r kh a st h ea b i l i t yt oa p p r o a c ha r b i t r a r yn o n - l i n e a rf u n c t i o n a n dt h ef e a t u r e so fs e l f - s t u d ya n ds e l f - o r g a n i z a t i o n u s et h el e s sn u m b e ro ft r a i n e d c h i n e s ef o n to f “s i m s u n t or e c o g n i z ea l lt h ec h i n e s ef o n to f “s i m s u n i sa c h i e v e d t h er e s o u r c eo ft h ee m b e d d e ds y s t e mi ss a v e d a n dt h er o wa n dq u e u ew e i g h t e d 哈尔滨工程大学硕士学位论文 i i i 一i i i 薯 e n c o d i n gm e t h o dg a l ln o wb ec o m b i n e dw i t ht or e c o g i l i z ec h i n e s ec h a r a c t e ri nt h e e m b e d d e ds y s t e m e x p e r i m e n ts h o w st h a tt h i sm e t h o dc a nl t c o g n i z et h ec h i n e s e c h a r a c t e re f f e c t i v e l y k e yw o r d s :c h a r a c t e rr e c o g n i t i o n ;r i d g e l e tt r a n s f o r m ;b pn e u r a ln e t w o r k ;c h i n e s e s t r o k e sf e a t u r e ;l o wa n dq u e u ew e i g h t e de n c o d i n g 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指 导下,由作者本人独立完成的。有关观点、方法、数据 和文献的引用已在文中指出。除文中已注明引用的内容 外,本论文不包含任何其他个人或集体已经公开发表的 作品成果。对本文的研究做出重要贡献的个人和集体, 均己在文中以明确方式标明。本人完全意识到本声明的 法律结果由本人承担。 作者( 签字) : 日期:幻谚年3 月j7 日 哈尔滨工程大学硕士学位论文 第l 章绪论 1 1 论文研究的目的及意义 随着计算机技术的高速发展,人们追求高质量生活的各种梦想可能成为 现实,一些便于生活的高新技术电子产品应运而生,它们方便了人们的生活, 提高了生活质量。本论文研究背景是便携式全自动中文阅读机的设计与实现。 人们的日常生活离不开读书看报,如果能用智能阅读机自动朗读出书报中的 内容,不仅可以大大提高人们的工作效率、消除因读书看报所引起的疲劳, 而且还能使枯燥的阅读变得充满乐趣。同时,对于残障人群、老年人及儿童 更是个有力的助手,可以帮助他们获得信息与知识。因此自动阅读机具有 很高的实际应用价值,目前国内市场尚未见到同类产品问世,期刊文献上也 没有见到相关报道。 自动阅读机的技术含量较高,所涉及的研究领域较广,实现的难度较大。 首先为方便使用,自动阅读机必须是便携式的,因此必须用嵌入式系统来实 现。其次,自动阅读机应能够独立自动完成文本图像采集、文本图像处理( 包 括文本图像去噪、文本图像倾斜矫正,文本图像分割) 和文字识别,最后是 语音合成的实现。这些功能基于嵌入式系统来实现具有一定的难度。目前随 着电子技术的高速发展,实现上述功能的自动阅读机已成为可能。 自动阅读机的设计分为文本图像采集模块、中央控制系统模块、文本图 像处理模块、文字识别算法模块和语音合成模块。其中包括软件设计与硬件 设计两大部分。在这些部分中最重要的是创建汉字字库和实现文本图像中汉 字的识别。 目前文本图像的汉字识别技术相当成熟,但是其核心技术被国内的几家 公司所垄断,同时各公司间的汉字库编码技术不尽相同,在不同产品使用过 程中存在兼容性差的缺点,更主要的是,现成的汉字识别技术具有知识产权, 需要购买技术方能使用,这无形增加了设计成本,不利于开发。 哈尔滨工程大学硕士学位论文 经过实验室老师和同学的努力,目前通过自主研发,已经实现了一种基 于行列加权编码的高识别率的汉字识别算法,并应用在嵌入式系统中得到了 很好的效果。但是基于此方式制作的汉字字库编码计算复杂,而且必须对每 一个汉字字模计算行列加权编码,并将此编码列入汉字字库。g b 2 3 1 2 中常 用的一级常用汉字有7 0 0 0 ,常用印刷体汉字有4 种字体,1 3 种字号,如果对 每一个字号,每一个字体制做相应的行列加权汉字字库,不仅工作量极大, 而且在识别匹配的过程中效率也很低,对于目前所使用的基于a r m 7 的嵌入 式硬件操作平台更是沉重的计算负担,事实证明要实现对不同字体和字号的 汉字有效识别必须通过查找不同字体不同字号的汉字对小五号宋体字的共性 特征,通过特征提取来实现字库扩展。 因此本课题的目的是研究一种新的对现有字库扩展方法,可以实现基于 单一字体的多字号识别。利用自适应的方法,将其它字号的宋体汉字识别为 小五号宋体汉字,小五号宋体汉字可以利用已知的行列加权编码的识别方法 实现,用尽量少的已知字号宋体汉字字库实现识别其他所有字号的宋体汉字 是本课题的中心思想。 1 2 国内外研究现状概述 文字识别很早就是人类的梦想,早在1 9 2 9 年,t a u s h c k 就在德国获得了 一项有关o c r ( o p t i c a lc h a r a c t e rr e c o g n i t i o n ) 的专利【l j 。欧美国家为了将浩如 烟海、与日俱增的报刊杂志、文件资料和数据报表等文字材料输入计算机进 行信息处理,从5 0 年代开始了西文o c r 技术的研究,以便代替人工键盘输 入。汉字的识别最早可以追溯到6 0 年代,1 9 6 6 年,m m 公司的c a s e y 和n a g y 利用简单的模板匹配法识别了1 0 0 0 个印刷体汉字 2 1 。7 0 年代以来,日本学者 做了许多工作,其中有代表性的系统有1 9 7 7 年东芝综合研究所研制的可以识 别2 0 0 0 汉字的单体印刷汉字识别系统口l ;8 0 年代初期,日本武藏野电气研究 所研制的可以识别2 3 0 0 多个汉字的印刷体汉字识别系统,代表了当时汉字识 别的最高水平嗍。此外,日本的太平洋、松下、理光和富士等公司也有其研 2 哈尔溟工程大学硕士学位论文 i i i i i i i 。 i iii i l li_ i i 葺 制的汉字识别系统。这些系统在方法上,大都采用基于k - l 数字变换的匹配 方案,使用了大量专用硬件,其设备有的相当于小型机甚至大型机,价格极 其昂贵,没有得到广泛应用。 我国对汉字识别的研究工作大致可以分为三大阶段: 第一阶段从7 0 年代末期到8 0 年代末期。这一阶段主要研究的是汉字识 别的算法和方案,研究人员提出了用于汉字识别的各种方法和特征,如特征 点方法、汉字周边特征、汉字的结构元特征等,并在此基础上研究成功一批 汉字识别系统,其中比较突出的有清华大学电子工程系研制成功的清华多字 体印刷汉字识别系统,沈阳自动化所研制的沈阳印刷汉字识别系统和北京信 息工程学院研制成功的北信单体印刷汉字识别系统。这一阶段是印刷体汉字 识别成果倍出的时期。但是,这些成果还仅仅处于实验室阶段,没有转化为 产品来实际解决印刷汉字的自动输入问题。 第二阶段是从九十年代初期开始,汉字o c r 技术进入了一个重要、蓬 勃发展的时期即将实验室的研究成果推向市场,推向实用,在实际的汉字识 别输入应用条件下,检验和考查这些研究成果。而一个汉字识别系统能否通 过这一严峻的考验,并进一步发展,取决于两个重要因素: 1 识别方案本身是否具有足够的抗干扰能力,以适应实际应用环境中各 种干扰噪声的影响,保持较高的识别正确率,满足实际应用的要求。 2 识别系统是否可以根据用户的要求、市场的需要,不断及时地改进系 统的性能指标和使用环境,从而在激烈的市场竞争中取得一席之地。 印刷体汉字识别系统的研究还要解决好实用汉字识别系统所必须解决的 一些问题,如版面的自动分析、行字切分、人机界面和良好的应用环境等等。 这一阶段,形成了一些初步实用的印刷体汉字识别系统开始进入市场。典型 的系统有:清华大学电子工程系设计的清华o c r o ,“s 扣1 及记号 1 妙,:口一i 少( 竺羔兰) ,其中参数组y = ( 口,“,6 ) 中,口表示脊波的尺度:”和6 分 1 6 哈尔溟工程大学颂士学位论文 别对应脊波的方向和位置,s 扣1 是d 维空间中的单位球面,参数空间i 上的 测度乒d y 定义 2 4 l 为: p d y 2 万d a 吼d z f d 6 ( 3 - 1 ) 其中o - a 是s 扣1 的表面积,d u 表示s 扣1 上的一致概率测度。 与前述章节一样,用厂表示函数厂的连续f o u r i e r 变换: 厂a ( ) = 陟o ) e m d t 。为了表述的方便,这里均考虑f l 粥t x r d ,d 2 的 情况,并假设1 | f ,:r 专r 是s c h w a r t z 空间s ( r ) 中的函数。 定义3 1 若函数杪:r 。_ r 满足 胁) 1 2 巧5 唯卜细 ( 3 2 ) 则称沙是d 维空间中的容许神经激活函数【2 5 拍r ) z ( a d m i s s i b l en e u r a l a c t i v a t i o nf u c t i o n ) 。由满足容许条件( 3 - 2 ) 的函数少生成的脊函数 矿,:口1 少( 鼍就称为脊波( m d g e l e t ) 。 对y s ( r ) 而言,容许条件( 3 - 2 ) 就等价于消失矩条件 p y ( x ) 出= o ,七= o ,l , 下d + l 卜1 ( 3 - 3 ) 这与小波函数( 也即容许小波) 的消失矩形之很类似,与小波不同的是, ( 3 3 ) 式表明这里消失矩的阶数随空间维数d 的增加而增长。 若g ( x ) 是“s 型”函数,如g ( x ) = l ,- ,哪么g ( x ) 本身不满足( 3 2 ) 式; l + e 但是当坍【罢】+ 1 时,其m 阶导函数g ( * ( x ) 则满足( 3 2 ) 式。也就是说,对神 经网络理论中的某些函数来说,只要取其阶数足够高的导函数就可以成为容 许函数。 根据定义可以知道,脊函数的支撑集是带状区域: x r dl i 群x - bl 0 ,定义l = 7 = ( 口,”,b ) is as 1 s ,“s d 一,b r cf , 则w f ( r d ) ,记 口, = ( ,杪,) ) ,盯,有口,1 l ( ,) ef ( r ,( 办) ) 。 性质3 表明,对v f ( r d ) ,正= 巳l ( 渺,( 咖) 均有意义。这样 ( 3 4 ) 式适用的范围就拓展了,可以令s 一0 ,使得正一f ,通过厂来考察。 更准确的有以下定理: 定理3 3 设厂三l ( r d ) 厂、r 似d ) ,沙满足容许条件( 3 1 ) ,那么 ( 1 ) 丘r ( r d ) ; ( 2 ) 当占寸0 时,f i 厂- :a :一0 1 9 、啥尔须工程大学石贞士学位论文 我们已经知道任何厂0 ( r 4 ) nl 2 ( r 4 ) 均可用脊波函数序列的连续加权 叠加来表示: 厂= q ( 俐1 掣) 丢妙单窘乃枷 与小波类似的,可以对尺度参数口作二进离散,从而得到( 3 8 ) 式的半连 续表示。 首先选定少使之满足 胁嘲j 2 莩蕾才引 仔叻 ( 3 9 ) 式也就是容许条件( 3 1 ) 离散化后再归一化的表达式。特别的,若;满 足y ( 2 7 c o ) = 1 ,那么满足( 3 9 ) i 戈。与定理3 1 以及性质3 类似的,根据( 3 9 ) 式, f o c - 2 7 如1 ( 厂( 工) ,2 y ( 2 。 x 一6 ) ) ) 2 妙( 2 ,( u x - - b ) ) d u d b 在点收敛的意义下对任意厂s ( 足d ) 成立,且对更一般的 f f ( 犬d ) 厂、r ( 月d ) 也成立。 若选定函数伊使得p ( 缈) f 2 = 丢2 朋i p ( 2 一,国) | 2 ,那么v 缈r 有 l 方c 彩,1 2 + 丢2 ( d 。”l 多c 2 彩,1 2 = f 国f d 1 ( 3 - 1 0 , 由( 3 - t o ) 式知p ) 1 2sh 扛i ,也即9 在原点附近快速下降,换句话说,9 有消失矩性质。事实上,伊使“近似”容许神经激活函数。对于上述函数对 ( 驴,沙) ,下式成立 f o c 2 。如1 只厂( 曲,2 杪( 2 。( “z 一6 ) ) ) 2 7 缈( 2 o x b ) ) d u d b + j ( 厂( 力,j f ,( “z 一6 ) 矽x - b ) d u d b 3 1 2 离散脊波变换 在小波框架的介绍中已经知道,若h 表示h i l b e r t 空间且 织 是一个框架, 那么任意厂日都可以用系数序列 ,) ) 。来完全表示。 为了表述的方便,这里记阼= 口z y ( 口x - - 6 ) ) ,下面考虑如何将参数空 间r 离散化为l ,使得在框架l 上总有 4 s l l :, , 。,萋防) 一_ b 旷帅2 , ,e l d 。 其中d 是足d 中的某个紧集。 记r ( 似厂) = ( 厂,) ,则 r ( 门( y ) - ( r 。厂,虬 ) 其中6 ( 力= 口 2 少( 口0 6 ) ) 。这样脊波变换的系数也就使r 。f 得一维小 波变换的系数,r ( 力( y ) 可以进一步表示为 r ( 门( 力= 去( r _ z j = 尝旷( 伽) 多( 缈口) 产如 ( 3 1 1 ) ( 3 1 1 ) 式表明对函数f 的脊波变换也就是首先对口o 用p 蚰调制,再沿 直线 x 甜= f :工r 积分的结果。如果对参数口和f 作二进离散,就得到频域 空间的动态多级分解,二维情形( d = 2 ) 的频域多尺度分解结构如图3 1 所示。 若沙c ( r ) 且满足 蜥i n i 锄f 肛驴 i7弦叫-(d-1)da0 o 1 2 l 嗣纠a o ii p ( ) 即刮可+ i 国1 ) ,舻t d - 1 p 2 + 口 则称l f ,是可框架化的【2 9 弼。 2 l 哈尔滨t 程大学硕士学位论文 j ,一 , 二:会,以 。, 丫鬈 。一。卜 、 、一, 图3 1二维离散脊波燹换对频域平豳的二进动态分解图 对于可框架化函数沙,可以证明以下结论: 存在b o 0 ,使得v 6 0 0 ( 与沙,口o ,b o 和d 有关) , v f 三( q ) ( q 是尺d 众的单位立方体) , 彳l l 厂髭k 厂,炸) | 2 矧1 卅臣 ,e i j 上述结论就是一个框架存在性定理。 考虑到工程中最常见的是二维情形,下面只考虑d = 2 ,a 。= 2 。更一般的 d 维空间脊波分析方法只要沿用前述模型就可以很方便得到。 设杪满足容许条件( 3 1 ) 且可框架化,由吵生成的脊波函数可以写为 少印:口一;y ( 竺塑掣) 有3 个参数:尺度玎,角度p 和表示位置的6 ;其支撑集是沿着一 哈尔滨工程大学硕士学位论文 条称为脊线的直线附近的带状区域: ( x ,y ) :卜c o s 臼+ y s i l l p l 6s 口 。脊波沿 垂直脊线方向的截面就是通常的一维小波。对于任何平方可积函数厂,其脊 波变换系数为: r ,( 口,0 ,6 ) = ( 厂,y 嘶) = j ( 石) 沙啪6 ( x ) 出 其中y 表示的复共轭。并且有完全重构公式 厂= ,:8i = i o r ,( 口,目,6 ) 缈。一声( x 乙d a ,d b4 d 万o - 分别对三个参数离散化得到: y ,( x ) = 2 i 2y ( 2 。( x lc o so :,+ x 2s i lo , ,) 一七) ,j ,e j ( 3 - 1 2 ) ( 3 1 2 ) 式是r 的一个框架,根据框架的定义,v fer ,弘,b o ,s j , 训秘班枷) 一删: 从而厂总可以用脊波变换系数集 ( 厂,肚) ) ,七加完全重构。此外,根据 对偶框架理论,总存在 ,j ) ,j ,。:的对偶缈 ) j 地使得 ,= 磊 痧小= 荟 厂以) j 脊波与小波最大的差异在于脊波具有方向性,也就是说,在尺度和位置 参数之外引入了表征方向的角度参数0 。通常对0 按以下方式离散化: e | j = 2 2 0 0 1 2 j 角度离散化的采样步长和尺度成反比。尺度和角度的共同离散化将二维 平面分解成如图3 2 所示的多级结构。径向第个圆环对应尺度2 j 口 f 2 = e k f 2 ,e 七= t k - a 2 t 同理可得 抛一刁嚣叫嚣甏吲气- a 2 k 胁哦 ( 2 ) 隐含层权值变化 对从第_ ,个输入到第i 个输出的权值,有 m 广刁盖一刁盖警嚣 = ,7 ( - a 2 t ) f 2 w 2 矗厂1 7 p ,= 1 7 毛p 其中 同理可得 m a l 。= 7 7 屯( 3 2 4 ) 为y i j i i 练一个b p 网络,需要计算网络加权输入矢量以及网络输出和误 3 2 u 刁 蚴 劲 卜 - p p p 打 2w 材 艿 蛇柚 = q r , 岛 = p 艿 哈尔滨工程大学硕士学位论文 _ - - - , , ;n i l u_ f i i i 萱 差矢量,然后求得误差平方和。当训练矢量的误差平方和小于误差目标时, 训练停止,否则在输出层计算误差变化,且采用反向传播学习规则来调整权 值和阈值,并重复此过程。当网络完成训练后,对网络输入一个不是训练集 合中的矢量,网络将以泛化方式给出输出结果。 b p 算法可以使权值和阈值得到一个稳定解,但存在一些缺点,如易陷于 局部极小值,学习过程易发生震荡等。为克服不足,目前不少学者提出了一 些改进的方法。包括动量b p 算法,学习速率可变b p 算法,弹性b p 算法, 变梯度算法,拟牛顿算法和l m 算法。详细的介绍可参考文献 4 1 4 8 。 对于一个给定的问题,采用哪种训练方法是最快捷的取决于很多因素, 包括问题的复杂程度以及所研究问题的性质、训练样本的多少、网络的结构、 权值和阈值的数目、误差目标、参数取值等。比如对于函数逼近、非线性回 归问题采用l m 算法比较合适,而对于模式识别问题选用变梯度算法较好。 实际应用中一般要根据具体问题,经实验比较选用较为合适的一种方法。 3 6 本章小结 脊波变换是通过对小波基函数添加一个表征方向的参数得到的,它不但 和小波一样有局部时频分析的能力,而且还具有很强的方向选择和辨识能力, 可以非常有效的表示信号中具有方向性的奇异特征。主要介绍了连续脊波变 换、离散脊波变换,框架化等相关知识,最后介绍了与脊波变换密切相关的 r a d o n 变换。 神经网络是一种高度并行的信息处理系统,具有高度的容错能力、自组 织能力和自学习能力。其崭新的思路及优良的特性引起了人们极大的研究开 发兴趣。本章介绍人工神经网络的相关基础理论,从神经网络的特点和用途 入手,进而介绍了它的基本模型、结构及学习方式最后详细介绍了b p 网络 的基本模型和b p 学习算法。 3 3 哈尔溟_ 程大学硕士学位论文 i i r l_i i i 第4 章基于脊波变换的汉字笔画特征提取算法 本章将重点介绍基于脊波变换的汉字识别方法。利用脊波变换提取汉字 图像在水平,竖直,对角线的直线特征,选用b p 神经网络作为分类器,对 有限字号的宋体汉字进行训练,随机抽取g b 2 3 1 2 任意字号的汉字测试取得 了令人满意的效果。实验结果表明,在数字图像处理的实际应用中脊波变换 不仅可以应用在图像去噪,边缘检测等方面,而且可以作为字符图像特征提 取的一种全新算法,实现汉字图像的高性能识别。这在脊波变换的应用以及 汉字识别算法上都是一次创新。 本文的主要目的是利用自适应的方法,将其它字号的宋体汉字识别为小 五号宋体汉字,小五号宋体汉字可以利用已知的行列加权编码的识别方法实 现,所以用尽量少的已知字号汉字字库实现识别其他所有字号的汉字是本课 题的中心思想。要实现此目的本文提出了基于脊波变换的汉字笔画特征提取 算法和b p 人工神经网络分类器相结合的方法。首先判别上述步骤得到的单 个宋体汉字图像的字号,己知此汉字的大小后,对图像进行预处理,将图像 规则化为6 4 6 4 ,接下来利用基于脊波变换的汉字笔画特征提取算法和b p 人工神经网络分类器相结合的方法将其它字号的宋体汉字识别为小五号宋体 汉字,做到单字体多字号识别。 4 1 单字体多字号识别设计思路 基于脊波变换的汉字图像笔画特征提取和人工神经网络进行特征识别的 框图如图4 1 所示。 l 黼号h 嬲h 瓣徽h n p g l 图4 1 基于笔画特征和人工神经网络的宋体汉字识别原理框图 哈尔溟工程大学硕士学位论文 4 1 1 宋体汉字字号判别 要识别汉字中的图像,首先要判断这个宋体字的字号大小。图像中的汉 字也是由像素组成的点阵,点阵中每个点只有一种状态,有笔画或无笔画。 用二进制数字来表示点阵,即1 表示有笔画,也就是字符的笔画经过此位, 对应于此位的象素应置为字符颜色:0 表示无笔画,也就表示字符的笔画不 经过此位,对应于此位的象素应置为背景颜色或不改变。利用这个特性,对 汉字图像首先进行行扫描,从上到下扫描,计算扫描到的第一个黑像素和最 后一个黑像素的垂直距离,为此汉字的高。然后进行列扫描,从左到右扫描, 计算扫描到的第一个黑像素点和最后一个黑像素点的垂直距离,为此汉字的 宽。通过计算可以得到该汉字的大小。 在仿真的计算机中,字号的大小是以磅来计算的,计算机可以输出从 5 p t 到7 2 p t 大小的字符。本文的字号为印刷用字号。如小五号,小四号等。 从磅6 p t ) ) u 像素( p x ) 的换算公式如下:常用计算机分辨率为9 6 d p i ( p xp e r 硫h ) ,l p t = 1 7 2i n c h ,以小五号印刷体汉字为例,小五号为9 p t ,对应的像 素值为: 1 9 ( p t ) x 去( i n c h p t ) x 9 6 ( p x i n c h ) = 1 2 p x ,二 印刷用汉字字号表如表2 1 所示。 4 1 2 图像预处理 由于样本图像的字体、字号不同,在图片中的位置也不同,所以必须对 其进行预处理,使各个图像在进行特征提取前具有相同的形式。这样输入神 经网络的特征向量也才能具有统一的形式。 预处理的基本方法是:( 1 ) 规则化:截取汉字字符图像像素为o ( 黑) 的最 大矩形区域,将此区域的图像经过缩放变换,使之变成6 4 x 6 4 的图像。( 2 ) 二值化:将汉字字符图像二值化以便进行后续处理。( 3 ) 反色处理:将规则化 的二值图象进行反色处理,即使汉字字符用1 ( 白) 表示,其它部分用0 ( 黑) 哈尔滨工程大学硕士学位论文 表示。如图4 2 所示为小五号宋体字,图4 3 所示为归一化为6 4 x 6 4 后的形 式。 i _i - 、 o o l 汉字中还存在大量的形近字,比如王和玉,国和匡等。因此,在借鉴国外优 秀的字符识别以及数字识别的方法的时候,就存在较多的局限性。 统计模式识别方法的基本思想是将特征提取阶段得到的特征向量定义在 一个特征空间中,这个空间包含了所有的特征向量,不同的特征向量,或者 说不同类别的对象都对应于空间中的一点。在分类阶段,则利用统计决策的 原理对特征空间进行划分,从而达到识别不同特征的对象的目的。统计模式 识别中应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。 特征提取与选择是模式识别中的关键技术之一,其目的就是找出一组对 识别最有效的特征。提取特征的目的是为了识别目标,一般来说,为了达到 较高的识别率和识别可靠性,总是尽可能多地提取特征,以利于找出最有效 的特征。但这并不意味着特征选得越多越好,特征参数的数目与识别率并不 成正比。特征选得过少,固然难以达到准确识别的目的,但选得过多,同样 可能会使识别效果降低,特征选择就是以某种分类判决规则为准则,从所提 取的特征中选出对分类贡献较大的特征,删除贡献甚微的特征,经过特征选 择,特征空间维数也被进一步压缩了。特征提取是否充分,特征选择是否合 理,直接影响着模糊模式识别系统识别率的高低及其系统的适时性和可靠性。 汉字是一种方块字,从整体的结构看无法得到每一个汉字的独立特征, 通过阅读大量文献,笔者认为最能体现汉字特征的元素应该是笔画。汉字的 笔画为以下几种:横、竖、撇、捺、点、折、钩,通过上面讲到的预处理过 程,不仅是将汉字做到了归一化和二值化,通过观察和实验得知,汉字图像 在进行过预处理以后,汉字笔画像素点的排列都可以用横、竖、撇、捺,四 种模版来体现。以下为设计的横、竖、撇、捺,四种笔画的模板。其中的撇 模板和捺模板分别有两种形式。 横 笔画模版:“竖”笔画模版: 厂o o o r o lo 三jl 吕1 1 :l 3 7 主兰享 壹三1 三 ;三妻 三三壹 按着如下四个方向选取的:横( 三) 、竖( o ) 、撇( 坚) 、捺( 三) 。 244 符图像进行脊波的变换,对每一s s ,在矽0 时可求出d 矽,( s ,y ,e ) zez , 得到特征集合町( 5 ,y ,岛) ,d 哆( j ,7 ,岛) ,d ( j ,乃幺) ) 。这些特征充分反 3 8 哈尔溟工程大学硕士学位论文 d ( s ,b ) ,d ( j ,厂,岛) ,d ( s ,儿幺) ) 中选取低频系数作为图像的特 征,得到图像在一个尺度四个方向脊波低频特征集合 么岛,如4 & ) 作为汉字 字符识别的特征。 4 。1 4b p 网络设计 b p 网络的设计主要包括输入层、隐含层、输出层及各层的激活函数选择 等几个方面。 1 网络层数 b p 网络可以包含不同的隐含层,但理论上已经证明,在不限制隐含层节 点数的情况下,单隐含层的b p 网络可以实现任意非线性映射。本文采用单 隐含层的b p 网络。 2 输入层的节点数 输入层接受外部的输入数据,因此其节点数取决于输入矢量的维数。在 本文中,输入层节点数应由汉字图像进行脊波变换后提取出的低频特征组成 的特征向量的维数决定。 3 输出层的节点数 输出层的节点数取决于两个方面:输出数据类型和表示该类型所需数据 的大小。当b p 网络用于模式分类时,以二进制形式来表示不同模式的输出 结果,则输出层的节点数可根据待分类模式数来确定。 4 隐含层的节点数 如何选择隐含层的节点数是一个十分复杂的问题,往往要根据经验和多 次实验来确定,对于模式识别分类的b p 网络,根据前人的经验,可以参照 以下公式进行设计: ,l = 而+ 口( 4 。1 ) 式中:靠为隐含层的节点数:为输入层的节点数;为输出层的节点数;口 为1 1 0 之间的整数。 5 。激活函数 3 9 哈尔溟工程大学硕士学位论文 b p 网络的传输函数常采用s 型激活函数。本文采用对数s 型激活函数 l o g s i g 作为隐含层和输出层的激活函数,对数s 型激活函数的输入作用范围 为 - 4 ,4 】比双曲正切s 型激活函数的输入作用范围为【2 ,2 】要大。而且其输出 为【0 ,1 ,满足输出要求。 6 初始值和归一化 初始权值在输入累加时使每个神经元的状态值接近于零,权值一般取随 机数,要比较小。输入样本要进行归一化处理,使那些比较大的输入仍落在 激活函数变化大的地方。 7 训练函数选择 对于给定问题,采用哪种训练函数,其训练速度快是很难预料的,需要 根据实验来确定。 4 t 2 方案实现 4 2 1 预处理 预处理部分通过调用编写的m 函数文件p r e p c e s s i n g m 实现。对输入汉 字字符图像调用p r e p r o c e s s m g 函数可以实现其二值化、规则化和反白处理。 图4 4 至图4 8 给出了宋体汉字字号为小五号、四号、三号、二号,一号预 处理前后的图像,经过预处理环节的汉字字符图像成为规范化的二值点阵信 息。 皑 图4 4 预处理前后的宋体小五号。皑。图 柏 皑 图45 预处理前后的宋 皑 图46 预处理前后的宋 岂 图47 顶处理前后的宋体二号“皑”图像 岂 图4 8 预处理前后的宋体一号。皑”图像 从图中可以很清楚的看出在同种字体宋体,不同字号的情况下,组 成汉字的像素分布存在很大的差异,这种差异直接导致了预处理后的图像也 存在较大的差异性,这也就说明了希望通过将汉字“缩放”实现大字号缩小, 小字号变大的想法是不能成立的。 在以往的文献中有部分学者认为,在相同字体不同字号的情况下,字号 的变化汉字的缩放,是对组成汉字像素的插值和抽取,如果能从中找到规律, 得到字号变倍的自适应表达式,就可以实现汉字字号的i 3 适应缩放。如本课 题如果能找到宋体汉字不同字号的像素点插值和抽取规律,得到自适应变换 方法就可以实现。通过笔者对汉字字形技术的研究发现,对汉字像素的抽取 和插值确实是实现字号变化的方法,但是汉字本身的结构复杂,在低分辨率, 小字号输出的情况下,像桑的捧列是不可能完全符合汉字的结构的,为了能 有效体现每一个汉字的特征,只有抽取一部分像素,所以汉字的小字号字模 是专门的技术人员测试制作的,是无规律可言的。如果简单的通过线性缩放 对像素的抽取则是随机的,抽取之后的效果很可能已经无法辨识此汉字。同 样在汉字放大的情况下,插值也是无规律可言的,线性放大也会造成汉字的 严重失真。 针对本课题,只有利用一种有效的特征提取方法找到宋体其他字号和已 知小五号宋体字的联系,将其他字号的宋体汉字识别为小五号宋体汉字。 哈尔滨工程大学硕士学位论文 i i i i _ ii 一- i a a m 一- i i i i i i 置 4 2 2 基于脊波变换的汉字笔画特征提取 基于脊波变换的汉字笔画特征提取部分通过调用编写的m 函数文件 c p i c k u p m 来实现。 通过方案设计中提到的对汉字字符图像的横、竖、撇、捺,作四个方向 的脊波变换,四个方向为矽= 三,0 = o ,口= 百3 7 ,口= i 7 ,实现脊波变换是首先沿 不同方向上作r a d o n 变换,然后再作一维小波变换。投影变换的方向即为笔 画特征提取方向。 接下来对图像四个方向的投影值进行一维小波变换并提取低频系数。由 于h a a r 小波具有紧支性、对称性和正则性零点,非常适合于信号特征抽取【2 0 l , 所以小波函数选择h a a r 小波函数。m a t l a b 一维小波函数采用m a l l a t 算法, 则投影值将作为小波分解的初始数据:而对于小波分解层数的问题,经实践, 选择进行一层分解。对每一方向的投影值进行一层一维小波分解并提取低频 系数得到四个低频系数列向量a 0 1 ,a 4 5 1 ,a 9 0 1 ,a 1 3 5 l ,每个向量的大小 为4 8 x1 ,为了方便输入神经网络,把四个低频系数列向量组成一个特征向量 a ,则a 为一个1 9 2 x1 的列向量。a 即为提取出的经一层小波分解的方向小 波低频特征向量,也就是神经网络的输入向量。对经过预处理的图像调用 c p i c k u p m 函数文件进行处理,可以得到对应的列向量a 。 4 2 3b p 网络识别 1 输入向量集和目标向量集的形成 b p 网络的训练采用有教师学习方式,这种学习方式“教师 需给出与输 入向量p 相对应的“正确输出答案 ,即目标向量r ,有教师学习过程的输入 向量和目标向量的集合即为训练样本集。训练的过程是对权值和阈值进行调 整以使实际输出向量与目标向量的误差小于规定值的过程,权值和阂值的调 整是在所有样本输入后计算其总的误差后进行的,这种调整方式称为批处理。 由于网络训练采用这种批处理方式,因此训练时应预先形成输入向量集 4 3 哈尔滨工程大学硕士学位论文 _1 p 和目标向量集t ,这一过程通过编写的m 脚本文件d r p t m 实现。对于不 同的训练样本可以通过运行d r p t m 形成并存储相应的训练样本集。 2 b p 网络的创建和训练 b p 网络的创建和训练过程通过编写的m 脚本文件d r t r a i n m 实现,具 体实现过程介绍如下: , 首先加载训练样本集并用p r e m n m x 函数对输入向量集进行归一化处理, 使其取值范围为 1 ,1 】,这样那些比较大的输入也将落在激活函数变化大的范 围内。 接下来用n e w f f 函数创建b p 网络:创建的b p 网络为单隐含层网络,由 于提取出的汉字字符图像进行脊波分解的低频特征向量为1 9 2 xl 的列向量, 所以b p 网络输入层节点数为1 9 2 个;隐含层节点数应为1 0 - - - 2 0 个;输出层 的节点数为标准小五号宋体汉字字库中样本的个数:隐含层和输出层的激活 函数为l o g s i g ( 对数s 型激活函数) 。利用n e w f f 函数创建b p 网络,默认的 权值阈值初始化函数为i n i t n w ,即n w 网络初始化函数,它是w i d r o w 等人 在分析了两层网络是如何对一个函数进行训练后提出的,利用这种方法可以 在较少的训练次数下得到满意的效果。本文经实践在此基础上将输出层的权 值闽值乘以0 0 0 0 1 ,以使输出层激活函数的初始输入在激活函数变化大的范 围内。b p 网络的训练函数经实践对比选择t r a i n s c g 函数。误差性能函数为默 认的均方误差n 1 s e ,其定义为: l ( 气一吼) r o s e = 丛l 一 ( 4 - 2 ) 刀 式中,l 为输出层节点数;a k 为第k 个输出节点的实际值;气为第七个 输出节点的目标值。在仿真时,对不同的训练样本集进行训练时,所设定的 误差性能目标值将通过测试进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安史之乱第一现场《旧唐书》的灾难纪实文
- 肇庆市实验中学高二下学期第四周历史理科晚练
- 2025店铺租赁合同简易模板
- 2025【网络安全评估合同书】合同书样本
- 2025年安徽省畜类产品买卖合同
- 2025年个人对个人借款合同范本
- 第01讲 两条直线的位置关系(解析版)
- 绿化用工合同书二零二五年
- 工程消防维保合同
- 煤矿转让买卖居间合同书二零二五年
- 设计院保密管理制度(3篇)
- 《投资理财课件》课件
- 2025年中国工艺美术及礼仪用品行业市场前瞻与投资战略规划分析报告
- 阔盘吸虫病病因介绍
- 【MOOC】国情分析与商业设计-暨南大学 中国大学慕课MOOC答案
- 恶性心律失常的急救护理
- 风机安装与调试方案
- 肿瘤的化学治疗
- 空腔脏器手术解析
- 2024年五年级英语下册 Unit 3 Spring Begins from March第2课时说课稿 陕旅版(三起)
- 大班剪纸教育课件
评论
0/150
提交评论