




已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)基于嵌入式系统的泰文手写识别系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着联机手写识别技术的发展,多种语言的联机手写识别系统都已应用在各种 嵌入式系统上。但泰文文字形状和结构特殊、相似文字多、手写体文字形变复杂, 所以对泰文手写文字的识别有一定的难度,并且由于嵌入式系统c p u 的运算能力 较差,所以在嵌入式系统上实现泰文联机手写识别,需要依据具体情况进行设计, 才能取得满意的效果。 本文在对联机手写识别技术和泰文文字深入分析的基础上,针对泰文字符的 独特形状选择特征提取方法,并结合嵌入式系统的实际情况对识别系统各关键阶 段预处理、字符分离和识别匹配阶段进行详细设计。在此基础上,本文设计 并实现了一个三级分类器集成的识别系统,其识别速度和准确性较原有系统得到 了很大提高。最终在低性能嵌入式系统上实现了泰文联机手写识别。 测试表明,本系统的识别速度和识别率都达到了满意的效果,显示出本文所 设计的识别系统的优越性。本文所采用的思想和设计的算法,具有一定的通用性, 对与泰文文字识别相关的应用都有一定的借鉴意义。 泰文联机手写识别目前仅对单字进行识别,如果能够对连续输入的泰文文字 进行识别,对用户来说更为方便和快捷。为达到此目标需要提高识别系统的性能 和解决连笔问题,今后将会对相关算法作更为深入的研究。 关键词:泰文,联机手写识别,特征提取,嵌入式系统 a b s t r a c t w i t ho n l i n eh a n d w r i t t e nr e c o g n i t i o nt e c h n o l o g yg o i n gt op r o d u c t i v ep h a s e ,al o to f i n v i g o r a t i v e a p p l i c a t i o n s o fo n l i n eh a n d w r i t t e nr e c o g n i t i o nf o rm a n yl a n g u a g e a p p e a r e di ne m b e d d e ds y s t e m b u tt h a ic h a r a c t e r sh a v es p e c i a ls t r u c t u r ea n ds h a p e , m a n yo ft h e mh a v es i m i l a rs h a p e ,a n dh a n d w r i t t e nc h a r a c t e r si nt h es y s t e mh a v e c o m p l e xd i s t o r t i o n t h e r e f o r e ,h a n d w r i t t e nt h a ic h a r a c t e r r e c o g n i t i o ni so n ed i f f i c u l t t a s k o nt h eo t h e rh a n d t h ep e r f o r m a n c eo f c p ui ne m b e d d e ds y s t e mi sf r e q u e n t l ys l o w , a n dd o n th a v ee n o u g hc a p a b i l i t yi nd e a l i n gw i t hc o m p l e xo p e r a t i o n i no r d e rt o a p p r o v i n gi m p l e m e n tt h a io n l i n eh a n d w r i t t e nr e c o g n i t i o nt e c h n o l o g yi ne m b e d d e d s y s t e m ,w em u s td e s i g nt h eh a n d w r i t t e ns y s t e mb a s e do ne m b e d d e ds y s t e mc o n d i t i o n a n ds i m p l i f ya n do p t i m i z et h ea r i t h m e t i c t h i s p a p e r p r o c e e d s f r o mo n l i n e h a n d w r i t t e nr e c o g n i t i o n t h e o r y a n da n a l y s i s o f t h et h a ic h a r a c t e r s a n ds e l e c tf e a t u r ee x t r a c t i o nm e t h o dt or e p r e s e n tt h ef e a t u r e so f h a n d w r i t t e nt h a ic h a r a c t e r se f f e c t i v e l ya n da b s o r bt h ed i s t o r t i o n so fh a n d w r i t t e n 。t h i s p a p e rd e s i g n e dt h ei m p o r t a n ts t a g ei nt h er e c o g n i t i o ns y s t e mb a s e do ne m b e d d e d s y s t e m ,i n c l u d ep r e p r o c e s s ,c h a r a c t e rs e p a r a t i n ga n dr e c o g n i t i o ns t a g e f i n m l y , w e d e s i g nt h et h a io n l i n eh a n d w r i t t e nr e c o g n i t i o nt h a th a v et h r e es t a g ec l a s s i f i e r , a n dc a n b eu s e di nl o w e n de m b e d d e ds y s t e m t h er e s u l t so fe x p e r i m e n ts h o wt h a tt h ee f f e c t so f1 1 1 a ic h a r a c t e rr e c o g n i t i o nm a t d e s i g n e db yt h i sp a p e ra r eo b s e r v a b l yb e t t e rt h a nt h o s ep r o d u c e db yc u r r e n tm e t h o d t h em e t h o da n da r i t h m e t i cp r o p o s e db yt h i sp a p e rc a nb eu s e di nt h et h a ic h a r a c t e r s r e c o g n i t i o nf i e l d 。 t h a io n l i n eh a n d w r i t t e nr e c o g n i t i o ni sas i m p l em e t h o dt oi n p u tt h a ic h a r a c t e r ,i t i sp o p u l a rt or e c o g n i z et h ec o n t i n u o u sh a n d w r i t t e nc h a r a c t e r i no r d e rt op r o m o t et h e s y s t e m t h eb e t t e rm e t h o da n da r i t h m e t i cw i l lb es t u d yi nf u t u r e k e y w o r d :t h a ho n - l i n eh a n d w r i t t e nr e c o g n i t i o n ,f e a t u r ee x t r a c t i o n ,e m b e d d e d s y s t e m 创新性声明 本人声明所呈交的论文是我个人在导师的指导下进行的研究工作及所取得 的研究成果。尽我所知,除了文中特另t d n 以标注和致谢中所罗列的内容以外,论 文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志所做的 任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:公茎叠 同期: o c 岬、4 、( o 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文 在解密后遵守此规定) 本学位论文属于保密,在一年解密后适用本授权书。 本人签名:公萋鑫日期:墨塑:垂,! o 导师签名: 第一章绪论 第一章绪论 随着科技进步和全球信息交流的扩大,个人便携式消费电子产品( 包括手机、 p d a 、掌上电脑、电子词典等1 迅速发展,手机和p d a 等典型的电子产品更成了生 活的一部分,其拥有的数量已经大大超过个人电脑而成为人们同常生活的必需品。 嵌入式系统就是当i j f 各种电子产品的软件和硬件实现,是一种单片机技术的发展。 随着市场的成熟和人们信息需求的提高,小体积大屏幕的电子产品配备触摸屏幕 和手写笔是必然趋势,而联机手写识别的文字输入方法成了此类产品最吸引人的 功能。所以当前联机手写识别技术成为便携式电子产品的很大的竞争优势。 联机手写识别或称为在线手写识别( o n l i n eh a n d w r i t i n gr e c o g n i t i o n ) ,它给用户 提供了一种自然的文字输入方式。用户利用某种输入设备直接书写文字,经过系 统识别处理后,转换为文字统一表示的输入方法。在嵌入式系统上的联机泰文手 写识别输入,是通过压电式触摸屏幕来实现的。在书写时,手写笔在触摸屏上的 接触点的电压变化可以转化为坐标,所以手写笔的运动轨迹被转化为坐标序列并 被记录下来,从这些坐标序列可以比较容易地抽取书写文字的笔划和笔顺的信息, 进而对书写者所书写的笔迹进行识别,转化为泰文文字输出。 从9 0 年代以来,联机手写体的识别正逐步走向实用。各国的科研工作者相继研 究出了多种语言的联机手写识别系统,包含英文、中文、韩文、日文等联机手写 识别系统都已经应用在计算机和各种电子产品上。泰国是一个发展中国家,拥有 6 千万人口,电子产品和计算机软硬件技术也在迅速的发展,因此具有广泛的市场 前景。 过去2 0 年泰文手写识别技术得到了很大的发展,尤其在过去1 0 年内【l 】。但是目 前泰文手写字符识别仅有少量的研究,大多集中于印刷体泰文字符的识别,这是 因为泰文手写字符识别在某些方面比其他字符识别更困难,比如字符相似度很高、 不同书写者的书写方式变化较大、文字内缺乏空隙等等,这些导致对泰文文字特 征提取和识别的困难。泰文文字是一种以字符为基础的文字,是由不同字符组合 成的,并且字符中含有圆环、之字型、曲线和字符头部尾部的圆圈等等很多因素 成为了泰文手写识别的难点,所以对泰文手写识别的研究具有一定的难度。 1 1 泰文识别研究的发展 最早的泰文字符识别是1 9 8 3 年鼬r n p a l l 对泰文印郦0 体的识别【2 】主要是对打印 机打出的泰文文字样本进行识别。在早期对印刷体泰文字符的识别中,为了减少 可能的候选集采用两阶段识别处理。k i m p a n 使用了k l ( k a r h u n e n l o v e v e ) 变换对印 2 荩丁嵌入式系统的泰文手写识圳系统的研究与实现 刷体泰文字符的特征进行处理,他在试验中所使用的特征是字符的宽度和高度。 早期研究中大部分的泰文字符样本都足由老式的喷墨打印机生成的。打印出的文 件比激光打印机差,打印的文字包含很多笔划断裂、墨点、部分缺失等等很多问 题,这些问题都给识别带来了困难,因此当时对打印文字的预处理算法相对于特 征提取和识别是眈较关键的。 在接下来的更多的研究中都在尝试找出一种更可靠的特征值提取方法对泰文 字符进行分类。比如,重心中点位置( c e n t e ro fg r a v i t y ) 、直方图投影法( h i s t o g r a m p r o f i l e s ) 等等。这些特征大部分都是使用区域分割技术( z o n i n gt e c h n i q u e s ) 提取泰文 字的区域特征,其中r a t r e e ( 1 9 8 5 年) 【3 1 、a i r p h a i b o o n ( 1 9 9 4 年) 【4 1 、c h a t w i r i y a ( 1 9 9 4 年) 【5 】等人都使用这些特征提取方法进行了试验和研究。随着激光打印机在商业应 用的普及,对泰文字符的识别从老式喷墨打印机打印的文件转向了对激光打印机 打印文件的文字识剐。激光打印机打出的文件文字清晰、笔划连续,因此在泰文 文字识别的预处理过程中只需要很简单的预处理算法。在泰文文字识别处理最初 的工作是根据i f t h e n e l s e 规则对泰文字符进行分类。神经网络最早应用在拉丁 字符集的识别系统,1 9 9 3 年k h u n a s a r p b a n 手f l l u r s u i s a p 将其使用在了泰文字符识别 系统上并取得了一定的成果【6 j 。 泰文字符印刷体识别有两个商业版本【7 】,一个是1 9 9 9 年由a t r i u m 开发,n t s ( t h a i :n e wt e c hs e r v i c e ) 发行的;另一个是2 0 0 0 年由n e c t e c ( t h a i l a n d :n a t i o n a l e l e c t r o n i e sa n dc o m p u t e rt e e h n o l g yc e n t e r ) t a n p r a s e r t 等人开发。然而,这两个产品 仅仅适用于固定尺寸和字体的泰文字符,而且他们的性能也与拉丁字符识别系统 相差很多。 对于泰文手写识别,h i r a n v a n i c h a k o m 在1 9 8 4 年第一个提出了对泰文手写打印 字符的的识别【8 1 。他使用了一组拓补特征码来对泰文字符进行分类。1 9 8 5 年h o t 提出了对泰文数字手写体的识别,他使用统计识别方法,通过细化字符抽取出一 组链码和计算输入模型与模板分类模型间的变换距离的方法来实现。此后很少有 关于泰文手写识别方面的研究提出论文。 1 9 9 3 年k h u n a s a r p h a n 和l u r s u i s a p 提出了模拟光线敏感( s i m u l a t e dl i g h t s e n s i t i v e ) s l s 特征用于泰文手写识别i “。这个特征主要是根据生物研究中大脑皮层 对物体产生的视赏模型。他们试验的识别系统使用两层神经网络,第一层神经网 络分类器将图像分为八组,第二层神经网络分类器将前面的分组再分成4 4 个字符 分类,可以达到7 0 的识别率。1 9 9 8 年p h o k h a r a t k u l 和k i m p a n 使用文字的中空属性 ( c a v i t yp r o p e r t i e s ) 作为特征,使用神经网络作为识别引擎【9 】。在他们2 0 0 0 年的研究 中,他们使用了傅立叶描述符( f o u r i e rd e s c r i p t o r ) 与神经网络相结合作为识别引擎 u o ,但采用了不同的学习算法。使用这种方法他们的试验取得了显著的成果,报 告显示识别率达到了9 9 精确率,然而他们的识别范围仅局限于单个孤立字符, 第一章绪论 并且识别样本有限,对手写风格的多种变化没作足够的分析和处理。 2 0 0 2 年m e t h a s a t e 和s a e t a n g 将笔段分割的方法引入在泰文联机手写识别系统 上【1 ”,利用笔段方向码提取笔段,并从文字结构中提取1 2 种笔画形状作为特征, 使用隐性马尔可夫模型h m m ( h i d d e nm a r k o vm o d e l ) 作为样本训练和识别 方法,识别率达到9 2 7 1 。但是这个识别系统同样局限于单个孤立字符。同年 m e t h a s a t e 和s a e t a n g 使用笔段分割的方法与多层反向传播b p ( b a c k p r o p a g a t i o n ) 网 络相结合【1 6 】,应用于泰文联机手写识别系统上,识别率仅达到8 9 7 6 ,但是此系 统可以识别泰文文字整字f 泰文字符的组合) 。 2 0 0 4 年p a r i n y as a n g n a n s a t 等人提出了一种泰文联机手写识别系统【1 7 】,使用笔段 分割方法提取特征,隐性马尔可夫模型h m m ( h i d d e nm a r k o vm o d e l ) 与支撑 制成向量机s v m ( s u p p o r tv e c t o rm a c h i n e ) 相结合的识别方法。试验结果显示。对独 立泰文字符的识别率可以达到9 3 7 。 1 2 嵌入式系统概述 嵌入式系统【2 4 l 一般指非p c 系统,有计算机功能但又不称之为计算机的设备或 器材。它是以应用为中心,软硬件可裁减的应用系统,对功能、可靠性、成本、 体积、功耗等综合性严格要求的专用计算机系统。简单地说,嵌入式系统集系统 的应用软件和硬件于一体,具有软件代码小、高度自动化、响应速度快等特点, 特别适合于要求实时和多任务的体系。嵌入式系统主要由嵌入式处理器、相关支 撑硬件、嵌入式操作系统及应用软件系统等组成,它是可独立工作的“器件”。 嵌入式系统几乎包括了生活中的所有电器设备,如掌上p d a 、移动计算设备、 电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自 动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、 工业自动化仪表与医疗仪器等。 嵌入式系统的硬件部分,包括处理器微处理器、存储器和i ,o 端口、图形控制 器等。嵌入式系统大多使用e p r o m 、e e p r o m 或闪存( f l a s hm e m o r y ) 作为存储介 质。软件部分包括操作系统软件( 要求实时和多任务操作) 和应用程序编程。应用程 序控制着系统的运作和行为;操作系统控制着应用程序编程与硬件的交互。 嵌入式系统在应用中,按其制造成本分类大致可以由高、中、低端三个层次组 成。在高端应用中,成本往往不是考虑的主要条件,而更强调稳定性、j 下确性、 和功能性,有许多系统设计时通过增加系统冗余来保证系统稳定性和正确性。这 种系统以军事工业和航天工业控制系统为典型代表。中、低端的应用一般是消费 类电子产品,消费大众对价格的敏感导致了成本为第一要素,其c p u 的计算能力 和外部存储空间经常被压缩到最低。 4 基丁- 嵌入式系统的泰文手丐识别系统的研究与实现 本文设计的泰文联机手写识别系统运行在一个低端嵌入式系统上,由于低端嵌 入式系统c p u 的运算能力较差,所以在嵌入式系统上实现泰文联机手写识别,需 要依据具体情况对识别系统进行设计和优化,才能取得满意的效果。 1 3 1 泰文文字概要 1 3 泰文手写识别的基本问题 泰文旧称暹罗语( s i a m e s e ) ,泰国的官方语言1 l 。属汉藏语系壮侗语族壮傣语支, 使用人口约5 0 0 0 万,有中部北部,东北部和南部等4 个方言区,曼谷话是泰文 的标准语。泰文有元音1 7 个,元音分长短,可以区别词义;有辅音4 4 个、5 个音 标,1 0 个数字和2 个符号。 泰文是一种孤立型语言。基本词汇以单音节词居多。构词中广泛使用合成和重 叠等手段。泰文中吸收了大量的梵语、巴利语和相当数量的孟语,高棉语,汉语 ,马来语和英语词汇。泰文词没有形态变化。词序和虚词是表达语法意义的主要 手段。基本词序是:主语一谓语宾语。定语在中心词之后。状语有的在中心词之前, 有的在后。数词,量词和名词组合时,一般是名词在前,数词居中,量词在后。 泰文属于音位文字类型。1 3 世纪的兰甘亨碑文是目前发现的最早最完整的泰文 文献。据该碑文记载,1 2 8 3 年素可泰王朝兰甘亨大帝创造了泰文文字。实际上泰 文是将孟文和高棉文加以改造丽成的,以后经过历代的改革形成现代泰文。现代 泰文有辅音字符4 2 个,元音字符和符号3 2 个。元音字符可以在辅音字符的前后出 现,还可以出现在辅音字符的上,下部位。有4 个声调符号,标在辅音的右上方, 第一声调不标符号。泰文字符表如图1 1 。 n 锄慰只嗣埘d 穹a2 f , 翻列露习们副姒国秘o 4 4 个辅音( c o n s o n a n t s ) n6 uu1 jn 一州科nu 臼a - j 一廿矗 j lw 日d 1 7 个元音( v o w e l s ) 影1 - - 。p0 1l u 气t1n 订 5 个音标( t o n em a r k s ) l o 个数字( t h a id i g it s )o 俞bnd db 州晶一 2 个符号( s y m b o l s )1 图1 1 泰文字符 泰文文字由多个字符组合而成,文字结构中每个部位可以出现的字符种类是构 字规则所确定的【1 2 】( 见图1 2 和图1 3 ) 。图1 2 中p 1 是音标字符,确定文字的发音; 第一章绪论 p 3 是辅音字符,是文字的主体,可独立存在也可与元音或音标组合:p 2 和p 4 是元 音字符,p 2 为上部元音,p 4 为下部元音,在组字规则中上部元音与下部元音是不 能同时存在的,图示l j 3 分别显示了上下部元音所组合的得泰文文字,p 1 ,p 2 和p 4 可以是空符号即独立辅音单独组成文字。元音分为简单元音和复合元音,除了p 2 和p 4 位值的上下部元音外,还有一种独立元音与辅音字符的p 3 的位置相同,独立 元音在组合时与其它原音组成复合元音;单独的音标,单独上下部元音字符不能 组成文字。泰文文字所包含的字符完全确定了文字的读音,因此不论是文字的形 态还是文字的读音都遵循着严格确定的规则,即泰文文字的字符是文字的书写单 位、文字的音素单位。 二口 二口 n 1 。_ j 二口 图1 2 泰文文字结构 图1 3 泰文文字示例 1 3 2 泰文手写识别存在的难点 对于嵌入式系统中联机泰文手写文字的识别存在着一定的困难,主要可以从下 面几点体现: ( 1 ) 相似文字多 泰文字符在其结构特征上存在很高的相似性,相似字符所构成的文字之间的相 似性也很高。如图1 4 中每行字符其构成几乎相同,字符之间的差别仅在于很小得 部分。起笔、落笔处或中间笔顺的弧度的差别等。同时,文字的这种相似性随着 文字所含字符数量的增多而增加。这给文字识别过程中的预处理、特征提取乃至 分类处理带来很大困难,在手写体文字识别情况下这一困难显得更为突出。图1 4 列举了部分印刷体泰文相似文字,图1 5 列举出部分手写体题相似文字。 介幻n 翁霸 笥 甾面饧 铆钠辆 钉 m烈n l洲 t , l j 讨 刚i 叫 v 秒绷 n 门n 印 l 图l4 泰文印刷体相似文字示例图1 5泰文手写体相似文字示例 6 基丁嵌入式系统的泰文手弓识别系统的研究一,实现 ( 2 ) 文字形变方式多样 手写文字识别的最大难点在于由书写不同引起的模式结构的变形,这种变形因 人而异,而且变形可能十分严重。抗干扰能力,也称为鲁棒性,对于联机手写识 别系统的性能是非常重要的。因为泰文字本身是复杂的二维结构,书写的时候, 笔画的畸变、丢失、多余笔段( 如笔锋) 的插入、字的倾斜、部件问相对位置和大小 变化等,这些都是经常发生的现象,所以形变后的文字结构更加复杂。对于结构 识别来说,会造成基元提取和识别的错误。传统的结构识别方法恰好在鲁棒性上 是薄弱环节。因此,要想取得好的性能,必须对传统识别方法进行改进,增强其 鲁棒性,从而增加实用性,如何吸收手写体文字中的个性因素和环境因素是识别 系统需要解决的关键问题之一。如图1 6 列举了泰文字符的1 8 种手写体变形i l ”。 磁 璺。西甾i c fd 肖翘 l o l i “可 喵镪万嚣筒墨舌呵叼 甜 丽a 为at = faaa 磊a a 镯a 万a 稍f i l 贫爿l i i 图1 6 泰文字符手写体变形t ( 3 ) 笔顺问题 由于不同人有不同的书写习惯,笔划的书写顺序经常发生变化。因此,单纯通 过文字结构的串匹配进行识别难以达到理想效果。对手写泰文进行识别时,仅仅: 通过笔段、笔划等细节特征进行分析是不够的,还需要增加对轮廓、笔划密度等 整体分析。如图l ,7 显示出泰文字符第二笔划的书写笔顺的不同。a ) 中显示为按规 则书写的笔顺;鳓中显示手写体中第二笔划可能出现倒笔。 图1 7 泰文手写字符笔划书写不同 ( 4 ) 识别系统的性能 目i j i 研究的很多泰文联机手写识别系统都能达到较高的识别率,然而其识别方 法需要大量的数值运算,包括浮点运算。面大多数嵌入式系统由于成本的限制, 所选取的c p u 较低端,无法进行复杂的计算,更罕有浮点协处理器。浮点运算由 编译器自带的浮点处理程序实现。一条普通的浮点加法,需要消耗数百个时钟周 翟b叹烈a 第一章绪论 7 期,更刁:用髓浮点乘除法了。所以对泰文丁j 写识别系统各阶段的设计需要进行考 量和优化,使其能够适应低端嵌入式系统。 1 4 本文工作 本文针对嵌入式系统的实际情况和泰文文字本身的特点,在低端嵌入式系统上 研究和实现了泰文联机手写文字的识别系统。本文所作的主要工作如下: 1 对泰文文字的研究 本文对泰文文字作了比较深入的分析。包括泰文字符集、泰文字符的书写方法、 泰文文字的组字规律、文字独有的拓补特性和泰文手写文字产生的形变等等。 2 根据泰文文字本身固有特性选择特征提取方法 为了更精确估计泰文字符的细节特征,本文提出对字符笔划提取笔段的“方向 码和笔段间隔方向码作为特征,能更精确体现笔划方向的变化。此外,根据泰文 字符拓补特性,本文提出一种依据方向码探测笔划中圆环的拓补特征提取方法, 作为粗分类特征采用精确匹配,可以提高系统的速度。为了对泰文字符提取整体 特征,本文采用了笔划密度特征与边缘轮廓特征相结合作为粗分类特征,能够有 效吸收手写体形变。 3 识别系统整体设计 通过对泰文文字形状的分析,在预处理阶段本文提出了一种八方向码和拐码判 断相结合的滤波方法,能够更好地消除噪声和平滑笔划。在字符的分离过程中依 据泰文的组字规律提出一种横向分割的方法,对泰文笔划可能出现的位置作出了 全面的估计,有效地避免字符的误识,并且此方法由笔划位置判断字符,可以忽 略手写字符的笔划顺序,对于不同笔顺输入的相同泰文字也可以有效识别。 最后本文在识别阶段设计了三级分类器集成的方案,一级分类器采用拓补特征 作精确匹配可以提高识别速度,二、三级采用近似匹配的方法降低系统拒识率。 4 辨识系统的测试与评估 本系统依据泰文字符手写体变形的种类,采用了1 0 个人书写的4 6 8 0 个样本, 最终人工筛选出3 7 6 3 个手写样本作为模板。此外,使用1 5 个人书写的5 组共计 1 1 6 5 0 个测试样本对本系统作出测试和评估,最终得出的辨识速度和辨识率均取得 了满意的效果。 本系统识别速度快、准确度高、无笔顺限制,并且对c p u 的运算能力要求很 低,适于在中低端嵌入式系统中使用。作为一种方便快捷的输入方法,可以大大 提高用户输入泰文文字的速度。目前本系统已应用于泰文嵌入式产品上,并已投 放泰困市场,赢得了客户的好评。 8 基丁嵌入式系统的泰文手写识别系统的研究与实现 1 5 本文内容安排 本文内容共分六章: 第一章为绪论。首先阐明本文研究的意义及泰文手写识别的发展状况,总结了 近二十年来泰文识别的研究成果,并且简述了嵌入式系统的概念。然后对泰文文 字的基本知识作了简要说明,指出了联机泰文手写识别的困难和问题,并对本文 所作的工作做了概括说明。 第二章简要介绍了联机手写识别的中各个阶段的处理过程与方法,包括手写文 字的滤波、正规化的预处理方法和文字识别的特征提取方法。分析目前模式识别 中联机手写识别的各种研究方法,指出各类方法解决模式识别问题的主要思想及 主要用途。 第三章对泰文文字进行了详细的介绍,主要介绍了泰文字符集、泰文字符的书 写方式和泰文文字的组字规律。针对泰文字符独特的形状和结构选取出笔段方向、 拓补特征、笔画密度和字符边缘轮廓四种特征提取方法,并详细介绍每种方法及 其作用。 第四章具体介绍了基于嵌入式系统的泰文手写识别系统的设计与实现。本章首 先讲述了本系统所运行的嵌入式系统的架构,对用于手写输入的触摸屏的基本原 理作出说明。然后详细介绍了泰文手写识别各个阶段的实现方法,包含预处理的 步骤、字符的分离和归一化的步骤,最后介绍了本系统所采用的三级分类器识别 的具体实现。 第五章为泰文联机手写识别的测试,介绍了采样系统和识别系统的界面和功 能。最后列举出对识别系统的测试方法,测试环境和测试结果。 第六章为结束语。本章对全文内容作了一个总结,介绍了本文已经解决的问题, 并分析了系统存在的问题,对未来的研究方向作了探讨。 第一二章联机手q 识别概述 9 第二章联机手写识别概述 手写字符识别是模式识别学科的一个传统研究领域,它将人工语言输入转换成 象征意义的符号或者编码,手写识别分为两类口5 l :( 1 ) 联机手写字符识别,又称在 线手写识别:( 2 ) 光学字符识别o c r ( o p t i c a lc h a r a c t c rr e c o g n i t i o n ) 或称离线 ( o f f - l i n e ) 字符识别。联机手写字符识别通过与计算机连接的手写输入设备获取输入 的字符。 在研究泰文联机手写识别之前,首先应该了解联机手写识别的方法,本章将介 绍联机手写识别的主要阶段,包含预处理、特征提取和特征匹配,以及各阶段所 采用的主要方法,并对各类方法解决联机手写识别问题的主要思想及用途作出分 析。 2 1 联机手写识别 联机手写识别的理论和技术,在经历了三十多年的发展之后,日臻成熟,己形 成了一个完整的体系。联机手写识别一般采用多阶段处理方式,主要包括预处理、 特征抽取( 模式表达) 、特征匹配( 模式匹配) 等阶段,图2 1 给出了相应的原理 图。 图2 t联机手写识别原理图 这是一个总体上的阶段划分,根据不同的识别方法,预处理、特征抽取和特征匹 配阶段又可以进一步细分成各阶段。 2 2 预处理 联机手写识别时,书写者用笔在图形输入板( 也叫平板型数字化仪) 上写字, 把笔相对于板的坐标位置( 或是笔相对于前一点的坐标偏移值) 检测出来,使文 字笔划上各点的x ,y 坐标对( 数字化信号) 不断输入计算机,完成信号的模数转换。 经过模数转换的数字信号不能直接用来识别,因为它含有各种干扰和噪声。对联 1 0 基1 。嵌入式系统的泰文手写识别系统的砌究与实现 机手写识别而占,干扰、噪声主要有人手抖动、笔的速度变化、图形板的量化噪 声、感应噪声等,取出这些干扰、噪声,把单字分割出来都需要预处理。 噪声消除主要采用线性平滑算子( 如低通滤波器) 或非线性平滑算予( 如中值 滤波) 来处理笔划数据【7 l 【羽。另外,还有一类笔划扰动是由人的书写不稳定产生的。 例如,在抬笔和落笔时,手很可能会发生抖动造成笔划弯曲或抖动,这种噪声通 常只出现在一个笔划的端点附近,因此可以采取适当的方法加以消除1 9 i 【”j 。 笔划校正和归一化的主要目的是用来增强整个识别算法对不同输入方式和书 写风格的适应性。在输入过程中,笔划的尺寸和方向可能都会发生很大的改变。 尽管这些变化有时可以通过选取具有尺度和方向不变性的特征来克服,但这样做 也可能会带来其它方面的影响,因此,通过笔划校正和归化可以部分地减少输 入到分类器中的同类数据之间的差异,即增大类内数据的相似度,从而保证较高 的分类正确率。笔划的校正和归一化通常包括形变校正、方向校正和尺度归一化。 2 3 归一化 手写文字的规一化是识别过程中的一个重要步骤。归一化的内容包括字符尺 寸、位置、倾斜方向、笔划密度和方向等。归一化方法分为线性归一化方法和非 线性归一化方法两大类1 2 0 l 。线性归一化针对的是尺寸缩放和位置偏移两种变形, 在字符识别中使用也最为普遍,其基本的方法是将去掉四边空白后的字符图像线 性映射到归一化点阵中去;非线性归一化针对的是笔划密度不均匀等手写文字的 形变问题,这也是手写文字识别中的关键问题。 2 3 1 线性归一化方法 1 四边定界法 设字符图像四个边界的坐标分别是x 。x 。、y 、y 。,归一化的点阵大小 设为6 4 x 6 4 。归一化过程是将原图像中黑象素点的坐标线性映射到归一化图像中, 映射的公式为: x ka ( x x 。 ( 2 1 ) y k 伊一y 。一 ( 2 ,2 ) 其中尺度因子: a = 6 们譬一一一 ( 2 3 ) 8 = 6 4 佩一一x 。0 q q 这种方法使归一化后的字符恰好定界于设黄的点阵内。但由于水平和垂直方向 的尺度因子可能不一样,归一化后的字符会产生变形( 长宽比和笔划方向的变化) 。 第二章联机手弓识别概述 2 重心对准法 这种方法将原图像的重心映射到归一化点阵的几何中心,水平方向和垂直方向 的尺度因子相同,以保持字符形状不变。设原图像的重心坐标为似圳,归一化映射 的公式为: x ka ( x x 0 + 3 2 y 1 = a ( y y c ) + 3 2 其中尺度因子由字符的直径确定: ( 2 5 ) ( 2 6 ) a = 7 0 ,x 一一x m h r + y 。一y 。h p q - 、 这种方法将字符的重心对准,以便于模式匹配的进行。水平方向和垂直方向的 尺度因子相同,保证了字符形状不变,但点阵四边的界限不定,个别很长的笔划 甚至可能被截断。 3 单边定界法 与重心对准法一样,这种方法也把原图像的重心映射到归一化点阵的几何中 心,水平方向和垂直方向的尺度因子相同,但尺度因子由离重心最远的那条边到 重心的距离确定,以保证归一化字符完全在点阵边界内。设字符原图像重心到四 条边的最大距离等于d 。,尺度因子= j 2 佑。,a = 3 2 厶。 2 3 2 非线性归一化方法 由于手写变形所造成的不规则性及局部变化特性,使文字点阵图像上笔划分布 过分不均匀,这时就需要采用非线性归一化方法进行校正处理。 1 基于密度均衡的非线性化一般方法: 许多非线性归一化方法的共同点在于它们都是基于密度均衡来解决上述变 形,两区别在于对密度的描述不同。 设f c i , j ) 表示非线性归一化之前的文字点阵l x j , i = 1 , 2 , ,= j ,2 ,办 g 伽,圳表示非线性归一化之后的文字点阵m x m = ,z 膨n = ,2 ,- d o , j ) 表示汉字点阵氏,中各点处的笔划密度函数; m ,v o ) 分别表示密度函数在水平 和垂直方向的密度投影,即: , j v ( i ) = m j ) + a - 。( f ,川,i = 1 , 2 , ( 2 8 ) j = , 矿( ) = m ,) + 口,( i ,m ,= 1 , 2 , ( 2 9 ) - = 1 2基丁嵌入式系统的泰文手写讥别系统的研究与实现 通常a h ( i 。,a r a , j ) 为- - 支函数或常数。 基于笔划密度均衡的非线性归一化方法的通用均衡表达式如下: 所:窆日( 七) 善,扛2 , ( 2 1 0 ) “ h ( d m :圭y r ,j # :厶, ( 2 ,1 1 ) “ y r ,j 其中,m = j ,2 ,m ;= j ,z n 。 2 基于象素密度均衡的非线性归一化 这是一种最为简单的非线性归一化方法,其密度函数定义为: 吖“,= 川= 羔詈萎霎:蓄型萎言煮;( 2 。1 2 , 这种非线性归化方法仅对笔划象素点有定义且它们的笔划密度相同,即仅仅 考虑了笔划象素点,未考虑背景空白点,优点是算法简单,计算速度快,缺点是 在归一化后的文字点阵中笔划粗细不均匀,另一方面,由于密度均衡是基于全局 的,故手写变形的不规则性及局部性不能得到很好的纠正。 2 4 特征提取 特征选择与提取的基本任务是如何从许多特征中找出那些最有效地特征 2 2 1 。 特征选择就是从一组特征中选择出一些最有效地特征以达到降低特征空间维数的 目的,特征提取就是通过映射( 或变换) 的方法将高维空间中的样本用低维空间 表示。经过上述预处理变换可以得到一种简单象素点输入表达式,从而为特征提 取打下基础。下列原则【2 3 j 可以用来选取特征: 1 可区别性:对于属于不同类别的对象来说,特征值应具有明显的差异; 2 可靠性:对同类的对象特征值应比较接近; 3 独立性:所用的各特征之阃应彼此不相关; 4 数量少:模式识别系统的复杂度随系统的维数( 特征的个数) 迅速增长。 模式i 别中的特征选择和提取的目的是多重的:一是为了降低模式表达维数; 二是源于工程的考虑;三是辨识出与特定分类任务不相干的或多余的测量值。 降维对提高分类性能也有益处,有助于误识率的减低。特征选取可以看作是一 个剪除刁i 期望的噪声输入( 特征) 的过程。通过从可用特征中去除噪声输入,压 第一:章联机手写识别概述 缩特征集,从而降低分类以驯难度1 2 。 近三十多年来,各幽学者进行了大量的研究工作,提出了许多种不同的特i i = 提 取方法,这些特征主要分成两大类,即统计特征和结构特征。 其中统计特征分为全局特征和局部特征。全局特征是对整个图像进行变换,包 括k l 变换1 2 8 】、f o u r i e r 变换【2 9 l 、h a a r 3 0 1 、h a d a m a r d 3 1 】基于级数展开变换、h o u g h 变换【3 2 】、投影变换【3 3 】等等。局部特征【1 8 】是在特定位置对特定大小的窗内图像进行 变换,包括笔划密度特征、笔划方向特征、从文字背景部分抽取笔划密度、抽取 文字背景轮廓特征、网格单元特征、周边差分特征、细胞特征等。统计特征一般 用于粗分类,但对相似字的区分较差。 结构特征的抽取主要是基于特征点、笔段、笔划、笔划轮廓线、字根、边角等。 由于结构法描述模式细部结构的能力较强,因此对相似字的分类能力较强,但是 该方法所需的工作量很大,能够识别的字数有限。 结构方法一般具有较高的分类速度,对字体的变形具有很好的抗干扰能力,同 时对旋转及平移也有一定的稳定性。但是结构方法的特征抽取过程比较复杂,特 征定义和求取规则依靠经验和直觉,人工调整的工作量比较大,对图像的预处理 要求也较高。 手写文字的特征提取方法目前有很多种,针对不同语言手写文字的识别已经提 出了很多有效的方法。在研究泰文手写字符特征提取方法时,一方面要充分借鉴 其他语言文字识别领域中产生的研究结果,另一方面要充分考虑泰文文字的固有 特性,寻求符合泰文文字的特征提取方法。 2 5 特征匹配方法 特征匹配方法是整个系统的核心,模式识别有许多种方法,一般可以分为四类 f 3 6 】:模板匹配、统计分类、句法与结构匹配、神经网络。这些方法也可以交织 在一起使用,总体结构采用多级分类识别模型。 2 5 1 模版匹配( t e m p l a t em a t c h i n g ) 模板匹配是最简单也是最早使用的模式识别方法。使用这类方法需要预先定义 一些模式类的模板或原形。在进行模式的识别时,将待识别模式和存储的模板进 行各种角度和方位的匹配,并使用一定的准则进行模板与待识别模式之日j 相似度 的度量以判定待识别模式所属模式类,其分类策略是:对每个文字作一个标准模 板,与待识汉字点阵图形“距离”最小的模板所代表的文字,就被判定为识别文字。 其算法可描述为:j 4 f ( i , ,j 表示待识文字点阵,f r f ,表示标准模板。将输入图形与 1 4基丁+ 嵌入式系统的泰文手写识别系统的研究与实现 模板库中的每个标准模板一一进行“与”运算,计算两者的归一化相似度d 所砂, 因为有: d ( f ,f j = r f ,j f r f , f r f , 式蛳圳吖“,= f 赭薹 眨四 似j t ( i ,j t ( i ,j ,所以d d r 厂,f j j ( 2 1 4 ) i i i i 若输入模式与标准模板完全相同,贝t j d ( f , o = l 。可见,两者愈相似,则相似度 愈接近1 。最后,判决相似度最大者作为识别结果输出。 通常,模板的获取是通过训练集的训练得到的,模板的匹配需要大量的计算 时间。但随着处理器速度的不断增加,这类方法变得更加可行。 2 5 2 统计方式( s t a t i s t i c a la p p r o c h ) 统计决策法发展较早,理论也较成熟。其理论支柱是概率论和数理统计,其 要点是提取待识模式的一组统计特征,然后按一定准则所确定的决策函数进行分 类判决。统计模式识别方法将模式表示成n 个特征值或度量值,并看成是n 维空间 中的一个点。统计分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年养老护理员高级面试题集合康复辅助技能篇
- 2025年中国茶艺师认证考试模拟题及解析
- 2025年高性能铁氧体磁体项目合作计划书
- 2025年阿德福韦酯合作协议书
- 2025年铸铁及相关金属制卫生、厨房器具、餐具项目合作计划书
- 江苏省淮安市2025年初中毕业暨中等学校招生文化统一考试物理试题(含答案)
- 广西壮族自治区柳州市柳北区2025-2026学年七年级上学期开学考试语文试题(含答案)
- 安徽省2025-2026学年高二上学期9月秋季检测地理试卷(含答案)
- 抗排队安全教育培训课件
- 脊髓损伤题目及答案详解
- 2025年园林绿化技术员职业技能考核试题及答案解析
- 2025年军事模型行业研究报告及未来行业发展趋势预测
- 押题宝典期货从业资格之《期货法律法规》试题及参考答案详解(能力提升)
- 2025安徽宣城市总工会招聘社会化工会工作者13人笔试参考题库附答案解析
- 北京数语科技Datablau数据模型与数据资产平台介绍
- 人体对外界环境的感知+课件-2025-2026学年人教版生物八年级上册
- 无人机驾驶培训专业知识课件
- 初中语文学科组质量分析
- 70岁老年人三力测试能力考试题库及答案
- 2025年职业指导师(中级)考试全真模拟试卷
- 2025年广告设计师专业知识考核试卷:2025年广告设计与制作软件应用实战试题
评论
0/150
提交评论