已阅读5页,还剩72页未读, 继续免费阅读
(计算机应用技术专业论文)联机手写汉字识别系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
安徽人学顺1 学位沧文 摘爱 摘要 汉字属 :二维平面的方块字不像英文那样能直接键入计算机,而需要熟记编码、击键输入, 这曾一度成为汉字输入的唯一模式,目前也仍是计算机汉字输入的主要方法,但是键稀输入学习 起米比较凼难,而且需要记忆人颦编码,对丁很多人米说并不方便。随着计算机技术的发展,一 种新的输入方法一联机手写汉字识j ;l i 的输入法诞生了。这是一种实时识别方式即州户边丐, 机器一边识别处理。这种输入方法不需要记忆编码,也不需要键盘操作,方便、易学。 本文着眼丁一个基于鼠标设备的联机手写汉字识别系统的研究与实现,借助于鼠标手写汉 字,并完成实时识别。该系统对c p u 速度影响小,识别速度快且使用简单。 联机手写汉字识别的方法可分为两大类:一类是薹丁整字识别的方法,一类是基丁笔画识别 的方法,本文采用的是后者,即先识别笔画再判别整个汉字的两级识别方法,因为汉字由笔画组 成,而联机识别的特点就是写一笔、识别一笔。因此,在汉字识别中笔画识别是文字识别的前 提平关键。论文首先讨论了笔画的分类利特征然后对汉字笔画信息的各种数据做了统计,这些 数据对本文研究的识别系统具有重妥的指导意义剃应瑚价值。 论文所采用的笔画识别方法是以方向代码这个概念为基础的。在鼠标移动过程中可以获得笔 迹的一系列坐标点数据,由丁这些数据点是离散的,所以任相邻两点的曲线就是计算机所能分辨 的一段最小直线。文中对每一最小段氟线所属的方向域进行标记,产生了8 种方向代码。这样, 每一个笔画的移动轨迹都可以产生一个方向代码序列,通过对该序列进行滤波、归并之后可咀得 到该笔画的笔段序列,依照笔画特征字典用动态规划法匹配获得的笔段串,从而完成笔画的识别, 其中也包括了部分连笔部利:的识别。 由丁手写的随机- 性,手写的笔画或汉字因人而异、因时而异、因书写条件、设备和环境而异。 所以在识别过程中,获得的方向代码序列是随机的。这就要求系统具有自学习的功能,对于新山 现的止确模式,能够进行学习记忆。机器学习方法的种类很多,本文就笔画识别问题主要讨论了 文法学习和神经网络学习方法。 实现笔画的识别是本文所采用的两级识别方法的第一步,第二步就是实现汉字的识别。论文 设计了汉字识别系统的流程图。整字识别中主要讨论了四个问题:一是在汉字识别过程中对单笔 画的识别进行后处理,提出了两种方法;- 二是分析了识别字典的种类以及相关问题;三是笔画串 的匹配问题:四是讨论了识别系统实现的联想输入功能。 论文研究的手写汉字识别系统开销小,能有效节省软硬什资源,适用于嵌入式系统和单片机, 有很大的应用前景。 笑键词:联机手写汉字识别;笔画;方向代码;笔段;模式识别:识别字典 安破人学坝l 学位论文 a b s t r a c t a b s t r a c t u n l i k e e n 9 1 i s h ,c h i n e s e“a r a c t e r s ,w h j c hb e l o n g t ot w od i m e n s i o n s s q u a r e c h a r a c t e r s ,c a n n o tb ep u ti n t ot h ec o m p u t e rd i r e c t l y i ti sn e c e s s a r yf o rp e o p l et om a s t e r c o d e sa 1 1 di n p u tb yo p e r a t i n gk e y b o a r d ,w h i c hw a so n c ea no n l yp a t t e mf o rc h i n e s e c h a r c t e ri n p u t i n g ,a tp r e s e n t ,k e y b o a r di n p u t i n gi ss t i l lam a i nm e t h o dt oi n p u tc h i n e s e c h a r a c t e r s b u ts t u d y i n gh o wt oi n p u tb yo p e r a t i n gk e y b o a r di sn o ta l le a s yt h i n g ,i tr e q u i r e s t or e m e m b e ran u m b e ro fc o d e s ,w h i c hm a k e si tn o tc o n v e n i e n tt om a n yp e o p l e w i t ht 1 1 e d e v e l o p m e n to fc o m p u i e rt e c h n o l o g y ,an e wi n p u tm e t h o dn a m e do n - l i n eh a l l 椭t t e n c h i n e s ec h a r a c t e rr c c o g n i t i o n a p p e a r s i t i sar e a l t i m e r e c o g n i t i o nm e 血o d ,b y t 1 1 i s m e t h o d ,c o m p u t e r c a nr e c o g n i z ec h i n e s ec h a r a c t e r sw h i l eu s e r sa r ew 打t i n go na h a i l d 、砌t t e nb o a r d t h i sm e t h o dn e e dn o tr e m e m b e r i n gc o d e sa n do 巾e r a t i n gk e y b o a r d i t s c o n v e n i e n ta n de a s yt ol e a m t h i sd i s s e n a t i o nm a j n l yd i s c u s s e st h er e s e a r c h e sa i l di m p l e m e n t a t i o n so fa no n 1 i n e h a l l d e w r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o ns y s t e mb a s e do nam o u s ed e v i c e ,w h i c hc a n r e c o g n i z ec h i l l e s ec h a r a c t e r sr e c u r i n gt om o u s ed e v i c e t h es y s t e mh a sl i t t l ei n n u e n c eo n c p us p e e d i ti se a s yt 0u s e t h em e t h o d so fo n l i n eh a n d w i t t e nc h i n e s ec h a r a c t e r sr e c o g n i n o nc a l lb ec l a s s i 蠡e d i n t ot w oc a t e g o r i e s 0 n ei sb a s c do nc h i n e s ec 1 1 a r a c t e rr e c o 朗i t i o n ,t h eo t h e ri sb a s e do n s 仃o k er e c o g i l i t i o n t h cd i s s e n a t i o na d o p t st 1 1 el a t t e r i e 胁em e t h o dt h tr e c o g i l i z es 仰k e f i r s t l ya 1 1 dr e c o 印i z ec h i n e s ec h a r a c t e rs e c o n d l y b e c a u s ec h i n e c h a r a c t e ri sm a d eo f s t r o k e ,a n dt 1 1 ec h a r a c t e r i s t i co fo n - l i n er e c o 鲈i l i o ni sr e c o g l l i z i n ge a c hs t r o k ew h i l ew t i t i n g e a c hs t r o k e t h e r e f o r e ,i nt h er e c o g l l i t i o ns y s t e m ,s t m k er e c o g n i t i o ni s 也ep r e c o n d u c t i o na n d k e yo fc h j n e s ec h a r a c t e rr e c o g n i t i o n t h ed i s s e r t a t i o nd i s c u s s e st h ec a t e g o r i e sa n d c h a r a c t e r i s t i co fs t r o k en r s t i y ,m e nm a k e sa uk i n d so fs t a t i s t i c so nc h i r l e s ec h a r a c t e rs t m k e i n f b n n a t i o n t h ed a t ai sv a i u a b l ea 1 1 dp l a y sas i g n m c a 芏l tr o l e i nt h eo n l i n eh a l l d w r i t t e n c h i n e s ec h a r a c t e rr e c o g n i t i o ns y s t e mt h i sd i s s e n a t i o nr e s e a r c h e s t h es t r o k er e c o g n i t i o nm e t h o di nt h i sd i s s e n a l i o ni so nt l l eb a s i so ft h ec o n c e p t i o n d i r e c t i o nc o d e i nt h i sd i s s e r t a t i o n ,as e r i e so fc o o r d i n a t e sc a nb eg a i n e dw h e nw ea r e m o v i n gt h em o u s e b e c a u s et h e s ec o o r d i n a t e sa r ed i s c r e t e ,t h ec u r v eb e t w e e ne a c ht w o 窒墼叁兰! ! ! :兰垡堡兰 一羔生坚! ! l a d j o i n i n gd a t a d o ti sm e1 e a s tb e e l i n et h a tt 1 1 ec o m p u t e rc a nd i f r e r e n t i a t e i n t h i s d i s s e r t a “o n ,t h e r ea r e8k i n d so fd i r e c t i o nc o d e sa r ed e n n e d ,e a c hs e g m e n t i sm a j - k e dw i t ha c o d e 1 nt h i sw a y ,e a c hs t o k et r a c kc a np r o d u c eas e q u e n c eo fd i t e c t i o nc o d e v i an l t e r l n g a n dm e 唱e r i n gt h es e q u e n c e ,w e c a no b t a i nt h es t r o k ee x t r a c t i o ns e q u e n c eo ft h i s s t r o k e ,t h e na d o p tt h ed y n 锄i c 矿。酽锄m 崦m e t h o dt or e c o 嘶z et h i s 蚶o k ea c c o r g t o s t r o k e r e c o g n i t i o n d i c t j o n a r y t h e r e j n t o ,p a r t i a l s t r o k ec o n n e c t i o nr e c o g n j t j o n i sa l s o i m p l e m e n t e d b e c a u s eo ft h er a n d o m i c i t yo f h a l l d w m e nc h a r a c t e r s ,h a l l d w r i n e ns t r o k eo rc h i n e s e c h a r a c t e r sa r ed 印e n d e do nu s e r ,t i m e ,w r i t i n gc o n d i t i o n ,e q u i p m e n ta n dc i r c u m s t a n c e i nt h e c o u r s eo fr e c o g n i t i o n ,t h ed i r e c t i o nc o d es e q u e n c ei ss t o c h a s t i ca n du n c e r t a i n s oi ti s n e c e s s a r yf o rt h es y s t e mt op o s s e s ss e l f - l e a m i r 唱a b m 吼m a ti st os a y ,w h e nan e wp a t t e m a p p e a r s ,t h es y s t e mc a nl e 踟a 1 1 dr e m e m b e ri t ,t h e r ea r em a n yc l a s s e so fm a c h i n el e a r i n g m e t h o d s ,t h ed i s s e f t a t i o nm a i n i yd i s c u s s e ss y n t a xl e a m i n ga f 通n e u r a ln e t w o r km e 也o d i m p l e m e n l j n gs t r o k er e c o g n i t i o ni st h e 矗r s ts t 印o ft w 0 1 a y e rr e c o g n i t i o nm e t h o dt h i s d i s s e 九a t i o na d o p t e d t h es e c o n ds t e pi si m p l e m e n t i n gc h i n e s ec h a r a c t e rr e c o g n i m i o n i n t h ed i s s e n a t i o n ,w ed e s i g naf l o wc h a r to ft h er e c o g n i t i o ns y s t c m t h e r ea r em a i n l yf o u r p m b l e m sw eh a v ed i s c u s s e dd u r i n gc h i n e s ec h a r a c t e r sr e c o g n i t i o n t h ef i r s to n ei st h ep o s t p r o c e s s i n gp r o b l e m f o rs t r o k e r e c o g n “i o n ,t w o m e t h o d sa r e p r o p o s e d i nt h i s d i s s e n a t i o n t h es e c o n do n ei s ,a 1 1 a l y z i n gt h er e c o 弘i t i o nd i c t i o n a r y a n dr e l e v a n t p r o b l e m s ,t h en l i r do n ei s t h ep m b l e ma b o u tm a t c h i n gs t r o k e8 e q u e n c e t h el a s to r l c i s ,d i s c u s s i n gw o r d sa s s o c i a t i o nf u n c t i o no f t h er e c o g n i t i o ns y s t e m t h es p e n d i n go fr e c o g n i t i o ns y s t e mt h i sd i s s e r t a t i o nr e s e a r c h e di si 俄l e i tc a l l s a v e s o 行w a r ea 1 1 dh a r d w a r er e s o u r c ee f f e c t i v e l y t h es y s t e mh a si m p l i c a t i o ni n e m b e d d e d s y s t e m sa n dm i c m c o n t r o l l e r s np o c e s s e sh u g ei m p l i c a t i o np o t e n t i a l k e yw o r d s :o n l i n eh a n d w r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o n ;s t r o k e ;d i r e c t i o nc o d e ; s 们k ee x t r a c t i o n ;p a t t e mr e c o g n i t i o n ;r e c o g n i t i o nd i c t i o n a r y i 盘徽人学峻i 学位论文 ;整l 蓑丑录 图表目录 剀1 1 汉字识别的研究范嗣3 图1 2 汉字识别系统框图3 图1 3 “汉”字的涪法树4 酬14 一个句法模式识别系统的框图5 图2 1 八方向运笔幽1 2 表2 1 汉字笔画分类1 4 幽2 2 穴种复合笔画示例图1 5 图3 1 汉字文法树17 表3 1 部分笔画编码字典1 8 表3 ,2 以各种笔画起笔的汉字数一2 l 图3 ,2 各种笔画的出现次数2 2 表3 - 3 笔画相同的汉字列表2 3 表3 4 相邻笔画频度列表2 5 图4 1b r e s e n h 柚画线算法原理图2 9 图4 2 笔画方向代码分区2 9 表4 1 方向代码闽值表3 l 图4 3 方向代码逻辑搜索图3 1 表4 2 笔画方向代码序列滤波算法3 4 表4 3 简化笔画方向代码序列的算法3 6 表4 4 笔画和方向代码序列的对应关系3 7 图4 4 部分允许连笔的偏旁部首图例3 8 图4 5 笔画识别运行结果示意图3 9 图5 1 机器学习系统的基本结构4 0 圈5 ,2 由笔段序列构成的笔画示例图,4 2 图5 3 模式识别系统框图4 3 图5 4 人工神经元的结构模型4 6 图5 5b p 网络示意图4 8 图6 12 6 种笔画在标准键盘上的键位分布图5 2 表6 ,1 笔画与外码对应表5 2 图6 2 基了鼠标设备的联机手写汉字识别系统框幽,5 3 表6 ,2 笔画间的位置关系分类,5 4 图6 3 “利”字的搜索树及回溯思路示意图5 7 表6 3 多候选笔画组合算法5 9 表6 4 汉字外码表。6 0 表6 5 对笔画识别库的学习算法6 1 表6 6 对汉字库排序算法6 2 表6 ,7 对联想词库排序算法一6 3 表6 8 求联想词库索引文件算法6 4 图6 4 汉字的联想词语索引图6 5 表6 9 根据索引文件布找井显示联想词语的算法6 5 幽6 5 手写汉字“人”后效果图6 6 图6 6 舣击候选框中“人”字斤的效果图6 6 图6 7 双击词语“人行道”后的效果图6 7 v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得蜜 淋哮或其他教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示谢意。 学位论文作者签名:铷、袭 签字日期:加工,年f 月子日 学位论文版权使用授权书 本学位论文作者完全了解轻数太哮有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授麟古孥可以将学位论文的全部或部分内容编入有关数据库进行 检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者鲐赫苠 糊张关蜘 签字日期:加r 年j 月g 日 签字日期:弘u j 7 年j 一月矿日 学位论文作者毕业去向: 工作单位:电话: 通讯地址:邮编: 箱。奇绪论 1 1 研究汉字i 只别的意义 第一章绪论 汉字如何进入计算机,一直是中国人使用计算机所面临的一大难题。自从发明汉 字编码( 包括音码、形码及其混合类型) 的方案以来,熟记编码、击键输入,曾一度 成为汉字输入的唯一模式,目前也仍是汉字输入的主要模式。但是,音码虽容易被掌 握,但对发音不准的人,输入常会出错,且重码率太高,不会读音的字更是无法输入; 形码可以高速输入,特别适合于看稿输入,而对无稿输入来说就有不便,现在形码并 无统一的标准,种类繁多,且都需要强记大量拆分方案,很多人学习起来有困难。此 外,不管音码还是形码,都是基于键盘输入的,对于现在一些小到容不下键盘的微机 ( 如p d a 等) ,编码输入就无用武之地了。 随着计算机技术的发展,在大众越来越强的呼声下,一种新的汉字输入方法 联机手写汉字识别的输入法诞生了。这种输入方法,完全以平常的书写习惯,把要输 入的汉字写在一块叫书写板的设备( 实际上是一种数字化仪,现在有的与屏幕结合起 来,可以显示笔迹) 上。这种设备将笔尖走过的轨迹按时间采样后发送到计算机中, 由计算机软件自动完成识别,并用机器内部的方式保存、显示。 汉字的计算机识别是模式识别领域的一个重要应用,其任务就是研究如何使计算 机能“识字”,它是智能计算机接口的一个重要组成部分,也是汉字信息处理的一个 重要环节【1 0 ,3 1 。 手写汉字输入计算机的方法具有很多优点: ( 一) 手写完全符合人们的书写习惯,人一边写、一边修改,机器一边识别。这 样可以不中断人们对文章的思考,自然地将汉字输入计算机。这种输入方法简单直观, 容易学习。 ( 二) 手写汉字识别技术可作为一种高速信息自动录入手段,也可作为未来计算 机的重要智能接口,还可作为办公自动化、机器翻译、新闻出版等领域理想的输入方 式,有着广阔的应用前景【4 j 。 ( 三) 汉字识别后将庞大的点阵图像压缩成机器内码表示,能减少存储容量和通 讯交流的信息量。 ( 四) 手写汉字输入方式可以代替或部分代替键盘编码的汉字输入方法,它无需 1 安徽人学坝 学位论文 联机r + 与汉一识别系统的删f 宄,实脱 经过学习训练和记忆汉字编码规则,是1 种最直接和自然的输入方法。 ( 血) 在线手写汉字识别的应用范围很大,只要具备一定的识别率和识别速度, 它可以用在各种电子设备上以取代键盘输入。随着计算机性能价格比的不断提高,笔 记本电脑已出现,只要解决了文字符号的在线以别问题,在线输入方式将有可能取代 键盘,从而成为人们喜爱的计算机汉字输入方式。 汉字识别不但在实际应用方面十分重要,在理论研究方面也有重大意义。汉字字 量大,即模式类别很多,是大类别( 或者称为超多类) 模式识别问题,汉字识别还涉 及到图像处理、人工智能、形式语言和自动机、自然语言理解、模糊数学、组合数学、 信息论、计算机、中文信息处理等学科,也涉及到语言文字学、心理学、仿生学等, 是一门综合性技术【5 】。汉字识别在理论和技术上,都有大量问题需要研究。目前,笔 迹鉴别( s c r i p t i d e n t m c a t i o n ) 以及利用汉字识别技术制成的自动阅读机( 或盲文阅读 机) 等,对扩大计算机在国民经济各部门的应用有实际意义。 联机手写汉字识别的输入方法,具有不需要记忆编码方案和键盘操作的优点,特 别适合于大众使用,有着极大的市场潜力。但是,这种输入方法能否最终为人们接受, 主要取决于识别技术是否能够满足人们的需要。而就目前这一技术的发展状况来看, 还没有达到成熟的程度,特别是对自然书写的识别率等方面还无法达到实用要求。 因此,大力开展汉字识别方面的研究工作是很重要的。 1 2 汉字识别概述 汉字识别( c c r ) 是文字识别( 如数字、汉字、英文、蒙文、藏文、韩文、日文 等) 的一个具体问题。通俗地说,就是用计算机自动识别印刷在纸上和人写在纸( 或 介质) 上的汉字。 1 2 1 汉字识别的研究范围 汉字识别研究范围可以用图1 1 形象地表示出来,它构成了三维空间【5 】。按识别 文字类型包括联机手写体汉字识别( o n l i n eh a i l d 、v r i t t e nc h i n e s ec h a r a c t e rr e c o g n i t i o n , 简称o l c c r ) ,单体印刷体汉字识别( s i n 9 1 e _ f o n tp r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n , 简称s p c c r ) ,多体印刷体汉字识别( m u l t i - f o n tp r i n t e dc h i n e s ec h a r a c t e rr e c o g n i t i o n , 简称m p c c r ) ,手写印刷体汉字t 别( h a l l d p r i n t e dc h i n e s ec h a r a c t e r r e c o g l l i t i o n ,简 称h c c r ) ,手写行书汉字识别( h a n d m nc h i n e s ec h a m c t e rr e c o g i n t i o n ) 等;按识别 文字和版面质量包括高、中、差三种;按文字数量和版面复杂程度包括一级、二级文 2 第一争绪论 字、1 0 0 0 0 汉字和简单、中等、复杂i 种版面。 在下面一小节中将介绍本文研究的主要内容联机手写汉字识别的相关概念 和背景。 0 0 0 0 ( 复杂 文字数量( 版面复杂程度) 图1 1 汉字识别的研究范围 1 2 2 汉字识别系统的构成和识别方法 字版面质量 图1 2 是汉字识别系统的框图。它包含汉字图形输入装置、预处理器、识别器和 后处理器等几个主要环节。 圈1 2 汉字识捌系统框图 汉字图形输入装置的作用是把手写或印刷汉字转换成电信号。对于联机手写汉字 识别,输入装置是一种特殊的书写板。在板上书写汉字或字符时,书写板把笔画轨迹 转换为电信号,送入识别系统,经转换后的手写汉字是一种二维点阵图形。 识别方法是整个系统的核心。模式识别方法主要有统计模式识别和结构模式识别 两大类嘶,7 ,引。 1 统计决策法 统计决策法发展较早,理论也较成熟。其理论支柱是概率论和数理统计,其要点 是提取待识模式的一组统计特征,然后按一定准则所确定的决策函数进行分类判决。 窒塑叁兰竺! :堂丝堡兰壁! ! ! :! 堡堡型墨竺塑型! 塾:! 兰些 在汉字识别中,国外学者大多采用这神方法,如变换系数法等。这种方法羞眼于数量 特征,便于特征提取和分析计算,主要优点是抗干扰力强,缺点是抽取好的特征较为 困难,并且不能反映精细的模式结构特征。它往往把汉字图形看做是一种随机的二维 点阵,没有充分考虑到汉字结构的特点,利用它所具有的结构信息。凶此统计决策方 法用于字符识别似乎很不适合。 2 句法结构法 解决模式识别的句法分析方法,近些年越来越受重视,它具有结构处理能力,是 模式识别中发展较为成熟的一种方法。句法模式识别是以形式语言理论的概念和自动 机技术为基础的,形式语言的起源可以追溯到2 0 世纪5 0 年代中期。汉字是一种特殊 的模式,其结构虽比较复杂,但具有相当严格的规律。换言之,汉字图形含有丰富的 结构信息,可以设法提取含有这种信息的结构特征及其组字规律,作为识别汉字的依 据。这就是结构模式识别,其基本原理是:用一个句法来描述一个模式类,n 个类就 有n 个句法,句法也称为文法或语法,对于一个未知样本,通过基元抽取构造该样本 的描述即句子,然后分析该句子遵循哪个语法从而推断该样本所属的类别。 可以看出,结构模式识别方法就是把待识模式看做是由若干个较简单子模式构成 的集合,后者又可继续分解为若干个更简单的子模式,而简单得不能再分割的子模式 就叫做基元。这样,任何模式都可以用一组基元及定的组合关系来描述,这和一个 句子由单词、短语等按语法规则组成类似。图1 3 是把“汉”字分解为基元的例子。 汉一一一一一一一模式 f七一子模式 ,又 一一一一一一一。,1 夭i 、 卜 、 、 7 一一一一一一一基元 图i3 “汉”字的语法树 句法模式识别系统如图1 4 所示,直线上方为识别部分,下方为分析部分。其中 识别部分由预处理、基元提取和句法( 结构) 分析组成;而分析部分包括基元选择及 文法( 或结构) 推断两部分。 在句法方法中,一个模式由一个句子表示。该句子属于一个文法所规定的语言, 用一组模式基元和它们的组合关系来提供模式结构描述的语言,支配基元组合成模式 的规则由所谓模式文法来确定。 首先要为待识模式选择基元,在选择了基元后,下一步是构造一个或多个文法, 以便生成一个或多个语言来描述币在研究的模式。 图l4 一个句法模式识别系统的框图 句法结构法的优点是能够反映模式的结构特征,用来描述汉字字形结构在理论上 是比较恰当的,而且对模式结构的畸变不敏感,因此适合于联机手写字符识别,在手 写汉字识别方面也已得到初步应用。但是汉字结构毕竟是十分复杂的,再加上各种干 扰和非理想因素( 如手写字字形的随意性等) 的影响,因而用这种方法来识别汉字仍 有较大困难,其另一个缺点就是抗噪声干扰能力较弱。 把统计识别和结构识别两种方法结合起来是近年来受人注意的一种方法。这种方 法既适宜识别有噪声的文字,又尽量利用汉字字形所含有的结构信息,对文字变体、 变形适应性好,能获得较好的识别效果。所以,对汉字识别来说,着重汉字字形结构 特点,把统计和结构方法两者结合起来,取长补短,将是解决汉字识别这个十分困难 问题的较好途径。 1 3 联机手写汉字识别( o l c c r ) 联机手写汉字识别就是指用户一边写字,机器边识别处理,是一种实时识别方 式。识别以笔画为单位,然后根据一个汉字的笔画组合、笔画之间的相对位置和关系, 最终识别出汉字吲。 1 3 1o l c c r 概述 在汉字识别系统中被识别的模式是方块汉字。如图1 1 所示,方块汉字有印刷体 和手写体之分,因此识别系统可分为印刷体汉字识别系统和手写体汉字识别系统两 种。后者按书写时间与识别时间的关系,又可分为实时识别和非实时识别,即联机识 别和脱机识别两种方式口,1 0 1 。 联机手写汉字识别是一种良好的人机通信方式,具有简捷、自然的特点,一直是 智能计算机接口的研究重点,是一种人工实时把汉字输入计算机的方法。这种方法在 5 兰塑叁堂! 坠! :兰竺丝苎 壁! ! ! l 坚! 堡型墨竺塑业塑! ! 茎些 操作上和击键输入不同,使用者只要在专用书写板上按常规方法书写,就可以把汉字 输入计算机。书写者不必学习击键的编码方案,可减轻学习种操作方法的负担,书 写方法和同常习惯基本相同。这对普及计算机应用,促进办公自动化,都很有好处。 从模式识别的角度看,联机和脱机两种情况在本质上有重要区别,识别方法也有 所不同【3 l 。 脱机手写体与印刷体汉字识别的识别对象是已经写好或印好的方块汉字,也就是 况,待识模式是一种特殊形式的二维汉字点阵图形或图像。 联机( 也称实时或在线) 手写汉字识别系统的识别对象虽然也是方块汉字,但是 构成汉字的笔画在书写时是按照书写顺序依次送入计算机的,即人一面写,机器一面 识别。因而,事实上已经把个二维图形分解为一维的笔画序列。联机识别利用书写 板把笔画变为一维电信号,输入计算机的是以坐标点序列表示的笔尖移动轨迹,因而 被处理的是一维的笔画串。这种笔画串既含有笔画数目、笔画走向、笔顺和书写速度 ( 甚至还有笔尖的压力) 等信息,还可以免去细化等预处理环节,减少一些影响识别 的因素。这是一种方便的汉字输入手段,用户面向计算机,可以利用交互方式迸一步 提高系统识别率。联机识别时,识别结果可以及时反馈,显示在屏幕上,识别错了可 以重写,从而对识别率的要求可以降低。联机手写汉字识别是在各种自动识别输入的 方法中,能够代替或部分代替人工编码输入的唯一可能的方法。 1 3 2 联机手写汉字识别技术的发展与现状 作为模式识别和人工智能学科的一个分支汉字识别技术在我国7 0 年代末起 步,至今已有2 0 多年了,一直向着实用化大步迈进】。 联机手写字符识别的发展历史可以追溯到上世纪五十年代,伴随着手写板硬件的 出现,人们开始研究联机手写字符识别技术。随着半导体和计算机技术的发展以及模 式识别领域理论和方法研究的不断深入和完善,到八十年代后期,联机手写字符识别 技术的研究已经朝着实用的方向努力,特别是英文,已经开始研究完全无限制的整旬 识别技术( n l n o nc l l r s i v ec h a r a c t e rr e c o g n i t i o n ) 。 联机手写汉字识别技术相对起步较晚,1 9 8 1 年,i b m 公司e f y h a p 等推出了第 一套较为成熟的联机手写汉字识别系统。该系统是基于对汉字笔画、字根编码的思想 进行识别的。 1 9 8 8 年我国刘迎建等人提出了利用笔段为基元的联机手写汉字识别技术。该方 法把汉字分为笔段、笔画、字根、单字和词组五个层次,分别用模糊属性文法进行描 述,以启发式模扳引导匹配。 现在,笔式计算机的兴起,大人促进了联机手写汉字识别技术的发展。这种用笔 输入的笔式个人计算机是微机浪潮后的又一次浪潮,它取消键盘,缩小机器体积,用 笔就可以输入和控制计算机。显然,联机识别技术将在推动笔式计算机在我国的发展 和应用中起到决定性的作用。 在中国研制中文笔式计算机,一个技术关键是研制能很好识别亿万人书写的汉字 的联机识别方法,也就是说,改变目前联机识别装置只能识别部分人一笔一画仔细书 写的汉字之状况,使它能识别人们平常自然书写的一个十分庞大、模糊、变形的汉字 集合。台湾也在进行联机手写汉字识别方法的研究,由于采用不同的思路,台湾的产 品在连笔处理方面具有一定的优势,而对于笔顺的限制相对比较严格。从有限的一些 资料来看,它们大致是基于笔段串的动态规划方法的。 值得注意的是,国外的一些大公司也开始注意联机手写汉字识别这一领域。 m i c r o s o f t 、m o t o m l a 、a p p l e 等大公司均已投资于该方向的研究。由于资金雄厚,并 且具有很强的软、硬件的优势,其势头不可小视。国内研究人员应该奋起努力,把这 一具有浓厚文化特色的核心技术掌握在中国人自己手中。 可以相信,在汉字识别中最具市场潜力的联机系统必将在大陆、台湾、新加坡等 地广泛使用。联机手写体汉字识别技术不仅在理论上有重要的研究意义,而且在实际 中也有很重要的应用价值。此项研究的技术水平近几年得到了突飞猛进的发展,其研 究的焦点已集中在如何提高行书体汉字的识别率上。 1 4 联机手写汉字识别问题的难点 汉字识别是o c r ( o p t i c a lc h a r a c t e rr e a d e r ,光学字符读出器) 的个重要部分, 被认为是o c r 中最困难的问题,也是o c r 研究的最终目标,而手写汉字识别则是难 中之难。 和所有模式识别系统一样,汉字议别的主要性能指标是正确识别率和识别速度; 从实用角度看,还应考虑系统的复杂性、可靠性和价格等等。联机手写识别问题之所 以如此困难,是由其特殊性决定的,可归纳如下【3 7 】: 1 汉字字量大 国标g b 2 3 1 2 8 0 两级汉字共6 7 6 3 个,目前我国常用汉字约3 0 0 0 4 0 0 0 个。t 别系统般应能正确识别这些常用的字,才能满足实际应用的需要。但是,对某一待 识字进行识别时,一般必须将该字按一定准则和存储在机内的每一个已知汉字逐一比 7 兰堂盔堂竺! :兰竺丝兰 壁! ! ! :蔓堡:望型墨竺塑业! ! ! ! 兰些 较,找出其中与之最相似的字。显然,汉字集合的字量越大,识别速度越低。也就是 说,汉字识别是一种超大类别模式谚 别问题,而类别数越大,分类识别就越困难。为 了提高识别速度,常采用树分类,即多级识别方法。采用这种方法以后,识别速度虽 然可以提高,但也可能使识别率下降。汉字集合字数愈多,f 确识别率与识别速度的 矛盾愈大。这是汉字识别的主要困难之一。 2 字体多 汉字的手写体有楷书、行书和草书三大类,虽然不同字体的拓朴结构基本相同, 但笔画的长短、位置及姿态却有一定的差别。这给分类识别增加了难度。 3 结构复杂、字形相似 汉字笔画多,结构复杂。在g b 2 3 1 2 两级字库中,笔画最多的汉字有3 0 画,平 均每个汉字笔画为1 0 6 画。由于笔画多,有的汉字结构十分复杂,有的汉字虽然笔 画少,但往往字形十分相似,如“人、入”、“巳、已、己”等。这些字有的只是一点 之差,或者某一笔画长短略有差别,其意义就迥然不同。这就要求分类器能够区分非 常精细的结构差别。 4 书写变化大 手写汉字识别的最大难点在于由书写不同引起的模式结构的变形,这种变形因人 而异,而且变形可能十分严重。抗干扰能力,也称为鲁棒性,对于联机手写识别系统 的性能是非常重要的。书写的时候,笔画的畸变、丢失,多余笔段( 如笔锋) 的插入, 字的倾斜,部件问相对位置、大小的变化等,这些都是经常发生的现象。对于结构识 别来说,会造成基元提取和识别的错误。传统的结构识别方法恰好在鲁棒性上是薄弱 环节。因此,要想取得好的性能,必须对传统识别方法进行改进,增强其鲁棒性,从 而增加实用性。 5 笔顺问题 由于不同人具有不同的书写习惯,笔画的书写顺序经常发生变化,因此,单纯通 过串匹配进行识别难以达到理想效果。对汉字进行描述时,仅仅采用一维串也就显得 不够,必须利用一些二维方法来描述,从而又极大地增加了匹配
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/IEC TS 11801-9903:2025 EN Information technology - Generic cabling systems for customer premises - Part 9903: Matrix modelling of channels and links
- 2025-2026学年北京版(新教材)二年级上册数学第六单元达标试卷(附参考答案)
- 河南往年初三考试真题及答案
- 2025年体育教师素养考试题及答案
- 山羊小蚂蚁测试题及答案
- 初级画画教师考试题目及答案
- 2025年贵州二模化学试卷及答案
- DB1306T 281-2025 中药材北沙参产地初加工技术规程
- 虚拟文物信息管理-洞察与解读
- 2025年世界文学常识题库及答案
- 2025上海市生物医药技术研究院招聘专技人员12人考试笔试备考试题及答案解析
- 2025年天津省考真题及答案
- 基于多尺度建模的AZ31镁合金固态增材制造机理与性能优化研究
- 2025北师大版三年级数学上册全册教案
- 手足口病诊疗指南(2025版)
- 人工智能在酒店管理中的运用-洞察及研究
- 第6课《剪出大千世界》课件浙人美版初中美术八年级上册
- 2025-2030工业互联网平台生态构建与产业协同发展白皮书
- 招标采购从业人员考试(招标采购专业实务初、中级)试题库及答案(2025年贵州)
- 宣传业务培训课件
- 医院停水停电应急预案流程
评论
0/150
提交评论