(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf_第1页
(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf_第2页
(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf_第3页
(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf_第4页
(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(检测技术与自动化装置专业论文)一种脱机手写体汉字仿生识别方法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种脱机手写体汉字仿生识别方法的研究 摘要 人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具 有良好容错性的文字识别系统。近年来,围绕仿人脱机手写体汉字图像识别的研 究方面取得了很多进展。以每一类事物的“认识”为目的的仿生模式识别理论方 法对属于超多类模式识别的手写体汉字识别,是具有理论方法研究意义和实际应 用价值的。 文章主要工作如下: 1 、分析了人类将汉字拆分为若干基本笔划复合连接交叉所形成的相对不变 的拓扑结构来“认知”汉字的识字机理过程,定义了一种基于与横、竖、撇、捺 笔段对应方向的双权值椭圆型神经元序列覆盖手写体汉字图像的获取基本笔段 方法;给出了手写体汉字图像转化为具有容错表征方式的汉字基本笔划类型( 横、 竖、撇、捺、折) 在不同位置组成的几何图形算法,获取表征基本笔段图形的双 权值椭圆型神经元。 2 、分析了人类识字中对笔划类型容错性心理过程和拓扑结构辨识过程,归 纳了具有冗余容错表征方式的六种汉字笔划合成类型;定义了汉字笔划神经元的 合成规则以及笔划神经元的相合相交类型判别规则。 3 、仿人类学习、记忆、对比与判断的识字过程,以汉字笔划在汉字图形中 拓扑结构的最佳覆盖为目标,定义了表征手写体汉字特征知识的数据结构表;并 先验建立了样本汉字的样本知识库;给出了手写体汉字的容错匹配识别方法。 选取s c u t - i r a c 手写体汉字库中的手写体汉字图像,对文章研究的手写体 汉字仿生模式识别方法进行了验证实验。实验结果说明,该方法具有接近人类识 别手写体汉字的容错性和准确性。 关键字:仿生模式识别,双权值神经元序列,汉字特征知识,冗余容错性。 ar e s e a r c ho fb i o m i m e t i cr e c o g n i t i o no no f f - l i n e h a n d w r i t t e nc h i n e s ec h a r a c t e r s a b s t r a c t :h u m a no c u l a ra p p e r c e i v ei st r u l yar o b u s tc h a r a c t e rr e c o g n i t i o ns y s t e m 、v i t l lf i n eb e a r a b l em i s t a k ea b i l i t yw h i c hc a na d a p t st oa l lk i n d so fn o i s e s r e c e n t l y , m u c ha b o u th a n d w r i t t e nc h i n e s ec h a r a c t e r sr e c o g n i t i o nh a sb e e nm a d e b i o m i m e t i c p a t t e r nr e c o g n i t i o nm a k e ss e n s eb o t hi nt h e o r ya n dp r a c t i c ew h e ni ti su s e di nl a r g e c l a s s e sp a t t e mr e c o g n i t i o n ,l i k ec h i n e s ec h a r a c t e r sr e c o g n i t i o n t h ef 0 1 1 0 w i n ga r et h em a j o rc o n t e n t si nt h et h e s i s : 1 、a c c o r d i n gt ot h er e l a t i v ec h a n g e l e s st o p o l o g i c a ls t r u c t u r eb r o u g h ta b o u t c o m p o u n d i n g ,c o n n e c t i o na n dc r o s s o v e ro fs o m eb a s i cc h i n e s ec h a r a c t e rs t r o k e s ,t h e p r o c e s so fh u m a n c o g n i z i n g ”c h i n e s ec h a r a c t e r s i s a n a l y z e d d o u b l e - w e i g h t s e l l i p t i c a l n e u r o n s e q u e n c et h a t a c c o r d st ob a s i cs 订o k e si sd e f i n e dt oc o v e r h a n d w r i t t e nc h i n e s ec h a r a c t e r s i m a g e b a s i cs t r o k e s a r e o b t a l n e d i m a g eo f h a n d w r i t t e nc h i n e s ec h a r a c t e r si st r a n s f e r r e di n t og e o m e t r i cf i g u r ec o m p o s e db yf a u l t t o l e r a n c ec h i n e s ec h a r a c t e r ss 订o k e so fd i f f e r e n tp o s i t i o n r e p r e s e n t e db a s i cs t r o k e s e g m e n tf i g u r e ,t h ed o u b l ew e i g h t se l l i p t i c a ln e u r o ni so b t a i n e d 2 、1 1 1 ep s y c h o l o g i c a lp r o c e s so f s t r o k es t y l e sf a u l tt o l e r a n c ea n di d e n t i f i c a t i o no f t o p o l o g i c a ls t r u c t u r ea r ea n a l y z e di nh u m a n c o g n i z i n g ”c h i n e s ec h a r a c t e r s s i x s t y l e s o fc h i n e s ec h a r a c t e r ss w o k e sw i t hf a u l tt o l e r a n c ea r ec o n c l u d e d t h e c o m p o s i n gr u l e so fc h i n e s ec h a r a c t e r ss 仃o k e sn e u r o na n dt h ei d e n t i f y i n gr u l e so f c h i n e s ec h a r a c t e r ss t r o k e sn e u r o n j o i n ta n di n t e r s e c t i o ns t y l e sa r ed e f i n e d 3 、i m i t a t e dc h i n e s ec h a r a c t e r s r e c o g n i t i o np r o c e s so fh u m a nl e a r n i n g , m e m o r i z i n g ,c o n t r a s t i n ga n dj u d g i n g ,a n da i m e dt h eb e s tc o v e ro fc h i n e s ec h a r a c t e r s s g o k e si nc h i n e s ec h a r a c t e r sf i g u r e ,t h ec h a r a c t e r i s t i ck n o w l e d g ed a t a - b a s et a b l eo f h a n d w r i t t e nc h i n e s ec h a r a c t e r sa n ds a m p l ec h i n e s ec h a r a c t e r sa r eb u i l t f a u l t t o l e r a n tm a t c h i n gr u l e sa r ed e f i n e d h a n d w r i t t e nc h i n e s ec h a r a c t e r si ns c u t - i r a ca r et e s t e d t h ee x p e r i m e n ti s p r o v e dt ob ec l o s et oh u m a nf a u l tt o l e r a n c ea n dv e r a c i t y k e yw o r d s :b i o m i m e t i cp a t t e r nr e c o g n i t i o n ,d o u b l ew e i g h t se l l i p t i c a ln e u r o n s e q u e n c e ,c h i n e s ec h a r a c t e r sc h a r a c t e r i s t i ck n o w l e d g e ,r e d u n d a n t f a u l tt o l e r a n c e 插图清单 图1 1脱机手写体汉字识别系统简图2 图2 1仿生模式识别二维空间覆盖示意图9 图2 2多权值神经元网络1 6 图2 3多权值神经元形状1 7 图3 1双权值椭圆型神经元序列2 0 图3 2手写体汉字“白”的笔段提取和笔段神经元2 2 图3 _ 3手写体汉字“毕”的笔段提取和笔段神经元2 2 图3 4手写体汉字“礼”的笔段提取和笔段神经元2 3 图4 1手写体汉字“白”的笔划神经元2 8 图4 2 手写体汉字“毕”的笔划神经元2 8 图4 _ 3手写体汉字“礼”的笔划神经元2 9 图5 1手写体汉字“白”的笔划神经元3 2 图5 2 印刷体汉字“白”的笔划神经元3 3 图5 _ 3手写体汉字“毕”的笔划神经元3 3 图5 4印刷体汉字“毕”的笔划神经元3 3 图5 5手写体汉字“礼”的笔划神经元3 4 图5 6印刷体汉字“礼”的笔划神经元3 4 图6 1印刷体汉字“白”的实验结果3 6 图6 2手写体汉字“白”的实验结果3 6 图6 3印刷体汉字“毕”的实验结果3 7 图6 4 手写体汉字“毕”的实验结果3 7 图6 5印刷体汉字“礼”的实验结果3 8 图6 6 手写体汉字“礼”的实验结果3 8 图6 7 样本汉字“礼”的实验结果3 9 图6 8 被识别汉字“礼1 ”的实验结果3 9 图6 9 被识别汉字“礼2 ”的实验结果4 0 图6 1 0 被识别汉字“礼3 ”的实验结果4 0 表格清单 表2 1 仿生模式识别与的差别9 表4 1 八种笔划类型及其代码2 4 表4 2 笔划的笔段合成及其容错形状2 4 表4 3 笔划相合相交结构类型及其容错形状2 6 表4 4 手写体汉字的特征知识数据结构表2 7 表4 5 手写体汉字“白”的特征知识数据结构表2 8 表4 6 手写体汉字“毕”的特征知识数据结构表2 9 表4 7 手写体汉字“礼”的特征知识数据结构表2 9 表5 1 印刷体和手写体汉字“白”的特征知识数据结构表3 3 表5 2 印刷体和手写体汉字“毕”的特征知识数据结构表3 4 表5 。3 印刷体和手写体汉字“礼”的特征知识数据结构表3 4 表6 1 印刷体和手写体汉字“白”的特征知识数据结构表3 7 表6 2 印刷体和手写体汉字“毕”的特征知识数据结构表3 8 表6 3 印刷体和手写体汉字“礼”的特征知识数据结构表3 9 表6 4 被识别手写体汉字“礼1 ”和样本汉字“礼”的特征知识数据结构表4 1 表6 5 被识别手写体汉字“礼2 ”和样本汉字“礼”的特征知识数据结构表4 l 表6 6 被识别手写体汉字“礼3 ”和样本汉字“礼”的特征知识数据结构表4 2 表6 7 重特征知识数据结构表的汉字列表4 3 独创性声明 本人声明所旱交的学位论文是本人在导师指导f 进行的研究工作及取得的研究成果。据 我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的 研究成果,也不包含为获得 盒胆工些盔堂 或其他教育机构的学位或证 s 而使用过的 材料。与我同i :作的同志对本研究所做的任何贡献均已在论文中作了明确的说明井表示谢 意。 学位论文作者签名:杏l 巨辛舀 签字日期:沙n 6 年1 2 月 日 学位论文版权使用授权书 本学位论文作者完全了解金胆_ i 些盍堂有关保留、使用学佗论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权盒照 :些厶堂可以将学位论文的全部或部分内容编入有关数据库进行检索。可以采_ j 影印、缩 印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密屙适用本授权书) 学位论文作者签名:去十k ,辛舀导师签名: 签字日期: 。6 年i2 月 日 签字日期: 学位论文作者毕业后去向 :f 作单位: 通讯地址: 电话 邮编 莎以年p h 日 致谢 本文的主要工作是在我的导师王建平教授的悉心指导下完成的。王建平老师 以渊博的知识、严谨的治学态度、敏锐的思维和非凡的敬业精神给予了我专业的 指导,为我树立了为人处事的楷模。同时,王老师还以真诚热心的关怀给予了我 生活上的帮助,使我受益良多。在此向王老师表示最诚挚的谢意! 感谢徐晓冰、钱自拓、秦剑和赵丽欣老师,谢谢你们在学习和生活上对我的 帮助。 感谢电气学院的全体老师,他们的教诲为本文的研究提供了理论基础,并创 造了许多必要条件和学习机会。 感谢同窗好友管理、廖建敏、谢芝东同学,和你们一起度过的时光将是我人 生的美好回忆;在实验室期瞄,得到了王熹徽、刘伟、孙伟、穆举胜、马宾、杨 金付和朱克忠同学在学习和生活上热情关心和无私帮助,在此向他们表示衷心感 谢;感谢同实验室的程羽、潘乐、张丽萍、王晓雪等同学的关心和帮助。 感谢我的父母及家人。他们用辛勤的劳动和无私的关怀给了我学习和生活的 物质精神支持,感爱之心,无以言表,他们永远健康快乐是我最大的心愿! 感谢所有关心和帮助过我的同学和朋友! 作者:李帷韬 2 0 0 6 年1 1 月 第一章汉字识别概述 汉字识别【1 1 1 2 1 3 】吲技术是一种高速、自动的信息录入手段,将成为未来计算 机的重要智能接口,其作为办公自动化、新闻出版、机器翻译等领域的理想输入 方式,有着广泛的应用前景。在信息技术及计算机技术日益普及的今天,如何将 汉字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈。 汉字是历史悠久的中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。 汉字数量众多,仅清朝编纂的康熙字典就包含了4 9 0 0 0 多个汉字,目前使用 汉字达到万余字( 国家标准g b l8 0 3 0 中共有2 7 4 8 4 个汉字) ,其数量之大,构思 之精,为世界文明史所仅有。由于汉字为非字母化、非拼音化的文字且数量浩大、 结构繁杂、变化多端,使得解决汉字的自动输入问题要比西方的少量字符拼音文 字的自动输入问题要艰巨的多。印刷文字有不同字体、不同大小之分;手写汉字 的书写更是因人而异,因时而变,形态变化十分巨大,如何解决好这样种完全 有别于西方文字的超多类的,变化多端的模式识别问题需要从理论和方法上加以 研究。 1 1 字符识别及手写体汉字识别的发展历程和研究现状 字符识别,也称光电字符i r ;( o p t i c a lc h a r a c t e rr e c o g n i t i o n ,简称o c r ) 。随 着电子计算机的诞生和大规模集成电路的飞速发展,字符识别的研究因其广泛的 应用前景,越来越受到广泛的注意。到了6 0 年代,字符识别在模式识别领域中已 成为一个十分活跃的研究课题。 手写体汉字识别是属于文字识别的一个具体问题。对汉字识别研究最早的是 美国i b m 公司的c a s e y 和n a g y 6 | | 7 1 o1 9 6 6 年他们发表了第一篇关于汉字识别的文 章,用模板适配法识别1 0 0 0 个印刷体汉字。手写体汉字识别的研究最早始t 7 0 年代中期的日本,我国则在8 0 年代初期开始进行手写体汉字识别的研究。目前进 行手写体汉字识别研究的国家和地区主要集中在中国、日本、中国台湾、美国和 加拿大,实际应用水平最高的首推日本1 4 】。 日本早在7 0 年代中期就开始进行手写体汉字识别的研究,1 9 8 1 年f u j i t 8 1 等人 集成笔划密度、笔划方向和背景特征实现了个实验系统,它对1 0 0 0 个字的识别 达到了8 5 的正确率,从而打破了手写体汉字识别很难的心理障碍一】。日本的东 芝、n t t 、三洋电机、富士通等公司先后推出了一批汉字识别装置和系统,具 有代表性的是1 9 8 4 年东芝制造的手写印刷体汉字识别实验装置o c r v 5 9 5 1 1 0j ,可 识别2 2 0 0 个汉字及其它符号,识别率为9 9 ,1 9 8 6 年n t t 综合通信实验室推出了手 写体汉字识别实验装置j ,可识另u j l s 第一级汉字、英文字母、数字、平假名、 片假名等3 2 0 0 个字符,识别率为9 8 。 我国( 包括台湾在内) 的起步较晚,大约8 0 年代初才开始进行手写体汉字识 别的研究1 2 1 1 1 3 1 1 1 4 i ,1 9 8 5 年以后,有关手写体汉字识别研究的文章不断出现在期 刊上。与闩本的研究人员不同,由于面对的汉字数量庞大,所以更注重结构方法 的研究。目前,国内已陆续有几个实验室系统通过了鉴定。1 9 9 5 年国家8 6 3 高技 术3 0 6 课题组组织了第四次汉字识别系统性能测试脱机手写体文本汉字识别系 统识别率为6 8 0 5 8 9 9 1 。1 9 9 6 年8 月清华大学计算机系“脱 机手写体文奉汉字识别系统”通过鉴定,标识符域为3 7 5 5 ,对工整书写的汉字识 别率为7 4 0 3 9 6 5 。1 9 9 7 年3 月清华大学电子1 :程系研制的t h o c r 一9 7 综合集成 汉字识别系统通过鉴定,其中的非特定人脱机手写汉字文本识别子系统,对书写 较为工整的手写汉字文本的正确识别率达9 5 8 。 1 2 手写体汉字识别的一般步骤1 2 i i 博1 1 “i i ”i 1 1 8 1 1 ” 一个典型的手写体汉字识别系统由前端数字化输入装置、预处理系统、识别 系统和后处理系统四大部分组成,如图1 1 所示【2 0 f 。 图1 i脱机手写体汉字识别系统简图 输入装置将写在纸或其它介质上的原始文稿通过光电扫描仪等输入设备转 换成二维图像信号( 可以是灰度图像或二值图像) ,再进行行、字切分,将整页版 面的原始图像先按书写行分割开,然后从每行中切分出单个汉字图像,送入单字 识别部分进行处理。 单字识别按先后处理顺序包括预处理、特征提取和匹配识别。由输入装置得 到的数据不可避免地存在着各种外在的干扰,使得图像质量产生偏差,会对识别 效果产生影响。因此在对原始汉字图像进行识别处理之前,尽可能降低干扰因素 是非常有必要的,也就是要先对原始采样信号进行预处理。预处理包含二值化、 平滑化( 去噪) 、归一化、字符分割| 2 ”等方面。 特征提取是从预处理后的他图像中按一定的方式获取代表汉字特征的一组 向量。在相当长的文字识别研究过程中,人们经历了例如边缘特征、变换特钲、 穿透特征、网格特征、特征点特征、方向线索特征等许多特征的提取。采用单一 的特征提取方法利用的汉字信息量有限,导致存在利用该特征难以区分的汉字。 因此运用数据融合的理论,对不同的原始特征向量进行多特征融合,合成新的特 征向量保留了参与融合的单个特征对各个类别的有效鉴别信息,有利于增强特征 向量的分类能力,可以实现最优识别特征的自动提取,滤除对类别识别无效的特 征和干扰。 匹配识别算法是整个识别过程的核心部分。将汉字特征向量与模板特征府量 按一定的原则进行匹配判决,以确定待识汉字的类别。现有的分类器主要有两类: 基于距离的分类器f 2 2 1 1 2 3 l | 2 4 】和神经网络分类器1 2 6 1 。由于每种分类方法都有自己 的优、缺点和不同的适用范围,现在人们通常采用多分类器集成方法( 包括串行、 并行以及串并行混台三种集成方式) 来提高识别率。 最后对识别结果进行后处理,即对单字识别的结果利用语言知识等中文上下 文联想构阋法进行确认或纠错。 1 3 手写体汉字识别的方法分析与技术难点 1 3 i 手写体汉字识别的方法分析1 1 1 2 1 1 1 5 1 1 1 6 i i 7 1 1 2 。1 1 2 7 1 1 2 8 i1 2 9 1 1 捌1 3 惮3 3 汉字的模式表达形式和相应的字典形成方法有多种,每种形式又可以选择不 同的特征,每种特征又有不同的抽取方法,这使得判别方法和准则以及所用的数 学工具不同,形成了种类繁多,形式特别的文字识别方法。用于汉字识别的模式 识别可以大致分为以几下类:第1 类是基于汉字结构特征的方法;第2 类是基f 汉 字统计特征的方法;第3 类是基于人工神经网络的识别方法,此外一些结构与统 计相结合的识别方法也逐渐兴起。 i 结构模式识别方法 结构模式识别理论在2 0 世纪7 f ) 年代初形成,是早期汉字识别研究的主要方 法。通常提取笔段或基本笔划作为基元,由基元组合及其相互关系町以精确地对 汉字加以描述,最后利用形式语言及自动机理论进行文法推断,即识别。结构模 式识别方法的主要优点在于对字体变化的适应性强,区分相似字的能力强,缺点 是抗干扰能力差。目前常见的结构模式识别方法有基于笔划密度特征、外围特征、 微结构特征和特征点特征的方法。 2 统计模式识别方法 统计模式识别方法是用概率统计模型提取待识别汉字的特征向量,然后根据 决策函数进行分类。统计特征的特点是抗干扰性强,匹配与分类的算法简单,易 于实现。不足之处在于细分能力较弱,区分相似字的能力差一些。另外与结构法 相比,特征无直观性的物理意义。目前常见的统计模式识别方法有模板匹配法、 利用变换特征法、投影直方图法、几何矩特征法和s p l i n e 曲线近似与傅立叶描绘 子法。 3 神经网络方法 h o p f i e l d 神经网络、a r t 网络、认知器模型等神经网络模型可用于文字识别。 这些方法主要应用于特征抽取与选择、学习训练及分类器的设计、单字识别后处 理等几个方面。不同于传统的模式识别方法,神经网络所“提取”的特征并无明 显的物理含义,而是储存在神经物理中各个神经元的连接之中,省去了由人来决 定特征提取的方法与实现过程。从这个意义上来说,神经网络提供了一种“字符 自动识别”的可能性。此外,神经网络分类器是一种非线性的分类器,它可以提 供很难想象到的复杂的类问分界面,这也为复杂分类问题的解决提供了一种可能 的解决方式。 4 统计与结构相结合模式识别方法 统计模式识别方法具有较好的抗干扰抗噪声的能力,但对汉字结构的差异区 分能力较弱,而结构模式识别方法对结构特征较敏感,区分相似字的能力较强。 在实际应用中,统计模式识别方法与结构模式识别方法通常结合使用,在特征抽 取过程中,抽取能反映汉字结构信息的统计特征,这是近年来文字识别领域的一 个重要研究方向。 在汉字识别的研究初期,人们主要是从汉字的结构上去提取特征,然后再经 过模板匹配等方法进行识别,后来,随着统计模式识别的发展,研究人员开始将 统计模式识别方法应用到汉字识别中。 然而,无论是结构还是统计模式识别,其理论都是建立在不同类事物“划分” 的基础上,从不同类事物的区别来识别,这与人类真正的识别过程是不一致的, 因此阻碍了识别率的提高。仿生模式识别理论1 3 4 1 1 3 5 i f 3 6 1 | 3 7 j 1 3 8 是基于“认识事物 而不是基于“区分”事物为目的,与传统的以“最佳划分”为目标的统计模式识 别相比,它更接近于人类“认识”事物的特性,本文将这种理论应用于手写体汉 字的识别中。 1 3 。2 汉字识别的困难和问题1 3 9 i i 帅1 1 4 1 与所有模式识别系统一样,汉字识别的主要性能指标是证确识别率和识别速 度:从实用角度看,还应考虑系统的复杂性、可靠性和价格等等。对识别系统识 别率和识别速度的要求,很难有一种统一的、严格的标准,主要根据实际应用的 需要来确定。但是作为一种输入手段,汉字识别系统的性能应该可以和其它的输 入手段( 如人工键入) 相比拟。目前由专业人员操作的汉字键入的错误率约为1 ,键入速度最高达2 0 0 字r a i n ,平均速度也在5 0 字m i n 以上。以此为参考指 标,这些指标应该是汉字识别系统必须达到的最低要求,在某些需要大量输入的 场合( 如数据库的建立) 对识别系统性能的要求还应更高。 要达到上述要求是相当困难的。这是因为:从客观上说,汉字是一种特殊的 模式集合。这种集合的模式种类( 汉字字数) 很多,结构复杂,有些模式十分相 似,加上印刷质量与干扰的影响,以及人们在书写时的随意性使字形不够规范等 原因,都使证确识别( 特别是要求具有高识别率) 十分困难。从技术上说,人们 关于模式识别的研究虽已有较长的历史,但迄今仍没有能够全面地适用于分析或 描述各种模式的严谨的理论。在研究某一种模式识别问题时,有的方法比较巧妙, 或者说,某种识别方法较符合被识别的模式集合的情况,因而得到较好的效果。 但是即使这是一种好的方法,由于不容易顾及所有各方面的问题,所得结果往往 也不是全局最佳的。例如,某一种方法可能得到较高的正确识别率,但算法可能 过于复杂,开销较大。 汉字集合识别的特点: ( 1 ) 字量大 目前我国常用汉字约3 0 0 0 4 0 0 0 个,国标g b 2 3 1 2 8 0 二级汉字共计6 7 6 3 个。 识别系统一般应能正确识别这些常用的字,才能满足实际应用的需要。显然,汉 字集合的字量越大,识别速度越低。为了提高识别速度,常采用树分类,即多级 识别方法。采用这种方法以后,识别速度虽然可以提高,但也可能使识别率下降。 汉字集合字数愈多,正确识别率与识别速度的矛盾愈大。这是汉字识别的主要困 难之一。 ( 2 ) 字体多 我国印刷字体主要有宋体、仿来体、黑体和楷体四种,手写体则有楷书、行 书和草书三大类。印刷体汉字不同字体的同一个字虽然拓扑结构基本相同,但笔 划的粗细、长短、位置及姿态,都有一定的差别,各个部件( 如偏旁、部首与主 体) 的大小比例与位置,也都有所变异。换句话说,不同字体的同一个字的字形 点阵并不相同。对于手写汉字,这种差别就更大。因此,计算机自动识别时,很 难把不同字体的同一个字,用一个参考汉字来比较、判定。这种情况将使多体汉 字识别系统所需的参考模板数成倍增加,或者要求所选用的识别特征能适应不同 字体的字形变化,否则将难以获得足够高的识别率。 ( 3 ) 结构复杂、字形相似 和拼音文字相比,汉字笔划多,结构复杂。笔划最多的汉字有3 6 划,平均 每个汉字笔划为1 1 划。由于笔划多,有的汉字结构十分复杂,有的字虽然笔划 较少,但往往字形十分相似,如“人、入”;“巳、已、己”;“戊、戍、戎”:“王、 主、玉”;“大、犬、太”等。这些字有的只有一点之差,或者某一笔划长短略有 差别,其意义就迥然不同。识别时必须能正确判定这些微小差异,否则就会发生 错误。我国工作者已经在这方面进行了大量研究并取得了一定的成果。 ( 4 ) 手写体风格众多,随意性大,无规律可循。不同的书写风格导致的汉 字的变形差别很大,主要表现在以下方面:基本笔划变化。横不平,竖不直, 直笔变弯,折笔的拐角变成圆弧,短横、短竖变点点变捺,该连的不连,不该 连的却相连等等。笔划与笔划之间的相对位置不确定,部件与部件之间的位置 发生变化。笔划的倾斜角度、笔划的相对长度、部件的相对大小发生变化。 脱机书写的其它因素,如纸张,用笔的好坏,笔划的粗细,字形的大小,扫描仪 性能的好坏等等,都会导致识别的困难。 其中,手写体汉字字形的变化和相似字是最难以解决的问题。目前,识别率 较高的研究都是在工整和规范书写的前提下实现的。 汉字识别可简单的分为两个过程:学习( 训练) 过程和识别过程。学习过程 就是让计算机通过样本学习或训练提取出每个汉字的特征并存储起来,作为标准 特征库,即模板库;识别过程中,计算机首先按学习过程中的特征提取方法提取 出输入模式的特征,然后再与标准特征库中的特征进行匹配,匹配程度最大的汉 字即为识别结果。因此,如何确定表达待识别汉字模式的最佳特征,如何进行特 征匹配,从而进行高效、快速的识别,是汉字识别技术的关键所在。 1 4 当前的研究热点i 7 1 1 3 1 1 1 4 2 i 1 预处理技术 手写汉字变形问题是非特定人脱机手写汉字识别中的关键问题,所谓脱机手 写汉字识别的预处理,就是探讨直接从汉字点阵图像上补偿手写变形、减小属于 同一类别的不同模式之间的差异的理论和方法。通常,直接从汉字点阵图像上消 除手写变形的方法有两种,即非线性归一化方法和变换函数法。 非线性归一化是预处理方法的主流和核心,其目的主要是将不同大小的汉字 点阵归一化成相同大小并直接在汉字点阵图像上矫正手写变形。常用的非线性归 一化方法有:基于点密度均衡的非线性归一化、基于的笔划穿透数目均衡的非线 性归一化、基于笔划间隔均衡的非线性归一化、基于线密度均衡的非线性归一化、 基于汉字点阵二维平面矫形的非线性归一化等。各种非线性归一化方法的主要区 别在于如何刻画汉字笔划的疏密程度的不同,使得归一化后的汉字点阵中笔划分 布尽量均匀。 变换函数法是近年来图象识别及文字识别的一个研究方向,常用的变换函数 法有基于几何模型的变换函数法、余弦整形变换函数法、基于笔划倾斜角度的变 换函数法等。三种方法各有优缺点,能解决不同类型的手写形变。但是,目前的 变换函数法的自适应能力不强,如何根据不同的手写变形自适应地采用不同的变 换函数和不同的处理方法是变换函数法今后的研究方向。 2 特征抽取与分析 特征抽取是模式识别的一个重要环节,抽取稳定且有效的特征是识别系统成 功的关键。一般认为,汉字笔划及其相对位置关系是手写汉字中最为稳定的特征, 然而,直接从汉字点阵图像上准确地抽取汉字的每一个笔划并找出其相对位置关 系则十分困难。统计特征具有良好的抗噪声、抗笔划的粘连与断裂等特性,但是, 方块汉字具有二维结构,单纯利用统计特征还不能很好的反映出汉字的结构信 息,所以,一种有效的手写汉字特征应该将汉字的统计特性与结构信息结合起来, 将汉字笔划的特性与汉字背景空白处的特性结合起来。 但是一个汉字的特征能够使得该汉字类别与其它汉字类别区分开来,则该汉 字的特征具有足以描述该汉字的信息,然而,从上述这些特征中还不能恢复出原 始汉字点阵,这些特征还不足以描述汉字,因此,寻找与之互补的其它特征是今 后的研究课题之一。 3 彭 别字典的生成 在手写汉字识别中,由于不同人书写风格的差异造成的手写变形很大,使得 属于同一汉字类别的不同样本之间的差异较大,产生一个具有代表性的识别字典 是补偿手写变形、提高手写汉字识别率的有效途径,通常,识别字典可以分成单 模板字典和多模板字典两大类,前者指每个类别仅有一个参考槿板( 也可称为代 表元) 存放在识别字典中,而后者指每类有一个或一个以上的参考模板。显然, 由于手写变形的存在,单模板字典显得不足,因此有必要生成多模板字典,问题 的关键在于如何生成多模板字典。 4 多方案集成 多方案集成是近年来文字识别领域的一个主要研究方向,任何一种特征、任 何一种识别方法都有其优点和局限性,借鉴印刷体汉字识别的成功经验,走多特 征组合、多方案集成的道路,也许是脱机手写汉字识别系统走向实用化的有效途 径。常用的分类器集成方法有投票法、概率法、d e m p s t e r - s h a f e r 法,行为知识空 间法、综合集成法、基于置信度的神经网络集成法等。 5 单字识别后处理 通常,在识别实际文本时,需要对单字识别的结果进行基于中文上下文联想 构词法的识别后处理。利用后处理技术,应该能够实现对单字识别结果的确认或 纠错,并进一步区分相似字。 6 、仿生模式识别 以仿生模式识别理论为基础,以一类样本在特征空间中分布的最佳覆盖作为 目标的仿生模式识别方法具有更接近人类真实的认识过程。它以“认识”为目标, 即是在学会认识事物的过程中,不需要其它类的参与,这同人类认识事物的方式 是一致的,它体现了一类事物与无限类事物的区别,因此它可以认识无限类事物, 上述特点决定了其在属于超多类模式识别的手写体汉字识别方面具有无可比拟 的优越性。 1 5 本课题研究的意义及论文的内容 手写体汉字谚 别的研究因其广泛的应用前景,在人工智能与模式识别领域中 已成为一个十分活跃的研究方向。手写体汉字是一个复杂的多模式识别问题。由 于手写体汉字书写风格因人而异等因素,使提高脱机手写体汉字识别的识别正确 率存在相当的困难,尚未达到令人满意的效果。 近年来,围绕手写体汉字图像识别的研究在很多方面已取得了重要进展。很 多研究报道对脱机手写体汉字识别的特征提取和采用最近邻分类器,以及神经网 络分类器的识别方法。这些方法以如何用先验知识自定义规则将一类已知特征样 本在有限特征空间中的最佳划分作为目标,以机器的有限“区分”识别手写体汉 字。 人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具 有良好容错性的文字识别系统。如何建立模仿人类看图识字的认知机理和过程是 值得研究的方法之一。文章通过对手写汉字仿生识别的几个关键问题研究,力图 探索一些具有容错性能的应用于手写汉字识别的汉字基本笔划获取方法和基本 笔划复合连接交叉所形成的拓扑结构分析方法,以及模仿人类汉字形码输入法建 立具有冗余容错形状的手写体汉字特征知识的方法,以提高机器仿人识别手写体 汉字图像的容错性和准确性,这可对人工智能与模式识别的理论方法研究提供应 用参考实例。 论文共分七章: 第一章,系统阐述目前汉字识别技术的研究现状、发展历程、研究热点和当 前的汉字识别方面需要解决的问题,最后介绍了本文研究的意义和各章的内容安 排。 第二章,介绍了仿生模式识别理论与多权值神经元网络原理。 第三章,根据手写体汉字的仿生认知机理,汉字可通过被拆分成若干基本笔 划复合连接交叉所形成的相对不变的拓扑结构来“认知”。给出了一种基于方向 游程的笔段图形提取方法;定义了一种改进的基于笔段双权值椭圆型神经元序列 的笔段图形获取方法;运用仿生模式识别方法,将手写体汉字图像转化为具有容 错表征方式的汉字基本笔划类型在不同位置组成的几何图形:构建了笔段神经 元。 第四章,模仿人认识汉字的容错机理,不同的笔段可被合成为另一类定型的 笔划以及同一类型笔划的不同形变可被归为同类笔划。归纳了笔划的笔段合成及 其容错形状;定义了汉字笔划神经元合成规则以及笔划神经元相合相交类型的判 别规则;构建了手写体汉字特征知飒的数据结构表。 第五章,仿人学习、记忆与对比判断的能力,定义了容错性识别方法,通过 “认知”手写体汉字的基本笔划形状、数量、位置和相合相交数量等信息来灵活 容错的比较判断识别各类手写体汉字。 第六章,选取对应s c u t - i r a c 手写体汉字库中的手写体汉字图像对所定义 的方法进行验证实验,给出了手写体汉字的识别结果,并分析了实验结果以及重 特征知识数据结构表的汉字类型。 第七章,对本文的研究工作进行总结以及对进一步工作的展望。 第二章仿生模式识别理论与多权值神经元网络原理 2 1 仿生模式识别原理简介跚嘲删册【3 8 1 传统模式识别中把不同类样本在特征空i h j 中的最佳划分作为目标,而仿生模 式识别则以“认识”而不是“划分”为目标,它比以“最佳分类”为目标的传统 模式识别方式更接近人类真实的认识过程。以二维空间的情况示意如图2 1 。 i :i 荔) 0 | 夕1 、7l 一 t : 7 图2 1 仿生模式识别二维空间覆盖示意图 图中,三角形为要识别的样本,圆圈和十字形为与三角形不同类的两类样本, 折线为传统b p 网络模式识别的划分方式,大圆为r b f 网络的划分方式( 等同 于以模板匹配的识别方式) 细长椭圆形构成的盐线代表仿生模式识别的“认识” 方式。 因此,仿生模式识别把分析特征空间训练样本点间的关系作为基点,而特征 空间中样本分布的连续性规律为此提供了可能性。仿生模式识别用的方法是“高 维空间复杂几何形体覆盖识别方法”,是在特征空间中研究某类样本的分布状况 而加以合理覆盖,从而来“认识”某类样本。仿生模式识别与传统模式识别的差 异如表2 1 所示。 表2 1 仿生模式识别与的差别 传统模式识别仿生模式识别 基本出发点多类事物的最佳分类一类类事物的认识 理论基础所有可用的信息都特征空间中同类样本 包含在训练集中的连续性规律 数学工具统计学拓扑学 分析方式代数、方程的理论推导高维空问画法几何 ( 逻辑思维)( 形象思维) 识别方法划分高维空间复杂几何形体覆盖 实现途径支持向量机、传统多权值高阶神经元网络、 神经网络等通用神经计算机 仿生模式识别把分析特征空间训练样本点间的关系作为基点,而特征 空间中样本分布的连续性规律为此提供了可能性。仿生模式识别用的方法 是“高维空间复杂几何形体覆盖识别方法”,是在特征空间中研究某类样 本的分布状况而加以合理覆盖,从而来“认识”某类样本,它就是强调用 “认识”模式取代传统的模式“分类”与划分。 2 2 仿生模式识别的数学工具一一多维空间几何分析理论 2 2 1 神经元的多维空间几何对应 广义地看待一个神经元可以理解为一个如下的基本运算操作: y = f ( x ,工2 ,:,x 。) 一0 】 ( 2 1 ) 神经元的基本运算规则。如对于b p 网络的神经元 而对于r b f 网络的神经元,则可取 ,x n ) = x ( 2 2 ) ,“) = ( 一。) 2 2 ( 2 3 ) 因而可以把一个神经元对应于多维空间中一个超平面或超面,其方程式为 o ( x 1 ,x 2 ,= ,x n ) 一0 = 0 ( 2 4 ) 而神经元输出函数f n 基是输入空间的输入点偏离该超平面或超曲面的程度。 显然超平面或超曲面的几何概念对于帮助人们对神经网络行为的认识与分 析是十分有效的。 2 2 2 多维空间几何的基本分析方法与定理证明 原苏联科学院院士和通讯院士a 亚历山大洛夫等的一部数学名著”中对 多维空间几何学的内容及其发展史作出了简单的介绍:德国数学家格拉斯曼和英 国的数学家凯利通过与普通的解析几何作形式的类比的途径得到多维空间解析 几何原理的表达。瑞士数学家史雷夫里讨论了多维空间的j 下多面体的问题。但多 维空间几何学虽历经多年的发展,而目前尚未形成系统而实用的几何分析方法。 本论文给出了如下的多维空间几何学的公理、 定理及其证明,以便应用于人工神经网络行为的分析研究中。 1 、基本定义自由度 自由度等于维数。n 维空间有n 个自由度。 约束:对于h 维空间的点p ( z 1 x 2 x ) ,若存在,( x l 2 ,) = c ,则称 ,为p 的一个完全约束。若存在f ( x l , x 2 ,x a ) 蔓f 或厂( x l j 2 。) c ,则称 ,为p 的一个不完全约束。( 若无特殊说明,本文提及的约束均指完全约束) 超平面:胛维空间中的k 维超平面定义为满足下面的n - k 个各自独立的线性 方程的点的轨迹: a | l x l + a 1 2 x 2 + + a 1r , x n + b l = o ( 2 5 ) 啦i z l + a 2 2 x 2 + + a 2 x n + b 2 = o ( 2 - - 6 ) ( 卅k ) l x l + 川卅i ) 2 x 2 + + ( ”一 ) i 而l + 6 f 月一k ) = 0 ( 2 7 ) 这些方程中的每一个都表示一个一l 维超平面,而它们全体则共同决定”k 个这种超平面的公共点。每个方程中x 的系数a l , a 2 ,a 。就是该月一1 维超平面的 法线向量的系数。 超球面:到定点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论