



全文预览已结束
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
清 华 大 学 学 报 自 然 科 学 版 10 26 1997年 第37卷Journal of T singhua U niversity Sci 智能技术与系统国家重点实验室 北京100084 收稿日期 1996207204 第一作者 男 1961年生 副教授 3 国家自然科学基金 69675004 和国家 八六三 高科技 项目 863 23062032052 3 文 摘 方向线素特征在手写体汉字识别中得到了广泛的 应用 文中对该特征进行了形式化描述 分析了其存在的不 足 在普通方向线素特征的基础上 引入模糊数学思想 提出 了汉字的模糊方向线素特征 给出了形式化描述 应用该特 征实现了一个非特定人手写体汉字识别系统 经对含有 37550个汉字 10 套国标一级汉字 的未学习样张的测试 识 别率由8515 提高到8917 十选正确率达到9814 在同 等测试条件下 比单纯使用方向线素特征识别率提高了四个 百分点 关键词 汉字识别 模糊特征 特征抽取 分类号 TP 242 6 手写体汉字 其形状千差万别 因人而异 字形 的差别主要表现有三点 1 笔划长短差异 2 笔划位 置差异 3 规范性程度差异 这三种差异的不同组 合 造成了手写体汉字的千差万别 同时也给识别工 作带来了巨大困难 以至于手写体汉字识别被认为 是字符识别的最终目标 本文首先对常用的汉字方向线素特征进行了形 式化描述 指出了其存在的不足 针对字形差异的主 要表现 引入模糊数学的思想 提出了汉字的模糊方 向线素特征 最后采用本文所提出的方法 实现了一 个非特定人手写体汉字识别系统 经对含有37 550 个 10 套国标一级汉字 不同人书写汉字的未学习 样张的测试 识别率由原来的8515 提高到8917 充分说明了模糊方向线素特征的有效性 1 汉字的模糊方向线素特征 方向线素特征已被证明是一种行之有效的手写 体汉字识别特征 1 可形式化地描述如下 设F i j 是汉字规格化后的N3N二值化点 阵图象 F i j 0 白像素 1 黑像素 定义1 设F i j 是汉字的二值化图象点阵 当满足条件 F i j 0 u 1 0 v 1 F i u j v 1 时 称点 i j 为该汉字的笔划边缘点 简称边缘 点 边缘点的全体称为笔划的轮廓线 定义2 对任意两个相邻的边缘点 i j 和 k l 定义集合 H i j i k 0 l j 1 S i j j l 0 i k 1 P i j i k 1 j l 1 N i j i k 1 l j 1 分别称为汉字的方向属性集合 集合中的元素 是汉字 横 竖 撇 捺 四种笔划的反映 例 如 若 i j H 则说明该汉字在点 i j 处有 横 的因素存在 但不一定是横笔划 也可能是 撇 或 捺 的部分 定义3 将点阵F i j 均匀地划分为m3m 个网格 第k个网格所包含的边缘点的全体称为网 格集 记为Nk k 0 1 m3m 1 定义4 第k个网格的方向线素为一个四维 向量 记为Ek Ek H Nk S Nk P Nk N Nk 其中 为求集合的势 定义5 所有网格的方向线素按顺序排列起 来 组成一个m3m34维的向量 称为汉字的方向 线素 记为 X x0 x1 xm m 4 1 T X即为该汉字的特征向量 一个汉字区分于其他汉字的主要特征就是笔划 及其所在位置 如果将笔划中的 点 和 左上提 划 归到 捺 的范畴 将 右上提 划归为 撇 的范畴等 等 则广义地讲 汉字是由 横 竖 撇 捺 四 种笔段组成的 四种笔段的数量及其相互位置关系 唯一地决定了一个汉字 方向线素特征刚好表达了 汉字在不同的空间位置上 四种笔段数量的多与寡 从而较好地表达了汉字的笔划和位置这两个主要特 征 被广泛地应用于手写体汉字识别中 并取得了较 好的效果 但从定义可以看出 该特征存在两点明显 的不足 1 网格的划分是确定的 即对于某一网格来说 点 i j 或者属于该网格 或者不属于该网格 是一 个确定性的问题 然而由于书写引起的位移等因素 的影响 不同的人书写 或者同一人在不同时间不同 环境不同心态下书写的同一汉字 同一笔划可能会 落入不同的网格 对于横竖笔划发生这种情况的可 能性更大 其结果使得笔划的微小位移可能会导致 特征的突变 2 方向属性的确定只考虑了相邻两个边缘点的 情况 带来的问题是使得噪声对方向属性的确定影 响较大 以上两点均可以通过定义模糊集合的方法来减 弱其影响 为此 提出汉字的模糊方向线素特征 为解决第一个问题 相应于集合Nk引入模糊 网格集FNk 定义6 设网格中心为坐标原点 网格边长为 2n a 0 n 论域U为全体边缘点 则模糊网格集 FNk定义为 FN k i j 1 a i a a j a 1 2 a n i 2n a a j a a i 2n a 1 2 n a i a 2n a j a a 2n i a 1 2 a n j 2n a a i a a j 2n a 1 2 n a j a 2n a j a a 2n j a 1 2 a n i j 2n a a j 2n a a i j 2n 1 2 a n i j 2n a a 2n j a a i j 2n 1 2 n a i j a 2n a j 2n a j 2n i a 1 2 n a i j a 2n a 2n j a j 2n i a 0其它 其形状如图1所示 图2是相邻网格隶属函数的中 心位置剖面示意图 由图中可以看出 相邻网格的隶 属函数是交叉的 这样 某边缘点是否属于某一网格 不再是一个确定关系 而具有一定的模糊性 由于隶 图1 隶属函数示意图 图2 隶属函数剖面图 属函数是连续的 从而排除了特征突变的可能性 当 a n时 模糊方向线索则退化为普遍的方向线素 为解决第二个问题 首先改变一下属性集合的 定义 考虑三个相邻边缘点的情况 定义7 设 i j 是边缘点 k l u v 是与 i j 相邻的两个互不相等的边缘点 重新定义集 合 H i j i k 0 i u 0 l j 1 j v 1 S i j j l 0 j v 0 i k 1 u i 1 P i j i k 1 u i 1 j l 1 v j 1 N i j i k 1 u i 1 l j 1 j v 1 相应地引入模糊集合FH FS FP和FN 论域U均 为全体边缘点 对任意 i j U 如果 i j H 或 i j S 或 i j P 或 i j N 则隶属度 FH i j 1 或 FS i j 1 或 FP i j 1 或 FN i j 1 否则 视 i j l k 和 u v 三点的组成情 况 以隶属度 FH i j 或 FS i j 或 FP i j 或 FN i j 进入模糊集合FH 或FS 或FP 或FN 例如 如果 i j k l 和 u v 间满足条件 如 图 3 k l i j u v 图3 边缘点排列示例 34马少平 等 基于模糊方向线素特征的手写体汉字识别 j l 0 k i 1 i u 1 j v 1 则可取 FH i j 0 FS i j 0 5 FP i j 0 5 FN i j 0 定义8 设A B是二个论域为U的模糊集 合 A与B的交集定义为 D A B x U D x 3 B x 定义9 论域为U的模糊集合A的势定义为 一实数 A 6 x U A x 定义10 第k个网格的模糊方向线素为一个 四维向量 记为FEk FEk FN k FH FN k FS FN k FP FN k FN 其中 为模糊集合求势 定义11 所有网格的模糊方向线素按顺序排 列起来 组成一个m3m34维的向量 称为汉字的 模糊方向线素特征向量 记为 X x0 x1 xm m 4 1 T 其中 xi i 0 m3m34 1 为模糊数 隶属函 数 xi 各自不同 由实验确定 2 系统实现 基于模糊方向线素特征建立起来的非特定人手 写体汉字识别系统由模式输入 预处理 模糊特征抽 取 特征匹配和结果输出五部分组成 其中 模式输 入部分将扫描 切分后的单个汉字图象点阵读入到 内存 并将原来按位存放的图象转换为按字节存放 预处理部分对图象进行简单的消噪声及平滑处理 后 采用二次函数非线性规格化方法对汉字图象进 行规格化 模糊特征抽取部分首先抽出汉字笔划的 轮廓线 然后根据本文所介绍的方法 抽取汉字的模 糊方向线素 在字典中存放的是标准汉字的模糊方 向线素特征 特征匹配部分将当前字特征与字典中 的标准特征进行匹配 按照城区 City Block 距离 距离最小者即为识别结果 如下式所示 m in j 1m 6 n i 1 x j i xi 其中 x j i为字典中第j个汉字的第i个特征分量 xi 为当前汉字的第i个分量 n为特征维数 m为字典 中汉字总数 最后将识别结果及10个候选存入到文件 中 3 实验结果 为验证系统的有效性 用中国科学院自动化所 收集的50套一级汉字样张对系统进行了测试 其中 40套样张用于学习 10套样张用于测试 识别结果 如表1所示 从中可以看出 在相同测试环境下 采 用模糊方向线素特征比用普通方向线素特征 一选 识别率提高了四个百分点左右 证实了本文所提方 法的有效性 表1 识别结果 所用特征一选二选三选四选五选六选七选八选九选十选 普通方向线素8515921394139513951996139617961997119712 模糊方向线素8917941595179614961997139716971998129814 a 普通方向线素特征情况 b 模糊方向线素特征情况 图4 位移与距离变化曲线 44清 华 大 学 学 报 自 然 科 学 版 1997 37 3 为何模糊方向线素特征会带来如此好的结果 呢 设网格宽度为m个象素 图4给出的是一个由 n个象素组成的竖线 当其横向移动位移S时所引 起的距离D变化曲线 a 和 b 分别对应普遍方向 线素特征和模糊方向线素特征时的情况 从图中可以看出 位移对模糊方向线素特征的 影响是逐渐加大的 不象普通方向线素特征那样有 一个大的突变 表明模糊方向线素特征鲁棒性能好 但在实验中我们也发现 应用模糊方向线素特征后 对相近字的识别率有所下降 这也从另一个侧面说 明了该特征对汉字小范围内的变化不敏感的特点 适应手写汉字较大的变化 及对相近字的正确识别 历来是手写体汉字识别中的一对矛盾 利用上下文 知识 对识别结果进行后处理 是解决这一问题的较 好方法 2 4 结束语 本文根据手写体汉字的变形特点 提出了汉字 模糊方向线素特征 可以较好地反映汉字笔划基本 单元 横竖撇捺在空间的分布 较好地消除由笔 划位移和笔划边缘不光滑等因素引起的噪声干扰 可消除一些汉字的不稳定因素带来的不利影响 综 合起来 该特征有以下特点 1 是汉字组成信息的反映 从汉字学角度来看 汉字是由十几种不同的笔 划组成的 而组成笔划的基本单元是横竖撇捺 基本 单元的全体及其空间相对位置 唯一地确定了一个 汉字 方向线素特征表现的刚好是一个汉字在其不 同的空间位置上 横竖撇捺四种因素的多寡 是组成 该汉字的基本单元及其空间位置的反映 可以较好 地反映一个汉字的组成信息 2 对笔划位移不敏感 笔划位移是引起汉字差异的重要因素之一 由 模糊方向线素特征的定义可以看出 当笔划在网格 内位移时 特征值不变 当跨越网格移动时 特征的 变化由移动距离和隶属函数决定 如果隶属函数定 义的较合理 则特征对笔划位移将不敏感 3 对笔划边缘噪声敏感较小 由扫描得到的待识汉字笔划边缘往往不光滑 凹凸不平 由于在方向线素中考虑了三个相邻边缘 点的情况 并根据其连接关系赋予不同的隶属度 从 而使得特征对边缘噪声敏感较小 参 考 文 献 1郭 军 1 余弦整形 换 用 手书 文字认识 1 信学论 D 1993 76 4 835 842 2夏 莹 马少平 朱小燕 1 脱机手写汉字识别 1 智能 计算机接口与应用进展 威海 1995 33 38 Handwritten Chinese characters recogn izing based on fuzzy directional line element feature Ma Shaoping Xia Ying Zhu Xiaoyan Department of Computer Science and Technology T singhua U niversity State Key L aboratory of Intelligent Technology and System s Beijing 100084 Abstract The directional line element feature has been applied in the recognition of handw ritten Chinese characters w idely This paper presents a formalized description of this feature Basing on the common directional line element and according toits defect the fuzzy mathematical idea is introd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生外出旅游安全协议书5篇
- 新解读《GB-T 32622-2016社会保险征缴稽核业务规范》
- 2025防盗门工程承包合同2篇
- 高级房屋售卖合同范本
- 赠予车位合同范本
- 河南高层工程施工方案
- 简易办公租房合同范本
- 石材购销合同范本
- 的消防合同范本
- 承建喷泉工程合同范本
- 海天注塑机全参数DOC资料全
- Test Plan Template:测试计划模板
- (完整版)三年级下册数学开学第一课ppt
- 苏教版四年级科学上册全册课件
- JJF1101-2019环境试验设备温度、湿度校准规范-(高清现行)
- 人教版新教材高中物理实验汇总及答案详解
- 中班语言《大狮子和小老鼠》课件
- TSG11-2020 锅炉安全技术规程
- 资助业务工作培训
- 《足球运动发展史》PPT课件
- IPQAM调制器操作说明书(共36页)
评论
0/150
提交评论