人工智能及识别技术藏文识别的预处理_第1页
人工智能及识别技术藏文识别的预处理_第2页
人工智能及识别技术藏文识别的预处理_第3页
人工智能及识别技术藏文识别的预处理_第4页
人工智能及识别技术藏文识别的预处理_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工智能及识别技术人工智能及识别技术 藏文识别的预处理藏文识别的预处理(一)藏文文字特点及构成 藏文在字形上与汉字有着很大的差异, 在单字的识别技术上会有很大的不同, 但在预处理技术上却有许多可以借鉴的地方, 同时根据藏文本身的特点, 又可以在此基础上加以改进。 藏文是一种以辅音字母为主要构件的特殊的拼音文字,有30个辅音字母和4个元音字母。元音字母不能独立书写,只能加在辅音字母的上部或下部。辅音字母中又有两类特殊的辅音字母, 叫做上加字和下加字, 也只能加在其它辅音字母的上部或下部。一、藏文识别的预处理一、藏文识别的预处理文字识别的预处理文字识别的预处理 预处理是整个文字识别系统的重要组成部

2、分。 印刷体字符识别时, 首先将印在纸上的字符经光电扫描转换为数字信号输入计算机。 纸张薄厚、洁白度、油墨深浅、印刷质量都会产生污点、断笔、交连等干扰, 版面中可能文本与图形共存, 字符大小位置不确定, 扫描时摆放不正等等使识别无法在原始图象上直接进行。因此, 在进行单字识别之前, 首先要对原始图象进行预处理。由于识别过程是在经过预处理的文字图象上进行的, 预处理性能的优劣将直接影响整个识别系统的性能。 对于一个藏文音节来说, 其最复杂的拼写如图所示,每一个方块表示一个字母。在识别过程中以字丁(音节拼写的每一个横向基本单位称为字丁)为基本的识别单位。 藏文字形结构:基字、前加字、后加字、上加字

3、、下加字、再后加字 根据藏文在书写上和字形上的特点, 实现了一种适用于藏文识别的预处理技术。整个预处理过程包括:二值化二值化 版面分析版面分析 倾斜校正倾斜校正 行字切分行字切分 归一化归一化二次定值法: 先根据经验取 作为阈值, 对文字图形进行整体阈值二值化, 区分出是背景还是图象。再分别求出对应 的图象和背景的灰度平均值 和 , 定出二次选用的阈值: 首先由灰度级直方图确定整体阈值 ,然后用二次定值法得到 作为最后的二值化阈值。局部闭值二值化法 由象素点的灰度值和该象素点的周围点灰度特性来确定该象素点的二值化阈值。对于印刷质量差, 干扰较严重的文本图象, 使用局部阈值二值化方法可以得到较好

4、的效果。(三)倾斜校正(三)倾斜校正 通常扫描得到的图象由于扫描时摆放不正会造成图象中文本有不同程度的倾斜。因此需要进行倾斜校正。 音节点的提取 印刷体藏文每一行文字中音节点都在同一条水平线上,可以利用这个特点计算文本的倾斜角。 利用提取连通域的方法提取文本图象中的音节点, 如果一个连通域的点的数目小于阈值TCh,大于阈值TCl,则认为该连通域为一个音节点,TCl阈值的作用是消除小污点的干扰, 将点数小于阈值TCl的连通域作为噪声直接删除。 由于音节点的大小要比藏文字母小得多, 阈值TCh、TCl可以取音节点象素点个数SC的一定比例。 如取TCh。 SC的值可以通过统计连通域的点数得到。(二)

5、二值化(二)二值化用于识别的文字图象通常可以是256级灰度图或二值图,因此在预处理模块中加入灰度图的二值化功能,一方面可提高二值化的质量, 另一方面也可增强识别软件的适用性。二值化算法有 整体阈值二值化 与 局部阈值二值化 两种整体阑值二值化:是指对一幅图象的各个部分都用同一闭值进行二值化, 而不考虑图象局部的情祝。由灰度级直方图确定整体阈值通常文本图象的直方图有两个峰值一个对应字符笔划部分另一个对应字符的背景部分。阈值应取在两个峰值的波谷处, 波谷越陡, 二值化效果越好。 图2所示的藏文文本图象中的连通域的点数分布如图3所示, 由干音节点的大小相似, 形成明显的峰值, 可以将分布图中峰值点对

6、应的象素点数作为SC的估计值。(3 3)图像旋转)图像旋转 图象旋转可以采用坐标变换的方法,以原点(图象的中心点)为中心进行旋转 角:其逆变换为: 图2所示的藏文文本图象, 提取音节点, 然后对其进行霍夫变换的结果如下: 从图4中还可以看到原始图象中每一行都会形成一个峰值,而且各个峰值点所对应的 值是一致的,因此可以同时提取多个峰值点,从一组 值中统计出最佳结果。(2 2)霍夫()霍夫(HouphHouph)变换)变换 提取了音节点之后,对其进行霍夫变换。霍夫变换是一种线描述方法, 它将笛卡儿坐标空间中的线变换为极坐标中的点。如果用 表示直线距原点的法线距离, 为该法线与轴的夹角, 则可以用如下的参数方程来表示该直线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论