文字识别算法

上传人：1*** IP属地：浙江上传时间：2020-04-09 格式：DOCX 页数：12 大小：115.09KB 积分：15 举报 版权申诉

免费预览已结束，剩余7页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

题题目目图像分割技术学学院院计算机科学与技术班班级级计软 1401 学学生生兰俊锋学学号号 20141214023 文字识别是智能识别技术中的一个重要技术文字具有便于信息保存和传递的优点使信息在时间和空间上得以迅速扩散在人们的日常生活中在机关事务处理工业以及商业交往中需要识别文字的数量如同天文数字但利用计算机识别的文字量却很少最近几年随着计算机技术数学和图像技术的发展文字识别的应用领域逐步扩大目前较为活跃的应用包括数字识别文字识别等文字识别是指用计算机字典高速地识别现在介质如纸张等上的数字英文符号或汉字文字识别实际上就是解决文字的分类问题一般通过特征及特征匹配的方法来进行处理本文将从算法应用两方面介绍文字识别技术本文介绍的文字识别应用有英文字母识别车牌特殊文字识别书写文字识别特殊文字识别文字是人类相互交流信息的重要工具社会发展进入信息时代人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息而是使用计算机将文字自动的输入计算机用计算机对他们进行处理随时以各种方式满足人们的不同需要因此研究如何用计算机自动识别文字图像解决文字信息自动输入计算机并进行高速加工处理的问题已引起大家的广泛关注归一化算法一般作为一种图像的预处理技术其目的是将采集到的原始图像转换成特征提取器所能接受的形式灰度图像或二值图像消除一些与类别无关的因素噪声消除归一化等从理论上讲经过归一化后的骨架应该是宽度为一的中心线但这是不可能的不同的硬件设备和不同的算法得出的结果可能不是唯一的其结果与原图案的扭曲程度也是不样的扭曲程度尽量的小应该是归一化算法追求的目的之一既然预处理是为后续的特征提取和分类器设计服务的那么预处理方法的选择就应该有利于特征的提取以使分类变得简单汽车牌照识别在高速公路收费电子警察和治安卡口等系统中有重要的应用价值作为图像识别的典型问题汽车牌照识别的研究有很长的历史但因为实际路况的高度复杂性如车速光线污染及变形等目前的性能还不能令人满意 1 1 文字识别过程概述文字识别过程概述一般来说文字图像的识别过程主要由以下 4 个部分组成正确地分割文字图像区域正确地分离单个文字正确识别单个文字正确地连接单个文字其中属于文字图像分析技术问题属于文字识别技术问题关于由于仅从分割处理不能对其进行评价通常采用文字识别地评价值来判断分离的正确性单纯的文字识别是指经二值化处理后的单个文字识别 1 1 1 1 文字识别系统的原理及组成文字识别系统的原理及组成文字图像的识别的原理如下图所示图中光电变换检测部分的主要功能是对纸面上的文字进行光电转换然后经模数转换成具有一定灰度的数字信号送往其后的各部分进行处理和识别常用的检测设备是扫描仪 CCD 摄像头等文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割将真正的文字图形分割出来以便后续进行识别识别与处理部分的功能是将已分割出的文字图形信息加以区分去除信号中的污点空白等噪声增强文字图像的信息并根据一定的准则除掉一些非本质信号对文字的大小位置和笔画粗细等进行规范化以便简化判断部分的复杂性特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息供识别部分进行识别作为特征提取的内容是比较多的可以是几何特征如文字线条的端点折点和交点等识别判断部分则是根据抽取的特征运用一定的识别原理对文字进行分类确定其属性达到识别的目的实际上判断部分就是一个分离器识别系统学习部分的功能是生成计算机特征字典学习根据已准备好的多个字样抽出代表该字的特征进行修改按照字典的规定位置存放该特征学习分为两种一种是在人的参与下进行称为有教师学习一种由计算机自动进行称为无教师学习 1 2 1 2 文字识别的方法文字识别的方法文字识别是指用计算机字典高速地识别现在介质如纸张等上的数字英文符号或汉字文字识别实际上就是解决文字的分类问题一般通过特征及特征匹配的方法来进行处理特征判别是通过文字类别例如英文或汉字的共同规则如区域特征四周边特征等进行分类判别它不需要利用各种文字的具体知识根据特征抽取的程度知识的使用程度分解到地使用结构分析的办法完成字符的识别匹配的方法则是根据各国文字的知识称为自动采取按形式匹配的方法进行按实现的技术途径不同又可分为两种一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配另一种是只抽出部分图像与字典进行匹配然后根据各部分形状及相对位置关系与保存在字典中的知识进行对照从而识别出每一个具体的文字前一种匹配方法适合于数字英文符号一类的小字符集后一种匹配方法适用于汉字一类的大字符集 1 3 1 3 边缘检测边缘检测边缘 Edge 是指图像局部亮度变化量最显著的部分边缘主要存在于目标与木板目标与背景区域与区域包括不同色彩之间是图像分割纹理特征提前和形状特征提取等图像分析的重要基础图像分析和理解的第一步常常是边缘检测由于边缘检测十分重要因此成为机器视觉研究领域最活跃的课题之一图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关图像亮度的不连续可分为阶跃不连续即图像亮度在不连续处的两边的像素灰度值有着显著的差异线条不连续即图像亮度突然从一个值变化到另一个值保持一个较小的行程后又返回到原来的值在实际中阶跃和线条边缘图像是很少见的由于大多数传感元件具有低频特性使得阶跃边缘变成斜坡型边缘线条边缘变成屋顶形边缘其中的亮度变化不是瞬间的而是跨越一定的距离对一个边缘来说有可能同时具有阶跃和线条边缘特性例如在一个表面上由一个平面变化到发线方向不同的另一个平面上就会产生阶跃边缘如果这一表面具有镜面反射特性且两平面形成的棱角比较圆滑则当棱角圆滑表面的法线经过镜面反射角时由于镜面反射分量在棱角圆滑表面上会产生明亮光条这样的边缘看起来像在阶跃边缘上叠加了一个线条边缘由于边缘可能与场景中物体的重要特征对应所以它是很重要的图像特征比如一个物体的轮廓通常产生阶跃边缘因为物体的图像亮度不同于背景的图像亮度 2 2 简单贝叶斯分类器简单贝叶斯分类器简单贝叶斯分类器 Simple Bayes Classifier 或 Na ve Bayes Classifier 1 假定特征向量的各分量间相对于决策变量是相对独立的对于特征向量为 X x1 x2 xd T的测试样本它属于第 Ci类的条件概率为 P Ci X P X Ci P Ci P X P Ci P X 1 对每一个类别即取不同的值都计算上面的条件概率最终的识别结果为条件概率最大的那一类别虽然简单贝叶斯分类器是基于独立性假设的在违背这种假定的条件下简单贝叶斯也表现出相当的健壮性和高效性 678 它已经成功地应用到分类聚类等问题中 2 1 2 1 简单贝叶斯分类器在切分中的应用简单贝叶斯分类器在切分中的应用在确定文字的最佳候选后边界时假设有 m 个候选后边界分别对应 m 个候选切分结果用 d 种特征来衡量其合理性记为 Xj x1 x2 xd T j 1 2 m 则当文字为 Ci类 C1 C2 C3 分别表示汉字英文和数字标点类别且后边界为第 j 个候选后边界的概率为 P Xj Ci P Xj Ci P Ci P Ci i 1 2 3 j 1 2 m 2 以上公式 2 与公式 1 不同的是公式 1 只需要确定一个值即观测值 X 对应的类别而公式 2 不仅需要确定一个候选后边界切分出文字的种类还需要确定 m 个候选后边界那一个最合适显然使 P Xj Ci 取最大值时的 j 就对应了最佳切分位置而相应的 i 即为对文字类别的定义 2 2 2 2 特征提取特征提取文中的贝叶斯分类器用到的特征可分为两种一种是文字形状和结构方面的特征包括 6 种文字外形特征文字高度宽度字间距离覆盖率高宽比 2 纵向起始位置和 3 种后边界特征后边界穿越笔划数后边界投影值后边界上下穿越笔划点距离另一种是文字内容特征包括 16 维方向线素特征把文字分成不重叠的 2 2 块每块提取出水平垂直 45 和 135 4 个方向的方向线素特征第一种特征里除了覆盖率和高宽比外都需要特征归一化这里用图像中的汉字平均高和宽对它们归一化因此切分过程的第一步需要估计基本参数汉字平均高和宽在研究中发现文字切分中最容易出现的错误是 1 把汉字的偏旁部首等部件当成英文数字或标点单独切开 2 把英文数字或标点与汉字切在一起为了有较好的切分效果就需要抽取出能够区分这些错误的特征一级汉字中容易切开的汉字有以下几种 1 八儿川非加旧别训 2 叫礼仆讨引很 3 必小心 4 懊第 1 3 种字单个字左右部分容易切开第 2 4 种字由于有左边的部首左右部分也容易切开第 1 2 种汉字易被当成英文或数字类文字切开第 2 4 种汉字左边的点易被当成标点类文字切开为此把上面 4 种文字易被切开的部分定义为新的文字类别部件类用 C4 来表示它该类仅用于提取特征 3 3 归一化算法的研究归一化算法的研究汉字图像的归一化包括位置大小旋转倾斜和笔画宽度的归一化在整个汉字识别系统中会进行字符切分倾斜校正等步骤本文主要研究汉字的大小和笔画宽度的归一化 3 1 3 1 字体大小归一化字体大小归一化由于汉字字形字体繁多同一汉字的特征也因此而不同为了便于统一描述和提取同一汉字的特征对不同字形字体汉字均能识别为汉字识别工作打好基础在汉字特征提取前还需对汉字图像进行大小归一化的操作所谓大小归一化就是对实际提取的字符进行缩放操作最后得到预定大小的字符图像一般汉字图像预处理的第一步是进行二值化处理二值化处理的目的是把灰度图像转换为二值图像二值化处理后图像中的像素点不是 1 黑点就是 0 白点记为 GM N Pi j 1 i M 1 J N 其中 M 和 N 分别为 G 的长和宽 Pi j 为第 i 行第 j 列的像素点 Pi j 1 时表示一个黑像素点前景点 Pi j 0 时表示一个白像素点背景点简记为 G 一般的缩放算法是对一个区域的灰度值进行运算由四个以上的输入像素决定输出像素的灰度值而对于二值图像只有黑白像素此时可以对图 G 进行划分而得到一组图块 g 使得每个 g 内黑像素点的分布是比较均匀的记为 gm n Pa b Pa b G 1 a m 1 b n 其中 m 和 n m M n N 分别称为该图块的长和宽定义了图块之后二值点阵图像又可表示为 GM N gx ym n 1 x M m 1 y N n 其中 x y 表示图块 g 在图像 G 中的位置在图块 g 中值为 1 的像素点个数与全部像素点个数之比称为该图块的灰度值记为 P g Pi j m n 100 1 i m 1 j m 若 g 中所有的像素点为 1 则称将 g 置 1 若所有的像素点为 0 则称将 g 置 0 本文所用的大小归一化算法不是简单地将 g 压缩为一个像素点而是按压缩比将 g 缩小成为另一个图块 g 使得 g 具有与 g 相同的特征即二者的黑像素点分布是相似的这样由 g 构成的缩小图 G 就可基本上保持原图 G 的特征从而减小了由缩小所造成的失真设 GM N gi jm n 1 i M m 1 J N n G g i j g i j为 g 缩小后形成的图块算法描述如下读入原图 G 根据 G 的行列数特征及压缩比确定图块 g 的行列数及 g 的行列数 i 1 j 1 读人 gi j 根据第一次划分得到的图块的灰度值 P gi j 及图块的特征构造 g i j 若 i M m 或 j N n 则修改 i j 的值使之指向下一个像素点然后转向步骤继续否则结束算法的关键是根据原图块 g 的黑点分布特征来动态地构成 g 为了提高处理效率可在分布特征基本相似的一个较大的区域采用相同的 g 而当特征发生较大变化时再重新构造新的 g 3 2 3 2 笔画宽度归一化笔画宽度归一化对笔画宽度进行归一一化的目的是使二值图像变为仅有一个像素宽度的骨架这个过程也称之为细化细化的本质就是寻找图形的中轴线或骨架并以其骨架来取代该图形细化后的图形的像素宽度变为 1 但仍能保持原图形的结构性信息如位置方向长度等在现代模式识别系统中细化处理已经成为最为关键的预处理步骤之一细化效果的好坏将直接影响识别速度及识别的准确率可以说能否进行有效的细化已成为识别系统成功与否的关键所在对一个图像细化之后的骨架必须能够反映出原来物体的形状特征才具有实用价值因此一个好的细化算法一般需要满足以下要求保留物体形状的连通性可以是 4 向连通也可以是 8 向连通无过度腐蚀即保留位置重要的点如线段终点骨架图像尽可能是原图像的中心线骨架必须与原物体是拓扑等价的抗噪声性能好出现在物体边界上的噪声不应该过分影响细化结果细化分成串行细化和并行细化串行细化即是一边检测满足细化条件的点一边删除细化点并行细化即是检测细化点的时候不进行点的删除只进行标记而在检测完整幅图像后一次性去除要细化的点经典的图像细化算法有 Hilditch 算法 Pavlidis 算法和 Rosenfeld 算法等 Zhang 细化算法 2 是目前应用最为普遍的方法之一是在上面三种细化算法的基础上演变而来的也是本系统所采用的算法每当人们开发出一种新的算法时也经常引用 Zhang 细化算法来与新算法进行比较以评定新算法的优劣定义边界点是本身标记为 1 而其 8 向连通邻域中至少有一个点标记为 0 的点以边界点为中心的 8 向邻域即中心点为 p1 其邻域的 8 个点绕中心点顺时针依次进行标记如图所示首先标记同时满足下列条件的边界点连接数 1 2 6 个零像素 p2 p4 p6 中至少有一个像素是背景像素即白色点 p4 p6 p8 中至少有一个像素是背景像素在一次迭代运算后删除被标记的像素点然后进行另一个迭代其步骤和第一次迭代相同只是把上述条件替换成如下的形式 p2 p4 p8 中至少有一个像素是背景像素 p4 p6 p8 中至少有一个像素是背景像素第二个迭代后同样删除所有被标记像素然后转入下一轮循环直到两次迭代中均无像素被删除时算法结束 3 3 3 3 算法修正算法修正由于图像边界的不规则和骨架对噪声的敏感使抽取骨架存在大量的畸变从而使数据拟合和矢量化跟踪的结果不能正确表示原始信息严重地影响到今后对图像的识别质量对此一般的修正策略是对给定骨架的两个连通成分考查它们之间的距离与某一域值的关系以决定这两个连通成分的连接性较为常用的法订 3 3 1 3 3 1 固定视口法固定视口法为校正骨架化畸变可设定固定的视口根据固定视口各边线出口的情况来判别各连通成分可否连接

人人文库> 全部分类> 教育资料 > 幼儿教育

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

文字识别算法

文档简介

温馨提示

最新文档

评论

文字识别算法

文档简介

温馨提示

最新文档

评论

相关文档