一种基于模糊模板匹配的车牌汉字识别方法_第1页
一种基于模糊模板匹配的车牌汉字识别方法_第2页
一种基于模糊模板匹配的车牌汉字识别方法_第3页
一种基于模糊模板匹配的车牌汉字识别方法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    一种基于模糊模板匹配的车牌汉字识别方法        吴 炜,杨晓敏,刘大宇,何小海 时间:2009年08月25日     字 体: 大 中 小        关键词:        ? 摘? 要:关键词: 模式识别? 车牌识别? 模板匹配?1。因而,汉字的整体信息在无笔

2、顺识别中起着无法替代的重要作用。? 统计模式识别借助概率论的知识,判断或决策对象的特征类别,使得决策的错误率达到最小。基于统计特征的识别方法先抽取识别对象的稳定特征,组成特征矢量,然后在字符集的特征空间中进行特征匹配。基于以上认识,在分析汽车牌照中汉字字符的特点后,采用了有别于结构分析的一种基于字符图像特征统计的模式识别方法进行汉字识别。同时针对统计方法无法区分的相似汉字,提取其微结构信息进行特殊的校正识别。1? 特征统计匹配? 统计决策论其要点是提取待识别模式的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决2。汉字的统计模式识别是将字符点阵看作一个整体,从该整体上经过大量统计得到

3、所用特征,用尽可能少的特征模式来描述尽可能多的信息。所采用的方法有:特征统计的方法、整体变换分析法3、几何矩特征、笔划密度特征、字符投影特征、外围特征、微结构特征和特征点特征等。这些方法都具有各自的优缺点,应根据具体应用进行选取。主要方法有外围面积特征匹配法和网格特征匹配法。外围面积特征反映了字符的轮廓信息。外围面积特征提取法,主要是从周围形状的心理学知识来获得汉字信息的特征,即对文字周围上下左右的形状进行量化,从而构造特征向量。网格特征实际是结构模式识别和统计模式识别相结合的产物。字符图像被均匀或非均匀地划分为若干区域,称之为“网格”。在每个网格内寻找各种特征,如目标面积比例、交叉点、笔划端

4、点的个数、细化后的笔划长度和笔划密度等。特征统计以网格为单位,即使个别点统计有误差也不会造成大的影响,从而增强了特征的抗干扰性。因此这种方法得到日益广泛的应用。在实际的车牌汉字识别中,当相同汉字的二值图形变动较小时该方法较有效。具体应用:将尺寸为34×66象素的汉字二值图均匀分成32个正方形的小区域(不考虑外边框的1个象素),统计每个8×8的小区域内目标象素(白色)所占的面积比例,就得到了归一化的32维特征矢量。统计多幅相同汉字的32维特征矢量,取均值作为该汉字的标准网格特征模板。识别时,计算待识别汉字的32维网格特征矢量与模板矢量之间的Euclid距离,求得最小距离值,其

5、对应的汉字即为识别结果。在具体应用中,由于外部原因常常会出现字符模糊、字符倾斜的情况,而网格特征匹配方法对字符模糊和倾斜较敏感,因此鲁棒性不是很强,不适合实际应用。2? 模板匹配2.1 基于二值图形变动分析的模糊模板匹配? 在含有汽车牌照的图像中,将汉字定位并提取出来以后,还要完成规格化、二值化等操作。即使是相同的汉字,由于车牌倾斜、模糊,特别是由于每次定位不可能完全精确一致等诸多因素的影响,导致在二值图中字体的形状、大小都会不同,字体位置也会发生不同程度的偏移。将这种二值图形的不规则现象称为图形的变动。在汉字识别的分析过程中,希望对图形变动的大小进行量化处理。因此,提出了求图形整体变动量的统

6、计方法,其优点是不需要参照标准图形,可以进行客观评价,并构造出用于匹配识别的模糊模板。? 对每一个车牌的汉字字符,选取n幅质量较好的参考图。将这n幅参考图规格化为17×33的标准大小后进行二值化处理,得到标准参考图fi? f(x,y)为得到的二值化后的待识别图像,把所有点的置信度平均后得到总的置信度con作为判别依据。最大置信度con所对应的模板汉字作为匹配识别输出的结果。? ? 公式中的width和height分别是归一化后标准图像的长和宽。通过对实验结果的分析发现,识别错误的图像,往往严重变形、模糊,二值化效果差。2.2 基于二值图形变动分析的模糊模板匹配的改进算法? 针对以上问

7、题,提出了一种简单的改进算法。将切分后不同大小的灰度字符图像规格化为17×33的标准尺寸以后,将各象素点的灰度值线性变换到0,1区间,再与模糊图形模板匹配,计算Euclid距离,其最小距离值对应的模板汉字作为匹配识别输出的结果。该方法的优点是不用对灰度图像作二值化处理,避免了由于二值化操作带来的图像信息损失。特别是对一些模糊图像,若直接采用二值化效果较差,影响匹配准确度。因此使用该方法在一定程度上提高了识别正确率。? 实验中发现,对少数明暗程度变化大或对比度不强的模糊图像,该方法也产生了少量识别错误。这是由于将待识别图像的各点灰度值线性拉伸到0,1区间后,原始图像明暗程度不同导致其平

8、均值与对应模板的平均值并不一致,直接用Euclid距离进行匹配,带来了计算误差。因此引入了归一化相关性度量公式:? ? 其中I(i,j)和Tn(i,j)分别是输入的待识别的字符图像和第n个模板,分别是输入字符图像所有灰度的均值和第n个模板的均值,w和h分别为图像的长和宽,S(I,Tn)是匹配函数,其值在01之间,代表待识别图像与模板图像的匹配程度。使用该公式计算相关性,可以避免由于明暗和对比度变化导致图像和模板的“能量”不一致而带来的匹配误差,进一步提高了匹配准确度。3? 试验结果的进一步校正? 模板匹配表现的主要是汉字的整体特征,但是有些汉字存在着一定程度上整体的相似性,因此必须对相似的字符

9、进行进一步的校正才能提高识别的正确率。对相似汉字的区分,往往是寻找其特有的笔划结构,这也是在统计模式识别中引入结构方法的必要之处。例如在车牌汉字识别中,“粤”字与其他省份汉字的最大区别是底部的钩状结构。为此对预处理后的17×33二值图像的底部1/4部分作水平和垂直方向的投影,水平投影17个特征值(由左、右二边分别投影得到),垂直投影33个特征值(由上、下二边分别投影得到),形成50维的微结构投影特征矢量。“粤”字微结构特征及其统计41幅图像后的微结构投影特征直方图如图2所示。经统计平均后作为区分相似汉字的依据。实际校正时,计算微结构特征的匹配距离。若小于预先设定的阈值,则直接返回该汉字作为识别结果。?4? 实验流程及结果? 对识别300幅切分后的质量较好的汉字灰度图进行识别,实验流程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论