基于空间分布的最大类间方差二值化算法.doc_第1页
基于空间分布的最大类间方差二值化算法.doc_第2页
基于空间分布的最大类间方差二值化算法.doc_第3页
基于空间分布的最大类间方差二值化算法.doc_第4页
基于空间分布的最大类间方差二值化算法.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于空间分布的最大类间方差二值化算法.txt不怕偷儿带工具,就怕偷儿懂科技! 1品味生活,完善人性。存在就是机会,思考才能提高。人需要不断打碎自己,更应该重新组装自己。第35卷第3期2001年5月浙 江 大 学 学 报 (工学版)Journal of Zhejiang University (Engineering Science)Vol.35.3May 2001收稿日期:1999-07-20.作者简介:张引(1970-),女,甘肃永登人,浙江大学讲师,从事图形图像、多媒体信息处理和人工智能研究.基于空间分布的最大类间方差牌照图像二值化算法张 引(浙江大学CAD&CG国家重点实验室,浙江杭州310027)(浙江大学人工智能研究所,浙江杭州310027)摘 要:车辆牌照识别VLPR(Vehicle License Plate Recognition)是智能交通系统ITS(IntelligentTransportation System)的重要部分,有着巨大的社会和经济效益.车辆牌照图像二值化方法的研究是VLPR中的关键技术,通常都采用经典的Bernsen算法和Otsu算法.但由于光照不均、摄像机畸变、曝光不足、动态范围太窄和车辆牌照被污染等原因,车辆牌照图像的质量往往不佳,常存在严重伪影和字符边缘模糊,极大地影响了牌照图像二值化效果,Bernsen算法和Otsu算法也不能很好地克服上述问题.为此,提出了一种新的牌照图像二值化算法CASDA(Cluster Algorithm Based on Spatial Distribu-tion Analysis),把牌照图像空间分布特性与最大类间方差的统计特性有机结合,大大加快了最大类间方差模式分类速度.与Bernsen、Otsu、LEVBB等算法比较,CASDA具有速度快,能消除不均匀光照引起的伪影,极少出现笔划断裂等优点,二值化效果好.关键词:二值化;模式分类;牌照识别中图分类号:TP391.4;U491.116 文献标识码:A 文章编号:1008-973X(2001)03-0272-04VLPR有着广泛的实际应用前景,如交通控制与诱导、小区车辆管理、闯红灯等违章车辆监控、不停车自动收费、道口检查站车辆监控、公共停车场安全防盗管理等.同OCR相比,它识别的是场景字符;同目标识别相比,牌照中的字符以一定的规则排列,有其空间分布的特殊性.此外,VLPR要求具有很高的识别率和实时性,能处理汽车在高速行驶时造成的牌照图像模糊、扭曲、变形和适应准全天候.因此,VLPR是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题之一.中国汽车牌照主要分黄底黑字、蓝底白字、黑底白字等三种,其灰度图像则为白底黑字、黑底白字两大类.由于光照不均匀影响、摄像机畸变、曝光不足和动态范围太窄等原因,导致牌照图像存在严重的伪影;并且由于图像灰度分布不均匀、对比度不足,以及牌照上的灰尘、脏污等,使得牌照的字符图像边缘模糊,细节分辨不清.严重影响到牌照图像二值化的效果.为此,本文提出一种结合牌照字符空间分布和最大类间方差分类准则的全局阈值法CASDA算法,用于牌照字符识别的二值化处理,既能消除伪影,又能保持牌照字符笔划的边缘完整性,且满足VLPR的实时性要求.最后,本文将CASDA算法实验结果同最具代表性的二值化算法:Otsu算法1、Bernsen算法2以及Bernsen算法的改进LEVBB3算法做了比较.1 文本图像二值化算法概述文本图像二值化的基本要求是二值化图像能忠实再现原来文本图像,即:(1)字符笔划不出现空白、空心、短裂;(2)二值化后笔划基本保持原来文字特征.Trier与A.K.Jain4研究了已有的文本图像二值化方法,认为下面的二值化算法是最典型的算法,包括Bernsen算法、Chow与Kanekos算法、Eikbil算法、Mardia与Hainsnorth算法、Niblack算法、Taxt算法、Yanowitz与Bruckstein算法、White与Rohrer动态阈值算法、Park算法、White与Rohrer的集成函数算法、Trier与Taxt算法等局部自适应算法. Otsu算法、Kapur算法、Kittler与Illingworth算法、Abutaleb算法等全局阈值算法.在VLPR的图像二值化中,通常都采用Bernsen算法和Otsu算法.然而Bernsen算法有伪影现象,且容易出现二值化图像笔划断裂现象.为此文献2给出了对Bernsen产生伪影的解决方法:(1)对原图做均值平滑去噪;(2)计算去噪图的边缘值(Sobel算子);(3)去除边缘值小于某阈值Tp的目标点.由于该方法引入了Sobel求边缘并增加阈值Tp,仍然存在选取困难,且该方法对于由背景灰度突变形成的伪影现象仍无法消除.叶芗芸3对Bernsen算法作了改进并命名为LEVBB算法,称该算法是完全基于图像局部特征的自适应算法,对背景区域可能出现的伪影现象有较好的消除作用,同时算法中没有固定的阈值选取困难.Otsu算法不但费时(要对每幅图像的每一级灰度进行计算),更主要的是Otsu方法的判别准则函数可能呈双峰5,此时,Otsu算法往往将大量背景错分为字符,导致无法识别,不适于VLPR的要求.2 基于空间分布的最大类间方差二值化算法2.1 牌照图像空间分布与图像二值化在光照均匀、无噪声和无干扰的理想情况下,牌照图像中灰度变化平缓,可以假定字符灰度为g1,背景灰度为g2,且0g1,g2255.假定该牌照图像中字符像素点所占比例为r1,背景像素点所占比例为r2,则0r1,r21,且r1+r2= 1.该牌照灰度图像均值为M=r1g1+r2g2,g1Mg2. (1)方差计算如下:C2=r1(g1-M)2+r2(g2-M)2. (2)由式(1)可得r1(g1-M) +r2(g2-M) = 0, (g2-M) =-r1r2(g1-M).代入式(2)可得C2=r1r2(g1-M)2.由此导出,字符灰度为g1=Mr2r1C,背景灰度为g2=Mr1r2C.对于白底黑字牌照,为把黑字从白底中分割出来,选取粗阈值T1=M-r1r2C; (3)对于黑底白字牌照,为把白字从黑底中分割出来,选取粗阈值T1=M+r1r2C. (4)式(3)和式(4)中字符像素点所占比例r1未知,但根据统计规律,牌照中字符所占像素点比例r1为0.3 0.4左右,由于经过图像分割自动定位的牌照区域基本精确在牌照的四个边框附近,标准牌照高度与长度比RatioLP为140440 = 0.318 2,r1恰恰与RatioLP接近,由于这里所需得到的是粗阈值,所以r1用RatioLP近似,粗阈值T1(T2)的误差为10个像素点左右.273 第3期张 引:基于空间分布的最大类间方差牌照图像二值化算法2.2 模式分类与图像二值化文本图像的二值化问题可以归结为两类模式(字符目标与背景)的分类问题,即对文本图像,判定其上任意一像素点是属于字符类,还是背景类,从而最终把文本图像分成字符和背景两大类.设给定图像具有1,2,3,l,共l级灰度,阈值设为k,把灰度大于k和小于k的像素分为两类:类1和类2.类1中的像素总数为W1(k),平均灰度值为M1(k),方差为1(k);类2中的像素总数为W2(k),平均灰度值为M2(k),方差为2(k);所有图像像素平均值为Mr.则类间方差2B(k)和类内方差2A(k)定义如下:2B=W1(M1-Mr)2+W2(M2-Mr)2=W1W2(M1-Mr)2,2A=W121+W222.模式分类理论中,不同类别之间可分性度量有三个标准:散布矩阵、散度和Battacharyya距离6,类间方差与类内方差的比值对应于散布矩阵,反映了各类模式在模式空间的分布情况.类间方差越大,类内方差越小,则说明分类结果类与类之间距离大,每类自身各像素性质相似度越大,即模式分类结果越好.2.3 CASDA算法在3.1节中要对粗阈值T1(T2)作微调,得到最终的二值化阈值,一个办法是根据精确分析笔划边缘7,然而这项工作并非易事,特别在字符粘连情况下,笔划分析很难.我们认为可以采用最大类间方差判别准则函数2B/2A对粗阈值T1(T2)进行微调,算法通用、简单.由此把基于空间分布的二值化方法与最大类间方差分类准则有机结合,得到一种新的牌照图像二值化算法CASDA算法.CASDA算法描述:首先假定为白底黑字牌照,则以T1为阈值对牌照图像二值化处理;对以T1为阈值的二值化图像进行纹理分析,判定并分析字符笔划边缘,同时计算黑点所占比例关系,以此确定二值化图像效果及中的假定(为白底黑字牌照)是否正确;(若为黑底白字牌照,以T1为阈值的二值化图像鲜有笔划边缘,并且黑点比例远小于r1.)若假定正确,转;说明假定错误,应为黑底白字牌照,则以T2为阈值对牌照图像二值化;以T1(或T2)为初始阈值T0,在kT0-10,T0+10范围内分别计算判别准则函数S(k)=2B(k)2A(k),其中2B为类间方差,2A为类内方差,取判别准则函数S(k)为最大值的k为最终的牌照图像二值化阈值.3 实验结果我们在P133/32计算机上采用C语言编程,并把CASDA算法与Bernsen算法、Otsu算法以及LEVBB算法进行了比较.图1中各牌照二值化时间:快速Otsu算法在0.07 s以上,Bernsen算法0.05 s左右,LEVBB算法在0.04 s左右,而CASDA算法为0.01 s.如图1所示,在大多数情况下,Bernsen算法和LEVBB算法得到的二值化图像效果基本一样,都有很大的噪声干扰,不利于进一步的单字提取和字符识别.如图1(c)的光照不均匀,Bernsen算法、Otsu算法和LEVBB算法均无能为力,而CASDA算法得到的二值化图像清晰,无伪影. Otsu算法得到的二值化图像也有较大的噪声,笔划粘连现象较多.如图1(d)由字符、牌照背景和保险杠残留图像三部分组成,Otsu算法将牌照背景亦误分割为字符,造成二值化图像模糊一片,无法进一步识别.CASDA综合了图像的空间分布特性与最大类间方差的统计分布特性,根据空间分布特性初步确定二值化阈值,再由最大类间方差判别准则函数2B/2A进行微调,在较小的灰度范围内搜索,使分类算法运算量呈10倍下降,取得满意的二值化效果.实验表明CASDA无论是二值化图像效果还是计算速度均优于Bernsen算法、Otsu算法和LEVBB算法.与Bernsen算法、Otsu算法和LEVBB算法相比,CASDA基于全局阈值考虑,阈值选取合理,二值化效果好,能消除伪影,极少出274浙 江 大 学 学 报(工学版) 2001年 图1 二值化方法比较Fig.1 Comparison of binarization methods现笔划断裂现象.对于有噪声干扰、非均匀光照的牌照图像有良好的适应性,且算法速度极快,满足牌照识别实际要求. CASDA算法的二值化与采用笔划分析的方法7相比,效果基本一样,但是摒弃了笔划分析的复杂性,实现简单,具有更好的通用性.致谢 感谢导师潘云鹤院士、王潮博士对本文工作的大力支持.参考文献:1 Otsu N. A Threshold selection method from gray-level histogramsJ. IEEE Trans Systems, Man and Cy-bernetics, 1979, 9(1): 62-66.2 Bernsen J. Dynamic thresholding of gray-level imagesA. Proc. 8th Int. Conf. on Pattern RecognitionC.LOS Angeles: IEEE Computer Society Press, 1986. 1251-1255.3 叶芗芸.文本图像的快速二值化方法J.红外与毫米波学报,1997,16(5):344-350.Ye Xiang-yun. Fast binarization alogorithm for document imageJ. Journal of Infrared and MillimeterWaves, 1997,16(5):344-350.4 Trier, Jain A K. Goal-directed evaluation of binarization methodsJ. IEEE Trans Pattern Analysis and Ma-chine Intelligence, 1995, 17(12): 1191-1201.5 Sang Uk Lee, Seok Yook Chung. A comparative performance study of several global thresholding techniquesfor segmentationJ. Computer Vision, Graphics, and Image Understanding, 1990,50(2): 171-190.6 FuKunaga K. Introduction to statistical pattern recognition 2nd editionM. Boston: Academic Press, Inc,1990.7 张引,潘云鹤.面向车辆牌照字符识别的预处理算法J.计算机应用研究,1999, 16(7):85-87.Zhang Yin, Pan Yun-he. Pre-processing algorithm for vehicle license plate character recognitionJ. Journalof Application Research of Computer, 1999, 16(7):85-87.(下转第280页)275 第3期张 引:基于空间分布的最大类间方差牌照图像二值化算法Preprocessing methods for computer imagesof particle saltationSUN Zhi-feng1, SUN Zhi-lin2, WEI Lei1(1.Dept. of System Science and Engineering, Zhejiang Uni., Hangzhou 310027, China;2.Dept. of Ocean Science and Engineering, Zhejiang Uni., Hangzhou 310027, China)Abstract: Particle saltation sequential images taken during a video-image experiment on the bed-surface of non-uniform sediment can be used for determining the saltating grain trajectory and ve-locity, which are very important for studying the mechanics of sediment transport. In order toobtain high precision data on grain saltation, the authors resorted to computerized image process-ing and recognition of the video images. The methods for preprocessing particle saltation singleimage are described in this paper. Real color video images are first transformed into gray-levelimages, whose useful parts are pre-intercepted. Then, half-neighborhood-area filter and thecross median filter are used for moving average processing of these images. A satisfactory resultis obtained. The pre-processing of the images laid the foundation of the further processing suchas the threshold segmentation, configuration extraction and edge detection.Key words: image processing and recognition; particle saltation; video image; nonuniform sedi-ment(上接第275页)License plate binarization algorithm based on analysis of thespatial distribution and maximum variance between clustersZHANG Yin(State Key Lab of CAD&CG, Zhejiang Uni., Hangzhou 310027, China)(Institute of AI, Zhejiang Uni., Hangzhou 310027, China)Abstract: VLPR (Vehicle license plate recognition) is an important part of ITS (IntelligentTransportation System), which has great social and economic values. Vehicle license plate bina-rization algorithms comprise a critical technology in VLPR. Generally, Bernsen algorithm andOtsu algorithm

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论