毕业设计(论文)-车牌字符分割与数字识别算法研究.doc_第1页
毕业设计(论文)-车牌字符分割与数字识别算法研究.doc_第2页
毕业设计(论文)-车牌字符分割与数字识别算法研究.doc_第3页
毕业设计(论文)-车牌字符分割与数字识别算法研究.doc_第4页
毕业设计(论文)-车牌字符分割与数字识别算法研究.doc_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(输入章及标题)燕山大学 毕业设计(论文) 车牌字符分割与数字识别算法研究 学 院 里仁学院 年级专业 03级电子信息工程 学生姓名 指导教师 专业负责人 答辩日期 2007年6月24日III燕山大学毕业设计(论文)任务书学院:里仁学院 系级教学单位:电子信息与通信工程系 学号030202070014学生姓名刘杰专 业班 级电子信息工程课题题 目车牌字符分割与数字识别算法研究来 源自选主要内容 车牌识别系统是智能交通不可或缺的一部分,可分为车牌定位、字符分割与字符识别三个部分。该题目要求完成该系统中的字符分割与车牌字符自动识别算法研究,重点为车牌数字的自动识别,并对所研究算法进行编程验证。基本要求1通过学习相应书籍和查阅资料,熟悉并掌握数字图像处理的基本技术2学习一种用于图像处理算法验证的软件工具。3学习并研究字符分割与字符识别算法。4编程验证算法的有效性。参考资料1智能图像处理技术 李弼程等编著 电子工业出版社 20042Visual C+/MATLAB 图像处理与识别实用案例精选 胡小峰,赵辉编著 人民邮电出版社 20043用于验证所用算法的编程语言参考书(自选)4IEEE,Elservier 以及中国期刊网上的相关文章周 次14周58周912周1316周1718周应完成的内容收集资料熟悉课题内容查阅参考书确定设计思路编程语言学习及设计中使用的算法的理解和熟悉编制处理程序,并上机进行软件程序调试及优化实验结果整理和总结论文书写课题总结答辩指导教师:张涛系级教单位审批:说明:如计算机输入,表题黑体小三号字,内容五号字。本任务书一式二份,教师、学生各执一份。 摘要摘 要随着高速公路逐渐普及,我国的公路交通事业发展迅速。而相应的人工管理方式已不能满足实际的需要,微电子、通信和计算机技术在交通领域的应用极大地提高了交通管理效率。目前典型地应用如告诉公路自动收费系统、违章车辆在自动记录系统和道路车辆数字图象采集系统等。目前的车牌字符的分割与数字识别有许多方法,本文首先介绍了字符切分与数字识别的几种方法,并采用基于图像提取的方法实现了字符分割,应用数字字符轮廓结构特征和统计特征相结合的方法进行数字识别,完成了车牌识别的实时算法,实现了车牌识别的研究目标。最后本文通过计算机试验对该方法进行了验证,试验证明该方法有效。关键词 字符分割;字符识别;字符轮廓;轮廓的统计特征5AbstractWith the widely application of highway, the highway transportation business rapidly develops in our country. Due to the shortage of corresponding artificial management, the application of the micro-electronic, communication and computer technology in transportation field greatly improves the management efficiency of it. Recently, many typical cases, such as the highway automatic charge system, automatic recording system of illegal vehicle and the picture acquisition of vehicle in road , are widely used. Currently, many new methods are used in vehicle number Partition and digital identification. This paper introduces a few methods about character slice and digital identification. Character slice is finished by the method of picture acquisition. Combined digital character outline specification with statistics, vehicle number identification is realized by digital identification method, and its real-time algorithm is designed. At last, this method is tested by computer experiment, the result shows its validity.Keywords Character list partitions Character list identifies Character list online Covariance characteristic of outline 目 录摘 要IAbstractII第1章绪论11.1课题背景11.2汽车牌照自动识别技术的现状与发展11.2.1汽车牌照识别的主要应用技术11.2.2我国汽车牌照识别的特殊性31.2.3无源型汽车牌照智能识别系统41.3汽车牌照识别技术的应用51.4本文结构5第2章 目前汽车车牌识别技术的方法72.1汽车车牌字符分割方法72.1.1 基于聚类分析的车牌字符分割方法72.1.2利用Hough变换和先验知识的车牌字符分割算法102.1.3基于数字形态学的车牌字符分割算法132.2汽车车牌的字符识别方法举例172.2.1车牌字符识别中的字符特征提取方法172.2.2BP神经网络算法在字符识别中的应用192.3本章小结22第3章本文采用的汽车车牌识别方法253.1汽车车牌的识别过程253.2汽车车牌的字符分割方法253.3汽车车牌的数字识别方法273.3.1字符轮廓定义273.3.2结构基元283.3.3基元的检测293.3.4轮廓的统计特征303.3.5数字字符的识别算法303.4本章小结31第4章 程序调试与试验分析334.1软件调试334.1.1字符分割程序调试334.1.2数字识别程序调试334.2本章小结34结 论35参考文献37附录139附录245附录351致谢67第1章 绪论第1章绪论1.1课题背景现代社会已进入信息时代,随着计算机技术、通信技术和计算机网络技术的发展,自动化的信息处理能力和水平不断提高,并在人们社会活动和生活的各个领域得到广泛应用。在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。目前指纹识别、视网膜识别技术已经到了实用阶段;声音识别技术发展也是相当的快。作为现代社会的主要交通工具之一的汽车,在人们的生产、生活的各个领域得到大量使用,对它的信息自动采集和管理对于交通车辆管理、园区车辆管理、停车场管理等方面有十分重要的意义,成为信息处理技术的一项重要课题。随着城市道路监控技术和ITS智能交通技术的发展和融合,“电子警察”已经成为缓解交通紧张、降低交通事故和隐患体现科技强警的一项重要举措。电子警察执法处罚具有高技术含量,可以对“超速、逆行、闯红灯、禁停、压黄线、抢占公交车道等一系列违章现象进行准确、稳定、自动、全天候的监控、执法和处罚。电子警察的出现可以大大缓解因违章行为导致交通事故增加与警力少和警务人员劳动强度大的矛盾,有效抑制的由于人为违章引起的交通事故。电子警察在国内一些大中城市经过近几年的广泛应用,技术已经很成熟,由早期单一的闯红灯抓拍演变为多项违章内容及车流量、排队长度、等待时间、车道占有率、平均速度等交通信息统计分析的监控系统。汽车牌照识别技术是车辆检测系统中的一个重要环节,它在交通监视和控制中占有很重要的地位, 有着多种应用1 ,例如自动收费系统、不停车缴费、失窃车辆的查寻、停车场车辆管理、特殊部门车辆的出入控制等等。同时,汽车牌照识别的方法还可应用到其他检测和识别领域。所以汽车牌照的识别问题已成为现代交通工程领域中研究的重点和热点问题之一。1.2汽车牌照自动识别技术的现状与发展1.2.1汽车牌照识别的主要应用技术1.2.1.1 IC卡识别技术 IC卡是一种集微电子技术、通讯技术和计算机技术于一体的高科技产品,利用IC卡技术进行汽车牌照的识别,主要是指在每辆汽车上安装一个微型的电子信号接收和发射装置即 IC卡,卡内存储了该车的车牌号码以及其他一些信息,当汽车通过设有车辆检测装置的路口时,IC卡系统将与路口的计算机系统进行对话,使之辨识出该汽车的车牌号码和其他有关内容,从而可以实现监督与管理。然而,尽管 IC卡技术识别准确度高,运行可靠,可以全天候作业,但它整套装置价格昂贵,硬件设备十分复杂,不适用于异地作业,且须要制定出全国统一的标准。另外,无法核对车、卡是否相符,也是 IC卡技术存在的缺点。1.2.1.2条形码识别技术2条形码技术由于识别速度快、准确度高、可靠性强以及成本较低等优点,目前已广泛应用在商品销售、图书借阅管理、仓库进出货管理、邮政管理等众多领域。而条形码用于汽车牌照的识别方面还是一种新方法,它可以通过在车辆的侧面印刷条形码。其中包括地区、车型、车牌号码等基本信息,当条形码扫描器阅读出这些信息后,就可以完成识别的任务。但是条形码识别技术对于扫描器要求很高,并且同 IC卡技术一样,须在全国范围有统一的标准。这给近期短时间内推广造成困难。1.2.1.3图像处理技术 运用图象处理技术解决汽车牌照识别的研究国内外都有,最早出现于80年代,这个阶段的研究并没有形成完整的系统体系,而是就车牌识别中的某一个具体问题进行讨论,并且通常是采用简单的图象处理技术来解决。识别过程是使用工业电视摄像机( Industrial TV Camera)拍下汽车的正前方图像,然后交给计算机进行简单处理,并且最终仍需要人工干预。例如车辆牌照中省份汉字的识别问题,1988年戴营等利用常见的图像处理技术方法提出汉字识别的分类是在抽取汉字特征的基础上进行的。根据汉字的投影直方图 (Projection Histogram),选取浮动阈值,抽取汉字在y方向的峰值,利用树形查表法进行汉字的粗分类;然后根据汉字在x方向的投影直方图,选取适当阈值,进行量化处理后,形成一个变长链码,再用动态规划法,求出与标准模式链码的最小距离,实现细分类,完成汉字省名的自动识别。1.2.1.4传统模式识别技术传统模式识别技术一般包括模板匹配法,统计特征法等.进入90 年代,由于计算机视觉技术(Computer Vision Techn ique)的发展,开始出现汽车牌照识别的系统化研究。1990 年A.S Johnson等3运用计算机视觉技术和图象处理技术实现了车辆牌照的自动识别系统。该系统分为图象分割( Image segment)、特征提取和模板构造(Feature Ex- traction and Template Formation)、字符识别(Character Recognition) 等三个部分。利用不同阈值(Threshold)对应的直方图不同,经过大量统计实验确定出车牌位置的图象直方图的阈值范围,从而根据特定阈值对应的直方图分割出车牌,再利用预先设置的标准字符模板进行模式匹配(Pattern Matching) 识别出字符。1990年R.A.Lotufo等4使用视觉字符识别技术(Optical Character Recognition Techniques)分析所获取的图象,首先在二值化图象中找到车牌,然后用边界跟踪技术提取字符特征,利用统计最邻近分类器(A Statistical Nearest Neighbor Classifier)与字符库中的字符比较,得出一个或几个车牌号码,对这些号码做核实检查,看是否确实有该车牌号码,从而最终确定出一个实际存在的正确的号码。总之,这个时期的应用在识别正确率方面有所突破,但还没有考虑到识别实时性的要求,识别的速度有待进一步提高。1.2.1.5人工神经网络技术 近几年以来,计算机及其相关技术发达的一些国家开始探讨用人工神经网络技术解决车牌的自动识别问题.例如1994年M. M. M. FAHM Y等就成功地运用了BAM (Bidirectional associative memories)神经网络方法对车牌上的字符进行自动识别,BAM神经网络是由相同神经元构成的双向联想式单层网络,每一个字符模板对应着唯一一个BAM矩阵,通过与车牌上的字符比较,识别出正确的车牌号码。这种采用BAM神经网络方法的缺点是无法解决识别系统存储容量和处理速度相矛盾的问题。由于人工神经网络技术抛开了传统的计算结构和相应的算法,采用了生物神经网络的模型,因此它能较好地实现人类存储知识及处理信息的机能,使系统可以模拟人类思维,对需要处理和解决的问题进行记忆、联想、推理,从而较好地解决了车牌识别中所提出的因字符残缺不完整而无法识别的问题。另外人工神经网络技术应用于车牌识别领域与传统方法相比,还可以避免繁重的数据分析和数学建模工作,可以将信息存储与处理并行起来,大大提高了运行速度,因此越来越受到人们的广泛关注。1.2.2我国汽车牌照识别的特殊性如上所述,国外汽车牌照识别系统研究工作已有一定进展,但并不尽合我国国情,这主要是因为以下五个方面的原因:(1)我国标准汽车牌照是由汉字、英文字母和阿拉伯数字组成,汉字的识别与字母和数字的识别有很大的不同,从而增加了识别的难度; (2)国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色(例如韩国,其车牌底色为红色,车牌上的字符为白色,而我国汽车牌照仅底色就有蓝、黄、黑、白等多种颜色,字符颜色也有黑、红、白等若干种颜色;(3)其他国家的汽车牌照格式(如汽车牌照的尺寸大小,牌照上字符的排列等)通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式(例如分为军车、警车、普通车等);(4)我国汽车牌照的规范悬挂位置不唯一;(5)由于环境、道路或人为因素造成汽车牌照污染严重,这种情况下国外发达国家不允许上路,而在我国仍可上路行驶。由于我国汽车车牌识别的特殊性,采用任何一种单一识别技术均难以奏效。目前正在研制的无源型汽车牌照智能识别系统综合利用了车辆检测技术、计算机视觉 (Computer Vision)技术、图象处理技术、人工智能技术和人工神经网络技术等,是一个比较有发展前途的车牌识别系统。1.2.3无源型汽车牌照智能识别系统1.2.3.1系统特点 该系统融合了多种先进技术,对由数字照相机或数字摄像机采集到的行使中汽车图象进行分析与处理,自动分割出汽车牌照并智能识别出汽车牌照号码。所谓无源型汽车牌照智能识别系统是指在无任何专用于发送车牌信号的车载发射设备(如:无线、微波、红外、可见光、超声波等)的情况下,对运动状态车辆或静止状态车辆的车牌号码进行非接触性信息采集并实时智能识别的系统。与传统系统相比,这种系统节省了设备安置及大量资金,从而提高了经济效益。另外,由于采用了最先进的计算机应用技术,所以可提高识别速度,较好地解决实时性问题。1.2.3.2系统关键技术从大体上此系统的关键技术可分为以下两方面(1)汽车车牌的提取根据我国标准汽车车牌底色及字符是由固定的几种颜色(白色、蓝色、黄色、黑色、红色)组成,这些颜色信息可帮助牌照的定位,故可以利用人工神经网络技术先检验相关颜色,初步定出一个或几个可能存在车牌的区域,再在这些区域中寻找适当特征的图形,找到车牌位置,从而将完整的汽车车牌分割提取出来。.(2)汽车车牌字符的智能识别考虑到部分汽车牌照会存在受污损,涂漆脱落,以及对行驶中的汽车进行图象采集时造成的图象扭曲、变形等情况,如果运用以往一些技术方法,可能造成识别错误,因此可以利用人工神经网络方法具有自适应性和记忆特性,对于不完整的汉字同样能够正确识别的特点,对汽车牌照上有限的汉字进行准确快速处理。该系统设想采用人工神经网络技术建立省份简称汉字、英文字母以及阿拉伯数字的标准模板,与汽车车牌上的字符相匹配,自动智能地识别出汽车车牌号码。1.3汽车牌照识别技术的应用车牌自动识别技术作为车辆识别的先进技术手段,在智能园区中可用于以下几个方面:(1)车辆出、入园识别:园区的业主入住时,将自己的汽车进行登记,其车牌信息将记录在计算机数据库中。在园区大门处,设有车牌自动识别系统,对进出车辆自动识别,并根据数据库中的车牌数据判断是否是园区内的车辆,对园区内的车辆放行并自动记录其出入园时间,以便出现车辆被盗等情况时查询;对园区外车辆,将要求其登记后方可进入。(2)停车场管理:在园区停车场出、入口处,设有车牌自动识别系统,对进出停车场的车辆自动识别,并根据数据库中的车牌数据判断是否是已买(或租)车位的车辆,对已买(或租)的车辆放行,并自动记录其出入停车场时间,以便出现车辆被盗等情况时查询,对进入停车场的已买(或租)车位的车辆自动将其车位处的挡车器打开,以便车辆停放;对其它车辆,将自动记录其出入停车场的时间,以便计时收费,对进入停车场的其它车辆自动分配停车位并将其车位处的挡车器打开,以便车辆停放。目前车牌自动识别技术大量应用智能园区的障碍是识别率的提高和经济成本的降低。可以预言,用不了多久这种基于计算机数字识别技术的车牌自动识别产品将会大量使用于智能园区的车辆管理。 (3)用于高速公路收费管理:一旦车牌自动识别技术到了实用阶段,它可以首先推广应用到高速公路收费管理。它可以使高速公路行驶的车辆不必停车而实现收费管理。(4)用于城市交通车辆管理:车牌自动识别技术还可以将该车的外貌、颜色等参数结合起来使用,尤其可以使用于城市机动车辆的档案管理工作、特殊的交通管理工作。1.4本文结构本文首先对汽车车牌数字识别技术的国内外现状与发展进行了比较全面的描述,然后介绍了当今汽车车牌识别技术的几种先进方法及其基本的特点,其次是本文研究此课题所用方法,实现了车牌识别的研究目标,并完成了车牌识别的实时算法。最后对代码进行调试得出相关结论。第2章 目前汽车车牌识别技术的方法第2章 目前汽车车牌识别技术的方法文字是人类互相交流信息的重要工具。与其他信息载体相比,他具有便于信息保存和传递的优点,使信息在时间和空间商得以迅速扩散。并且用简单的几个字符可以表达大量的信息,且能方便地被人们接受和理解。因此,文字地信息表达几乎渗透了人类活动地各个角落。社会反战进入信息时代,人们已不再停留在用自己地耳朵和眼睛去直接获取这些信息,再用手指将信息记录在纸上,然后进行信息地分析处理。而是使用计算机代替人的简单、重复劳动。目前,文字识别与提取技术已经有了一定的进展,并且应用到了一些领域,比如交通、公共安全等领域。我相信文字识别技术将来会得到进一步的发展,并且在日常生活的会有更广泛的应用。 下面介绍几种有关汽车牌照字符分割和数字识别的方法。2.1汽车车牌字符分割方法2.1.1 基于聚类分析的车牌字符分割方法2.1.1.1车牌特点我国现行的拍照主要有四种类型:蓝底白字、白底黑字或红字、黑底白字。车牌共有七个字符和一个点符号。一般第一字符是汉字,且是各省市的简称,如”湘”、”鄂”、”沪”等;第二个字符是大写英文字,如”A”、”B”、”C”等;接着是一个点”.”;第三个字符可能是英文字母,也可能是阿拉伯数字;第四至第七个字符均为阿拉伯数字,如”鄂A.X 1 2 3 4”,车牌的长度为45厘米,宽度为15厘米。其中单个字符统一宽度为45毫米。高90毫米,第二、三个字符为34毫米,其中字符间隔为12毫米。2.1.1.2字符分割字符分割是指将车牌分割成单个字符区域。如图2-1中包含字符的矩形黑框所示,图2-1中的碎细线段为残余的车牌边框。需要强调的是,为了准确识别车牌上的汉字,英文和数字,每个字符区域必须是包括单个字符的最小巨型区。切分越准确,则后面识别的效果越好,如果偏移了1-2行象素,尽管不大,但是由于车牌图象中字符很小,一般和高约10到20多的象素,这样对字符识别,尤其是汉字识别造成很大的困难。目前常采用的方法是水平投影法,即沿水平方向,计算每列字符的象素数目。这样,字符块在水平方向的投影会在字符的间隙处取得局部最小值,因此字符的正确分割位置应该在上诉局部最小值附近,由于第2,3个字符的终止位置,再依次找出1、2、3、4、5、6、7的起始位置。图 2-1 字符分割示例但是再实际处理中,由于摄像机的性能,车牌的整洁程度、光照条件等因素的影响使拍照中字符可能出现严重的模糊、缺损或污迹干扰,如图2-2第一行。同时,经过车牌定位而分割出的拍照区域并非完全是精确到拍照上的字符区域。一般是含有拍照四条边框的残缺和拍照上两个铆钉干扰的区域,如图2-2第二、三行,有时更由于定位的不准确,定位车牌的长度过长,多了一段不属于车牌的区域,如图2-2第四行。对于”沪”、”湘”等汉字,由于汉字部首与字并不连接,水平投影时也存在局部最小值,往往把部首当作背景切掉,如图2-2第五行。这些因素都可能导致水平投影法字符切割的不准确,甚至失败。最后由于有些车牌字符的不规范,如有的白牌黑底车牌字符多于7个,使水平投影无法使用。因此,文中提出了一种基于聚类分析切分车牌字符的方法,按照属于同一个字符的象素构成一个连通的原则,再结合拍照字符的固定高度、间距的固定比例关系等先验知识,较好得解决了汽车拍照在复杂背景条件下的字符切分问题,降低了对车牌定位准确的要求。同时如稍加改动,也适用于字符不为7个的不规范车牌。2.1.1.3切割方法从图2-2中可看到到,在理想情况下,对于车牌的第2-7个字符,每个字符的象素(此时为黑色)构成了一个独立的连通。于是只要得到每个连通域的行列的起始和终止位置,并由此构成一个矩形区,就得到了包含字符的最小矩形区,定义这样的矩形区为一个类。而对第一个字符,由于汉字的不连通性,如”沪”,聚类分析时往往为多个连通区域。假设得到了”沪和三个点共四个连通域,但通过简单比较类”户”的宽度与后6个已知类 (字符)的宽度,就知道需要对第一个字符重新聚类。这样根据后6个已知的字符的长度和宽度等先验知识,完全可以简单方便地得到第一个字符的起始和终止位置。同样对于字符粘连,铆钉干扰也可通过聚类分析加以解决。设车牌二值化后背景象索为白色,用0表示,而字符象索为黑色,用 1表示;图象宽度为nWidth,高度为nHeight;类为包含单独连通域的最小矩形区。具体聚类分析方法如下:(1)对车牌图象采用差分直方图法5二值化(二维熵阀值分割快速法效果好,但速度慢),如图2-3的第二列。(2)以LI=nWidth8为阀值对车牌图象按行进行扫描,如果有线段的长度大于L2 认为是牌照的左右边框。因此可除掉拍照边框部分,如图3的第二列。(3)对处理后的图象从上到下按行逐象素扫描快速聚类6,如两象素闻距离d=d_const,就可认为两象素属于一类即属于同一个字符。其中d取两象素A(x1,y1),B(x2,y2)间的街区距离。d(A,B)=x1x2+y1y2 (2-1)考虑到车牌的第一个字符一般为汉字,故对d_corsst采用浮动变化的方法。即对车牌图象前nWidth/7部分用d_const=2或3聚类,这样能基本解决汉字的不连通问题;对图象后(nWidth6)/7部分,取d_const=1。此时可能出现两个字符连接或字符与铆钉连接等问题,将在后面的聚类分析中解决。(4)比较聚类后的各类的高度。对高度小于nHeight/2的类,可认为是噪声,因此可去掉。一般情况剩下的类为7字符和左右边框的残余(在图象中表现为很细的线段。由于”1”存在的可能性,此时不能简单依据类的宽度信息而分开)。(5)如果找到的类的数目少于7个或某类的宽度大于其余类的宽度超过一定的阀值,则应为字符粘连问题。于是分析由第4步得到的类的宽度信息。找出宽度最大的类进行分裂处理。分裂方法可采用前面的水平投影法,在类的中间2-3个象素范围内寻找局部极小点。重复步骤5,直到满足条件。(6)按各类的列起始位置从左到右排序。(7)如果类数目等于7个。转到步骤8。否则,分析一下排序后最坏的情况:设得到的聚类为(C1,C2 ,Ck-1,Ck。从左到右依次为:左边框残余线段或噪声C1Cm+7个字符类字符Cm+1Cm-2,右边框残余线段或噪声Cm+gCk。设每个类的水平方向的中心位置为c;每个类中心与后一个类中心之间的距离为MiCi+1C。对于7个字符类,字符之间的距离是有规律的。只有第2个与第3字符之间的距离为79毫米。其余为57毫米。这样设M1,M2,M3,M4,M5,M6为相邻字符间的距离(对于M2,应取57M2/79),在理想情况下,M1M2M3M4=M5=M6,对应的方差也应为最小。现在就把问题转化为已知K1个数m,求出6个连续的数,使其方差最小。第一步:计算每个类中心与后一个娄中心之间的距离:Mi=Ci+1C,(i=1,2,1)。第二步:从集合(M1,M2,M3,,Mk-2,Mk-1)中依次取出6个数。Mi,Mi+1,Mi+2,Mi+3,Mi+4,Mi+5,注意对第二个数要令Mi-1=Mi-257/79,计算. ,(j=1,2,,k-6) (2-2)第三步:找到Di的最小值Dmin则对应的7个字符类(Jmin,Jmin+1,Jmin+6). (8)如果某类的长宽度大于其余6个类超过设定的阈值N,则一般是铆钉连接或噪音的缘故,此时应接其余类的高宽,结果见图2-2的第四列。黑色矩形区为最后字符切分的结果。(9)对聚类后的矩形区用双线性变换成1632大小的二值图像作为神经网络的输入图 2-2 车牌图像处理示例2.1.2利用Hough变换和先验知识的车牌字符分割算法2.1.2.1预处理预处理对于车牌字符分割及字符识别都非常重要,好的预处理算法可以有效率提高正确率.我们的预处理算法包括图像尺寸归一化、车牌种类判别、目标增强3个步骤。(1)尺寸归一化车牌图像的尺寸对分割的准确率有较大影响。首先将车牌图像尺寸归仪化到16040像素。实验表明,在这个尺度上车牌图像字符分割的效果最好。(2)车牌种类判别车牌分为黄底黑字、蓝底白字、黑底白字等几种。灰度化以后分为白底黑字和黑底白字两大类。通过分析直方图,可以判别出车牌的种类。如果是白底黑字的车牌图像,则将车牌图像反色变为黑底白字。(3)目标增强预处理的主要目的是抑制噪声。直方图均衡化或灰度拉伸在增强目标点的同时,容易使背景也被增强,还会引入噪声。事实上,车牌中字符所占像素点的比例大约为207。所以,只增强这的20目标点即可.先将车牌图像的灰度值归一化到0100,这样目标点和背景被同时削弱.然后将灰度值前20的点的灰度值乘以2.55.这样大部分字符像素点得到增强,就实现了削弱背景、增强目标的目的,并抑制了噪声.试验证明,目标增强有效地提高了分割地准确率。目标增强的效果见图2-3。 图 2-3 目标增强2.1.2.2水平分割水平分割大体上分为以下两部分(1)Hough变换提取直线的原理如下8:对于图像空间中的任意一点(x。,y。), 利用变换 r=xcos+ysin (2-3)将其变换为参数空间(,r)中的一条曲线rx。cos+y。sin.对位于同一直线l上的n个点逐一进行上述变换,则在参数空间(,r)中对应得到n条曲线.由式(1)可知,这n条曲线必定经过同一点(。,r。).找到参数空间中的这个点就知道了图像空间中的对应直线l.于是Hough变换可以用来在二值图像中检测直线.(2)利用Hough变换的水平分割方法对于旋转角度较大的车牌图像,作整体水平投影后,通过投影很难直接分析出水平分割线.但是对于单个字符而言,旋转对其影响并不大,单独对一个字符作投影,很容易根据投影分析得到水平分割线.基于这样的事实,文本提出一种先分块取分段水平分割线,然后再拟合的方法,较好地解决了水平分析问题.算法包括以下3个步骤:第一,分析垂直投影,粗细求出垂直分割线,将车牌划分为子块.此时求取垂直分割线只是为了将图像划分为子块,所以对准确性的要求不高;第二,分析各个子块的水平投影,求出分段水平分割线;第二,以各段水平分割线的中点为输入,采用Hough变换的方法求解直线,这样就得到了要求的水平分割线。水平分割线求得以后,就能去除水平边框,求得准确的垂直分割线。2.1.2.3垂直分割我们提出一种利用垂直投影信息结合先验知识约束地垂直分割方法。一般情况下,分割先位置总是对于于垂直投影的谷底,而且分割线穿过区域的图像灰度方差应该较小。但是由于由各种干扰以及字符投影本身具有的复杂性,很难直接准确确定出垂直分割线的位置.因此,我们考虑到,车牌的外廓尺寸是440140(mm),每个字符宽度45mm,高90mm,间隔符10mm,每个单元间隔12mm9.利用这些先验信息作为约束条件,就能比较准确地找到垂直分割线地位置.算法步骤如下:(1)求取候选垂直分割线寻找图像垂直投影地谷底,作为候选垂直分割线地位置;(2)估算车牌尺寸根据水平分割线和候选垂直分割线提供地位置信息,利用车牌尺寸地先验知识,估算出整个车牌地宽度和每个字符地宽度;(3)确定大间隔地位置车牌地前两个字符和后面5个字符之间有一个较大地间隔。估算出车牌尺寸以后,利用车牌尺寸地先验知识,估算出大间隔地位置。根据垂直投影以及方差信息。在估算地位置附近搜索,确定大间隔的左右边界,同时去掉了间隔符;(4)求取垂直分割线.根据大间隔的位置利用先验知识估算出垂直分割线的位置,然后在估算出的位置附近,根据垂直投影以及方差信息,从候选垂直分割线中确定分割线。确定垂直分割线时,左右边框和内侧的字符之间的间隔较小,而且通常该处的噪声较大,而左右边框和外测的背景之间往往有较大的间隔.很多情况下,只根据投影信息和方差信息很难将左右边框与其临近的字符分开.我们通过强化先验知识的约束,有效地解决了这个问题.大间隔的检测一般是较准确的,同时除了首尾两个字符以外,别的字符的分割也是比较准确的。这样,根据大间隔的位置和其余字符的宽度能比较准确地计算出首尾两个字符的分割位置。以计算出的位置为中心,在其较小的邻域内搜索,确定垂直分割线.实验表明,这种方法能获得很好的分割效果。 结合先验知识的垂直分割算法分割准确,能去除间隔符和左右边框的影响,见图2-4图 2-4 垂直分割2.1.3基于数字形态学的车牌字符分割算法2.1.3.1图像预处理图象预处理过程(1)采用动态阈值法将图像二值化:如果输入图像较暗或者车牌较脏,如果采用固定的阈值将图像进行二值化,生成的二值图会非常黑或者有很多噪声。二值化有很多方法,主要为P片法或者峰谷法。本文采用的是P片法,阈值的大小的设定基于以下假设:由于现有车牌绝大部分为蓝底白字或者黄底黑字车牌,设理想的车牌平均包含大约60的蓝黄色像素和40的白黑色像素。首先,将图像二值化,计算出黑色和白色像素的比例,将它和期望值进行比较。从而算出新的阈值,直到近似等于期望值为止。图2-5为处理前与处理后的车牌图片。 图 2-5 车牌图片二值化对比(2)去除边框和铆钉等影响识别的因素:通过对图像进行开闭运算,将 图 2-6 去除前后车牌图像及其水平和垂直投影铆钉和灰尘等面积较小的干扰因素去掉。边框通过将二值化后的图进行水平和垂直投影,根据边框投影宽度相对字符窄很多,将边框去除。如图2-6所示。2.1.3.2连通区域法连通区域法是基于数字形态学原理来实现的。它的方法如下:在二值图中检测到第一个黑色像素点,假设它是一个连通区域上的一个像素点,将它作为递归过程的开始,递归公式为 (2-4)Xk代表提取出来的连通区域,A代表车牌的二值图。B是33的8连通区域的模板X。为包含检测到的第一个黑色像素点的连通区域。在递归开始的时候,创建一个新的图像X。,如下图所示,在递归的第一步,X。通过模板B膨胀,这意味着感兴趣的区域从第一个像素扩展到它的相邻像素,得到的X1图像是膨胀后的图像与原图像的交集。也就是说第一个像素周围的像素若属于连通区域,它必定为黑色。接着X1膨胀,一直递归下去,直到Xk=Xk- 1,表明连通区域所有的像素点都已找到。图2-7演示了递归操作的前两步。当一个连通区域被找到,检测一下她是否满足字符的规格(高度,宽度等),从而将铆钉和灰尘图像去掉。这个方法的优点是不受图像倾斜的影响,而且它找到的边界十分准确。但也有不足的地方就是要求图像质量高,而且转化的二值图质量要好,字符之间没有粘连现象。小的断裂也会使这种方法失败。2.1.3.3综合策略现有的车牌字符分割方法有静态边界法和投影法等方法。静态边界法是根据车牌字符在车牌中的位置进行字符分割,而投影法则是通过车牌二值图的垂直投影,寻找波谷位置进行字符分割。图 2-7 连通区域法示意图静态边界法不受噪声影响,但它依赖于车牌图像的正确提取。投影法可以很容易地确定字符边界,但阈值的选取在这个方法中十分关键。选错阈值对连通区域法的效果是有影响的,但影响不大。表2-1列出了三种方法对三种情况的处理效果。表2-1 字符分割方法比较 静态边界法 投影法 连通区域法 额外的边界 不当的阀值 噪声 要达到最好的分离效果,本文提出一个综合策略可以提高分割效果。图2-8显示了三种方法是如何组合以达到最好效果的。 步骤:(1)通过动态阈值法将彩色图像转化为好的二值图像。(2)使用连通区域法,看是否可找到七个或者八个连通区域(汉字未必连通)。(3)若失败,将车牌图像的边框去掉,再使用连通区域法再搜索一边。(4)若还是失败,使用投影法确定字符位置。 (5)如果这种方法也失败了,使用静态边界法将字符分割。连通区域法作为检测的主要方法是因为如果输入图像没有太多噪声输入车牌图像 No Success Success Success动态阀值使用连通区域法分离字符去除边框使用连通区域法分离字符使用投影法分离字符静态边界法分离字符 ? No ? No ? Yes Yes Yes 输出分割后的字符图 2-8 综合策略流程图以及和字符相似的黑色区域,它的识别成功率是很高的。在这种方法失败后,投影法作为它的替代者。静态边界法作为最后的手段是基于车牌字符一般都是水平排列。由于部分车牌图像质量较差,车牌分割出现错误。我们对引起错误的原因进行了分析。主要有以下两个原因:第一,车牌图像是定位程序分割出来的,不是手工分割的。车牌定位的准确性对字符分割的影响很大。当有较多车身背景时,容易引起分割错误。第二,当有很强噪声的时候,单纯采用去噪算法难以完全去噪,会造成一些分割错误。2.2汽车车牌的字符识别方法举例2.2.1车牌字符识别中的字符特征提取方法2.2.1.1车牌汉字统计特性及分析汽车图像经过预处理、车牌定位、字符分割等步骤后,能够提取出单个字符的图像。汉字子图像二值化后,对其结构特性进行统计分析,所得结果对于特征的选择和分类器设计都有很大的意义。(1)周边特征分析每一个汉字图像用3232点阵表示,分别从左、右、上、下4个方向顺次扫描汉字点阵。用Pln(l),Prn( l ),Pun ( l ),Pdn ( l ),n=1,32,l=1,32,分别表示按上述4个方向扫描汉字点阵时,在第n个扫描线、第l列点阵位置上第一次遇到笔画黑像素的概率。因此l表示第n次扫描行上在周边上第一次遇到黑像素前白像素的个数,它称为空程长度。这样在4个方向上空程长度l的概率分布函数,可以较好地说明汉字周边结构特征的分布。下面定义周边扫描空程长度熵,它们是四边结构特征所包含信息量的度量。左周边熵: ; (2-5)右周边熵: ; (2-6) 上周边熵: ; (2-7) 下周边熵: ; (2-8) 根据熵的理论,当为等概率分布时,其信息量为最大:maxHln =4bit. 对于其他三个周边熵也同样如此。 (2)游程统计特性分析车牌汉字的游程统计分布可以反映汉字内部笔划结构的分布情况。游程是指在同一方向上,宽度为一个像素的扫描线条的长度。由笔划像素组成的黑游程长度记为BRL,由背景像素组成的白游程长度记为wRL。为了对汉字游程分布有一个大概的了解,对8个离散方向(0,20,45,70,90,110,135,160)4040点阵的汉字进行游程分布统计。不同角度的平均黑游程长度列于表2-2中。 表2-2不同角度的平均黑游程长度 离散方向 黑游程平均长度 离散方向 黑游程平均长度 () (像素数) () (像素数) 0 4.159 70 3.445 90 4.470 110 3.547 45 2.677 20 2.261 135 2.939 160 3.348(3)笔划特性及分析在选用汉字特征时不仅仅利用笔划,同时选用笔划组成的结构,以提高特征的分类效率。分析50个车牌汉字图像,结果显示横竖笔划使用频率最高,共占约34。因此,以横竖笔划为主选择局部特征和端节点特征是合理的。同时,撇捺笔划数目随长度的增长迅速下降,而横竖笔划数目随长度的增长变化较慢,所以选取长横竖笔划作边框的关键笔划。2.2.1.2判别准则在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别文字的特征与哪一个类别的特征最近。本研究选用公式5作为相似度判别准则。 (2-9)2.2.1.3构造神经网络分类器采用复合特征分类法,选用种具有互补特征作为类特征。在学习阶段,对训练样本进行次互不相关的分类,然后组合次分类结果,完成特征空间的划分。组合的形式为:S=S1S2,SN。采用BP神经网络来进行车辆字符的识别。BP网络是采用Widrow2Hoff学习算法和非线性可微转移函数的多层网络。一个典型的BP网络采用的是梯度下降算法,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论