(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf_第1页
(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf_第2页
(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf_第3页
(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf_第4页
(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(通信与信息系统专业论文)车辆牌照自动识别系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 鼋3 6 鼢 本文对车辆牌照自动识别系统做了较为深入的理论研究,并做了大量的实 验加以证明。 文章首先讨论了车牌定位的方法。鉴于以往方法的优缺点,在对车牌图像 区域进行分析的基础上提取出区域图像的一维和二维特征。基于维特征提出 了一种新的算法,这种算法速度快,准确率高;基于二维特征首次将遗传算法 应用于车牌定位,取得了更为显著的效果。 车牌提取出来以后,本文对其进行了一系列识别前的预处理:畸变校正、 二值化、去噪声和字符分割,最终将牌照图像分割为单独的字符。针对样本的 特点,本文对现有的一些算法作了改进。实验结果表明,改进后的算法能获得 更为准确的结果。 :最后研究字符的识别。本文在识别时,采用了多层分类器组合的方法,结 合基于概率的统计识别法,基于模糊的模板匹配法,细化,去除毛刺,以及基 于骨架信息的结构方法。实验证明,这套方法使识别率明显提高,达到了9 9 以匕。 关键词:车牌识别,车牌定位,特征提取,遗传算法,多层分类器, 模板匹配统计识别,结构识别 a b s t r a c t i nt h ep a p e r ,t h o r o u g ht h e o r e t i c a lr e s e a r c ho nt h ev e h i c l el i c e n s ep l a t ea u t o 。 r e c o g n i t i o ns y s t e mh a sb e e nm a d ea n ds o m ep r i n c i p l e sa n dm e t h o d s a r e g i v e na n d p r o v e db y al o to f e x p e r i m e n t s a tf i r s t ,m e t h o d so fl i c e n s ep l a t el o c a t i o na r ed i s c u s s e d 0 h e - d i m e n s i o na n d t w o - d i m e n s i o nc h a r a c t e r sa r ea b s t r a c t e df r o mt h ea r e ai m a g eb a s e e lo nt h ea n a l y s i s o f t h ep l a t ei m a g e b a s e do nt h eo n e - d i m e n s i o nc h a r a c t e r s ,an e w a l g o r i t h mi sr a i s e d w h i c hh a sah i 曲s p e e da n dac o r r e c tr a t i o b a s e do nt h et w o - d i m e n s i o nc h a r a c t e r s , t h eg e n e t i ca l g o r i t h mi sa p p l i e do nt h ep l a t el o c a t i o nf o rt h ef i r s tt i m e t h er e s u l ti s e x c e l l e n t a f t e rt h ei m a g eo fl i c e n s ep l a t ew a se x t r a c t e d ,i ti s p r e p r o c e s s e d t h es t e p s i n c l u d ea b e r r a t i o n c o r r e c t i o n , t h r e s h o l d i n g ,g e t t i n g r i do fn o i s ea n dc h a r a c t e r d i v i s i o na tl a s t ,t h ep l a t ei m a g ei sd i v i d e dt os i n g l ec h a r a c t e r s a i m i n ga tt h e s p e c i a l t yo ft h es a m p l e s ,t h ea l g o r i t h m sa r ei m p r o v e d i ti sp r o v e dt h a tt h er e s u l t u s i n g t h ei m p r o v e d a l g o r i t h m i sm o r ea c c u r a t e f i n a l l yt h er e c o g n i t i o no f c h a r a c t e ri sr e s e a r c h e di nt h ep a p e r , t h ec o m b i n a t i o n o fm u l t i l a y e rc l a s s i r - yp r o c e s s o ri sa p p l i e d ,i n c l u d i n gs t a t i s t i cr e c o g n i t i o nb a s e do n p r o b a b i l i t y , t e m p l a t em a t c h i n gm e t h o db a s e do nf u z z i n e s sa n ds t r u c t u r e m e t h o d b a s e do nt h es k e l e c t o ni n f o r m a t i o n t h ee x p e r i m e n t ss h o wt h a tt h er e c o g n i t i o nr a t i o i n e r e a s e st oa b o v e9 9 k e y w o r d s :v e h i c l e l i c e n s ep l a t er e c o g n i t i o nl i c e n s ep l a t el o c a t i o n c h a r a c t e ra b s t r a c t i o n g e n e t i ca l g o r i t h m m u l t i - l a y e rc l a s s i f yp r o c e s s o rt e m p l a t em a t c h i n g s t a t i s t i cr e c o g n i t i o ns t r u c t u r er e c o g n i t i o n 南京理工大学硕士学位论文 概述 1 1 研究背景和现状 在我国,随着高速公路和各种等级公路的发展,对现代化交通管理手段的 需要越来越迫切。然而,目前几乎所有的收费站均采用人工识别车型,人工收 费,这种陈旧落后的工作方式和管理方式已经越来越不能适应高速公路的迅猛 发展。车辆牌照自动识别系统作为车型判别、被盗车辆发现和来往车辆监控管 理的有力手段,已引起了人们的广泛重视。 车牌自动识别系统可以安装在高速公路收费站、停车场、桥梁、隧道等关 卡或路口,通过识别车辆牌照的号码,从数据库中检出车辆的车型和其它记 录,来实现不停车收费,如果是还未在数据库中有记录的车辆,则建档,下 一次就可以按常规处理。除此之外,车牌自动识别系统对于交通事故和违章 的处理也很有帮助。如果在重要路口安装自动识别系统,记录车辆的车型、 车牌等细节,则对事故的侦察工作提供了极大的便利。各路口的自动识别系 统通过网络互连后,还可组织成功能强大的报警网,用于提供违章车辆的信 息。总之,车辆牌照自动识别系统有很高的实用价值,是现代化交通管理的 重要手段。 车牌自动识别系统涉及图像处理、模式识别等领域的知识。国外对车牌自 动识别系统的研究较早,早在7 0 年代,英国在实验室中就完成了“实时车牌 检测系统”的广域检测和开发。同样在7 0 年代,诞生了第一个实时自动车牌 检测系统,它的应用面向被盗车辆的发现 1 2 。8 0 年代末期,广域检测的 商业应用开始进入日程,这种趋势持续到9 0 年代并融入了传统车流分析的交 互控制。9 0 年代,车牌自动识别系统在电子收费系统上的应用更是加速发展, 已经达到了较高的实用水平。 我国地域广大,牌照的样式也很不规范,国外的车牌自动识别产品无法适 应国内复杂的车牌形式,导致识别率降低,加上进口发备价格昂贵,经济投 入难以在短期内回收,因此应尽快开发出适合我国国情的车牌自动识别系统。 然而,我国对汽车车型、特别是牌照的定位和识别研究较少,虽然有一些科 研院所和企业进行了有关的研究,但在技术上还不够成熟,使得这方面的研 南京理工大学硕士学位论文 究突破更为迫切。 1 2 车牌识别系统的结构 本文研究工作的目的是在实际项目中投入使用,担任车辆监控、车辆信息 采集的任务,所以对系统的实用性十分重视。 系统的硬件组成框图如下: 图121 系统硬件框图 感应线圈相当于一个传感器,当车辆经过时,其频率会发生变化,从而触 发图像采集卡采集图像。在以往类似的系统里,也常用红外探测器实现这部分 功能。红外探测器安装在地面露天的环境中,用它来触发采集图像,会由于天 气、温湿度的变化发生虚警、失灵等故障。感应线圈埋在地下,受环境影响小, 灵敏度高,性能十分理想,而且在做触发器的同时还可以采集有关车型的感应 信息,可谓一举两得。 单片机负责检验从线圈传来的信号是由于真的有车辆,还是虚警。如果判 断结果是有车,就向计算机发送信号。这个判断过程由单片机来完成速度快, 效率高,有利于系统实时性的实现。 计算机接到信号后,令图像采集卡在这一瞬间采集图像,图像送入计算机 的车牌识别系统,进行定位、识别、然后显示识别结果并归档( 存入数据库) 。 接下来,将简单介绍最重要、最复杂的部分,也是本文的核心部分,车牌 识别系统。识别系统的设计主要考虑两个方面:一是准确,二是高效,即一力 面系统应尽可能降低误识率和拒识率,保证输出结果稳定,另一方面又要保证 实时性,减少每个处理环节所用的时间。 车牌识别系统的主要任务是车牌在图像中的定位、车牌字符的分割以及字 符的识别。图l22 是车牌识别系统的功能流程图。可以看到,控制器将任务 分派给不同但相关的模块,来处理车牌识别的一系列任务,包括车牌在图像上 的定位、字符的分割和识别。具体过程是:将整个含有汽车和背景的图像经由 南京理工大学硕士学位论文 车牌定位模块进行处理,完成车牌的定位。定位完成后,将车牌区域的图像传 送给字符定位模块进行处理,完成车牌内的字符定位。字符位置得到后,经由 字符识别模块识别,获得车牌号或拒识信息。最后,通过语义分析模块,确定 得到的车牌号是否正确。如果识别出的结果不符合事先定义好的规则,则认为 车牌定位出现错误,应重新寻找车牌;反之,无须再进行进一步的搜索,将正 确的车牌号信息经处理传给别的系统,进行进一步处理,比如通过数据库系统 决定收费情况,是否被盗车辆等等的判断。如有必要,识别的结果还可以送入 车型判别系统,起到一定的辅助作用。 本文的软件系统是用v c + + 实现的。 图12 l 车牌识别系统结构图 在整个车牌识别系统中,重点和难点当属车牌的定位。车牌定位是识别的 基础,找不到准确的车牌图像,识别根本无从谈起,其重要性不言而喻。而在 自然背景下检出目标图像历来就是图像处理中f 分棘手的问题。针对这种情 况,本文用很大的篇幅讨论了车牌定位的方法,提出了两个新的算法,并取得 了很好的结果。 光学字符识别( o c r ) 很早就开始发展,至今技术已经十分成熟。为了提 高系统的实时性,本文没有采用神经网络等复杂的手段,而是结合多分类器使 用模板匹配乖j 结构分析相结合的方法,电取得了满意的识别率。 南京理工大学硕士学位论文 1 3 彩色图像灰度化 为使处理的问题得到简化,必须将彩色信息投影到灰度空间上,本文接下 来所有的工作都是在灰度图像的基础上进行的,所以采集到图像后的第一步就 是将彩色图像转换为灰度图像。 彩色图像根据三色学说原理,可以用红( r ) ,绿( g ) 和蓝( b ) 三个分量表示, 因此可以用与单色图像相似的方法分别量化。车牌的种类多种多样,颜色也各 不相同。背景色有白色,蓝色,黄色,黑色等等,前景色有白色,红色,黑色, 蓝色等等。这些众多的彩色信息,如果用单通道的彩色信息,必将造成误分割。 由于人眼对r g ,b 三个分量亮度的灵敏度感觉不一样,可以采用不同程度的 压扩变换,从而获得比较好的主观色彩效果。 在进行彩色图像的灰度化时,通常采用如下公式: ,= 03 尺+ 05 9 g + ol l 占 ( 131 ) 1 4 本文的主要工作 本文第一章讨论了车牌识别研究的发展历史,我国车牌识别研究的现状、 车牌识别系统的总体结构、彩色图像灰度化和本文所做的工作。 第二章首先讨论传统的图像分割方法,介绍了一种基于边缘检测和区域生 长的定位方法,根据仿真结果分析了它的优缺点。然后介绍定位前改善图像质 量的工作,接下来对车牌区域图像的特征进行了分析,提取出若干有用的特征, 并讨论了各个特征的可靠程度。最后基于上面的特征提取,提出种基于区域 图像一维统计特征的快速算法,准确地从图像中找到车辆牌照。 第三章提出了一种车牌定位的新方法。这种方法将遗传算法用于车牌定 位,结合区域特征矢量构造的适应度函数,寻找到牌照区域的最佳定位参量。 第四章对提取出的牌照区域进行预处理,包括变形牌照的矫正和标准化, 图像去噪声、二值化和单个字符的分割四个部分。 第五章研究字符的识别。应用多分类器,结合模板匹配、结构等方法识别 车牌上的字符,达到车牌识别的最终目的。 第六章对本文做了总结,并指出车牌识别中有待进一步研究的问题。 南京理工大学硕士学位论文 2 车牌定位 所谓车牌定位,就是将车辆的牌照区域与复杂的背景分离,从图像中分割 出来,它的实现需要使用图像分割,模式识别等多方面的知识。在车辆牌照自 动识别系统中,车牌的定位是以后一切识别工作的基础,其准确程度直接影响 到系统的识别精度,因此定位的重要性是不言而喻的。但是,图像分割历来是 计算机视觉研究中的一个重要而困难的任务,虽然一直受到研究人员的重视, 但进展比较缓慢,被认为是计算机视觉研究中的一个瓶颈,所以车牌定位是整 个系统的难点。本章先介绍传统的定位技术,然后根据牌照区域字符目标的特 点提出了特征提取的方法,并设计了一个效果良好的快速算法。 2 1 传统的车牌定位方法 传统的车牌定位技术一般采取直线检测、灰度阈值、区域生长、边缘检测、 频域和空间分割等方法【6 】。下面将介绍几种常用的图像分割方法。 1 灰度闽值法。即二值化方法,是图像分割中的一个重要方法,目的是 将图像中有意义的特征或者需要应用的特征提取出来。这些特征可以是图像场 的原始特征,如物体占有区的象素灰度值,物体轮廓线和纹理特征等,也可以 是空间频谱,或直方图特征等。 二值化的方法利用了图像中要提取的目标物与背景灰度特性上的差异【3 】, 如设置一个灰度阙值,令凡是灰度值低于这个阈值的象素都变成某个灰度值, 而灰度值高于这个阈值的象素都变成另一个灰度值,这样就可以将图像中的物 体和背景以明显不同的灰度级区别开来。 设图像f i x , y ) ,其灰度级范围是【z ,z :】。在z ,和z :之间选择一个合适的 灰度闽值为t ,则按上述方法分割后的图像f ( r ,y ) 可由下式表示: z ( x , y ) - 乏觏) 其e 他z 佗, 式中z 为阈值,是图像t l x ,y ) 灰度级范围内的任一个灰度级集合,即z c _ z z : 。z 。和z 。为任意选定的目标和背景灰度级。由此可见,阈值的选取直接 南京理工大学硕士学位论文 影响分割的结果( 在本文的第四章中将对灰度阈值的选取方法作进一步讨论) , 只有在一些目标物体灰度级和背景相差明显的图像中才可以应用简单的灰度阈 值法来分割出图像中的目标物和背景。实际情况下,车辆图像的背景十分复杂, 图像的灰度直方图很难呈现峰一谷一峰的形状,用阈值法提取车牌区域有很大的 限制。 2 边缘提取。经典的边缘提取以原始图像为基础( 4 】。对图像的每个象素 考察它的某个邻域内灰度的变化,利用边缘邻近一阶或二阶方向导数的变化规 律,用简单的方法检测边缘。所谓边缘点是指它两边象素的灰度值有显著不同, 边缘点也存在于这样一对邻点之间,即一个在较亮的区域内部,另一个在外部。 粗略地区分边缘种类可以有两种,其一是阶跃边缘,它两边象素的灰度值有显 著的不同;其二是屋顶状边缘,它位于灰度值从增加到减少的变化转折点。常 用的边缘检测算子有梯度算子、s o b e l 算子、l a p l a c i a n 算子和m a r r 算子等。 3 区域生长法。区域生长是一种概念上最简单的按幅度分割的方法【4 】, 它把幅度相似的邻近的各个象素聚集在一起,构成一个分区。具体地说就是: 从某一适当的初始象素( 设想每个子区域f i 有一个这样的象素) 出发,找出 具有该子区域相似属性的相邻象素,并且依次逐个对相邻象素一再重复这一过 程。这样使区域范围不断扩大,直至每一象素都被划归某一区域f i 。 在使用区域生长进行车牌定位时,一般不直接对原始的灰度图像进行处 理,而是首先把图像二值化,得到二值图像或进行边缘检测,得到边缘图像, 然后用区域生长提取出若干可疑区域,最后根据牌照的先验知识对各个可疑区 域比较判别,找到真实的牌照。 下面介绍一个基于边缘提取和区域生长的传统定位方法【6 】。 该算法的步骤如下: ( 1 ) 用s o b e l 算子进行边缘检测,得到边缘灰度图像。s o b e l 算子的定 义如下: s ( j ,) 垒i ( ( i 一1 ,1 ) + 2 f ( i 一1 , j ) + ( i 一1 ,+ 1 ) ) ( ( i + l ,一1 ) + 2 厂( ,+ l ,) + f ( i + 1 ,+ 1 ) i +,、 j ( 厂( f 1 ,一1 ) + 2 f ( i ,1 ) - k f ( i + l ,一1 ) ) 。 一( - ,( j l ,+ 1 ) + 2 f ( i ,+ 1 ) + f ( i + l ,+ 1 ) 其中,月,) 是原始图像灰度值。 ( 2 ) 挑选边缘灰度值高的象素为初始点进行区域生长,所取邻域为矩 6 南京理工大学硕士学位论文 形,宽高比为15 倍。 ( 3 )潜在牌照判别。利用有关牌照的先验知识,判断第二步得到的目 标区域是否为牌照区域。主要的先验知识有:牌照的宽高大小范围、 宽高比范围等。 这个算法思路清楚,速度较快,用在质量较好的图像上可以收到满意的效 果。然而该算法成功的一个重要条件是,第一步执行完后,边缘灰度图像中牌 照号码相对完整,同时低边缘值占大多数。本文的样本噪声比较严重的时候, 不容易满足该条件。如图2 11 所示,图( b ) 是图( a ) 经s o b e l 算子边缘检测后的 结果( 本章所用图像大小为原始图像的7 0 ) ,牌照区域已完全看不出字符的内 容,而且图像中的多个区域经边缘检测后的边缘灰度分布与牌照区域非常接 近,这样的图像应用该算法常常得不到正确的结果,但由于实验条件所限,图 2l1 ( a ) 这样的图像在本文的样本中是一个普遍现象。 ( a ) ( b ) 图2 1 1s o b d 边缘检测示意图。( a ) 为原图像,( b ) 为边缘检测后的图像 针对实际所得图像的特点,作者设计了一个基于区域图像一维统计特征的 快速算法,下面的几节将对它的原理、步骤和结果进行介绍。 2 2 图像的预处理 本文在车牌定位之前,对图像进行了预处理。实际情况下,环境和设备的 因素都可以使图像质量下降,给后面的定位和识别带来很大的困难,有时甚至 造成拒识或误识,所以应该采用一些方法来改善图像质量。这里进行的主要是 图像的平滑。 7 南京理工大学硕士学位论文 图像平滑的主要目的是减少噪声 3 】。图像中噪声的种类很多,在图像处理 技术中常见的有和图像信号强度不相关的加性噪声,和图像信号相关的乘性噪 声、量化噪声和由图像切割引起的“盐和胡椒”噪声,即颗粒状噪声。图像平 滑的方法也多种多样,在空间域可以用邻域平均来减少噪声,在频率域由于噪 声多集中在高频段,可以采用各种形式的低通滤波的办法减少噪声。但是,图 像的平滑总要以丢失一部分细节为代价的。不恰当的平滑会使图像本身的细节 如边界轮廓、线条等变得模糊不清,从而使图像降质。为了尽量保持细节,又 消除噪声的影响,尤其在本文这种牌照目标的面积与图像总面积之比很小,牌 照中字符笔划较细的情况下,尽可能地保证图像细节不丢失,本文采取了中值 滤波法。 中值滤波是一种非线性信号处理方法,与其对应的中值滤波器当然也就是 一种非线性滤波器。它对于干扰脉冲和点状噪声有良好抑制作用,而且也是一 种对图像边缘能较好保持的非线性图像增强技术。在一维形式下,中值滤波是 一个含有奇数个象素的滑动窗口,经排序后,窗口象素序列为: f ,e m e ,f 。,f + , ( 2211 ) v = ( l 1 ) 2 ,l 为窗口长度,f 即为窗口象素的中值滤波输出。 中值滤波具有许多重要特性【7 】,比如: a ) 对离散阶越信号,斜升信号不产生影响,连续个数小于窗口长度一半的 离散脉冲将被平滑,三角函数的顶部平坦化; b 1 令c 为常数,则 m e d c f ,) = c m e d f ,) m e d ( c + f ,) = c + 和d 只,) ( 22l2 ) m e d 疆。+ f 。、- m e d f 。? 、+ m e d 。? 、 c 1 中值滤波后,信号频谱基本不变。 二维中值滤波的窗口形状和尺寸设计对滤波效果影响较大。针对不同的内 容和不同的应用要求,往往采用不同的窗口形状和尺寸。常用的_ 维中值滤波 窗口形状有线状、方形、圆形、十字型以及圆环形等,见图22l l 。窗口尺 寸一般先用3 再取5 逐点增大,直到其滤波效果满意为止。使用一维中值滤波 最值得注意的是要保持图像中有效的细线状物体。 南京理工大学硕士学位论义 : : :。 。 :。:。:。 。 :。 ( a )( b )( c )( d )( e )( f )( g ) 图2 211 中值滤波的几种常用窗口( a ) 方形窗口( b ) 菱形窗口( c ) 十字形窗口 ( d ) ( e ) ( i ) ( g ) 线状窗口 在本文中,这几种窗口都尝试过,觉得效果最好的是二一维十字形中值滤波。 比较图2 212 中的( a ) 图和( b ) 图,可以发现( b ) 图画面平滑了一点,噪声点减 少,同时也模糊了一点。然而,图像的平滑总是以损失部分细节为代价的,在 本文l 1 1 ,由于后面特征提取方法的特点,平滑噪声起的作用远远大于细节丢失 带来的损失,所以采用了这种中值滤波的方法。 ( a )( b ) 图2 2l2 中值滤波结果图( a ) 为原图像,( b ) 为滤波后的图像 2 3 特征提取 从人眼视觉的角度出发,牌照的字符目标区域具有如下特点:( 1 ) 牌照的字 符与底色在灰度上有较大差异,字符与牌照底交界处有较大的灰度值跳变,这 种跳变在很大程度上与光照无关。而字符与牌照底内部灰度较均匀,无明显跳 变。( 2 ) 牌照字符有多个,基本呈水平排列,所以在牌照的矩形区域内存在较 i 富的边缘。( 3 ) 不同图像中牌照的具体大小、位置不确定,但大小变化有一 定范【翻,存在个最大长度和高度。这些特点在图像的维灰度分布图上体现 得 分明显。 南京理工大学硕士学位论文 ( b ) 图2 3l汽车灰度图像及其一维分布特征,( a ) 为汽车灰度图,( b ) 为( a ) 中自线 所示部分的一维灰度分布 图23l ( a 1 是一幅随机抽取的样本图像( 本文所用的图像均采自连云港一新 墟级公路收费站,大小为3 5 2 2 8 8 ,2 5 6 灰度级。这里和以卜- 各章图像的大 小和举标都以象素为单位) 。图23l ( b ) 是图( a ) 在y = 5 0 的位置上的灰度分布, 其横坐标为图像的横坐标,纵坐标为该点图像的灰度值。从中可以看出,在牌 照所在的i x 域,灰度曲线变化剧烈,高灰度值与低灰度值之间的差异较大,与 其它【x 域相比有明显的区别,呈。个有规律间隔的强烈的灰度“梳形”变化。 向没有牌照出现的域,就无法获得“个有规律间隔的强烈的灰度变化。冈此, 0 南京理工大学硕t 学位论文 针对牌照区域的这个明显的特点,如果能提取出良好的特征,再结合牌照的大 小、形状、可能位置等先验知识,就能找到车牌的大致位置,至少可以标出可 能的位置,不会将应该判为车牌的区域漏判。分析哪个位置出现了“梳形”变 化,可以同时在傅立叶频域和空域进行。f 日是有研究表明,对傅立时域的分析 很困难,所以最终还是回到了对空域的研究。下面就是牌照区域的几个特征。 2 3 1 牌照区域的统计( 数学) 特征 首先在图像上确定个矩形区域,其左上角顶点的坐标为以y ) ,长度为, 高度为h 。对区域里的每一行灰度值进行一维的波峰检测和波谷检测,然后统 计区域的数学特征,也就是说,下面的特征都是基于波峰和波谷值的。之所以 采取这种方法,是因为波峰和波谷的特征可以很好地代表整个区域的特征,而 且受噪声干扰小,计算方便省时。 提取特征如下: 1 波峰密度d e n 对于区域里的每一行,一维波峰密度定义为 玎 d e n ( i ) = 导i l y ,y + 办一l 】( 2 3 1 1 ) f n 是第f 行波峰的个数。为了简便起见,这里所说的第f 行并不是整个图 像的一行,而是指象素 g ( f ,功,g ( i , x - - 1 ) ,g ( i , x + l - 1 ) 组成的一行。 对于整个窗口,二维的波峰密度定义为 d e n :三y y + h1 d e m , h 鲁 ( 2312 ) 从物理意义上说,波峰密度代表了一个区域内较亮象素点的密集程度。显 然,无论牌照区域是深色底浅色字还是浅色底深色字,由于有多个字符,都有 丰富的灰度变化,所以波峰的个数会比较多,相应波峰密度会较大。 2 波峰的均值m 。 第f 行波峰所在位置的象素点组成集合p ,。第i 行的一维波峰均值m p ( i ) 的 定义如下 iq 卅p ( 沪邑 ,p , y ,y + h 一1 】 ( 23 1 3 ) ,l zj2 l g , s 指第,行第列象素点的灰度值。对于二整个窗l ,二二维的波峰均值定 南京理工大学硕士学位论文 义为 - y * h 一11 n m p2 万1 萎朋,( 7 ) 2 专荟g t 后,只,只) ( 2 3 1 4 ) n = 门, ( 23 l 5 ) 是区域内总的波峰个数。埘。的物理意义很明显,牌照内的字符或底色 必有其一较亮,波峰的均值应该较大。这个特征可以把背景中一些变化频率大 而灰度值小的部分排除。 3 波谷均值掰, 第f 行波谷所在位置的象素点组成集合q ,第f 行的一维波谷均值的定义 是 q ,i 【y ,y + h 一1 】( 2 3 1 6 ) 对于整个窗口,二维的波谷均值m ,定义为 y + h i1 m m t2 i 1 善啊( 7 ) 2 刍荟乳七 0 1 ,q 2 ,q ) ( 2 31 7 ) m = 拧: ( 23 l 8 ) m 表示区域内波谷的个数。波谷的均值代表了牌照中较暗部分的平均灰 度。 4 波峰波谷均值差埘。 一维的波峰波谷均值差脚。( f ) 的表示式是 a m ( f ) = 所,( j ) 一州,o ) f 【y ,y + h 一1 】( 23 1 9 ) 对于整个窗口,波峰波谷均值差坍。的表示式是 a m 2 埘p 所 212 的分析指出。车牌图像的一个显著特点就是字符和牌照底差异较大, 在灰度分布图上表现出曲线有强烈的变化,所以波峰与波谷的均值差应陔很 大。这个特征可以很好地区分开车轮边缘、树木等灰度变化频率大,但变化幅 南京理工大学硕士学位论文 度小的图像区域的干扰。 5 波峰标准差o 。 在牌照区域,字符内部和底板内部的灰度是均匀的,除了噪声造成的影响 外,没有明显的跳变。因此波峰的方差较小,在理想的情况下应该为0 。为了 减小特征的数值,这里取标准差代替方差。 对于第,行, 1n 1 , o ,( f ) = t x ( g f m p ( ,) ) 2 儿 p ,f 抄,y + 一1 ( 2311 1 ) ,j 2 l 对于整个窗口, 盯,:i|y乙+h1仃,o):【丽1n(gk-lnp)1 k - - t p ) z 】 七 鼻,只,只 盯,2 i 刍仃,o ) 2 面荟( 2 】尼七,只,只 6 波谷标准差口: 根据上面分析的原因,牌照较暗部分的灰度也应该是均匀的, 方差也较小,且理想情况下为0 。同理用标准差取代方差。 对于第,行, 所以波谷的 。撕) = 哮喜( 驴喇) ) 2 】j 皑一e y , y + h - 1 】( 2 3 1 1 3 ) 对于整个窗口, a t :,1y 厶+ h - i d ,( f ) :【孑1 m 幢。一掰,) z 】 七 q l ,q :,q 1q 。) 2 矗鲁dr ( f ) 2 万荟一坼) 2 】尼 七 q l ,q :,一 7 波峰间距的方差口d 2 波峰间距指相邻两个波峰j 和j + l 之间的距离巧川 d l j | 。fx l n xjj p j z 是波峰对应象素点的横坐标。所谓波峰间距的方差,就是波峰分布的均 匀程度。从图21 ( b ) 可以看出,牌照区域一维灰度的变化有一定规律。这个规 律虽然会由于牌照字符的不同和颜色的不同而有所变化,但有一点是相同的, 那就是:维灰度分布曲线中的波峰或波谷的分布比较均匀。不会出现部分 区域内有很多波峰,其它区域波峰很少的状况。所以,波峰间距的方差f _ := 应很 大。对丁区域的每一行,波峰间距方差的数学表达式如下 南京理工大学硕士学位论文 a 撕) = 六 ( 北矿矿咏侧2 + 萋+ 1 ( “) 也( j ,圳2 f 【j p ,y + h l 】,只 ( 23 1 1 6 ) 0 。( ,x ) - x ) 是第i 行旺,y + ,】区间的第一个波峰到区域左边界的距离,一( ,x ) 是该区间波峰的个数, - t - ,一1 一r 。,) 是最后个波峰到区域右边界的距离。 m z ) 是该区间波峰间距的均值 1q 一1 ( j ,功2 丽哥“f 功吖) + 否d :, p l ( j ) + ( x + l - l - x , , o , x ) o ,堋 i l v ,y + h l 】,b( 23 1 1 7 ) 区域总的波峰间距方差表示如下 y + h l 盯:= 亡盯;o ) ( 231 1 8 ) 是不是波峰间距方差的值越小就越能体现牌照区域的特点呢? 牌照内的任 何一行都有汉字、字母和数字,高灰度值和低灰度值交错排列,但不是标准的 均匀分布,换言之,相邻波峰之间的距离大小并不完全相同,是有变化的。所 以牌照区域的这个特征值不能低于某个数值。而对于车辆散热片,保险杠等非 字符目标,波峰间距的方差会很小。利用这个特征,可以很好的把字符区域同 它们区别开来。 利用上面提取的七个特征,选择其中六个,构成区域二维特征矢量矿。 矿= d e n 肼,a m ,。,。2 。j 和区域一维特征矢量 v o ) = d 娥t ) mp ( i ) 狮a ( i gp ( t ) ( y 1 l j 畋i 不选择m ,是因为m 和7 中已包含了m ,中的信息,为了使模式向量的维 数尽量小,只选择六个特征。 南京理工大学硕士学位论文 2 3 2 聚类变换 在分类时,特征矢量矿中各个分量并不具有同样的重要性,它们在判别函 数中有不同的贡献,这一点可以通过线性变换来实现。变换后,重要的特征赋 予较大的权值,不重要的特征给予较小的权值。假定变换矩阵为对角阵 7 , 即 = ( w m ) 匈膏时 兰够= 时( 2321 ) 式中,一l ,2 ,疗表示特征权系数,现在的问题就是要在一个类别中各模式 点之间的距离最小的条件下来决定系数w 。在模式识别中,一个类别中各模 式点之间的距离被称为类内距离,表示了同类模式的相似性,经常用欧式距离 来进行侧度。使用无偏样本方差,得类内距离为 d 2 = 2 ( ) 2 ( 2 3 2 2 ) = l 式( 4 ) 中,a ? 为模式分量咋方向的样本方差,这里的样本应全部取自不同图像 的牌照区域。当考虑到加权系数后,该式变为 d 2 = 2 ( w 盯 j = , 不能都为零,为求类内距离最小, w 。= i k = l ( 2 32 3 ) 需要用到拉格朗日乘子。考虑约束条件 ( 2 3 24 ) 在此约束条件下,要使上式中的d 2 最小,相当于使 s = 2 ( w 盯,) 2 一p ( w ,一i ) ,= lj = 1 最小。将此式对求偏导并令其为零,则有 = 告 同样,若s 对l a n g r a n g e 乘子求偏导并令其为零,可得 w 。= l ( 2325 ) ( 2326 ) ( 2327 ) 口 o w ,、【 = 业 w 南京理 大学硕士学位论文 于是,由( 53 5 ) 式和( 53 4 ) 式有 z”z。鲁-v3=1 1 v 或 p 。:了4 _ o j 2 将( 5 3 7 ) 式代入( 53 4 ) 式可得特征加权系数 1 w g2 i o ;o :2 j = l ( 2328 ) ( 2329 ) 对给定的维数甩,上式分母中的连加对各w 。值显然相同,故加权系数w 。 与方差o ? 成反比。这种方法的计算原则是,大的方差对应的加权系数小,而 小的方差应取较大的加权系数。聚类变换就是这样靠加权来实现特征选择的。 o 。小意味着第k 个特征更加可靠,相应的权应更重;相反,o 。大表示第k 个 特征可靠性较小,相应的权应更轻。由2 32 1 1 式确定的变换矩阵彤将模式 向量由矿空间变换到x 空间: x = y 那么,在x 空间其类内距离就达到最小。 经过对本文样本进行统计,得到有关w 的以下结果: 对于二维特征矢量: w 2 = d i a g ( 4 6 3 5 2 9o0 7 3 6o0 4 8 00 0 6 1 5o2 0 5 4o5 5 8 1 ) 对于一维特征矢量: w i = d i a g ( 5 6 6 7 1 7o0 6 3 8o0 6 3 70 0 7 0 601 0 7 1 o 7 9 1 5 ) 得到基于二维特征的。瞩,就可以用传统的模式识别方法,如贝叶斯准则、 最近邻法等进行识别。然而,这种识另u 方法需要计算所有子区域的二维特征矢 量,对于本文采用的3 5 2 2 8 8 的样本,采用长5 0 ,高2 0 的窗口,需要计算 ( 3 5 2 5 0 ) ( 2 8 8 2 0 ) = 8 0 9 3 6 个特征矢量,计算量非常大。对于实时性要求 商的系统,实用价值不大。因此,本文针对一维和二维特征矢量提出了两种新 的算法,将在下面的章节里详细介绍。 南京理工大学硕士学位论文 2 , 4 基于一维统计特征的快速算法 为了提高速度,节省时间,该算法利用的是图像区域的一维统计信息。在 设计算法之前,首先应该定义行牌照区域( 图像的一行中牌照所在的区域) 的 判别函数,也就是模式分类器。从一个特征向量判断该向量所代表的区域是否 属于行牌照区域是一个典型的两类问题,即判别模式x 是属于类。,还是。 训练两类模式分类器的方法很多,如固定增量法、梯度法、随机逼近法、校正 增量法、势函数法等,本文采用增量校正算法 7 得到分类器如下: 接i 三z 三: q 。, 2 【o6 7 2l 06 2 9 70 6 4 3 6 0 2 6 8 2 00 3 8 6 一o3 0 2 9 】 。,指行牌照区域,o 。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论