(运筹学与控制论专业论文)汽车车牌模糊模式识别系统.pdf_第1页
(运筹学与控制论专业论文)汽车车牌模糊模式识别系统.pdf_第2页
(运筹学与控制论专业论文)汽车车牌模糊模式识别系统.pdf_第3页
(运筹学与控制论专业论文)汽车车牌模糊模式识别系统.pdf_第4页
(运筹学与控制论专业论文)汽车车牌模糊模式识别系统.pdf_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要基于视频图像的车牌识别系统,要求能够将运动中的汽车牌照从复杂背景中提取并识别出来。本文介绍了车牌识别系统中的关键技术( 车牌提取、图像预处理、特征提取、车牌字符识别等) 。本文首先采用模糊积分理论提取车牌,然后对车牌图像进行预处理,再利用自联想存储网络进行字符恢复。在特征提取中,由模糊熵作为各特征对于分类贡献的指标进行特征提取。在字母和数字识别的第一阶段,幂q 用支持向量机将其分成两类,第二阶段将模糊模式识别和神经网络理论结合分别对每类建立识别模型。在汉字识别中,则直接将模糊模式识别和神经网络理论结合建立识别模型。利用遗传算法优化隶属函数和网络参数,再利用最速下降法局部寻优,使系统具有很好的稳定性和精确性。测试结果表明,字母和数字的识别率可达到9 6 ,汉字的识别率可达到9 5 。关键词:模糊模式识别、模糊熵、支持向量机、遗传算法、神经网络a b s t r a c tt h eo b j e c t i v eo fa u t o m a t i cv e h i c l en u m b e rp l a t er e c o g n i t i o ns y s t e mi st oa c c u r a t e l ye x t r a c ta n dr e c o g n i z et h ev e h i c l en u m b e rp l a t ef r o mt h ec o m p l i c a t e db a c k g r o u n d i nt h i sp a p e r , w ei n t r o d u c ef u n c t i o n so f n u m b e rp l a t ee x t r a c t i n g ,n u m b e rp l a t ep r e - p r o c e s s i n g ,c h a r a c t e re x t r a c t i n ga n dc h a r a c t e rr e c o g n i t i o ne t c i nt h i sp a p e r , i nt h ef n 苫tp l a c eaf u z z yi n t e g r a lt h e o r yi su s e dt oe x t r a c tt h ev e h i c l el i e e n c e , t h e np r e - p r o c e s s i n gi sc a r r yo u t ,a n df i n a l l yc h a r a c t e ri sr e s n m o db ya u t o a s s o c i a t i v em e m o r y i nt h i sp a p e r , w ei n t r o d u c ef u z z ye n t r o p yf o rc h a r a c t e rd i s t i l la n du s j n gf u z z ye n t r o p ya si n d e xo fc h a r a c t e rf o rc o n t r i b u t i o no fc l a s s i f i c a t i o n f i r s ts t a g eo fr e c o g n “i o no fl e t t e ra n dd i g i tc h a r a c t e rr e c o g n i t i o n ,w ec a r r yo u tt h ec l a s s i f i c a t i o no ft h e mb yt h es u p p o r tv e c t o rm a c h i n et h e o r y , s e c o n ds t a g e ,w er e s p e c t i v e l ys e tu pr e c o g n i t i o nm o d e lo fe w r ys p e c i e s w ep r e s e n tt h em e t h o do fc h i n e s ec h a r a c t e r sr e c o g n i t i o nb a s e do nf u z z yn e u r a ln e t w o r k a tt h es a m et i m e ,w ep r o p o s e du s i n gg e n e t i ca l g o r i t h mo p t i m i z em e m b e r s h i pf u n c t i o na n dp a r a m e t e r so fn e t w o r kf o rs o l v i n gad i s a d v a n t a g et h a tt h es t e e p e s td e s c e n te a s i l yg e ti n t ol o c a lm i n i m u m ,t h a tm a d es y s t e mh a sag o o ds t a b i l 时a n da c c u r a c y t h er e s u l t so ft e s ts h o wt h a tt h er e c o g n i t i o nr a t eo fl e t t e ra n dd i g i tc h a r a c t e ri sa p p r o x i m a t et o9 6 a n dt h er e c o g n i t i o nr a t eo f c h i n e s el e t t e ri sa p p r o x i m a t et o9 5 k e y w o r d s :f u z z yp a t t e r nr e c o g n i t i o n ,f u z z ye n t r o p y , s u p p o r tv e c t o rm a c h i n e ,g e n e t i ca l g o r i t h m ,n e u r a ln e t w o r k h独创性声明及使用授权的说明一、学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标明和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。二、关于学位论文使用授权的说明东南大学,中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其它复印手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研究生院办理签名:导师签名日期:沙易i 1 驴东南大学硕士学位论文第一章引言1 1 交通管理现状与研究的意义近几年来,世界各国的汽车数量迅速增加。致使公路交通负担越来越重,交通事故已成为世界第一大公害。随着我国经济的发展,车辆急剧增加,交通状况日益恶化。从交通需求发展看,我国汽车化水平还很低,随着经济的持续高速增长,必然引起交通需求的超常发展,而道路交通管理相对滞后,交通问题较发达国家更为突出。解决这一问题的方法就是引入智能交通系统,而车牌识别是智能交通系统中的关键技术。对汽车牌照的正确识别。既可以实现在交通路口、高速公路、军事要塞、机关门卫对过往车辆的实时登记、流量统计和对防卫日标的安全警备,对肇事车辆、被盗车辆、犯罪车辆进行辨识和拦截;又可在汽车存车场对进出的车辆进行登记、统计和查询,以保障安全防盗,并可协助自动收费。这无疑节省了人力、资金,同时提高了交通管理的效率是建设智能交通系统不可缺少的部分。根据来自美国和挪威收费站的资料表明,自动收费站e t c 收费车道的通行能力,每小时至少1 5 0 0 辆,而人工收费只有3 5 0 辆,也就是说,在不增加收费车道和扩建收费站的情况下,电子不停车收费系统使收费站车道通行能力提高到4 倍以上。本项目将对基于视频技术的车牌识别关键技术及在高速公路e t c 中的应用进行研究,研究成果将为江苏苏南高速公路电子不停车收费( e t c ) 的实施提供关键技术支撑,对提高高速公路通行能力具有重要意义,同时也为当前高速公路联网收费中防换卡逃费提供解决方法,可望产生显著的经济效益和社会效益。1 2 国内外研究现状及发展趋势汽车牌照自动识别系统( l i c e n s ep l a t er e c o g n i t i o ns y s t e m ,l p r ) 一般由牌照选取、牌照预处理和字符识别三大部分组成。以上三个部分在功能上是相互独立的。虽然汽车牌照识别的字符集小,但由于受室外环境光线、车辆运动颠簸、雨雾等诸多不确定因素的影响。最后获得的字符图像可能会有严重的缺失和畸变,从而影响识别效果。早期曾出现过基于车载电子标签的车牌识别系统。当汽车即将到达收费站时,车载电子标签发出信号,收费站的接收系统收到信号,就得到了汽车车牌。但是,这种方法在实际应用当中存在很多问题。首先,车主不愿意购买电子标签;其次,车主可以偷换电子标签,从而产生舞弊问题。所以,现在研究的重点主要是基于视频图像的车牌识别。就字符识别来说前人已经提出了多种方法文献 1 提出了模版匹配法;在这种方法中,首先建立标准字符库,然后将输入的待识别的字符与标准字符进行匹配。匹配时采用如下公式:p i ( a ,历= ( ( 口fa p , ) v ( a f 。a p , 。) )( l2 1 )其中,以卢分别代表标准文字向量和待识别文字向量。由上式可以看出匹配中包括两点一是字符点的匹配,二是背景点的匹配,当两者的匹配值较大时,则认为待识别字符属于该字符类。这种方法的缺点是每次匹配时要计算的像素点数太多,导致系统响应变慢。文献 2 提出了基于距离度量准则的识别方法,即在提取特征之后。计算待识样本特征和标准样本特征的距离,与哪一类的距离最小,则认为待识样本属于哪一类。基于人工神经网络的字符识东南大学硕士学位论文别是一种较为成功的经典方法 3 ,但目前广泛使用的b p 网络一般面临网络结构设计和参数优化方面的问题。文献 4 提出了通过主成分分析降维并提取字符统计特征的识别方法;文献 5 提出了提出了基于矩和小波变化的识别方法。其缺点也是识别速度较慢。1 3 本文的研究方法和主要内容车牌识别技术主要研究车牌选取,字符分割、字符特征提取及识别。本文利用视频图像处理技术来获取车牌的特征数据,进而建立识别模型。研究主要包括三个部分:车牌选取、车牌图像预处理、字符识另1 j 。( a ) 在车牌选取阶段,采用模糊增强的方法使图像对比度增强,然后进行边缘提取锝到若干个准车牌,根据车牌自身的特点提取一些车牌特征,利用模糊集理论计算每个准车牌是车牌的隶属度,选取隶属度最大的准车牌即为车牌,从而实现车牌选取。( b ) 在车牌图像预处理阶段,采用中值滤波去除随机噪声,利用h o u g h 变换检测车牌边框,检测边框的同时可以检测车牌倾斜的角度,从而可以矫正车牌。通过垂直和水平投影去除边框采用模糊c 均值的方法进行图像二值化。对于二值化后的车牌图像,首先通过图像的垂直投影进行字符分割,然后将字符归一化,再利用自联想存储网络进行字符复原。( c ) 在字符识别阶段,分为汉字识别和数字、英文字母识别。先对分割得到的单个字符检测四周边缘,然后将字符剪切出来并将其归一化为8 0 * 4 0 的点阵字符。对归一化后的字符利用模糊熵理论进行特征提取,然后建立模糊神经网络进行识别。模糊神经网络将神经网络的自学习能力和模糊系统的逻辑推理能力结合起来,实现了两者的优势互补。为了建立好的模糊神经网络模型,这里利用遗传算法和梯度下降法优化网络参数。在得到最终的网络模型后,利用测试样本对识别模型进行测试,检测模型的识别效果。第二章模糊模式识别理论基础2 1 模式识别概述模式是用来和待识对象进行比较的样本,而模式识别的意思就是对研究对象利用一些特征进行分类,识别出它们的分类结果。模式识别的基本流程入如图2 1 :图2 1 模式识别基本流程模式识别研究的方法主要有:统计模式识别,句法模式识别,神经网络模式识别和模糊模式识别。其中,基于决策理论的统计模式识别是传统的模式识别方法。统计模式识别的理论很完善,方法主要有:聚类分析法、统计决策法最近邻法等。统计模式识别的优点是理论很成熟,能很好地考虑噪声和干扰的影响,识别模式基元能力强。但是,统计模式识别对结构复杂的模式提取特征困难,不能反映模式的结构特征,难以从整体上考虑识别问题。句法模式识别的优点是识别方便,可以从简单的基元开始,由简到繁,能够反映模式的结构特征,其缺点是当存在噪声和干扰时,基元的抽取比较困难。人工神经网络是新近发展起来的一个理论,它模拟了人脑的结构和思维方式。由于其良好的自学习和强分类能力,在模式识别领域的应用中取得了很大的发展。利用人工神经网络进行模式识别有许多明显的优点:( 1 ) 具有很好的自适应能力;( 2 ) 具有很好的容错性,因此能对带有噪声或是变形的输入模式仍能进行很好的识别;4东南大学硕士学位论文( 3 ) 学习算法成熟,便于学习和训练;“) 具有并行处理能力和数据的分布式存储能力,识别速度快。但是,人工神经网络也存在着一些缺点。例如:收敛速度慢;容易陷入局部极小点,所以,在利用神经网络进行模式识别的研究时,往往将神经网络与别的理论相结合,以期得到更好的结果。但是在现实世界中,有很多的识别问题具有模糊性例如在天气预报中,对于”多云”的描述,到底怎样算多云,很难给出一个精确的概念。这时,利用上面的识别方法就很难得到一个好的识别结果,而模糊模式识别的方法就可以得到较好的识别结果。2 1 2 特征提取特征选择与提取是研究如何从众多的特征中找到那些对识别最有效的特征,从而实现特征空间的压缩,特征提取的好坏将直接影响到识别的结果。特征选择常用的方法有以下几种:( 1 ) 基于距离度量的特征选择。常用的距离度量有:s 阶m i n k o w s k i 距离:( ,而) :【羔1 一勃门;1( 2 2 。1 )j 1欧氏距离:d1艿8 ( x k ,而) = 【( h 一勃) 2 】_( 2 2 2 )平方距离:磊( 以,而) 2 峄l 一勖( 2 2 3 )( 以,而) = ( x k 一而) 7 q ( x k 一而)( 2 2 4 )( 2 ) 基于熵最小化的特征选择。w ( p ,g ) 表征两类分布烈一) 和g ( t ) 的差别:r ( p ,g ) = v ( p , q ) + 矿( g ,p )在很多情况下,可以用= _ p ( x i ) l o g p ( x ,) - q ( x j ) l o g q ( x , )+ p ) i o g g ( 一) + g ( 而) l o g p ) go( 2 2 5 )w ( p c o , q “)来表征各类之间的分离程度。( 3 ) 基于模糊度的特征选择。常用的模糊度计算公式有:距离模糊度:( 2 2 6 )东南大学硕士学位论文以( 彳) = 【i u a ) 一“ ,瓴) l ”】一( 2 2 7 )栉;。熵模糊度:、如( 爿) 2 志善【叫一“) l n u a ) 一( 1 一钆“) ) m ( 1 一( t ) ) 】( 2 卫8 )2 3 模糊模式识别理论基础2 3 1 模糊关系和模糊关系矩阵在模糊集的基础上,把普通集合中关系的定义推广到模糊集合中,就可以得到模糊关系的定义定义2 3 1 模糊关系模糊关系是一个定义在清晰集u l ,u 2 ,玑的笛卡儿积上的模糊集。用模糊集的表示方法,可将u lx x u n 上的模糊关系q 定义为如下模糊集合:q = ( “,2 ,。) ,峋 i ,甜2 ,甜。”l 似l ,“2 ,甜。) e u lx u 2 玑) ( 2 3 1 )其中,:“虬哼【o ,1 】作为特例,二元模糊关系是一个定义在两个清晰集的笛卡儿积上的模糊集。通常用模糊关系矩阵来表示有限笛卡儿积上的二元关系,即这个矩阵中的元素是相应有序对属于该模糊关系的隶属度值。这样,就得到了模糊关系矩阵的定义定义2 3 2 模糊关系矩阵对于有限集彳; q ,a 2 ,a f f o b = 岛,b 2 ,以) ,则a b 中的模糊关系可以表示成肼,l 的矩阵:r =u ( a l ,6 1 )u ( a 2 ,岛)u ( a m ,h i )“ ,b 2 )u ( a 2 ,b 2 )( 口。,b 2 )这个矩阵称为模糊关系矩阵2 3 2 模糊关系的合成在说明模糊关系的合成之前,先引入两个概念:投影和柱状扩展。定义2 2 3 投影令q 为u i 中的一个模糊关系, , 为 1 , 2 ,胛) 的一个子集则q 在x 上的投影是u x u k 中的一个模糊关系级t 它可用下面的隶属函数来定义:( ,) - ,嚣,( 地,)2 3 3 6东南大学硕士学位论文其中, 甜 , 。, 是 蚝,) 关于如i 一,”。 的补集定义2 3 4 柱状扩展令绋表示吒中的一个模糊关系, , 是 1 , 2 ,啦的子集,则g 扩展至u t x 以玑的柱状扩展为u ix u , 玑中的一个模糊关系( k ,其定义为( u l ,。) 5z t q p ( u l t ,)( 2 3 4 )有了以上两个定义,就可以定义模糊关系的合成。令p ( u ,矿) 和q ( v ,) 表示两个共用一个公共集y 的清晰二元关系。定义p 和q 的合成为u x w 中的一个关系记作po q ,它满足( 墨:) e po q 的充要条件是至少存在一个y 矿使( 以力毫p 且o ,力q 。通过使用关系的隶属函数的表达式,可以得到合成的一个等价定义:定义2 3 5 对任意似力u x w ,当且仅当“,口似力= m ,a x 即o ,力,( 弘2 ) 】( 2 3 5 )时,po q 是尸( 以 和q ( l 聊的合成,其中,f 表示任一r 范数。2 3 3 模糊测度与积分定义2 3 6u 是基本空间,设a 量,( ,若满足:( 1 ) u a :( 2 ) a a j a a :( 3 ) 以e a j u a a月村则称a 为盯域,或称盯代数。定义2 3 7 若z e ( - 1 ,佃) ,9 4 :a _ 【0 , 1 】,满足条件:( 1 ) g ( = l i( 2 ) 4 n 口为空集时,有g ( x u 动= g ( 彳) + g i ( 功+ 以 ( 一) g z ( 口) ;( 3 ) 4 单增或单减趋近a 时,有嬲g a a ) 2 9 a a ) ;则称g j 为彳- f 测度或g 工测度7东南大学硬士学位论文定义2 3 8 设( u ,a ,g j ) 是测度空问,h :u 【o ,1 】是u 上可测函数,4 a ,h 在彳上关于乳的f 积分定义为:地) 。乳0 2 删s u p 】( 口 乳( a a h o ) ) ( 2 3 6 )其中九= i 矗( “) 4 ,( o s a 1 ) 特别当a = u = “l ,甜。) g h ( u 1 ) h ( u 2 ) h ( u 。) 时记以= ,甜2 ,。)时,则积分公式变为:l 矗 ) 。岛( = 曼q ( ) ( 以) )( 2 3 7 )定理2 3 1x f f v i ,4 n 4 为空集时,则g 测度有性质;g , t ( u 4 ) = n ( 1 + 绐j ( 一,”一l 】( 2 3 8 ),一7 01 - 1显然,当u = 伽l ,甜2 , 时,有月g ( u ) = 【r i ( 1 + 船4 ( 坼”一l 】= 1( 2 3 9 ) ,- l当对v f ,g 似,) 都已知时,由( 2 3 9 ) 式可以求出五,进而求出9 4 ( 以) 。根据模糊集理论,模糊事件可表示为三元组 q j - ( ,p ) q = ,o ,l ,;_ t 为其特征集,k = o ,1 ,m - i ) ,p = p ,“) ,p ,“) ,p r ( ,;_ ) ) 为其特征的评价集用模糊集a 描述模糊事件存在的可能性大小,u a ( 吒) 表示特征咯对于识别模糊事件的重要程度即权重,记k = r o ,胛1 ) ,则模糊事件存在的可能性由下式计算:烈一) 2 二o ,以) ( 五”2 3 4 权重的选取方法( 2 3 1 0 )这里采用二元对比排序法进行权重的选取。设【,= ( u 1 屹,) 为有限论域,a 为( ,上的模糊集,待求( ) ,f = 1 ,2 , 假定尹= f 易,p 2 ,& 为被调查集,则二元对比摔序法可描述为:对v ( u ,) ,1 s s , k ,v p ,e p ,若被调查者认为蚝 ) u a ( ) ,则认为丘( ,乃) = l ,厶( ,p j ) ;0 ,当j k 时,显然有以下8东南大学硕士学位论文性质:( 1 ) 妻丘 。,乃) + 妻丘 。,乃) :口;i di d( 2 ) 窆窆杰丘似,p ,) ;_ q n ( n - 1 ) ;k = 1i - i ,l i厶这时,可按下式计算( 坼) ,f = 1 ,2 ,栉。h口艺丘 ,p j )2 萄显然,( q ) 满足( 虬) - - l 。,一( 2 3 1 1 )2 3 5 语言变量与模糊i f 幢n 规则数字计算机具有很强的计算能力,但是却很难达到人脑的思维能力,一个很重要的原因是数字计算机只能对数进行处理,而人脑却能对语言进行思维。语言变量是人类知识表达中最基本的元素,当用传感器测量一个变量时。传感器会给出一个数值;而当征求专家对一个变量的评价时,专家会给出语言。例如,当使用雷达枪来测量汽车的速度时,雷达枪会给出诸如3 9 m p h ,4 5 m p h 等数字;而当让某个人告诉我们汽车速度时,恸她通常会说如“它开得慢”、“它开得快”等话语。因此,引入语言变量的概念就会使自然语言的模糊描述形成精确的数学表述,这是人类知识系统有效地嵌入工程系统的第一步。z a d c h 为语言变量给出了如下的定义;定义2 3 9 语言变量可表征为四元组( x ,t ,u ,m ) ,其中,( 1 ) x 为语言变量的名称,如速度、年龄等。( 2 ) t 为语言变量x 取值的术语集合,如t _ 慢速,中速,快速 。( 3 ) u 为语言变量x 取值的论语,如u = 【0 ,圪。】。( 4 ) m 是研究x 取值的语意规则,即将t 中的每个语言值和u 中的模糊集连接起来的语义规则。在模糊系统中,人类知识可以用模糊w - t h e n 规则来表述。一条模糊i f - t h e n 规则就是一个条件陈述句,它可以表述为i f ,t h e n 。由于模糊命题是用模糊关系来解释的。所以剩下的关键问题是怎样解释i f - t h e n 规则。在模糊命题运算中,表达式i fp t h e nq 可以写成p q 。目前,通常认为p + q 等价于p v q ,q g ) v p 和p q 2 3 6 模糊逻辑与近似推理在传统逻辑中有一种基本推理规则是假言推理( h y p o t h 删s y l l o g i s m ) 这一推理规则9东南大学硕士学位论文的陈述是。给定两个命题p q 和g _ ,可以推出命题p r 为真命题,记为( q g ) ( g 斗呦( p _ ,)( 2 3 1 2 )假言推理可更直观地表述为:前提i :如果x 为a ,则j ,为口;前提2 :如果y 为b ,则z 为c l结论:如果x 为4 ,则z 为c 。在模糊逻辑中,命题都是由模糊集表述的模糊命题。模糊逻辑的最终目的是将模糊集理论作为一种主要工具,为不确定命题的近似推理提供理论基础。为实现这一目的,将上述的假言推理推广为广义假言推理( g c r a l i z c dh y p o t h e t i c a ls y l l o g i s m ) 。这一推理规则陈述的是给定两个模糊命题,“如果x 为彳,则y 为矗”和。如果y 为b ,则z 为c ”。可推出一个新的命题“如果x 为a ,则z 为c 一。这里,a ,b ,b ,c ,和c 是模糊集合,b和丑很近似,c 和c 。很近似,即:前提h 如果x 为4 ,则y 为曰;前提2 :如果y 为丑,则z 为c ;结论;如果x 为4 ,则= 为c 。现已给出了模糊逻辑中广义假言推理的基本思想,下一个问题就是,在给定前提条件下,怎样确定结论中模糊命题的隶属度函数。为了解答这一问题,提出了推理合成规则。推理合成规则是下列程序的一种推广:假设从鼻毫u 到y 矿上有一条曲线y = ( 力,并给定善= 口和y = ( 曲可以推出y = b = ,( 口) 将上述程序进行推广,即假设a 为一个区间,( 力为一个区间值函数。为找到由口和弛) 所推出的区间b ,首先要构建一个由口扩展而来的拄状集合a e ,然后找到它和区闻值曲线的交集1 。那么,l 在y 上的投影就是所求的区间6 。再进行下一步推广,假设4 是u上的一个模糊集合,q g u x v 中的一个模糊关系。则由a 。的柱状扩展以和其模糊关系q的交集。即可得到模糊集以。n q 。那么,以n g 在_ y 轴上的投影即为模糊集合b 。更具体地讲,给定( 曲和( 力,可得“o ( 力2 “j ( 力,进而可得”“o ,力= 哇 力,( 墨y ) 】= f 陋_ 一( 功, y ) 】( 2 3 1 3 )1 0东南大学硕士学位论文最后,可得b ,它为a en q 在矿上的投影,即= 哪吐匕o ) “力】( 2 3 1 4 )x f :o 则上式称为推理合成规则。由此,可以得到广义假言推理结论中模糊命题的隶属度函数为:甜j z ) = 鲫p 酗j 口 ,n f wo ,力】( 2 3 t s )v e y若在式( 2 3 1 5 ) 中采用不同的t 范数和不同的含义规则式,则可以得到多个结论2 3 7 贴近度贴近度是对两个f 集接近程度的一种度量。定义2 3 1 0 设a ,b ,c 是u 上的模糊集,若映射n :,( ,) 一【o l 】( 2 3 1 6 )满足条件:( 1 ) 彳,占) = n ( b ,4 ) ;( 2 ) h 4 彳) = l ,n ( u ,) = o ;( 3 ) 若4 b c ,则( 么,c ) ( 4 功 ( 鼠c ) 。则称n ( a ,功为f 集4 与曰的贴近度。称为,( 上的贴近度函数。贴近度的这个定义,是原则性的概念,其具体规则视实际需要而定。常用的贴近度有海明贴近度、欧几里的贴近度和格贴近度。海明贴近度:欧几里的贴近度格贴近度:( 4 研;l 一丢喜h ) 一“) i( 离散论域)_ 瑚_ 1 _ 击n ( 功( 功l 出( 连续论域) ,印= l 一击( 骞( ) 一( _ ) ) 2 ) ( 离散论域)( 4 占) = 1 一了亭i ( f 一o ) 一( 力) 2 岔口( 连续论域)式中,当u 为有限论域时,n ( a ,毋= ( 4o 功a ( 4 o b 。)东南大学硕士学位论文当u 为无限论域时,ha o b 2 v f u j ( 薯) 如) )a o b2 茹( ( 砌2 3 8 模糊模式识别系统在现实世界中。很多概念具有模糊性,虽然并不存在一个明确的判别边界能对具有模糊性的对象进行精确的分类,但是,人脑却可以比较容易地处理和识别模糊信息。而建立在模糊集合理论基础上的模糊模式识别技术能够模拟人脑的这个功能。因此,研究模糊模式识别技术是很有意义的。模糊模式识别应根据实际问题进行特征提取,将普通特征变为模糊特征,建立模糊集的隶属函数,然后利用模糊模式识别的原理进行识别。因此,在提取特征之后,必须建立适当的描述此特征的隶属函数。隶属函数的确定是模糊模式识别的重点也是难点,确定隶属函数的方法主要有:( 1 ) f 统计方法对论域上的固定元是否属于论域上一个可变动的普通集合丘做一个确切的判断。在各次试验中,材。是固定的,而以是随机变动的。做栉次试验,则“。彝目出“a ”的次数甜。对彳的隶属度= j 竺二兰! = 二竺艿:n ( a i ,o 1 2 ) ,7 :n ( a 2 ,0 2 2 )= 仨虽誊4 ( 功= 尸岱刃= 防o ) a x鸣( 力= 户 ,7 石 = 亿( 力出其中,b 和名( 功分别是随机变量万和玎的概率密度,而东南大学硕士学位论文按概率方法计算,得a 2 = 1 - 4 ( 一4 ( 曲4 = 1 一面仁乌矿4 曲( 挚4 ( 力= m ( x - a 1 ) 一西( 竺鱼)盯i盯2这里吣,= 珐e 乞v 刀( 3 ) 带置信度的德尔菲法。设彳是f 集,其方法步骤如下:& 请疗位专家,对v o u ,给出( ) 的估计值肌;b 第一次的估计值概扣1 忆赢= 吉喜,码= 丢喜( 聊旷一m 1 ) 2 ;c 将肼”珊l ,d l 给专家,让专家给出新的估计值埘2 ,i = l 栉;正重复b ,c 直到第_ i 步有d k o 为预先给定的标准;e 将m k ,以给专家,让专家给出估计值m l m 。,并给出每一个估计值的信任度q ,e j 【0 , 1 】计算鬲= 窆m 坍,e 一= 窆q 。其中,嵋2 0 ,i 1 厅且窆嵋:1 。+( 4 ) f 分布法。常用的f 分布有矩形分布和半矩形分布、梯形分布和半梯形分布、抛物型分布、正态分布、哥西分布、蛉型分布。隶属函数的确定虽然有一定的规律性和科学性。但仍带有较浓厚的主观色彩。因此,必须对隶属函数进行优化,通过不断的修正,才能建立最优的隶属函数。使用模糊识别技术分类的结果不再是一个模式明确地属于某一类,而是以一定的隶属度属于某一类,所以,必须对识别的结果进行处理。对结果进行处理有两种基本方法:一是按“最大隶属度原则”归类,这种方法主要应用于个体的识别;另一种是按“择近原则”归类,此方法主要应用于群体模型的识别。定义2 3 n 最大隶属度原则设4 ,( ,i = 1 - n ,对“o u ,若存在乇使东南大学硕士学位论文如( “。) = m a x ( a l o ) ,4 ( “o ) ,以 o ) )则认为相对地隶属于4 。定义2 3 1 2 择近原则设4 ,b e f ( u ) ,f = l 以,若存在f o 使( 4 0 ,丑) = m a x c n ( a l ,功,n ( a 2 , d ,( 以,功)则认为曰与4 0 最贴近,即判别占与4 0 为一类第三章汽车图像预处理在汽车牌照识别中,车牌选取与字符分割的好坏直接影响到归一化和特征提取的好坏,而特征提取又与字符识别的准确率紧密相连。所以本章主要介绍汽车牌照自动识别系统( 黼r s ) 中的关键技术:车牌分割,牌照图像预处理。3 1 汽车车牌识别系统简介基于视频图像的汽车车牌识别系统中,首先利用摄像头拍摄汽车正面图像,将图像信号送至图像卡,并转化成数字图像存在图像卡的存储器中;然后计算机读入图像卡存储器中的数字图像并对其进行实时处理,提取出字符特征后。送入分类器得到识别结果。3 2 汽车图像预处理对于所拍摄的汽车图像,首先要提取车牌。要进行车辆牌照的提取,必须了解车辆牌照与背景或车体相区别的特征。中国现有的车辆牌照可分为四类;蓝底白字、黄底黑字、黑底白字和白底黑字,颜色组合比较丰富。同时,光线对颜色的影响较大,所以直接利用颜色特征提取牌照图像并不可取。经过观察发现,所有牌照具有以下特征。( 1 ) 车牌呈规则的矩形,宽高比约为2 2 :7 ,每个字符的宽高比约为0 5 ;( 2 ) 车牌区对比强烈,边缘非常丰富;( 3 ) 车辆牌照的具体排列格式是由一个省份汉字( 军警牌为其它字) 后跟字母或数字组成的7 个字序列。标准车牌的具体排列格式是:第一个是各省、直辖市的简称或军警代号,第二个是英文字母,第三、四个是英文字母或数字,第五、六、七个是数字。行驶中的汽车被摄象机拍摄所得的图像随拍摄角度和车牌污损程度不同,采集到的图像往往较模糊。并且,除车牌特征比较丰富外,车灯、各种商标的特征也较丰富。据此,提出一种基于模糊增强技术的车牌提取算法。3 2 1 模糊增强边缘提取是基于边缘特征的图像分割的第一步,但由于拍摄的图像可能不清晰,使得车牌边缘和背景的对比不强烈,还有噪声的影响,这些因素都会影响边缘提取效果。所以,首先要对所获得的图像进行平滑处理,这里采用邻域平均法,模板尺寸为3 3 ,然后对平滑后的图像进行模糊增强,这样可以增强边缘处的对比度,有利于后面的边缘提取。这里提出一种模糊增强的方法,其方法如下:若得到的车牌图像为m x n 的图像,具有上- 1 个灰度级,用雄。表示图像中象素( 肌,胛) 的东南大学硕士学位论文灰度级k 相对于特定灰度级,。的隶属度,通常取,= l - 1 ,所以,材。= g ) = 西l m( 3 2 1 )取1 , m = ( ,) ) ,= l ,2 ,( 3 2 2 )叫喜0 s “ms “。s 群。1( 3 2 3 )式中, 。= g ( 1 0 ) ,c ( “。) 的效果是增大( 。) 或减小( ”。“。) 甜。的值相应与( 3 2 ,1 ) 的逆变换为。= g 一1 ( ) = ( 三一1 ) “。( 3 2 4 )未经过增强和经过模糊增强的图像如图3 1 ;图3 1 汽车图像由图可以看出,经过增强后的图像更加突出了车牌字符及其边界。对两个图像分别利用s o b e l 算子进行边缘检测,边缘检测后的图像如图3 2 。其中,左图是未经过模糊增强提取的边缘图像,右图是经过模糊增强提取的边缘图像。很明显可以看出,经过模糊增强后的边缘提取效果更好。图3 2 边缘图像3 2 2 车牌区域的提取考虑到车牌一般位于汽车图像的正下方,所以从下往上进行扫描,如果某一行的白像1 5东南大学硕士学位论文紊点比较多并且从这一行向上黑白像素交替出现的频率较高,直到某一行的白像素点又比较多,则认为白像素点比较多的两行之间的部分为车牌所在的水平区域。对提取的水平区域做垂直投影,因为没有车牌的部分的投影曲线相对较低,且比较平缓;有车牌的部分垂直投影比较突出,因此,投影图中梯度最大的位置对应车牌的左右边界。在某些情况下,投影圈中有“毛刺”现象出现,对应的梯度比较大,容易造成干扰。针对这种情况,采用了“滑动窗”机制:根据车牌宽高比的先验知识以及提取的带状区域的高度可以确定出车牌宽度的大致范围。以此作为滑动窗的宽度;然后由右至左。寻找梯度的极大值点( 即可能的右边界) ,同时检测滑动窗的左边界是否对应梯度较大的位置。如果其左边界对应梯度较大的位置,则认为滑动窗所在的区域即为车牌区域;否则,则认为是干扰区域。通过以上的提取,得到第一个准车牌区域。下面要对这一区域是车牌区域的可能性进行评估,这里取两个特征:宽高比和竖直投影特征。记准车牌区域的宽高比为善,考虑到车牌的宽高约比为2 2 :7 ,所以构造隶属函数:,( 功:e 哼)在提取竖直投影特征时,首先将准车牌区- - 值化,这里只是为了评估车牌。对- - 值化要求不是很精确,所以分割阀值取直方图中两峰之间的谷点。获得- - 值化图像后,进行竖直投影。显然,车牌图像的竖直投影图有7 个独立的峰。因此,取准车牌投影图中峰的个数为竖直投影特征。记 为独立的峰的个数构造如下隶属函数:f 毒篡;f c n ) = 。一4 1 1( 3 2 6 )l 7 珂s 1 1【了, 行特征提取后,还要寻求每个特征对于评估车牌的贡献( 即权重) 这里采用二元对比法来选取权重,调查了1 0 0 0 个对象,调查结果如表3 3 :s 1 z ep r o j e c ts i z e4 4 04 4 0lp r o j e c t5 6 05 6 0表3 3 置信度分析表据此求出权重s i z e :0 4 4 ,p r o j e c t :0 5 6 。记s 代表几何特征,p 代表投影特征。计算此准车牌区域的特征评价得到:p ( s ) = 0 9 8 6 ,p ( = 1 ;由( 2 3 9 ) 求出a = 0 ;由q 3 8 ) 式求出岛( x j ) = 0 5 6g o ( x 2 ) = 1 ;由( 2 3 1 0 ) 式求出此准车牌区域是车牌区域的可能性为0 9 8 6 。所以判断此区域即为车牌区域,提取的车牌如图3 4 图3 4 车牌如果此区域是车牌区域的可能性很小,则继续向上扫描找到准车牌并重复以上步骤,直到找到车牌区域。1 6东南大学颐士学位论文在字符识别之前,还要对提取出来的车牌图像进行预处理。预处理的内容主要有:边框检测,倾斜校正、图像二值化、字符分割、归一化、图像复原。3 2 3 边框检测和倾斜校正由于拍摄角度不同,车牌会出现倾斜现象。但是,边框的上下,左右边界依然是直线,因此,用h o u g h 变换来检测边框。在检测边框时即可确定车牌倾斜的角度护,将车牌旋转口角即可将车牌校正。经过校正后的图像如图3 5 :图3 5 调整后的车牌3 2 4 图像二值化虽然车牌字符和底色差别很大,但由于拍摄中外界因素的影响,会使得车牌直方图中两峰之问的谷不是非常明显,导致最佳分割阀值不好确定。鉴于这种情况,采用模糊c均值算法进行二值化。f 伽算法通过对目标函数j ( u ,功= ”以2( 3 2 7 )j i ,耐的迭代优化对数据集进行模糊分类。其中,丹是数据的个数,口是类别数,m 是加权指数,表示数据坼属于类别c ,的程度,以表示数据以和类别q 的聚类中心q 之间的距离。若得到的车牌图像为m n 的图像,有三一1 个灰度级,则f c m 均值算法步骤如下:( 1 ) 确定类别数c = 2 ,数据个数h = m n ,加权指数m = 2 ,距离选欧氏距离。( 2 ) 取出现次数最多和次多的两个灰度值作为初始聚类中心。可得到v 0 = “,v 2 ) 。( 3 ) 依次取b = o ,l ,2 ,“) 按如下方法更新u ( 6 为u ( “) ;a ) 计算 = p i l ,2 ,以爿一_ i - o ) ,l k = l 2 一厶。b ) 按如下方法计算数据以的新的隶属函数值:1 ) 鹳胜氟2 衣5( 2j q ”n2 ) 否则对所有f _ ,t ,令= o ,且取= 1 。k = 七+ l 。l | i t1 7东南大学硕士学位论文( 5 ) 按式巧= 士窆( ) :黾,f = 1 ,2 计算v ( b + 1 ) e ( u 。) 2 “i - j( 6 ) 取s = o o l ,若0 u 6 一u p “i l 兰2 ,疗z 埘这里取o g = 0 5 5 ,按( 3 2 8 ) 式进行二值化。考虑到车牌图像中背景像素点总数与字符像素点总数之比基本固定( 约为2 o ) ,所以若二值化得到的背景像素总数与字符像素总数之比约为0 5 ,则说明此车牌字符的平均灰度小于背景的平均灰度,这时对二值化图像取反即可。这样可以将不同颜色的车牌都二值化成黑底白字的车牌。二值化后,此时的车牌周围仍然有一个长方形的边框,在后面的字符识别中经常被认为是字符的一部分而影响识别效果。因此,使用水平和垂直投影来检测并取出周围的边框。结果如图3 6 ;图3 6 二值化结果3 2 5 字符分割将二值车牌图像进行垂直投影,如图3 7 :图3 7 字符的垂直投影每一个谷点位置即为字符应被分割的位置。经过以上的分割,可以得到切分出来的单个字符,如图3 8 :目囝园回翻囝图3 8 切分出来的单个字符由图3 8 可以看出,车牌字符被很好地分割出来。3 2 6 字符归一化由于拍摄远近不同导致字符的大小也不同,所以这时分割出的字符还不能直接用于识别,必须要将字符进行归一化。首先检测出字符的外边框,然后将字符沿着外边框切割1 8东南大学硕士学位论文出来。下面,要将字符归一化成8 0 * 4 0 象素的字符。这里,采用最近邻插值算法。插值通常是利用曲线拟合的方法,通过离散的采样点建立一个连续函数,用这个重建的函数就可以求出任意位置的函数值。对于等间隔离散数据,插值可以表示为:f o ) = c k h ( x - x i )( 3 2 9 )k , l o其中,j i l 为插值核,c 。为权系数。插值算法的数值精度及计算开销直接与插值核有关。插值核的设计是插值算法的核心。在最近邻插值算法中,每一个插值输出象素的值就是在输入图像中与其最近邻的采样点的值。算法的数学表示为:厂( 力= ,阮) ,0 5 ( z i _ i + x i ) x 0 5 ( + + 1 )( 3 2 1 0 )通过最近邻插值算法,可以将分割出来的字符归一化为8 0 * 4 0 象素的字符。3 2 7 字符复原由于外界污染等因素,归一化后的字符会有一些缺损,从而对后面的字符识别造成影响,所以要对归一化后的字符进行复原。这里将神经网络中的h e b b 规则应用于自联想存储网络进行字符复原。自联想存储网络的结构如图3 9 :图3 9 自联想存储网络传递函数为对称硬极限函数,所以输出a = h a r d l i r a s ( w p )( 3 2 1 1 )h e b b 规则的意思是:权值 0 的变化与突触两边的活跃函数值的乘积成比例,数学表示为:形”- - w “+ 口g p q 7( 3 2 1 2 )如果将权值矩阵初始化为0 ,然后q 个输入输出对依次应用式( 3 2 1 2 ) ,则有:w = a p 7( 3 2 1 3 )其中,a = 【口i ,a 2 ,】,p = 【p l ,p 2 ,】。如果输入模式是正交的,采用式( 3 2 1 3 ) 为权值不会产生误差;如果输入模式非正交时,权值采用如下形式则会使误差最小:w = 4 妒7 竹一p 7( 3 2 1 4 )东南大学项士学位论文对归一化后的字符。字符像素点用1 表示,背景像素点用一1 表示,采用式( 3 2 1 4 ) 为权值,字符复原的效果如图3 1 0 ;葛莴葛葛荡图3 1 0 字符“9 ”的复原图上图中最左边的图是标准模式,依次分别是遮住不同位置的模式及其复原模式。可以看出,复原效果是很好的。4 i 原理简介第四章车牌字符识别系统原理车牌字符识别属于= 维信号识别。但是,由于天气、拍摄角度、车牌污损等因素的影响。使得车牌字符出现扭曲、变形的情况:同时,字符信息具有模糊性。例如“川”字中的撇,到底满足什么样的特征才是撇,并没有一个明确的概念。车牌字符识别的这些特点使得传统的识别方法不能取得很好的识别效果。虽然并不存在一个明确的边界能对具有模糊性的对象进行精确的分类,但是人脑却可以比较容易地处理和识别模糊信息。例如:尽管车牌字符被扭曲变形或被噪声污染了,但是人却可以一眼看出是什么字。前面已经叙述过建立在建立在模糊集合基础上的模糊模式识别技术能够模拟人脑的这种功能,因此,以模糊模式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论