毕业设计(论文)-车牌识别系统研究.doc_第1页
毕业设计(论文)-车牌识别系统研究.doc_第2页
毕业设计(论文)-车牌识别系统研究.doc_第3页
毕业设计(论文)-车牌识别系统研究.doc_第4页
毕业设计(论文)-车牌识别系统研究.doc_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘 要随着现代交通运输的迅猛发展,以及汽车的大量普及,车牌识别技术的应用已经成为交通管理部门重要的管理手段。本文主要研究了车牌字符的识别技术,并将BP神经网络应用于车牌的识别,在车牌图像进行预处理的基础上,重点讨论了用BP神经网络方法对车牌字符的识别。BP网络包含了神经网络理论中最精华的部分,由于其结构简单、可塑性强,得到了广泛的应用,特别它的数学意义明确、步骤分明的学习算法更使其具有更广泛的应用背景。本文介绍的方法是建立在首先将训练样本做图像预处理,再对车牌上的字符进行分割,得到单个字符的基础上,对大小不一的字符做归一化后,得到二值图像,作为输入矢量。把这个特征向量送到BP网络中进行训练,得到了训练好的权值。然后输入要识别的图片,进行识别。程序结果显示该方法具有一定的可靠性和可应用性。关键字:LPR;字符识别; BP神经网络;ABSTRACTWith the rapid development of the modern transport and the large mumber of popular car,license plate recognition technology have become an inportant management tool of the traffic management.For the discernment to the number plate character, this text applies BP neural network to the automatic discernment of the automobile number plate, on the basis that the number plate picture goes on in advance treated , is it use BP neural network method to car discernment , license plate of character to discuss especially.BP network includes neural netword theory in essence,because of its simple structure ,strong plastic,it is widely used.Particularly its mathematical meaning clear,distinct step in the learning algorithm is more to the wider use of background. Will train samples to do the pretreatment of the picture at first, character in number plate cut apart, get the individual character. Then we get a receive characteristic vector quantity like this to put, what the vector quantity of this characteristic is written down is the characteristic of the character.Send the characteristic vector quantity BP network train, get good right value of trainin. Open picture discerned to want, go on to picture in advance treated to can discern. It shows that the validity of this method .The results of the procedures showed that the method is reliability.Key words:The number plate discerning;The character discerning;LPR;BP neural network; 目 录第一章 概 述11.1 基本概念11.2 车牌字符识别简介41.2.1 车牌字符识别发展概况41.2.2 车牌字符识别系统用到的方法41.3 国内外研究现状和发展趋势7第二章神经网络简介92.1人工神经元92.1.1神经元模型92.1.2 几种常用的作用函数102.2人工神经网络构成102.2.1 基本模型102.2.2 前向网络112.3.1 Hebb学习规则112.3.2 学习规则122.4 BP神经网络122.4.1 BP网络模型122.4.2 输入输出关系122.4.3 网络学习训练122.4.4 BP网络的设计问题132.4.5 BP网络的限制与不足152.4.6 BP算法的改进15第三章车牌字符识别的神经网络设计183.1 车牌字符识别的设计思路183.1.1 MABLAB基本介绍183.1.2设计构思介绍203.1.3相关理论基本介绍203.2 车牌字符识别的神经网络设计223.2.1 MATLAB上的代码实现223.2.2代码测试233.2.3结果测试24结束语25致 谢26参考文献27附录28南京邮电大学2008届本科生毕业设计(论文)第一章 概 述1.1 基本概念随着21世纪经济全球化和信息时代的到来,计算机技术、通信技术和计算机网络技术迅猛发展,自动化的信息处理能力和水平不断提高,并在人们社会活动和生活的各个领域得到广泛应用。高速度、高效率的生活节奏,使汽车普及成为必然趋势,交通管理自动化越来越成为亟待解决的问题。在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。目前指纹识别、视网膜识别技术已经到了实用阶段;声音识别技术发展也相当快,而对汽车牌照等相关信息的自动采集和管理对于交通车辆管理、园区车辆管理、停车场管理、交警稽查等方面有着十分重要的意义,成为信息处理技术的一项重要研究课题。车辆牌照识别(License Plate Recognition, LPR)技术作为交通管理自动化的重要手段,其任务是分析、处理汽车监控图像,自动识别汽车牌号,并进行相关智能化数据库管理。LPR系统可以广泛应用于高速公路电子收费站、出入控制、公路流量监控、失窃车辆查询、停车场车辆管理、公路稽查、监测黑牌机动车、监控违章车辆的电子警察等需要车牌认证的重要场合,尤其在高速公路收费系统中,实现不停车收费技术可提高公路系统的运行效率,LPR系统更具有不可替代的作用,因而对LPR车牌识别技术的研究和应用系统开发具有重要的现实意义。LPR系统中的两个关键子系统是车牌定位系统和车牌字符分割识别系统。关于车牌识别技术及定位系统研究,国内外学者已经作了大量工作,但实际效果并不理想,对辅助光源要求高,很难有效解决复杂背景下多车牌识别的技术难题,如:车牌图像的倾斜、车牌表面污秽或磨损、光线干扰等都会影响定位的准确性。传统车牌识别一般仅支持单一车辆,背景比较简单。而当今许多实际应用场合,如在繁忙交通路口临时对欠税费报废挂失等车辆的稽查,则监视区域比较复杂,现有识别方法无法直接应用,一般同时出现多辆汽车,背景有广告牌、树木、建筑物、斑马线以及各种背景文字等。车牌定位与识别方法,总体来说是图像处理技术与车牌本身特点的有机结合,当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效运用。一个车牌定位与识别系统基本包括:图像预处理、车牌搜索、车牌定位、车牌校正、车牌字符分割和字符识别结果的输出。本系统主要是在对汽车图像进行细致分析,从而研究车牌定位与识别的算法问题。汽车图像的背景非常复杂,快速、准确地定位车牌是车牌自动识别技术的关键技术之一,也是研究的热点和难点。长期以来,人们不断探索研究高效的车牌定位方法,取得了一定的研究成果,有关这方面的论文屡见不鲜。但大都是基于汽车图像的某个侧面特征来定位车牌的,如基于边缘检测、纹理特征及颜色特征等。由于车牌背景的复杂性和车牌特征的多样性,迄今为止,仍旧没有一个完全通用的智能化的车牌定位方法。为了寻求一种智能化的车牌定位方法,人们尝试利用数学形态学和小波等原理对传统的车牌定位方法进行改进,取得了一定的成果。李波等人提出了基于数学形态学和边缘特征的车牌定位方法,这种方法先对车牌图像进行预处理,然后利用基于垂直方向结构元素的腐蚀运算进行滤波, 再用闭合运算来填补车牌区域内细小孔洞,进而增强车牌区,使车牌区成为一个连通区域, 最后利用字符边缘的特征对车牌进行准确的定位。左奇等人提出基于数学形态学的实时车牌图像的分割方法,该方法综合运用了数学形态学和评价函数,先运用数学形态学的膨胀算法,结合信号处理中的带通滤波算法,把车牌图像的纹理结构和整体结构特征相统一,再利用数学形态学的线运算和投影法准确定位车牌区域。这种方法不仅可以快速、准确地定位不同光照条件下的一系列汽车图像中的车牌,而且还适于对有噪声及复杂背景的车牌图像进行分割。这些方法将数学形态学运算与数字图像的特征相结合, 有效改进了传统的车牌定位方法, 提高了车牌定位的速度和准确度。但数学形态学在车牌定位中的应用还不够广泛,定位效果还不够理想,有待于进一步探索研究。数学形态学是一种非线性图像处理和分析理论它的成功应归功于一个新的 思路,即摒弃了传统的数值建模及分析方法,而从集合的角度来刻画和分析图 像。数学形态学中基于集合的观点是非常重要的,这意味着:它的运算由集合运 算(如并、交 、补等)来定义;所有的图像都必须以合理的方式转换为集合。这一基于集合的观点的一个自然结果是形态学算子的性能将主要以几何方式进行刻画,而传统的理论则以解析的方式描述算子的性能。这种显式的几何描述特 点更适合于视觉信息的处理和分析,因此,数学形态学与几何的直接关系是它的 个十分吸引人的优点。数学形态学是在集合论的基础上发展起来的,这就使它 同计算机视觉问题紧密地结合了起来。从视觉心理角度看待“看见” 或“看不 见”,实际上是一种“并集”或“交集”运算,因为对于所有能看到的东西来说,其理 解的结果是它们的“并”,而对于所有因遮挡而不能看到的东西来说,其理解的 结果是它们“交”。因此,集合变换反映着视觉过程。数学形态学采用具有一定结构和特征(即形态)的结构元素(structure element) 去量度影像中的形态,进而解决理解问题,这和影像的低层次处理和高层次处理都是一致的。 因 而,数学形态学是适宜于解决计算机视觉不同阶段(由低层次到高层次)问题的 统一的理论、方法和分析工具。从集合论的角度看,数学形态学包含了从一个集合转换到另外一个集合的运算方法。数学形态学是在集合论的基础上发展起来的,这就决定了它的运算必须由集合运算(并、交、补)来定义。而数字图像是由一系列离散的像素点组成,可以以某种合理的方式将其转换为集合。这样,数学形态学就可以对数字图像进行移位、交、并等集合运算,用具有一定结构和特征的结构元素( 实际上也是一个集合) 量度图像中的形态,进而达到对图像分析和识别的目的。腐蚀和膨胀是数学形态学中的基本运算,其它运算都是由这两种基本运算复合而成的。数学形态学最先应用于二值图像,后来才被推广到灰度图像的形态变换。这些基本运算在二值图像和灰度图像中各有特点。下面介绍数学形态学在二值图像中的基本定义,设A 是原始图像,B是“结构元素”。这种转换的目的是要找到原始集合的特 定几何结构,而转换后的集合包括了这种结构的信息。同时这种转换是通过一种 称为结构元素的特征集合来实现的。对集合进行分析就是对集合进行变换,以突 出所需要的信息,所采用的方法是使主观“探针”与客观物体相互作用。“探针 也是一个集合,它由我们分析的目的来决定。这个“探针”的集合称为结构元素。剩下的问题就是如何用结构元素对物体集合进行变换。在形态学中定义了两 个基本的变换,即腐蚀(Erosion)和膨胀(Dilation)。一般将形态学变换作用于实际图像的过程称为形态学运算车牌字符识别是车牌自动识别技术的另一项关键技术,字符识别的方法有很多, 主要有:(1)模板匹配法,即利用MN 模板与待识别字符逐个像素的比较。该方法简单,但只适用于尺寸固定,车牌水平放置的情况;(2)特征匹配法,每个字符都有它独特的笔画特征,字符可以分解为具有横、竖、撇、捺、弓、洞中的一种或几种特征集合。把输入字符分解为具有上述笔画的结构特征集合,与字符库中的特征集合进行匹配, 结构特征最匹配的字符就是该输入字符的识别结果。这种方法排除了尺寸、方向变化带来的干扰,但这类方法不适用于出现笔划融合、断裂、部分缺失的字符的识别; (3)人工神经网络法,人工神经网络通过对大量样本的学习获取知识,不断改进自身性能,从而保证系统对字符的高识别率。这种方法适用于学习系统所处的环境平稳的情况,而对于所处的环境不平稳的情况,很难自适应学习环境特性,因此,很难保证字符识别系统的要求。近年来随着数学形态学在数字图像处理中的广泛应用,人们开始探索用数学形态学的理论来解决字符识别的问题。在图像处理过程中,先利用数学形态学的开启运算和闭合运算去除噪声或连接目标,从而达到恢复图像的目的。一般情况下,利用开启运算可以消除散点和“毛刺”,而利用闭运算则可以在选择适当的结构元素后将两个邻近的分离目标进行连接。然后再利用变形的数学形态学运算识别车牌字符。传统的车牌字符识别方法很多,但运用数学形态学进行车牌字符识别的研究还比较少。数学形态学的理论非常严谨,对图像的处理简明、直观,在定量描述图像的形态特征上具有独特的优势。因此,它在车牌字符识别中的应用,开辟了字符识别研究的新领域,有广阔的发展空间。图像二值化是图像处理的一项基本技术, 也是很多图像处理技术的预处理技术. 在模式识别技术、光学字符识别(OCR ) 、医学数据可视化中的切片配准、及在如银行验印系统等工程应用中, 图像二值化是它们进行数据预处理的重要技术. 在很多图像处理技术中, 图像特征对于最终的识别结果起着关键作用. 如在医学数据可视化中的切片配准中, 切片图像的边界轮廓特征对于配准是至关重要。在上述各系统中, 图像来源各不相同, 有手写纸张、印刷纸张、医学图像、银行支票等; 获取图像的途径也各不相同, 如CCD、数字相机、扫描仪、X 光、CT、MR I、显微镜等, 扫描到计算机里的图像质量也参差不齐, 其中CCD 和数字相机受环境光的影响很大. 同时, 图像来源如纸张、支票也可能质量很差. 因此 我们需要一种能处理低质量、甚至单峰直方图的图像的二值化方法, 以尽可能地保留我们所需要的信息, 特别是原图的特征信息。车牌字符识别实际上是依附在车牌上的印刷体文字的识别,能否正确识别不仅是文字识别技术的问题,还是考虑其载体车牌区域的影响。车牌字符识别技术是文字识别技术与车牌图像自身因素协调兼顾的综合性技术。由于摄像机的性能、车牌的整洁度、光照条件、拍摄时的倾斜角度及车辆运动等因素的影响使牌照中的字符可能出现比较严重的模糊、歪斜、缺损或污迹干扰,这些都给字符识别带来了难度。尽管如此,我国依然有大量的学者从事车牌字符识别研究,文献给出了基于神经网络的车牌识别方法,对于解析度较高和图像比较清晰的车牌,这些方法能有效识别车牌中的字符,但对于较低解析度和较为模糊的车牌无能为力。由于摄像条件和客观因素的限制,如车辆牌照不整洁、光照条件不好、角度不合适、车速较快等原因,采集的图像可能模糊、歪斜或缺损,因此要对图像进行平滑和增强处理。图像去噪:为了消除噪声,常采用滤波的方法,可分为空域滤波和频域滤波。按照空域滤波器的功能又可以分为平滑滤波器和锐化滤波器,平滑滤波器常用的方法有邻域平均法、选择平均法、中值滤波、自适应滤波等,其中,去噪处理多采用中值滤波,能获得较好的效果。实际应用中可能采用传统的邻域平均平滑算法,也可能采用某些改进的算法,如应用灰度差倒数加权算法进行滤波处理。图像增强:最常用的方法是灰度直方图变换,包括直方图均衡化和直方图规定化。直方图的基本思想是把原始图的直方图变换为均匀分布的形式,这样就增加了像素灰度值的动态范围从而达到增强图像整体对比度的效果。实际中有时需要变换直方图使之成为某个特定的形状,从而有选择地增强某个灰度值范围内的对比度,这时可以采用比较灵活的直方图规定化方法。41.2 车牌字符识别简介1.2.1 车牌字符识别发展概况字符识别发展可分为三个阶段:第一个阶段为初级阶段,在这一阶段中,技术上是应用一维图像的处理方法完成二维图像的识别任务。这样萌芽了一个基本思想抽取特征向量的构造和它的相关函数。现在此法仍不失为一种重要的匹配方法。第二个阶段为基础理论研究阶段。提出了表示边界的链码法,用于结构分析的细化思想,以及一些离散图形上的拓扑性研究,形成了不仅能抽取局部特征,而且能抽取大范围的凹凸区域、连通性、孔等特征的算法,完成了作为基础理论核心的“特征抽取理论”,及所谓的K-L展开法工作。第三个阶段为发展阶段。这一阶段的研究工作是技术和实际相结合,针对实际系统的要求和设备可能提供的条件,提出了更为复杂的技术。但就多种方法分类来说为二大方法:相关法和构造解析法。在这两类方法的基础上,已研究出了不同类各具特色的实用系统。字符识别系统根据输入设备的不同有如下分类,如图1.1所示:字符识别磁识别光学识别机械识别在线识别脱机识别单个字符识别连笔字符识别印刷体字符识别手写体字符识别图1.1 字符识别分类目前开展比较多,并进入实用阶段的是光学字符识别系统 (OCR系统)。日本虽说起步不是最早,但因投入了大量的人力和物力,目前处于世界领先地位。七五年日本拥有650台光学字符识别机,进入了实用阶段。到一九七八年,能阅读英文字母、数字、片假名和平假名等118 种OCRT0300上市。之后,其研究方向转向了汉字识别。我国是从七十年代开始字符研究的。一九七八年,中科院自动化研究所等合作研制出了“倍函自动化分检机”,可识别09个数字;一九八七年清华大学研制的汉字识别系统通过了技术鉴定,可识别国家二级汉字库6000多字,识别率可达99%,速度为1字/4秒;一九八七年十二月,西安交大人工智能和机器人研究所研制的汉字识别系统也通过了技术鉴定,同样可识别汉字6000多,识别速度可达1字/1秒,识别率达98%以上,处于国内领先地位。这都为字符识别的实际应用提供了广阔的前景。1.2.2 车牌字符识别系统用到的方法字符识别系统用到的方法很多。下面以表格的形式,其用到的方法作一简单的介绍和比较。表1.1 几种识别方法的比较统计决策句法结构模糊判决逻辑推理神经网络主要理论支柱概率论数理统计形式语言自动机技术模糊数学演绎逻辑布尔代数神经生理学模式描述方法特征向量符号串、树、图模糊集合字符串表示的事实以不同活跃度表示的输入结点集模式类判定是一个聚合类。用条件概率分布P(X| wi)表示,m类就有m个分布,然后判定未知模式属于哪一个分布。是一种语言。用一个文法表示一类,m类就有m个文法,然后判定未知模式遵循哪一个文法。是一种集合运算。用隶属度将模糊集合划分为若干子集,m类就有m个子集,然后根据择近原则分类。是一种布尔演算。从事实出发运用一系列规则,推理得到不同结果,m类就有m个结果。是一个非线性动态系统。通过对样本的学习建立起记忆,然后将未知模式判决为其最接近的记忆。主要方法几何分类:线性分类、非线性分类统计分类:Bayes决策无教师的分类:聚类分析自动机技术CYK 剖析算法Early算法转移图法隶属度函数的设计:模糊设计法二元对比排序法推理法模糊集运算规则模糊矩阵产生式推理语义网推理框架推理BP模型HOP模型高阶网主要优缺点优点:比较成熟,能考虑干扰、噪声等影响,识别模式基元能力强。缺点:对结构复杂的模式抽取特征困难。不能反映模式的结构特征,难以描述模式的性质,难以从整体考虑识别问题。优点:识别方便,可从简单的基元开始,由繁至简。能反映模式的结构特性,能描述模式的性质,对图像的畸变的抗干扰能力较强。缺点:当存在干扰及噪声时,抽取基元困难,且易失误。优点:由于用隶属度函数作为样品与模板间相似度的度量,故往往能反映它们整体的与主要的特性,从而允许样品有相当的干扰与畸变。缺点:准确合理的隶属度往往难以建立,故限制了它的应用。优点:已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需同过众多规则的推理达到目标确认的问题,有很好的效果。缺点:当样品有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。优点:可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样品有较大的缺损和畸变。缺点:模型在不断丰富与完善中,目前能识别的程式类还不够多。本系统中主要用到的是基于神经网络的字符识别方法。车牌定位和字符分割两个模块的处理实际上都可看作是字符识别模块的预处理,车牌识别的根本目的是输出牌照号码,因此字符识别是整个系统的核心。和其他模式识别一样,字符识别的基本思想也是匹配判别。其基本过程如下:首先对分割出来的字符进行预处理,并抽取出代表未知字符模式本质的表达形式如各种特征),然后将此表达形式和预先存储在机器中的标准字符模式表达形式的集合(称为字典)逐个匹配,最后用一定的准则进行判别,即在机器存储的标准字符模式表达形式的集合中,找出最接近输入字符模式的表达形式,该表达模式所对应的字符就是识别结果。1.字符识别常用算法:(1)模板匹配法先在图像中检测出已知形状的目标物,然后用这个目标物的形状模板与图像匹配,在约定的某种准则下检测出目标物图像,通常称这种方法为模板匹配法。它能检测出图像中的线条,曲线,图案等等,在许多方面己经获得广泛的应用。模板匹配方法是实现离散输入模式分类的有效途径之一,其实质是度量输入模式与标准模式之间的某种相似性,取相似性最大者为输入模式所属类别。它根据字符的直观形象抽取特征,用相关匹配原理进行识别,即将输入模式与标准模板在一个分类器中进行匹配。(2)基于字符特征的字符识别方法基于字符特征的字符识别算法一般包括以下3个步骤:(1)提取字符的特征,建立一个字符特征向量空间,每个字符对应向量空间中的一个向量;(2)定义分类函数;(3)对输入的字符图像自动提取相应的特征,根据分类函数进行特征匹配,识别出相应的字符。用于字符识别的分类特征应满足以下要求:(1)有较强的分类能力,类内各样本距离应尽量小,类间距离应尽量大;特征用于粗分类时,粗分后各子集的样本数不宜过多,其数量应该大体相等;(2)具有较高的稳定性和鲁棒性,尽量减少笔划断裂或粘连的影响;(3)易于提取,在保证系统性能稳定的前提下,特征的维数不宜过高,以减少运算量和存储复杂度。上述三个要求很难同时满足,应根据所设计的系统有针对性地予以选择。在字符识别中,被广泛采用的有两类特征:结构特征和统计特征。2.字符的结构特征 常用的结构特征主要有:笔道密度函数、空洞和缺口、字符的特殊节点数等等。字符的统计特征主要有复杂指数、粗网格特征、垂直和水平投影等。车牌字符识别是车牌自动识别系统中的一个关键问题。识别速度决定了一个车牌识别系统是否能够满足实际应用的要求,虽然现在已经有了很多车牌识别算法,但对于识别速度的提高仍有很高要求。基于BP神经网络的车牌字符识别关键在于车牌字符特征提取和BP网络规模的大小。本文对车牌字符提取了粗网格特征,将归一化后的字符每一个像素点特征全面提取作为神经网络的输入;为了降低网络规模,对输出层的目标期望输出进行了编码,隐含层节点数的确定采用了初定隐节点数的经验公式,大大减少了隐含层节点数和迭代次数,降低了车牌字符识别系统中BP神经网络的规模,从而在保证准确率的同时提高了识别速度。目前我国一个标准车牌中有三类不同识别对像:汉字、英文字符和数字0-9。其中汉字51个,除I和O以外的英文大写字母A-Z和数字0-9,共34个字符。车牌字符总共仅80多个字符,字符的大小一致,字型统一。粗网格特征是属于统计特征中的局部特征,又称局部灰度特征。它通过把字符分成NN个网格,统计每个网格中的像素素量,而每个网格各自反映字符的某一部分特征,在识别阶段,把各个网格组合起来作为字符的统计特征并以此来识别字符。粗网格特征提取方法是先把待识别字符进行大小和位置归一化,再等分为NN维个网格,然后依次统计各网格内的黑像素(或白像素)的数量,从而取得一个以数值表示的的网格特征。为了BP神经网络能对车牌字符进行正确识别,识别前对单个字符图像进行归一化处理,分两个步骤:(1)位置归一化为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置上当字符的中心位置产生偏移时,对基于网格的特征提取方法将产生很大的偏差,因此在特征提取之前,必须基本保证字符处在图像的中心位置,一般是将除字符之外的其他背景图像裁剪掉,使得字符填满整个图像。(2)大小归一化通过归一化图像中的像素对应在原图像中的点的位置的像素值来决定归一化图像中像素点的灰度值。f(x,y)是二值化后的车牌字符点阵图像,g(x,y)为归一化后的图像,g(x,y)中的任一点映射到原图像f(x,y)的点为,当为整数时, =;当不是整数时,进行像素内插变换。粗网格特征反映了字符的整体形状分布,车牌字符识别属于小分类问题。为了保留字符的整体结构特征和细节特征,将归一化后字符点阵的每个像素点作为一个网格,直接输入到神经网络分器中。实验表明,此方法对所有车牌字符都有较好的分类效果。对字符4提取网格特征的步骤:对于待识别字符,首先归一化为3216的比例尺寸的字符点阵,黑像素为1,白像素为0,得出的0、1组成的矩阵即为字符的特征向量。1.3 国内外研究现状和发展趋势车牌识别技术自1988年以来,人们就对它进行了广泛的研究,目前国内外已经有众多的算法,一些实用的LPR技术也开始用于车流监控、出入控制、电子收费、移动稽查等场合。然而,无论是LPR算法还是LPR产品几乎都存在一定的局限性,都需要适应新的要求而不断完善,如现有系统几乎都无法有效解决复杂背景下的多车牌图像分割定位与有效识别的技术障碍,另外也很难适应全天候复杂环境及高速度的要求。车牌字符识别实际上是依附在车牌上的印刷体文字的识别,能否正确识别不仅是文字识别技术的问题,还是考虑其载体车牌区域的影响。车牌字符识别技术是文字识别技术与车牌图像自身因素协调兼顾的综合性技术。由于摄像机的性能、车牌的整洁度、光照条件、拍摄时的倾斜角度及车辆运动等因素的影响使牌照中的字符可能出现比较严重的模糊、歪斜、缺损或污迹干扰,这些都给字符识别带来了难度。尽管如此,我国依然有大量的学者从事车牌字符识别研究,文献给出了基于神经网络的车牌识别方法,对于解析度较高和图像比较清晰的车牌,这些方法能有效识别车牌中的字符,但对于较低解析度和较为模糊的车牌无能为力,因为这些方法只有在车牌中的每个字符被独立分割出来的前提下才能完成识别工作。而独立分割车牌取得字符,对较低解析度和较为模糊的车牌来说是非常困难的。车牌字符识别的研究在技术上已经取得了一定突破,然而离复杂多变的实际应用要求还有一定差距,许多新方法仅停留在理论和文章上或者限定在比较狭窄的约束范围内,并不能以产品的形式大范围投入使用。因而车牌字符识别的实用化研究仍然有很长的路要走。目前的车牌识别方法主要是针对车辆自动缓停收费、停车场管理等场合,所监视的区域一般只有单一车辆,背景也比较简单。而如今的许多实际应用场合,监视区域比较复杂,现有的方法无法直接应用。比如在移动交警稽查、高速公路的监视与监控、城市交通要道的监视与监控,所监控的区域一般会同时出现多辆汽车,背景也比较复杂,有广告牌、树木、建筑物、斑马线以及各种背景文字等。所以本课题针对这种情况创新性的提出了一种复杂背景下多车牌定位分割与识别方法,并考虑了彩色分割与ColorLP算法,这也是当前车牌图像识别的发展趋势。当然,车牌识别系统的具体应用发展也很迅猛,从原来的停车静止拍摄场景应用,如收费站、停车场等,发展到移动公路车辆稽查、违章自动报警、超载闯红灯等实时监控场合应用,增加神经网络自适应识别学习训练功能,对于系统响应的速度、网络化、智能化、识别成功率等实用化要求也越来越高。随着上述核心技术的研究发展,应用领域和功能等也获得大幅提高。8第二章 神经网络简介2.1人工神经元生物神经网络(BNN)信息传递过程为多输入单输出(MISO)系统,信号为脉冲,当脉冲到达突触前膜时,前膜释放化学物质,结果在突触后产生突触后电位,其大小与脉冲密度有关(时间总合效应),并且各通道都对电位产生影响(空间总合效应)。ANN等效模拟电压近似BNN脉冲密度,仅有空间累加无时间累加(可认为时间累加己隐含于等效模拟电压之中)。2.1.1神经元模型 神经元是人工神经网络的基本处理单元,它一般是一个多输入/多输出的非线性元件。神经元输出除受输入信号的影响之外,同时也受到神经元内部其他因素的影响,所以在人工神经元的建模中,常常还加有一个额外输入信号,称为偏差(Bats), 有时也称为阀值或门限值。见图2.4。 图2.4 基本神经元模型上图a=f(wp)是不加偏差的输入输出关系,其中w是权重,p是输入;a=f(wp+b)是带偏差的输入输出关系,w、p意义同上,b是偏差,f是所谓的作用函数。 经过抽象,可得到数学表达式如下: (2.10) (2.11)i: 数值(Weigthts);:阀值(Threshold)9(s):作用函数(Activated Transfer Function)。作用函数的基本作用是:(1) 控制输人对输出的激活作用;(2) 对输入、输出进行函数转换;(3) 将可能无限域的输入变换成指定的有限范围内的输出。2.1.2 几种常用的作用函数 包括阀值型(硬限制型)、线性型、S型函数(Sigmoid)、辐射基函数等。下面各图形中的 n(W*P十b)是输入,a是输出。 (1)阀值型(硬限制型) 有两种形式,第一种是: (2.12)当输入大于0时,输出为1;输入小于0时,输出为0。第二种是: (2.13)也就是当输入大于0时,输出为1;反之为-1。(2)线性型也有两种情况,全线性型和正线性型,如下: 全线性 A=f (W*P+b)=W*p+b (2.14)此时输出与输入成正比关系。正性型 (2.15)当输入大于0时,输出与输入成正比关系;反之,输出恒为0。(3)S型函数(Sigmoid) 也有两种可能的函数类型。 对数正切y=1/(e-n+1) (2.16)输出与输入成对数正切关系。 双曲正切 y=tanh(n) (2.17)输入与输出成双曲正切关系。(4).辐射基函数 高斯函数 三角波函数2.2人工神经网络构成人工神经网络有很多构成形式,比如基本型、前向型、回归型以及互联型等,下面我们列出一些前两种神经网络构成形式。2.2.1 基本模型人工神经网络的基本模型如图2.13所示。 图2.13 人工神经网络基本模型 图中,输入经过神经元之间的连接值和作用函数,得到输出,再与目标值相比较,根据其差值信息,反馈回来进行神经元之间连接值的调整。2.2.2 前向网络结构如图2.14 所示。图2.14 前向网络结构 其中,x1,x2,xn是输入,y1,y2,yn是输出。 前向网络的特点如下: (1) 神经元分层排列,可又多层;。 (2) 层间无连接; (3) 方向由入到出. 感知网络(Perceptron即为此),应用最为广泛。2.3 人工神经网络的学习规则ANN中的核心问题就是如何决定网络连接的加权系数(Weight)。这一小节介绍M些常用的学习规则。2.3.1 Hebb学习规则1949年,D.O.Hebb基于生理学和心理学的研究,对生物神经细胞如何进行学习的问题,剔除了一个直觉得假说:“当两个神经元都处于兴奋状态时,连接这两个神经元的权值将得到加强”,公式表示如下: (2.31)上式中,Wij是连接权值的变化,Vi、Vj是两个神经元的活化水平,是学习系数。2.3.2 学习规则也称为误差校正规则或者剃度方法,著名的BP方法即为其中一种。 (2.32) (2.33)上式中,Wij为权值的改变,为学习系数,Vi是当前神经元的兴奋度,是实际输出与期望输出的偏差。2.4 BP神经网络BP网络是应用中经常碰到的,这一节将详细介绍一下BP网络。2.4.1 BP网络模型BP神经网络模型见图2.15 图2.15 BP神经网络结构可以看出,BP网络一般情况下有一个输入层,一个隐藏层(有时是两个或更多),一个输出层。2.4.2 输入输出关系I-H(输入层到隐藏层) (2.41) (2.42)H-O(隐藏层导输出层) (2.43)其中,输人层神经元个数为 n,隐含层神经元个数为n1,输出层神经元个数为S2。2.4.3 网络学习训练前面已经说过,神经网络的关键问题之一是权值的确定。下面,讨论一下BP网络中的权值确定方法。我们假定输入q组本p1,p2,pq,piRn,期望输出为T1,T2,Tq,这里TRs2,网络的实际输出为a21,a22,a2q,a2 Rs2。评价的准则是误差最小,所以网络训练的实质转化为一个优化问题。这里考虑用梯度法(Gradient)来找出误差与加权系数的关系,以得到加权系数改变的规律。定义误差函数为: (2.44)我们利用剃度下降法求权值的变化及误差的反向传播。(1)输出层的权值变化从第i个输入到第k个输出的权值改变有: (2.45)同理可得: (2.46) (2)隐含层权值变化 (2.47)其中, 同理可得,。(3)解释输出层误差 ej(j=1-S2)隐含层误差 ei(i=1-n2),这里,可以认为ei是由ej加权组合形成的,由于作用函数的存在,ej的等效作用为ji=ejf ()。2.4.4 BP网络的设计问题在进行BP网络的设计时,一般应从网络的层数,每层中的神经元个数和激活函数、初始值以及学习速率等几个方面来进行考虑。下面讨论各自的选取原则。(1)网络的层数理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输入层的网络,能够逼近任何有理函数。增加层数可以进一步的降低误差,提高精度,但同时也使网络复杂化。另外不能用仅具有非线性激活函数的单层网络来解决问题。因为能用单层网络完美解决的问题,用自适应线性网络也一定能解决,而且自适应线性网络的运算速度还要快。而对于只能用非线性函数解决的问题,单层精度又不够高,也只有增加层才能达到期望的结果。(2)隐含层神经元数网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元数的方法来获得,这在结构实现上,要比增加更多的隐含层要简单得多。为了对隐含层神经元数在网络设计时所起的作用有一个比较深入的理解,下面先给出一个有代表性的实例,然后从中得出几点结论。例:用两层BP网络实现“异或”功能。网络要实现如下的输人l输出功能: 对于一个二元输入网络来说,神经元数即为分割线数。所以隐含层神经元数应2。通过改变隐含层的节点数做试验,当sl2,3,4,5,6以及为20、25和30时对网络进行设计。选择误差目标为err_goal0.02,并通过对网络训练时所需的循环次数和训练时间的情况来观察网络求解效果。整个网络的训练结果如表2-1所示。 表2-1 当 Sl 2,3,4,5,6,20,25,30时的训练结果我们评价一个网络设计的好坏,首先是它的精度,再一个就是训练时间。从表2-l中可以看出下面几种情况: 神经元数太少,网络不能很好的学习,需要训练的次数也多,训练精度也不高; 一般而言,网络隐含层神经元的个数S1越多,功能越大,但当神经元数太多,会产生其他的问题 当S1=3,4,5时,其输出精度都相仿,而S1=3是的训练次数最多。一般的讲,网络sl的选择原则是:在能够解决问题的前提下,再加上一个到两个神经元以加快误差的下降速度即可。(3)初始权值的选取一般取初始权值在(-1,1)之间的随机数。另外,威得罗等人在分析了两层网络是如何对一个函数进行训练后,提出一种选定初始权值的策略:选择权值的量级为r,其中为第一层神经元数,r为输入个数。(4)学习速率学习速率决定每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论