资源目录
压缩包内文档预览:(预览前20页/共48页)
编号:19301260
类型:共享资源
大小:2.62MB
格式:RAR
上传时间:2019-05-17
上传人:乐****!
认证信息
个人认证
黄**(实名认证)
广东
IP属地:广东
20
积分
- 关 键 词:
-
车辆牌照图像识别算法研究与实现
车辆牌照图像识别算法
车辆牌照图像
车辆牌照图像识别算法研究与实现车辆牌照图像识别算法研究与实现
车辆牌照识别
车牌识别算法
车辆牌照识别算法
- 资源描述:
-
车辆牌照图像识别算法研究与实现,车辆牌照图像识别算法研究与实现,车辆牌照图像识别算法,车辆牌照图像,车辆牌照图像识别算法研究与实现车辆牌照图像识别算法研究与实现,车辆牌照识别,车牌识别算法,车辆牌照识别算法
- 内容简介:
-
西南科技大学本科生毕业论文 西南科技大学 毕业设计毕业设计( (论论文)文) 题目名称:车辆牌照图像识别算法研究与实现 年年 级:级:2003 级级 本科本科 专科专科 学生学号:学生学号:20035064 学生姓名:何建斌学生姓名:何建斌 指导教师:方艳红指导教师:方艳红 学生单位:信息工程学院学生单位:信息工程学院 技术职称:讲师技术职称:讲师 学生专业:生物医学工程学生专业:生物医学工程 教师单位:信息工程学院教师单位:信息工程学院 西西 南南 科科 技技 大大 学学 教教 务务 处处 制制 西南科技大学本科生毕业论文 I 车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越 来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公 共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌 定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌 进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数 字字符识别的问题,本文采用了基于 BP 神经网络的识别方法。在学习并掌握了数 字图像处理和模式识别的一些基本原理后,使用 VC+6.0 软件利用以上原理针对车 牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC+ 西南科技大学本科生毕业论文 II Research and Realization of License Plate Recognition Algorithm Abstract: In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC+ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC+ 西南科技大学本科生毕业论文 III 目 录 第 1 章 绪论1 1.1 课题研究背景1 1.2 车辆牌照识别系统原理1 1.3 车辆牌照识别在国内外研究现状2 1.4 本文主要工作及内容安排3 第 2 章 车辆牌照的定位方法.4 2.1 车辆牌照图像的预处理4 2.1.1 256 色位图灰度化.4 2.1.2 灰度图像二值化.5 2.1.3 消除背景干扰去除噪声.6 2.2 车辆牌照的定位方法简介6 2.3 系统采用的定位方法7 2.3.1 车辆牌照的水平定位.7 2.3.2 车辆牌照的垂直定位.7 2.3.3 定位的算法实现.10 2.4 实验结果分析12 第 3 章 车辆牌照的字符分割.13 3.1 车牌预处理13 3.1.1 去边框处理.13 3.1.2 去噪声处理.13 3.1.3 梯度锐化.15 3.1.4 倾斜调整.16 3.2 字符分割方法简介17 3.3 系统采用的分割方法19 3.3.1 算法介绍.19 3.3.2 算法的实现.20 3.4 字符分割实验结果21 西南科技大学本科生毕业论文 IV 第 4 章 特征提取与字符识别.22 4.1 字符的特征提取22 4.2 字符的识别方法简介23 4.3 系统采用的识别方法24 4.3.1 人工神经网络简介.24 4.3.2 BP 神经网络识别车牌.25 4.3.3 BP 神经网络识别算法实现.28 4.4 实验结果分析29 总结32 致谢33 参考文献.34 西南科技大学本科生毕业论文 1 第 1 章 绪论 1.1 课题研究背景 现代社会已经进入信息时代,计算机技术、通信技术和计算机网络技术的不断 发展,自动化信息处理能力的不断提高,在人们社会活动和生活的各个领域得到了 广泛的应用,在这种情况下,作为信息来源的自动检测、图像识别技术越来越受到 人们的重视。 随着汽车数量的急剧增加,车牌自动识别(license plate recognition, LPR)技术日 益成为交通管理自动化的重要手段1。车牌自动识别技术是计算机视觉、图像处理 技术与模式识别等技术的融合,是智能交通系统中一项非常重要的技术。通过车辆 牌照自动识别,就可以对运动车辆查询相关的数据库,根据提取的车辆信息,实现 有针对性的车辆检查,极大的提高工作人员的效率,降低工作强度,同时也减少了 国家财政收入的流失,减少交通事故的发生以及加强社会治安。因此对车牌识别技 术研究有巨大的经济价值和现实意义。 由于车牌自动识别技术在智能化交通控制管理中发挥的重要作用,吸引了各国 的科研工作者对其进行广泛的研究,目前已有众多的算法,有些已应用于交叉路口、 车库管理、路口收费、高速公路等场合。由于需适应各种复杂背景,加之要识别的 车辆种类繁多,颜色变化多端,以及检测时要适应不同天气变化导致的不同光照条 件,因此,目前的系统都或多或少地存在一些问题。但随着计算机性能的提高和计 算机视觉理论及技术的发展,这种技术必将日趋成熟。 车牌的定位与识别技术,总体来说是图像处理技术与车牌本身特点的有机结合, 当然也包括小波分析、神经网络、数学形态学、模糊理论等数学知识的有效运用2。 本课题是对汽车图像进行分析,从算法角度来研究车牌的定位与识别。 1.2 车辆牌照识别系统原理 一个典型的车辆牌照识别系统(LPR)是由图像采集系统和图像识别系统组成的, 如图 1-13。当系统发现有车时,图像采集系统便开始采集车辆牌照信息,得到的信 息是图像识别系统的输入。通过识别系统的预处理,为目标搜索提供一个良好的定 位环境。在预处理的基础上把图像中的车牌从背景中分割出来。对车牌中的字符做 西南科技大学本科生毕业论文 2 字符分割,最后把分割后的字符进行识别,便得到了汽车牌照的号码。 整套系统实际是一种硬件和软件的集成。在硬件上,它需要集成可控照明灯、 镜头、图像采集模块、数字信号处理器、存储器、通信模块、温控模块、单片机等; 在软件上,它包括车牌定位、车牌字符切割、车牌字符识别等算法。这样一体化的 结构形式能在现实中降低对环境的要求。 CCD摄像机 图像输入接口 预处理 字符识别显示 字符分割 牌照与背景分 割 图图 1-1 车辆牌照识别系统原理框图车辆牌照识别系统原理框图 1.3 车辆牌照识别在国内外研究现状 自 1988 年以来,人们就对车辆牌照识别系统进行了广泛的研究,目前国内外已 经有众多的算法,一些实用的 LPR 技术也开始用于车流监控、出入控制、电子收费 等场合。然而无论是 LPR 算法还是 LPR 产品都存在一定的局限性,都需要适应新 的要求而不断完善。如以色列 Hi-Tech 公司的 See/Car System 系列,它需要多种变 形的产品来分别适应某一个国家的车牌;新加坡 Optasia 公司的 VLPRS 系列,只适 合于新加坡的车牌;See/Car Chinese 系统可以对中国大陆的车牌进行识别,但都存 在一定的缺陷,而且不能识别车牌中的汉字。 我国在 90 年代初期开始了车辆牌照识别技术的研究。但由于以下几个原因使我 国的车辆牌照识别技术在研究和应用方面都有一定难度,且落后于其它国家:我 国的标准汽车牌照是由汉字、英文字母和阿拉伯数字组成,汉字的识别与字母和数 字的识别有很大的不同,从而增加了识别的难度。国外许多国家汽车牌照的底色 和字符颜色通常只有对比度较强的两种颜色,而我国汽车牌照仅底色就有蓝、黄、 黑、白等多种颜色,字符颜色也有黑、红、白等几种颜色。其他国家的汽车牌照 格式通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式。 我国汽车牌照的规范悬挂位置并不唯一,而且由于环境、道路或人为因素造成汽 西南科技大学本科生毕业论文 3 车牌照污染的情况比较严重,这都给车牌识别造成了一定的难度。 因此,我国车辆牌照识别技术的提高和广泛应用还需广大科研工作者和相关交 通部门的共同努力。 1.4 本文主要工作及内容安排 本文主要研究车辆牌照识别系统中的数字识别技术,将数字图像处理技术与模 式识别技术紧密结合,针对汽车牌照字符识别的特点,分析了车牌定位与分割、字 符分割、特征提取、BP神经网络等算法。在车牌定位、字符分割和特征提取的基础 上,详细研究了车牌数字字符的识别。 文章在接下来的第二章介绍了车辆牌照的定位方法;第三章介绍了车辆牌照的 字符分割算法;第四章介绍了车辆牌照数字字符的识别。其中车辆牌照数字字符的 识别是本课题的重点。文章在每一步处理后给出了实验结果,并给出了最后的识别 结果。 西南科技大学本科生毕业论文 4 西南科技大学本科生毕业论文 5 第 2 章 车辆牌照的定位方法 车辆牌照的定位方法是基于图像处理的基础上,对图像进行分析、总结并经过 大量的试验所获得的。定位方法的研究与车牌特征和图像处理技术是分不开的。从 自然背景中准确可靠地分割出车牌区域是提高系统识别率的关键,但是由于车牌图 像摄于背景复杂且光照不均匀的自然场景,因而会出现颜色失真或低对比度的图像, 这给车辆牌照的定位带来了很大的困难。为此人们进行了大量的研究,并取得了一 定的成果。 本课题中,根据车牌的二值图像在水平和垂直方向的投影特性提出了基于二值 化图像投影法和数学形态学相结合的车牌定位算法,该算法具有快速、简洁实用和 与背景相关性小的特点。车牌的定位算法分为预处理、水平定位、垂直定位。其流 程图如图 2-1 所示。 图像输入 牌照区域定位中值滤波削弱背景干扰 灰度图像二值 化 彩色图像灰度 化 裁减车牌子图 像 图图 2-1 车辆牌照定位原理车辆牌照定位原理 2.1 车辆牌照图像的预处理 为了使车牌能够被精确定位,在定位搜索以前,要对车牌图像进行预处理。为 了能够方便的进行后期的数字图像处理,需要将彩色图像转化成 256 色的灰度图后 进行处理,然后对图像做二值化处理,削弱背景干扰,消除噪声。经过以上的预处 理,就可以对车牌进行定位和分割处理。 2.1.1 256 色位图灰度化 西南科技大学本科生毕业论文 6 由于 256 色的位图的调色板内容比较复杂,使得图像处理的许多算法都没有办 法展开,因此有必要对它进行灰度处理。所谓灰度图像就是图像的每一个象素的 RGB 分量的值是相等的。彩色图像的每个象素的 RGB 值是不同的,所以显示出红 绿蓝等各种颜色。灰度图像没有这些颜色差异,有的只是亮度上的不同。灰度值大 的象素比较亮,反之比较暗。图像灰度化有各种不同的算法,比较直接的一种是给 象素的 RGB 值各自一个加权系数,然后求和。经常用到的灰度化公式由式(2-1)完成: (2-1)BGRI*114 . 0 587 . 0 *229 . 0 式(2-1)中为灰度值。I 加权系数的取值是建立在人眼的视觉模型之上的,对于人眼较为敏感的绿色取 较大的权值,对人眼较为不敏感的蓝色则取较小的权值。这样可以使得到的灰度图 像在视觉上更接近人的主观感觉。应该注意的是最后得到结果一定要归一到 0255 之内。 2.1.2 灰度图像二值化 在进行了灰度化处理以后,图像中的每个象素只有一个值,即象素的灰度值。 它的大小决定了象素的亮暗程度。为了更加便利的开展下面的图像处理操作,还需 要对已经得到的灰度图像做一个二值化处理。图像的二值化就是把图像中的象素的 灰度值根据一定的标准分化成两种颜色。在系统中是根据象素的灰度值将图像处理 成黑白两种颜色。图像的二值化有很多成熟的方法:可以采用阈值分割法,也可以 采用给定阈值法。阈值分割法可以分为全局阈值法和局部阈值分割法。所谓局部阈 值分割法是将原始图像划分成较小的图像,并对每个子图像选取相应的阈值。在阈 值分割后,相邻子图像之间的边界处可能产生灰度级的不连续,因此需用平滑技术 进行排除。局部阈值法常用的方法有灰度差直方图法、微分直方图法。 全局阈值分割方法在图像处理中应用比较多,它在整幅图像内采用固定的阈值 分割图像。根据阈值选择方法的不同,可以分为模态方法、迭代式阈值选择等方法。 这些方法都是以图像的灰度直方图为研究对象来确定阈值的。另外还有类间方差阈 值分割法、二维最大熵分割法、模糊阈值分割法、共生矩阵分割法、区域生长法等 等。 在本系统中考虑到所要进行处理的图像大多是噪声比较少的灰度车牌,系统中 采用全局阈值分割的方法进行处理,初始阈值的确定方法是由式(2-2)完成:T 西南科技大学本科生毕业论文 7 (2-2)3/ minmaxmax GGGT 和分别是最高和最低灰度值。该阈值对不同牌照有一定的适应性,能够保 max G min G 证背景基本被置为 0,以突出牌照区域。 经过二值化,可以进行下一步处理。 西南科技大学本科生毕业论文 8 2.1.3 消除背景干扰去除噪声 对二值化后的图像进行相邻象素灰度值相减,得到新的图像,左边缘可以直接 赋值,不会影响整体效果。考虑到图像中的文字是由短的横竖线组成,而背景噪声 有一大部分是孤立噪声,所以用模板(1,1,1,1) T 对图像进行中值滤波,得到去 除大部分干扰的图像。 2.2 车辆牌照的定位方法简介 经过以上的预处理,我们就可以对图像进行车牌的定位和分割。 为了快速、准确地定位车牌,目前已有很多学者提出许多定位算法。其中,众 多算法都是利用了车牌自身异于背景区域的特征来进行车牌定位的。这些特征包括 车牌的颜色特征、几何特征、纹理特征和经过处理运算后得到的车牌区域固有的特 征(异于背景区域特征)等。 车牌定位的算法基本上可以分为两大类:第 1 类是通过一个步骤将车牌定位出 来;第 2 类是通过两个步骤将车牌定位出来4。 第 1 类:这类算法的主要特点是通过一个步骤就可以将车牌区域定位出来。其 主要的算法介绍如下: (1)基于神经网络的车牌定位方法:该方法首先是用神经网络对大量的样本图像 进行训练,然后再进行图像预处理,最后用训练的神经网络提取真正的车牌区域。 该算法要求把图像中每一个像素所提取特征输入神经网络来进行学习,计算量很大, 同时需处理好网络局部收敛的问题,且车牌定位时间长5。 (2)基于模板匹配的车牌定位方法:该算法主要是设立一个滑动窗口,该窗口有 若干向量值,利用该窗口在汽车图像上滑动,并计算该窗口所覆盖的那块车牌图像 的向量值,找出最佳的向量值,认为是车牌区域。 (3)直线边缘检测:这种方法主要利用 Hough 变化检测车牌周围边框直线。这种 方法的缺点是 Hough 变换计算量大,对于边框不连续的实际车牌,需附加大量的运 算6。 (4)统计直方图及投影方法:该方法通过对图像的水平和垂直两个方向灰度投影 直方图来分析推断出牌照的位置。该方法的缺点是对噪声敏感,且牌照图像存在倾 斜时,不能达到预期的效果。 第 2 类:即先对车辆图像进行车牌的粗定位,然后再进行精定位。所谓粗定位 西南科技大学本科生毕业论文 9 有两种含义:第 1 种粗定位的含义就是从车辆图像中找出车牌的大致位置,它并不 要求非常精确的定位出车牌的位置,只需要给出包含车牌的相对较小或较大的一块 区域就达到目的;第 2 种粗定位的含义就是利用粗分割,即给出包含车牌区域在内 的若干候选区域,再从这些区域中提取车牌区域7。这里不再作详细的论述。 2.3 系统采用的定位方法 在系统中,采用投影法来实现车辆牌照的定位。利用水平投影来检测车牌的水 平位置,利用垂直投影和形态学的方法检测车牌的垂直位置8。 2.3.1 车辆牌照的水平定位 得到二值化图像以后,首先把二值图像投影到 y 轴。根据车牌特征,车牌区域 中的垂直边缘较密集,而且车牌一般悬挂在车身较低的位置其下方没有很多的边缘 密集区域。因此在车牌对应的水平位置上会出现一个峰值,如图 2-2 所示。峰值的 两个低谷点就是车牌的垂直位置,这样就得到了包含了车牌的带状区域。所以问题 转成确定低谷点的位置。但是从图中可以发现投影图不是十分的光滑,会给精确定 位带来一些困难,所以对投影图进行平滑。窗口尺寸比较关键,选小了不足以平滑, 选大了则会改变投影图原有的基本变化特性。对于实际的投影曲线可以通过找差分 曲线的过零点来确定低谷点,所以对平滑以后的投影图求一阶差分:)(nh (2-3) 1()()( nhnhnh 找出其由正至负的点,也就是局部最小值。但是并不是所有的局部最小值之间 都能称为峰的,它可能附属邻近的一个峰,因而要确定哪一个局部最小值是峰谷, 哪一个是毛刺。如何判决峰的独立性呢?本文采取了 3 个判决依据: 1. 独立峰具有一定峰顶和峰谷的落差,当局部最大值和邻近的局部最小值的差 大于阈值,则该局部最小值为谷底,反之则为毛刺。 2独立峰具有一定的宽度,这是由车牌的宽度信息决定的。 3独立峰具有一定的面积,这是因为在经过边缘提取,二值化后,在车牌区域 具有明显的纹理特征。 在光照均匀和背景不是很复杂的图像中,车牌的峰值特性十分明显,很容易就 可以定位出车牌区域的水平位置。但在光照不均匀或背景复杂的图像中峰值特性就 不是很明显了。如何准确地确定局部最小值是否为谷底,关键在于阈值的选取。 2.3.2 车辆牌照的垂直定位 西南科技大学本科生毕业论文 10 根据车牌的特征可以知道,车牌在垂直方向的投影呈现有规律的“峰、谷、峰” 的分布。字符与字符之间的间隔是近似相等的,而且字符的宽度是近似相等的,而 车 (a)二值化图像)二值化图像 (b)水平投影图)水平投影图 图图 2-2 水平投影水平投影 牌具有 7 个字符,所以车牌区域在垂直方向上的投影应该存在 6 个低谷点,而且相 邻低谷点之间的距离是近似相等的,第二和第三字符之间的距离略大于其他字符间 的距离。但在现实中得到二值图像的“峰、谷、峰”的特点并不十分明显,采用这种 方法对车牌的垂直位置进行定位效果不是很好,本文考虑使用形态学与投影法相结 合的方法来对车牌进行垂直定位,下面简单介绍图像形态学9。 最初形态学是生物学中研究动物和植物的一个分支,后来也用数学形态学来表 示以形态学为基础的图像分析数学工具。形态学的基本思想是使用具有一定形态的 结构元素来度量和提取图像中的对应形状,从而达到对图像进行分析和识别的目的。 数学形态学可以用来简化图像数据,保持图像的基本形状特性,同时去掉图像中与 研究目的无关的部分。使用形态学操作可以实现增强对比度、消除噪声、细化、填 充和分割等常用的图像处理任务。 数学形态学的数学基础和使用的语言是集合论,其基本运算有四种:膨胀 (Dilation ) 、腐蚀(Erosion )、开启(Open)和闭合(Close )。基于这些基本运算还可以 推导和组成各种数学形态学运算方法。其运算对象是集合,通常给出一个图像集合 和一个结构元素集合,利用结构元素对图像进行操作。结构元素是一个用来定义形 态操作中所用到的邻域的形状和大小的矩阵,可以具有任意的大小和维数。下面简 单介绍一下以上 4 种运算。 1、膨胀 膨胀的运算符为“”,图像集合用结构元素来膨胀,记作,其定义ABBA 见式(2-4),其中表示的映像,即与关于原点对称的集合。式(2-4)表明, BBB 西南科技大学本科生毕业论文 11 用对进行膨胀的过程是这样的:首先对作关于原点的映射,再将其映像平移BAB ,当与映像的交集不为空集时,的原点就是膨胀集合的像素。也就是说,xABB 用来膨胀得到的集合是的位移与至少有一个非零元素相交时的原点的位BA BAB 置的集合。 (2- ABxBA x | 4) 膨胀的作用效果如图 2-3 所示。其中白色表示目标,背景为黑色,结构元素为 一 33 正方形对象。 (a)膨胀前)膨胀前 (b)膨胀后)膨胀后 图图 2-3 图像膨胀前后的显示效果对比图像膨胀前后的显示效果对比 2、腐蚀 腐蚀的运算符是,图像集合用结构元素来腐蚀记作,其定义为:ABBA (2-ABxBA x )( | 5) 式(2-5)表明,用来腐蚀的结果是所有满足将平移后,仍全部包含在ABBxB 中的的集合,从直观上看就是经过平移后全部包含在中的原点组成的集合。AxBA 腐蚀的操作效果如图 2-4 所示,其中白色为目标,黑色为背景,结构元素为一 33 正方形对象。 (a)腐蚀前)腐蚀前 (b)腐蚀后)腐蚀后 西南科技大学本科生毕业论文 12 图图 2-4 图像腐蚀前后的显示效果对比图像腐蚀前后的显示效果对比 3、开启 开启的运算符为“ ”, 用来开启记为,其定义如下:ABBA (2-BBABA)( 6) 4、闭合 闭合的运算符为“ ”,用来闭合记为,其定义见式(2-7):ABBA (2-BBABA)( 7) 开启和闭合运算不受原点位置的影响,无论原点是否包含在结构元素中,开启 和闭合的结果都是一样的。 开启和闭合操作的效果如图 2-5 所示,其中白色为目标,黑色为背景。 对形态学了解后,我们用形态学来进行定位,具体算法为: 1、对得到的带状区域用结构算子先进行一次腐蚀运算,消除一些独立的亮点, 但使用的结构算子不能太大,否则会失去一部分车牌的信息。 (a)原图)原图 (b)对原图开启操作后)对原图开启操作后 (c)对原图闭合操作后)对原图闭合操作后 图图 2-5 图像的开启、闭合操作的显示效果图像的开启、闭合操作的显示效果 2、再进行二次膨胀运算,由于膨胀的目的是要把车牌区域连通,因此使用的结 构算子和腐蚀的结构算子不一样,要略大一些。 3、最后进行一次开运算,将车牌区域平滑一下。可以发现车牌在图像中形成了 一个块状区域。如图 2-6 所示。 将得到的图像再投影到垂直方向,再根据车牌的宽度信息,设定一个范围,可 以把这个范围设置大些,这是因为经过形态学变化后,车牌的长度会变大,而且有 可能把附近的一些杂点连在一起了,从而增大了车牌连通区域的长度,如果范围定 西南科技大学本科生毕业论文 13 的太小,就有可能检测不到车牌区域10。 2.3.3 定位的算法实现 利用投影法,在 Visual C+中用 C+语言对以上算法进行编程,对车辆牌照进 行定位。实验中水平方向上的定位函数为 HprojectDIB();垂直方向上的定位函数为 VprojectDIB();定位以后分割过程所用的函数为 TempSubert();iTop 和 iBottom 分 别是车牌的上下边缘,iLeft 和 iRight 为车牌的左右边缘。定出车牌的四个边缘以后, 就可以通过分割函数 TempSubert()将车牌从源图像中裁减出来,为了使裁减的准确, 可以设置边缘的微量调整。图像定位算法流程图如图 2-7 所示。 (a) 水平投影分割得到的图像水平投影分割得到的图像 (b) 腐蚀运算得到的图像腐蚀运算得到的图像 (c) 第一次膨胀运算得到的图像第一次膨胀运算得到的图像 (d) 第二次膨胀运算得到的图像第二次膨胀运算得到的图像 图图 2-6 形态学变化得到的图像形态学变化得到的图像 西南科技大学本科生毕业论文 14 图图 2-7 定位流程图定位流程图 西南科技大学本科生毕业论文 15 2.4 实验结果分析 经实验,大部分图片中的牌照能够被正确的定位出来如图 2-8,极少部分牌照不 能正确定位。实验表明,投影法基本上实现了车辆牌照的定位,但同时不难看出被 定位的车牌还包括车牌边框,与理想要求还有很大差距,如果在这些车牌上进行字 符分割,将会有很大的困难。另外在实验中还发现该算法对车牌背景环境要求比较 严格,车牌如果比较倾斜或者车牌颜色与汽车颜色相近或者车牌背景中的噪声较大, 则定位起来比较困难,不能实现车牌的精确定位,以后需要进一步改进。 图图 2-8 定位前后的图像定位前后的图像 西南科技大学本科生毕业论文 16 第 3 章 车辆牌照的字符分割 在做字符分割以前,必须对定位出来的图像做进一步的处理,要对车牌做去边 框处理、去噪声处理、梯度锐化、倾斜度调整等预处理才能进行字符分割。 3.1 车牌预处理 3.1.1 去边框处理 一般蓝底白字的车牌都有白色边框,与字符的颜色相同,它的存在将对后继的 字符识别造成影响,因此它的滤除十分必要。 1、滤除上下边框 将检测到的二值牌照图像进行水平投影,在 0IHeight 的范围内,计算各 sumI,( sumI为从 0 到 Width 的范围内,二值化牌照图像的白像素点数)然后,将 所有的 sumI累加起来,记为一值,然后将该值除以 2*Height-(2/3)*Height,如果 sumI小于该商,就令该 sumI为 0。这样直方图中必有连零块和非连零块,测试每 个非连零块的宽度,如果它不在车牌高度的范围内,就置其为零,那么就将边框滤 除了(其中 Height,Width 为牌照图像的高度和宽度)。 2、滤除左右边框 滤除左右边框的方法与滤除上下边框的方法类似,只是阈值有些不同,不再赘 述。 3.1.2 去噪声处理 图像在扫描或者传输过程中夹带了噪声,去噪声是图像处理中常用的手法。通 常去噪声用滤波的方法,比如空间域滤波和同态滤波。采用合适的滤波方法不但可 以滤除噪声还可以对图像进行锐化,增强图像的边缘信息。下面介绍几种常用的滤 波方法。 1、邻域平均法 为了消除图像中的噪声,可以直接在空间域上对图像进行平滑滤波。它的作用 有两种:一种是模糊;另一种是消除噪声。空间域的平滑滤波一般采用简单平均法 进行,就是求邻近像素点的平均亮度值,称为邻域平均法。邻域的大小与平滑的效 果直接相关,邻域越大平滑的效果越好,但邻域过大,平滑会使边缘信息损失的越 大,从而使输出的图像变得模糊,因此需要合理选择邻域的大小。典型的邻域有两 西南科技大学本科生毕业论文 17 种:四邻域和八邻域,其模板见式(3-1)。 如果图像中的噪声是随机不相关的加性噪声,窗口内各点噪声是独立分布的, 经过上述模板平滑后,信号与噪声的方差比可提高许多倍。这种算法简单,处理速 度快,但它的主要缺点是在降低噪声的同时使图像产生模糊,特别在边缘和细节处。 而且, (3- 010 101 010 4 1 4 M 111 101 111 8 1 8 M 1) 随着邻域的增大,虽然增强了去噪声的能力,但同时模糊程度也更严重。 2、高通滤波 在进行图像处理时,我们经常要对图像进行锐化以便突出图像的边缘。同样的, 可以采用在空间域对图像进行滤波的方法,只不过这时采用的冲激响应阵列与空间 域低通滤波时所采用的完全不同。采用高通滤波器让高频分量顺利通过,而对低频 分量则充分限制,使图像的边缘变得清晰,实现图像的锐化。但是,对图像进行空 间域的高通滤波,在增强图像边缘的同时,孤立的噪声点也得到了增强。常用于空 间域高通滤波的冲激响应阵列有以下几种: (3- 010 151 010 1 H 111 191 111 2 H 121 252 121 3 H 2) 3、中值滤波 中值滤波是一种非线性滤波,它也是一种邻域运算,类似于卷积。但中值滤波 的计算不是加权求和,而是把它邻域内的所有像素按灰度值进行排序,然后取该组 的中间值作为邻域中心像素点的输出值。中值滤波的突出优点是在消除噪声的同时, 还能防止边缘模糊。如果图像的噪声多是孤立的点,这些点对应的像素又很少,而 图像则是由像素较多、面积较大的块构成,中值滤波效果很好。 4、同态滤波 同态滤波器的思想就是用一系列方法把乘性信号变换成加性组合信号,经过处 理后再反变换回乘性信号。同态滤波以图像的照明反射模型作为频域处理的基础, 它在数字图像处理中有着十分重要的应用。这里不再详细论述。 西南科技大学本科生毕业论文 18 去除噪声处理要根据不同的噪声特点选取合适的方法。本系统采用的是去除杂 点的方法来进行去噪声处理。具体的算法如下:扫描整个图像,当发现一个黑色点 的时候就考察和该点直接或间接相连接的黑色点的个数有多少,如果大于一定的值, 就说明该点不是离散点,否则就是离散点,把它去除掉。在考察相连的黑色点的时 候用的是递归的方法。 西南科技大学本科生毕业论文 19 3.1.3 梯度锐化 我们所得到的二值化图像的字体一般是比较模糊的,对识别造成了一定的困难, 所以有时要对图像进行锐化处理使模糊的图像变得清晰,同时可以对噪声起到一定 的抑制和去除作用。 图像的锐化有很多方法,一种是微分法,一种是高通滤波法,梯度锐化的方法 就是微分法的一种。 梯度对应一阶导数,梯度算子是一阶导数算子。对一个连续函数它在位),(yxf 置的梯度可以表示为一个矢量:),(yx (3-3 T T yx y f x f GGyxf ),( ) 这个矢量的幅度(也常直接简称为梯度)和方向角分别为: (3-2 1 22 )( yx GGfmag 4) (3-)arctan(),( x y G G yx 5) 以上三式中的偏导数需要对每个象素位置计算。在实际中常用小区域模板卷积 来近似计算。对和各用一个模板,所以需要两个模板组合起来构成一个梯度 x G y G 算子。根据模板的大小,其中元素值的不同,人们提出了许多种不同的算子如图 3- 1。在这三个算子中,最简单的算子是 Roberts 算子,Roberts 算子是效果比较好的一 种,我们采用的就是这个算子,效果如图 3-2 所示。算子运算时是采用类似卷积的 方式,将模板在图像上移动并在每个位置计算中心象素的梯度值。在边缘灰度值过 渡比较尖锐且图像中噪声比较小时,梯度算子的工作效果较好。 1 -1 1 -1 -1 -1 1 -1 1 -1 1 1-1 1-1 11 1 2 1 -1 -2 -1 -1-2-1 21 (a)Roberts (b) Prewitt (c) Sobel 图图 3-1 几种常见的梯度模板算子几种常见的梯度模板算子 通过图 3-2 可以看出梯度锐化可以让模糊的边缘变的清楚,同时选择合适的阈 值还可以减弱和消除一些细小的噪声。 西南科技大学本科生毕业论文 20 实验证明梯度锐化具备一定的去噪声能力,但同时也会对字符的边缘有所损伤。 从处理结果可以看出图像的边缘变得清晰而且少了很多细小的杂点,但梯度锐化有 其自身的缺陷,当处理的图像边缘很细的时候可能造成边缘信息的损失。在实验中, 如果图像中的字符较为细小,则不使用梯度锐化。 (a)原始图像)原始图像 (b)利用)利用 Roberts 算子检测到的边缘算子检测到的边缘 (c)利用)利用 Prewitt 算子检测到的边缘算子检测到的边缘 (d)利用)利用 Sobel 算子检测到的边缘算子检测到的边缘 图图 3-2 梯度算子的检测效果比较梯度算子的检测效果比较 3.1.4 倾斜调整 虽然在拍摄车辆车牌时,可以调整 CCD 摄像机的俯仰角度、摄取方向和水平度, 以保持车牌的横向边缘的倾斜度尽可能小,并且让车牌在整幅图像中处于相对居中 的位置,即图像的视觉中心上。但是,实际上 CCD 摄像机通常安装在路边或顶部, 这将造成车辆车牌与 CCD 摄像头成像平面不平行,产生不同程度的车牌图像的倾斜 与变形,影响车牌的检测和分割。就图像的旋转倾斜的问题,更多的情况下,图像 的水平校正是放在车牌的二值化和分割,甚至是在车牌字符切分之后再进行,这样 图像 的运算量大大减少。然而,倾斜的车牌图像本身就极不利于车牌字符的切分,因此, 将图像水平校正放在图像预处理过程中是切实可行的11。 一般情况下,可将倾斜的车牌图像近似看成一个平行四边形,它有三种倾斜模 式:水平倾斜见图 3-3,垂直倾斜见图 3-4 和水平垂直倾斜见图 3-5,分别如下所示。 水平倾斜时,字符基本上无倾斜,车牌的水平轴与图像坐标系的水平轴有 xx 一个倾斜角度,只要求取,将图像绕轴旋转即可。垂直倾斜时,倾斜实际x 上是同一行间像素的错位偏移,只要检测到垂直倾斜角度进行错位偏移校正即可。 西南科技大学本科生毕业论文 21 水平垂直倾斜时,既存在水平倾斜又存在垂直倾斜,是最一般的情况。可先检测水 平倾斜角度,进行水平倾斜校正,然后再求取垂直倾斜角度进行垂直倾斜校正。 对车辆牌照做预处理以后就可以进行字符分割的步骤。 x y x / y / x / x y / y (a) 水平倾斜水平倾斜() (b) 水平倾斜水平倾斜(0 )0 图图 3-3 水平倾斜水平倾斜 i j i j (a) 垂直倾斜垂直倾斜() (b) 垂直倾斜垂直倾斜()00 图图 3-4 垂直倾斜垂直倾斜 西南科技大学本科生毕业论文 22 x x / yy / x y /y x (a) 水平垂直倾斜水平垂直倾斜() (b) 水平垂直倾斜水平垂直倾斜(0 )0 图图 3-5 水平垂直倾斜水平垂直倾斜 3.2 字符分割方法简介 图像分割是一种基本的计算机视觉技术,是由图像处理进行到图像分析的关键 步骤,这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始图像转 化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能。图像分割多年来一 直得到人们的高度重视,至今已提出各种类型的分割算法12。 字符分割的算法很多,通常根据处理对象的不同有许多相应的方法。为了实现 更好的分割,有关景物的总体知识和先验信息是很有用的,根据包含在图像中的信 息,可以定制相应的判决准则和控制策略,使其完成自动分割,比如对多行文本的 处理,邮政部门对邮政编码和地址的识别,金融等部门对支票签名手写字迹的分割 识别等等,都是针对具体的不同研究对象而采用不同的算法。 传统的字符分割算法可以归纳为以下三类:直接的分割法,基于识别基础上的 分割法,自适应分割线聚类法13。直接的分割法简单,但它的局限是分割点的确定 需要较高的准确性;基于识别结果的分割是把识别和分割结合起来,但是需要识别 的高准确性,它根据分割和识别的耦合程度又有不同的划分;自适应分割线聚类法 是要建立一个分类器,用它来判断图像的每一列是否是分割线,但是对于粘连的字 符是很难训练的。因为分割不可能做到完全正确,现在有的算法已经把字符的分割 作为不必要的步骤,而是直接把字符组成的单词当作一个整体来识别。利用诸如马 尔可夫数学模型等方法进行处理,这主要是应用于文本识别。以上的字符分割算法 均是基于二值图像进行的。考虑到二值图像丢失掉了很多信息,而且可能会造成字 符粘连、模糊或断裂的缺陷,对灰度图像的直接处理已经有人开始研究。 西南科技大学本科生毕业论文 23 在一般的字符识别系统中,字符识别之前要经过阈值化过程和行字切分过程, 以分割出一个具体的二值表示的字符图像点阵,作为单字符识别的输入数据。其中, 识别字符过程中的第一步就是要将获得的数字灰度图像转变为数字二值图像,这个 过程称为二值化过程,采用的技术,通常称为阈值化技术。由于获得的文本图像不 但包含了组成文本的一个个字符,而且包含了字符行间与字间的空白,甚至还会带 有各种标点符号,这就需要采用一定的处理技术,将文本中的一个个字符切分出来, 形成单个字符的图像阵列,以进行单字识别处理。这就是字符文本的行字切分问题, 分为行切分和字切分两个主要步骤,首先由行切分得到一行行文本字行,然后在文 本字行中进行列切分得到一个个单独的字符点阵。 车牌的字符切分是在车牌定位的基础上,对取出的牌照图像区域进行下一步处 理,定出牌照上每一个字符的上下左右边界,从而将牌照上的字符完整准确地切割 下来,作为下一步字符识别的数据源。牌照切分是在二值图上进行的。字符切分分 为两步进行,先进行字符的垂直切分,定出每个字符的左右边界,然后进行字符的 水平切分,定出每个字符的上下边界。字符切割过程往往容易被人忽视,但是它对 于字符识别的重要性是不言而喻的,因为切割错误的字符被正确识别的概率基本上 等于零。 3.3 系统采用的分割方法 根据以上介绍的算法,本文采用了一种比较实用的方法,通过对图像的扫描, 得到分割的字符。 3.3.1 算法介绍 经过处理后的车牌可以进行字符分割,本文的分割算法如下: 1、先自上而下对图像进行逐行扫描直至遇到第一个黑色象素点。记录下来。然 后在自下而上对图像进行逐行扫描直至找到第一个黑色象素,记录下来。这样就可 以找到图像的大致高度范围。 2、在上面得到的高度范围内对图像进行自左向右逐列进行扫描,遇到第一个黑 色象素时认为是字符分割的起始位置,然后继续扫描,直至遇到有一列中没有黑色 象素,则认为是第一个字符分割结束,然后继续扫描,按照上面的方法一直扫描到 图像的最右端。这样就得到了每个字符比较精确的宽度范围。 3、在已知的每个字符的比较精确的宽度范围内,按照第一步的方法,分别进行 西南科技大学本科生毕业论文 24 自上而下和自下而上的逐行扫描来获取每个字符精确的高度范围。 经过以上 3 个步骤的循环,就可以实现字符的分割。字符分割以后要做归一化 和紧缩排列,以便做特征提取14。 因为扫描进来的图像字符大小存在差异,而相对来说,统一尺寸的字符识别的 标准性更强准确率自然也更高,标准化图像就是要把原来各不相同的字符统一到同 一尺寸,在本系统中是统一到同一高度然后根据高度来调整字符的宽度。具体算法 为:先得到原来字符的高度,并与系统要求的高度作比较,得出要变换的系数,然 后根据得到的系数求变换后应有的宽度。在得到宽度高度之后,把新图像里面的点 按照插值的方法映射到原图像中。 图像标准归一化的高度和宽度信息可以通过一个对话框输入,但为了以后特征 提取的时候处理方便。建议归一化的宽度为 8,高度为 16。 经过标准归一化处理后的各字符在图像中的位置不定,要对它进行特征提取处 理起来比较麻烦,所以要把归一化处理后的字符进行紧缩排列,以形成新的位图句 柄,以方便下一步的提取工作 至此已经基本上完成图像中字符的分割工作。此外还可以采用其他方法以达到 更好的效果。 3.3.2 算法的实现 根据以上算法在 VC+中用 C+语言编程,可以实现字符分割,并实现字符的 归一化和紧缩排列。实验中的字符分割函数为 CharSegment();DrawFrame()函数用 来给分割后的字符周围画边框;StdDIBbyRec()函数用来实现归一化处理;紧缩排列 由函数 AutoAlign()完成。下面图 3-6 显示了分割算法实现流程: 西南科技大学本科生毕业论文 25 图图 3-6 分割算法的实现流程分割算法的实现流程 西南科技大学本科生毕业论文 26 3.4 字符分割实验结果 实验结果如下面几幅图所示,为了便于观察分割结果,每个被分割后的字符都 用 方框分割开来。从实验可以得出,该字符分割模块基本上可以完成大部分的数字字 符分割。图 3-12 中“川”字被分割成了三份,这说明分割算法的正确性,但它对汉字 的分割却是错误的。图 3-13 中为了可以清楚的观察字符的紧缩排列,归一化的字符 宽度为 12,高度为 24(图 3-11 中的字符宽度为 8,高度为 16)。由于汉字结构比 较复杂,所以该算法不能对汉字作字符的分割。在实验时,图
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。