(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf_第1页
(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf_第2页
(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf_第3页
(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf_第4页
(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(信号与信息处理专业论文)基于神经网络的集装箱字符识别的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 近年来,随着信息技术和计算机技术的发展,为了使集装箱运输管理更加 方便,人们越来越重视集装箱号码自动识别技术,并且这一技术在码头、火车 站等场合得到了广泛的应用。例如:当集装箱卡车通过装有集装箱箱号检测系 统的大门时,系统可以自动识别出集装箱号码,把系统识别的结果反馈给计算 机系统,可以实现动态跟踪集装箱,这样也更方便管理。 虽然集装箱识别系统的优点有很多,但是也存在不足。比如雨、油污、雾、 集装箱表面的凹凸折纹等一些因素都会影响字符识别。在这些因素的影响下, 集装箱的字符会发生畸变或缺失,让这个系统的识别率受到很大的影响。 集装箱号码识别的关键技术主要由四个部分组成,包括号码区域定位、号 码字符分割、字符特征提取和字符识别。本文对这四项技术分别进行了深入的 研究,并取得了一些有意义的成果。 在号码定位部分,根据先验知识,要先对图像进行预处理,图像的预处理 有很多内容,本文主要介绍了图像的灰度化、对比度增强处理、二值化、滤波 去噪、边缘检测以及数学形态学等方面的处理,最后得到号码的精确定位。 在号码分割部分,为了有效的分割字符,本文采用垂直投影法对图像进行 分割。对于存在粘连的字符,运用投影二值法来进行分割。 在特征提取部分,可以采用的方法有很多,比如:逐像素特征提取法、骨 架特征提取法、1 3 点特征提取法等等。经过几种方法的比较,本文最终采用改 进的粗网格特征提取法来提取字符的特征向量,这种方法可以得到局部特征和 全局特征,很好的反映每个字符的特征。 在字符识别部分,采用改进后的b p 神经网络来对字符进行识别。本文设 计了两个三层b p 神经网络来分别识别集装箱中的数字和字母,避免相近字符 的混淆,最终得到识别结果。 本文在m a t l a b 平台下对实验进行了仿真,实现了算法的基本功能,基本达 到了实验的预期目标。 关键词:号码定位;字符分割;特征提取;字符识别;b p 神经网络 a b s t r a c t w i t ht h ed e v e l o p m e n to fi n f o r m a t i o na n dc o m p u t e rt e c h n o l o g y ,p e o p l ep a y m o r ea n dm o r ea t t e n t i o nt ot h ec o n t a i n e rn u m b e ri d e n t i f i c a t i o nt e c h n o l o g ,i no r d e rt o m a k et h ec o n t a i n e rt r a n s p o r t a t i o nm a n a g e m e n tm o r ec o n v e n i e n t a n dt h ec o n t a i n e r n u m b e ri d e n t i f i c a t i o nt e c h n o l o g yi sa l r e a d yu s e di nr a i l w a ys t a t i o n 、d o c ka n d s oo n f o re x a m p l e ,w h e nc o n t a i n e rt r u c k sp a s st h e d o o rw i t hc o n t a i n e ri n s p e c t i o n s y s t e m ,t h es y s t e mc a l la u t o m a t i c a l l yr e c o g n i t _ 2t h ec o n t a i n e rn u m b e r ,a n dp u t 也e r e s u l to fi d e n t i f i c a t i o ns y s t e mf e e d b a c kt oc o m p u t e rs y s t e m t h u s ,i tc a nr e a l i z et h e d y n a m i ct r a c k i n g a n dm a n a g e m e n t ,a n di m p r o v et h ee f f i c i e n c y o fc o n t a i n e r t r a n s p o r t a t i o n a l t h o u g ht h en u m b e ri d e n t i f i c a t i o n s o m ed i s a d v a n t a g e s f o re x a m p l e ,t h eu s e c o n c a v o c o n v e xc r e a s e so fc o n t a i n e r s s y s t e mh a sm a n ya d v a n t a g e s ,i ta l s oh a s o f t h es y s t e mi sa f f e c t e db yr a i n ,f o g ,o i l , s u r f a c ea n do t h e rf a c t o r s s ot h a t t h e c o n t a i n e rn u m b e rc h a r a c t e r sw i l ld i s t o r to rm i s s t h e s es i t u a t i o n sw i l l a f f e c tt h e i d e n t i f i c a t i o nq u a l i t y t h ek e yo ft h ec o n t a i n e rn u m b e ri d e n t i f i c a t i o nm a i n l yc o n s i s t s o ff o u r p a r t s ,i n c l u d i n gn u m b e rp o s i t i o n i n g 、n u m b e r c h a r a c t e rs e g m e n t 、f e a t u r ee x t r a c t i o n a n dn u m b e rc h a r a c t e rr e c o g n i t i o n t h et h e s i sm a k e st h ef u r t h e rr e s e a r c ho nt h ef o u r t e c h n o l o g i e s ,a n dg e t ss o m eb e n e f i c i a lr e s u l t s i nt h en u m b e rp o s i t i o n i n g ,a c c o r d i n gt ot h ep r i o rk n o w l e d g e ,t h ei m a g em u s t b ep r e p r o c e s s e d i m a g ep r e p r o c e s s i n gi n c l u d e sm a n yc o n t e n t s ,a n dt h e t h e s i s m a i n l yi n t r o d u c e st h e s h a d e so fg r a yi m a g e 、i m a g ee n h a n c ep r o c e s s i n g 、t h e b i n a r y 、f i l t e r i n g 、e d g ed e t e c t i o n 、m a t h e m a t i c a lm o r p h o l o g ya n do t h e ra s p e c t so f t h e p r o c e s s i n g f i n a l l y ,t h ei m a g eo fn u m b e rp o s i t i o n i n gi sg o t i nt h en u m b e r c h a r a c t e r s e g m e n t ,i no r d e rt os e g m e n t a t i o ne f f e c t i v e l y ,t h et h e s i su s e s t h ev e r t i c a lp r o j e c t i o n m e t h o df o ri m a g es e g m e n t a t i o ne l e v e nc h a r a c t e r s ,a n dn o r m a l i z e st h ed i v i s i o n c h a r a c t e r s i nt h en u m b e rd i v i s i o np a r t ,i no r d e rt os e g m e n tc h a r a c t e r se f f e c t i v e l y ,t h i sp a p e r u s e sv e r t i c a lp r o j e c t i o nm e t h o dt os e g m e n tc h a r a c t e r s f o re x i s t i n g a d h e s i o n c h a r a c t e r s ,t h i sp a p e r u s e sp r o j e c t i o no ft w ov a l u em e t h o dt os e g m e n tc h a r a c t e r s u i nt h ef e a t u r ee x t r a c t i o np a r t ,m a n ym e t h o d sc a nb ea p p l i e d p e r - p i x e lf e a t u r e e x t r a c t i o nm e t h o d 、s k e l e t o nf e a t u r ee x t r a c t i o nm e t h o d 、13 p o i n t so ff e a t u r e e x t r a c t i o nm e t h o d 、t h ec o n t o u re x t r a c t i o nm e t h o d ,a n ds oo n t h r o u g ht h e c o m p a r i s o no ft h es e v e r a lm e t h o d s ,t h ei m p r o v e m e n to fr o u g hn e t w o r kf e a t u r e e x t r a c t i o nm e t h o di sa p p l i e dt oe x t r a c tc h a r a c t e rc h a r a c t e r i s t i cv e c t o ri nt h et h e s i s f i n a l l y t h i sk i n do fm e t h o dc a ng e tl o c a lf e a t u r e sa n dg l o b a lf e a t u r e s ,a n dt h e s ec a n r e f l e c tt h ec h a r a c t e r i s t i c so fe v e r yc h a r a c t e rv e r yw e l l i nt h ec h a r a c t e rr e c o g n i t i o n ,t h et h e s i su s e st h ei m p r o v e db pn e u r a ln e t w o r kt o i d e n t i 母t h ec h a r a c t e r s i no r d e rt oa v o i dt h ec o n f u s i o no fs i m i l a rc h a r a c t e r s ,t h e t h e s i sd e s i g n st w ob pn e u r a ln e t w o r ko ft h r e el a y e r s ,a n dt h e ng e tt h er e s u l t s n l et h e s i sm a k e st h eb a s i cf u n c t i o no ft h ea l g o r i t h mu n d e rm a t l a bp l a t f o r m t h es i m u l a t i o ng i v e st h ee x p e c t e dr e s u l t k e y w o r d s :n u m b e rp o s i t i o n i n g ;c h a r a c t e rs e g m e n t a t i o n ;f e a t u r e e x t r a c t i o n ; c h a r a c t e rr e c o g n i t i o n ;b pn e u r a ln e t w o r k 武汉理工大学硕士学位论文 1 1 背景及意义 第1 章绪论 当今世界经济迅猛发展,知识信息每天都在变化,通信、计算机和网络等 技术也在飞速发展,信息自处理能力得到了提高,并且大量应用于人们的生活、 生产当中,极大的加快了人类进步的步伐、推动了社会的发展。 到了2 0 世纪后半叶,全球的集装箱运输从技术装备到经营管理越来越完善, 我国的集装箱运输业在近几十年内也发展迅速,运输量巨大。集装箱运输因为 其效率高、效益高、速度快、安全等优点使得集装箱运输成为货运的主要方式, 而且在整个运输体系中所占的比重越来越大了。 目前,我国作为全球水运的大国,集装箱的吞吐量连续有六年在世界上处 于首先地位。因此,我国最近几年一直力求提高现代化的集装箱管理水平,来 获得物流信息高速通道,这个通道是以集装箱运输为主要模式的【1 1 。 遗憾的是,虽然许多集装箱码头采用了现代化管理,但集装箱号码识别仍 然需要人工读取、记录的操作方式【2 1 。集装箱进出码头、堆场、闸道时,人工在 读取、记录和校对时难免存在人为失误,这也极大程度的降低了集装箱的通关 速度【3 】。货运入港的时间也大大增加了,进而增加了货运的成本,货物的价格也 随之升高了,增加了人们的生活成本,使人们的生活水平得不到提高。随着集 装箱数量的剧增,我国现有的集装箱码头的设施和管理水平已经不能满足当前 集装箱运输日益专业化的需求,因此运用集装箱号码自动识别技术是解决这一 问题的关键i 训。 集装箱号码自动识别系统能自动识别集装箱的号码,不需要人工的干涉, 就可以完成对集装箱的一些信息的收集,这样既消除了人工读取、记录产生的 失误,又提高了效率。集装箱号码的自动识别,可以减少人为的失误、减少作 业的时间,从而提高了报关通关的效率,进而降低货物的成本。为了使这一体 系在集装箱运输业中得到更好的运用,必须要做好集装箱自动识别系统的研究 开发工作,从而去迎合集装箱运输业的迅猛发展。 现在想利用海关偷渡的现象经常发生,这一方面使得一些不法分子人中牟 取暴利,一方面也使我国的税收蒙受了巨大的损失,另一方面也保障不了广大 武汉理工人学硕士学位论文 消费者的合法权益。如果海关可以通过验证系统找到集装箱主或者货主,可以 打击一些走私偷渡的不法分子,因而来保护人民和国家的利益。 为了实现这些目的,就要对现有的集装箱识别系统进行改进,比如降低天 气、集装箱体油污等因素影响会对字符识别造成影响的,使集装箱识别效果更 加理想可靠,提高识别率。 1 2国内外发展状况 8 0 年代后期,世界上的一些发达国家为了在市场竞争中占有一席之地,实 现集装箱的现代化运输【6 】,从而开发出了集装箱自动识别系统,并取得很好的效 果。随着科技的不断发展,集装箱自动识别技术也得到了不断的完掣5 1 。目前存 在下面几种形式 6 - 1 2 j : ( 1 ) 视频识别系统。该系统利用安装在路旁的摄影设备,传送车辆的车牌 号和集装箱箱号等数据信息,最后由人工或者自动的方式把这些数据信息记录 下来。这个系统的出错率很高,但是可靠性较低,精确性也不高,因此现在使 用这个系统的国家越来越少。 ( 2 ) 条形码识别系统。该系统是用光学识别系统进行识别条形码,这项技 术已经得到了广泛运用。运用激光枪识别用铜箔、银箔制成的金属条形码,在 5 m 内可以准确的识别。金属条码的寿命长,可得到广泛的应用。其主要缺点是 抗污性能差,容易受到沙尘、油污等侵蚀,需要时常擦洗,识读的可靠性不太 高。 ( 3 ) 微波反射系统。该系统用微波反射调制式技术进行识别,开发于上世 纪8 0 年代,这种技术不受雨、雪、雾、灰尘、油污、振动等因素的影响,抵抗 污染能力很强。目前世界上各国的车辆和集装箱等自动识别系统都已经广泛使 用了这个系统。这个系统的缺点是集箱装上安装的电子码板的源来自于码板中 的电池,因此在使用途中要时常换电池或电子码板。另外有一种无源码板,其 识别距离比较短,一般在2 m 以内才能识别。集装箱自动识别系统罩面应用的码 板大部分是有源码板。 ( 4 ) 光学字符识别系统。该系统相似于视频识别系统,都是通过安装在路 边的摄像设备拍摄集装箱图像,再对图像进行处理并提取集装箱号码,最后利 用光学字符识别技术进行自动识别。这项技术也容易受到恶劣天气等因素的影 响,由于光学字符识别技术发展至今已比较成熟,因此识别率较高。当系统识 2 武汉理工人学硕士学位论文 别出现错误或者识别不了时,由于之前拍摄过集装箱号码图像,可进行人工纠 正,所以光学字符识别系统的精确性和可靠性很高。 ( 5 ) 射频识别系统。该系统是一种称为电子标签的非接触式的自动识别系 统。其基本原理是通过射频信号自动识别目标物体并取得数据信息,它的优点 是可超出视线距离识别,比光学字符识别的距离远,射频识别卡可存储大量的 数据并且具有读写功能。识别过程中不需要人工干涉,在恶劣的环境下可照常 工作。射频识别系统的缺点是标签成本比较高,因此不会随便丢弃。 ( 6 ) 人工智能自动识别系统。该系统的原理是通过摄像设备拍摄集装箱图 像,再把图像传送进计算机来进行识别,最后自动生成该集装箱的相关信息【1 3 】。 这个系统的缺点是智能化程度不够高,人工神经网络提供了一个新的方向,但 是目前还不够成熟。 图1 1 集装箱号码的识别系统流程图 上面叙述的各种系统都有局限性,但是广泛得到应用的是人工智能自动识 别系统和光学字符识别系统i l 训。这两种系统的优点是不用在集装箱上安置其他 设备就可以进行人机交互,所以发展很快,现在应用的也比较成熟。图1 1 即为 集装箱号码的识别系统流程图。集装箱号码识别技术就是在计算机视觉技术、 数字图像技术、模式识别等基础上发展起来自动识别技术。首先利用摄影设备 拍摄集装箱图像,再传送数字图像信息,经过图像的预处理、号码定位、字符 分割、字符识别等过程后,最后将结果呈现出来的一种实时的识别技术1 1 5 o l 。 这种技术的识别效果受到油污、天气等因素的影响很大。因此提高集装箱号码 识别技术的识别率是关键的技术问题。 3 武汉理工大学硕士学位论文 1 3 研究内容 数字图像处理的研究经历了很多年,其相关理论、各种算法和技术也很成 熟。在人工神经网络方面,很多科学家提出的可应用于识别和分类的基于不同 理论的神经网络模型和实现算法【2 l 】,给了本文良好的理论基础。 本文主要是采用了理论与实际实验相结合的方法对集装箱自动识别系统进 行了研究。集装箱自动识别的步骤是通过摄像设备拍摄集装箱的图像,传入计 算机后对图像做预处理,获取我们需要的号码区域图像,然后对分割号码区域 字符,接下来提取字符特征向量,最后利用神经网络对分割出来的字符识别。 本文分为五个章节: 第一章为绪论部分。主要介绍了本课题的研究背景及其意义、国内外发展 状况以及本文的研究内容。 第二章是集装箱号码区域的定位提取。先分析了集装箱号码的编写规则: 然后对图像进行预处理,本章主要对图像进行了灰度化、对比度增强、二值化、 倾斜矫正、滤波、边缘检测以及数学形态学等方面的处理,并通过实例来体现 处理的效果,最后得到集装箱号码区域的精确定位。 第三章是集装箱号码的字符分割。为了有效的分割字符,本文采用垂直投 影法对图像进行分割。对于存在粘连的字符,运用投影二值法来进行分割。 第四章主要为字符的特征提取。可以使用的方法比较多,本章依次介绍了 逐像素特征提取法、骨架特征提取法、1 3 点特征提取法等等。经过几个特征提 取方法的比较,最后运用改进的粗网格特征提取法来提取待识别字符的特征, 依次得到局部特征和全局特征,可以很好的反映每个字符的特征。 第五章为字符识别部分。本章简单介绍了字符识别技术、人工神经网络特 征以及网络模型,并着重对b p 神经网络进行了详细的介绍,并对b p 网络提出 了改进算法,最后用改进后的b p 神经网络来对字符进行识别。 4 武汉理f _ j :人学硕士学何论文 第2 章集装箱号码区域定位提取 2 1 集装箱号码的编写规则 国际化标准组织制定了集装箱号码编写的国际化统一标准。这个标准在全 球是唯一的,即使用印刷体的数字和字母1 2 引。图2 1 是几种集装箱的号码图像。 集装箱号码是由4 个大写英文字母和7 个阿拉伯数字组成的,共1 1 个字符, 包括四个部分: ( 1 ) 第一部分是箱主代码,由国际集装箱局注册的3 个大写英文字母组成, 代表集装箱是属于哪个公司的。 ( 2 ) 第二部分是设备识别码,由1 个大写的英文字母表示。 u 表示所有的集装箱 j 表示集装箱所配置的挂装设备 卜表示集装箱拖挂车和底盘挂车 ( 3 ) 第三部分是箱体的注册码,由6 位阿拉伯数字组成,是唯一识别集装 箱的标识。当位数不足6 位时,在前面加0 补足6 位。( 例如:当箱号为5 6 7 7 时,需要用0 0 5 6 7 7 来表示) 。 ( 4 ) 第四部分为校验码。校验码只有l 位数字,即第1 1 位数字,是由4 位字母和6 位数字经过一种校验法则计算得到的,用于检查识别结果是否正确。 ( a ) | _ 一 图2 1几种集装箱的号码图 集装箱号码标记的尺寸和颜色都有要求,所有字体的高度不得小于l o o m m 。 集装箱号码必须标识在每个集装箱的表面,除了底面。因箱体的结构不同,有 的可以采用横向单行排列号码,如图2 2 所示。如果不能实现横向单行排列的, 可采用竖向排列,如图2 3 所示。有的横向单行排列和竖向单行排列都不能实现 的,可按图2 4 和图2 5 的方式排列。 武汉理工人学硕士学位论文 图2 3 识别标识一竖向排列 图2 4 识别标识多柱式竖向排列 图2 5 识别标识分组横向排列 6 武汉理工大学硕士学位论文 有时候把3 位箱主代码和l 位设备识别码一起叫做箱主代码,如果没有做 特别的说明,一般提及的箱主代码为4 位英文大写字母。 2 2 集装箱图像预处理 2 1 世纪是一个充满信息的时代,图像是人类获得信息、传送信息和表达信 息的一种重要手段。从摄像机获取的图像由于受到自然环境等因素,质量一般 较差,这样就需要对图像进行预处理,使我们感兴趣的区域突显出来。 图像的预处理有很多内容,本节主要是对图像的灰度化、增强处理、二值 化、滤波、边缘检测以及数学形态学等方面的处理,并通过实例来体现处理的 效果。 2 2 1 图像灰度化 目前的集装箱图像样本大部分是通过数码相机拍摄得到的,在进行预处理 之前的图像全是彩色图像。真彩色图像也可以称作r g b 图像。在真彩色图像中, r 、g 、b 这3 个分量分别表示一个像素的颜色,分别为红、绿、蓝3 种颜色, 可以通过这三种基色合成出任意颜色【2 3 1 。 彩色图像包含的信息量很大,这样需要的更大的存储空间,因此图像处理 的速度也会随之变慢。图像上每个像素都有r 、g 、b 这三个分量,也有一些与 识别没有关系的信息,妨碍下一步的识别工作。所以,在对图像进行处理的过 程中,一般都将彩色图像转化为灰度图像,这样可以加快图像处理的速度。 在r g b 模型中,当r = g = b 时,图像呈现一种灰度颜色,其中灰度值就是 r = g = b 的值。灰度化处理就是把彩色图像转化为灰度图像。灰度图像的灰度范 围为0 - 2 5 5 。一般灰度化的处理方法有以下几种: ( 1 ) 最大值法:将彩色图像中的r 、g 、b 中亮度最大值作为灰度值 r = g = b = m a x ( r ,g ,b )( 2 1 ) ( 2 ) 平均值法:将彩色图像中的r 、g 、b 的亮度求平均得到灰度值 尺= g :b :r + g + b ( 2 2 ) 3 ( 3 ) 加权平均法:给三个分量设置不同的权值,并使三个分量等于它们的 加权和平均,即 7 武汉理l :人丫:硕f :7 :f 节论文 尺:g = b :鉴堡堂! 垡鉴垒 ( 2 3 ) 3 i 乏 1 、彬,、分别为r 、g 、b 的权值。仡现实生活t 1 ,人眼刈。绿色的 敏感度域一岛,其次为红色,对监色的敏感度最低,l 时此迎陔使彬,的值尽量大, 的值尽绩小。 经过多次实验证明,= 0 3 0 ,彬,- - 0 5 9 ,= 0 1 l 时得到最为合理的灰度 冈。 ( a ) 集装箱1 图像( b ) 集装箱2 图像 图2 6 待处理的彩色图像 ( a ) 集装箱1 狄度图( b ) 集装箱2 狄度图 图2 7处理后的狄度图像 本文算法程序都是在m a t l a b 软件平台上实现的,调用m a t l a b 函数库中的 r g b 2 9 r a y ,可将彩色图像转换成狄度图像,为下面的图像处理提供了良好的基 础条件。函数r g b 2 9 r a y 基本调用语法如f : g r a y i m a g e = r g b 2 9 r a y ( v a r a r g i n ) ( 2 4 ) 其中g r a y i m a g e 表示处理后的狄度图像,如图2 7 所示:v a r a r g i n 表示待处 理的彩色图像,如图2 6 。 武汉理: 大学硕士学位论文 2 2 2 图像增强处理 图像增强是图像处理中的一个主要任务,目的是使图像的视觉效果得到改 善,突出图像中有用的信息。 厂( x ,y ) = t g ( x ,y ) 】 ( 2 5 ) 其中g ( x ,y ) 表示输入的图像,f ( x ,y ) 表示增强处理后的图像。 对比度增强是增强技术中很重要的又比较简单的一种方法。对比度增强是 按照一定的规律,修改输入图像每个像素的灰度值,来达到改变图像灰度动态 范围的目的f 2 4 1 。 ( 1 ) 线性变换 在图像成像时曝光过度或不足时,就会产生对比度不强的问题,这时图像 中的细节会分辨不清,解决的方法就是将灰度范围进行线性扩展。 线性点运算的实质是:如果原图像g ( x ,y ) 的灰度范围是【a ,b 】,线性变换 后的图像厂( 石,y ) 的灰度范围是【c ,d 】。f ( z ,y ) 和g ( x ,y ) 之间的狄度变换关系 如下: i c g ( x ,j ,) a 厂( x ,y ) = 罢二兰【g ( 工,y ) 一口】+ c 口g ( x ,y ) 6 ( 2 6 ) i d 一口 l d g ( x ,j ,) b ( 2 ) 非线性变换 有时为了得到更为精确的变换,单纯的线性变换无法满足需求,因此可以 采用非线性变换。常用的有对数变换或g a m m a 校正。 对数变换的过程如下: 八五力= c l o g g ( x , 力+ l 】 ( 2 7 ) 它常用来扩展低值灰度,压缩高值灰度,c 为一个常数。 g a m m a 校正:设g 为图像的灰度,为胶片或c c d 图像传感器等的入射光 的强度,由此可得出,入射光强度与输出信号之间的关系可表示为: g = 。 ( 2 8 ) 一般情况下,理想图像中的灰度和光强度成正比,并不是上面式子中这个 关系。因此构造下面的式子: 口上 f = k r = 尼( 垒) , ( 2 9 ) 9 武汉理i :入学硕士学位论文 k 为一常数,通常取1 。1 y 通常取0 4 - 0 8 。在m a t l a b 中,上述的线性和 非线性变换都可用同一个函数i m a d j u s t 实现。 ( a ) 集装箱1 增强前 ( b ) 集装箱1 增强后 图2 8集装箱l 增强前后对比 ( a ) 集装箱2 增强前( b ) 集装箱2 增强后 图2 9集装箱2 增强前后对比 由于本文重点是要提取号码部分的图像,需要号码部分在背景图像上更加 突出,因此采用对比度增强的方法来处理图像。图2 8 为集装箱l 增强前后对比, 图2 9 为集装箱2 增强前后对比。经过图像对比,可以看出号码图像部分更加清 晰、突出。 1 0 武汉理工大学硕士学位论文 2 2 3 图像的二值化 图像的二值化就是按照一定的阈值把灰度处理后的图像转化为黑和白这两 种颜色,一般灰度级大于阈值的像素点为白色,灰度级小于阈值的点为黑色。 因此阂值的选择是图像二值化的关键,利用阈值或者阈值范围把图像分成背景 和目标两部分。 设图像g ( x ,y ) 的灰度级范围是【0 ,l 】,在0 和l 之间选取一个恰当的阈值 t ,则图像处理方法如下: f c x ,y ,2 三; 二:;三丁t c 2 。) 这样得到的f ( x ,y ) 是一幅二值化图像。二值化后,f ( x ,y ) = l 的点为目 标,f ( x ,y ) = 0 的点为背景。选择阈值的方式有很多种,常用的有以下几种方 法: ( 1 ) 直接固定阈值法 直接固定阈值法是所确定的阈值运用于整个图像中的每一个像素。这种方 法处理起来很简单,速度非常快,对于背景单一的图像处理的效果还好,可是 对于背景复杂的图像,处理后的结果就不会很理想。 ( 2 ) 直方图法 先做出图像的灰度直方图,如果直方图呈现双峰状还且有很明显的波谷, 则把谷底所对应的灰度值作为阈值。这种方法适合目标和背景的灰度差异较大 且直方图有明显波谷的图像。 ( 3 ) 自适应阈值法 当背景复杂且灰度变化大时,整幅图像没有一个合适的阈值,这时候单一 的阈值并不能满足图像的需求。这时,就要对图像进行分块处理,对选取的每 一块确定一个阈值,这种选择方式称为自适应阈值法。这种方法消耗的时间比 较长,计算量也很大,但是抗噪声能力很强1 2 引。 集装箱号码图像中的号码区域一般与背景差异较大,而且背景比较单一, 因此本文对图像进行二值化使用一个初始阀值t ,其选取方法是:选取阀值 r = g 憾一( g m “一g m 。) 3 ,g 懈和g m i 。分别是最高和最低灰度值。集装箱l 二值 化前后对比效果如图2 1 0 ,集装箱2 二值化前后对比效果如图2 1l 。 武汉理j :人学硕十学位论文 ( a ) 集装箱1 二值化前 ( b ) 集装箱1 二值化后 图2 1 0 集装箱l 二值化前后对比 ( a ) 集装箱2 二值化前 ( b )集装箱2 二值化后 图2 1l集装箱2 二值化前后对比 2 2 4 图像滤波去噪 在拍摄图像的过程中,会受到比如大雾或雨雪天气等很多因素的干扰,这 时图像上会产生与脉冲噪声相似的噪声。这种类型的噪声会使图像中出现一些 很细微的亮点,对集装箱号码的分割和识别过程产生不好的影响。用中值滤波 器可以去除这种类似脉冲式噪声点,并且取得的效果也很好。中值滤波是一种 在运算过程中不用统计图像特征的非线性的滤波,因此在实际中使用起来比较 方便。 1 2 武汉理工人学硕士学位论文 中值滤波器,在一定的条件下,可以克服细节模糊等其他线性逆波器造成 的的缺点,并且处理存在脉冲干扰和扫描噪声的图像效果很好。但是这种滤波 器在消除噪声时也会让信号的高频信息损失,图像的边缘部分产生模糊。 中值滤波器是运用一个拥有奇数个点的滑动窗口,用这个窗口中各像素点 的灰度中值取代窗口中间位置的那点值【2 6 】。设窗1 3 长为n ( n 为奇数) 的一个一 维序列石,五,以,对这个序列中值滤波,也就是在输入序列中连续抽 出n 个数,乃呻,f j l ,f j ,乃+ l ,f j + ,其中乃为窗口处的中 心值,1 ,= ( 一1 ) 2 ,再按照数值大小排列这n 个点的值,把序列号在正中间对 应的值作为滤波的输出。用公式可以表示为: z = m e d f z z + v ) ( 2 1 1 ) 其中,z ,:二翌。 图2 1 3 图像滤波后 输入波形的上升边缘能被保持是中值滤波的一个重要特点。对二维序列 x j ) 中值滤波时,其二维的滤波窗口有圆环形、十字形、圆形、方形、线状等 很多不同的形状。 二维数据的中值滤波用公式可以表示为: 、fm e d x j 1 ( 2 1 2 ) 利用中值滤波处理图像阵列时,如果窗口是关于中心点对称的,并且中心 武汉理工大学硕士学位论文 点也在窗口里面,即: ( x ,y ) 彳;( - x , - y ) 彳; ( o ,0 ) 彳; ( 2 1 3 ) 窗口里面某一点与窗口中心的坐标距离是( x ,y ) ,中值滤波能使其所有方向 上的跳变边缘都保持。一些边缘变化缓变的轮廓线较长物体的图像,用圆形或 方形窗口,对一些有尖顶角的物体的图像,最好运用十字形的窗口。 中值滤波一般使用的滑动窗口含有奇数个点,其窗口形状和大小都会对滤 波器产生很大的影响。滤波过程中需要考虑的有程序的复杂程度、处理时间长 短和消除噪声的效果。经过实验的反复对比,本文最终使用n x n 的方形中值 滤波器,其中为最接近图像宽度形的奇数。图2 1 2 、2 1 3 为滤波前后对比图 像。 2 2 5图像的边缘检测 边缘检测一般采用空域微分算子来对灰度级间断检测的一种检测方法。图 像边缘上灰度变化最大的地方,一般对应函数的梯度比较大,因此选取的求导 算法的好坏直接影响边缘检测的好坏。边缘检测就是对图像上的所有像素点求 一阶或二阶微分来确定哪些是边缘像素点。一般情况下,图像的边缘点对应的 就是一阶微分图像的峰值,利用二阶图像求导则是过零点对应着图像的边缘点。 如果一个像素落在图像中某一物体的边界上,那么此像素的周围区域将成 为一个灰度级的变化带。边缘检测算子可以检测每个像素的邻域,并且量化灰 度变化率,也可以确定方向,用到的大多数方法是基于方向导数掩模求卷积的。 通常用到的检测器有r o b e r t s 边缘检测器、s o b e l 边缘检测器、p r e w i t t 边缘检测 器、k i r s c h 边缘检测器等【27 1 。c a n n y 边缘检测器的m a t l a b 语法: j = e d g e ( i , c a n n y ) ; ( 2 1 4 ) i 为原图像,j 为边缘检测后的图像。采用e d g e f f l 数的c a n n y 边缘检测器对图 像进行边缘检测得到的效果图,可以清晰的看到号码区域字符的边缘和背景上 的其他边缘。 根据之前对集装箱的研究可以看出,集装箱号码所在的区域在图像的右半 边,因此,只需要截取图像的右半边进行边缘检测即可。这样不仅可以减少计 算量,也可以消除左半边字符的影响,进一步缩小了候选区域范围。如图2 1 4 所示,分别显示 c a n n y 算子、s o b e l 算子、p r e w i t t 算子、r o b e r t s 算子的程序对于 集装箱l 的运行结果。 1 4 武汉理:r 入学硕+ 学位论文 c a n n y 算子 s o b e l 算子 p r e w i t t 算子 r o b e d s 算子 图2 1 4各种检测器的比较图 2 2 6 图像的倾斜矫正 由于图像采集工作是由数码相机完成的,由于放置相机的位置不同,采集 到的视频图像避免不了的会发生不同程度的倾斜,因此需要对发生倾斜的图像 进行倾斜矫正,为下一步的图像处理打好良好的基础。 图2 1 5 图像边缘检测 本文倾斜矫正的思路是:首先找到集装箱的倾斜角度0 ,然后通过以这个角 度旋转集装箱。具体步骤如下: ( 1 ) 先对原始灰度图像进行二值化处理,可以使边缘检测时的干扰因素减 少一些,找到集装箱水平边缘也更加容易。 ( 2 ) 对二值化图像进行边缘检测,为了让集装箱边缘更加明显为下一步的 武汉理i 人。、倾 :,z f 论文 操作打卜基础。本文采1 jc a n n y 边缘枪洲器对2 1 0 ( a ) r ,的:值化i 割像进行边 缘检测,如l 铡2 1 5 。 ( 3 ) 伍边缘枪测后的劁像卜找到墩长水平边缘,并扫:卜l 选取两个t ia 、b , 此时可以选择最长水_ 边缘卜f ;f 勺域i 盘点a ( x ,y 。) 和高低点b ( x 2 ,y 2 ) ,从而求得 此茂线的斜率为: 特鬻 x ,一兑 、。7 再 如斜率和倾斜角之j 白j 的关系得到: 0 = 万一口ct a nk ( 2 1 6 ) ( a ) 倾斜矫正前的i 矧像 ( b ) 倾斜矫正后的图像 图2 1 6 图像矫f 前后对比 这样就知道了旋转角度目。得到倾斜角度臼后,把图像沿其倾斜的相反方向 旋转口,就得到了矫萨后的图像。在m a t l a b 中可调用i m r o t a t e 对图像进行倾斜 矫一: i = i m r o t a t e ( f ,0 ,m e t h o d ) ; ( 2 17 ) 其中m e t h o d 有“n e a r e s t ”( 最近邻插值法) 、“b i l i n e a r ”( 双线眺插值法) 、 “b i c u b i c ”( 双三次插值法) 【2 8 】。双线性插值法的插值效果优于最近邻插值,可以克 1 6 武汉理工人学硕士学位论文 服灰度不连续的缺点,其运算量少于双三次插值法。因此本文采用的是双线性 插值法,如图2 1 6 所示为图像矫正前后对比。 2 2 7 数学形态学的基本运算 从边缘检测后的图2 1 4 可以看出来,号码区域并不是一个连通的区域,因 此需要把号码区域合并起来,连成一个大的区域,以便其分割出来。本文采用 数学形态学的一些基本原理对图像处理,最终得到所需的目标号码区域。 以下介绍了数学形态学中的一些基本概念和运算方法【2 9 1 。设q 为二维欧几 里德空间,图像a 是q 的一个子集,结构元素也b 是q 的一个子集,b q 是 欧氏空间里面的一个点。 ( 1 )腐蚀 简单的腐蚀是去除物体周围的所有边界点,使剩余物体的周边的面积比原 始物体小一个像素,即在二值化图像中实现“细化”或者“收缩 操作。其运算 定义式为: ao b = a + bia a ,b b = u 彳6 ( 2 1 8 ) ( 2 )膨胀 简单的膨胀是把所有与物体相接触的背景点合并到这个物体中来,也就是 将相应数量的点增加到这个物体的面积中,即在二值化图像中实现“变粗 或 者“加长”操作。其运算定义式为: ao b = z qib :sa = n a 6 ( 2 1 9 ) ( 3 )开运算 先腐蚀后膨胀的过程称为开运算,即a 先被b 腐蚀,再被b 膨胀。开运算 可以使物体的轮廓变光滑,消除一些细小的突出物和狭窄的间断。其运算定义 式为: a o b = ( a o b ) o b ( 2 2 0 ) ( 4 )闭运算 先膨胀后腐蚀的过程称为闭运算,闭运算过程与开运算相反,即a 先被b 膨胀,再被b 腐蚀。闭运算可以使物体的轮廓变光滑,消除细长的鸿沟和一些 狭窄的间断,去除很小的洞孔,并且填充边界线中的断裂。其运算定义式为: a b = ( a o b ) o b ( 2 2 1 ) 本文采用的基本思路是: 1 7 武汉理j :入学硕七学位论文 ( 1 ) 集装箱号码区域是呈矩形的,从其边缘检测图中可以看出来,需要对 其做腐蚀运算,可以消除一些不在号码矩形区域的边界线,得到如图2 1 3 所示 的腐蚀后的图像。 边缘俭测腐蚀后图像 形态 ( b ) 集装箱2 形态变换处理图 图2 1 7 基于数学形态变换的图像处理 ( 2 ) 再对图像做闭运算,将号码区域连通为一个矩形区域,消除各个号码 字符之间的不连通的情况。 ( 3 ) 这时图像中还存在号码区域外的一些小的连通域,需要对图像进行反 复的开闭运算后,可得到号码区域。 1 8 一删煳 皿圜一 武汉理一j :火学硕士学位论文 对边缘检测后的集装箱图像进行膨胀、腐蚀、开运算和闭运算,可使号码 区域合并在一个连通的区域,这为后面的集装箱号码的粗定位提供了良好的后 选区域。如图2 1 7 ( a ) 所示为集装箱1 的数学形态变换的处理过程,( b ) 为集 装箱2 的数学形态变换处理过程。 2 3 集装箱号码的定位提取 集装箱号码区域宽高比为l 2 ( 分组横向式排列) 、l 2 l ( 竖向多柱式 排列) ,8 1 0 ( 单向横向排列) 、l 1 0 1 8 ( 单向竖向排列) ,去除不符合宽 高比的连通域即为真正的号码区域。 数学形态处理后的集装箱l 中图像为连通区域,如图2 1 8 ( a ) ,此时也只 有一个连通域,可确定为集装箱的号码区域。而集装箱2 中连通区域较多,由 先验知识,号码区域一般在最上面的一个连通域中,因此最上面一个连通区域 即为所需的号码区域。 。_ 。1 。1 1 。1 。1 。1 。1 。1 。1 。 - - 图2 1 8 集装箱1 符合结构特征的连通域 先进行水平定位,把图像看为若干行,从上往下逐行扫描直到遇到第一个 白色像素点,把这行记录下来,作为号码区域的上边缘。然后再从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论