(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf_第1页
(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf_第2页
(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf_第3页
(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf_第4页
(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(信息与通信工程专业论文)基于gabor小波变换和矩变换的神经网络图像识别技术.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 伴随着计算机技术的不断开拓和对人类感知机理研究的不断发展,数字图像 识别技术已经成为数字图像处理技术中一个重要的研究方向,其应用范围几乎涵 盖了人类所涉及到的所有领域。但是图像识别技术依然受限制于自适应性能差, 鲁棒性不高,技术不通用等缺点,在识别技术发展的今天,如何加强图像识别技 术的适应性和鲁棒性甚至通用性就成为了研究图像识别的一个热点问题。 针对如何加强图像识别技术的适应性、鲁棒性甚至通用性,本文对图像识别 技术进行了研究。按照图像识别的过程,把图像识别技术分成图像处理、特征提 取和模式识别三部分进行研究和讨论。 在图像处理阶段,本文首先介绍图像复原、图像增强和图像分割三类图像处 理技术。然后分析和对比了三类图像处理技术的常见方法,并给出仿真结果。还 针对图像在噪声污染度严重和多层噪声干扰的情况,提出了新的自适应门限中值 滤波器。实验证明,自适应门限中值滤波器能够在消除污染密度大的脉冲噪声同 时保护图像的细节,而且它对于传统滤波器滤除噪声效果不好的多层脉冲噪声也 拥有良好的去噪声效果。 在特征提取阶段,按照选取待识别图像的边缘关键特征为主要目标的思路, 对传统特征提取方法的优缺点进行比较。本文基于特征提取技术和人类感知机理, 提出了采用了具有与人类视觉基元相似性质的g a b o r 小波变换和不变矩变换作为 特征采集手段,分别提取待识别目标的局部特征和和全局特征。并再保留这两种 特征优点的情况下对其融合,产生新的优化特征。 在模式识别阶段,本文采用了模拟生理学上的真实人脑神经网络的结构和功 能的人工神经网络进行判别分类。把融合的优化特征输入白适应学习率的神经网 络进行训练和识别。本文对实现方法进行研究,并对实现的仿真结果进行分析。 实验结果证明本文提出的技术相比于g a b o r 小波变换的神经网络和矩变换的神经 网络识别算法有更好的自适应性和鲁棒性。 关键词:图像识别,自适应门限中值滤波,q l b o r 小波变换,炬变换,神经网络 a b s t r a c t a b s t r a c t w i t l lt l l ed e v e l o p i i l e mo fc o m p u t 盯t e c l l i l o l o 百韶锄dh 曲a ns e 娜a t i o nr e s e 删l e s , t l l et e c t l n o l o g yo fi n :l a g er c c o g i l i t i o nb e c 锄e es i g t l i f i c 觚t 丘e l do fi m a g ep r o c e s s i i l 吕 i tc 雒b ea p p l i e di na l m o s ta l lh 啪a n1 i v 铭b 毗i ti s1 i i i l i t e di ni t ss h 嘶c 0 i n i n 擎o f l a c k i i l ga d a p t a t i o n 锄dn o tb e i n gu s c d i 1 1d i f 衔e n tf i d d 伽s ,h o we i l h 蛆c ei t s 却啪o n ,r o b u s 恤e s s ,e v e nu i l i v e r s a l i t yi sap 】r o b l e 1 o nm eb 勰i so fe n l l 盟c i n ga d 印t a t i o i l ,r o b l 塔协e s s ,e v e nl | 1 1 i v e r s a l i t yo fi m a g e r e c o g n i 矗o nt e c l n o l o g y ,t l l i sd i s s e r t a t i o nr 髂e 缸c h e dt l l ei m a g er e c o g i l i t i o nt ec :1 1 n o l o g y a c c o r d i n gt o t h ep h a s 锶o fi m a g er e c o 班t i o n “r e s 翩r c h e da n dd i s c i l s s c di i lt l l r c e s e c t i o n sm c h 嬲,i m a g ep r e p r o c e s s 协岛f b a t u r ee x 仃a c t i o na z l dp a t t e n lr e c o g n i d o 玑 ht h ep h a s eo fi m a g ep m c 铭s i t l 岛t l l i sd i s s e n a d o ni n 虹o d u c e d ,d i s c 船s e da 1 1 d s 缸u l a t e dt 1 1 e 伽i 廿o n a lm e t l l o d so fi i n a g er e s t o 硎o n ,i m a g ea l h 觚c e m a l t 趾di m a g e s e g m e i l t a t i o i lf u n h 黝o r c ,i tp r o p o s c dan 鲫a d 印d v e 蝴o l dm e d i a i lf i l t a t o m o v em u l t i p l e - i m p l l l s en o i s e m o r e 0 v e i tp r o c s 嚣b e t t 盱a b i l i t yo fa t t e r i u a t i n g m u l t i l a y e f 。di m p l l l s en o i s et h a no t h e rm e n l o d s hm e p h a s e o ff b a :t i 】r e t r a c t i o n ,t h i sd i s s e n a t i o np r 叩o s e dt ou s eg a b o rw a ve _ i 耽 仃觚s f o 胁t og c tg l o b a lf e a t l l r eo fi m a g ea n du s em o m 曲t 仃a n s f o r mt og e tl o c a lf e a t l l r e t h e l l ,c o m b i n i n g 也e 酉o b a lf e a n 】r ea n dt h e1 0 c a lf e a h i r ew i l l 觚ei i l t on 洲f b a n | r et ob e p r o c e s s e di i lt 1 1 ep a 仕锄r c c o g n i t i o np h 勰e h lt h ep h 勰eo fp a t t 锄r e c o g n i 廿o n ,t h i sd i s s e r t a t i o na d o p t e d 枷丘d a ln e u r a l n c t 、) l ,o r ks i i n u l 劬gt h es 饥l c t i l 】呤a n df 1 1 n c t i o no ft i u 吼蛆n e u r a ln e 脚o r kt oj u d g ea i l d 酗s o n nt o o kt h ef i l s m gf 宅a t u r et ob et l l ei n p mo f n 删n e t w o r kt ot r a i na n dr c c o g n i z e k 略t ,m en e wt c c h n 0 1 0 9 yi sc o m p l e t c d t h ee x p 硎m e mf e 龇l t ss h o wm a ti to w 璐b e t t e r a d a p t a t i o i l ,r o b u s 恤e s s ,e v e n 嘶v e r s a l i t yt l l a nn e u r a ln e t 、) l ,0 1 ki n l a g er e c o g i l i t i o nb 嬲e d o n n 坞g a b o f w a v e l e t 仃a n s f t 舢( 坷t h e m o m e n t 乜彻s f b 衄 k e y w o r d s :i m a g er e c o 倒垃o n ,a d a p 6 v et l l r e s h 0 1 d m e d i a i lf i h g a b o rw a v e l e t 仃锄f o 咖,m o m e n tn 孤s f o 皿,n 删n e 帆r o r k 图目录 图目录 图2 1图像识别的主要步骤4 图3 一l图像退化的模型9 图3 2 一个高斯噪声的概率密度函数。1 0 图3 3 一个均匀噪声的概率密度函数。1 0 图3 4 一个脉冲噪声的概率密度函数:1 1 图3 5 三种滤波器的比较。1 3 图3 6a t m f 与传统滤波器在脉冲噪声污染下的的比较1 6 图3 7a t m f 与传统滤波器在多层脉冲噪声污染下的比较1 7 图3 8 拉普拉斯算子的增强效果1 9 图3 9 圆形模板在图像中的不同位置图。2 2 图3 1 03 7 个像素的模板2 2 图3 1 1 各种图像分割算子的比较2 3 图4 1 两组o 到9 的目标图像样本。3 8 图4 2 一个样本在g a b o r 变换下面的示例3 9 图5 1 基于神经网络的图像识别技术的训练过程。4 l 图5 2 基于神经网络的图像识别技术的识别过程。4 2 图5 3 图5 4 图5 5 多层前馈型网络示意图 训练的误差性能曲线 识别判决结果 v 4 3 。5 0 。5 l 表目录 表目录 表4 一l 两组0 到9 图像样本的矩变换特征3 8 表4 _ 2 一组o 到9 图像样本的g a b o r 小波变换特征3 9 表5 1 三个基于不同特征的神经网络模型识别率比较5 1 表5 2 三个基于不同特征的神经网络模型各样本识别率比较5 l 表5 j 三个基于不同特征的神经网络模型训练收敛时间比较5 l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 美虹日期:呻年月f 阳 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:导师签 日期: 第一章引言 1 1 图像识别研究的意义 第一章引言 模式识别诞生于2 0 世纪2 0 年代。随着计算机的出现和人工智能的兴起,模 式识别在2 0 世纪6 0 年代迅速发展成为一门学科。它利用计算机和光学传感器来 识别计算机“看到”的图像信息,模拟人类的视觉;利用计算机和声学传感器来 识别计算机“听到”的音频信息,模拟人类的听觉;利用计算机和压力、温度、 气体,生物等传感器来识别获取到的各种信息,模拟人类的触觉、嗅觉和味觉。 在这些人类感官模拟中,基于视觉的图像识别则具有特别重大的意义。 视觉是人的一个非常重要的器官,它可以为人提供物体的形状、大小、位置 等具体空间位置信息,这是其他感官所不能取代的。以至于一个人在失去触觉, 嗅觉和听觉还可以做很多事情,而没有视觉就举步维艰。从信息量的角度来看, 在人类接受的感官信息中,视觉信息约占6 0 ,听觉信息约占2 0 ,其他如味觉、 触觉和嗅觉等加起来不过约占2 0 。由此可见视觉是人们获取外部信息最为重要 的手段。图像作为视觉在客观世界感知所获得信息量的客观表现,其客观表现就 是人视觉获得的信息。 从信息量的角度来看,图像包括的信息量也最大,内容最广泛,涉及到各种 各样的物体。图像识别所研究的是如何根据计算机通过对图像所提供的特征信息 的分析将图像中的一个或多个客体目标自动辨别出来。这正是对图像所表示场景 信息进一步分析所要具备的基础。它研究的理论和方法在很多科学和技术领域中 得到了广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。 1 2 图像识别的发展和现状 图像识别的发展经历了三个阶段:文字识别、图像处理与识别和物体识别。 文字识别开始于1 9 5 0 年左右,一般是识别数字、字母和各种符号。今天,从 印刷文字识别,到手写体联机识别或脱机识别,发展迅速,许多识别技术已经进 入实用阶段。 图像处理和识别的研究,始于1 9 6 5 年。过去主要是利用照相技术和光学技术 电子科技大学硕士学位论文 处理图像。现在,伴随着计算机技术的发展,图像处理技术已经从模拟时代跃入 数字时代。由于数字图像处理不但可以消除图像的失真、噪声,还可以对图像增 强和复原,因此,数字图像识别技术得到了有力的支持。再借助计算机处理、判 读、解析与识别,图像识别技术迅速发展。 物体识别建立在数字图像识别技术之上,主要指对客观世界的客体( 如三维 世界) 的感知和认识,属于计算机视觉范畴。它结合了人工智能、信息科学、计 算机科学等学科,其研究被广泛应用在各种工业中,成为了图像识别方向一个重 要的研究方向。 图像识别广泛应用于机械、冶金、勘探、农业、林业、渔业、天文气象、医 务、邮电、交通、公司、财务等领域。在军事安全领域,党的十六大中,由我国 自主研制的“面像检测与识别核心技术”的应用就是一个典型的例子。通过面部 识别技术,计算机快速进行身份识别,有效的提高了安全系数。在医学领域,图 像识别可以提高病情检测的速率和正确率,也是正确合理治疗的保证。在机械领 域,图像识别技术可以帮助工人检测物品的损坏、分类等,在一定程度上扩展了 人的能力。在林业领域,利用识别技术判断火灾的发生,是图像识别技术在火灾 探测报警中的应用。 到今天,图像识别技术已经得到广泛重视,世界各国已经研制成多种多样的 自动识别机和视觉机器人。在现实生产生活中图像识别的研究成果也与普通百姓 的生活相结合。比如说:文字识别,指纹识别,车牌识别,印章识别等等。它们 都在不断的方便我们的生活。通过对各个图像识别技术应用的简介,可以看出从 理论和应用角度来看图像识别都是一个值得去研究的课题。 1 3 本课题基本任务和贡献 许多图像识别技术的研究已经进入高潮,比如说汉字识别。但是,大多数识 别技术的自适应性能比较差,鲁棒性能也不够好。当待识别的物体被噪声污染, 或者畸变( 平移、伸缩或旋转等) 等情况下,识别技术的性能将大大下降。同时, 不同应用领域的图像识别技术对于非本领域的识别问题不能发挥令人满意的作 用,部分原因是由于模式识别技术本身的缺点所限制,比如说汉字识别技术其应 用于分类判别的特征可能是建立在汉字独有的特征上面的。因此,它就不能应用 于待识别目标所不具备汉字本身独有特征的车体识别。因此,在识别技术已经比 较成熟,甚至实用化的今天,如何加强图像识别技术的适应性和鲁棒性甚至通用 2 第一章引言 性就成为了研究图像识别的一个热点问题。 针对如何加强图像识别技术的适应性和鲁棒性乃至通用性,本文对传统的图 像识别方式进行分析和对比。通过对传统方法的优缺点比较,选择了待识别目标 图像的边缘关键特征为主要目标,避免了采用目标图像的特殊特征带来的局限性。 再采用了具有与人类视觉基元相似的性质g a b o r 小波多通道滤波器作为特征采集 手段,结合不变矩变换分别提取待识别目标的局部特征和全局特征,并保留这两 种特征优点的情况下对其融合产生新的优化特征,再采用了模拟生理学上的真实 人脑神经网络的结构和功能的入工神经网络进行判别分类。本文对提出的基于 g a b o r 小波变换和矩变换的神经网络图像识别技术进行试探性研究,并对实现的仿 真结果进行分析。 本文的章节安排如下:第一章为引言,介绍了图像识别技术的发展和存在的 问题。第二章为图像识别原理简介,从图像识别的过程出发对图像识别作一个整 体的介绍。从第三章开始,本文按照第二章介绍的图像识别的过程给出详细的解 决方法。第三章为图像处理,介绍和对比了图像处理的三大类技术的常见方法, 并提出了一种改进的自适应中值滤波器。图像处理的作用是把原始图像转化成像 元图像。第四章为图像特征提取,本文提出了一种融合了g a b o r 小波变换提取的 局部特征和不变矩变换提取的全局特征的自适应和鲁棒性更好的优化特征。特征 提取的作用是把像元图像转变成特征图像。第五章基于g a b o r 小波和矩特征的神 经网络图像识别技术,建立了人工神经网络的分类器,并利于第四章提取的融合 优化特征进行分类器的训练和待识别目标的判决。最后对本文提出的新技术进行 了实验和讨论。第六章为结论与展望。本文的重点在第三、四、五章。 3 电子科技大学硕士学位论文 2 1 图像识别过程 第二章图像识别原理简介 图像识别的基本任务是通过对待识别目标图像进行分析,最后把图像中的目 标识别出来。为了完成这个任务,主要通过以下4 个步骤【l 】: 1 图像预处理 首先需要对获取的图像进行图像预处理,滤去噪声和干扰。此外,当图像信 息微弱不适合辨识时候,还需要对图像进行增强,消除畸变,灰度调整等。总之, 消除无关特性而加强对目标图像感兴趣的特征,以利于人机分析。 2 图像分割 当图像包含多个物体时候,为了找出待识别目标,需要对图像进行分割,将 其分为多个且每个只包含一个目标的区域。图像分割有利于分离和定位待识别物 体。 3 图像特征提取 待识别目标物体被分割出来以后,接着提取需要的某种特征,计算其模型库 的特性。然后根据不同情况采取合理的描述算子对其进行描述,建立其特征库。 4 图像分类 根据图像提取到的特征值,利用模式识别的方法进行分类判决,确定类别名 称,得到识别结果。识别结果是一种机器对图像信息的一种理解和解释。 图像识别的主要步骤可见图2 1 : 图2 一l 图像识别的主要步骤 其中图像预处理和图像分割两部分又可以合称为图像处理,图像特征提取与 图像分类两部分又可以合称为图像识别部分。本文着重讨论图像识别技术部分, 所以把图像预处理和图像分割部分合为一章图像处理进行研究和讨论。而图 像特征提取和图像分类两个图像识别的关键部分,依然分为两个章节进行研究和 4 第二章图像识别原理 讨论。 2 2 数字图像处理 图像经过采样,量化以后可以用一个二维的数组, ,y ) 来表示。连续的图像 在坐标空间。耵和性质空间f 都离散化成为可利用计算机表达的数字图像。每一个 采样单元叫做一个像素。x 和y 分别代表数字图像的行和列,是像素值。 二维数字图像存储格式有很多种,比如说单色图像、灰度图像、伪彩色图像、 2 4 位真彩色图像等等。灰度图像( 又称为灰度图) 是指只含有亮度信息,没有色 彩信息的图像。要表示灰度图,需要把亮度值进行量化,通常8 b i t 位图的灰度级 分为0 2 5 5 共2 5 6 个级别,0 最暗( 全黑) ,2 5 5 最亮( 全白) 。灰度图的处理比较 方便,图像处理一般采用灰度图。 由于数字图像在计算机里面的存储方式,我们可以把它看作是一个二维矩阵, 直接对其进行处理,比如说加、减、卷积等。这种对图像像素直接处理的方法称 为空域法。同时,由于数字图像是二维信号,它的另外一种处理方式和二维数字 信号处理的办法类似。即通过把,似y ) 变换到频域f 以v ) ,再对频域信号f 0 ,v ) 进 行处理,最著名的方法是傅立叶变换。这种方法称为频域法。 依据功能和目的的不同,数字图像处理的技术通常分为以下几类: 1 图像增强 目的在于使图像的视觉效果更好和更能够有利于后期的进一步处理。鉴于不同 的图像用途,更好和更有利都是没有一个客观的评价标准的。 2 图像复原 将图像退化过程模型化,通过对退化过程的把握,采用相反的图像变换方法, 获取其原始图像。 3 图像重建 指根据对场景的投影数据获取场景中的物质分布的信息。再通过这些信息重建 目标图像的技术。 4 图像变换 为了有效和快速处理数字图像,常需要将空域图像转换到频域,再进行处理和 加工。这些转换技术就称为图像变换技术。 5 图像编码 图像处理除了改善图像的视觉效果以外,在保证一定视觉质量的同时减少数据 5 电子科技大学硕士学位论文 量也是其中一个重要的技术。通过压缩,图像更有利于存储、处理和传输。 6 图像水印 对图像加入水印可看作一种特殊的图像处理过程,它将水印编入了图像。其重 要用途之一就是保护图像产品的舨权。 2 3 图像识别技术 图像处理分为低、中、高三个层次【2 l 。低层处理指的是像素层次的处理,在前 一个小节已经介绍。这个层次的目的就是改善图像的质量,其输入是图像,输出 也是图像;中层处理指的是在低层处理基础上给图像中分割处理的基元以特征描 述,即一般而言的“模式识别”,在这个层次中对图像进行特征抽取,然后根据图 形的特征利用识别理论对图像进行分类,并对整个图像作结构上的分析。该层次 的目的是图像分类与描述,其输入是图像,输出是类别和图像的结构分析;高层 处理指的是在中层处理的基础上进行图像的理解,即“计算机视觉”。因此,图像 识别作为中间层次,有着承上启下的作用。 模式识别就是让机器自动识别事物。其研究的内容是利用计算机分类识别物 体,在错误概率最小条件下,使识别结果尽量与客观事实相吻合。常见的模式识 别技术分为三大类【3 】,即模板匹配方法、结构模式识别和统计模式识别。模板匹配 模式识别方法是最简单的模式识别方式,它通过比较待识别模式和已有模式的相 似程度来识别,比如说动态时间规整法( d y n a i i l i ct i 啪w a r p i n g ,d t w ) 。结构模 式识别,用模式的基本组成元素( 基元) 及其相互间的结构关系对模式进行描述 和识别的方法,比如说使用模式与子模式分层结构的树状信息。在多数情况下, 可以有效地用形式语言理论中的文法表示模式的结构信息,因此也常称为句法模 式识别。统计模式识别是对模式的统计分类方法,即结合统计概率论的贝叶斯决 策系统进行模式识别的技术,又称为决策理论识别方法。其主要方法有:判别函 数法,k 近邻分类法,非线性映射法,特征分析法,主因子分析法等。模式识别技 术不断发展,这三类技术都不断互相渗透和融合。 目前主要的识别方法有近邻匹配法、支持向量机、遗传算法、模糊识别方法、 人工神经网络等i j j i 卅。 近邻法( n e 缸e s tn e i g h b o r ) 是一种非参数模式识别方法,直接对被识别样本某 个给定近邻域中的已知类别的学习样本数量进行统计,并以其中数量最多的那 类作为分类结果的分类方法。计算及存储量巨大是该方法最主要的缺点。同时该 6 第二章图像识别原理 算法对原始数据的容错能力不强,尤其当原始数据中包含过多噪声或异常样本即 各不同类别样本互相交错混杂有明显的统计分布规律时,聚类结果很难令人满意。 因此错判率较高。 支持向量机( s u p p o n 斌叫m a c h i n e s ) 是统计学习理论的发展的产物,针对 有限样本情况,它提供了套完整的、规范的基于统计的机器学习理论和方法。 一个重要特点是可以不需要依赖于设计者的经验知识和先验知识。该方法较好地 解决了适应性能差、算法复杂、对样本数过于依赖和局部最小点等问题,但从理 论到应用还存在一些尚未解决的问题,比如训练速度馒、计算资源需求大等缺点。 遗传算法( g 锄e t i ca 1 9 0 r i n 脚) 是一种模拟生物界的进化机制( 适者生存,优 胜劣汰遗传机制) 而来的随机化搜索方法。其主要特点是直接对结构对象进行操 作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能 力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整 搜索方向,不需要确定的规则。其缺点是随着进化的增加,需要很复杂的搜索, 因此运算速度慢。而且收敛于局部极小的较早收敛问题尚未解决。 模糊识别( f u 毖yr e c o 鲥t i o n ) 是将模糊逻辑理论与识别运用相结合的一种方 法。根据人脑对客观事物认识带有模糊性这个特点,利用模糊信息进行模式决策 分类,使计算机或机器带有接近人类的智能。它在统计模式识别和句法模式识别 中有较好的应用,但该方法需要准确的模糊模型、隶属度函数等前提条件,适用 性不是很广泛。 人工神经网络( a n i 6 c i a ln e u r a ln 对啪r k , n n ) 是基于模仿人脑神经网络结 构和功能而建立的一种信息处理系统,具有高度的非线性处理能力,能够进行复 杂的逻辑操作和分类识别。它拥有自学习功能,如实现图像识别功能时,只需先 把图像样本和对应的正确识别结果输入网络。网络就会通过自学习功能,慢慢学 会识别类似的图像。其次,人工神经网络的反馈网络就可以实现联想存储功能。 另外,具有高速寻找优化解的能力。当寻找一个复杂问题的优化解,往往需要很 大的计算量,利用a n n 并行分布处理的特点,可以很快得到优化解。此外,a n n 所有定量或定性的信息都等势分布贮存于网络内的各神经元,故有很强的鲁棒性 和容错性。总的来说,a n n 具有很强的分类决策能力和对不确定信息的描述能力, 但它也有需要较多的训练样本,在非并行处理系统中运算速度慢等缺点。 7 电子科技大学硕士学位论文 3 1 图像处理概论 第三章图像处理 图像处理包含了图像识别过程中的两个部分图像预处理和图像分割。不 论是光传感器、& 堰红外普通摄像机或照相机、雷达等各种成像手段,获取的图 像与客观世界都有一定程度的差异,同时由于采集设备和环境的差异也会给图像 造成主观上的不同。图像处理就是希望通过使用各种方法消除主观因素带来的缺 陷,主观优化图像,找出待识别目标,使新的图像比原始图像更适合于图像分割, 最后通过图像分割把原始图像转化成为像元图像。从而有利于图像识别过程中后 两个部分特征提取和分类的进一步处理,得到与客观世界一致的结果。 图像复原和图像增强是图像处理中的两大类技术。由于通常是作为更进一步 处理的先前步骤,所以通常又称为图像预处理技术。它们彼此之间有密切的联系。 他们相同之处在于希望改进待处理图像的视觉质量。不同之处在于图像复原技术 是认为图像是在如上一段提到的采集等条件下退化或者恶化了,现在根据相应的 退化模型和知识重建或恢复原始图像。图像增强技术则目的在于使图像的视觉效 果更好和更能够有利于后期的进一步处理。鉴于不同的图像用途,更好和更有利 都是没有一个客观的评价标准的。如果说图像复原是一个客观过程,那么图像增 强就是一个主观的过程。 图像分割是由图像处理进入到图像分析的关键步骤。通过图像分割,将原始 图像转化为更抽象和更紧凑的特征形式,使得更高级的分析和理解成为可能。图 像分割算法一般是基于亮度值的两个基本特性之一:不连续性和相似性。第一类 性质的应用途径是基于亮度的不连续变化分割图像,比如图像的边缘。第二类的 主要应用途径是依据事先指定的准则将图像分割为相似的区域。门限处理、区域 生长、区域分离和聚合都是这类方法的实例。 3 2 图像复原 图像复原技术是将图像退化过程模型化,通过对退化过程的把握,采用相反 的图像变换方法,获取其原始图像。由于图像预处理只是图像识别的一个部分, 8 第三章图像处理 本文假设获取的图像主要受脉冲噪声的影响来进行讨论。 3 2 1 图像退化模型 如图3 1 所示,退化过程【2 1 通常可以被模型化为一个退化函数和一个加性噪声 项,处理一幅输入图像,o ,) ,) 产生的一幅退化图像占o ,) ,) 。根据这个模型复原图 像就是要在给定退化图像和退化算法基础上得到,) ,) 的过程。这里假设噪声模 型的统计特性己知。 f ( x ,y ) 图3 1 图像退化的模型 图3 1 中的模型可以由下式表达: 9 0 ,y ) 一 0 ,_ ) ,) 半, ,y ) + ,l o ,y ) ( 3 - 1 ) 其中,j l o ,y ) 是退化函数的空间描述。“木”表示空间卷积。空域的卷积等于 频域上的乘积,故式3 1 也可以转化成等价的频域描述。 在后面,本文假设 ,y ) 是一个使原图像不变的作用因子,因此后面只处理 由噪声引起的退化。 3 2 2 噪声模型 噪声是最常见的退化因素之一,因此也成为了图像复原中重点研究的地方。 通常噪声来源于图像的获取和传输过程中。图像传感器的工作会受环境因素和自 身质量等影响。在传输过程中,图像主要受传输信道的干扰为主。 噪声是一种信号,拥有一切信号所拥有的特征时域特性和频域特性。在 数字图像处理中,由于处理单幅图像,常只考虑噪声的空域特性和频域特性,即 与图像空间坐标的关系。在本文中,本文假设噪声独立于空间坐标,与图像本身 无关联。至于频域特性,则不同的噪声模型不同。 噪声对于图像的直接影响在于图像像素的灰度发生变化,噪声本身的灰度值 可看作随机变量,其分布用概率密度函数( p d f ) 来描述。下面介绍几种常见噪声 以及它们的概率密度函数。 高斯噪声 高斯随机变量z 的p d f 可表示为: 9 电子科技大学硕士学位论文 荆a 了毛e 七卅,2 一 ( 3 - 2 ) 其中z 表示灰度值,表示z 的均值,盯表示z 的标准差。高斯噪声的概率密 度函数见图3 2 。如图所示,高斯噪声灰度值大部分集中在均值附近,其7 0 落在 ( p 一口) ,( p + 盯) 范围内,且有9 5 落在 ( p 一2 仃) ,( + 2 盯) 范围内。 声。 p ( z ) 1 压口 o 6 0 7 ,芴 肛一op 弘+ o z 图3 2 一个高斯噪声的概率密度函数 高斯噪声的产生常见于电子电路噪声和由低照明度或高温度带来的传感器噪 均匀噪声 均匀噪声的p d f 可表示为: p ;奄阳 p 0 ) 1 6 一口 口萋斧 ( 3 - 3 ) 图3 3 一个均匀噪声的概率密度函数 均匀噪声p d f 的均值和方差分别是: 暑( 4 + 6 ) 2 ( 3 4 ) 盯2 = p 一口) 2 1 2 ( 3 巧) 图3 3 是它的概率密度函数。均匀噪声灰度值的分布在一定范围内是均匀的。 均匀密度噪声在实践中相对其他噪声模型使用的少,但是作为模拟随机数发 生器或者高斯噪声是非常有用的。 脉冲噪声( 椒盐噪声) 1 0 第三章图像处理 脉冲噪声的p d f 可表示为: f 只扣4 p ( z ) ; 五 z - 6 ( 3 6 ) 10其他 脉冲噪声有正的也有负的。脉冲噪声对图像的影响强度常比较大。因此,总 是习惯对其数字化为最大灰度或最小灰度值。如果6 ,4 ,灰度值6 在图像中显示 为白点,而灰度值4 显示为黑点。若只或咒为0 ,则脉冲噪声称为单极性脉冲噪声。 如果e 和己都不为o ,尤其是它们大小相近时候,脉冲噪声将类似于随机分布在图 像上面的胡椒和盐粉微粒。因此,也称双极性脉冲噪声为椒盐噪声。椒对应黑色 负脉冲响应,而盐对应白色正脉冲响应。在8 b i t 图像中,4 。0 ( 黑) 和 6 - 2 5 5 ( 白) 。图3 4 显示了脉冲噪声的概率密度函数。 p 0 ) 咒 图3 4 一个脉冲噪声的概率密度函数 脉冲噪声常见于成像环境突变的情况下,比如说错误的开关操作。 3 2 3 空域滤波复原 当不考虑退化函数h 的影响来消除各种噪声时,常用的两大类方法,分别是 空域法和频域法。空域是指图像平面本身,空域法即是指直接对图像的像素直接 处理。频域滤波主要用于消除周期噪声。当仅有加性噪声存在时,空间滤波法效 果比较理想,同时前人已经研发出来很多简单有效的方法。 算术均值滤波器 这是一种的线性滤波技术,拥有不错的抑制噪声的性能。在二维情况下,算 术均值滤波器是一个尺寸为肌玎的矩形图像窗口,通常m 一 为正方形窗口。算术 均值滤波的过程就是计算窗口领域中所有像素的平均值。而窗口正中心( x ,y ) 点的 图像灰度值由这个平均值替换。算术均值滤波简单的平滑了图像的局部变化,在 模糊图像细节的同时消除了噪声。 l l 电子科技大学硕士学位论文 中值滤波器 中值滤波器( m n 是最著名和常用的顺序统计滤波器。其原理类似算术均值滤 波器,不过是用窗口中所有像素的灰度中值来代替该像素的值。它应用普遍,对 于大多数随机噪声,都有良好的去噪能力。且因为中值滤波不影响阶跃函数和斜 坡函数,因此在相同尺寸下比起线性平滑滤波器引起的模糊要少。中值滤波器尤 其对单极或双极脉冲噪声( 椒盐噪声) 非常有效。它是一种非线性滤波器。 自适应中值滤波器 中值滤波器只要在脉冲噪声的空间密度不大( 根据经验灰度值较低的椒盐噪 声概率e 和灰度值较高的椒盐噪声概率咒小于o 2 ) 时滤波效果是不错的。由于中 值滤波器总是不可避免的丢失图像细节和边缘,当在概率更大的噪声面前,这种 缺陷更为明显。有效的滤除噪声和良好的边缘细节保护成为了一个矛盾。为了进 一步消除中值滤波器的缺点,自适应中值滤波器0 m f ) 出现了1 5 1 。它的滤波方式和 传统的中值滤波器一样,都使用一个矩形区域的窗口最,。不同之处是在滤波过程 中,自适应中值滤波器会根据一定的设定条件改变滤窗最,的大小。这样,用滤波 器的输出值来代替滤窗中心的坐标象素值。因此,在细节完整性和细节的保护上, 它的滤波性能相比于传统的中值滤波器更好。 定义如下: z 。是在最,滤窗中灰度的最小值 z 一是在最。,滤窗中灰度的最大值只, z 。是在足,滤窗中灰度的中值最, 乙,是在坐标g ,y ) 处的灰度值 s 一指定,所允许的最大值是, 自适应中值滤波器算法由两部分组成,称为第一层( k v e l a ) 和第二层( l 胛d b ) 。算法如下: l e v e l 彳4 - z 。一z m ( 3 7 ) 4 一z _ 一z 一 ( 3 8 ) 如果4 ,o 且4c o ,转到k v e l b 否则增大滤波器窗口尺寸 如滤波器窗口尺寸s 一,重复k v e l 彳 否则输出z 。 l e v e l b 日毒z 埘一z 曲 ( 3 - 9 ) 易* 乙,一z 。 ( 3 - 1 0 ) 第三章图像处理 如果旦,o 且垦t o ,输出z , 否则输出z 。 每一次算法输出一个值,窗口最,就移到另外一个像素点。然后算法在新像素 点重新开始应用。a m f 能够对于各种噪声密度都取得不错的消噪能力。不同情况 下,需要改变最大滤波器窗口的允许尺寸。一种获取合适的j 址伍最大滤波窗口的 方法是使用不同的均值滤波器来试验获得。 a m f 滤波方式具有3 个特点:一是消除了椒盐噪声;二是对其他非脉冲类噪 声起到了平滑作用;三是降低了普通中值滤波所造成的图像失真,比如物体边缘 的过薄或过厚现象。该算法中的z 。、z 。就认为是脉冲噪声分量,这样即使它们 可能不是图像中象素的最低值或最高值也给以取除。 图3 5 三种滤波器的比较 由于a m f 的算法基于可以变化的窗口,在实验中分别采用了5 5 和7 7 的滤 波窗口来比较三种滤波器的去噪声能力。实验明显表现出a m 咿的去噪声和保护细 节的能力。变化窗口的范围越大,a m f 的效果越好。在图3 5 中比较了三种算法 对于被1 0 椒盐噪声( 只一只一o 0 5 ) 污染的图像经用5 5 滤波窗口的各种滤波器复 原以后的图像。五幅图片分别是( a ) 【加a 图像,( b ) 由1 0 椒盐噪声污染的k m 电子科技大学硕士学位论文 图像,( c ) 用5 5 滤波窗口大小的算术中值滤波器滤波的结果,( d ) 用5 5 滤波 窗口大小的m f 滤波的结果,( e ) 用最大滤波窗口尺寸5 x 5 的a m f 滤波的结果。 可以看出算术中值滤波器对于椒盐噪声没有起到良好的作用。m f 比算术中值滤波 器效果好了很多,几乎滤除了全部的脉冲噪声。但是相比于a m f ,m f 的细节损 失比较严重。总的来说,中值滤波器能够成功地降低脉冲噪声,缺点是使图像模 糊。当噪声持续增大时候,m f 的降噪和细节保护能力都持续下降。从这个实验中, 可以看出a m 咿在消除脉冲噪声和保持边缘细节上相对于传统滤波器的优势。 3 2 4 自适应门限中值滤波器 在实际的应用中,图像常常被多层脉冲( 即脉冲噪声灰度值不总是最大值和 最小值) 噪声污染。经过实验证明,对于低噪声密度的多层脉冲噪声a m f 有不错 的性能,比如说脉冲密度小于1 0 。当噪声密度上升到2 0 、3 0 甚至更大时候, 址伍就不能展现出证人满意的去噪性能。继续加大最大滤波器窗口的尺寸是一个 可行的方法,但是滤波器窗口增大就会更多的损失图像细节。而且,由于w f 是 并行处理算法,a m f 在考虑到像素之间关系上面相对薄弱。这一点,在对付普通 脉冲噪声上面也是一个不足。 扩展自适应中值滤波器( e a m f ) 1 6 1 论文提到了脉冲噪声灰度值不常常是最大值 和最小值。噪声值可能小于最大值或大于最小值。因此,在b 蝴f 算法中,滤波 器把接近灰度最大值或最小值的像素值抛弃,然后再寻找滤波器窗口里面的中值。 因此,b 址仃能够在保持细节的同时,消除拥有一定灰度值变化范围的脉冲噪声。 在某些实验情况中,发现b w f 并不能提供比讧f 明显的效果提升。因此, 基于噪声灰度值可能为动态的情况嘲【7 l 修改a m f ,再参考检测拥有随机灰度值的 脉冲噪声机理【8 1 【9 l ,两个动态门限z 和l 被加入到m f 。它们定义如下: 五o ,y ) - z _ 2 一x n ( 3 一1 1 ) 乏0 ,y ) tx 一一k ,: ( 3 - 1 2 ) 其中x 。是在初始化窗口中的最小灰度值,:是窗口中的次最小灰度值, z 一是窗口中最大灰度值和z 。:是次最大灰度值。接着,调整a m f 判决准则: 4 - z “一z 。一薯 ( 3 - 1 3 ) 4 一z “一z 一+ 互 ( 3 1 4 ) b - 互,一z 。一五 ( 3 - 1 5 ) 岛t z 。一z + 瓦 ( 3 1 6 ) 1 4 第三章图像处理 但是,实际应用中,多层噪声常不意味着只有两层,比如说灰度值2 5 5 ,2 3 3 , 3 和0 。如果图像被更多层噪声感染,由公式3 1 1 和3 1 2 获得的动态门限王和瓦并不 总是合适的。因此,我们提出了一种新的算法白适应门限中值滤波器c a d 【1 0 l 来 处理这些复杂的环境。 a f 的检测准则如下: 1 初始化:矢量畴储以坐标o ,d 为中心的滤波窗口内像素灰度值,并初始化所有 的元素p ( f ) 一o 。矢量元素个数矿- k x 置分别为9 ,2 5 或4 9 ,相应于窗口尺寸足值 3 ,5 或7 。与此同时,初始化王- 疋- o 。 2 循环: a ) 定义元素即一时2 + 9 的灰度值为窗口& ,中心的待处理像素,坐标值为o ,y ) a 其它的元素值踯- k x j + f ) 初始化如下: p o ) - z 1 ,l x 一( k 一1 2 f j + ( k 一1 ) 仁) ,一( k 一1 ) 尼,y + ( k 一1 犯 ( 3 1 7 ) b ) 重新调整矢量p 内部元素的位置:将所有像素值的最小值存储在p ( 0 ) ,然 后从小到大,最大值存储在p 加) ,其中一等于肌 c ) 获取互。因为五作用z 。,分析从最小值p ( 0 ) 到最大值。 m 循环: 1 ) 获取见。q 和6 是两个相比较元素的序列号。初始化。一o ,6 - h ) 见j 是元素尸0 ) 和尸( 6 ) 的差。如果d 。- o ,转到2 ) 如果见。一l ,转到3 ) ,如果 d i 。乃,转到5 ) 2 ) 如果d 4 。瓦,转到6 ) 3 ) 如果见。五,转到6 ) 4 ) 如果6 - r ,五一d ,终止循环d ) ,其中d - 。否则n t n + 1 ,6 - 6 + 1 ,返回到1 ) 。 5 ) 五- d 一1 ,终止循环d ) ,其中d 一 6 ) 王一d 一1 ,终止循环d ) ,其中d - d 如。 c ) 获取毛。处理过程类似五。只是由于五作用z 。,算法会有一些变化。分析过 程从最大值p 伽) 开始往最小值分析。初始化值n - 一,6 - n l 。在步骤4 ) 中,在 转到1 ) 之前,让4 t 4 1 ,6 - 6 一h 3 获取五和正后,程序结束。 在上面算法中,疋用来判断待处理像素在图像局部区域内是否被噪声污染。 可以通过观察待处理图像的直方图大致获取它的取值范围。在实时处理中,经过 实验,它可以被初始化为5 到2 0 的值。r - 形只由噪声密度只决定。在步骤5 ) 和6 ) 中,为了避免消除被当作未污染像素的p p ) 或p p + 1 ) ,所以王t d 一1 或艺- d 一1 。 电子科技大学硕士学位论文 在4 ) 里面,因为算法无法通过t 判断出尸( 6 ) 是否是噪声,所以王- d 。 对于大多数图像,图像值大部分分布在直方图中心的两边,小部分值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论