毕业设计(论文)-基于Retinex的图像增强算法研究.doc_第1页
毕业设计(论文)-基于Retinex的图像增强算法研究.doc_第2页
毕业设计(论文)-基于Retinex的图像增强算法研究.doc_第3页
毕业设计(论文)-基于Retinex的图像增强算法研究.doc_第4页
毕业设计(论文)-基于Retinex的图像增强算法研究.doc_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文基于Retinex理论的图像增强算法研究分类号 密级 UDC注1 学 位 论 文基于Retinex理论的图像增强算法研究(题名和副题名)陈 雾(作者姓名)指导教师姓名 任明武 申请学位级别 硕士 专业名称 模式识别与智能系统 论文提交日期 论文答辩日期 学位授予单位和日期 答辩委员会主席 评阅人 年 月 日注1:注明国际十进分类法UDC的类号。 54声 明本学位论文是我在导师的指导下取得的研究成果,尽我所知,在本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均已在论文中作了明确的说明。研究生签名: 年 月 日 学位论文使用授权声明南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对于保密论文,按保密的有关规定和程序处理。研究生签名: 年 月 日 摘 要Retinex是一种建立在科学实验和科学分析基础上的图像增强理论,其实质就是从图像中抛开照射分量的影响来获得物体的反射分量,即获得物体本来的面貌。与其它图像增强方法相比,Retinex算法具有锐化、颜色恒常性、动态范围压缩大、色彩保真度高等特点。故本文对该理论进行了重点研究。本文分析了几种常规的图像增强方法的优缺点;在颜色恒常性理论的基础上研究了全局和局部Retinex算法;对全局Retinex算法引入了两种改进方法;详细地分析了局部Retinex算法和同态滤波之间的相关性;并对在局部Retinex算法中使用的高斯模板的大小和高斯函数的方差之间的关系进行了研究;实验过程合理地分析和使用了几个有效的图像增强的评价指标。最后,本文在分析全局和局部Retinex算法的基础上,提出了一种将两者联合的Retinex方法。通过实验分析,该联合的Retienx算法在对比度和熵方面基本达到了局部Retinex算法的水平,且在亮度方面更是优于局部Retinex算法。关键词 Retinex,同态滤波,颜色恒常性,动态范围压缩,信息熵AbstractThe Retinex is one kind of image enhancement theory and it eatablished at the scientific experiment and the scientific analysis. It essence is to skinningthe illumination in the original image and to yield the reflectance image, that is, the original appearance of the object. Compares with conventional enhancement methods, the Retinex has shown itself to be a very versatile automatic method and can simultaneously provide sharpening, color constancy, dynamic range compression and color rendition.This thesis first discussed several basic image enhancement methods, and analyzed the shortcomings of them. Then the global and local Retinex algorithms were investigated in detail. This thesis made two modifications to the global Retinex algorithm to get good results. It discussed the relation between the local Retinex algorithm and homomorphic filtering. Afterwards it pointed out the Gaussian filter radius should be three times of the standard deviation. During the experiment, several effective parameters for image enhancement appraisal have been analyzed.Finally, this thesis proposed a combined Retinex method integrated the global and local aspects. The experiment had proven the combined method proposed in this thesis can reach the same level with the local Retinex at contrast and the entropy aspect, but can be more brighter than the local Retinex.Keywords: Retinex, Homomorphic Filtering, Color Constancy, Dynamic Range Compression, Entropy目 录摘 要IAbstractII目 录III图表目录V1绪论11.1 问题的提出11.2 研究现状及问题21.3 本文的研究工作21.4 本文各章内容安排32图像增强方法概述42.1 线性变换和分段线性变换42.1.1线性变换42.1.2分段线性变换52.2 图像边缘增强62.3 直方图均衡化62.4 直方图规定化92.5 同态滤波93基于全局特征的Retinex图像增强123.1 颜色恒常性与Retinex理论123.1.1 颜色恒常性123.1.2 Land的Retinex理论123.1.3 Retinex理论的发展123.2 基于全局特征的Retinex算法分析133.2.1 灰度图像增强133.2.2 彩色图像增强163.3 算法流程173.4 增强结果显示173.5 对基于全局特征的Retinex算法的两个改进183.5.1 直方图截取的线性拉伸183.5.2 自适应线性拉伸203.6 实验与结果分析213.7 小结264基于局部特征的Retinex图像增强284.1 局部Retinex 的实质284.2 局部Retinex算法步骤294.3 局部Retinex与同态滤波的关系294.4 局部Retinex算法分析304.4.1 单尺度Retinex304.4.2 多尺度Retinex(MSR)334.4.3 带色彩恢复的多尺度Retinex(MSRCR)344.5 一种局部与全局相联合的Retinex算法354.5.1 算法思想介绍354.5.2 算法流程介绍364.6 实验图像比较及结果分析374.6.1 图像质量评估374.6.2 试验结果分析434.7 小结445总结与展望45致 谢46参考文献47附录A 实验图像50A.1 灰度图像50A.2 彩色图像51图表目录图 三段式线性变换5图 分段线性变换5图 2.2.1 拉普拉斯算法33模板6图 2.2.2 拉普拉斯锐化6图 2.3.1 直方图均衡化例一7图 2.3.2 直方图均衡化例二8图 2.5.1 同态滤波流程图9图 2.5.2 同态滤波函数的剖面图10图 2.5.3 同态滤波例一11图 2.5.4 同态滤波例二11图 mn的灰度图像14图 3.4.1 全局Retinex增强18图 图像的直方图19图 图像的累积分布函数20图 3.6.1 主观质量评价尺度21图 3.6.2 灰度scene 全局Retinex增强23图 3.6.3 灰度girl全局Retinex增强23图 3.6.4 彩色scene全局Retinex增强24图 3.6.5 彩色girl全局Retinex增强24图 4.1.1 Retinex框架图28图 高斯分布31图 不同的高斯分布32图 girl图像经典Retinex增强结果图38图 girl图像(全局局部)Retinex增强结果图38图 scene图像经典Retinex增强结果图39图 scene图像(全局局部)Retinex增强结果图39图 yellowsand图像经典Retinex增强结果图40图 yellowsand图像(全局局部)Retinex增强结果图40图 增强图像的亮度趋势图41图 增强图像的对比度趋势图42图 增强图像的信息熵趋势图43表格 3.6.1 增强图像的对比度25表格 3.6.2 增强图像的信息熵26表格 增强图像的亮度41表格 增强图像的对比度42表格 增强图像的信息熵431 绪论1.1 问题的提出一般情况下,在各类图像系统中图像的传送和转换(如成像、复制、扫描、传输以及显示等)总要在一定程度上造成图像质量的降低。例如摄像时,由于光学系统失真、相对运动、大气湍流等都会使图像模糊;再如传输过程中,噪声污染图像,使人观察起来不满意,或者使计算机从中提取的信息减少甚至造成错误。因此,必须对降质图像进行改善处理。图像增强不考虑图像降质的原因,只是按特定的需要突出一幅图像中的某些信息,同时,削减或去除某些不需要处理的信息。其主要目的是使图像更适合于人的视觉特性或计算机识别系统。从图像质量评价观点来看,图像增强技术主要目的是提高图像可辨识度。它不是以图像保真度为原则,而是通过处理设法有选择地突出便于人或机器分析的某些感兴趣的信息,抑制一些无用的信息,以提高图像的使用价值,即图像增强处理只是增强了对某些信息的辨别能力1。Retinex图像增强算法是一种建立在科学实验和科学分析基础上的图像增强理论,其实质就是从图像中抛开照射光的影响来获得物体的反射性质,即获得物体本来的面貌。与其它图像增强方法相比,Retinex算法具有锐化、颜色恒常性、动态范围压缩大、色彩保真度高等特点。虽然传统的色彩理论能够很好地解释很多与色彩有关地现象,并在实际生活中有着非常广泛地应用。然而美国物理学家Edwin Land在20世纪50年代发现有些现象是传统的色彩理论无法解释的,经过近20多年的科学实验和分析,Land认为在视觉信息的传导过程中人类的视觉系统对信息进行了某种处理,去除了光源强度和照射不均匀等一系列不确定的因素,而只保留了反映物体本质特征的信息,如反射系数等2。当这些描述物体本质特征的相关信息传递到大脑皮层后,经过更为复杂的信息处理,才最终形成人的视觉。基于这样的认识,1977年Edwin Land首次提出了一种被称为Retinex的色彩理论,Retinex这个词本身就是由视网膜Retina和大脑皮层Cortex两个词组合构成的。Retinex理论主要包含了两个方面的内容:物体的颜色是由物体对长波、中波和短波光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩不受光照非均性的影响,具有一致性2。尽管Retinex理论能够很好地解释某些视觉现象并已经被大量地科学实验所证实,但由于种种原因,他的理论一直没有得到广泛的传播和接受,直到20世纪80年代初期美国宇航局下属的一个研究机构(Nasas Langley Research Center)将Retinex理论用于处理航空器拍摄的外太空图片且获得了非常好的处理效果后,人们才重新认识到它的科学性和合理性,并开始应用于数字图像处理领域2。1.2 研究现状及问题最早的Retinex算法是1971年Land和McCann提出的任意路径算法(random walk),这是一个时间离散的随机过程算法,即下一个像素位置的选择是从当前像素周围的邻域中随机挑选出来的。其最主要的缺点就是计算量较大3。随后,Jobson等人提出了基于同态滤波(Homomorphic Filtering)的Retinex算法。该算法认为反射系数图像对应着原图像中的锐化细节,而光照图像则被认为是空间平滑的,将原图像的低通滤波作为照射光的合理预测。低通滤波通常是将原图像与大的高斯核做卷积得到的3。1985年,Blake等人提出了基于泊松方程(Poisson Equation Solution)的Retinex算法。该算法以Land提出的Mondrian模型为基础3。1999年,Funt等人在泊松方程Retinex算法的基础上做出改进,提出了重复的多解决方案的非线性滤波Retinex方法3。近年来Retinex的应用范围越来越广泛,人们对它的研究也逐渐深入。比如,D.J.Jobson,G.A.Woodell将这种理论运用到彩色图像增强领域,取得了非常好的效果2。还有很多科学家将它用于图像预处理,以便为后续处理提供对比度高、色彩逼真的图像。通过与其它增强方法相比,Retinex方法具有非常明显的图像增强效果。它具有锐化、颜色恒常、颜色高保真等特性,而很多其它的图像增强算法通常只具有其中的一种或几种特性,不是全部4。目前很多国外的从事图像研究的科学家正致力于这一块的研究,但在中国,对这一领域的研究还是非常少的。通过与其他图像增强方法相比,Retinex方法具有非常明显的图像增强效果。但是,这种方法的运算量比较大,需要在实际应用中进一步优化和完善。1.3 本文的研究工作本文主要是研究基于Retinex理论的图像增强算法,通过与其它图像增强方法相比,讨论Retinex理论的先进性和独特性。主要工作内容如下:1. 对Retinex理论进行深入研究,包括基于全局特征的Retinex算法和基于局部特征的Retinex算法。2. 实现基于全局特征的Retinex增强算法,并对全局Retinex算法中的线性拉伸部分做了改进,引入两种线性拉伸改进方法。3. 实现基于局部特征的Retinex增强算法。4. 在全局Retinex算法和局部Retinex算法的基础上,提出一种将两者联合的Retinex算法。5. 选用几个图像增强质量的客观评价指标,并将这几个指标用于检测采用Retinex理论增强后的图像中,通过多组实验,分析全局Retinex算法,局部Retinex算法和本文提出的联合的Retinex算法的优劣性。 1.4 本文各章内容安排第一章 绪论,介绍了关于Retinex图像增强理论的研究背景,目前的研究内容以及研究方法及本文研究工作中所要解决的问题,最后介绍了本文的主要任务及各章内容安排。第二章 图像增强基本方法概述,详细分析了线性变换和分段线性变换、图像边缘增强、直方图均衡化、直方图规定化和同态滤波等方法,分析各种方法的优缺点。第三章 分析全局Retinex理论的基本思想,实现基于全局特征的Retinex图像增强算法,并对全局Retinex算法中的线性拉伸部分进行改进,引入两种改进方法。第四章 实现基于局部特征的Retinex图像增强算法,分析局部Retinex算法和同态滤波之间的关系;对在局部Retinex算法中使用的高斯模板的大小和高斯函数的方差之间的关系进行研究;在全局和局部Retinex算法的基础上,提出一种将全局和局部相联合的Retinex算法。选取几个图像质量客观评价指标,通过实验分析全局Retinex算法、局部Retinex算法和本文提出的联合Retinex算法的优劣性。第五章 对全文进行总结,并对今后的研究方向进行展望。2 图像增强方法概述图像增强是一个相对的概念,增强效果的好坏,除与算法本身的优劣有一定的关系外,还与图像的数据特征有直接关系,同时由于评价图像质量的优劣往往凭观测者的主观而定,没有通用的定量标准,因此增强技术大多属于面向问题,增强方法只能有选择地使用5。目前,图像增强的方法基本上可以分为空间域处理和频域处理两大类。空间域(spatial domain)处理是在原图像上直接进行数据运算。它又分为两类,一类是在与像素点邻域有关的空间域进行,称为局部运算,例如空间域卷积运算。另一类是对图像做逐点运算,称为点运算。处理可以是线性或非线性的,例如用指数、对数、比值、黑白到彩色的变化等。空间域法的图像增强技术可描述为,其中是处理前的图像,表示处理后的图像,为空间运算函数,它是作用在上的一个算子5。频域(frequency domain)处理主要是通过某种变换(如傅立叶变换、余弦变换、小波变换等),将图像变换到频域,对图像的变化系数值进行运算,即作某种修正,然后通过逆变换得到增强后的图像。它主要包括低通和高通滤波,低通滤波用来消除噪声,高通滤波用来提升边缘、轮廓6。下面,我们依次分析几种图像增强的基本方法。2.1 线性变换和分段线性变换2.1.1 线性变换通俗地讲,线性变换即比例变换,即因变量和自变量之间存在固定的比例系数,该系数为常数。灰度变换函数为线性函数: ()当时,输出图像的对比度增大;当时,输出图像对比度降低;当,时,仅使输出图像的灰度值上移或下移,其效果是使整个图像更亮或更暗。如果为负值,暗区域将变亮,亮区域将变暗,这时的点运算相当于图像求补。一般情况下,线性变换都是将某个较小的灰度范围拉伸到较大的灰度范围,因此常称为灰度拉伸。2.1.2 分段线性变换分段线性变换是将图像区间分成两段乃至多段作线性变换。在感兴趣的区间,概率大于1,突出有价值的信息;在不感兴趣的区域,斜率小于1,抑止无用信息。如图所示: 图 三段式线性变换图所示的三段式公式为 ()令,则上式表示在区间和内斜率小于1,原有图像信息受到抑止。在区间斜率大于1,这个区间段内的图像信息得到突出,变换结果如图所示。 (a) 原始图像 (b)分段线性变换图像图 分段线性变换2.2 图像边缘增强图像在传输和变换过程中会受到各种干扰而退化,典型的就是图像模糊。而在图像的观看和识别中,常常需要突出目标的轮廓或边缘信息。这样,看起来更惬意,对目标的识别也更容易一些。锐化作为图像边缘增强的一种方法,它仅增强图像边缘处区域的方差。图像锐化一般有两种方法,一种是微分法,另外一种是高通滤波法。下面,介绍一下常用的微分锐化方法:拉普拉斯(Laplacian)锐化,其锐化模板如图2.2.1所示。图2.2.1 拉普拉斯算法33模板容易看出拉普拉斯模板的作法:先将自身与周围的8个象素相减,表示自身与周围象素的差别;再将这个差别加上自身作为新象素的灰度。可见,如果一片暗区出现了一个亮点,那么锐化处理的结果是这个亮点变得更亮,增加了图像的噪声。因为图像中的边缘就是那些灰度发生跳变的区域,所以锐化模板在边缘检测中很有用, (a) 原始图片 (b)拉普拉斯锐化 图2.2.2 拉普拉斯锐化2.3 直方图均衡化直方图均衡化(Histogram Equalization)广泛应用在图像增强处理中,它是以累计分布函数变换为基础的直方图修正法,可以产生一幅灰度级分布具有均匀概率密度的图像。直方图是高低不齐的,因为像素灰度是随机变化的,简单的说,直方图均衡化就是用一定的算法使直方图大致平和。(a) (b) (c) (d) 图2.3.1 直方图均衡化例一如图2.3.1所示,图(a)和(b)分别为一幅8比特灰度级的原始图像和直方图均衡化后的图像,图(c)和(d)分别为(a)和(b)对应的直方图。原始图像比较暗,对比度比较低,由图(c)可以看出其直方图所占据的灰度值范围比较窄且主要集中在灰度值64附近。由图(d)可以看出其均衡化后的直方图占据了整个图像灰度值允许的范围,且呈现参差不齐的外形,这是由于灰度级的可能个数有限造成的。在一些灰度级可能没有像素,在另外一些灰度级处则像素很拥挤6。由于直方图均衡化增加了图像的灰度动态范围,也就增加了图像的对比度,这些反应在图像上就是图像有较大的反差,很多细节部分都比原始图像更清晰了。算法描述:令是图像面积,是有效亮度级的个数,对于一个完全平坦的直方图来说,应该在每一个亮度级上有个像素。设是原来的灰度级,是变换后的灰度级,则可描述为:。但实际应用中,有两种情况需要考虑6:1) 多个至一个:若有连续个灰度的频数之和级等于,则必导致它们合并成一个灰度级。2) 一个到多个:若有某个灰度级的频数是的倍,则必须将其分为个不同的灰度级,每一个灰度级的频数都是。情况(1)导致的灰度级合并是简单的(是多到一的映射关系),但情况(2)时的分解是不容易的(是一到多的关系),因为难以判定在图像的不同位置,到底如何分解才是最好。假设灰度级要映射到中,有三种映射规则: 规则1:总是将映射到; 规则2:随机分配出中的一个灰度级; 规则3:检查该像素的近邻像素的灰度平均值,并分配给它一个中最接近的灰度级。规则1是简单的,满足点运算的原则。规则2使用随机数(函数),执行速度慢,且含义不明显。规则3使用了邻域运算,其输出与像素的位置有关系,不是点运算。在实际应用中,一般仅使用规则1。由此可以看出,均衡化后的直方图并不均衡,因为“只合并,不分解”,导致变换后的图像的灰度级减少,某些细节消失,同时,由于拉大了反差,将拥有特别多的像素的灰度级变得与前、后灰度级之间拉开了距离。直方图均衡化的另一个缺点就是对于某些图像,如直方图有高峰,经处理后对比度不自然的过分增强了。如图2.3.2所示,(a)和(b)分别为8比特的原始灰度图像及直方图均衡化后的图像,(c)和(d)分别为(a)和(b)对应的直方图。由(c)可以看出原始图像的直方图所占据的灰度值范围比较窄且主要集中在灰度值128附近,故在直方图上形成一个高峰。增强后的图像(b)中,尽管整幅图像的对比度有了较大提高,但图像局部细节过分增强了,如图像(b)中的左上角和右下角。 (a) (b) (c) (d) 图2.3.2 直方图均衡化例二 2.4 直方图规定化直方图规定化(或直方图匹配,Histogram Matching)的优点是能自动地增强整个图像的对比度,但是它的具体增强效果不容易控制,处理的结果总是得到全局均衡化的直方图。而实际有时需要变换直方图使之成为某个特定的形状,从而有选择地增强某个灰度值范围内的对比度,这时我们可以采用比较灵活的直方图规定化方法6。直方图规定化是指将一幅图像通过灰度变换后,使其具有特定的直方图形式,如使图像与某一标准图像具有相同的直方图,或者使图像具有某一特定函数形式的直方图。简单地说,就是把一个图像经过灰度变化后,使得它的直方图为,即规定形状。用途:可以用来校正因亮度和传感器差异引起的变化。比如,在比较同一个场景在不同的光照条件下得到的两幅图像之前。2.5 同态滤波在生活中会得到这样的图像,它的动态范围很大,而我们感兴趣的部分的灰度又很暗,图像细节没有办法辨认,采用一般的灰度线性变换法是不行的。这时我们需要采用同态滤波。同态滤波是一种在频域中同时将图像亮度范围进行压缩和将图像对比度进行增强的方法。自然景物记录在视网膜或照片底片上的亮度,可认为是照射分量和反射分量的乘积7,即 (2.5.1)式中是非负的亮度,是照射分量,是反射分量。对明暗比过强的景物,照射分量的变化比较缓慢,但在整个画面上照射分量有很宽的动态范围,传送信道与存储介质(照相底片)往往难以适应。取修正强度,当时,过大的动态范围就会得到压缩;当时,反差得到增强。这样既要压缩动态范围又要提高反差的一个合理的方法就是分别处理照射分量与反射分量7。根据上述模型,可用下列方法把两个分量分开进行滤波,如图2.5.1所示: 图2.5.1 同态滤波流程图其中,表示对数运算,表示对数傅立叶变换,表示线性高通滤波器,表示傅立叶逆变换,表示取指运算,代表初始亮度图像,代表处理后的亮度图像。这里,称作同态滤波函数。它可以分别作用于照度分量和反射分量上。在自然图像中过大的动态范围主要是照射分量产生的,边缘细节仅取决于反射分量。因为一般照度分量是在空间缓慢变化的,而反射分量在不同物体的交界处是急剧变化的,所以图像对傅立叶变换中的低频部分主要对应照度分量,而高频部分主要对应反射分量。以上特性表明我们可以设计一个对傅立叶变换的高频分量和低频分量影响不同的滤波函数,如图2.5.2所示,若,则就会一方面减弱低频而另一方面加强高频,最终的结果是同时压缩了图像的动态范围和增加了图像各部分之间的对比度89。图2.5.2 同态滤波函数的剖面图由于同态滤波在加强图像的高频分量的同时对低频增强效果一般,表现在图像上就是对比度不高。而人眼识别图像时,对图像的对比度要求比较高。因此我们采用直方图均衡化来提高同态滤波后的图像的对比度,以利于人眼的辨别。如图2.5.3和图2.5.4所示,处理效果比较好。(a)原始图片 (b)同态滤波 (c)同态滤波直方图均衡化 图2.5.3 同态滤波例一(a)原始图片 (b)同态滤波 (c)同态滤波直方图均衡化 图2.5.4 同态滤波例二3 基于全局特征的Retinex图像增强3.1 颜色恒常性与Retinex理论3.1.1 颜色恒常性颜色恒常性是指不因外界环境变化而保持对客体颜色知觉不变的心理倾向,即指在照明发生变化的情况下,人们对物体表色的知觉趋于稳定的心理倾向。简单的说,就是同一个物体的表面在不同的光照条件下会产生不同的反射谱,人体的颜色机制确实能够分辨出这样由于光照变化导致的物体表面反射谱的变化,但是人对该物体表面颜色的认知在一定范围内却保持恒定,即认为物体表面的颜色未发生变化10。一般的颜色理论仅局限于描述颜色刺激值与颜色知觉之间的关系,然而人眼观察到的颜色与波长、亮度之间的关系并不是完全对应的。人的颜色认知既来源于外界的物理刺激,又不完全由外界的物理刺激决定,因此这些理论都难以解释颜色恒常现象。针对这个问题,很多的学者都从不同的角度出发提出了各种颜色恒常理论(或模型)。目前具有代表性的颜色恒常理论(或模型)主要有Von Kries色系数定律、Land的Retinex理论、谱锐化理论和神经网络模型1011。3.1.2 Land的Retinex理论美国物理学家Edwin Land在20世纪50年代发现有些现象是传统的色彩理论无法解释的,经过近20多年的科学实验和分析,Land发现在视觉信息的传导过程中人类的视觉系统对这些信息进行了某种处理,只保留了反映物体本质特征的信息,如反射系数等,而去除了光源强度和照射不均匀等一系列不确定因素。当这些描述物体本质特征的相关信息传递到大脑皮层后,经过更加复杂的信息处理,才最终形成了人的视觉。基于上述认识,1977年Edwin Land首次提出了一种被称为Retinex的色彩理论。Retinex本身是一个合成词,它是由视网膜Retina和大脑皮层Cortex这两个词组合构成的,故Retinex理论又被称为视网膜大脑皮层理论2。3.1.3 Retinex理论的发展最早的Retinex算法是Land等人提出的任意路径算法(random walk),这是一个时间离散的随机过程算法,即下一个像素位置的选择是从当前像素周围的邻域中随机挑选出来的。其最主要的缺点就是计算量较大3。随后,Jobson等人提出了基于同态滤波(Homomorphic Filtering)的Retinex算法。该算法认为反射系数图像对应着原图像中的锐化细节,而光照图像则被认为是空间平滑的,将原图像的低通滤波作为照射光的合理预测。低通滤波通常是将原图像与高斯核做卷积得到的3。1985年,Blake等人提出了基于泊松方程(Poisson Equation Solution)的Retinex算法。该算法以Land提出的Mondrian模型为基础。 1999年,Funt等人在泊松方程Retinex算法的基础上做出改进,提出了重复的多解决方案的非线性滤波Retinex方法12。这说明在Retinex理论的发展过程中,尽管提出了多种看似存在较大差异的算法,但实际上却都非常的相似。这些算法的基础都是假定照射光是空间平滑的。所有上述算法对反射图像的操作都是为了提取出照射光,只不过其中有些算法又添加了一些对图像反射系数的假定,比如它的限制范围、Mondrian形式3等等。简单的说,所有Retinex算法的实质都是从给定的图像中抽取出照射光,得到物体的反射性质,从而产生不受光照非均衡性影响的、动态范围压缩较好的、令人满意的图像。 虽然Retinex理论能够很好地解释某些视觉现象,并且已经获得了大量的实验支持,但由于种种原因,该理论一直没有得到广泛传播和接受。直到20世纪80年代初美国宇航局将Retinex理论用于处理航空器拍摄的外太空图像且获得了非常好的处理效果后2,人们才开始重新认识到它的科学性和合理性,继而将其广泛应用于数字图像处理领域。3.2 基于全局特征的Retinex算法分析根据Retinex理论,物体的颜色是由物体对光线的反射能力决定的,而物体对光线的反射能力是物体本身固有的属性,与光源强度的绝对值没有依赖关系2。因此通过计算各个像素间的相对明暗关系,可以对图像中的每个像素点的灰度值进行校正。据此,本文引入了一种基于全局特征的Retinex图像增强算法2,这种方法包括以下几个步骤:数据准备、像素点灰度值校正和数据的显示,下面首先以灰度图像的增强为例进行介绍。3.2.1 灰度图像增强1、数据准备数据准备主要是对待处理的图像数据进行格式转换。对于8位的灰度图像,我们取出各像素点的灰度值,将该灰度值的数据类型由BYTE型转为double型,为后期的浮点运算做准备。2、像素点灰度值校正该步骤主要是计算出图像中各像素点之间的相对明暗关系,通过这个明暗关系对各像素点灰度值进行校正,此步骤也是整个算法的核心。下面先以灰度图像为例。1) 相对明暗关系公式推导 图 mn的灰度图像如图所示,是一个宽度为、高度为的灰度图像。从图像上的起点A到终点B存在一条路径,该路径上共有8个像素点,它们的灰度值分别为。则起点A和终点B之间的相对明暗关系可以用连续相乘法来计算2,即表示为 ()其中,为门限函数,在本文叙述的算法中取。另外,根据Land等人的实验表明:人眼对亮度的感知能力是呈指数型的,而不是线性的,且摄像机采集的图像亮度也是满足指数型的。所以将像素点之间的明暗关系放在对数域处理,这样做有两个好处:(1)对数形式接近人眼和摄像机对亮度的感知能力;(2)可以将复杂的乘积形式变成简单的加减2。式()是对连续相乘的数取对数,故可进行如下简化,即 () 经过上述一系列的计算和化简,可以发现起点A和终点B之间的相对明暗关系实际上就是其像素的灰度值在对数域中的差。因此,在算法实现时,首先对输入图像中的每个像素值都取对数。我们在进行数据准备时将各像素点的灰度值的数据类型由BYTE型转为double型,正是为此处做准备。其次,需要考虑的问题则是起点和终点的选取问题。2)起点和终点的选取从上述计算公式可以发现,对于同一个起点,选取各个不同的终点则会产生各个不同的相对明暗关系,通过这些不同的相对明暗关系来校正起点则会产生多个不同的起点像素的灰度校正值。同样,对于同一个终点,选取多个不同的起点也存在上述问题。因此,起点和终点的选取对于图像中像素点灰度值的校正起着至关重要的作用。为了解决这个问题,很多学者提出了不同的解决方案,如用随机方法来选择起点和终点,或者沿顺时针方向计算某个像素周围8个像素的相对明暗关系。下面,主要介绍一下本文所引入的方法2。输入图像的大小为,假定增强后的图像中各像素点的灰度值都相同(一般取为128或图像的均值),即 () 我们首先计算水平方向上任意两个距离为的像素点之间的相对明暗关系: () 通过该明暗关系对原始图像中的每个像素点的灰度值进行校正,则校正后结果图像中的像素点的灰度值为 () 接着,计算垂直方向上任意两个距离为的像素点之间的相对明暗关系,即: () 通过该明暗关系对原始图像中的每个像素点的灰度值进行校正,则校正后结果图像中的像素点的灰度值为 () 待每个像素点都完成后,将水平方向上的距离调整为,同时将垂直方向上的距离调整为,重复上述运算,直到水平方向和垂直方向上的距离都为1,得到像素点灰度级校正后的结果图像。由式()可以看出,反映了原始图像中像素点与之间的相对明暗关系,其取值范围为05.54。若,则表示像素点比像素点亮。在进行像素点灰度值校正后,。这表明我们在增强后的图像中还原了原始图像中像素点之间真正的相对明暗关系。同样,垂直方向上进行的计算也是同样的目的。3、数据显示初始时,将增强后的图像中所有像素点的灰度值都设置为,根据式()和()可以发现,在进行像素点灰度值校正后的结果图像中所有像素点的灰度值都集中在周围。由于此时像素点灰度值的数据类型是double型的,具有较强的区分能力,故在图像显示时需要对图像进行线性拉伸。对于8位的灰度图像,最亮的部分用255表示,最暗的部分用0表示,采用如下公式对像素点灰度值校正后的图像进行线性拉伸: () 其中,表示增强后图像中所有像素点灰度值中的最小值,而表示增强后图像中所有像素点灰度值中的最大值。表示图像中的原像素点的灰度值经线性拉伸后的灰度值。3.2.2 彩色图像增强彩色图像增强和灰度图像增强一样,也需要经过数据准备、像素点灰度值校正和数据显示这三个步骤,由于像素点灰度值校正步骤和灰度图像增强完全一样,此处不再重复叙述。下面,我们重点介绍一下彩色图像的数据准备和数据显示部分的工作。图像是由像素点组成的,它可以被看作是二维的像素点阵。对于8比特灰度图像,一个字节刚好可以表示一个像素,即每一个像素位置上有一个数值。对于彩色图像,三个字节才能表示1个像素,即每一个像素位置上有三个数值。这三个数值可以代表人眼视网膜的感光细胞的响应,更广义的说,代表着任何一种包含三个感光元件的成像系统(如照相机)的光学感应值12。对RGB图像来说,这三个数值也就是三原色红绿蓝的量值。由于获得图像时所利用的那三个感光元件是独立的,故我们可以独立的来考虑这三个数值。因此,我们可以把一幅彩色图像当成三个独立的二维像素点阵来看待。在每一个颜色通道上,每一个像素对应着相应的感光元件对红绿蓝光线的响应值。故对于24位的彩色图像,我们将其分解为R、G、B三幅灰度图像,即所有像素点的R分量构成一个8位的R图像、所有像素点的G分量构成一个8位的G图像、所有像素点的B分量构成一个8位的B图像。这样,我们就将一幅彩色图像转化成了三幅灰度图像,依次对这三幅图像进行上述的数据准备即可。数据显示时,步骤刚好和上述过程相反。我们将线性拉伸后的3幅图像按R、G、B顺序依次写入一个24位的彩色图像中输出,得到的即是增强后的彩色图像。3.3 算法流程1、分析输入图像,若是灰度图像,则将图像中各像素点的灰度值的数据类型由BYTE型转为double型;若是彩色图像,则将其分解为、三幅灰度图像,依次将这三幅灰度图像中的像素点的灰度值的数据类型由BYTE型转为double型。2、将输入图像放在对数域中处理,即 (3.3.1)3、将增强后的结果图像中的像素点的灰度值都初始化为,即 (3.3.2)4、水平方向上,令,计算与之间的相对明暗关系,通过式()对进行修正。5、垂直方向上,令,计算与之间的相对明暗关系,通过式()对进行修正。6、令,重复步骤4和步骤5,直到且。7、对增强后的图像用式()进行线性拉伸,若是灰度图像,则直接输出;若是彩色图像,则将线性拉伸后的3幅图像按R、G、B顺序依次写入一个24位的彩色图像中输出。3.4 增强结果显示(a)原始图像 (b)直方图均衡化 (c)全局Retinex增强 图3.4.1 全局Retinex增强如图3.4.1给出了利用全局Retinex算法实现图像增强的计算机仿真结果。由于原始图像(a)受到薄雾的影响,导致图像整体质量较低,图像对比度不高。采用直方图均衡化方法提高图像对比度后发现,图像整体对比度得到较大提高。但是,图像局部区域出现过增强现象,导致细节丢失,如图中(b)所示。采用基于全局特征的Retinex增强方法后,可以发现增强后的图像比原始图像质量明显改善,局部细节部分也较为清晰,如图中(c)所示,但图像整体偏暗,对比度不高。因此需要对该算法进行改进,提高增强图像的对比度。 3.5 对基于全局特征的Retinex算法的两个改进上述算法中,经全局Retinex算法增强后的图像对比度不高,因此需要对结果图像的直方图进行校正。在此,本文在全局Retinex算法的数据显示中,对原有的线性拉伸方法引入两种改进方法,一种基于直方图截取的线性拉伸方法,另一种则是自适应的线性拉伸方法。3.5.1 直方图截取的线性拉伸若系统没有充分利用显示装置所允许的最大灰度范围,导致图像的对比度太低(如摄影时曝光不足),使得图像的一些细节难以观察,可以对图像进行对比度的线性拉伸,将原图像的灰度范围由扩展成,即 ()这就是在上述算法的数据显示中用到的线性拉伸,在图像增强中,这是一种简单而有效的方法。然后有时候,该算法并不能很好的提高图像的全局对比度。如图所示,为原始图像的直方图,表示图像中所有像素点灰度值中的最小值,而表示图像中所有像素点灰度值中的最大值。线性拉伸主要的目的就是将图像中的像素点的灰度级由原来的区间段拉伸到。 图 图像的直方图从上图可以发现,图像中的大部分像素点的灰度级都集中在区间之间,只有一小部分超出。对于灰度级处于区间和区间内的这部分像素点,它们对整幅图像灰度级的影响微乎其微,可以对其进行忽略,故在线性拉伸时,只增强灰度级在区间内的像素点,而对其它像素点进行抑制。据此,本文引入了一种基于直方图截取的线性拉伸方法13。为了改进图像增强的效果,将公式()改为如下形式: 0 255 ()其中,、分别表示图像的下饱和点和上饱和点,如图所示。下面我们从图像的累积分布函数出发,分析直方图中上、下饱和点的选取。在数字图像中,图像的直方图,表示图像中各灰度级出现的概率。令 ()则被称为图像的累积分布函数,如图所示,它表示图像中的像素点在某一灰度级或某一灰度级下所占的比例。 图像的累积分布函数图中,、分别表示达到下饱和和上饱和的概率值,对应的图像中的灰度级为、,这也就是我们需要选取的上、下饱和点。通过分析图像的累积分布函数与直方图的关系,我们发现当图像的累积分布函数在某一灰度级超过下饱和点的概率值,即时,即可得到下饱和点,编程实现时,从灰度级开始,向后搜索,直达找到满足条件的值和。同样,当图像的累积分布函数在某一灰度级超过上饱和点的概率值,即当时,可找到满足条件的上饱和点。编程实现时,为了提高效率,此时从灰度级255开始往下递减搜索,直到找到满足条件的灰度级。在该线性拉伸算法中,上饱和和下饱和概率值、的选取需要通过多次实验结果去获得,一旦这两个概率值确定好,该算法就成为一个自适应的线性拉伸算法。图.5为增强后的结果图,其中(c)为原全局Retinex算法增强后的结果,可以发现增强后的图像整体对比度比较差,不利于人眼识别。图(d)在原全局Retinex算法中引入了基于直方图截取的线性拉伸,可以发现图像整体对比度提高很多,视觉效果比较好。图(d)中参数,。3.5.2 自适应线性拉伸在上述算法中,我们发现和的选取对图像的线性拉伸效果起着至关重要的作用。这种基于直方图截取的线性拉伸方法,是通过手工设置上饱和概率和下饱和概率来获得和,对于具有不同直方图分布的图像,上、下饱和概率的取值随着直方图的不同而需要进行一定的调整,在算法实现时需要不断的调整该取值,且该饱和概率的取值还需要经过若干实验来进行选择,比较繁琐,不利于实时应用。因此,我们下面引入一种自适应的线性拉伸方法14。在高斯分布(也称正态分布)中,对于正态随机变量来说,它的值落在区间 内几乎是肯定的事,这就是所谓的“规则”(在第四章中将详细介绍)。根据“规则”,与图像均值的距离超过的像素点的影响都可以忽略不计,因此,我们取下饱和点,上饱和点。然后根据公式()对原有图像的直方图进行线性拉伸。对于一幅给定的图像,根据其直方图我们可以很方便的计算出其均值和方差,继而计算出上饱和点和下饱和点对应的灰度级。和上述基于直方图截取的线性拉伸方法相比,该方法计算量小,执行速度快,且具有自适应性,适应于实时图像增强系统中,其增强结果图如图3.6.2图3.6.5中(e)所示。3.6 实验与结果分析图像质量的含义主要包括两个方面:图像的逼真度和图像的可懂性。为了对图像通信的某些环节进行合理评估,图像质量评价的研究已成为图像信息工程的基础技术之一。在图像处理领域中,如何评价一幅经过处理的图像质量的好坏,如何评价某个图像处理算法的优劣一直是人们关心的问题。然而图像质量评价没有统一的测度。一直以来,人们希望能够找出图像逼真度和可懂度的定量测量方法,作为评价图像和设计图像系统的依据1516。主观评价方法就是让观察者根据一些事先规定的评价尺度或自己的经验,对测试图像按视觉效果提出质量判断,并给出质量分数。对所有观察者给出的分数进行加权平均,所得的结果即为图像的主观质量评价。它主要有五种度量尺度,如图3.6.1所示。这种测量方法虽然较好地反映出了图像地直观质量,但无法应用数学模型对其进行描述,不易定量准确测量。且主观评价方法有平均主观分数等,其结果受到观察者的知识背景、情绪以及疲劳程度等很多因素影响17。在实际应用中,图像的主观质量评价方法受到了严重限制,甚至根本不适合于某些应用场合,如实时图像传输等领域1819。 级别 绝对测量尺度 相对测量尺度 1 很好 一群中最好的 2 较好 好于该群重平均水平的 3 一般 该群中平均水平4 较差 差于该群中平均水平的5 很差 该群中最差的 图表 3.6.1 主观质量评价尺度在实际应用中,我们经常会采用图像的一些数字特征来作为图像质量评估的主要客观标准20,比如亮度、对比度、亮度值误差21、频谱平坦度22、均方误差、峰值信噪比23、信息熵24和梯度熵25等。图像质量的客观评估方法的好处在于可以根据一定的数学模型对实验图像进行定量的准确测量。故本文对增强图像的质量评估将采用以客观评价为主,主观评价为辅的方式。由于改进的全局Retinex增强方法与原全局Retinex方法的最大区别在于对图像对比度的提高,因此本章将对比度作为实验图像质量的一个主要评价指标。同时,由于熵体现了对图像信息量的度量,故将熵也作为一个评价指标。本文实验图像的选取以彩色scene和彩色girl图像为例,即图3.6.4和图3.6.5。(a)原始图像 (b)直方图均衡化 (c)全局Retinex(d)全局Retinex基于直方图截取的线性拉伸 (e)全局Retinex自适应线性拉伸 图3.6.2 灰度scene 全局Retinex增强(a)原始图像 (b)直方图均衡化 (c)全局Retinex(d)全局Retinex基于直方图截取的线性拉伸 (e)全局Retinex自适应线性拉伸 图3.6.3 灰度girl全局Retinex增强(a)原始图像 (b)直方图均衡化 (c)全局Retinex(d)全局Retinex基于直方图截取的线性拉伸 (e)全局Retinex自适应线性拉伸 图3.6.4 彩色scene全局Retinex增强(a)原始图像 (b)直方图均衡化 (c)全局Retinex(d)全局Retinex基于直方图截取的线性拉伸 (e)全局Retinex自适应线性拉伸 图3.6.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论