(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf_第1页
(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf_第2页
(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf_第3页
(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf_第4页
(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(计算机科学与技术专业论文)基于颜色不变性的图像检索算法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要: 在现代社会中,图像检索系统的发展越来越快,系统中所包含的图像越来越 多。当今的图像检索特征提取算法主要包括颜色直方图、基于图像的纹理和形状 等特征进行提取。颜色和形状都是基于内容的图像检索系统中经常使用的特征。 在图像检索过程中提取与光照无关的、能够刻画物体表面物理反射特性的颜色特 征,被称为颜色不变性描述。与其他颜色特征计算相比,颜色不变性描述不需要 精确得到图像的光照信息,在很多计算机视觉的实际应用问题中( 如物体识别、图 像检索等等) ,颜色不变性描述子则显得更为实用和重要一些。 由于颜色本身的不稳定性,很容易受到光照变化的影响。获取一种对光照鲁 棒的、具有颜色恒常性功能的颜色描述子对整个计算机视觉系统来说是非常重要 的。对于同一个物体,不同光打在上面( 在不同光照条件下) ,它所呈现的颜色特征 是完全不同的,如果不考虑光照变化对物体成像的影响,那么对于图像检索的结 果会产生很大的误差。在现有的图像检索技术基础上,进一步研究光照条件变化 对颜色特征的影响,对图像检索系统性能的提高是非常有意义的,这样便可进一 步提高图像检索结果的准确率。 本文提出一种新算法,即利用不变矩公式进行颜色不变性描述特征计算。算 法充分利用了图像的颜色信息、边缘信息及形状信息,其具有良好的光照不变性, 由于不变矩的尺度不变性、平移不变性和旋转不变性,所以提出的颜色不变性描 述子也具有此三项特征。文中将该颜色特征应用到图像检索系统中,得到一种对 光照鲁棒的图像检索系统。经过大量的实验后,能够表明不变矩算法在总体检索 效率上具有良好的性能。对于提取边缘信息稀少的图像,此算法的性能能够优于 国内外已经存在的一些算法。 关键词:颜色不变性;图像检索;颜色恒常性;不变矩 分类号:t p 3 9 1 a bs t r a c t a b s i l 【a c i - i nm o d e ms o c i e t y , t h ed e v e l o p m e n to ft h ec o n t e n tb a s e di m a g er e t r i e v a ls y s t e m g e t t i n gf a s t e ra n df a s t e r , i tc o n t a i n sm o r ea n dm o r ei m a g e s m o d e mi m a g er e t r i e v a l a l g o r i t h m si n c l u d ec o l o rh i s t o g r a m ,i m a g e b a s e dt e x t u r ea n ds h a p ef e a t u r ee x t r a c t i o n a l g o r i t h m c o l o ra n ds h a p ea r ec o m m o nf e a t u r e sw h i c hw e r eu s e di nt h ec o n t e n tb a s e d i m a g er e t r i e v a ls y s t e m t h ec o l o rf e a t u r e sw h i c ha l ei r r e s p e c t i v et ot h el i g h ta n dc a l l p o r t r a yp h y s i c a ls u r f a c er e f l e c tp r o p e r t i e st h a te x t r a c t e di nt h ei m a g es e a r c hp r o c e s s n a m e dc o l o ri n v a r i a n td e s c r i p t o r c o m p a r e dw i t ho t h e rc o l o rf e a t u r e s ,c o l o ri n v a r i a n t d e s c r i p t o rd o e sn o tr e q u i r ea c c u r a t ei m a g el i g h t i n gi n f o r m a t i o n , i nm a n yp r a c t i c a l a p p l i c a t i o n so fc o m p u t e rv i s i o np r o b l e m s ( s u c ha so b j e c tr e c o g n i t i o n , i m a g er e t r i e v a l , e t c ) ,c o l o ri n v a r i a n td e s c r i p t o ri sm u c hm o r ep r a c t i c a la n di m p o r t a n t b e c a u s eo ft h eu n c e r t a i n t yo ft h ec o l o ri t s e l f , i ti se a s yi m p a c t e db yt h ec h a n g e si n i l l u m i n a t i o n t og e tac o l o rd e s c r i p t o rt h a ti sr o b u s tt oi l l u m i n a t i o na n dh a st h ec o l o r c o n s t a n c yf u n c t i o ni sv e r yi m p o r t a n tf o rt h ee n t i r ec o m p u t e rv i s i o ns y s t e m a no b j e c t w a ss h o n ew i t hd i f f e r e n tl i g h t ( i nt h ed i f f e r e n ti l l u m i n a t i o n ) ,t h e ni tm a yf o r md i f f e r e n t c o l o rf e a t u r e s s oi fi td o e sn o tc o n s i d e rt h ei n f l u e n c eo ft h ei l l u m i n a t i o no nt h eo b j e c t , t h e r ew i l lb eag r e a te r r o ri nt h ei m a g es e a r c hr e s u l t b a s e do nt h ee x i s t i n gi m a g e r e t r i e v a lt e c h n i q u e s ,f u r t h e rr e s e a r c h i n gt h ei m p a c tt h a tt h ec h a n g e si ni l l u m i n a t i o nt o t h ec o l o rc h a r a c t e r i s t i c si s v e r ys i g n i f i c a n tt oi m p r o v et h ei m a g er e t r i e v a ls y s t e m p e r f o r m a n c e ,a n dt h e ni tw o u l df u r t h e re n h a n c et h er e s u l t so fi m a g er e t r i e v a la c c u r a c y t h i sp a p e rp r e s e n t san e wa l g o r i t h m ,a su s i n gt h ei n v a r i a n tm a t r i xt oc o m p u t et h e i n v a r i a n td e s c r i p t i o no ft h ec o l o r s t h ea l g o r i t h mm a k e sf u l lu s eo ft h ec o l o ri m a g e i n f o r m a t i o n ,t h ee d g ei n f o r m a t i o na n ds h a p ei n f o r m a t i o n ,a n di th a sg o o di l l u m i n a t i o n i n v a r i a n c e ,b e c a u s eo ft h ei n v a r i a n tm a t r i x ss c a l ei n v a r i a n c e ,t r a n s l a t i o ni n v a r i a n c ea n d r o t a t i o ni n v a r i a n c e , s on e wc o l o rd e s c r i p t o ri sa l s oi n v a l i a n tw i t ht h e s et h r e e c h a r a c t e r i s t i c s i nt h i sp a p e r , t h ei n v a r i a n tm a t r i xc o l o rd e s c r i p t o rw i l l a p p l yt ot h e i m a g er e t r i e v a ls y s t e mt og e ta ni l l u m i n a t i o nr o b u s ti m a g er e t r i e v a ls y s t e m a f t e ral a r g e n u m b e ro fe x p e r i m e n t s ,i n v a r i a n tm a t r i xa l g o r i t h mh a sa g o o dp e r f o r m a n c ei nt h ew h o l e s e a r c he f f i c i e n c y a sf o rt h ee x t r a c t i o no ft h el i r l e e d g ei n f o r m a t i o ni m a g e ,t h e p e r f o r m a n c eo ft h i sa l g o r i t h mi sb e t t e rt h a ns o m eo fo t h e ra l g o r i t h m st h a ta l r e a d y e x i s t e di nd o m e s t i ca n da b r o a d k e y w o r d s - c o l o r i n v a r i a n t ;i m a g er e t r i e v a l ;c o l o rc o n s t a n c y ;i n v a r i a n tm a t r i x c l a s s n o :t p 3 9 1 v 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。 同意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 签字日期: 当褥 i 钼留日 导:孕哮声导师签名季哮声 期:矽降伟 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 5 7 月馏日 致谢 在北京交通大学的硕士研究生学习生活即将结束,在这段难忘的日子里,除 了得到家人朋友的鼓励和支持以外,最大的收获是我有幸遇到很多良师益友。在 此对他们表达我最诚挚的感谢! 本论文的工作是在我的导师宋泽海老师的悉心指导下完成的,宋泽海老师严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢两年来 宋泽海老师对我的关心和指导。 同时,我要感谢须德教授,他在学习上和生活上都给予了我很大的关心和帮 助,在此向须德教授表示衷心的谢意。 在实验室工作及撰写论文期间,李兵师兄对我论文的研究工作给予了热情的 帮助,同时,还要感谢周晓宁、张硕与马亮同学给我的支持,在此向他们表示由 衷的感谢! 另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。 1 1问题提出 l 引言 图像检索技术对于多媒体数据库的发展起着决定性的作用。现代的图像检索 系统都是抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要 查找的图像大致特征描述出来,就可以找出与之具有相近特征的图像。图像检索 中的特征提取是图像标注、图像检索、物体识别等计算机视觉问题中的一个重要 步骤【i 】。在图像检索过程中提取与光照无关的、能够刻画物体表面物理反射特性的 颜色特征,被称为颜色不变性描述( c o l o ri n v a r i a n td c s c r i p t i o n ) 。与颜色恒常性计算 相比,颜色不变性描述不需要精确得到图像的光照信息,在很多计算机视觉的实 际应用问题中( 如物体识别、图像检索等等) ,颜色不变性描述子则显得更为实用和 重要一些。目前,大量的研究仍然关注于如何提取一系列鲁棒的、稳定的图像特 征描述子。最近提出的s i f t 算子t 2 j ( s c a l e i n v a r i a n tf e a t u r e t r a n s f o r m ) 在图像的形状 描述上取得了很好的结果。然而,与光照无关的具有鲁棒性的颜色特征作为另一 个重要的图像视觉特征,得到的关注相比于形状特征要少很多。 由于颜色本身的不稳定性,很容易受到光照变化的影响。获取一种对光照鲁 棒的、具有颜色恒常性功能的颜色描述子对整个计算机视觉系统来说是非常重要 的。国内外现在的一些比较成熟的颜色特征提取算法往往忽略了光照对颜色变化 的影响,提取的颜色特征并不能代表物体本身原有的颜色。例如用户在检索过程 中以一幅蓝色书籍图像来作为检索示例图像。受到光照变化影响的其他书籍图像 也许也会呈现蓝色的特性,因此这种图像会给检索结果带来很大误差,偏离用户 的实际期望值。因此在现有的图像检索技术基础上,进一步研究光照条件变化对 颜色特征的影响,对图像检索系统性能的提高是非常有意义的,这样便可进一步 提高图像检索结果的准确率。 1 2研究意义 颜色经常被用作一种简单方便的成像比对特征,其作为一种有效的视觉信息 特征被广泛地应用于物体识别和图像检索等计算机视觉问题中。颜色在人类的理 解过程中是非常重要的视觉提示。在人类进行不同的视觉活动中,包含了对颜色 的判别等颜色识别过程。但颜色同时也是一种极其不稳定的视觉特征,很容易受 到光照变化的影响。要想利用颜色作为比对特征,那么首先就必须去除光照的影 响。现阶段去光方法主要有两种,一是把光源映射到一个标准光下,这种方法在 过去的十年中已经被去除【3 ”】。主要原因是如果这些方法被运行在一个大型多媒体 数据库中,那么效果就不够理想。第二种方法是替换图片的特征让其独立于光照 的光源,这样它们的特征将不依赖于颜色不变性特征提取算法,关于第二种方法 的研究已经被发表了许多论文 5 - 9 1 。 s w a i n 和b a l l a r d t l 0 1 研究了一种提取图像特征的方法,这个方法中利用了颜色 直方图的交集。虽然其独立于几何空间的转换,但是当光照条件变化时,这个方 法提取的图像特征不可避免地被降级。为了解决这个问题,f u n t 和f i n l a y s o n 推论 了一系列基于颜色派生的物体反射率模型。他们提出一种叫做颜色恒常性颜色索 引( c c c i ) 的算法,这个方法能够匹配颜色直方图的相邻像素点。g e v e r s 和s m e u l d e r s 扩充了c c c i 技术,同时考虑到了颜色光照和形状变化。a d j e r o h 和l e e t 7 】提出了 另外一种基于颜色比率的特征提取。这种计算方法要计算每个像素点和其邻接像 素点的变化。w e i j e r 和s c h m i d 9 】把颜色比率的算法又延伸到了基于边缘的颜色不 变性描述。虽然这些方法在处理光照条件变化时的性能要优于s w a i n 和b a l l a r d 的 方法,但他们是在忽略颜色信息的基础上,把图像的形状特征提取出来。当图像 中出现污点,或者图像的形状信息被降级,这种派生出来的算法很容易受到图像 噪声和黑色区域的影响。这些方法都对图像的质量非常敏感。 可见传统的基于颜色不变性的图像检索对光照变化的处理都不同程度地存在 缺陷,检索结果会与期望值产生误差。由于光照对物体成像的影响,笔者所做的 研究工作就是寻找到一种与光照无关的图像特征描述子,改进上述算法对污点敏 感和提取颜色信息不完全的缺陷,并将该特征应用到图像检索中,得到一种对光 照鲁棒的图像检索系统。虽然基于颜色不变性的图像检索技术有着广阔的应用前 景,并且已经取得了很大的进展,但是仍然有许多关键技术没有解决或不够完善。 因此,该项技术的研究仍有着深远的意义,也将面临巨大的挑战。 1 3研究现状 图像搜索引擎所实现的图像检索基本上是与文本搜索引擎类似的基于图像内 容描述的语义层次的匹配。在许多情况下,用户习惯于通过概念来提交查询。概 念查询的一种实现即基于文本式的描述,用关键词、关键词逻辑组合或自然语言 来表达查询的概念,这就是语义层次的匹配。但由于文本对图像的描述更容易产 生歧义,当词语不足以形象和准确地描述视觉感知时,用户就需要利用其所呈现 的视觉特性来查询,例如利用颜色、纹理、形状等特征。因此,就出现了基于图 2 像本身固有属性匹配的图像检索技术。下面分别介绍三种研究方向的研究现状。 l ,颜色特征是图像最直观而明显的特征,一般采用直方图来描述。颜色直方图是 表示图像中颜色分布的一种方法,它的横轴表示颜色等级,纵轴表示在某一个 颜色等级上具有该颜色的像素在整幅图像中所占的比例,直方图颜色空间中的 每一个刻度表示了颜色空间中的一种颜色。采用直方图计算图像间的相似性比 较简单,但它不能反映图像中对象的空间特征。 2 图像可以看成是不同纹理区域的组合,纹理通常定义为图像的某种局部性质, 或是对局部区域中像素之间关系的一种度量。纹理特征可用来对图像中的空间 信息进行一定程度的定量描述。根据纹理特征进行检索主要考虑粗糙性、方向 性和对比性三种特征。 3 采用形状特征进行检索时,用户通过勾勒图像的形状或轮廓,从图像库中检出 形状类似的图像。基于此特征的检索方法有两种:( a ) 分割图像经过边缘提取后, 得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索。( b ) 直接针对图 形寻找适当的矢量特征用于检索算法,但处理这种结构化检索更为复杂,需做 更多的预处理。 图像检索技术从关键字标注的图像检索到基于内容的图像检索,人们在图像 检索方面己经进行了很多有意义的探索,并提出了一些具有代表性的原型系统。 q b i ct 1 1 】【1 2 】是i b m 公司开发的基于内容的图像检索系统。它支持基于例子图 像的查询方式,也支持草图、轮廓、组合颜色和纹理特征的查询方式以及其它方 式。颜色特征主要采用r g b 、y i q 、m t m 坐标和m u n s e l l 颜色空间和2 5 6 维r g b 颜色直方图等方式来表示。它所采用的纹理特征是改进了的t a m u r a 纹理表示法。 在国内,基于内容的图像检索系统主要有中国科学院计算技术研究所智能信 息处理重点实验室开发的基于内容的图像检索演示系统( m i r e s t 1 ) ,m i r e s ”】系统是 一个综合利用高层语义特征和低层可视特征的图像检索系统。它通过机器学习的 办法提取图像语义类别来表示图像高层内容;低层特征则集成图像的颜色、纹理、 边缘特征;该系统还实现了基于核函数和s v m 的相关反馈算法。m i r e s i ”】系统对 各种类别的图像都能进行有效的检索。 以上的原型系统中在图像检索过程中可能对光照变化影响考虑得不够充分。 现阶段,对于利用颜色不变性进行图像检索,国内外也已经有一些成型的算法。 图像颜色不变性特征的算法描述主要有以下方法: 1 基于物体反射率对颜色一致性的研究,国外学者提出了种名为颜色不变性派 生算法,这种算法用来匹配相邻像素之间的颜色比率。在此算法中,图像成像 时每个点的r 、g 、b 值都与物体表面的反射率相关,由最基本的传感器反映 公式求微分把积分符号去掉后,可以得到一个像素点描述,然后把这个描述子 求导进行演算后,把不必要的变量去掉能最终得到颜色不变性描述子。这个描 述子把每个点的描述r 、g 、b 进行了全新的定义,它可以有效地去除光照对 物体成像的影响。 2 对于上述算法国外有些学者进行了拓展,主要思想是在上述描述子特征基础 上,把三种独立的颜色比率映射成两种相互独立的颜色比率,改进后的算法大 大的改变了计算的效率,使得搜索效率大幅度提高。这两种描述子虽然考虑了 光照条件对物体成像的影响,但是污点对算法检索效率影响很大,去除这些影 响还有待于人们对两种算法的进一步研究改进。 3 之前的两种算法在图像污点影响的处理上都没有达到最佳的效果,由于图像描 述子是基于图像上的每一个象素点来实现的,图像上的很多像素点可能都是污 点,这样,夹杂污点的颜色不变性描述肯定会有很大的缺陷,很多查询结果就 会失真。后来,人们从颜色比率的公式来研究去除污点影响的算法,最后得出 结论,可以利用颜色比率的分散性来减少对图像模糊的依赖性。由颜色比率公 式推导出颜色入射角公式,利用该公式进行颜色不变性描述并进行图像特征的 提取。 4 颜色比率推导的不变性描述计算起来费时费力,在时间性能上往往达不到人们 的要求。由此,人们又对颜色比率推导出的颜色不变性描述进行了更深入的推 导和假设,最后又得到一个更加简洁的不变性描述子,该不变性描述子利用了 颜色恒常性和几何光照不变性来减少图像颜色比率对图像模糊的敏感性,相比 之前的颜色不变性描述子,从效率性能上进行了改进。 上述四种算法都是基于利用颜色导数计算得到的,对于拥有丰富边缘信息的 图像,这些算法都不能把图像特征提取完全,存在一定的缺陷,所以颜色不变性 特征提取技术的研究还会面临很大的挑战。 1 4 论文研究内容 本文研究了基于颜色不变性的图像检索算法,并将其用于实现基于内容的图 像检索系统。本文一共提出三种算法来进行实验测试,第一种算法是利用颜色直 方图进行检索,此算法主要包括颜色的量化,颜色分块生成循环队列和相似性匹 配,此算法在检索效率和准确率上大多不能满足用户的需求。第二种算法是基于 物理反射率对颜色的一致性进行推导,得到一个颜色不变性计算公式,此种算法 容易受到污点和阴影的影响。第三种算法是利用不变矩来推导一个颜色不变性计 算公式,此算法不易受到污点效应的影响,对第二种算法进行了有效的改进。算 法的基本思想是对一幅图像中的所有像素点进行不变矩计算,把所有像素点映射 4 到一个一维基本特征向量上,再由一维基本特征向量通过一些运算消除规模因素 的影响得到另一个一维复合特征向量,复合特征向量就是图像颜色特征的一个表 示。上述算法的共性是都拥有一个图像检索和匹配的过程,特征从图像中提取出 来后,就要进行图像的匹配。本论文所用的图像近似度算法为计算图像特征向量 之问的欧式距离。系统运作流程大概分为以下几点: 1 从多媒体数据库中提取所有图像的颜色特征描述,依次进行保存,把每张图像 提取的描述子都存入图片所对应的数据库或文件中。 2 计算目标图像和库中每幅图像之间的特征相似度,然后进行结果排序,把用户 要求相似度之内的图像进行提取显示。 本文所实现的算法主要是针对不变矩公式研究,在颜色不变性描述方面,提 出一些比较新颖的观点,进而进行实验验证。在进行了大量实验后,实验结果表 明利用不变矩推导的颜色不变性计算公式进行图像检索,其性能是比较优秀的, 在某些方面优于其他两种算法。 1 5 论文组织结构 第一章,简要介绍了基于颜色不变性特征的图像检索的研究意义以及国内外 发展情况,概述了国内外成型的一些颜色不变性描述算法,提出了本文的研究内 容。 第二章,主要介绍了图像成像的基本原理、颜色直方图的构造方法及其意义 以及颜色不变性特征描述的四个描述子,这些将为第三章的研究提供必要的理论 基础。 第三章,本章详细论述了不变矩的概念、如何利用不变矩进行颜色不变性特 征提取、详细的算法步骤、图像检索匹配技术、图像检索系统概述和算法流程图。 第四章,介绍了用于该实验的图像数据集,对本文提出的算法进行了实验, 并对实验数据结果进行了分析与说明,对实现的三种算法进行比较和总结,并给 出了实验结果的对比分析。 第五章,就研究成果对本文进行了概括性和全面性的总结,并指出了基于颜 色不变性的图像检索系统未来可发展的方向和空间。 5 2 颜色不变性描述 目前基于颜色不变性的图像检索在国i 为# 1 - 已经有很多成型的算法,这些算法 利用颜色和轮廓这两个图像最基本的特征来做为研究的根据,本章将相继介绍图 像成像的基本原理、颜色直方图以及颜色不变性的几个描述子,这些理论知识都 是第三章不变矩算法具体实现的理论基石。 2 1 图像成像基本原理 2 1 1图像及其属性 图像是视觉系统的基础,是客观世界在图像介质上的真实写照。图像可分为 光学图像、红外图像、激光图像、z 光图像、计算机数字图像和其他类型的图像 等多种,不同类型的图像来源不同。 从信息系统来看,图像是一种信息的载体,包含着客观世界某种特性及空间 分布的信息。需要指出的是,图像这个信息载体最终是为人类的视觉系统服务的, 也就是说,只有当图像的信息被人们视觉系统所接受,通过处理达到识别和理解 的目的时,它才有存在的意义。从这一点来说,图像是一种从客观世界到主管世 界的中间媒体,是人们通过视觉系统认识世界的一种重要途径。 图像的属性( 内容) ,如色彩、灰度、边缘和纹理等,反映图像的内容,是研究 图像的开始。图像的属性分析,是进一步分析和处理图像的基础。人的视觉系统 可以反映客观世界,但从图像的内容最初看到的仅仅是色彩、形状等基本特征, 其余的是靠对客观世界的先验知识。而图像特征如灰度、色彩、纹理、轮廓和形 状是基于灰度( 色彩) 在图像中的空间分布而产生的。不论图像的内容如何,这些特 征都是最基本的图像内容,它们是图像颜色特征提取等底层处理的基本依据。 2 1 2人们对颜色的感觉 颜色,作为一幅图像的本质属性,能够反应出图像的一些重要特征,所以颜 色和亮度信号是人, f r 笋l j 定一幅图像的重要标志。在过去的研究中,利用颜色特征 来进行图像检索是一种常用的方法,接下来介绍人们对颜色的感觉。 人类因为可以感知物体的颜色,才能更好地分辨周围的物体,同时享受色彩 的美丽。如果没有分辨色彩的能力,整个世界就会像黑白照片一样。物体反射了 6 若干波段的光,才能表现出一定的颜色,而人能够辨别颜色,实质是因为眼睛能 分别感受不同波长的光。人类对光的感觉开始于视网膜( 眼球内部的后表层) 里的两 类感光细胞:锥状细胞和杆状细胞。锥状细胞在亮光下起作用,只能感受彩色, 色调杆状细胞工作在低光环境下,只能够提取亮度信息。来自视网膜的视觉信息 通过视神经纤维传送到大脑的视觉皮层,在那里完成视觉的处理和理解,它们在 可见光谱上具有重叠的通带。上述两种类型感光细胞的组合可使人类感知任何彩 色,这意味着被感知的彩色只依赖于红色,绿色和蓝色的值,而不是整个光谱, 这就是彩色视觉的三感光细胞原理。 2 1 3 色度学理论【1 4 】 色度学是研究人的颜色视觉规律、颜色测量理论与技术的科学,它是一门在 二十世纪发展起来的,以物理光学、视觉生理学、视觉心理学、心理物理学等学 科为基础的综合性科学【”】。确切地讲色度学是研究人眼对颜色感觉规律的一门科 学。颜色是人眼对入射光线的一种感知,在人们眼中所反映出的颜色,人们习惯 把它归属于某一物体的本身,把它作为某一物体所具有的属于自身的基本性质。 但在实际生活中,人们眼中所看到的颜色,除了物体本身的光谱反射特性之外, 它还和照明条件所造成的现象有关。所以说颜色不单取决于物体本身的特性,而 且还与照明光源的光谱成分有着直接的关系。牛顿在1 6 6 6 年借助三棱镜首先发现 了光谱现象,揭示了白光可以分解为波长连续的色光,而一些不同颜色和数量的 色光也可以混合为白光。此后,大量的光学实验奠定了色度学的基础,得出了很 多关于光与颜色的结论: 1 光的波长决定了光的颜色,光线映射到我们的眼睛时,波长不同决定了光的色 相不同,波长相同但能量不同,决定了光的色彩明暗的不同。 2 在电磁波辐射范围内,只有波长从3 8 0 n m 到7 8 0 n t o 的辐射能够引起人们的视 感觉,这段光波叫做可见光。人们只能对各种可见光进行感觉、合成、分析和 辨色,可见光谱在未经折射的情况下,是以白光的颜色呈现在人的眼中。 3 单一波长的光称为单色光,由多波长组成的光称为复色光,除了少数单色光之 外,绝大多数单色光的颜色可以用复色光产生。自然界中的绝大多数颜色可以 用红、绿、蓝三种颜色混合产生,对各波长不同程度,不同比例的吸收、反射, 则可呈现干变万化的颜色。 4 颜色越浅,波长越长;颜色越深,波长越短。物体呈现的颜色,就是由于物体 对这一条色谱中不同的颜色( 即不同的波长) 选择性吸收和反射的能力所形成 的。 7 著名的格拉斯曼定律反映了视觉对颜色的反应取决于红、绿、蓝三输入量的 代数和这一事实。格拉斯曼定律包含如下五项内容: 1 所有颜色都可以用互相独立的三基色混合得到: 2 人的视觉只能分辨颜色的三种变化:明度、色调和色饱和度;假如三基色的混 合比相等,则色调、色饱和度也相等; 3 每一种颜色都有一个相应补色,如果某一颜色与其补色以适当比例混合,便产 生白色或灰色。如果两者按其比例混合,便产生近似于比重大的颜色成份的非 饱和色; 4 凡是在视觉上相同的颜色都是等效的,可以互相代替。 5 混合色的总亮度等于组成混合色的各颜色光亮度之和。 其中色调、色饱和度以及明度是表示色觉程度的。色调表示指各种颜色之间 的差别,明度是指色彩的明暗程度,色饱和度是指构成颜色的纯度,它表示颜色 中所含彩色成分的比例。格拉斯曼定律可用f 兰r ( r ) + g ( g ) + 召( b ) 表示,式中r 、 g 、b 表示三基色。 c i e r g b 色彩空间是r g b 色彩空间之一,以单( 单一波长) 原色的特定集合著 称。在1 9 2 0 年,w d a v i dw r i g h t ( w r i g h t1 9 2 8 ) 和j o h ng u i l d ( g u i l d1 9 3 1 ) 独立进 行了一系列人类视觉实验,提供了c i e x y z 色彩空间规定的基础。 、 5 ( 勾 人 图2 1 二基色刺激值与波长的关系 f i g u r e2 1r e l a t i o n s h i p sb e t w e e nt h et h r e es t i m u l a t e sa n dw a v e l e n g t h c i e ( 国际照明委员会) 制定的c i e l 9 3 1 r g b 颜色系统标准为色度学提供了测 量和比较的方法工具。c i e r g b 光谱三刺激值是由3 1 7 位正常视觉者,用c i e 规 定的红、绿、蓝三基色光,对等能量光谱色从3 8 0 r i m 到7 8 0 n m 所进行的专门性颜 色混合匹配实验得到的。实验时,匹配光谱波长为a 的等能光谱色所对应的红、绿、 刺激值 蓝三原色数量,称为光谱三基色刺激值,记为r ( a ) ,g ( 兄) ,b ( 4 ) ,它是c i e 在对 等能光谱色进行匹配时用来表示红、绿、蓝三基色的专用符号。三基色刺激值与 波长的关系如图2 1 。c i e l 9 3 1 r g b 标准为精确测量和表征颜色提供了方法,任何 一种颜色,无论是单色光还是复色光,用配色的方法得到的三基色值即表征了该 颜色。 2 1 4 颜色传感器的数学模型【1 4 】 人类的视网膜上存在着三种基本颜色感光细胞,他们对于不同波长光线的响 应不同。人眼的锥状体对光线颜色的感知是一种在感知波段上的积分效应,参见 公式( 2 1 ) ,其中,( 允) 表示照明光谱,s ( 旯) 表示物体表面的反射率函数, c ( 4 ) = ,( 允) s ( 五) 表示进入人眼的光谱,见( 允) 、砌( 见) 、p s ( 4 ) 分别是三种锥状细 胞的响应函数,分别对长波光线、中波光线和短波光线敏感,经过积分,得到人 眼感觉的l ,m ,s 三个颜色值: = p ( 4 ) s ( 4 ) p ( 4 ) d 4 工 m = p ( 4 ) s ( 4 ) p 材( 4 ) d 4 ( 2 1 ) 工 s = f ,( 允) s ( 兄) 风( 旯) d 允 对于c i e l 9 3 1 r g b 颜色系统标准,三基色的值可以用式子( 2 2 ) 计算得到,式 子中的,( a ) ,;( ,b ( 4 ) 就是图2 1 中三基色刺激值的曲线。因此测量一束光线 的颜色,除了用前面所述的配色方法以外,也可以先测定反射光谱 c ( 4 ) = i ( a ) s ( 4 ) ,然后再利用式子( 2 2 ) 积分得到: 尺= p ( 五) s ( 旯) ;( 五) d 五 g = p ( 五) s ( 兄) ;( 兄) d a ( 2 2 ) 口= p ( 旯) s ( 允) 云( 五) d 允 从图2 1 可以看到r ( 4 ) 存在负值,这在物理上没有对应的传感器,实际应用的 r g b 传感器的响应曲线如图2 2 所示。为什么用这三种基本颜色就可以表征自然 世界的任何颜色? 为什么人眼正好有三类颜色感光细胞? 1 9 6 4 年j u d d 等人首次用 9 主元分析法( p c a ) 对6 2 2 个太阳光照射下的目标颜色光谱进行分析,发现任何一个 光谱都可以用三个固定光谱的线性组合很好的近似。这个结论为很多人用实验重 现,c o h e n 和m a l o n e y 也都做了进一步探索,m a l o n e y 用p c a 分析了1 5 6 9 个 m u n s e l l 颜色样本,发现9 8 9 的能量集中在三个基函数上。因此三基色是人类视 觉系统对自然界的颜色进行统计后得出的最好近似。自然界的颜色具有这样的特 点,它既是三基色配色原理的物理基础,也是颜色不变性算法的基础。 、 b 、 入殳 k 。x 、 。 3 0 04 6 0 5 0 0 5 8 0 6 2 0 t o o 波长:埔 图2 2 传感器响应曲线图 f i g u r e2 2r e s p o n s ec u l v eo ft h es e n s o r 2 2颜色直方图介绍 图像颜色特征最为直接的一种表达方式就是颜色直方图。颜色直方图反映的 是图像中颜色的组成分布,即出现了哪些颜色以及各种颜色出现的概率。s w a i n 和 b a l l a r d 1 0 1 最先提出了使用颜色直方图作为图像颜色特征的表示方法。他们还指出 颜色直方图相对于图像的以观察轴心的旋转以及幅度不大的平移和缩放等几何变 换是不敏感的。颜色直方图对于图像质量的变化、模糊性也不甚敏感。颜色直方 图的这种特性使得它比较适合于检索图像的全局颜色相似性的场合,即通过比较 颜色直方图的差异来衡量两幅图像在颜色全局分布上的差异。 2 2 1全局直方图 全局直方图的定义如( 2 3 ) : 1 0 刺激值 j l ( 后) = 刀。n ( 2 3 ) 其中,k 代表图像的像素值,以。代表颜色像素值为k 的像素的个数,是图像像 素点的总数。 全局直方图包含了该图像中所有颜色值出现的频数,但是其丢失了某像素所 在的空间位置信息。颜色直方图虽然具有对图像旋转、缩放、仿射等变换的鲁棒 性,但是直方图检索方法还是有一定的缺陷。任意一幅图像都能唯一的给出一幅 与它对应的直方图,但不同的图像可能有相同的颜色分布,从而就具有相同的直 方图。因此直方图与图像是一对多的关系。正是由于这种原因,造成了直方图在 颜色特征上的表示误差。由于基于颜色直方图的图像检索结果的不稳定性,人们 对颜色直方图又做了进一步的探究,把颜色直方图进行分解和累加。下面介绍颜 色累加直方图。 2 2 2累加直方图【- 6 1 传统的颜色直方图方法在整幅图上统计颜色的分布信息,因而丢失了颜色的 空间分布信息,而颜色的空间分布特征对于区分图像的内容是非常重要的,如查 找含有足球场的图像,如果能够限定图像主体部分颜色为绿色,则可以明显地提 高检索的精度,过去为了获得颜色的空间分布信息一般将图像平均分成三块( 或者 上、中、下或者左、中、右三部分) 。因为图像的主体内容一般位于图像的中间大 部分,周围的背景部分占较小的面积,所以这种均匀分块的方法没有突出图像中 间的主体部分并且没有充分限制背景的范围,而且容易将主体划分在不同块内, 破坏了图像原本所要表达的一致性与完整性。一般来说,图像的中间部分为图像 内容的主体部分,图像的四周部分为主体内容所在的场景。将图像分为较多的块 数可以提高图像的空间分辨率,但同时增大了图像特征的存储空间,而且可能使 图像分得过于破碎或者颜色信息不够丰富,从而使图像的检索精度下降。因此, 实际的分块数目应是一个折中的选择,过多或者过少都会给特征提取和检索结果 带来很大的误差。由上可知,累加颜色直方图能增加直方图的鲁棒性,更准确的 表示图像的颜色信息。若一幅图像的某一特征的一般直方图为 日( p ) = ( 以。,以:k ) ,则该特征的累加直方图能根据下面的式子( 2 4 ) 计算得到: g ( p ) = ( q l ,g x 2 q r g 。) u 4 ) 上式子说明了累加直方图是图像中的各个子直方图的线性组合。 累加直方图的计算还要进行颜色空间的转换,一般来说,任何颜色都可以用 三基色r g b 来表示。r g b 颜色空间是一种常见的颜色表示法,但r g b 颜色空间 韭噩至亟厶堂亟士生位监童题色丕变世描述 与人眼的感知差异很大。例如,距离为5 0 的( o , o ,0 ) 与4 0 ,0 ,0 ) 两种r o b 颜色认为 是同一黑色而距离为5 0 的( 2 0 0 ,l s o , o ) 和( 2 0 0 ,2 0 0 , 0 ) 0 是差别很大的两种颜色( 黄 色和绿色) 。因此,为了使算法对于颜色距离的定义符合人的视觉特征,采用较能 符合人限感知特性的h s v 颜色空间( 色调h 、饱和度s 和亮度v ) t ”f 。一幅图像的 颜色一般都会非常的多,因此,颜色直方图矢量的维数会非常多,必然会增加计 算量。如果对h s v 色彩空间进行适当的量化后再计算直方图就会减少计算量, 提高计算效率。但过度缩减维数会丢失图像的特征信息,所以还要防止盲目缩减 维数。 口酮羽 g 凹23 不同光照r 同场景盼两幅嘲像对廊的个颜色通道的直方凹。由丁光照的影响,两幅 凹像的直方闺莘异很人。 f i g u r e2 3 t h es a m cs c e n eu n d i f f e r e n t ill u m i n a t i o nt w o i r r “g e sc o r r e s p o n d s t o t h e h i s t o g r a mo f t h e t h r e ec o l o rc h a n n e l sd u e t o t h ee f f e c t so f l i g h t ,t w o i m a g e sh a v ed i f f e r e n tc o l o r h i s t o g r a m s 图2 3 给出了一个图像颜色直方图的实例。从图中可以看出,无论用哪种方法 提取颜色直方图,两幅图像虽然场景内容完全一样,但是由于光照影响,他们的 颜色直方图分布差异非常大。颜色直方图虽然具有对图像旋转、缩放、仿射等变 换的鲁棒性,但是很容易受到光照变化的影响。因此,在实际的检索系统中,无 论直方图信息怎样优化,利用其所提取的颜色特征向量始终无法弥补光照条件带 来的检索误差。 2 2 3 颜色直方图构造过程及关键技术 基于特征数据库的直方图构造可概括为两个阶段:首先确定直方图的颜色集, 然后任意一幅图像可以通过映射表量化到颜色集,经过统计得到直方图。具体步 骤如下所示: 1 首先转换颜色空间; 2 在图像数据库中统计各幅图像各个颜色的概率分布; 3 用直方图的颜色集量化输入图像,得到量化图像; 4 在量化后图像上统计颜色直方图,作为图像的颜色信息的表示。 以上各个阶段采用不同的方法,都可以产生新的直方图构造算法,但是在各 个阶段如何选择算法和参数,尚没有最佳的选择。构造颜色直方图的关键技术主 要包括: 1 如何选择直方图代表颜色集,包括确定颜色数量和颜色集。为了使选择的颜色 更具有代表性,通常使用聚类方法产生代表颜色集,以尽可能充分的利用直方 图的颜色总数,以尽可能准确的反映图像的颜色信息,为图像在颜色上的匹配 奠定基础。 2 颜色空间的选取和特征分析。 3 如何使颜色空问、直方图颜色集的选取更符合人眼的视觉特性。 4 如何提高直方图的构造速度。一般通过合并颜色空间量化和颜色空间转换步 骤,并使用映射表进一步提高速度,颜色空间的量化通常占用最长的时间。研 究快速的量化方法对直

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论