(计算机应用技术专业论文)颜色恒常性计算研究.pdf_第1页
(计算机应用技术专业论文)颜色恒常性计算研究.pdf_第2页
(计算机应用技术专业论文)颜色恒常性计算研究.pdf_第3页
(计算机应用技术专业论文)颜色恒常性计算研究.pdf_第4页
(计算机应用技术专业论文)颜色恒常性计算研究.pdf_第5页
已阅读5页,还剩116页未读 继续免费阅读

(计算机应用技术专业论文)颜色恒常性计算研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要:知觉恒常性作为人类视觉系统最基本和最重要的功能之一,对人类正确稳 定地感知世界起着极其重要的作用。为了使计算机视觉系统具有类似的感知功能, 知觉恒常性计算成为了计算机视觉领域中一个重要的研究课题。论文以知觉恒常 性中的颜色恒常性作为研究对象,从无监督的颜色恒常性计算、有监督的颜色恒 常性计算、颜色恒常性算法的融合、以及颜色不变性描述四个方面展开了颜色恒 常性计算的研究: 在无监督的颜色恒常性计算上,针对目前g s i ( g r e ys u r f a c ei d e n t i f i c a t i o n ) 算法 依赖于相机参数的缺点,提出了一种基于灰色表面的颜色恒常性算法( c o l o r c o n s t a n c yu s i n ga c h r o m a t i cs u r f a c e ,c c a s ) 。该算法利用迭代的方法来进行灰色表 面提取,从而避免了需要获取相机的成像参数。利用c c a s 算法得到的灰色表面 来估计图像的光照颜色,可以很大地提高光照估计的准确度。 在有监督的颜色恒常性计算上,为了克服基于支持向量回归的颜色恒常性算 法的单一输出、参数调节繁琐、以及学习速度缓慢的缺点,引入了一种全新的单 隐藏层前向神经网络的学习算法e l m ( e x t r e m el e a r n i n gm a c h i n e ) 算法,提出了一 种基于e l m 的颜色恒常性算法。此外,为了克服传统的二值化的色度直方图特征 维数过高的缺点,论文基于g r e ye d g e 算法框架提取了一种新的低维高效的图像特 征作为基于e l m 的颜色恒常性算法的输入向量。 在颜色恒常性算法的融合上,利用威布尔( w e i b u l l ) 分布参数的图像纹理描述 方法,综合考虑图像的全局纹理特征和局部纹理特征的基础上,提出了一种基于 纹理相似性的自然图像的颜色恒常性计算算法。该算法利用g r e ye d g e 算法框架作 为颜色恒常性算法的产生器,根据图像的纹理特征,为其选择一个最优的颜色恒 常性算法或算法组合。 在颜色不变性描述上,基于鲁棒的d i a g o n a l o f f s e t 反射模型,定义了两个新 的颜色空间。在两个新的颜色空间上,引入了不变矩理论,提出一个基于不变矩 的颜色不变性描述子的计算框架。根据不同的颜色空间选择,该框架可以产生: 原始图像的颜色不变性描述子和边缘图像的颜色不变性描述子。而这两个描述子 的融合又构成了融合的颜色不变性描述子。这些颜色不变性描述子不仅具有对图 像光照变化的鲁棒性,而且还具有对图像几何变化以及图像模糊的鲁棒性。 图4 3 幅,表2 5 个,参考文献1 2 7 篇。 关键词:颜色恒常性,颜色不变性描述,e l m ,威布尔分布,不变矩 分类号:t p3 9 1 j 匕惠交通厶堂簋堂僮j 金塞垦盟b 盟 a b s t r a c t a b s t r a c t :a so n eo ft h em o s tb a s i ca n di m p o r t a n tv i s u a lf u n c t i o n s ,p e r c e p t u a l c o n s t a n c yp l a y sak e yr o l ef o rt h eh u m a nb e i n g ss t a b l yp e r c e i v i n gt h er e a lw o r l d i n o r d e rt om a k ec o m p u t e rv i s i o ns y s t e mh a v et h es i m i l a rv i s u a lp e r c e p t i o nf u n c t i o n , p e r c e p t u a lc o n s t a n c yc o m p u t a t i o nh a sb e c o m eo n eo ft h em o s ti m p o r t a n tr e s e a r c ht o p i c i nt h ec o m p u t e rv i s i o nf i e l d t h i sd i s s e r t a t i o nf o c u s e so nt h ec o l o rc o n s t a n c y c o m p u t a t i o n ,a n ds t u d i e st h i st o p i cf r o mf o u ra s p e c t s :u n s u p e r v i s e dc o l o rc o n s t a n c y , s u p e r v i s e dc o l o rc o n s t a n c y , c o l o r c o n s t a n c ya l g o r i t h m sf u s i o na n dc o l o ri n v a r i a n t f o rt h eu n s u p e r v i s e dc o l o rc o n s t a n c yc o m p u t a t i o n ,t h er e c e n t l yp r o p o s e dc o l o r c o n s t a n c ya l g o r i t h mg s i ( g r e ys u r f a c ei d e n t i f i c a t i o n ) i sac a l t l e r a - d e p e n d e n ts o l u t i o n a n ds u f f e r sf r o m c a m e r ac a l i b r a t i o nr e q u i r e m e n t i no r d e rt oa v o i dc a l i b r a t i n gac a m e r a , w ep r o p o s ea l li t e r a t i v ea l g o r i t h m ,w h i c hi sc a l l e dc o l o rc o n s t a n c yu s i n ga c h r o m a t i c s u r f a c e ( c c a s ) t h ea c h r o m a t i cs u r f a c e si d e n t i f i e db yt h ec c a sa l g o r i t h mc a nb eu s e d t oe s t i m a t ei l l u m i n a t i o no fa ni m a g e ,w h i c hc a ns i g n i f i c a n t l yi m p r o v ea c c u r a c yo f i l l u m i n a t i o ne s t i m a t i o n f o rt h es u p e r v i s e dc o l o rc o n s t a n c yc o m p u t a t i o n ,b yi n t r o d u c i n gan o v e lm a c h i n e l e a r n i n ga l g o r i t h me x t r e m el e a r n i n gm a c h i n e ( e l m ) ,w ep r o p o s ean e wc o l o r c o n s t a n c ya l g o r i t h mn a m e dc o l o rc o n s t a n c yu s i n ge l m ,w h i c hc a no v e r c o m et h es i n g l e o u t p u t ,c o m p l e xp a r a m e t e rt u n i n ga n dl o wt r a i n i n gs p e e do ft h es v rb a s e dc o l o r c o n s t a n c ya l g o r i t h m i na d d i t i o n ,d i s c a r d i n gt h et r a d i t i o n a lh i g hd i m e n s i o n a lb i n a r i z e d c h r o m a t i c i t yh i s t o g r a mf e a t u r e ,an e wl o wd i m e n s i o n a la n de f f e c t i v ef e a t u r ev e c t o ri s e x t r a c t e db a s e do nt h eg r e y e d g ef r a m e w o r k ,w h i c hi su s e da st h ei n p u tf o rt h ee l m b a s e da l g o r i t h m f o rt h ec o l o rc o n s t a n c ya l g o r i t h m sf u s i o n ,b a s e do nt h ei m a g et e x t u r ed e s c r i p t i o n w i t hw e i b u l lp a r a m e t e r i z a t i o n ,w ep r o p o s ean e wc o l o rc o n s t a n c yf u s i o ns c h e m ec a l l e d c o l o rc o n s t a n c yb a s e do nt e x t u r es i m i l a r i t yf o rn a t u r a li m a g e s b yu s i n gt h eg r e ye d g e f r a m e w o r ka st h ea l g o r i t h mg e n e r a t o lt h ep r o p o s e df u s i n ga l g o r i t h mc a ns e l e c tt h eb e s t c o l o rc o n s t a n c ym e t h o d ( o rb e s tc o m b i n a t i o no ft h em e t h o d s ) f o rt h ec e r t a i ni m a g e , a c c o r d i n gt oi t sb o t hg l o b a lt e x t u r ef e a t u r ea n dl o c a lt e x u t u r ef e a t u r e f o rt h ec o l o ri n v a r i a n td e s c r i p t i o n ,t w on e wc o l o rs p a c e sa r ed e f i n e db a s e do nt h e r o b u s td i a g o n a l o f f s e tr e f l e c t a n c em o d e l i nt h et w oc o l o rs p a c e s ,ac o l o ri n v a r i a n t d e s c r i p t o rc o m p u t a t i o nf r a m e w o r k i s p r o p o s e d ,b yi n t r o d u c i n gm o m e n ti n v a r i a n t s t h e o r y a c c o r d i n gt o d i f f e r e n tc o l o rs p a c es e l e c t i o n ,t h e d e s c r i p t o rc o m p u t a t i o n f r a m e w o r kc a ng e n e r a t eo r i g i n a li m a g ec o l o ri n v a r i a n td e s c r i p t o ra n de d g ei m a g ec o l o r i n v a r i a n td e s c r i p t o r t h ec o m b i n a t i o nt h e r e o fc a ns e r v ea sc o m b i n a t i o n a lc o l o ri n v a r i a n t d e s c r i p t o r a l lt h e s ed e s c r i p t o r sa r en o to n l yr o b u s tt oi l l u m i n a t i o nc h a n g e ,b u ta l s o r o b u s tt oa f f i n et r a n s f o r m a t i o na n di m a g eb l u r r i n g k e y w o r d s :c o l o rc o n s t a n c y , c o l o ri n v a r i a n t ,e l m ,w e i b u l ld i s t r i b u t i o n ,m o m e n t i n v a r i a n t s c l a s s n 0 :t p 3 9 1 v 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特i i i i 以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名菇善签字同期:必7 矿月厶同 1 1 6 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名 签字日期:夕舯歹年月珀 | 聊虢恸t 致谢 值此博士论文完成之际,回忆起在北京交通大学度过的难忘的九年时光( 本 科四年和博士五年) ,心中感慨万千。论文的完成浸透着多年来各位老师、同学以 及家人对我的关心和帮助。 首先感谢我的导师须德教授,在课题研究上的悉心指导、在学业和工作上的 无私帮助以及在生活等许多方面的谆谆教诲,都让我受益匪浅,尤其是他严谨的 学风和科学的思维,更是为作者以后的科研工作树立了典范。感谢宋泽海老师在 学习、生活及科研上的支持和帮助。感谢那位与我素未谋面,却给了我许多帮助 的,远在异国他乡的良师益友熊博士( d rw e i h u ax i o n g ) 。 感谢北京交通大学计算机学院的黄厚宽教授、阮秋琦教授、罗四维教授、韩 臻教授和赵耀教授对论文工作的指导和建议。他们独到且富有洞察力的见解、严 谨的科研态度使我受益匪浅。 感谢曾经关心过我、教育过我的沈林生老师、王六寿老师和张学龙老师。是 他们带着我一步一步从偏远的农村走进大学的殿堂。 感谢在北京交通大学多媒体数据库实验室工作过的王方石副教授、许宏丽副 教授、郎丛妍博士、吴爱民博士、冯松鹤博士以及鹿瑞、王宁、刘硕研、王金华 等博士生。论文的完成也得益于与他们的学术讨论。 感谢我亲爱的父亲、母亲。他们不仅将我带到这个美丽的世界,而且不辞辛 苦地供我读书、教我做人。感谢我可爱的妹妹,她给我的生活带来了如此多的欢 乐和笑声。特别要感谢我温柔善良的妻子郑玲,在我读博士期间,无论身处顺境 还是遇到挫折,她都给予了我真诚的理解和鼓励。 最后,真诚地感谢每一位曾经支持、帮助和关心过我的老师、亲人和朋友! 1 1课题的研究背景 1 绪论 计算机视觉是研究用计算机来模拟人类视觉功能的科学与技术;计算机视觉 的研究目标是使计算机具有通过二维图像认知三维环境信息的能力,然后达到认 识和感知世界的目的【l 。】。通过近几十年的努力,人们在计算机视觉领域取得了卓 有成效的研究成果,形成了一整套完整有效的理论和算法,并广泛应用于物体识 别、遥感图像分析、医学图像处理、多媒体技术、图像数据库、工业检测、军事 等领域。但是,计算机视觉系统目前仍处于不成熟的阶段,这既表现在它的关键 技术不成熟,如图像分割技术、边缘检测技术等,又表现在它的基本应用不成熟, 如物体识别能力较低、算法评价标准互相矛盾【3 】。尤其与人类的视觉系统相比较, 计算机视觉系统还处在一个初级的、低等的发展阶段。为了使计算机视觉系统具 有类似于人类视觉系统的视觉感知能力,广大的计算机视觉研究者开始致力于可 计算的视觉感知方面的研究。 计算机视觉理论奠基人之一,著名学者m a r r 在他的著作( ( v i s i o n ) ) 中,从物 理学、神经科学、生理学、心理学等学科出发,系统地阐述了计算机视觉的理论、 算法与机制,奠定了计算机视觉的理论基础【4 】。近年来,随着神经科学、视觉认知 科学、脑科学以及心理学的迅猛发展,国内外的研究者愈来愈重视视觉认知科学 在计算视觉中的应用研究。自1 9 7 8 年以来,每年举办的欧洲视觉感知会议( e u r o p e a n c o n f e r e n c eo nv i s u a lp e r c e p t i o n ,e c v p ) ,专门讨论视觉感知及其在计算机视觉领 域应用的研究成果。从1 9 9 8 年始,i e e e 的计算机分会经常举行专f - jw o r k s h o p 讨 论知觉组织在计算机视觉中的应用( p e r c e p t u a lo r g a n i z a t i o ni nc o m p u t e rv i s i o n , p o c v ) ,以促进智能视觉系统的研究。从2 0 0 0 年开始,i e e e 每两年举行一次生物 启示下的计算机视觉的研讨会( b i o l o g i c a l l ym o t i v a t e dc o m p u t e rv i s i o n ,b m c v ) ; 它的目标是在对人类视觉理解、建模的基础上,促进计算机视觉的发展。国际成 像科学与技术协会( i s & t ) 在其每年的重要会议c o l o ri m a g i n gc o n f e r e n c e 上经常开 辟了专门的颜色感知论坛。a c m 协会开辟了专门的期刊a c mt r a n s o na p p l i e d p e r c e p t i o n 用来发表视觉感知在计算机视觉方面应用的研究成果。国际期刊 e u r a s i p j a s p 在2 0 0 6 年征集了图像感知( i m a g ep e r c e p t i o n ) 的专题论文;除此之 外,每年在i c c v 、e c c v 、c v p r 等重要的计算机视觉相关的国际会议以及u c v 、 i e e et r a n s o np a m i 、j o f v i s i o n 等重要的期刊上都有相关的研究成果发表。 目前,在计算机视觉领域中,研究比较深入、应用比较广泛的视觉认知和视 觉心理学领域的理论主要有: ( 1 ) 注意力机制 视觉注意是属于神经生物学范畴的概念,它是生物视觉信息处理过程中一个 非常重要的过程。当视网膜潜在拥有整个场景时,注意力一次只集中在一个或者 为数很少的几个区域上【5 】。n e i s s e r 等【6 】将注意力机制引入视觉信息分析的研究,基 于空间特征的不连续性提出用p o p o u t 概念来表征信息的显著性的方法。以特征整 合理论为基础,l i t t i 等【7 】提出了一个模拟生物视觉的注意机制的计算模型。目前, 视觉注意力机制计算模型已经被逐步地应用于物体识别【引、图像和视频的内容分析 【9 】以及w e b 图像挖掘【i o 】等领域。 ( 2 ) 拓扑认知理论 中国科学院陈霖等【l l 】发现蜜蜂能够辨别拓扑性质,从而有力地支持了拓扑性 质初期知觉理论,并进而创立和发展了“大范围首先”的视知觉拓扑结构和功能 层次理论。该理论认为,在视觉处理的早期阶段,人的视觉系统首先检测图形的 拓扑性质:它对图形的大范围拓扑性质敏感,而对图形的局部几何性质不敏感。 视觉过程是从大范围拓扑性质的知觉组织开始的;以拓扑性质为基础的各级几何 不变性是图形知觉的基本表达【3 】。陈霖认为,图形的封闭性、连通性等都是图形 的拓扑学性质。图形的具体形状可能千差万别,但只要它们的拓扑性质相同,就 可以说它们是拓扑性质等价的图形。在视觉早期信息加工中,视觉系统对这些大 范围的拓扑学性质更加敏感。视觉系统先加工图形的拓扑性质,然后才加工它的 局部性质。基于拓扑认知理论,a p o s t o l o f f 等【l2 j 设计的分类器利用t - 型交会点获 取视频中的遮挡表面。s t a h l 等【l3 】利用知觉组织检测边缘图像中的凸结构。知觉组 织对于获取图像鲁棒的对象表示起着重要的作用,通过知觉组织获取对象整体的 拓扑特征,可以有效地建立对象表示。 ( 3 ) 知觉恒常性计算理论 根据几何光学知识,物体在视网膜的映像轮廓不同于物体的轮廓,会随着人 和环境的变化而不断变化,而且几乎每时每刻都在发生变化。但是对我们而言, 外界的物体看上去都是恒定的,有着恒定的大小、形状、亮度、颜色。这种现象 称作知觉恒常性( p e r c e p t i o nc o n s t a n c y ) 1 4 】。知觉恒常性主要包含:大小恒常性、形 状恒常性、亮度恒常性及颜色恒常性四个方面的恒常性。在计算机视觉领域中, 已有的文献对四个恒常性都有一定的关注和研究。知觉恒常性计算的目的就是要 消除距离、视角、光照颜色、光照强度等外界环境因素对物体图像的尺寸、形状、 颜色以及亮度的影响,得到一种与外部环境因素无关的、刻画物体本身物理特性 的、鲁棒的特征描述子;从而降低计算机视觉系统受外部环境因素的干扰、提高 2 其鲁棒性和稳定性。 除了上述的几个视觉认知理论外,已经在计算机视觉中应用的还有视觉推理 机制【1 5 17 1 、基元理谢18 1 、格式塔组织原理【1 9 。2 0 1 等等。 在上述得视觉认知理论中,知觉恒常性计算理论对于计算机视觉来说是非常 重要且研究较多理论之一。知觉恒常性功能作为人类视觉系统最基本和最重要的 功能之一,对人类正确稳定地感知世界起着极其重要的作用。类似的恒常性功能 对于稳定的计算机视觉系统也是非常必要的。本论文主要关注的是知觉恒常性计 算理论中的颜色恒常性计算问题。 1 2 课题的研究意义 十七世纪初,法国哲学家勒内笛卡尔为了显示出呈现在眼睛视网膜上的视觉 映像做了这样一个实验【l4 1 。他取下一只牛眼,把它放入一个框子,削去眼睛后部 使之成为半透明的。然后观察这个视网膜就能明白世界是如何投影到眼睛里的。 通过实验发现,视网膜上的影像对于实景的表现是失真的。物体在视网膜上的成 像随着人和环境的变化而变化。虽然视网膜上的物体的映像是极其不稳定的、实 时变化的,但是人类对外界物体的感知是恒定的,认为物体有恒定的形状、大小、 亮度、以及颜色。这就是知觉恒常性( p e r c e p t u a lc o n s t a n c y ) 现象。视觉心理学家们 将知觉恒常性分为:大小恒常性( s i z ec o n s t a n c y ) ,颜色恒常性( c o l o rc o n s t a n c y ) ,形 状恒常性( s h a p ec o n s t a n c y ) ,亮度恒常性( b n g h t n e s sc o n s t a n c y ) 【1 4 2 1 1 。 图1 1 演示的为四个知觉恒常性现象的实例。图1 1 ( a ) 为大小恒常性实例, 虽然图像中人物的高度相差很大,但是我们却感知到远处的人和近处的入拥有相 似的身高。图1 1 ( b ) 演示的是一个颜色恒常性的例子,同样一个瓶子,在不同的 光照下,其颜色分布有着非常大的差异,然而我们人类的视觉系统却能几乎完全 消除光照的影响,很稳定地感知到物体表面真实的颜色特性。图1 1 ( c ) 0 0 ,同样 一扇门通过不同视角观察时,它将显示为完全不同的性状( 矩形、梯形、平行四 边形等等) ,但是我们能够正确地感知到这扇门为矩形。亮度恒常性的例子如图 l - l ( d ) 所示。在该图中,同样亮度( 或灰度) 的圆环,在左侧和右侧环境下我们感 知到的亮度是完全不一样的;我们明显感觉到左侧的圆环的亮度要比右侧的亮很 多。这个例子说明了人类视觉系统不仅仅以入射到人眼的光线强度作为亮度感知 的依据。通过近几年的研究与发展,知觉恒常性计算在计算机视觉领域也取得了 一系列有效的理论和应用的研究成果【2 2 砚】。 与其它三个恒常性功能相比,颜色恒常性在计算机视觉有着更为重要的地位 和意义。颜色是视觉信息中最为基础也最为直接的特征之一;并且被广泛地应用 3 a 趸窑丑左堂照生位i 幺窑 缝j 幺 于图像检素、物体识别等应用领域。但是颜色特征也是一种极不稳定的视觉特征, 很容易受到光照变化的影响。因此,一种稳定的对光照变化鲁棒颜色特征的描述 子对于稳定的计算机视觉系统来说,是极其重要和必需的。而颜色恒常性计算的 目的就是消除光照对颜色的影响,得到一种与光照无关的颜色描述子。因此,颜 色恒常性计算对于计算机视觉具有极其重要的理论和实用意义。如果能够真正地 实现计算机视觉的颜色恒常性功能,那将会给计算机视觉系统带来质的飞跃。鉴 于颜色恒常性计算对计算机视觉的重要意义,本论文将颜色恒常性计算作为研究 的主要内容。 颜色恒常性计算是一个多学科交叉性很强的研究课题,融合了计算机视觉、 信号处理、人工智能和认知科学等学科的相关技术。因此吸引了来自这些学科领 域的众多研究者分别从视觉心理学、物理光学和计算机视觉等不同角度进行研究。 目前,部分颜色恒常性计算的研究成果已经被应用相机白平衡、图像的颜色映射、 人脸检测等实际的应用领域。本论文主要从计算机视觉的角度,基于可计算模型 来进行颜色恒常性计算问题的研究。 图卜1 知觉恒常性示倒( ) 大小恒常性( b ) 颜色恒常性( c ) 形状恒常性( d ) 亮度恒常性( 彩 图见附录 ) 1 3国内外研究现状 颜色恒常性作为四个知觉恒常性中的重要组成部分,在计算机视觉中也得到 了广泛的关注和深入的研究。本节中,我们将总结颜色恒常性计算在计算机视觉 领域中的发展和研究现状。 l r a i n i o n 印e c t r a s u r f a c e r 匝e c t a n c 8 ( a ) o b s 目v e d s p e c 订a p e r c e p t i o n 隔y 国 s pe c t r ar e q 3o n s ef u n c t i o n ss a m p l e p 多仨三b 薹y ( b ) 图卜2 图像中物体表面颜色形成的过程( ) 光线照射到物体表面经过反射进入人眼才能被人感知 物体表面的颜色( b ) 进入人眼的光线经过人眼中不同感光函数的视觉细胞采样后形成三个通道的 颜色信号 人眼、相机以及其他的各种成像设备在获取图像的时候,至少依赖于三个方 面的因素:成像时场景所处的光照条件、场景中物体表面的反射率以及成像设备 镜头的感光系数【3 3 3 4 】。图1 2 描述了人眼成像的基本过程。从图中可以看出,三个 方面的因素任何一个发生变化都会给最终的颜色信号造成很大的影响。一般地, 我们忽略镜头感光系数的差异对图像的影响,那么仍然存在光照这个外界因素对 图像的颜色产生影响。对于同一物体表面,不同的光照可能会产生完全不同的颜 色,因此颜色是一种极不稳定的视觉特征。但是幸运的是,人类的视觉系统拥有 颜色恒常性这一重要的视觉感知功能,它能消除光照对颜色的影响,得到物体表 面的真正的颜色特性( 一般指白光下的物体表面的颜色) 。为了提高计算机视觉系 统的稳定性,计算机学者们将颜色恒常性理论引入计算机视觉,提出了颜色恒常 性计算理论。颜色恒常性计算的目的就是要消除光照对图像颜色的影响,从而得 到物体表面与光照无关的颜色特性,为计算机视觉系统提供类似于人类视觉系统 的颜色恒常性感知功能。 图1 - 3 颜色恒常性计算研究的体系结构,其中虚线所包含部分为本论文主要的研究内容 颜色恒常性计算一般地可划分为单一光照下的颜色恒常性计算和多光照下颜 色恒常性计算两个方向来进行研究【3 5 - 3 6 ,如图1 3 所示。相对于单一光照条件,多 光照下的颜色恒常性计算要更为困难、更为复杂。现有的多光照条件下的颜色恒 常性计算算法主要有e l a n d 等提出r e t i n e x 算法【37 。r e t i n e x 算法来源于e l a n d 等对人类视觉的颜色感知的研究成果。该研究表明,人眼对颜色的感知不仅依赖 于物体表面反射进入人眼的光线的绝对值,而且与其周围表面的颜色也有很大的 关系。e l a n d 认为这种视觉机制不仅与视网膜( r e t i n a l ) 有关,还依赖于人脑( c o r t e x ) 的进一步处理,于是命名该算法为r e t i n e x ( r e t i n a l + c o r t e x ) 。r e t i n e x 算法假设图像 中颜色的平滑、微小的变化是由光照的变化引起的,而剧烈、快速的变化是由物 体表面反射率的变化引起的。r e t i n e x 算法不需要精确估计图像中各像素点成像时 的光照颜色,而是直接计算出其真实的颜色值。r e t i n e x 现在有很多各种改进版本 【3 8 删;最近,w x i o n g 等又提出了一种新的r e t i n e x 算法s t e r e or e t i n e x 。r e t i n e x 算法不仅能够应用于颜色恒常性计算,还广泛的应用于图像增强、遥感图像处理 6 等应用中【4 2 4 卅。m e b n e r 等也在多光照下的颜色恒常性计算领域作出了很多重要 的研究工作【3 们,他提出的很多多光照下的颜色恒常性计算算法都是以像素点的局 部平均颜色( l o c a la v e r a g ec o l o r ) 作为该点的初始光照值 4 5 - 4 7 】,然后通过迭代的方 法优化光照的估计结果。因此,我们将这一类方法统称为基于局部均值的算法。 除此之外,k b a m a r d ,gd f i n l a y s o n 和b f u n t 等都提出的一些变化光照下的颜 色恒常性计算算法【4 8 4 9 1 。但是,目前更多的研究仍然还是在单一光照下的颜色恒 常性计算的研究。单一光照下的颜色恒常性计算的前提是假设图像成像时,场景 中只有一种光照;即使存在多种光照也将其平均地看成一种光照【5 0 】。本论文中所 有有关颜色恒常性计算研究部分也都是以单一光照为假设前提,因此对于多光照 下的颜色恒常性计算本论文不予过多的讨论。在没有特殊说明的情况下,本论文 中所说的颜色恒常性计算都是指单一光照条件下的颜色恒常性计算。 单一光照下颜色恒常性计算又可分为两个主要的研究方向( 如图1 3 ) :图像 的光照估计( 颜色恒常性计算) 和颜色不变性描述。一般地为了简单起见,在很 多论文中( 如 3 3 ,3 4 等) 都将图像的光照估计直接称作为颜色恒常性计算( c o l o r c o n s t a n c y 或c o l o rc o n s t a n c yc o m p u t a t i o n ) 。因此,本论文第二、三、四章中的颜 色恒常性计算指的都是图像的光照估计。本论文选择了图像的光照估计( 颜色恒 常性计算) 和颜色不变性描述作为两个重要的研究内容。以下我们将分别对这两 个研究方向的发展过程和现状进行简要地总结: ( 1 ) 图像的光照估计( 颜色恒常性计算) 图像的光照估计( 颜色恒常性计算) 的目的是将未知光照条件下的图像矫正 到标准白光下的图像,这个过程一般可分为两个步骤【5 1 】:首先估计出图像成像时 的光照颜色,然后利用v o nk r i e s 模型【5 2 】( 又称对角模型,第二章中有详细介绍) 将图像映射到标准白光下。由于第二步只是相对简单的计算过程;因此绝大多数 的颜色恒常性算法都是主要关注图像的光照估计的问题,并将图像的光照估计直 接称为颜色恒常性计算。光照估计得越精确,则图像矫正的就越准确,也就可以 获得更好的图像的白平衡效果。根据w x i o n g 3 5 】的观点,可将图像的光照估计算 法分为无监督的算法和有监督的算法。 无监督的颜色恒常性计算 无监督的颜色恒常性计算算法是指利用图像本身底层的颜色特征估计得到图 像成像时的光照颜色,而不依赖于其他的先验知识。由于图像的光照估计本身是 一个病态的问题,在没有适当的假设或限制的情况下是无法解决洲弱】。为了解决 这个问题,各种各样的假设被提出。最简单的一种就是w h i t ep a t c h 假设瞰】:图像 中r g b 颜色通道的最大响应是由场景中的白色表面引起的。即w h i t ep a t c h 假设 认为图像中存在白色表面,于是r g b 三个颜色通道的最大值将被用作图像的光照 7 颜色。因此,w h i t ep a t c h 算法又被称为m a x r g b 算法。g r e yw o r l d 算法是另一个 比较简单并且广泛应用的颜色恒常性计算算法。该算法是基于g r e yw o r l d 假设提 出的。g r e yw o r l d 假设认为:场景中所有物理表面的平均反射是无色差的( 灰色 的) ( t h ea v e r a g er e f l e c t a n c ei nas c e n ei sa c h r o m a t i c ) n5 | 。也就是说,在r g b 三个颜 色通道下,场景中的对三个颜色通道的平均反射率是相等的。因此,三个通道的 平均值可以看作图像的光照颜色。为了将g r e yw | o r l d 更一般化,f i n l a y s o n 等【5 6 】将 闵可夫斯基范式( m i n k o w s k i n o r m ) 引入到g r e yw o r l d 算法,提出了一种s h a d e so f g r e y ( s o g ) 算法。s o g 算法利用m i n k o w s k i n o r m 距离代替简单求平均值的方法。 最近,j v w e i j e r 等【5 7 j 通过对对立颜色空间上( o p p o n e n tc o l o rs p a c e ) 医 像颜色导数 分布观察,提出一种新的g r e ye d g e 假设:场景中所有物理表面的平均反射差分是 无色差的( 灰色的) ( t h ea v e r a g eo f t h er e f l e c t a n c ed i f f e r e n c e si nas c e n ei sa c h r o m a t i c ) 。 基于g r e ye d g e 假设,j v w e i j e r 等提出了一个统一的颜色恒常性计算框架,该框 架不仅包含了m a x r g b 、g r e yw r o 订d 、以及s h a d e so f g r e y 算法,并且可将颜色恒 常性计算推广到图像的高阶导数空间上来进行。w x i o n g 等【5 8 】借鉴g r e yw b r l d 和 m a x r g b 算法的优点,提出了一种图像光照估计的技巧:由于场景中无色差 r a c h r o m a t i c ) 表面( 即:标准白光下的灰色表面) 能够完全反映入射光照的颜色, 因此只要提取场景中这些无色差表面,然后利用这些表面的颜色就能精确地估计 出图像的光照颜色。基于该思想,w x i o n g 等【5 8 1 提出了一种叫做灰色表面提取的 颜色恒常性算法( g r e ys u r f a c ei d e n t i f i c a t i o n ,g s i ) 。除了上述的这些算法外,无监督 的颜色恒常性算法还有基于边缘分类的颜色恒常性计算【5 9 1 、基于图像区域的颜色 恒常性计算【删、基于有效区域的颜色恒常性计算【6 1 1 、基于局部均值的颜色恒常性 计算等等【6 2 1 。 除了无监督的颜色恒常性计算和有监督的颜色恒常性计算外,还有很多学者 利用现有的颜色恒常性算法的融合来进行光照估计 6 3 拼】,以提高光照估计的精确 度。此外,考虑到图像自身的特征,如何从现有的颜色恒常性算法中,根据给定 的图像的特点选择一个最为合适的算法或算法组合也是颜色恒常计算问题中的一 个重要课题。本论文的第四章将观注这个问题的研究。 有监督的颜色恒常性计算 有监督的颜色恒常性计算就是通过对各种光照下可能出现的颜色( 或色度) 的学习,来预测未知光照图像的光照颜色。色域映射算法( g a m u tm a p p i n g ) 是一种 重要的有监督的颜色恒常性计算算法,他是由f o r s y t h 等【6 5 】提出,后经f i n l a y s o n 等【删扩展,最近g i j s e n i j 等又将其提升到图像的高阶导数空剐d 7 1 。色域映射算法是 基于如下假设的:在某一特定光照下可能出现的所有的颜色,在色度空间上构成 一个封闭的、有界的凸集。详细的色域映射相关算法过程可参考文献 6 5 6 7 。基 8 于贝叶斯推理的颜色恒常性计算( b a y e s i a nc o l o rc o n s t a n c y ) 也是一种重要的有监督 的颜色恒常性计算算法,它最早是由b r a i n a r d 等提出的【6 8 1 ,后经r o s e n b e r g 6 9 】 g e h l e r i 7 0 】等进行了一系列改进。为了克服基于贝叶斯推理的颜色恒常性算法计算复 杂的缺点,f i n l a y s o n 等【】提出了一种更为实用化的算法,基于相关性的颜色恒常 性计算( c o l o rb yc o r r e l a t i o n ) 。实际上,c o l o rb yc o r r e l a t i o n 算法就是b a y e s i a nc o l o r c o n s t a n c y 算法的一种离散化的实现。c o l o rb yc o r r e l a t i o n 算法最大的问题在于, 所有光照估计的结果必须是在算法已给出的光照候选集中选取概率最大的。然而, 由于候选集本身是离散的,不可能提供所有可能的光照色度。为了解决这个问题, c a r d e i 掣7 2 j 引入了b p 神经网络的方法来进行图像的光照估计,这种方法最直接的 好处是能够给出连续的任意的输出结果。w x i o n g 等【7 3 】提出的基于支持向量回归 s v r ( s u p p o r tv e c t o rr e g r e s s i o n ) 的颜色恒常性算法也是一种重要的有监督的算法, 相对于基于b p 神经网络的方法,s v r 是一种基于全局最优的回归算法。除此之外, 其他的有监督的方法还包括基于薄板样条插值的颜色恒常性计算【7 4 1 、基于 k l d i v e r g e n c e 的颜色恒常性计算 7 5 1 ,基于投票的颜色恒常性计算【7 6 】等等 ( 2 ) 颜色不变性描述 颜色不变性描述是实现颜色恒常性功能的另一种重要途径。由于图像的光照 估计本身就是一个很困难的问题;与图像的光照估计相比,颜色不变性描述的最 大优点在于它不需要精确的估计出图像的光照,而是从图像提取与光照无关的颜 色特征信息。颜色作为一种最简单、直接、并且有效的特征已经广泛应用于计算 机视觉的应用中 7 7 - 7 9 】。颜色直方图是颜色特征的一种简单而有效的表现形式。 s w a i n 等【8 0 】提出的直方图相交算法应用于物体识别更是取得了很好的效果。颜色直 方图虽然具有对图像旋转、仿射等变换的鲁棒性,但是很容易受到光照变化的影 响。为了消除光照强度对颜色的影响,可将r g b 颜色空间转换为r g 色度空间,从 而构成色度直方图。但是,色度直方图仍然不能够消除光照颜色变化对图像颜色 带来的影响。为了克服该问题,f u n t 等【8 1 】提出了一种既对光照强度变化鲁棒又对 光照颜色变化鲁棒的颜色不变性描述子一一颜色恒常性的颜色索引( c o l o r c o n s t a n c yc o l o ri n d e x ,c c c i ) 。该描述子是利用颜色对数空间的导数来消除光照的 影响。g e v e r s 等【8 2 】又将c c c i 进行了扩展,进一步消除了视角和阴影对颜色的影 响。由于c c c i 描述子是基于颜色的导数得到的。因此依赖于图像的边缘信息并且 很容易受到图像模糊的干扰。为了克服c c c i 描述子对图像模糊的敏感性,j v w e i j e r 等【8 3 】提出了一种对模糊鲁棒的颜色不变性描述子的构造方案。除此之外, 还有基于颜色比的颜色不变性描述【8 4 1 、基于直方图均衡化的颜色不变性描述【8 5 】等 盘譬 号手。 目前,颜色恒常性计算的研究越来越受到国内外许多研究结构和大学的关注。 9 在国际上,有加拿大的西蒙弗雷泽大学( b f u n t ,kb a m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论