(计算机应用技术专业论文)基于信息熵的图像检索技术研究.pdf_第1页
(计算机应用技术专业论文)基于信息熵的图像检索技术研究.pdf_第2页
(计算机应用技术专业论文)基于信息熵的图像检索技术研究.pdf_第3页
(计算机应用技术专业论文)基于信息熵的图像检索技术研究.pdf_第4页
(计算机应用技术专业论文)基于信息熵的图像检索技术研究.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文 m a s r e r s1 i t g g l s 摘要 随着各行各业对图像的使用越来越广泛,图像信息资源的管理和检索显得 卜1 益重要。基于内容的图像检索( c b i r ) 技术的研究主要包括两个方面:可 视化特征提取和相似性度量。其中研究的主体是定义图像的可视化特征表示, 通常可视化特征的表示可分为三个级别:图像级别、矢量级别和数字级别。现 在大多数可视化特征的表示,诸如颜色、纹理、形状等,均是矢量级别的。因 此,相似性度量空间是n 维的,计算量相当巨大。 为了能够将可视化对象的级别聚集到最高级别,即数字级别,本文提出应 用信息熵作为可视化特征的表示,即用图像的平均自信息量表示图像。这样相 似性度量空间的维数就降到一维,从根本上提高检索的速度。本文采用的方法 是用颜色直方图作为图像的概率密度函数的定义,再利用该密度函数推导出图 像的信息熵。 基于信息熵作为可视化特征表示这一概念,本文提出了两种相似性度量方 法:熵差分距离度量和最大相关熵度量。前者是简单的将图像信息熵进行相减, 求得差的绝对值,所以计算速度相当快:后者是为了校j 下相关熵度量没有对称 性的缺点而提出的,但此种方法并不能严格遵守可距离度量的条件,因此本文 采用熵差分距离度量方法来对信息熵进行相似性度量。 对于两幅十分不相似的图像,其信息熵的值可能相等。所以,单独使用熵 差分距离度量方法进行图像检索是不合适的,其精确度不高。为了保证检索算 法速度既快,精确度又高,克服熵差分距离度量方法的缺点,本文提出了个 多步检索算法:e d l n 算法。该算法先对图像数据库中的图像预先求出其信息 熵:检索时,先用熵差分距离度量方法进行快速的粗略检索,得到一个新的图 像数据库;最后使用颜色直方图l 1 n o r m 算法在这个耨的图像数据库进行精确 检索,得到最终结果。在e d l n 算法的基础上,作者使用v c + + 6 0 开发了一 套国旗检索系统,来证明该算法的实用性。 本文的主要内容包括以下几个方面: 硕士学位论文 m a sf e r sr j j l e s i s 1 ) 提出将信息熵作为图像的一种可视化特征表示,使图像可视化对象 的级别由矢量级别聚集到数字级别,也就使相似性度量空间由n 维降到一维。 2 ) 提出了两种基于信息熵的相似性度量方法:熵差分距离度量和最大相 关熵度量。 3 ) 提出了e d l n 多步检索算法,既保证了检索的速度,又保证了检索的 精确度。在此算法基础之上,丌发了一套国旗检索系统,提出该算法可以应用 到诸如商标、l o g o 标识等颜色特征十分显著的图像的检索中去。 关键词:信息熵,熵差分,相关熵,e d l n ,相似性度量,基于内容的图 像检索,颜色直方图,颜色空间 i i a b s t r a c t w i t hag o o dd e a lu s i n go fi m a g e ,i t i sm o r e i m p o r t a n t t oi m a g e in f o r m a t i o nr e s o u r c em a n a g e m e n ta n dr e t r ie v i n g t h ep r i r e i p a 】r e s e a r c h o fc o n t e n tb a s e di m a g er e t r i e v e ( c b i r ) i n c l u d e st w oa s p e c t s :v is u a l f e a t u r er e p r e s e n t a t i o na n ds i m i1 a r i t ym e a s u r e m e n t i ng e n e r a l ,v i s u a l f e a t u r er e p r e s e n t a t i o nh a st h r e e1 e v e l s :t h ei m a g el e v e l ,t h ev e c t o r l e v e la n dt h en u m b e r1 e v e l t h em a j o r i t yr e p r e s e n t a t i o n so fv i s u a l f e a t u r ea r et h ev e c t o ri e v e l t h es p a c eo fs i m i1 a r i t ym e a s u r e m e n t i s nd i m e n s i o n sa n dt h ec a l c u l a t i o ni sv e r y1 a r g e f o ra g g r e g a t i n gt h e1 e v e o fv i s u a o b j e c tt ot h en u m b e r1 e v e ,w e p r o p o s eo n em e t h o d :e n t r o p ya sav is u a l f e a t u r eo fi m a g e s t h u s ,t h e s p a c eo fs i m i1 a r i t ym e a s u r e m e n tm a yb ed e c r e a s e d t oo n ed i m e n s i o na n d t h es p e e do fr e t r i e v i n gc a nb ei m p r o v e d w i t ht h ec o l o rh i s t o g r a m sa s t h ep r o b a b i l i t yd e n s i t yf u n c t i o no fi m a g e s ,w ec a nd e f i n et h ee n t r o p y o fi m a g e s w i t ht h ec o n c e p to fe n t r o p ya st h ev is u a lf e a t u r er e p r e s e n t a t i o n ,w e p x o p o s e t w om e t h o d so f s i m i l a r i t ym e a s u r e m e n t :e n t r o p y d i f f e r e n c e d is t a n c em e a s u r e ( e d )a n dm a x i m u m r e l a t iv e e n t r o p y d i s t a n c e m e a s u r e ( m r e ) e d ist h es i m p l es u b t f a c t i o no f i m a g e e n t r o p y ,s ot h e s p e e d i sf a s t ;t h er e l a t i v ee n t r o p yd o e s n o ts a t i s f y t h e s y m m e t r y a x i o m ,a n ds ow ep r o p o s em r e s i n c em r ei s n o tam e t r i ci nt h es t r ic t s e n s eo ft h ew o r d w eu s ee da st h esi m i 1a rit ym e a s u r e m e n to fe n t r o p y f o rt w ov e r yd i s s i m il a ri m a g e s t h e i re n t r o p ym a yb ee q u a l s oo n l y u s i n ge d t or e t r i e v ei m a g e si sn o tp r o p e ra n de x a c t f o ru n d e r t a k i n g t h ef a s ts p e e da n de x a c t n e s so ft h er e t r i e v i n ga l g o r i t h m s ,w ep r o p o s e an e wr e t r i e v i n ga l g o r i t h m s :e d l n t h ee n t r o p yd i f f e r e n e ef o r m u l ac a n b ea p p li e dt ot h ed a t a b a s et or e t u r na ni n i t i a ls e to fr e t r i e y e di m a g e s t h i si n i t i a ls e t ,w h i e hi ss m a l l e ri ns i z et h a nt h ee n t i r ed a t a b a s e , ist h e ns e a r c h e du s i n gt h el i - n o r mt or e t r i e v ea f i n a ls e to fi m a g e s s i m i l a rt ot h ei n i t i a lq u e r yi m a g e b a s e do ne d l n ,w ed e v e l o pas e to f s y s t e mo fr e t r je v i n gf l a g s l l r it hv c + + 6 0 i naw o r d t h i st h e s i sp r i n c i p a l l yi n c l u d e s : 1 e n t r o p y a sav i s u a lf e a t u r eo fi m a g e s t h e1 e v e lo fv is u a l 1 1 1 硕士学住论文 m a s l e r s 1 i i e s i s o b j e c t so fi m a g e si sa g g r e g a t e dt o t h en u m b e r1 e v e lf r o mt h e v e c t o rl e v e l t h e s p a c e o fs j m i l a r it ym e a s u r e m e n t m a y b e d e c r e a s e dt oo n ed i m e n sio n 2 w e p r o p o s e t w om e t h o d so f s i m i l a r i t ym e a s u r e m e n t :e n t r o p y d if f e r e n c e d i s t a n c em e a s u r e ( e d ) a n dm a x i m u mr e l a t i v e e n t r o p y d i s t a n c em e a s u r e ( m r e ) 3 w ep r o p o s ean e wr e t r i e v i n ga l g o r i t h m s :e d l n e d l nu n d e r t a k e s t h ef a s ts p e e da n de x a c t n e s so f r e t r i e v in g b a s e do ie d l n 。w e d e v e l o pas e to fs y s t e mo fr e t r i e v i n gf l a g s ,a n de d l nc a nb e a p p li e d t or e t r i e v e i m a g e s w it hc o l o rf e a t u r e b e i n g o b v i o u s ,s u c ha st r a d e m a r k ,l o g oa n ds oo 1 k e y w o r d s : e n t r o p y ,e n t r o p yd i f f e r e n c e ,m r e ,e d l n ,s i m i f a r i t ym e a s u r e m e n t ,c b i r c o l o rh is t o g r a m s ,c o l o rs p a c e 硕士学位论文 m 舾i l r s 1 l j i :s l s 1 1引言 第一章绪论 随着多媒体技术及i n t e r n e t 网络的迅速发展,图像来源不断扩大,大容量 高速存储系统为图像的海量存储提供了基本保障,各行各业对图像的使用越来 越广泛,图像信息资源的管理和检索显得同益重要。基于内容的图像检索 ( c o n t e n t b a s e di m a g er e t r i e v a l ,简称c b i r ) 研究的主要方面就是用某种高效的 方法检索图像数据库中的图像。本文主要介绍的方法是通过图像的信息论观 点来提高检索图像的速度。通过将图像中的颜色特征与信息论结合,我们提 出了种多步检索方法,该方法在原有的基于_ 颜色特征的图像检索技术的基 础上改善了图像数据库中的图像检索性能,并且应用到了国旗图像检索系统 中。 c b i r 研究的主体就是定义图像的新的呵视化特征表示,该特征提供一种 有意义的描述引导相似性查询。当前研究的焦点已经集中在用复杂的特征 表示从巨大的图像数据库中利用多维检索技术加速检索的进程c 6 i 。为了能改 善检索的性能和效率,新的研究方向在于扩展已经存在的可视化特征表示方 法。可视化特征的表示通常能够分为若干级别。如图1 1 所示,基于表示的 复杂度和信息聚集的程度不同,一个可视的对象可以有不同的级别。在我们 的例子中假设三个级别的表示:图像级别,最一般的情况:矢量级别,聚集 信息到一种矢量表示;数字级别,聚集的最高级别,复杂度降到最低。 当将信息从图像级别聚集到数字级别时,包含在某一给定表示级别的信 息并不能保证唯一的去表示更低级别的信息。因此,要注意进行信息聚集时 必须依赖于某一给定级别的信息。大多数现在的可视化特征的表示,诸如颜 色、纹理、形状等,均是矢量级别的。为了提高检索速度,当然希望将信息 从矢量级别聚集到数字级别。本文提出应用信息熵作为可视化特征的表示来 达到这一目标。 硕士学位论文 m a 5 胜仗s 1 i i e s i s 图1 1可视化对象的表示级别 1 2 基于内容的图像检索技术的历史发展及现状 数字图像广泛的应用于科学、工程、商业以及个人计算中。通用汁算机 使用的图像的激增是有其多方面的原因的,其中最重要的原因就是包括多媒 体数字图书馆、医学图像管理、卫星遥感图像和计算机辅助设计和制造、地 理信息系统、罪犯识别系统、商标版权的管理等方面的大量应用【4 。 早在7 0 年代擞据库专家就丌始研究如何对图像数据进行有效的管理,其 主要方法是对图像文件建立关键词或文本标题以及一些附加描述信息,然后 将图像的存储路径和图像关键词之间建立联系,传统的关系数据库技术就可 以满足这样的要求。现在数据库技术已经取得了长足的进步,一些大的商用 数据库系统都丌始支持以二进制大对象( b l o b ) 存储图像,但对图像的管理仍 是通过二进制大对象和图像的关键词建立联系方法。由于直接在数据库中访 问图像的操作比较复杂,因此在数据库中以二二进制大对象管理图像的方法在 目前并没有流行起来。 8 0 年代是多媒体技术发展的时代,图像的获取、创作、压缩、存储技术 2 硕士学位论文 m a s f t i p 、s i i 正s i s 都取得了举世瞩目的成就,而对图像信息的管理尚未给予足够的重视。9 0 年 代是计算机网络时代,特别是9 0 年代中期以来以w w w 为代表的信息发却 以及资源访问方式的广泛流行,信息的发和方式也从单一文本方式转变为以 图形、图像、动画、视频和音频等视听信息。整个i n t e r n e t 网络环境就像一个 大型的分布数据库,在其中寻找自己感兴趣的一科t 媒体犹如大海捞针,对信 息检索工具的依赖同益加强,而目前基于网络的检索工具( 如y a h o o ,g o o g l e 和l y c o s 等) 大多采用文本检索方式。这种采用对图像建立关键词等文本描述 信息的方式已越来越不适应网络信息检索的要求,究其原因主要存在如下局 限性: 1 对图像加注文本信息仍由手:j = 完成,随着图像数据来源同益广泛,这种 方法显得费时费力: 2 文本描述信息是非常主观的,不同的人对同一幅图像数据可能有不同 的理解,因此当用户在查询时输入的关键词和数据库中的关键词不一致或这 些关键词根本就不存在时,将导致查询的失败; 3 “一幅画胜过一千句话”,区区几个关键词很难将图像所反映的内容描 述清楚: 4 由于媒体信息是发布在i n t e m e t 网络环境中,不同国家不同民族很难 用同一种语言+ 对图像进行加注标识,而且对图像语义理解的差异很大。 为了突破文本检索方式的诸多弊端,人们又转向研究图像中所包含的内 容信息作为图像的索引,对这方面的研究要归功于模式识别研究者,其主要 的方法是根据图像的颜色、纹理、图像对象的形状以及它们的空间关系等内 容特征作为图像的索引,计算查询图像和目标图像的相似距离,按相似度匹 配进行检索,其目的是试图解决图像数据库系统中手工建立文本标注信息的 缺点。 作为传统数据库检索的拓展,基于内容的图像检索系统主要是根据图像 的内容进行检索。同传统的关系数据库检索系统相比,它主要具有以f 的特 点: 1 传统的数据库中,符号数据可以用基本数据类型精确地表示,检索匹 配是精确匹配。而图像数据是一段二进制数据流,对图像进行像素和像素的 3 硕士学位论文 m a s l l r s 1 i i e s i s 精确匹配不科学。事实上人对两个图像的相似和不相似的判断是根据图像中 所包含的内容,很难将其精确描述,因此内容的表达是近似的。 2 图像数据的表达不是单一的,多种表达方法并存是可能的,表达方法 的选择要依赖于特定的用户和特定的应用领域,随着i 别技术的发展还可能 采 日更新或更好的表达方法。 3 符号数据本身就具有语义信息,在符号数据命名的过程中就赋予了特 定的信息。图像中的内容本身不包含语义信息,对图像的匹配主要是对图像 q ,的内容特征进行相似匹配。 4 由于对内容表达的不精确,因此榆索得到的结果可能包含一些不相关 的图像,这种情况对基于内容的检索是允许的,但重要的一点是在检索中不 要将相关的图像漏掉。 通常,图像特征和属性的相似性分析可以分为三级2 j :第一级别的查询 特征是原始特征,诸如颜色,纹理和形状等。此种类型的查询是客观的,并 且使用图像处理算法直接从图像中提取特征,不需要额外的数据资源来作为 爸询的向导,如图1 2 所示。 图1 2对l e n a 图像的l e v e l1 的查询示例 第二级别的查询被称为逻辑特征查询,需要一些确定图像中的对象的推 论知识。此种级别的查询可以进一步分为两种查询:某一给定类型对象的查 询和单个对象或个体的查询,如图1 3 所示。 硕士学位论文 图1 3对l e n a 图像的l e v e l2 的查询示例 第三级别的查询被称为抽象特征查询,需要大量的更高级别的有意义的 推理知识。般来说,此种查询在计算机中很难自动实现,因为图像内容与 抽象概念之白j 的联系需要复杂的推理和主观上的判断。图1 4 就是此种查询 的示例。 图1 4对l e n a 图像的l e v e l3 的查询示例 第级别的查询通常被认为是c b i r 研究和系统发展的焦点。而几十年 的计算机视觉研究表明第二、三级别的查询的实现比较困难f ”l ,它们是语义 级别的图像查询。并且第一和第二级别的显著不同也不是人为造成的,它们 之日j 的差别是由于目前计算机科学的技术水平与人类的认知之间的差别造成 的。本文主要是基于第一级别的。 1 3 本文的研究内容及结构安排 本文致力于在图像特征和属性的相似性分析的第一级别的基础上,通过 将信息熵作为可视化特征表示,以达到将可视化对象的级别从矢量级别聚集 刮最高级别,即数字级别,提高检索效率,并提出相应的检索算法。本文具 体内容安排如下: 第一章概述本文的背景知识以及组织结构。 第二章介绍通用的c b i r 系统的计算结构,包括可视化特征的提取和相 似性度量方法。现有可视化特征表示主要包括颜色、纹理、形状和图像的光 谱属性。由于本文的信息熵是由颜色直方图定义的,所以文中详细介绍了颜 色特征的提取方法。相似性度量必须满足距离度量的4 个基本条件,通常采 j | m i n k o w s k i 距离公式来度量。 第一j 章介绍将信息熵作为图像可视化特征的表示的方法,用颜色直方图 作为图像的概率密度函数的定义,再利用该密度函数推导出图像的信息熵。 这样一幅图像就可由一个数字表示,从而将相似性度量空间的维数从n 维降 低到一维。 第四:章提出了两种相似性度量方法:熵差分距离度量和最大相关熵度量。 熵差分距离度量是简单的将图像信息熵进行相减,求得差的绝对值,文中指 出该方法虽然检索速度快,但是单独使用熵差分距离度量方法进行图像检索 足4 i 合适的,其精确度不高。最大相关熵度量是为了校f 相关熵度量没有对 称性的缺点而提出的,但此种方法并不能严格遵守可距离度量的条件,因此 本文采用熵差分距离度量方法来对信息熵进行相似性度量。 第五章在第三章和第四章的基础上。提出了e d l n 多步检索算法。文中 给出了该算法的运行性能,并且与采用最大相关熵度量的检索算法和通用的 颜色直方图l ,n o r m 算法的运行性能进行了比较。在e d l n 算法的基础i :, 作者使用v c + + 6 0 丌发了一1 套国旗检索系统并且给出了一些检索示例。 第六章对本文进行了总结,提出了对今后研究工作的展望。 硕士学位论文 n s i i r s1 i 匝s f s 2 1前言 第二章c b l r 系统的计算结构 一个通用的c b i r 系统的计算结构如图2 1 所示。完整的处理是基于一 个图像数据库的。首先,用某种特征提取算法对图像数据库中的图像进行处 理,将得到的特征表示结果存储于数据库中,用于进行相似性计算。其次, 用同利t 特征提取算法对待查询的图像进行处理。最后,将待查询的图像的特 征表示结果与数据库中的图像的特征表示结果进行比较,那些被认为与待查 询的图像相似的数据库中的图像作为结果返回给用户。因此,查询的结果并 非是严格精确匹配的。 图2 1c b i r 系统的计算结构 查询能够被草图或图形化的用户界面工具指定,然而,查询指定的最终 结果必须与数据库中存储和检索图像时使用的特征表示相l 司。也就是况。查 询时用户可以使用示例图像,用户自己画的争图,或者能引起用户兴趣的原 始特征的直接表达等进行查询,但是,这些查询最终都将归结于同种特征表 1 io 21 1 可视化特征提取 c b i r 中一个基本的操作就是从图像中提取叮视化特征。可视化特征是利 h j 图像处理,模式识别,计算机视觉方法从图像中提取的属性。特征提取的 j :要方法都包括颜色、纹理、形状和图像的光谱属性等。 颜色是c b i r 系统中使用最多的可视化特征,而其主要原因便是从图像 中提取颜色相当简单。颜色是物体表面的一种视觉特性,每种物体都有其特 有的颜色特征,譬如人们说到绿色往往是和树木或草原相关,谈到蓝色往往 是和大海或蓝天相关,同一类物体往往有着相似的颜色特征,因此我们可以 根据颜色特征来区分物体。用颜色特征进行图像检索可以追溯到s t r i c k e r 和 s w a i n 提出的颜色直方图的方法【2 2 】。目前几乎所有基于内容检索的图像数据 j 车系统都把颜色检索方法作为检索的一个重要手段,并提出了许多改进方法。 本文也就是基于颜色直方图的一种改进方法。 纹理通常定义为图像的某种局部性质,能够被看成是某一带唯一模型特 ,r # 的区域。基于此种纹理特性,一幅图像可看成是不同纹理模型区域的嵌套。 阅此,当幅图像中的每一个纹理模型区域均以相应的纹理特征束划分和描 述时,此幅图像就可以根据纹理模型来检索和浏览了。 形状是图像的重要可视化内容之。在二维图像空间中,形状通常被认 为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边 界的描述以及对这个边界所包围区域的描述。目前的基于形状检索方法大多 围绕着从形状的轮廓特征和形状的区域特征建立图像索引。 图像的光谱方法,诸如傅立叶变换和小波变换,通常是作为纹理分析的 某种手段从图像中提取特征。在文献 2 6 1 q u ,小波作为一种图像检索方法被首 先提出来。他们的方法是利用h a a r 小波分解方法对待查询图像与存储图像进 硕士学位论文 m a s i e r st i i e $ i s 行处理,得到相似的图像。 2 ,1 2 相似性度量方法 c b t r 查询的目的是从图像数据库中高效地检索与_ f j 户指定的图像相似 的图像。其目的与传统的d b m s 查询有着鲜明的对比,c b i r 查询的目的是 相似性匹配的,而不是精确匹配的。相似性匹配是基于相似性函数计算的结 果之上的近似处理过程。相似性度量方法有两种:第一种是限量的方法,即 查询时从数据库中返回k 个最相近的图像;第二:种是限质的方法,即查询时 可返回任何数量的图像,但返回的图像与待查询的图像的差别必须在一限定 的范围内。 相似性度量函数d ( ,) 的形式依赖于特征表示的形式。大多数特征最 终是被表示成n 维向量空间的形式( 这样可以很方便地用数学形式表示) ,诸 如颜色直方图。d ( ,) 的定义可以参考2 4 节。 2 2 颜色特征的提取 从数字图像中提取颜色特征依赖于对数字图像中颜色的表示和颜色理论 的理解。颜色空阳j 对于相关颜色以数字形式表示是一个很重要的成分。在不 同颜色空问之间的转换和颜色信息的量化是给定的特征提取方法的首要决定 因素。 22 1 颜色的原理及人类对其的感知 颜色首先由牛顿在1 6 6 6 年“发现”,他观察到白光通过棱镜可以分解为 从紫色到红色一段连续光谱。被人类感觉到的颜色称为光,它是一段连续的 电磁波,波长从3 5 0 r i m 到7 8 0 n m ,出发光体产生,可以通过物体反射,或通 过半透明物体透射。 由神经生理学实验发现,在视网膜上存在三种不同的颜色感受器。它们 9 星:i 种不同的锥体细胞,每一种有自己独特的光谱灵敏度和灵敏范围。感受 到的颜色也就是我们通常所说的三原色:红色、绿色、蓝色。它们相应的波 k 分别为7 0 0 n m 、5 4 6 1 n m 、4 3 5 8 n m 。 颜色可分为彩色和无彩色。彩色是指黑扶白系列以外的知觉上具有色调 的色。无彩色是指黑灰白等知觉上无色调的色。人眼观察物体感受到的色感 觉包括色调( h u e ) 、彩度( s a t u r a t i o n ) 和明度( b r i g h t n e s s ) ,称为颜色的三属 性。色调是彩色彼此相互区分的特性,如红、黄等表述的颜色属性。彩度是 指彩色的纯洁性,可用以估价光谱纯色在整个色感觉中所占成分比例的视觉 特性,如红色是高彩度,而品红不是。明度是与所观察物体明亮程度相应的 视觉特性,由物体漫反射或漫透反射光的程度决定。 目前的基础色度学和c i e 。色度系统是以三色原理的色匹配实验为基础 的。色匹配就是调配一种颜色使其和另外的一个给定颜色相等同。三色原理, 就是说任何个颜色c + 都能用线形无关的:三个原色适当的相加混合与之匹 配,亦即任何一个颜色刺激都能用线形无关的三个参照色刺激适量的代数和 柬重现,它可用下式来表示: c + = c ( c ) = r ( r ) + g ( g ) + b ( b ) 1 2 ,g ,b 为与被测色c + 相匹配所需要的三个原色的刺激量,称为被测色c + 的三刺激量。用代数和和几何方法表示颜色较为方便,变换上式可得: r - 纛( c ) = ,( 月) + g ( g ) + b ( b ) 十u 十a 这罩r = r ( r + g + b ) ;g = g ( r + g + b ) :b = b ( r + g + b ) 称为颜色c + 的色 品坐标。定义色c + 的一个单位为l + ( c ) = r ( r ) + g ( g ) + b ( b ) ,即使c = r + g + b 。 这样,由= :刺激色原理就构成了允许显示器显示我们能够看到的颜色的机制。 c r t s 有r :个通道,分别为红,绿,蓝。通过改变每个通道的电压和组合它们 的输出,显示屏上的每个像素能够输出大量的颜色。 o c i e ,即c o m m i s s i o ni n t e r n a t i o n a l ed el e c l a i r a g e ,国陶:照明委员会 1 0 硕士学位论文 n s le r s1 1 i g g l y ; 22 2 颜色空问的属- 陛 颜色空f n j 通常被指定为一个三维的颜色坐标系统,在这个系统的子空f u j 中颜色是以点的形式表示的。应用予数字图像和计算机图形学中的大多数通 用颜色空间是r g b 颜色空| 、丑j ,各种颜色可以通过红,绿,蓝三种颜色的线形 组合表示出来( 如上所述) 。r g b 颜色空i h 的广泛存在应用主要是因为c r y 显示器和光栅图形设备均采用此颜色空间。另外,大多数数字图像存储的值 也是r g b 形式的。r g b 颜色空间的几何特征如图2 2 所示。 b 【0 图2 2r g b 颜色空削的几何特征 虽然r g b 颜色空间有着广泛的应用,然而由于r g b 颜色空间有着很重 要的理论上的缺陷( 不能模拟人类视觉感知) ,所以在颜色特征提取算法中通 常不采用r g b 颜色空问。因此,我们需要将来自于r g b 颜色空间的原始图 像像素值转换到其他颜色空间。 与人类视觉感知相近的颜色空i 日j 应满足三个属性:均匀性,完整性,唯 一性。 一个具有均匀性的颜色空问的某点坐标位置略微有变化时,人眼感觉不 到色的变化,仍认为是原来的颜色。实验研究表明,人类对于蓝色周围的颜 色变化最敏感,而对于绿色周围的颜色变化最不敏感。 完整性是指该颜色空间包括所有相对应的颜色。 唯一性是指该颜色空间中的两个不同点表示两个不同的颜色。 r g b 颜色空问由上可知不具有均匀性属性。该颜色空间的两点之间的距 离并不能说明这两种颜色相似或不相似。为了满足以卜三个属性,本文采用 c i e 颜色空间。 22 3c l eu c s 颜色空间 为了定义具有感知上的均匀性的颜色空m ,c i e 丌发了基于u c s 的 i 。+ u + 一v + ( c i e l u v ) 颜色空问和l + 一a + b * ( c i e l a b ) 颜色空问。但是它们也不 是严格的具有感知上的均匀性的颜色空问,只不过它们比其他的颜色空问更 好一些。定义以上两种颜色空恤j ,都必须首先将r g b 颜色空间转换成x y z r0 4 903 1021 f= 10 1 7 6 9 7 o 8 1 2 4 0 0 1 0 6 3 【 r o b x y z ij 【0 o 0 0 lo9 9 j 这样,c i eu c s 图就可以用u ( 横坐标) 和v ( 纵坐标) 组成的坐标系 两焉再西一x + 1 5 y + - - 3 z c i e l u v 颜色空、日j 均匀三维颜色空问是由矩形坐标l + ,u + ,v + 作出的 其量由下式导出: 三+ = 1 1 6 ( y k ) “3 1 6 ,j ,匕 0 0 0 8 8 5 6 + = 9 0 3 3 ( y y ,) ,y e 0 0 0 8 8 5 6 “+ = 1 3 l + ( “一“。) v + = 1 3 l + ( v l v 。) 这晕 r ,“t ,。t 描述所研究的色刺激,l ,“。,”。描述指定的白体色刺激4 9 1 。 c i e l a b 颜色空间是由矩形坐标p ,a ,铲作出的,其量由下式导出 u c s ,即u n i f o r mc h r o m a t i c i t ys c a l e ,等色差表色系。 1 2 l + = 1 1 6 ( y l ) ”3 1 6 ,y r ;, , 0 0 0 8 8 5 6 l + = 9 0 3 3 ( y k ) ,y 0 0 0 8 8 5 6 矿= 5 0 0 ( x x 。) “3 一( y 驯”】 b + = 2 0 0 ( y k ) “3 一( z 乙) ”3 】 这罩x ,y ,z 为所研究的色刺激,x n ,y 。,z 。为指定的白体色刺激【4 9 j 。 本文采用此颜色空间,其几何模型是一圆柱,其中i + 的变化范围是0 到1 0 0 ( 即从黑到白) ,a + 的变化范围是- - 8 0 到8 0 ( 即从绿到红) ,b + 的变化范围也 是- - 8 0 到8 0 ( 即从蓝到黄) ,如图2 3 所示。 a + 图2 3c i e l a b 颜色空阳j 其相应的色差由下式计算,两个颜色的色差e + 。为: a e * 曲= ( 日+ ) 2 + ( 6 ) 2 + ( 址+ ) 2 r 按照文献【3 0 】的方法,将l + 平均分为5 段,即“0 ,2 0 】,【2 0 ,4 0 】,【4 0 ,6 0 】, 【6 0 ,8 0 】, 8 0 ,1 0 0 ,a + ,b + 平均分为8 段,即“一8 0 ,一6 0 】,【一6 0 ,一4 0 】, - 4 0 , 2 0 ,【一2 0 ,0 ,【0 ,2 0 ,【2 0 ,4 0 】,【4 0 ,6 0 ,【6 0 ,8 0 ) ,那么c i e l a b 颜 色空间可以产生5x8 8 = 3 2 0 种不同颜色。将图像中某个像素的颜色的 1 1 r ,g ,b 值取出后,转换为相应的l + ,a + ,b + 值,若在某一范围内,则认为是同一 颜色。例如,l + 2 0 ,4 0 ,a + 【4 0 ,6 0 】,b + 2 0 ,4 0 】,则该颜色均被认为 是同一种颜色。 224 颜色赢方图作为颜色特征的表示 r g b 颜色空l 、b j 的某点要转化到c i e l a b 颜色空f 日j ,需要一定合适的表示, 以便捕获图像中的颜色属性。大多数通用的图像颜色属性的表示,以及本文 所采用的方法就是颜色直方图。颜色直方图空l 铷的非规范化定义如下: 巧= 吃吐。胁1 :c r ( i ,m ) t = i ,= l 这罩,m 表示被量化的颜色数,x ,y 分别为相应图像i 的宽和高,盯是 k r o n e c k e r 判别函数,本文如上所述m = 3 2 0 。 文献 2 2 1 中给出了颜色直方图空间的可度量属性的分析。个规范化的颜 色直方图空间的定义如下: h : ( i ,瓦,f 。川i 。o ,mi ,:1 如两t 喜喜( 蝴c ,) 当f ( x ,y ) 的值等于颜色c 。的值时 当f ( x ,y ) 的值不等于颜色e 的值时 其中,颜色直方图空i 训h 是一个m 维矢量空阳】的子集,五,表示颜色c 的直方图,x ,分别表示图像的宽和高,f ( x ,y ) 表示坐标为( x ,y ) 的点的颜色 值。 2 3 特征表示的相似性计算 一旦特征表示空阳j 被定义为一个m 维的颜色氲方图宅削,那么定义两幅 图像之间的相似性问题就转化为求颜色直方图空间中两点之问的距离问题。 假如两点分别是p 、q 两点2 f 日1 的距离可以定义为d ( p ,q ) 。我们提出的币式的 相似性定义如下: 定义2 1如果d ( u ,v ) 0 ,p g 2 d ( p ,q ) = 0 ,p = g 3 d ( p ,q ) = d ( q ,p ) ( 非负性) ( 确定性) ( 对称性) 4 d ( p ,g ) d ( p ,r ) + d ( r ,q ) , v r c( 三角不等性) 任何函数d ( p ,q ) 如果满足以上4 个条件就称为距离度量函数。 硕士学位论文 协e i l si f 【e s 【s 232m in k o w s k i 距离公式 通用的m i n k o w s k i 距离公式定义如f ( 或称l ,n o r m 公式) : d ,( p ,g ) = ( 1 只一吼 般地,为了便于计算通常取r 的值为1 ,2 或o 。当r = l 时,称为h a m m i n g 距离公式或l 1 n o r m 公式,定义如下: d 。( p ,g ) = z i p ,一q , 当r = 2 时,称为e u c l i d e a n 距离公式或l 2 - n o r m 公式,定义如下: 以b 们2 j 蕃印t 叫j ! 当r = o o 时,称为c h e b y s h e v 距离公式或l - n o r m 公式,定义如下: 见( p ,目) m a x ,1 p ,一q , 2 3 3 距离度量和相似性的讨论 除了以上介绍的m i n k o w s k i 距离公式以外,还有诸如直方图余弦距离度 肇公式,二次式距离公式等距离度量公式。 对于两个矢量p 和q ,它们的直方图余弦距离度量公式如下: 蹦p , q ) = c o s - 1 编 二次式距离公式的定义如下: z ) b ( p ,q ) = ( p g ) 。a ( p q ) 其中a 是一典型对称矩阵。 文献 3 3 1 中测试了采用l l 。n o r m 公式,l 2 - n o r m 公式,二次式距离公式以 及其他公式进行图像检索的性能,表明这几种距离度量公式在检索性能方面 差别不大。另外,l i - n o r m 公式比l 2 n o r m 公式更具有鲁棒性。由于l t n o m l 公式在计算上比其他公式更简便,故本文采用l 1 n o r m 公式去计算颜色直方 睡l 空间中两点间的相似性。由于一幅数字图像的信息论描述的发展方向是朝 着一维发展的,所以通过考虑某种同一的距离度量公式可以很方便的对颜色 宜方图和图像的信息描述进行比较。 硕士学位论文 m a s e r st t i e s i s 第三章信息熵作为图像可视化特征的表示 颜色直方图作为图像检索的一种方法已经得到了大量的证实。然而,由 j 图像数据库相当大,而且颜色直方图空间的维数又非常巨大,所以所能提 供的距离度量的计算花费应当受到控制。本章所提出的基于信息熵的颜色直 图检索方法试图从根本上提高检索性能。 本章的动机就是想将可视化对象的级别从矢量级别聚集到数字级别,减 7 i 栩似性度量空间的维数,以便从根本上改善检索性能。事实上,关于维数 减少方面的技术已经有好多种了,例如原理构成分析法1 3 8 , c o l u m n w i s e 聚类 上h o j 等。通常这些方法技术都是将直方图空间的维数由n 维降为k l 维。 本章提出的理论试图将颜色直方图空问的维数降为一维。图像的信息熵 是该幅图像中信息内容的一种度量。众所周知,香农的信息熵函数将n 维矢 嚣映射到了一组实数集上,因此,可以假想将多维空间降为维。 3 1 颜色直方图作为栅c 率密度函数 在第,5 章中已经讲到颜色直方图以及其组成的空间可以作为图像数据库 中颜色特征的表示。本节将详述利用来自信息论的方法去扩展基于颜色的图 像的属性特征。 对于数字图像资源,某像素的连续取样不会对该像素末来的值的输出产 生影响,也有人称具有此特性的图像资源是无记忆的。 根据2 2 节提出的颜色直方图的定义可推出该图像的概率密度函数如下: 衲:盟 n 】n 2 这艰,n ( c 。) 表示图像中像素颜色是q 的像素总数。图3 1 所示为蒙娜丽莎图 像中的红,绿,蓝三种颜色的直方图。从该图可以看出,三刺激色中,无论 哪种颜色的直方图都是靠近暗的区域比亮的区域响应更强烈一些。 lr 硕士学住论文 图3 1蒙娜丽莎及其三刺激色的直方图 32 信息论和信息熵函数 矢量v 由集合 五,x 2 ,矗 组成,假定v 的概率只= p ( ) ,那么v 的 信息熵的定义可由下式给出: h ( v ) = 一p 。l o g :( 只) 怍l 有时也称信息熵为信源的平均自信息量,最初由香农在1 9 4 8 年提出,表 示的是随机变量的概率分布的函数,并不是该随机变量的确定值的函数。 9 硕士学位论文 m a ,r e r s 1 i e s l s 3 21 信息熵的数学特性 文献 5 忡给出了关于信息熵的+ 些基本特性: 1 非负性 因为0 p ( x ) l ,所以l o g ( p ( x ) ) 0 ,因此有一p ( x ) l o g ( p ( x ) ) 0 ,由 信息熵的定义可知h ( v 1 0 。 2 极值性 即: h ( p 1 ,p 2 ,n ) h o n ,l 月,l ) = l 0 9 2 ( 胛) 此式表示在离散信源情况下,信源各符号等概率分布时,熵值达到最 大。 3 联合熵 假定一对离散随机变量( x ,y ) 的联合概率分布是p ( x ,j ,) ,那么( 爿,) 联合熵的定义如下: h ( x ,y ) = 一p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论