




已阅读5页,还剩60页未读, 继续免费阅读
(计算机应用技术专业论文)基于颜色特征的图像检索技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于颜色特征的图像检索技术研究 余芳( 计算机应用技术) 指导教师:郑秋梅教授 摘要 在基于内容的图像检索中,颜色特征计算简单,具有较好的鲁棒性, 作为图像的一种重要视觉信息,已经得到了广泛的应用。本文主要针对 图像的颜色空间、颜色的量化和颜色特征提取方法进行了研究。 首先,比较了r g b 和h s v 两种颜色空间模型,对颜色量化方法作 了分类介绍。在此基础上重点讨论和比较了常见的颜色特征和颜色空间 信息的提取方法,并对颜色特征的相似性度量方法作了介绍。 其次,针对颜色直方图缺少颜色的空间分布信息,特征维数较多, 存储量大的缺点,作了如下改进:( 1 ) 为了获取颜色的空间分布信息,提 出一种等面积环形分块方法,该方法不仅保持了颜色直方图的旋转不变 性,而且能够突出图像中心的主体地位,符合人的视觉特性( 2 ) 改进了 采用k - m e a n s 算法提取图像主颜色的方法,较好地提取了图像的主颜色 直方图,既降低了特征维数,又较好地保持了颜色表示精度。( 3 ) 基于上 述研究,提出了基于分块主颜色的图像检索方法:对图像进行等面积环 形分块,统计各子块的主颜色直方图。该检索方法同时具有等面积环形 分块和主颜色直方图的优点。实验证明,分块主颜色方法能明显地改善 检索效果( 4 ) 为了进一步提高检索效率,综合分块主颜色方法和分块颜 色矩方法进行检索。实验表明,组合检索比单一的检索方法更有效。 最后,详细设计和实现基于上述方法的图像检索原型系统i r s ,并 基于此原型系统,对本文提出的几种图像检索方法进行了实验比较和性 能分析 关键字;图像检索、颜色直方图、主颜色、图像分块 r e s e a r c ho nt h ec o l o r - b a s e di m a g er e t r i e v a l y u f a n g ( c o m p u t e r a p p l i c a t i o nt e c h n o l o g y ) d i r e c t e db yp r o f e s s o rz h e n gq i u - m e i a b s t r a e t a s m 叩o r t a n tv i s i o ni n f o r m a t i o no fi m a g e t h ec o l o rf c a t u m sms i m p l e a n dh a v eb e t t e r r o b u s t n e s s ,w h i c h h a sb e e n b r o a d l yu s e d i nt h e c o n t e n t - b a s e d 且l a g cr e t r i e v a l ( c b i r ) t h ee x p r e s s i o no f i m a g ec o l o ts p a c e t h ec o l o rq u a n t i f i c a t i o na n dc o l o rf e a m r ee x t r a c t i o nm e t h o da r ea n a l y 2 e da n d d i s c u s s e di nt h i sp a p e r f i r s t , i tc o m p a r e sr g ba n dh s vc o l o rs p a c em o d e l i 曲o d u c e st h ec o l o r q u a n t i f i c a t i o nm e t h o d s o nt h i sb a s i s ,t h ee x i p a c t i o nm e t h o d so f t h ec 0 1 1 1 i n o n c o l o rf e a t u r e sa n dt h ec o l o r - s p a t i a ld i s 们b u t i o ni n f o r m a t i o na r ca n a l y z e da n d d i s c u s s e de m p h a t i c a l l y s e c o n d , t h ec o l o rh i s t o g r a ml a c k st h ec o l o r - s p a t i a ld i s t r i b u t i o ni n f o r m a t i o n , h a sm a n yf e a t u r ed i m e n s i o n sa n dl a r g em e m o r yc a p a c i t ys h o r t c o m i n g s i n t h i sp a p e r ,t h ef o l l o w i n gi m p r o v e m e n t s 戤m a d e :( 1 ) i no r d e rt oo b l a i nt h e c o l o r - s p a t i a ld i s t r i b u t i o ni n f o r m a t i o n , a ne q u a l - a r e ar i n gp a r t i t i o ni sp r o p o s e d 1 1 1 em e t t h o dn o to n l yk e e p st h ec o l o rh i s t o g r a mr o t a t i o ni n v a r i a n t , b u ta l s o f o c u s e so nt h ed o m i n a n tp o s i t i o no f t h ei m a g ec e n t e r w h i c hi sc o n f o r m e dt o t h ev i s u a lc h a r a c t e r i s t i c ( 2 ) t h ee x t r a c t i o nm e t h o do ft h em a i nc o l o ,w h i c h l 黼t h ek - m e a n sa l g o r i t h mi si m p r o v e d t h ei m p r o v e dm e t h o de x t r a c t st h e m a i nc o l o rh i s t o g r a mw e l l ,w h i c hr e d u c e dt h en u m b e ro ff e a t u r e sa n d m a i n t a i n e dt h ec o l o re x p r e s s i o np r e c i s i o nw e l l ( 3 ) b a s e do l lt h ea b o v e r e s e a r c h , np a r t i t i o nm a i nc o l o ri m a g er e t r i e v a la l g o r i t h mi sp r o p o s e d : p a r t i t i o n t h ei m a g eu s i n gt h ee q u a l a r e ar i n gm e t h o da n ds t a t i s t i ct h e p a r t i t i o n sm a i nc o l o rh i s t o g r a m t h i sr e l r i e v a la l g o r i t h mh a sa d v a n t a g e so f b o t ht h ee q u a l a r e ar i n gp a r t i t i o na n dm a i nc o l o rh i s t o g r a m 1 1 1 ee x p e r i m e n t s h o w st h a tt h ep a r t i t i o nm a i nc o l o rm e t h o dc a ni m p r o v et h er e t r i e v a lr e s u l t s ( 4 ) t o 缸t l l 盯i m p r o v et h ee f f i c i e n c y , i n t e g r a t e dt h ep a r t i t i o nm a i nc o l o r m e - 1 h o da n dp a r t i t i o nc o l o rm o m e n tm e t h o d s 1 1 1 ee x p e r i m e n ts h o w st h a tt h e c o m b i n a t i o no f s e a r c hr e t r i e v a lm e t h o di si i l o r ce f f e c t i v et h a nt h es i n g l e f i n a l l y , a l li m a g er e t r i e v a lp r o t o t y p es y s t e m ( 塔) i sd e t a i l e dd e s i g n e da n d i m p l e m e n t e d b a s e do nt h i sp r o t o t y p es y s t e m , t h ei m a g er e t r i e v a lm e t h o d s , w h i c h 眦p r o p o s e di nt h i sp a p e r , a r ec a r r i e do na n da n a l y z e dt h ea l g o r i t h m s p e r f o r m a n c e t h et h e o r e t i c a la n a l y s i sa n de x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep a r t i t i o n m a i nc o l o ri m a g er e t r i e v a lm e t h o dc a r li m p r o v et h er e t r i e v a la c c u r a c ya n d i m p r o v e t h er e t r i e v a lr e s u l t s k e y w o r d s si m s g er e t r i e v a l ,c o l o rh i s t o g r a m , m a i nc o l o r , i m a g ep a r t i t i o n 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论 文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中国 石油大学或其它教育机构的学位或证书而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了 谢意 签名: 关于论文使用授权的说明 本人完全了解中国石油大学有关保留、使用学位论文的规定,即: 学校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手 段保存论文。 ( 保密论文在解密后应遵守此规定) 学生签名: 导师签名: 磊、易 砷年0 月日 一种年乒月1 日 中国石油大学( 华东) 硕士论文第1 章绪论 第1 章绪论 1 1 图像检索技术研究概述 随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容 量正以惊人的速度增长每天,无论是军用还是民用领域都会产生和使 用大量的图像信息。数字图像中包含了大量的有用信息,但由于这些图 像是无序地分布在世界各地,图像中包含的信息无法被有效地访问和利 用。这就要求有一种能够快速而且准确的查找访问图像的技术,也就是 图像检索技术。 自2 0 世纪7 0 年代起,图像检索技术便开始成为一个活跃的研究领 域。早期的图像检索技术主要是基于文本的图像检索【l 】它主要是对图 像进行人工分析,对图像物理特征、内容特征进行文字标注或标引,建 立类似于文本文献的索引数据库。通过检索数据库获得图像编号。继而 获取实际图像,把图像检索转为了文本检索的问题。 由于图像的信息处理与文字信息处理存在本质区别,基于文本的图 像检索存在着以下弊端: ( 1 ) 图像内容的文本描述由手工完成,处理工作繁重、速度慢、效 率低随着图像数据的来源日益广泛,这种方法显得费时费力。 ( 2 ) 人工注释具有很强的主观性,不同人对同一幅画可能有着不同 的理解,因此当用户输入的关键词和数据库中关键词不一致时,将查询 不到所需的图像。 ( 3 ) 文本描述不能充分描述和揭示图像信息,仅仅几个关键词很难 将图像的内容描述清楚,而且一些信息如纹理很难用文本来描述。 9 0 年代初期,随着大规模数字图像库的出现,基于文本的图像检索 技术越来越不能满足海量图像数据库的检索需要,为了克服这一困难, 研究者们提出了基于内容的图像检索技术( c o n t e n t - b a s e di m a g e r e t r i e v a l ,c b i 础【2 】。 基于内容的图像检索是对图像内容进行机器的自动分析,根据图像 中国石油大学( 华东) 硕士论文第l 章绪论 内容特征信息建立索引,并且通过图像特征向量间的近似度量进行图像 相似性匹配,从而实现图像的检索。基于内容的图像检索技术是计算机 图像处理技术与数据库技术相结合的产物,涉及了多个学科和领域,不 仅需要利用图像处理、模式识别、计算机视觉、图像理解等学科的相关 理论,还要从认知科学、用户模型、知识库系统、计算机图形学、数据 库管理系统以及信息检索等领域中寻求并获得启示,并不断引入新的媒 体数据表示和数据模型,产生出有效、可靠的查询处理算法和可视化查 询接口,以及与领域无关的检索技术和系统体系结构。 1 i i 图像检索系统的体系结构 典型的图像检索系统一般由两部分构成1 3 】:库生成子系统和图像查 询子系统,如图1 1 所示。每个子系统包含相应的功能模块和部件。 库生成子系统负责图像的存储和特征提取,并以特征信息索引库形 式存储图像特征信息的表达式。主要有: ( 1 ) 图像的预先处理:如转换格式、统一规格和图像修饰等,为图 像特征的提取奠定基础。 图1 1 典型的图像检索系统结构 ( 2 ) 图像特征的提取:特征的提取就是从包含大量信息的图像中分 解出不同种类的特征信息,包括视觉特征和统计特征,可从整幅图像、 局部或者内容对象提取特征。 2 中国石油大学( 华东) 硕士论文第1 章绪论 ( 3 ) 数据库系统:它由图像库、特征库和知识库组成。图像库存储 数字化的图像信息;特征库存储图像内容特征和客观特征:知识库存储 综合性知识,有利于检索优化和快速匹配 图像查询子系统完成基于内容的检索功能,由查询接口、检索引擎 和结果浏览三个模块组成。 查询接口主要是完成一些人机交互工作,用户通过查询接口进行参 数设置,包括现实的图像数目,用户感兴趣的图像特征以及一些阈值; 检索引擎主要是完成图像的相似性匹配工作,把示例图像的特征和特征 库中的特征进行相似性匹配,并按照相似度的大小对图像进行排序;结 果浏览模块显示系统的检索结果。 1 1 2 图像检索方法的分类 按照c b i r 研究方向的层面来看,图像特征主要分为底层物理特征 和高层语义特征4 】两大类,而底层物理特征又分为颜色、纹理和形状特 征,高层语义特征又包括对象层语义和概念层语义特征。本文研究的重 点是颜色特征的提取。 ( 1 ) 基于颜色特征的图像检索 颜色是物体表面的一种视觉特性。每种物体都有其特有的颜色特征, 同一类物体往往有着相似的颜色特征,因此可以根据颜色特征区分物体。 颜色特征通常对噪声,图像质量的退化,尺寸、分辨率和方向等的变化 具有很强的鲁棒性,是绝大多数基于内容的图像和视频检索的多媒体数 据库中使用的特征之一颜色特征的描述方法主要有颜色直方图( c o l o r h i s t o g r a m ) ,颜色相关图( c o l o rc o r r e l o g r a m ) ,颜色矩( c o l o rm o m e n t ) , 颜色聚合向量( c c v :c o l o rc o h e r e n c e v e c t o r s ) 等 ( 2 ) 基于纹理特征的图像检索 纹理是图像的重要特征之一,它与物体表面材质有关,通常定义为 图像的某种局部性质,或是对局部区域中像素之间关系的一种度量,其 本质是刻画像素的邻域灰度空间分布规律。 由于纹理特征可用来对图像中的空间信息进行一定程度的定量描 述,因此目前也是基于内容检索系统中的一个重要手段。用户可以通过 3 中国石油大学( 华东) 硕士论文第1 章绪论 提交包含有某种纹理的图像来查找含有相似纹理的其他图像。由于纹理 特征对模式识别和计算机视觉等领域的重要意义,对纹理的分析研究在 过去的三十年中取得了重大的成果。主要的纹理特征有t a m u r a 纹理特 征、自回归纹理模型、方向性特征、小波变换和共生矩阵等形式。 ( 3 ) 基于形状特征的图像检索 物体和区域的形状是图像表达和图像检索中的另一重要特征。形状 特征有两种表示方法,一种是轮廓特征表示法,一种是区域特征表示法。 前者只用到物体的外边界,而后者则关系到整个形状区域。但是不同于 颜色或纹理等底层特征,形状特征的表达必须以对图像中物体或区域的 划分为基础。由于当前的技术无法做到准确而鲁棒的自动图像分割,图 像检索中的形状特征只能用于某些特殊应用,在这些应用中图像包含的 物体或区域可以直接获得。另一方面,由于人们对物体形状的变换、旋 转和缩放主观上不太敏感,合适的形状特征必须满足对变换、旋转和缩 放无关,这也增加了计算形状相似度的难度。 ( 4 ) 基于高层语义特征的图像检索 图像的高层语义包括对象层语义和概念层语义1 5 j 。对于对象层的图 像语义的检索,通常建立在底层特征的基础之上,然后通过对象建模, 最后在对象知识库的辅助下进行对象的识别和检索。概念层语义比对象 层语义复杂,通常分为场景行为语义和情感语义基于场景行为语义的 图像检索方法,是根据要识别的对象和其他对象之间的空间关系,结合 概念级语义的知识库来获取场景行为的语义。图像的情感语义由于包含 丰富的主观成分,其检索方法涉及应用者的认知模型、文化背景、心理 因素等等,因此,除了需要更复杂的知识库以外,还需要更加完善的人 工智能技术。 在上面所述的图像检索方法中,颜色特征以其直观、简便及较强的 鲁棒性等优点,成为人们研究的热点。本文研究的主要内容便是基于颜 色的图像检索方法。 中国石油大学( 华东) 硕士论文第1 章绪论 1 2 基于颜色特征的图像检索的研究热点 基于颜色特征的图像检索是c b i r 的一个分类。由于颜色特征的直 观性和较好的鲁棒性,迅速成为c b i r 中研究的熟点。目前,基于颜色 的图像检索研究的热点主要在下述几个方面: ( 1 ) 颜色特征的提取 图像特征的提取是图像检索计算中一个必不可少的关键步骤图像 特征提取的好坏,直接影响着图像检索系统的性能。 目前常用的颜色特征是颜色直方图,它计算简单且具有旋转、平移 的不变性。但其最大的缺点就是缺少颜色空问分布信息。研究者对如何 描述颜色空间信息做了大量的研究。目前,颜色空间分布特征的描述方 法大致可分为三种:基于划分的方法,基于区域的方法以及基于变换的 方法。但这些方法都不够有效,且引入图像的颜色空间分布特征会破环 颜色直方图的旋转不变性。因此需要进一步对颜色空间分布特征进行研 究以提取出更加有效的颜色特征。 一般提取的颜色直方图,特征维数都比较大,随着图像数量的增加, 检索的计算量和数据的存储量都会越来越大。但如果颜色直方图的特征 维数过小,又可能会降低颜色精度,影响检索性能。因此需要进一步的 改进颜色量化的方法,使其在降低特征维数的同时仍能保持较高的颜色 精度。 ( 2 ) 高维索引技术 网络的飞速发展导致产生了大型的图像数据库,但最新的研究模型 也只能处理几百或几千幅图像,因为只有这样,在顺序扫描处理这些图 像时才不至于严重影响系统的操作性能。随着图像数量的日益增多,检 索速度已经成为瓶颈。尽管在这一研究领域己取得一些进展,例如k - d 树和r 树以及改进的索引树结构等嘲。但探索更加有效的高维索引技术 仍是一个急需解决的问题。 ( 3 ) 相关反馈技术 相关反馈技术主要基于人机交互的思想,借助一种相关反馈的技术 ( r e l e v a n c ef e e d b a c k ) 来猜测用户的需求,并且根据用户的需求,动态调 中国石油大学( 华东) 硕士论文第1 章绪论 整系统检索所采用的特征向量或参于检索的不同特征的权重系数,从而 尽量缩小低层特征和高层语义之间的差距,提高算法的检索效果其实, 相关反馈是文本检索领域中一个基本的技术,r u iy o n g 最先将箕用到 c b 瓜领域【7 罔,实验证明它的确十分有效。此项技术也是近几年c b 墩研 究的热点,许多相关反馈方法也相继被推出唧。 1 3 基于颜色特征的图像检索典型系统介绍 从9 0 年代初期,随着基于内容的图像检索技术成为研究热点,各大 公司和研究机构陆续推出了一些商用或研究用的图像检索系统在这些 图像检索系统中,都采用了颜色特征作为检索方法。 ( 1 ) q b i c q b i c t l o l 是由i b m 公司著名的a l m a d e n 实验室开发的。它是第一个商 品化的基于内容的图像检索系统。q b i c 提供了3 种属性的检索功能:颜 色属性、形状属性和纹理属性,它的检索效率非常高。颜色特性的查询 包括颜色酚比查询和颜色分布查询。纹理属性是对图像中线条的粗糙 性、对比性、方向性三者的综合考虑。形状属性查询包括对象形状查询 和轮廓查询。 ( 2 ) m g e r a g e 】是由w u a g e 有限公司开发的基于内容的图像检索引擎,它 也支持基于色彩、色彩布局、纹理和结构特征的视觉查询功能。但a g e 要比q b i c 在技术上向前迈了一步,r u r a g e 支持以上四种基本查询的任 意组合后的查询方式。用户还可以根据需要来调整一些基本图像特征的 权重。 ( 3 ) v i s u a l s e e ka n dw e b s e e k v i s u a l s c c k 和w e b s e e k i t 2 】是美国c o l u m b i a 大学开发的图像检索原型 系统。该系统的主要特点是用到了图像区域的空间关系查询和直接从压 缩数据中提取视觉特征。所用到的视觉特征有颜色集、纹理特征的小波 变换。为加快检索过程,还开发出了基于二叉树的索引算法。该系统具 有j a v a 浏览器,可以在s g ls u n 和i b m p c 平台上运行 6 中国石油大学( 华东) 硕士论文第l 章绪论 ( 4 ) n e t r a n e l r a i ”1 是u c s b 大学亚历山大数字图书馆项目组开发的一个图像 检索原型系统。n c m a 利用图像分割区域中的颜色、纹理、形状和空间位 置关系来检索数据库中的相似区域。 ( 5 ) p h o t o n a v i g a t o r p h o t o n a v i g a t o r l l 叼是浙江大学开发的一个图像检索系统,该系统将基 于颜色的图像检索技术较为成功地应用于敦煌壁画数据库的研究和开 发。 1 4 本文的主要研究工作 本文在介绍基于颜色特征的图像检索技术的基础上,将颜色直方图 作为研究重点。一般的颜色直方图存在不能反映颜色的空间分布信息及 特征维数过多的不足,本文在这两方面做了一些研究,提出了改进方法。 本文的主要研究工作和篇章结构概括如下: 第l 章,绪论部分,对c b i r 的发展过程、特征分类作了简要介绍i 对基于颜色的图像检索的研究热点及典型系统进行简要的综述。 第2 章,主要介绍基于颜色检索的相关知识。论述了常用的颜色模型、 颜色量化、颜色特征的表示、颜色空间分布信息的表示、颜色特征相似 性度量等。 第3 章,针对颜色直方图缺少颜色空间信息和特征维数过多的缺点 提出了一种分块主颜色检索方法:先对图像进行等面积环形分块,然后 提取各子块的主颜色直方图。实验表明,该方法能够改善检索效果。 第4 章,实现了一个图像检索系统j 峪,对以上介绍的方法进行分析、 比较和评价。 第5 章,结束语,总结全文,列出论文完成的主要工作,指出进一步 的研究方向。 7 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 第2 章基于颜色特征的图像检索技术 在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、 最稳定的视觉特征,相对于其他视觉特征而言,颜色对图像大小和方向 的变化都不敏感,具有相当强的鲁棒性。同时,在许多情况下,颜色又 是描述一幅图像最简便而有效的特征。人们对于一幅图像的印象,往往 从图像中颜色的空间分布开始。所有这些都促使颜色成为基于内容的图 像检索所采取的主要手段之一 基于颜色特征的图像检索中涉及的关键技术有四个:颜色空间的选 择、颜色的量化、颜色特征的提取以及颜色的相似性量度本章主要对 以上关键技术进行介绍。 2 1 颜色空间 对颜色特征的研究必须置于特定的颜色空间之中,常用的颜色空间 有r g b 、y i q 、h s v 、c i el ab 等。采用何种颜色空间并没有一个标准, 一般选择视觉一致性颜色空间,因为它们更接近于人们对颜色的主观认 识。所谓视觉一致性颜色空间是指在颜色空间中定义一个颜色度量函数, 如果在这个颜色度量下,人的视觉感觉差异比较大的颜色之间距离也大, 视觉感觉差异比较小的颜色之间距离也小,具有这种性质的颜色空间即 为具有视觉一致性的颜色空间 下面对r g b 颜色空间和本文采用的h s v 颜色空间进行详细介绍 2 1 1 r g b 颤色空间 r g b 颜色空间在图像显示中是一种常用的颜色空间目前,摄像系 统以及彩色显示器等硬件显示设备大都采用了r g b 颜色空间来表示颜 色数字图像一般也都采用r g b 颜色空间来表示。 如图2 1 t 1 5 1 所示,r g b 颜色空间为一个三维的颜色模型。它以红( r ) 、 绿( g ) 、蓝( b ) 作为三基色,也即在r g b 彩色模型中,所有颜色均由红、 9 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 绿、蓝相加混合而成。在r g b 坐标体系中的原点上,三基色的亮度均为 零,此时代表黑色;当三基色同时达到最高亮度为白色;由等量的三基 色混合而成的颜色是灰色,这些灰色点均落在r g b 彩色立方体的对角线 上。 苴 晶红 红 青 绿 图2 - 1r g b 颜色空间 虽然r g b 彩色模型被广泛应用于c r t 设备显示彩色图像,但它并 不是以一致的尺度表示色彩,不符合人对颜色的感知心理【1 6 1 :而且,r g b 颜色空间上的距离并不代表人眼视觉上的色知觉差异。比如红色 & ( 笙! ,o 埘,粉红色m ( 2 5 5 ,0 ,2 5 5 ) 、蓝色b ( o ,0 2 5 5 ) ,按照欧式距离, 显然d ( m ,r ) = d ( m ,b ) ,但是对人的视觉感觉来说,粉红色应该更接近于 红色因此,需要用另一种符合人的视觉心理的颜色模型来表示颜色。 2 1 2 i t s v 颜色空间 h s v 颜色空间具有视觉一致性,它比r g b 颜色空间更符合人的视 觉特性。h s v 颜色空间把颜色表示为三种属性:色调h ( h u e ) 、饱和度 s ( s a t u r a t i o n ) 和亮度v ( u e ) 。 如图2 2 所示,h s v 颜色空间模型可以看成是倒置的圆锥形h s v 颜色空问的色调h 表示光的颜色,如红、黄、绿等,它用角度0 0 , - - 1 9 0o , 或0 3 6 0 0 来度量。饱和度s 指颜色的深浅程度,即在纯色中包含的白 色光的成分。例如同样是红色,会因颜色浓度不同而分为深红色、粉红 色和浅红色。饱和度s 用百分比来度量,从浓度最小的o 到浓度完全饱 和的1 0 0 0 , 4 。亮度v 是指颜色的明暗程度,也用百分比来度量,从o 为 最暗的黑色,而1 0 0 0 , 4 为最亮的白色。 1 0 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 k 、黄 10 一一、h ,n o 弋 二习三 | 勿 图2 - 2 h s v 颜色空间模型 h s v 颜色空间直接对应于人眼色彩视觉特征的三要素,通道之问各 自独立,因此可以独立感知各颜色分量的变化,其中色调尤其影响着人 的视觉判断。因此在基于内容的图像检索中,应用这种颜色空间模型会 更适合用户的视觉判断m 。 2 1 3 r g b 颜色空问到h s v 颜色空间的转换 由于一般情况下获取的图像都是在r g b 空间描述的,但在图像检索 的应用中,h s v 空间模型更适合于人的视觉感知。因此,在图像处理中 一般把图像从r g b 空间模型转换到h s v 空间模型。 设r ,g ,b 【0 , 1 ,2 5 5 ,由r g b 颜色空间模型到h s v 颜色空间模 型的转化如下【嘲: 设v t - - - - - m a ) 【( r ,g ) ,定义r t ,b 为: 止再而y = - r,g = 瓦丽v - 丽gi ,扩= 丙丽v - 磊b 而 则 v = v 7 2 5 5yq o ,1 】 一生考型一) 柚毗删州叫 【0m a x ( r , g , b ) f n f i n ( r ,g 6 ) 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 i ( 5 拍) r = m a x ( r ,g ,6 ) l ( 1 g ,) ,= m 腻( r g ) _ j 一1 + r g 爿眦( r ,9 0 ) l ( 3 - 6 ) g - - m a x ( r ,g ,6 ) l ( 3 + g ) 6 = n l 积( r ,g ,6 ) i ( 5 叶o t h e r s _ i l = o x h 2 2 颜色量化 a n dg = m i n ( r ,g ,6 ) a n dg m i n ( r ,g 6 ) a 删n d 盖器 协, 6 m i i l ( r g ,6 ) 。 a n dr - - m m ( r ,g 声) d o ,3 6 0 】 颜色量化就是将颜色空间映射到一个给定大小的子集中,并使其总 体误差最小。颜色量化可以有效减少颜色分析的计算量及存储空间。一 个真实的颜色系统大约有2 2 4 种颜色,显然这直接影响到检索的效率和速 度。而且人眼只能识别出有限种颜色,比较人眼不能区分的颜色是没有 意义的。因此在图像处理前,需要先量化颜色空间。 颜色量化的方法有很多,依据颜色模板对全体检索图像是不变的还 是可变的,可以分为两种:固定颜色模板和可变颜色模板 2 2 1 固定颜色模板 ( 1 ) 等间距量化 等间距量化是一种对颜色空间进行均匀分割的方法。它将三个颜色 通道分别等分为l ,m ,n 份,得到l * m * n 种颜色。考虑到不同颜色空间 的特性,各通道对人眼视觉的重要程度不同,有时可以对不同的颜色通 道给予不同的量化级数。比如在h s v 颜色空间中,由于色调往往比饱和 度和亮度对人的视觉感知更重要一些,可以给予h 通道更多的量化级数。 等间距量化方法的实现非常简便易行。但是,通过这种方法量化的 颜色空间,信息可能会集中于少数颜色当中,而且还可能导致相同的颜 色中包含完全不同的信息。这一缺点极大地影响了其进行颜色检索的准 确性。因此,等间距量化方法一般应用于颜色直方图量化的初选。 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 ( 2 ) 非等间距量化 因为c b i r 中采用的颜色空间大都具有视觉一致性的特点,而且人 眼分辨颜色的能力是有限的因此,在量化时可以考虑按照人的颜色感 知对颜色空间进行非等间距的量化非等间距的量化就是对颜色空间每 一通道的划分不是采用等分的方法,而是人为地决定某一划分的大小 这一方法的前提是需要人对颜色空间模型进行大量的分析,在很大程度 上取决于在实际应用中对图像颜色感知特性的理解和分析程度 本文参照文献【1 9 1 ,采取以下方法对h s v 颜色空问作3 2 维非等间距 量化: 对于孵= 0 2 的颜色认为是黑色,c o d e - a o ; 对于锄1 ,且v 0 2 的颜色按亮度v 划分为三种灰度。分别为: 深灰( 0 2 ,0 5 】,浅灰( o 5 ,0 8 】和白色( o 8 ,1 】。c o d e = 1 ,= 2 ,3 其他颜色认为是彩色。将其划分为2 8 种彩色。 c o d e - - 4 + 4 * h + 2 j + v 。 h 2 0 ,矿h ( 3 3 0 , 3 6 0 u 1 0 ,2 0 1 i ,矿h ( 2 0 ,4 5 】 2 ,矿h ( 4 5 ,7 5 】 3 ,i f h ( 7 5 ,1 6 5 4 i fh e ( 1 6 5 , 2 0 0 5 ,fh ( 2 0 0 ,2 7 0 6 ,矿h ( 2 7 0 ,3 3 0 】 拈:辫:;i 5 】 v ,- j o ,矿( o 2 ,o 5 】 【l ,矿v e ( n 5 ,1 】 ( 2 - 2 ) 按照上面的方法将颜色空间共划分为3 2 种颜色,这3 2 种代表色的量化 方法有效地压缩了颜色特征并且较好的符合人眼对颜色的感知。 ( 3 ) 参考颜色表( r e f e r e n c ec o l o rt a b l e ,r c t ) 1 2 0 固定颜色模板最典型的是m e h t r e 等提出的参考颜色表( r c t ) 方法。 然而r c t 方法依赖于存储图像色彩分布的先验知识,随着图像库中图像 数据的增删,参考颜色表会变得越来越不精确 m m 在q b i c 系统中使用了参考颜色表的方法l ,用于量化彩色图 像,然后在量化图像上构造直方图。设r c t 有k 种颜色,直方图就是建 立在k 种参考色上,每个直方图是一个k ( 一般k = 6 4 或k = 2 5 6 ) 维颜色 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 向量。系统首先将r g b 三轴分别等量量化为1 6 个等级,共得出2 1 2 个颜 色立方盒,计算每个立方盒在m u n s e l lh v c 颜色空间的坐标轴,然后进 行标准的最小平方和聚类,可得到最优的k 个颜色。每个立方体用其中 心颜色做代表色,它们构成了颜色空间的一个划分。最后统计落在各个 立方盒内的像素,归一化后构成颜色直方图。这样,图像的直方图统计 只需要查表,不论输入图像的具体颜色分布如何,都用r c t 量化为k 种颜色表示,且k 个量化颜色不随图像而改变。r c t 方法适合于固定数 据库,如各种图像光盘,专用的艺术图像库等。但可以看出,参考色的 选择是至关重要的,如果没有存储图像颜色的先验知识,参考颜色也就 无从确定。而且对于变化的图像数据库,其性能随着图像的增、删、改 而变坏,颜色表示的精确度越来越差。 2 2 2 可变颜色模板 鉴于固定颜色模板往往不能很好地表示图像颜色的缺点,人们又提 出了可变颜色模板。每个图像都有自己的颜色模板1 2 1 】,这种方法能很好 的表示图像的颜色分布,实现图像之间相似性匹配。但根据其量化的方 法不同又可分为多种方法1 2 0 。 ( 1 ) 频度序列法【2 2 】 频度序列法的实现分为两步:第一步选择图像中使用频率最高2 5 6 种颜色作为颜色模板;第二步把其余颜色按最小距离准则映射到颜色模 板中该方法的特点是根据不同的图像选择不同的颜色模板,即可变颜 色模板。它是一种简单的颜色量化方法。该算法的优点是算法复杂度低、 实现容易,缺点是颜色量化效果不够理想。 ( 2 ) 中值裂分法暖l 中值裂分法是以集合r 、g 、b 中方差最大的那个分量的中值作为 裂分标准,不断地把颜色空间裂分成越来越小的区域,直至最终得到n 个集合,各集合中心点的颜色即为颜色模板的颜色。由于该算法采用最 大方差准则作为裂分标准。故所得到的颜色模板既能最大程度地反映图 像颜色的使用频率,又能保证图像中使用较少却非常特殊的颜色不被丢 失,可见是一种较好的量化方法 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 ( 3 ) 聚类量化法 基于图像中颜色之间的相似距离,采用模式识别中聚类方法的思想: 相同类内元素具有大的相似性,不同类中元素具有较小的相似性,通过 迭代实现类的划分。聚类方法大致可以分为两类:系统聚类法和动态聚 类法。系统聚类法是先选择若干个样本按准则函数逐步聚合,类别由多 到少,直到合适的分类为至;动态聚类法有k - m e a n s 算法 2 3 j ,i s o d a t a 算法1 2 4 1 、g l a 算法【2 5 0 6 】等。动态聚类算法起始类别数目和聚类中心不好 确定,一般采用随机方法在初始数据集中选择初始聚类中心。不同的起 始类别数目、初始聚类中心往往都会影响分类结果。 2 3 颜色特征的提取方法 颜色特征提取的好坏,直接影响着图像检索系统的性能,特征提取 是基于内容的图像检索的基础。常用的颜色特征的表示方法主要有颜色 直方图、累计直方图、颜色矩、颜色聚合向量等。 2 3 1 颜色直方图 在基于颜色的图像检索中,颜色直方图( c o l o rh i s t o g r a m ) 是最常用 的特征表示方法1 2 7 1 。在确定颜色空间的基础上,对一幅数字图像,统计 每一种颜色在该图像中出现的象素点数,然后以颜色值作为横坐标,颜 色出现的象素点数作为纵坐标,以此绘出的图形就称为该图像的颜色直 方图图像的归一化颜色直方图h 可以定义 2 8 】为: f上、 日= ( 水。】,j l 【c 2 】 珂q 】埘厶】) l m q m ,o m c 坶 ( 2 - 3 ) l i - l j m “】表示第k 种颜色在该图像中出现的象素点频数: m q ( 2 4 ) 其中l 和飓为图像的宽和高。 颜色直方图具有平移和旋转不变性,因此在图像检索中得到广泛的 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 应用。但是,颜色直方图也有以下不足: ( 1 ) 颜色直方图只反映了图像颜色的统计分布信息,而丢失了颜色 的空间分布信息。因此不同的图像可能有相同的颜色直方图,从而降低 检索效率。 ( 2 ) 颜色直方图的特征维数与颜色量化有关。一般地,颜色直方图 定义在一个固定的颜色集上,数量和颜色对于所有图像均保持不变嗍。 例如:j a i n 3 0 等采用r g b 通道分别等量量化的方法;s m i t h l 3 1 h s v 颜色 空间等量划分为1 6 6 个区域,对色调、饱和度和亮度采用1 8 x 3 x 3 的组 合;q b i c t l o 】采用固定的2 5 6 种参考颜色表量化图像:等等。而这些方法 获得的颜色特征维数都很大。随着图像的增加,计算量和数据库的存储 量都会越来越大。同时,对于颜色集中的某些颜色,图像中可能并没有 该颜色,颜色直方图中就会出现若干零值,这样会造成稀疏颜色直方图, 而稀疏直方图对噪声是很敏感的【2 9 】。另一方面,如果降低颜色的特征维 数,即降低颜色量化级数,又可能造成对图像表示的不精确,降低检索 效率。 针珂颜色直方图的以上两点不足,本文将提出改进的方法。该方法 既能获取颜色的空间分布信息,又能在降低颜色特征维数的同时保持较 高的颜色精度 2 3 2 累计直方田 当图像中的特征不能取遍所有的可取值时,颜色直方图中会出现若 干个零值。这些零值会影响直方图相交的计算,从而使匹配值不能正确 地反映两幅图像之间的颜色差别。由颜色直方图演化而来的累积直方图 可以解决上述问题【3 2 】。 累积直方图的定义如下: i 1 1 n ( k ) = j = ; k = o ,l ,厶l( 2 5 ) v 累积直方图可以有效地解决零值问题。实验表明,一般情况下,使 用累积直方图检索图像的效果优于统计直方图1 3 3 】。 中国石油大学( 华东) 硕士论文第2 章基于颜色特征的图像检索技术 2 3 3 颜色矩 颜色矩【拍j 是一种非常简单而有效的颜色特征。这种方法的数学基础 在于图像中任何颜色分布均可以用它的矩来表示此外,由于颜色分布 信息主要集中在低阶矩中,因此仅采用颜色的一阶矩、二阶矩和三阶矩 就足以表达图像的颜色分布。与颜色直方图相比,该方法的另一个好处 在于无需对特征进行向量化。颜色的三个低阶矩在数学上表达为: “= = jf - 乩 7 2 - 6 l 2 ) p t 2 i l p q ) r1 中 q 2 恃;( p ,叫叫 q 7 置= 专薯c p ,一声。,3 班 c z - s , 其中, n 为第j 个像素的第i 个颜色分量,为统计的像素数目。 因此,图像的颜色矩一共只需要9 个分量( 3 个颜色分量,每个分量上3 个低阶矩) ,与其他的颜色特征相比是非常简洁的。但由于低阶矩的分辨 能力较弱,因此在实际应用中,常和其他特征结合使用,而且一般在使 用其他特征前起到过滤缩小范围的作用。 2 3 4 颜色聚合向量 图像的颜色聚合向量【3 5 】是颜色直方图的一种演变,其核心思想是将 属于直方图每一个b i n 的像素分为两部分:如果该b i n 内
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全款租房合同范本
- 富力购房合同范本
- 文化艺术节目创意策划方案
- 在线社交平台市场分析与趋势
- 生态保护修复资金申请政策环境与实施效果分析报告
- 2025年铝挤压培训题库及答案
- 2025年南安普顿考试试题及答案
- 2025年食品安全管理员考试题库及参考答案
- 2025年山西省中小学教师招聘面试真题及答案
- 2025年山西公务员考试申论试题及参考答案(乡镇卷)
- 大学摄影教学课件
- DB13T 5252-2020 HDPE内衬修复供水管道技术规程
- 2025年天津市中考物理试卷真题(含标准答案)
- 循环经济与绿色生产方式
- 大班喝水教学课件
- DB31/ 741-2020碳酸饮料单位产品能源消耗限额
- 开学第一课课件高中政治统编版
- 2025儋州市兰洋镇社区工作者考试真题
- 2025-2030木薯市场发展现状调查及供需格局分析预测研究报告
- 小儿推拿店员合同协议
- 医疗废物管理知识培训课件
评论
0/150
提交评论