(计算机软件与理论专业论文)基于颜色特征的图像检索模型.pdf_第1页
(计算机软件与理论专业论文)基于颜色特征的图像检索模型.pdf_第2页
(计算机软件与理论专业论文)基于颜色特征的图像检索模型.pdf_第3页
(计算机软件与理论专业论文)基于颜色特征的图像检索模型.pdf_第4页
(计算机软件与理论专业论文)基于颜色特征的图像检索模型.pdf_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 基于颜色特征的图像检索模型 计算机软件与理论专业硕士研究生郑强 指导教师唐雁教授 摘要 随着计算机 互联网 图像处理技术的飞速发展 出现了越来越多的数字图 像 怎样从这些巨大的数字图像资源中 快速有效地得到想要的图像数据越来越 成为一个急需解决的问题 因为这个原因 近年来基于内容的图像检索技术已经 成为一个研究热点 基于内容的图像检索技术的研究主要集中在三个方向上 分 别是颜色 形状和纹理 颜色是基于内容的图像检索中应用最为广泛的特征 因 此本文主要对基于颜色特征的图像检索模型进行研究 国内外对基于颜色特征的图像检索模型的研究取得了一系列的成果 t o m b o y l e 提出了基于流行色的图像检索模型 k a n k a n h a l l i 和m e h t r e 提出了基于聚类 的颜色匹配检索模型 p a s s 等人提出了使用最大熵方法分析颜色空间信息的检索 模型 s t f i c k e r 等提出了使用模糊区域 计算颜色距的检索模型 c o l o m b o 等人基 于颜色空间的一致性 提出了颜色一致性检索模型 c i n q u e 等人利用色彩聚类方 法将图像的整体直方图分解成局部的区域直方图 提出了基于局部区域的检索模 型 这些基于颜色特征的图像检索模型在量化方法上存在不足 量化后的颜色不 能很好的表现图像的颜色特征 另外 许多算法没有考虑颜色的空间分布特征 导致检索出完全不相关的图像 针对以上问题 本文提出了一个基于不均匀量化 连通区域特征提取和矩形 信息排序的图像检索模型 图像检索模型主要有三个创新点 如下所示 1 模型在量化阶段 针对h s v 颜色空间的特点 提出了一种不均匀的量 化方法 将h 量化为6 级 s 和v 分别量化为3 级 h s v 颜色空间被量化为5 4 个量化级 不均匀的量化方法在保存图像大部分信息的基础上 使量化级数减少 到5 4 级 为后续特征提取阶段做了准备 由于量化级数较少 特征提取的速度就 较快 从而使查询速度也增快 2 特征提取阶段 提出了使用连通区域计算图像的直方图 计算图像的连 通区域面积 在图像的连通区域上使用了颜色直方图对图像信息进行统计 并使 用连通区域的直方图计算图像的相似度 连通区域使图像更好的反应了局部信息 减少了全局直方图相同但是局部完全不相同的图像出现的几率 3 对于检索出的中间结果 使用了矩形信息对图像进行重新排序 使相似 度高的图像位于检索结果的前面 主要思想是 分别计算出结果集和候选集 使 西南大学硕士学位论文 用矩形信息去掉结果集中相似度比较小的图像 用候选集中相似度比较大的图像 来代替 从而提高查询的精度 经对比实验表明 本文提出的模型有效地提高了 图像检索的查全率和查准率 关键词 图像检索 特征提取 相似度度量 矩形信息 a b s t r a c t ac o l o r b a s e di m a g er e t r i e v a lm o d e l m a j o r c o m p u t e rs o f t w a r ea n dt h e o r y r e s e a r c hd i r e c t i o n w e b a p p l i c a t i o nt e c h n o l o g i e s s u p e r v i s o r p r o f y a nt a n g a u t h o r q i a n gz h e n g 一 一 一 a bs t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e r ss c i e n c e t h ei n t e r n e ta n d i m a g ep r o c e s s i n g t e c h n o l o g y t h ev o l u m eo fd i g i t a li m a g ei sg o i n gu pf a b u l o u s l y h o wt og e tt h ed e s i r e di m a g e s q u i c k l ya n de f f i c i e n t l yi si n c r e a s i n g l yb e c o m i n ga nu r g e n tp r o b l e m a tp r e s e n t c o n t e n t b a s e di m a g e r e t r i e v a lh a sb e c o m eah o ta r e ao fr e s e a r c h i nt h i sp a p e r c o l o r b a s e di m a g er e t r i e v a lw a ss t u d i e d n 圯s t u d yo fc o l o r b a s e di m a g er e t r i e v a lh a sm a d eas e r i e so fa c h i e v e m e n t sa tc h i n aa n d a b r o a d t o mb o y l eh a dr a i s e da ni m a g er e t r i e v a lm o d e lb a s e do i lp o p u l a rc o l o r k a n k a n h a l l ia n d m e h t r eh a dr a i s e dac o l o rm a t c h i n gm o d e lb a s e dc l u s t e r i n g p a s se t e u s e dai n a x i h l u n le n t r o p y m e t h o dt oa n a l y s et h ec o l o rs p a c ei n f o r m a t i o n s t r i c k e re t c h a dr a i s e dam o d e lb a s e do nc o l o r m o m e n t s c o l o m b oe r e h a dr a i s e dam o d e lb a s e do nc o l o rc o h e r e n c ev e c t o r c i n q u ee t c w h ou s e d c o l o rc l u s t e r i n gm e t h o dt oc a l c u l a t et h ec o l o rh i s t o g r a m h a dr a i s e dam o d e lb a s e do nt h el o c a la 胤 m a n yq u a n t i t a t i v er e s u l t sc a nn o te f f e c t i v e l ye x p r e s st h ec h a r a c t e r i s t i c so ft h ei m a g e s m a n y a l g o r i t h m sd on o tc o n s i d e rt h es p a t i a ld i s t r i b u t i o no fc o l o r s r e s u l t i n gi ns o m ec o m p l e t e l yu n r e l a t e d r e t r i e v a lr e s u l t s i nv i e wo ft h ea b o v eq u e s t i o n s w ep r e s e n tam o d e lu s i n gu n i f o r m b a s e dq u a n t i z a t i o n c o n n e c t e dr e g i o nf e a t u r ee x t r a c t i o n s o r to fr e c t a n g l ei n f o r m a t i o n i nt h eq u a n t i t a t i v es t a g e w e p r e s e n tau n i f o r m b a s e dq u a n t i z a t i o nm e t h o dt h a tl e tt h eq u a n t i z a t i o nl e v e lw a sr e d u c e dt of i f t y f o u r l e v e l i nt h i sw a y 舔l e s sq u a n t i t a t i v es e r i e s i tm a k e st h es p e e do ff e a t u r ee x t r a c t i o nf a s t e r i nf e a t u r e e x t r a c t i o ns t a g e w ec a l c u l a t et h er e g i o n a la r e ao ft h ei m a g e w eu s et h ec o l o rh i s t o g r a mt om a k ea s t a t i s t i c so ft h ei m a g ei n f o r m a t i o n c o n n e c t e dr e g i o ni sb e t t e rt or e f l e c tt h el o c a li n f o r m a t i o no ft h e i m a g e 1 1 1 em e t h o d r e m o v e ds o m er e s u l ti m a g e st h a ta l en o ts i m i l a rw i t ht h eq u e r yi m a g e t h e h i 曲s i m i l a ri m a g e i sf r o n to ft h es e a r c hr e s u l t s n em a i ni d e ai s t h er e s u l t si n c l u d ear e s u l ts e ta n d ac a n d i d a t es e t w el l s et h er e c t a n g l ei n f o r m a t i o nt or e m o v et h ed i s s i m i l a ri m a g ef r o mt h er e s u l ts e t a n du s et h ei m a g ei nt h ec a n d i d a t es e ti n s t e a do fi t e x p e r i m e n t a lr e s u l t ss h o wt h a tt h em e t h o di s e f f e c t i v e k e yw o r d s i m a g er e t r i e v a l f e a t u r ee x t r a c t i o n s i m i l a r i t ym e a s ur e m e n t r e c t a n g u l a ri n f o r m a t i o n i i i 独创性声明 本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成 果 论文中引用他人已经发表或出版过的研究成果 文中已加了特别标注 对本研究及学位论文撰写曾做出贡献的老师 朋友 同仁在文中作了明确 说明并表示衷心感谢 学位论文作者 狩弓苏 签字日期 2 o d 年多月2 2 日 学位论文版权使用授权书 本学位论文作者完全了解西南大学有关保留 使用学位论文的规定 有权保留并向国家有关部门或机构送交论文的复印件和磁盘 允许论文被 查阅和借阅 本人授权西南大学研究生院 筹 可以将学位论文的全部或 部分内容编入有关数据库进行检索 可以采用影印 缩印或扫描等复制手 段保存 汇编学位论文 保密的学位论文在解密后适用本授权书 本论文 晌 保 密 口保密期限至年月止 1 n 一一 学位论文作者签名 辫弓致 导师签名 眵乙哆 签字日期 沙f 寿r 月 2 日 签字日期 0 年岁月乙z 日 第一章绪论 第一章绪论 1 1 研究背景及意义 随着计算机技术和图像技术的高速发展 全球的数字图像的数量正在以超乎 寻常的速度增长 每一天 在世界的各个角落 都会有大量的有意义或者无意义 的数字图像产生 现在一个普通的数码相机 每天都可以创造出几百兆的图像数 据 这些图像 不但对于拥有者自己非常有用 而且对于他人有很大的用处 毫无疑问 这些图像中包含有巨大的可用信息 每个地方的每一台计算机上 或者其他存储设备上 都可能包含了有用信息的图像 不幸的是 由于这些图像 分布在世界各地 对图像缺少统一的组织和管理 想要访问图像中有用的信息非 常困难 这就要求一种新的能够快速准确查找图像信息的技术 也就是图像检索 技术 自2 0 世纪7 0 年代中期以来 计算机视觉和数据库技术两大研究领域取得了 一定的研究成效 这两个技术 是图像检索技术的基石 在这两个技术的推动下 图像检索技术也逐渐成为一个非常热门的研究领域 这个领域的研究热潮 直到 现在也没有衰减 越来越多的新技术新理论 正在提出 相信在不久的将来 会 出现一些比较优秀的图像检索技术 使用图像检索技术的产品也会随着技术的成 熟 不断地在市场上推出 随着数据库技术的发展 特别是关系型数据库的从理论到产品的成熟 市场 上 出现许多大型的数据库系统 这些系统可以存储上亿信息 而只需要极少的 存储空间 同时 使用索引技术 对于拥有上亿条信息的数据库 查询的时间也 只需要数秒 甚至更少 这要依赖使用的数据库系统的执行效率和计算机硬件设 备的速度 在数据库大容量和高速度的促进下 产生了基于文本的图像检索技术 1 1 随着计算机视觉技术的发展 特别是人脸识别 指纹识别 虹膜识别等技术 从理论到市场的成熟 市场上 也出现了很多利用计算机视觉技术的产品 例如 自动对焦数码相机 指纹安全门和人脸识别系统等 这些产品 利用计算机视觉 技术中的一项或者多项算法 达到快速识别的效果 在高端的数码相机中 自动 对焦和人脸识别只需要1 秒以下的时间 这种速度为大量数字图像的处理提供了 前提 也为图像检索速度的提高做出了非常重要的技术铺垫 在计算机视觉技术 的促进下 产生了基于内容的图像检索技术 本论文主要研究的就是基于内容的 图像检索技术 随着数据库技术在2 0 世纪7 0 年代的逐步成熟 基于文本的图像检索方法也 在2 0 世纪7 0 年代出现1 2 j 最初的图像检索系统是将图像作为数据库中的一个记录 西南大学硕十学付论文 存储起来 用关键字对起进行描述 然后使用数据库的查询方法对其进行检索 这种检索技术主要通过对图像进行人工文字注解 利用文本检索的算法实现对图 像特征的检索 这种采用对图像建立关键字的技术 已经越来越不适应图像信息 检索的要求 在这样的现实背景下 基于内容的图像检索技术 c b i r c o n t e n t b a s e d i m a g e r e t r i e v a l 就应运而生了 基于文本的图像检索不但费时间费力 而且使用 文字也很难对图像所包含的信息进行完整的描述 从心理学的角度 人们对同一 图像的分类和信息提取可能出现偏差 使用出现偏差的关键字进行检索 显然得 不到好的检索结果 另一个方面 基于文本的图像检索系统也可以使用机器标注关键字 这种系 统二般有词典的支持 词典的选取一般是以词或旬为单位 基于文本的检索系统 使用这个词典对图像进行注解 然后将注解的结果放在数据库中 供用户查找 另外 除了标注技术外 关于多维索引 查询评价等技术也在同一时期得到发展 双方互相促进了对方的快速发展 虽然基于文本的检索技术目前广泛使用 但是该技术存在一些严重的问题 目前对这种技术的应用 也是一种折衷的办法 因为目前缺少 种方法 在普遍 领域能得到比基于文本的图像检索更好的结果 基于文本的图像检索技术存在严 重问题的原因是 目前的计算机视觉和人工智能技术无法完成对图像的准确标注 虽然有些计算机视觉和人工智能方法能够适用于一些图像的自动标注 但是 不能在广泛领域使用 对图像的标注 大部份仍然依赖于人工完成 人工标注的 效率不但低 而且人工标准的准确性和完整性也不能得到保证 在任何情况下 人工标注都可能因为主观因素而出现错误 而且一旦错误 也难以发现 总之 不同的人对一幅图像有不同的理解 这种主观理解在现实生活中是不可能相同的 就算对于标准者来说 能够统一而且准确的对所有图像进行标注 但是对于查询 者来说 并不能以标注者的角度去查询图像数据 从宏观上来讲 使用人工标注的关键字也不能包含图像中丰富的视觉特性 例如颜色 纹理和形状信息等 因为缺少这些信息 所以基于内容的图像检索技 术有先天不足的缺点 目前大部分关于图像检索的研究已经转入到了基于内容的 图像检索中来 2 0 世纪9 0 年代 随着互联网技术的广泛发展 越来越多的数字图 像出现在我们的面前 在这种情况下 基于文本的图像检索技术已经不能够满足 实际的应用需要 基于内容的图像检索技术已经成为研究者眼中的热点 基于内容的图像检索技术与基于文本的图像检索技术的区别在于 基于文本 的系统使用人工标注的方法对图像进行标注 而基于内容的图像检索技术自动的 提取每幅图像的视觉特性 将其作为特性量存储在数据库中 供用户的检索 这 些特性主要包括颜色 形状和纹理等 2 第一章绪论 对基于内容的图像检索技术的研究具有重要的理论价值和现实意义 z 1 随着物 质文明和精神文明的发展 在日常生活中对图像检索的需要越来越大 例如在知 识产权方面 随着市场经济的发展 人们越来越关心知识产权的保护问题 大多 数需要保护的知识产权都以图像的方式存在 例如商标和艺术作品等 商标一般 包含文字和图形元素 为了防止侵权问题 一个合法的商标应该经过商标注册部 门的审核 以防止与现有商标的相似 侵害商标的合法协议 目前的做法 是使 用文字来描述商标上字符和图形 然后通过人工比对的方式确定商标的合法性 这显然是费时费力的 很明显 使用基于内容的图像检索技术来审核商标的的合 法性 对简化整个商标的注册过程有非常重要的实际意义 1 2 研究现状 基于内容的图像检索技术从提出以来 国内外研究取得了不少的成果 不断 有新方法新技术出现 学术上 国内外知名期刊对基于内容的图像检索技术都有 详细的介绍 本节将首先对国内外典型技术进行分析 1 2 1 国内外典型技术 目前 基于内容的图像检索技术主要集中在图像的特征层次上 图像的特征 包括颜色 纹理 形状和空间等 大多数技术使用这些特征建立图像特征库 当 查询图像时 将查询图像和数据库中的目标图像进行对比 找出相似度高的图像 返回给用户 这种研究思路从7 0 年代到现在已经广泛采用 近年来国内外陆续投 入了大量的人力物力对该技术进行研究 取得了不少的成就 研究者根据技术和 理论上的研究成果 开发了很多原型系统 3 其中最具有代表性的系统是 1 r e t r i e v a lw a r e 系统 r e t r i e v a lw a r e 系统是又e x c a l i b u r 公司开发的一种基于内容的图像检索系统 t 4 1 2 1 2 在软件的早期版本中 主要是使用神经网络算法实现图像检索技术 在新的版本中 系统添加了颜色形状纹理等特性来进行图像检索 该系统在组合 多种特征方面 提出了新方法 2 p h o t o b o o k 系统 p h o t o b o o k 是m i t 实验室研究的用于浏览和搜索图像的图像检索系统 t s 1 2 1 3 该系统使用了3 种特征技术 分别是形状 纹理和面部特征 用户可 以使用这3 种特征分别进行查询 这个系统中的人脸识别系统已经应用于美国的 警察机构中 人脸识别也可以看成是基于内容的图像检索系统中的 种 3 q b i c 系统 q b i c 是i b m 公司开发的一个基于内容的图像检索系统 这个系统包含3 个 西南大学硕士学位论文 子系统 分别是 图像入库 特征计算和查询 该系统功能丰富 不但支持例图 查询 颜色和纹理查询 而且还支持手绘图像查询 q b i c 中存储了图像的高维特 征 这些特征的使用提高了图像检索的一些精度 4 v h a g e 系统 v l r a g e 系统是由v t r a g e 公司开发的一个基于内容的图像检索系统 该系统支 持基于颜色 颜色空间结构 纹理和纹理空间结构的图像查询 该系统的一大特 点是支持以上4 种查询的任意组合 用户可以根据自己的查询目的调整这4 个查 询的权重 使用这种方法 有效的提高了图像检索系统的检索能力 5 n e t r a 系统 n e t r a 系统是u c s b 实验室开发的一种图像检索系统 这个系统首先将图像按 照一定的方式分块 然后使用颜色 纹理 形状和空间位置信息对图像进行检索 n e t r a 系统使用的主要技术有两个 一是g a b o r 滤波的纹理分析 二是使用神经网 络技术对图像进行分类 从分类效果上来看 该系统提出的算法较为优秀 6 m a r s 系统 m a r s 系统是美国伊利诺斯大学开发的一个基于内容的图像检索系统 5 1 该系 统首先正式提出了相关反馈的技术和理论 在该系统中 可以使用层次化的检索 方法 对检索结构进行用户自定义的反馈 与其他系统不同的是 m a r s 系统并 不是研究某单一特性对图像检索效果的影响 而是研究一种自适应的多特征图像 检索方法 用户可以在该系统中 对感兴趣的区域进行检索并及时反馈 反馈将 使系统调整系统参数 对查询图像重新检索 综上所述 目前基于内容的图像检索主要集中的颜色 纹理和形状领域 这 些底层特征通常和上层语义相关联 综合两种技术的研究成为目前的主流 目前 多数基于内容的图像检索技术都是使用特征和上层语义进行相似度匹配 有效的 提高了图像检索的准确性 1 2 2 图像检索技术的关键点 从目前的研究来看 制约基于内容的图像检索技术提高的因素 主要在两个 方面 第一是怎样找到一种技术利用图像的底层视觉特征有效地表示图像的内容 这些底层特征包括颜色 形状和纹理特性等 第二是 如何度量图像之间的相似 性 目前 研究的内容多从这两个方面展开 一方面 研究人员力求找到一种能 有效表示图像信息的方法 另一方面 研究人员努力去寻找一种方法可以度量图 像之间的相似性 从现状来看 这些尝试都不是很理想 围绕以上两个因素 在理论上 目前有很多关键技术需要解决 这些关键技 术主要包含一下几个方面 4 第一苹绪论 1 特征的提取 特征提取是基于内容的图像检索的关键技术之 目前研究比较深入的特征 是颜色特征 纹理特征和形状特征 对于颜色特征来说 相似度度量定义的方法 十分困难 因为目前很难找到 种度量方法和人类视觉的度量方法一样 所以研 究图像之间的度量方法 最好能先弄清楚人类视觉对图像的度量方法 遗憾的是 目前人类视觉和人类心理学关于视觉度量方法的研究并不深入 所以难以找到一 种好的度量方法能使其符合人类视觉的特点 第二种纹理特征是一个即为重要又很难形容的特性 这种技术需要首先将图 像的纹理特征进行精确的描述 这是一项计算量大而且困难的工作 目前 纹理 特征并没有明确的定义 由纹理特征计算出的特征量其视觉意义并不强 通过实 验可以看出 以一种视觉意义并不强的特征 去检索图像 得到的往往是内容并 不相近的结果 从目前的研究来看 纹理特征不能广泛应用于所有的图像 只适 用于一部份图像而已 第三种形状特征是描述图像高层特征的一种方法 目前 形状描述技术还不 是非常成熟 主要原因是自动提取图像边界一直是图像处理的一大难题 另一方 面 目前的形状度量方法不具有很好的形状区分能力 不能很好的表达图像形状 之间的相似性 2 特征的局限性 特征具有局限性 目前大多数特征提取算法都是针对特定应用有效的 一旦 扩展到应用范围以外 效果就会明显下降 到目前为止 还没有一种有效的方法 能够使一种或多种特征用于多种应用 这种局限性 使基于内容的图像检索系统 的发展受到阻碍 3 1 图像的语义问题 目前的特征提取方法主要从图像的底层抽取特征 而真正表现图像内容的是 图像的高层语义特征 现在的技术方法中 很难找到一种直接有效的从底层特征 到高层语义的转换方法 无法突破这一点 那么基于内容的图像检索只能使用底 层特征来度量图像 达到的效果也受底层特性无法完全描述图像内容的限制 由 于这种限制 使用底层特征描述图像 然后进行图像检索并不会产生很好的效果 4 多特征检索方法融合 一个图像的单一特征始终只能表示图像内容的一个方面 这种方式虽然简单 但是由于单个特征包含的信息不足 一般很难达到理想的检索效果 目前 部分 研究者将视角转换到了综合多特征检索的技术来上 这中多特征检索技术 试图 综合两种或者更多种特征 对图像进行更全面的描述 企图达到更好的效果 但 是 目前摆在研究者面前的问题是 如何有效的结合不同形式的特征 使其各自 西南大学硕士学位论文 发挥所长而不相互影响 1 3 主要工作 本文针对目前颜色特征从空间转换到度量阶段存在的问题 提出了一种新的 基于颜色特征的图像检索模型 有效地提高了图像检索的查全率和查准率 本文 的主要工作如下所示 1 h s v 颜色空间的不均匀量化 量化是基于颜色特征的图像检索中一个非常 重要的问题 目的是减少图像中颜色的数目 为特征提取提供预处理功能 太多 的颜色并不能使特征提取算法有效地进行 颜色量化会使颜色数目减少 从而加 速特征提取的速度 实际中 颜色量化会导致颜色信息的丢失 这对图像检索的 效果有非常大的影响 本文在h s v 颜色空间中 提出了一种不均匀的量化方法 这种不均匀量化方法将h s v 颜色空间的色调 亮度 色饱和度进行了不均匀的划 分 最终将h s v 颜色空间量化为5 4 个度量级 有效地减少了颜色数目 同时 采用这种不均匀的量化方法 可以使颜色量化对检索结果的影响减少 2 基于连通区域的特征提取 特征提取是本文研究的重点技术 本文提出了 连通区域的概念 使图像信息不仅能从全局上表现出来 而且能够从局部信息中 表现出来 3 基于矩形信息的排序 本文在检索算法中加入了矩形信息 用来对中间检 索结果进行添加和删除 并对其进行排序 主要思想是 用户从查询例图中选择 一块有代表性的区域 与查询的中间结果图像进行矩形区域对比 对完全不符合 查询例图的图像进行删除 用候选集中相似度高的图像来代替 从而去除一些完 全不相关的图像 4 结合以上工作 提出了一个基于不均匀量化 连通区域特征提取和矩形信 息排序的图像检索模型 经对比实验表明 本文提出的模型有效地提高了图像检 索的查全率和查准率 1 4 论文结构 本文分为5 章 各章的内容安排如下所示 第一章是绪论 绪论中首先介绍了本论文的研究背景和意义 然后介绍了基 于内容的图像检索技术的国内外研究现状 重点分析了基于颜色特征的图像检索 技术 最后介绍了本文主要工作 第二章主要介绍了基于颜色特征的图像检索的相关理论和技术 主要包括目 前常用的颜色量化方法 特征提取方法和一些典型的检索算法 最后介绍了图像 第一章绪论 检索算法的性能评价标准 这些理论和技术将在后面的研究中用到 第三章介绍了本文的主要研究成果 提出了一种基于颜色特征的图像检索模 型 这一章中详细地阐述了h s v 颜色空间不均匀量化的方法 基于连通区域的特 征提取和基于矩形信息的排序方法 第四章分析了本文提出的模型的实验结果 在查全率和查准率上 与以往的 研究进行了比较 取得了较好的实验结果 第五章给出了本文的总结和未来的工作展望 在论文的最后是参考文献 致谢和攻读硕士学位期间发表的学术论文 7 两南大学硕十学位论文 曼皇曼曼曼皇寡寡曼量曼曼皇曼曼曼鼍曼曼曼量舅舅i i i 皇皇曼曼曼曼曼曼皇皇曼量曼曼曼曼曼曼曼曼蔓曼曼曼曼曼量曼皇曼曼曼曼曼鲁毫曼量皇曼皇 第二章相关理论和技术 颜色特征是图像检索技术中使用的基本特征之一 从应用来看 颜色特征是 目前应用最广泛的视觉特征 颜色特征与形状 纹理特征相比 对图像的尺寸 方向和位置的依赖性较小 同时 颜色特征的提取也相对容易 计算量较低 因 为这些原因 基于内容的图像检索技术中对颜色特征的研究受到研究者更为广泛 的重视 2 1 颜色系统 颜色系统是一个庞大 复杂 诱人的研究领域 在颜色系统中有两种重要的 颜色系统 红 绿 蓝 r g b 加色系统和青 品红 黄 c m y 减色系统口 两种系统中的颜色互为补色 这种补色关系是 青色是红色的补色 品红是绿色 的补色 黄色是蓝色的补色 两种颜色互为补色的意思是 两种颜色混合在一起 会得到白色 r g b 颜色空间是计算机处理图像最常用的颜色空间 通常将r g b 颜色叫做三 基色 在3 d r g b 空间中 每一个像素是该空间中的一个点 对颜色空间的构造 一般要满足以下几个要求 1 一致性 一致性是指颜色在颜色空间中的相似性应该表达视觉上的相似性 也就是说 两种颜色使用颜色空间度量方法算出的差异应该于在视觉上人们感知的差异成正 比 2 紧凑性 紧凑性是指在颜色空间中一种颜色能够区分于另一种颜色 3 完整性 完整性是指颜色空间爱你应该包含现实生活中所有能够感知的色彩 颜色的 完整性一般是各种颜色空间都应该具备的 一般来说 在视觉上的完整性并不能 保证颜色空间在数学上的完整性 反过来 颜色空间在数学上的完整性却能够反 应在视觉上的完整性 4 自然性 人类感知颜色 一般是从三个角度感知的 一是亮度 二是色调 三是饱和 度 颜色空间应该能够容易的将各种颜色转换为这3 个基本的感知特征 亮度是指彩色光线照射入人眼时 使人感受到的颜色的明暗程度 亮度与入 射光的强度有关 强度越大 那么光线的亮度就越大 强度越低 那么光线的亮 度就越小 第二章相关理论和技术 色调是指光线的颜色 光线由多种颜色组成 例如常说的红 橙 黄 绿 青 蓝 紫就是不同的色调 在物理上 改变色调的光谱成分 能够引起色调的 变化 饱和度是指颜色的深浅程度 例如深红色 淡红色等 一般将色调和饱和度 统称为色度 它即表示色光的颜色类别 又表示颜色的深浅程度 2 1 1 颜色线性变换 以r g b 颜色空间表示图像时 一个像素的颜色可以用一个向量屹来表示 心 被定义为 g 6 颜色变换c 是对向量v c 的一种操作 该操作将v c 变换为呢 一般常用的颜色 变换都是线性的 例如可以将r g b 颜色空间变换到y u v 颜色空间 颜色变换的 目的是 从r g b 颜色空间开始转换 得出一种合适的颜色空间 这种变换的大多 数操作都可以通过矩阵乘法来实现 基于颜色特征的图像检索中 常用的颜色空 间变换如下所示 1 o p p 颜色空间变换 o p p 颜色空间是从r g b 颜色空间做线性变换得到的 从r g b 颜色空间到o p p 颜色空间的转换可以表示为 形 矿v c 其中 z 柳是一个变换矩阵 其值是 矿号f 三1 1 1 21j o p p 颜色空间可以通过p 简单的得到 但是缺少颜色的一致性和自然性 o p p 颜色空间在颜色差异性上不好表示 2 y i q 颜色空间变换 y i q 颜色空间是一种用于n t s c 彩色电视的颜色空间 从r g b 颜色空间到 y i q 颜色空间的转换可以表示为 形 俨k 其中 俨是一个变换矩阵 其值是 西南大学硕十学位论文 f 0 2 9 9 0 5 8 7 o 1 1 4 l 俨 l0 5 9 6 0 2 7 4 0 3 2 2i o 2 l l o 5 2 3 一o 3 1 2j 3 y u v 颜色空间变换 y u v 是欧洲电视系统所采用的一种颜色编码 其中y 代表亮度 u v 代表色 差 u 和v 是构成彩色的两个分量 色彩空间的一个优点是亮度y 和色度u v 是分离的 从r g b 颜色空间到y u v 颜色空间的变换可以表示为 w t v c 其中 矿是一个变换矩阵 其值是 0 2 9 9 0 5 8 7 o 11 4 甲 l 0 1 4 7 0 2 8 9 0 4 3 6l 0 6 1 5 一o 5 1 5 一o 1 0 0j 2 1 2 颜色空间 颜色空间的选择是基于颜色特征的图像检索中一个非常重要的问题 图像可 以使用多种颜色空间来表示 选择不同的颜色空间对检索的最后结果有所影响 本文对一些常用的颜色空间进行简要的介绍 以找出实验中合适的颜色空间来 这些空间的介绍如下所示 1 r g b 颜色空间 最典型最常用的面向硬件设备的彩色空间模型是r g b 模型 r g b 模型是一种 与人的视觉系统结构密切相关的模型 根据人眼结构 所有颜色都可以看作是三 个基本颜色一一红 r e d 绿 g r e e n 和蓝 b l u e 一的不同组合 6 r g b 空间 可以在笛卡尔坐标系里 用一个单位立方体来表示 其中原点对应黑色 离原点 最远的顶点对应白色 但是 r g b 空间结果并不符合人们对颜色相似性的主观判 断 即是主观上相差很远的两种颜色在r g b 颜色空间中却可能距离很近 这就会 使颜色量化和相似度度量的准确性降低 另一方面 对肤色在r g b 空间和h s v 空间进行实验表明 相似颜色在r g b 空间的聚类效果较差 在h s v 空间的聚类较好 如图2 1 和图2 2 所示 1 0 f0 2 9 9 0 0 5 8 7 00 11 4 0 t 10 5 0 0 0 0 4 1 8 7 一o 0 8 1 3i i 0 1 6 8 7 0 3 3 1 3 0 5 0 0 0j f 萝 三 主 三吕 言 竺 izl10 0 0 0 0 0 1 00 9 9 0i lb l 然后 根据目标白色的三基色 e 匕 乙 的关系 亮度可以定义为 扛1 1 6 轰 3 1 6 u 1 3 l u 一 v 1 3 l 0 一 l 这个公式中 材 v 和 的值 由下列公式表示 石再4 x 西 瓦 v 竺墨 x n 1 5 y 3 z 硝 恒 一c 列 瑚啪芦c 别 1 2 第二章相关理论和技术 色彩的认识 一般来说 图像最原始的保存方式是以r g b 的方式保存的 可以将图像从 r g b 颜色空间转换到h s v 空间中来 设v 是r g b 颜色空间中的一个颜色 w c 是h s v 颜色空间中的一个颜色 从r g b 颜色空间到h s v 颜色空间的变换用t c 来表示 则这个变换过程用如下公式来表示 形 正 圪 公式中的t 是一个线性变换 其表示颜色从r g b 空间到h s v 空间的变换 如果将r g b 颜色空间中的r g b 归一为 0 1 范围 那么h s v 的值也在 o l 范围内 这个t c 变换可以用如下的几个公式来表示 1 m a x r g 6 v m i n r g b s 一 1 现定义r l g l b 1 分别为 v 一 一 1 v m i n r g b 蜀2 石面v 丽g 1 一m m i 2 d 1 一d n 一 v y m i n r g b 另外定义一个h l 该h l 由新定义的r l g l b l 得到 h 1 5 b l 当r m a x r g b 且g m i n r g b 1 一g l当r m a x r g b 且g m i n r g b 1 当g m a x r g b 且b m i n r g b 3 6 l当g m a x r g b 且b m i n r g b 3 9 1 当b m a x r g b 且r m i n r g b 5 一不其他 最后 可以通过以上计算的中间变量 计算h 的值 该值的定义如下所示 五 五 6 h s v 颜色空间的相似度可以用颜色在h s v 颜色空间中的距离来表示 h s v 颜色空间的好处是颜色在空间中的距离与颜色在视觉感知的距离几乎一致 一般 来说 如果有两种颜色用a 和b 来表示 需要计算他们的相似度 可以计算其的 西南大学硕士学位论文 距离来表示 颜色a 可以用m i h i s i v i 颜色b 可以用m j h i s j v j 来表示 它们的相似度可以定义表示为 d i j 2 卜去 l v j 2 s i c o s h i 一s j c o s h j 2 i s s i n m 一s js i n h j 2 j 上述公式对相似度进行了归一化处理 i 和j 表示两种不同的颜色的索引 但 d i i l 时 表示两种颜色非常的接近 如果d i j 0 时 则表示两种颜色在h s v 颜色 空间中的距离为最大 所以这两种颜色的差异也是最大 2 2 颜色量化 p a u ls h e c k b e r t 1 9 8 2 将颜色量化定义为确定一组颜色以表示图像的颜色空 间 然后确定从颜色空间到选定颜色集合的映射 也就是说 颜色量化是将颜色 空间映射到一个小的颜色子集中 颜色量化可以有效的减少颜色的数目 从而为 特征提取创造一个良好的条件 颜色量化技术一般分为均匀量化和非均匀量化两 种 均匀量化是指一个线性的量化方法 从原颜色到量化后的颜色是通过一个线 性的方法来执行的 非均匀量化是指量化过程是一个非线性的过程 颜色变化时 将原颜色不均匀的分配到目标颜色集中 通常来说 均匀量化比非均匀量化要快 这是因为均匀量化使用的算法要简单一些 均匀量化在量化后 目标集合中可能 有很多部分是空集 这是因为图像中可能不包含这些量化区间中的颜色值 而非 均匀量化没有这个问题 这里对图像检索中非常重要的量化方法进行简要的介绍 2 2 1 统一量化方法 统一量化法是一种概念上非常简单的量化方法 它简单的截取掉r g b 分量的 后1 3 位 得到一个新的量化级 使用新的量化级对图像进行新的操作 例如图像 中有一个像素点 颜色用 r g b 来表示 颜色的每一个分量占8 位 其为 r 11 1 l1 1 1 1 g 11 11 111 1 b l ll1l1 l 1 将右边n 位去掉 得到新的r g r e 表示为 r t 11 1 11 g 11 11 1 第二章相关理论和技术 皇曼曼曼曼曼鼍曼 曼曼皇曼曼曼罡皇曼曼曼鼍皇1 1 11 一一一 一一 i 量曼曼鼍曼曼曼皇曼曼曼曼皇曼鼍曼曼曼曼曼曼曼曼曼鼍曼曼皇 e 一 1l 11 1 这样经过量化后 r 分量从2 5 5 变为3 l g 分量从2 5 5 变为3 l b 分量也从 2 5 5 变为3 1 这样就有效的减少了颜色的数量 2 2 2 流行色量化方法 t o mb o y l e 和a n d yl i p p m a n 在1 9 7 8 年分别提出了流行色量化方法 流行色的 原理是 将图像中出现频率最高的颜色建立一个颜色表 也就是说 将直方图中 出现频率最高的n 种颜色作为颜色表 其他颜色被划分到这n 种颜色之中 这个 算法的具体步骤如下所示 1 分析原始图像 由原始图像建立颜色直方图 2 根据颜色直方图 按照降序排列所有的颜色 3 将出现概念最高的n 种颜色组成颜色查找表 4 将图像中其他的颜色 映射到查找表中 使其对应于查找表中的最接近 的颜色 流行色法在颜色量化中有比较好的效果 但是在颜色量化较少时 效果不是 很好 而且对于非均匀的颜色空间 其很容易忽略在颜色空间中稀疏区域中的颜 色 2 2 3 模糊c 均值聚类量化方法 模糊c 均值聚类算法 9 也常常用于颜色的量化过程中 它的基本实现是 对 颜色进行划分 使量化到同一级中的颜色相似度最大 而不同量化级的颜色之间 相似度最小 模糊c 均值聚类算法中每一种颜色都可能属于不同的类 只是属于 每一种类的程度不一样 模糊c 均值聚类是c 均值聚类的一种改进 c 均值聚类 对颜色的划分是硬性的 这种硬性是指颜色必须属于某个确定的类 而不能属于 多个类 模糊c 均值算法把x x 2 x n 分a m 类 指定或者求出每类的聚类中心 聚类中心要使目标函数到达最小 模糊c 均值算法使每一种颜色用给定的0 到1 间的值来表示其属于每一类的程度 颜色的隶属度可以组成一个矩阵 这个矩阵 表示为 u i l 其中 u 表示隶属度矩阵 u 曲表示每一个元素 表示第k 种颜色属于第i 类 的程度 归一化规定 每一个颜色属于所有类的隶属度和应该等于l 如下公式所 示 西南大学硕士学位论文 1 v k 1 2 刀 i i 确定模糊分类结果的一个重要函数是目标函数 该函数定义如下所示 厶 u y x 慨 v 1 1 2 m l 其中矿 v l v 2 匕 是模糊聚类中心的向量 1 1 1 是控制聚类结果的模糊程 度指数 模糊c 均值算法使用迭代的方法使目标函数的值达到最小 从而将颜色 合理的分到一个最相似的类中 这样就完成了颜色的划分 2 2 4 补色量化 在r g b 颜色空间中 每种颜色用8 个位来表示 表示2 5 6 级的量化 这样3 种颜色具有2 2 4 种颜色可能 用如此多的颜色来进行特征提取时不现实的 s w a i n 提出了补色的概念 来减少颜色量 补色的基本思想是在r g b 颜色空间中定义3 个变量 分别是 r g r g b y 2 b r g w b r g b 其中w b 表示亮度 r g 和b y 取8 个量化级 w b 取4 个量化级 则可以将颜色 数2 2 4 简化到2 5 6 个量化级 经过试验 s w a i n t 3 1 证明这种量化方法并不会对检索 的结果造成很大的影响 2 3 颜色特征的表达 颜色是描述图像信息的一种较为直接的视觉特征 在已有的研究中 已经提 出了很多提取和表达颜色特征的方法 下文介绍了一些常用的方法 并对这些方 法的优劣势进行了总结 2 3 1 颜色直方图 图像中的颜色分布可以用直方图来表示 对于一幅图像i x y 它的颜色直方 图可以用如下公式来表示 枷 剿 萎妒别 砌 颜色直方图定义了图像中所有颜色的分布 从实验中来看 颜色直方图具有 第二章相关理论和技术 旋转不变性和不缩放不变性 旋转不变性是指图片旋转后 所得到的颜色直方图 不发生变化 缩放不变性是指当图像缩小或者放大后 其颜色直方图基本不变 1 直方图 假设s 玉 是图像i x y 中一种颜色为 的像素的个数 s x i 是图像i 的像素个 数 对s 五 做归一化处理 得到颜色薯出现的概率 这个概率如下所述 悱等2 普 通过以上定义 可以得出图像i 的整个直方图是 日 办 五 h x o 五 公式中的n 是图像i 中颜色的量化级数 2 累加直方图 累加直方图是一般直方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论