(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf_第1页
(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf_第2页
(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf_第3页
(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf_第4页
(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)矢量近似索引描述方法在图像检索中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 随着数字化、信息化时代的到来,多媒体信息大量涌现,图像数据也随之飞 速增长,在气象、医疗、交通和军事等众多领域被大量地应用。与此同时如何对 大量的图像数据进行快速、有效地检索,得到用户所需要的数据,已经成为计算 机研究领域中急待解决的重要课题之一。 在传统的基于内容的图像检索系统中,由于图像视觉特征( 颜色或纹理等) 高维属性的特点,以前对于一维数据所提出的索引结构不能够适应高维数据的检 索要求,所以人们提出了许多的高维索引算法,如k d b - t r e e 、r - t r e e 及其家族系 列等。但人们在应用过程中发现,以上这些树形结构的检索性能随着数据维度的 增高而急剧下降,特别是当数据的维度超过l o 维时,往往这些算法的效率甚至不 如直接使用高维数据的顺序检索方法【i 】,这种现象也就是我们所说的维度灾难 ( d i m e n s i o nc u r s e ) 。为了解决这个问题,人们又提出许多相应的算法,如v a f i l e 、 n b t r e e 、金字塔算法等。但这些算法也都存在着自身的一些缺陷,如v a f il e 算 法采用了向量近似的方法,通过近似向量来构建索引,实现对高维数据的过滤, 是能够有效解决维度灾难问题的算法之一,但由于该算法所提出的前提是针对数 据独立分布的情况之下,没有考虑现实数据的相关性( 这也是金字塔算法中存在 的主要问题) ,另外采用向量近似的方法,数据维度没有精减,使实际的数据计算 量没有得到较大的降低,因而也影响了索引的效率。同样在n b t r e e 中虽然实现 了有效降维,但由于没有考虑数据的空间分布,因此其索引结点中的冗余节点较 多,进而影响其索引效率。在本文中针对图像数据的高维特性,在对基于内容的 图像检索技术所提出的各种不同的索引算法进行深入研究的基础上,吸取许多优 秀算法的优点并进行了综合和改进,提出了一种较为快捷的检索方法一一靶标式 图像检索算法。 按照数据的分布或按数据空间进行分割是进行图像检索的两种很重要的方 法,两者各有其优缺点。在本文中综合这两种方法的优点,提出了一种新型的图 像索引算法,通过对数据空间进行划分,并对划分后的子空间赋予不同的代码值, 以此构建图像的索引结构。并在此理论基础之上,设计了一个基于内容的图像检 索实验平台,通过对实验数据结果的比较,证明了作者提出的索引结构在基于内 容的图像检索中的高效和实用性。 关键词:基于内容的图像检索;维度灾难;k n n ;环形类;空间编码 分类号: j 匕塞变通太堂亟堂僮j 金塞旦墨! b ! a bs t r a c t a b s t r a c t :a l o n gw i t h t h ed i g i t a la n di n f o r m a t i o n a g e ,al a r g en u m b e ro f m u l t i m e d i ai n f o r m a t i o n ,i n c l u d i n gi m a g ed a t a ,i sr a p i dg r o w i n g i m a g ed a t aa r ew i d e l y a p p li e di nw e a t h e r , m e d i c a l ,t r a n s p o r t a t i o n ,m i l i t a r ya n ds oo nf i e l d s m e a n w h i l e ,h o w t or e t r i e v a lt h ei m a g e sw i t hr a p i da n de f f e c t i v ew a y s ,a n ds h o w i n gt h er e q u i r e dd a t at o c l i e n tb e c o m ea nu r g e n c yp r o b l e m i nt h et r a d i t i o n a lc o n t e n t - b a s e di m a g er e t r i e v a ls y s t e m s ,b e c a u s eo ft h ei m a g e f e a t u r e s ( c o l o ro rt e x t u r e ,e t c ) h a v eh i g h - d i m e n s i o n a ln a t u r e ,t h eo n e d i m e n s i o n a l d a t a si n d e xs t r u c t u r ec a n ta d a p tt ot h e s ed a t a f o rt h i sr e a s o n ,m a n ya l g o r i t h m sh a v e b e e np r o p o s e d ,s u c ha st r e e - b a s e di n d e x ( k d b t r e e ,r - t r e e ) h o w e v e r , w ef o u n dt h e p e r f o r m a n c eo ft h o s et r e e - b a s e di n d e xs t r u c t u r es h a r p l yd e g r a d e da sd i m e n s i o n a l i t y i n c r e a s e s ,t h e s ea l g o r i t h m se v e nc a l l tw o r ka sd i r e c tr e t r i e v a lw a yw h e nt h ed a t a d i m e n s i o na b o v e10 t h i sp h e n o m e n o ni sc a l l e da s d i m e n s i o nc u r s e f o rt h i sc a u s e , r e s e a r c h e r sh a v ep u tf o r w a r dm a n yc o r r e s p o n d i n ga l g o r i t h m s ,s u c h 弱v a f i l e ,n b t r e e , p y r a m i da l g o r i t h m h o w e v e r , t h e s ea l g o r i t h m s h a v et h e i ro w ns h o r t c o m i n g s f o r e x a m p l e ,v a - f i l ea d o p t e dv e c t o ra p p r o x i m a t i o nw a y s ,a n du s i n gt h ea p p r o x i m a t e v e c t o r sb u i l dt h ei n d e xf i l et of i l t e rh i g h d i m e n s i o n a ld a t a i ti so n eo fa l g o r i t h m sw h i c h c a ns o l v et h e d i m e n s i o nc u r s e e f f e c t i v e l y h o w e v e r , t h i sm e t h o di sp r o p o s e do nt h e b a s i so fi n d e p e n d e n td a t ad i s t r i b u t i o n ,d o e s n tc o n s i d e rt h er e l a t i v i t yo ft h er e a l i s t i cd a t a ( t h i si s t h em a i np r o b l e mo ft h ep y r a m i da l g o r i t h m ) i na d d i t i o n ,b e c a u s eo ft h e a p p r o x i m a t ev e c t o r s d i m e n s i o nd o e s n tb er e d u c e d t h ea c t u a la m o u n tw h i c hb e c a l c u l a t e dd o e s n tg e te f f e c t i v ed e c r e a s i n g , a n dt h u sa f f e c t i n gt h ee f f i c i e n c yo ft h ei n d e x t h en b t r e em e t h o dm a k e sa l le f f e c t i v ed e c r e a s i n go fd i m e n s i o n s ,b u tt h ew a yo f d e c r e a s i n gd i m e n s i o n sd i dn o tt a k ec o n s i d e r a t i o no ft h ed i s t r i b u t i n gw h i c ht h ed a t a s i t u a t e di nt h es p a c e a sar e s u l t ,t h i sa l g o r i t h ms u f f e r e df r o md e c l i n i n go ft h er e t r i e v a l e f f e c t i nt h i sp a p e r , w ep r o p o s e dan e wa l g o r i t h m - - t a r g e tw a y so fi m a g er e t r i e v a l t h r o u g ht h ee x p e r i m e n tc o m p a r e dw i t ho t h e ra l g o r i t h m s ,i ti sc o n v i n c i n g l yp r o v e dt h a t t h i si n d e xa l g o r i t h mi se f f i c i e n ta n da p p l i c a b l ei nc b i r k e y w o r d s :c o n t e n t b a s e di m a g er e t r i e v a l - c b i r ;d i m e n s i o nc u r s e ;k - n n ; r o u n dc l a s s ;s p a c ec o d e c l a s s n o : 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名:宇 抖醐:础“7 日 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 签字同期:二叩孑年多月厂日 新躲伴1 签字日期z 降6 月7 日 致谢 本论文的工作是在我的导师许宏丽副教授的悉心指导下完成的,许宏丽老师 严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年 来许宏丽老师对我的关心和指导。 许宏丽副教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都 给予了我很大的关心和帮助,在此向许宏丽老师表示衷心的谢意。 许宏丽副教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示 衷心的感谢。 在实验室工作及撰写论文期间,陆景辉及向前等同学对我论文中的研究工作 给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。 序 随着社会数字化、信息化时代的到来,关于图像的检索问题成为近十几年来 计算机研究领域一个新兴的课题。在本文中,采用基于内容的检索方法,对以往 的算法进行了较为深入的研究,并提出了一种新的检索算法一一靶标式图像检索 算法。它通过对数据空间进行分割、划分,最后生成图像的一维特征码,通过一 维的特征码来对图像进行初次过滤,从而大大减少了所需查询的数据量,加快了 图像的检索速度。通过实验表明,该算法具有较强的鲁棒性,在检索速度方面也 有了较大的提高。在论文写作过程中,得到了许宏丽老师的悉心教导,在这里再 次对许老师表示衷心的感谢。 1 引言 1 1 相关理论的研究现状及背景 随着数字技术的成熟和发展,图像技术得到了日益广泛的应用,目前图像检 索技术广泛应用于气象、天文、医学、人脸识别以及军事行业等储多领域,每天 都有数量巨大的图像数据的产生。随着图像数据库内信息量的急剧膨胀,如何更 快、更准确的进行图像检索成为计算机领域一个热点研究问题。 对于图像的检索技术可追溯到上世纪7 0 年代,当时是通过向数据库中的图像 数据添加标注信息来进行检索的,即通过添加关键字或文本信息对数据库中的图 像进行描述,查询时通过匹配这些信息来进行查询。这种检索方法的优点是:简 单,易于理解。现在,这种检索技术已广泛应用于互联网的搜索技术之中。然而, 这种基于文本的图像检索技术本身存在着许多严重的缺陷,主要包括:1 、主观性。 目前的计算机视觉和人工智能技术都不能自动对图像进行准确标注,很多时候还 需要人工来进行图像标注,由于个人的客观条件因素如兴趣、专业角度、关注点 等原因,手工标注往往是不准确或不完整的,也不可避免地带有主观偏差。也就 是说,不同的人对同一幅图像有不同的理解方法,这种主观理解的差异将导致图 像检索中的失配错误。2 、图像信息的丢失。图像中包含有丰富的视觉特征( 如颜 色、纹理、形状等特征) 住往无法用文本来进行客观地描述,从而导致在进行图 像检索时难以进行精确查询,使得检索结果难以与查询对象进行精确匹配;另外 大量冗余信息的存在,也使得检索效率大大降低,当今数字信息时代,在庞大的 检索数据结果中进行图像查找无异于大海捞针。3 、效率低。由于在很多情况下还 需要人工进行标注,在信息量巨大的今天,无疑会耗费巨大的人力来进行标识, 不但效率低下,而且难免会导致遗漏、错误标注等诸多问题的发生。4 、针对不同 的需求,可能要求对标注进行重新设定或修改,有时会对整体数据库的标注内容 进行修改,因此这种查询难以满足多层次用户的查询要求。由于上述这些缺点, 基于文本的图像检索技术变得越来越难以适应使用者的检索需求,人们开始探索 新的图像检索方法。 到了上世纪9 0 年代,随着大规模图像数据库的出现和普及,基于内容的检索 ( c o n t 朗卜- b a s e di m a g er e t r i e v a l ,简称c b i r ) 技术得到了快速的应用和发展。与 基于文本的检索方法不同,基于内容的图像检索技术着眼于图像的可视特征,通 过提取每幅图像的视觉内容特征作为图像标识码,如色彩、纹理、形状等,由于 e葛!窒迪 厶:堂亟堂位诠塞! 里!占 图像的这些特征完全可以通过计算机来自动计算完成,具有更大的客观性,而且 也避免了由于人工标注所引起的低效、歧义等缺点。另外,在图像检索的方式上 与以往基于文本的检索方式有很大的不同,基于文本的检索通常是由关键字来进 行检索的,而基于内容的图像检索一般是通过用户输入所需进行奄询的图像数掘 来进行检索的,主要通过提取图像的特征标识码来与图像数据库内的图像特征标 识码进行比对,最后按相似程度的大小来输出与查询特征标识最为接近的图像, 因而与用户更具有交互性,也更容易比较查询的效率及可靠性。查询过程可用图 卜1 来表示。基于内容图像检索技术已经取得了不少的成就,一些著名的图像检索 系统相继被推出,如i b m 的q b i c 系统,哥伦比亚大学开发的v i s u a l s e e k ,m i t 多媒体实验室丌发的p h o t o b o o k ,u cb e r k e l e y 开发的c h a b o t 系统等。 、 l 提取图。 斟像数据库 输夯询结果。 像特征 图1 - 1 基于内容图像检索的查询过程 用户 目前,这两种技术在图像搜索领域都得到了广泛的应用,同时关于图像搜索的 算法技术也层出不穷,使得图像检索产品日益成熟,推动了相关产业的发展。在 互联网方面,各大公司纷纷推出自己的图像搜索引擎,尽管相关技术还不太完善, 但这已经在很大程度上为用户提供了使用空间,同时也带来巨大的商业价值。 具有代表性的图像搜索引擎的网站有【2 】: 1 s c o u r ( h t t p :w w w s c o u r c o m ) s c o u r 成立于1 9 9 8 年,自称是第一个基于w e b 的多媒体搜索引擎。是采用基 于文本的检索技术开发的网站。它的工作原理是在文件名、路径名或a l t 标签中 搜索检索词。通过对关键词检索,向用户提供查询结果。在高级检索中,可以按 照g i f 、b m p 、j p e g 等图像格式进行查询。主要缺陷是标识深度不足,查准率较 低,但查全率较好。 2 q b i c ( h t t p :w w w q b i c a i m a d e n i b m c o r n ) q b i c ( q u e r yb yi m a g ec o n t e n t ) 是由i b m 公司著名的a l m a d e n 实验室开发 的。是采用基于内容检索技术应用中较为成功的一种,也是目前应用最广的图像 检索系统之,如旧金山现代艺术博物馆以及法国文化部等机构就采用了该系统。 它提供了3 种属性的检索功能:颜色属性、形状属性和纹理属性,检索效率非常 高。现在q b i c 除了上面的基于内容特性的检索,还辅以文本查询手段。例如为旧 金山现代艺术博物馆的每幅作品给予标准描述信息,包括作者、标题及日期几项 内容,另外许多作品还有内容方面的自然描述。 3 w e b s e e k ( h t t p :d i s n e y e t r e o l u m b i a e d u w e b s e e k ) 是一种在基于语义的图像检索技术基础上,引入基于内容的图像检索技术, 是将两种技术相结合的搜索引擎。它是由哥伦比亚大学开发的一种实验性系统。 采用代理技术自动搜索可视信息并对其进行分类,目前已分类的图像有6 6 万多幅, 形成了一个极富创新性的图像目录,主题分类是它的主要优点。w e b s e e k 的检索 途径有三种,一是使用关键词进行自由全文检索,但不支持短语检索;二是利用 不同的类目等级进行主题浏览;三是在检出图像的基础上利用其可视属性进一步 检索。 4 百度( h t t p :i m a g e b a i d u e o m ) 这是我国国内图像检索技术应用较为成功的范例,它主要还是基于文本内容 的检索技术,通过使用关键字来检索图片,同时可以设定图像的大小和格式,其 查询结果的查准率不高,但查全率较好。 还有很多其它图像检索技术的应用实例,在这里不再一一赘述。 1 2 本文的主要研究工作 本文主要采用第二种方法,即基于内容的图像检索技术,对以往的算法进行 了深入分析,在此基础上进行了综合运用,并进一步进行了改进,形成了一种新 的算法一靶标式图像检索算法。然后根据本算法,构建了一个图像检索的实验平 台,对本算法的图像检索效率进行了大量的实验验证,实验结果表明,本算法具 有较好的检索效率,有一定的实用价值。在本文中,主要包括以下几个方面: 1 对基于内容的图像检索技术的基础理论进行了概括介绍。 图像特征的提取是基于内容的图像检索技术的基础。在基于内容的图像检索 技术中,主要对图像视觉特征如色彩、纹理、形状、对象表面等进行提取。本文 对图像的颜色、纹理等被广泛应用的视觉特征进行了介绍,然后对各种特征的优 缺点进行了系统分析。 2 图像特征的选择。颜色特征及边缘特征是图像最基本的图像特征,在本文 中采用1 9 2 维的r g b 彩色直方图,利用颜色特征可以找到具有相似颜色比率的图 像,而边缘特性是图像特征中较为直观的特征,而且图像的边缘特征不会受灯光、 明暗度及颜色的影响,具有稳定性高的特点。如果检索过程中只对某一特征进行 3 计算的话,难免会导致图像信息的丢失,为了更加准确的进行图像查找,在本文 中使用了综合特征查找的方法,使用颜色特征及边缘特征结合起来形成的综合特 征来对图像数据进行检索,与采用单一特征的图像检索算法比较来看,提高了数 据的查询准确程度,特别是对于汽车、蝴蝶等形状特点较为突出的图像对象,其 查询的准确率有了很大的提高,从而避免了只采用单一特征所造成的图像信息丢 失的现象。另外,本文算法根据图像数据的空间分布特点,要求对查询数据的分 布空间进行划分,这也就要对数据的空间进行聚类处理,所以在本文中对以往所 提出各种聚类算法也进行了概括介绍。 3 对过去提出的一些比较成熟的图像检索算法按照其对向量数据空间的划分 方式进行了较为详细的介绍和分析,并对其优缺点进行了说明,为以后的理论形 成进行了铺垫。 4 以往所提出的各种检索算法多采用基于数据空间分布的划分方式或对图像 数据空间进行分割的方法来对图像进行检索,为了进一步提高数据的查询速度及 检索效率,本文对两种检索方式进行了综合,并采用空间编码技术根据图像特征 所处空间进行图像编码处理,并最终形成图像的一维特征码。同时为了更加准确 的对数据的空间位置进行记录,在本文中提出了一种新的聚类方法一环形聚类算 法,与向量空间的一维特征码共同标识图像的空间位置,以此构建本算法的索引 结构,大大提高了数据查询的准确性。另外,在对向量进行空间划分的过程中, 为了简化计算,在本文算法中采用了向量降维方法,使用p c a 算法对图像向量数 据进行降维处理,所以在本文中也对该算法进行了粗略介绍。 5 利用本文所提出的算法,构建了一个图像检索的实验平台,对作者所提出 的检索算法进行实验测试,同时利用相同的实验数据与其它的检索方法进行比较。 实验结果表明,本算法在图像检索速度方面有了较大的提高,从而也进一步证明 了本算法的实际可行性。 1 3 论文的组织结构 本文的行文和组织结构如下: 第一章,引言。 对本文的研究背景、研究的出发点进行了概要介绍,同时对本文的主要研究工 作及相关内容进行了简要说明。 第二章,基于内容的图像检索概述。 本章对基于文本的图像检索方法和基于内容的图像检索方法进行了比较,并对 其各自的优缺点进行了说明;对图像内容的相关特征进行了说明,主要从颜色、 4 纹理、形状等多方面进行了简要介绍;对于图像内容检索所涉及的相关技术也进 行了说明,最后介绍了图像检索效果的评价标准。 第三章,图像检索的高维特征索引技术。 在本章中,对以往所提出的一系列高维数据检索算法进行了介绍,并对其中的 重要算法如聚类算法进行了较为系统的说明,同时也对各种算法的优缺点进行了 分析。 第四章,本文图像检索算法的设计与实现。 在以往检索技术的基础上,提出了一种新的图像检索算法就标式图像检索算 法即t t 瓜算法,并对该算法的实现过程进行了详细说明。 第五章,实验系统的构建与分析验证。 根据本文所提出的算法,构建了相应的实验平台,并对实验结果进行了分析说 明。 第六章,结论。 对本文的研究工作进行了总结和分析,以及对未来基于内容图像检索的发展 方向进行了简要描述。 5 2 基于内容的图像检索概述 2 1 图像检索技术的发展及其检索方法 图像检索即根据对图像的描述或图像本身,在目标图像数据集合中查找与指定 图像特征相似或包含指定信息的图像。图像检索始于2 0 世纪7 0 年代,当时随着 图像技术的发展,包含大量图像数据的大型数据库越来越普及,如何在浩如烟海 的图像资料中找到与要求相关的图像数据成为一个急待解决的问题,图像的检索 技术应运而生。早期的图像检索是通过先行对数据库内图像进行标注,然后根据 查询用户所输入的关键词来进行查询,即基于文本的检索方法。但该检索方法存 在着许多缺陷,直到2 0 世纪9 0 年代,基于图像内容的检索方法的出现才又提供 了另一种图像的检索途径。 2 1 1 基于文本的图像检索方法 基于文本的图像检索技术( t b i r ,t e x t b a s e di m a g er e t r i e v a l ) 是指通过手工输入 的方式为图像输入一系列描述图像特征( 如图像名称、尺寸大小、压缩类型、主题 内容等) 的关键字,然后将图像的存储路径和图像关键字之间建立联系,查询时通 过将用户所输入的关键字与图像所标注的关键词相比较,最后将包含有用户输入 关键词的图像输出,供用户参考。在这种方法中,图像检索实际上变成了关于文 本内容的检索。该方法简单,易于实现,通过普通的关系数据库即可完成。但其 本身存在着一些严重的弱点【3 】。主要包括: 1 主观性。图像的标注问题是一个跨学科的问题,尽管投入了大量的人力物 力对其进行研究,但目前所掌握的计算机视觉和人工智能技术都不能自动对图像 进行准确标注,仍然还需要人工来对图像进行标注,由于个人的客观条件因素( 如: 兴趣、专业角度、关注点等等) 的原因,人工标注往往是不准确或不完整的,不可 避免地带有主观偏差。也就是说,不同的人对同一幅图像有不同的理解方法,这 种主观理解的差异将导致图像检索中的失配错误。 2 图像信息的丢失。图像中所包含的丰富的视觉特征( 如颜色、纹理、形状 等特征) 住往无法用文本来进行客观地描述,从而使图像检索难以进行精确查询, 导致检索结果与查询对象不能进行精确匹配。另外,如果对图像进行详细标注, 又会产生大量的冗余信息,使得检索效率大大降低。 6 3 检索结果难以与用户要求相符。在当今数字信息时代,每天都有大量的图 像数据产生,如果只通过关键字来进行检索,系统将包含有该关键字的图像全部 返回给用户,无疑会产生大量的冗余图像信息,而在如此庞大的检索数据中进行 相关的图像查找对用户来说无异于大海捞针。 4 难以同时适应多方面的需求。针对不同的需求,可能要求对标注进行重新 设定或修改,有时甚至会对整体数据库的标注内容进行修改,因此这种查询难以 满足多层次用户的查询要求。 5 效率低下。由于在很多情况下还需要人工进行标注,在信息量巨大的今天, 无疑会耗费巨大的入力、物力,因此效率极为低下,而且难免会导致遗漏、错误 标注等诸多问题的发生。 由于上述这些缺点,基于文本的图像检索技术变得越来越难以适应用户们的检 索需求,人们开始探索新的图像检索方法,基于内容的检索技术应运而生。 2 1 2 基于内容的图像检索方法 基于图像内容的检索方法( c m r ,c o n t e n t b a s e di m a g er e t r i e v a l ) 兴于2 0 世纪 9 0 年代,它是为了克服基于文本的图像检索方法的缺点而提出的一种图像检索技 术。基于图像内容的检索方法主要是指在图像处理的基础上,利用图像本身的特 征属性( 如颜色、纹理、形状等) 以及图像中所包含对象间的空间关系等基本视觉特 征所进行的检索。 与基于文本的图像检索方法比较而言,该方法具有如下几方面的优点: 1 客观性。与基于文本的检索方法不同,基于内容的检索技术着眼于图像的 可视特征,通过提取每幅图像的视觉内容特征( 如颜色、纹理、形状等) 作为图像 标识码,由于图像的这些特征完全可以通过计算机自动计算完成,所以具有更大 的客观性,从而避免了由于人工标注所引起的主观歧义的缺点。 2 效率较高。由于特征的提取过程是通过计算机自动计算完成,无需象文本 标注过程需要大量的人力耗费,具有较高的效率。 3 可靠性高。基于内容的图像检索一般是通过用户输入所需进行查询的图片 来检索的。利用提取的图像特征数据来与图像数据库内的图像特征数据进行比对, 最后按照与查询图片相似程度的大小来输出相关图像,更容易比较查询的效率及 可靠性,与用户也更具交互性。 7 2 2 关于图像内容的相关综述 本文算法是基于内容的检索算法,在基于内容的图像检索方法中,图像内容的 选择是至关重要的,它直接关系到检索系统的效率和检索结果。在本节中,对有 关图像的内容进行了系统的介绍,从而为以后选择适当的图像特征打下了基础。 图像的内容主要包括图像的颜色、纹理及形状等方面的特征 4 1 ,下面就对其分别 进行介绍。 2 2 1 图像的基本特征 1 图像的颜色特征 颜色是图像内容最重要的特征之一,当我们看到一张图片时,首先引起我们关 注的往往是图像的颜色。颜色相对于图像的其它特征,受视角、尺寸等条件的影 响较小,更具鲁棒性,特别是对那些难以用文字描述或难以进行空间分割以及那 些与空间位置无关的图像内容,颜色特征更具优势【8 】。在本文中,我们将从颜色 直方图、颜色矩、颜色集等方面对颜色特征进行系统介绍。 ( 1 ) 颜色直方图 颜色直方图是表示图像中颜色分布的一种方法,是一种最直观、最明显的特征, 也是在基于内容的图像检索的系统中应用最广的颜色特征,它所描述的是图像的 各种颜色在整幅图像中所占的比例大小。颜色直方图可以基于不同的颜色空间或 坐标系,常用的颜色空间包括r g b 颜色空间、h s v 颜色空间、l u v 颜色空间等 多种空间。其中r g b 颜色空间是最为常用的颜色空间,但r g b 空间与人们区别 颜色的判断逻辑有所不同,所以h s v 颜色空间也常被图像的检索系统所应用。h s v 颜色空间的三个分量分别代表了色彩( h u e l ) 、饱和度( s a t u r a t i o n ) 、值( v a l u e l ) - - 个 方面的特征。h s v 的值可以根据r g b 颜色特征值计算得到。 尽管颜色直方图应用的特别广泛,但其本身也存在着一些严重的缺点。因为颜 色直方图其本身并未考虑图像中颜色的分布特点,只是对象素的简单统计,所以 有些我们用肉眼看起来明显不同的图像,但由于其象素的颜色统计相同,而被计 算时视为相同。所以人们针对该弱点提出了多种改进,如颜色矩、颜色聚合向量 等颜色特征表示方式。 ( 2 ) 颜色矩( c o l o rm o m e n t s ) 颜色矩是由s t r i c k e r 和o r e n g o t 7 1 所提出的,它引入了数学中矩的概念,在矩的 基础上来表示图像中的颜色分布,较好的考虑了图像中颜色的分布情况。他们提 出颜色的分布信息主要集中在低阶矩中,因此使用颜色的一阶矩( m e a n ) 、二阶矩 ( v a r i a n c e ) 及三阶矩( s k e w n e s s ) 来表示图像的颜色分布。 该特征与颜色直方图相比较来说,更为简洁,且无需进行向量化。但由于颜色 矩只采用向量的低阶矩,其分辨能力较颜色直方图较差,所以颜色矩往往与其它 特征相结合使用,以增强图像特征的过滤作用。 ( 3 ) 颜色聚合向量( c o l o rc o h e r e n c ev e c t o r ) 颜色聚合向量是对颜色直方图的另一种改进方式,它是由p a s s t 8 1 等人提出的, 他们针对颜色直方图无法正确表达图像颜色空间的特点,在颜色统计中引入空间 阈值的概念,与象素值共同构成图像的特征。在这种方法中,它将每个象素区间 的内容分为聚合象素与非聚合象素两个部分。如果某象素区间所占据的连续区域 的面积大于给定的阈值t ,则该区间的象素做作为聚合象素,否则作为非聚合象素。 聚合象素与非聚合象素之和即为颜色直方图的统计值。在使用该颜色特征时,应 特别要注意阈值t 的设定。在某些检索方法中,该阈值t 被设为固定值,这样做虽 然操作简单,但如果设定不当,会导致某些图像的象素全为非聚合或全为聚合象 素现象,从而失去其表达图像空间特征的意义。 在使用该特征进行图像相似性比较的过程中,分别对聚合象素与非聚合象素的 值进行比较,然后综合分析得到一个近似值,作为比较结果。 2 图像的纹理特征 纹理是基于图像内容检索的另一个重要特征,纹理是所有事物表面所固有的一 种特性,图像可以看成是不同纹理区域的组合。理论上,可以把纹理看作是纹理 元素有规律地排列组合。( 纹理元素即图像中那些相互接近、相互编织的具有重复 性的区域。) 纹理特征通常被定义为图像的某种局部性质,是对局部区域中象素之间关系的 一种度量,它不依赖于图像的颜色或亮度,反映了图像中同质现象的视觉特征, 该特征也包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系, 对于模式识别和计算机视觉等领域具有重要的意义。t a m u r a 等学者从人类感知心 理学的角度出发,提出了纹理的6 种视觉特性:即粗糙度( c o a r s e n e s s ) 、对比度 ( c o n t r a s t ) 、方向度( d i r e c t i o n a l i t y ) 、线性度( 1 i n e l i k e n e s s ) 、规整度( r e g u l a r i t y ) 和粗略度( r o u g h n e s s ) 六种关于图像纹理的主要视觉特征,其中重要的是纹理的 粗糙度、对比度和方向度。纹理分为随机纹理和模式纹理,随机纹理用统计性质 表征,如灰度级的标准偏差或自相关宽度;而模式纹理可通过抽取某些度量进行 进一步表征。 目前,纹理的建模和分析通常分为以下三类:统计的、频谱的和结构的。纹理 统计分析主要包括灰度直方图、t a m u r a 特征、共生矩阵分析法、多尺度自回归分 9 析m r s a r 模型以及马尔可夫分析法等等,主要用于分析类似于木纹、山脉等纹 理细而且不规则的物体;纹理频谱分析主要包括小波变换等;纹理结构分析假定 图像由较小的纹理基元排列而成,多采用句法分析的方法,只适用于规则的结构 纹理分析,如砖花、规则的印刷图案等,目前研究不是十分广泛。 纹理特征在实际应用中主要用于气象云图分析、卫星遥感图像分析、生物组织 和细胞的显微镜照片分析等领域。但由于图像纹理与物体的形状间存在密切的关 系,而且千变万化的物体形状与嵌套式分布使纹理的分类也变得十分困难。所以 在图像检索系统中,纹理特征往往被用来与其它特征综合使用,以增强图像检索 算法的过滤作用。 ( 1 ) 关于纹理统计特征的内容分析。 在这里,我们只介绍一下其中最常用的方法一灰度共生矩阵。 由于纹理是由灰度分布在空间位置上反复出现而形成的,因而在图像空间中 相隔某距离的两象素间会存在一定的灰度关系,即图像中灰度的空间相关特性。 以往的灰度直方图不能较好的反映纹理中灰度级空间相关性的规律。于是人们想 到通过研究灰度的空间相关性来描述纹理,这也就是灰度共生矩阵产生的思想基 础。灰度共生矩阵是对图像上保持某距离的两象素所具有的灰度状况进行统计而 得到的,描述了成对象素的灰度组合分布,它可以视为是两个灰度组合的联合直 方图。 灰度共生矩阵的主要特点: 1 ) 矩阵大小。若图像灰度级为2 5 6 时,矩阵元素数为2 1 6 个,这样必然会导致 数据计算量的急剧增加。所以应当在不影响纹理分析的情况下将灰度级降低,然 后再生成相应的共生矩阵。 2 ) 归一化。为了分析方便,矩阵元素常用概率值来表示。 3 ) 对称性。各元素关于主对角线对称。 4 ) 主对角线元素为一定位置关系下的两象素同灰度组合出现的次数。 从灰度共生矩阵抽取出的纹理特征参数有:角二阶矩、对比度、相关和熵等。 在这些特征参数中:对比度( c o n t r a s t ) 代表图像的清晰度,即纹理的清晰程度,图 像中纹理沟纹越深,对比度则越大,视觉效果越清晰。角二阶矩( a n g u l a rs e c o n d m o m e n t ) 是一种对图像灰度分布均匀性的度量,当图像灰度分布比较均匀时,角二 阶矩值较大;反之,角二阶矩值则较小。熵( e n t r o p y ) 用来描述图像所具有的信息量。 纹理密集的图像熵值较大,反之,纹理稀疏的图像熵值较小,若图像没有纹理, 则灰度共生矩阵几乎为零,熵值也几乎为零。相关( c o r r e l a t i o n ) 是用来表示共生矩 阵中行和列之间相似程度的向量。如果图像中水平方向纹理占主导,则水平共生 矩阵得到的相关值大于其他方向共生矩阵得到的相关参数值。 1 0 此外,还有方差、逆差距、和平均、和方差、和熵、差平均、差方差、差熵 等参数,具体内容可查阅相关资料。 ( 2 ) 关于纹理频谱特征内容分析。 在这里我们主要介绍一下关于小波变换模型的具体内容。 使用共生矩阵能够从中抽取适当的统计量作为图像的纹理表示,但用其提取的 纹理性质缺少视觉相似性。到2 0 世纪9 0 年代初期,在开始引入小波变换并建立 与之相关的理论框架以后,许多研究人员开始研究在纹理表示中使用小波变换来 进行改进。其中m a n j u n a t h 等评价了各种小波变换i 9 j ,他们发现g a b o r 小波变换最 符合人类的视觉特征,但该算法的缺点是提取图像g a b o r 纹理的过程计算量很大, 难以满足海量图像检索系统的实时性要求。但该算法仍不失为一种优秀的算法, 并进一步拓展了人们的研究途径。 小波变换w t ( w a v e l e tt r a n s f o r m ) : 小波变换是对g a r b o r 变换的一种继承和发展,与g a r b o r 变换相比来说,小波 变换是一个时间和频率的局域变换,能更有效的从信号中提取资讯,通过伸缩和 平移等运算功能对函数或信号进行多尺度细化分析( m u l t i s c a l e a n a l y s i s ) ,解决了 f o u r i e r 变换所不能解决的许多困难问题,被誉为“数学显微镜”,它是调和分析发 展史上里程碑式的进展。其基本思想是通过一个母函数在时间上的平移和在尺度 上的伸缩,来获得一种能自动适应各种频率成分的有效的信号分析手段。小波变 换具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力, 是一种窗口大小固定不变但其形状可改变,时问窗和频率窗都可以改变的时频局 部化分析方法。即在低频部分具有较高频率分辨率和较低时间分辨率,在高频部 分具有较高时间分辨率和较低频率分辨率,很适合于探测j 下常信号中夹带的瞬时 反常现象并展示其成分,能更加有效地提取和分析局部信号。小波变换虽然具有 频率增加而时间( 或空间) 分辨率越高的特点,但其在频率域上的分辨率却会相应降 低,这也是小波变换很大的一个弱点。 ( 3 ) 关于纹理结构特征内容分析。 当前纹理结构特征的相关算法主要是句法分析,一般多用于规则纹理图案( 如 花布、砖墙的纹理,心电图的波形等) 的相关检索,在实际运用中应用较少,在这 里不做详述。 3 图像的形状特征 基于形状的图像检索概念是1 9 9 4 年由b r i a ns c a s s e l l a t i 所提出的,并在以后得 到了很大的发展,与颜色、纹理共同称为基于内容图像检索的三大特征。形状特 征与颜色和纹理相比,有其自身独特的优越性。首先,对于某些图像( 如一些特征 图案如会徽、商标标识等) 来说,使用纹理和颜色进行检索时,其特征所包含的图 像信息比使用形状特征所包含的信息要少得多。其次,图像的形状特征不会受灯 光、明暗度及颜色的影响,是较为稳定的特征,用来区别物体时对用户来说更为 直观。 基于形状特征的图像检索主要是检测出图像中所包含物体的轮廓线或分割出 具体目标的轮廓,然后提取相应的形状特征或矢量特征。但是,与颜色及纹理特 征相同,形状特征也存在其本身一些严重的缺陷。首先,当前的技术还难以对图 像进行准确而鲁棒的自动分割,所以形状特征只能应用于图像检索的某些特殊方 面,在这些应用中图像包含的物体或区域可以直接获得。其次,形状描述对具体 目标的缩放、旋转和尺度变化较为敏感,所以对不同图像中所包含物体的相似度 计算带来一定的难度。 图像形状特包括两方面的内容,一方面是图像局部的特征,另一方面是图像全 局的特征。图像局部特征是对图像中的目标进行具体分析,其检索效果的好坏与 相应图像分割算法有直接的联系,所以图像分割算法成为图像局部对象的形状特 征提取中最为重要的一环。通常来说,进行形状特征分析的过程主要有两种表示 方法:一种是轮廓特征的,一种是区域特征的。前者是利用形状的外部边缘,而 后者则是利用形状的全部区域。基于轮廓的形状特征方法,关键在于边缘检测的 研究,定义边缘的特征描述方法常见的有f o u f i e r 描述子、几何常量、多边形顶点 数、孔径数、曲率等。在基于区域的特征提取关键在于图像分割的研究,使用不 变矩作为目标区域的特征量进行图像匹配。在形状描述方面,近年来提出的一些 方法,主要包括边界特征法、傅里叶形状描述符法( f o u r i e rs h a p ed e s c r i p t o r s ) 、几何 参数法、形状无关矩法、有限元方法( f i n i t ee l e m e n tm e t h o d ,f e m ) 及小波描述子 等。目前较为常用的是傅立叶描述符法、形状无关矩法以及几何参数法。下面就 这几种方法进行简略介绍。 傅里叶形状描述符法的基本思想是使用物体边界的傅里叶变换作为形状描述, 利用区域边界的封闭性和周期性,从而将二维问题转化为一维问题。 形状无关矩法是基于区域的物体形状表示方法,它利用目标所占区域的矩作为 形状描述参数。假设r 是用二值图像表示的物体,则r 形状的第p + q 阶中心矩为: 作,5 扛一t ) p ( y 一儿y ,斗。 k y ) e r i 氏z i j 其中( 葺, ) 是物体的中心。 在几何参数法研究中,由b r i a ns c a s s e l l a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论