基于内容的图像检索-累加直方图算法_第1页
基于内容的图像检索-累加直方图算法_第2页
基于内容的图像检索-累加直方图算法_第3页
基于内容的图像检索-累加直方图算法_第4页
基于内容的图像检索-累加直方图算法_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE24基于内容的图像检索-—累加直方图算法ﻩ摘要ﻩ随着多媒体、网络技术的迅速发展,图像信息的应用日益广泛,对规模越来越大的图像数据库、可视信息进行有效的管理成为迫切需要解决的问题,灵活、高效、准确的图像检索策略是解决这一问题的关键技术之一。因此,基于内容的图像检索已成为国内外学者研究的主要热点问题,并取得了不少的成果。本文主要对当今热门的基于内容的图像检索技术进行了研究,重点对它的算法进行研究。在半年的时间里,通过查阅很多相关的资料,并认真学习了基于内容的图像检索的基本理论,特别是深入研究了颜色直方图理论和累加直方图算法,最后在MATLAB平台下编程实现此系统,该系统可以实现基本图像检索的功能,根据用户输入的样本图像来与图像库中的图像进行特征匹配,然后找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。经过对该系统进行反复的调试运行后,该系统所实现的功能基本达到了设计目标,并且运行良好。当用户提供出所要查询的关键图后,系统就可以从用户提供的图像库中检索到与关键图相似的图片并排序返回给用户,达到了预期效果。关键词:图像检索累加直方图颜色特征MATLABTitleContent-BasedImageRetrieval—-cumulativehistogramalgorithmAbstractWiththerapiddevelopmentofthemultimediaandthenetworktechnology,theimageinformationbecomesmorewidelyavailable,increasingthesizeoftheimagedatabase,visualinformationforeffectivemanagementofanurgentneedtoaddresstheproblem,flexible,efficientandaccurateimageretrievalstrategysolvethisproblemoneofthekeytechnologies.TheresearchersaresokeenonContent—BasedImageRetrievalthattheyhavemademuchprogress。Inthispaper,today’spopularcontent-basedimageretrievaltechnologyisanalyzed。Anditmainlyfocusesontheresearchofitsalgorithm。Inaperiodofhalfayear,Throughaccesstorelevantinformationandtoseriouslystudythecontent-basedimageretrievalofthebasictheory,inparticular,in-depthstudyofthecolorhistogramtheoryandcumulativehistogramalgorithm。Finally,thissystemshouldbeimplementedundertheplatformoftheMATLABbyprogramming。Inthissystem,thebasicimageretrievalfunctionscanbeachieved。itcanaccordtothesamplesuserinputsandthepicturesoftheimagelibrarytomatch.Italsocanidentifytheimagesthathaveashortdistancetothesampleimages,andpresenttotheuserinaccordancewiththeordersteeled.Afterrepeatedlyonthissystemdebuggingoperation,thesystemhaveachievethebasicfunctionsofthedesigngoals,andrunninggood.Whenuserswanttoprovideamapforthekey,thesystemcanprovideimagesfromtheimagelibrarytoretrievethekeyplansandsimilarsortofpicturethenreturnedthemtotheuser.Itachievedtheexpectedresults.KeywordsImageRetrievalCumulativeHistogramAlgorithmColorFeaturesMATLAB目次TOC\o"1—3"\h\z\uHYPERLINK\l”_1__绪论”1绪论ﻩPAGEREF_Toc167715557\h1HYPERLINK\l”_1.1__国内外的研究现状”1.1国内外的研究现状ﻩ1HYPERLINK\l”_1。2_选题意义及本文研究的内容"1。2选题意义及本文研究的内容ﻩ3HYPERLINK\l"_2__基于内容的图像检索的简介”2基于内容的图像检索的简介ﻩ4HYPERLINK\l”_2。1_基于内容的图像检索概述"2.1基于内容的图像检索技术的概述ﻩ4HYPERLINK\l”_2.2_基于内容的图像检索的关键技术”2。2基于内容的图像检索的关键技术ﻩ5HYPERLINK\l”_3_基于内容的图像检索原理和特点”3基于内容的图像检索原理和特点 6HYPERLINK\l”_3.1_基于内容的图像检索的原理及处理过程"3.1基于内容的图像检索的原理及处理过程ﻩ6HYPERLINK\l”_3。2_基于内容图像检索的特点"3。2基于内容图像检索的特点ﻩ8HYPERLINK\l"_4_颜色特征理论”4颜色特征理论ﻩ8HYPERLINK\l”_4。1_颜色模型”4.1颜色模型ﻩ9HYPERLINK\l"_4.2_颜色特征提取”4.2颜色特征提取 10HYPERLINK\l"_5_颜色直方图理论"5直方图理论ﻩ12HYPERLINK\l"_5。1_颜色直方图"5.1颜色直方图ﻩ12HYPERLINK\l"_5.2_直方图的矩"5。2直方图的矩ﻩ13HYPERLINK\l"_5.3_直方图均衡化算法"5.3直方图均衡化算法ﻩ14HYPERLINK\l"_5.4_基于直方图的图像检索技术分析"5.4基于直方图的图像检索技术分析ﻩ14HYPERLINK\l”_6_累加直方图算法”6累加直方图算法ﻩ16HYPERLINK\l"_6。1_累加直方图"6.1累加直方图ﻩ16HYPERLINK\l"_6.2_算法实现”6.2算法实现ﻩ18HYPERLINK\l”_6.3_改进的局部累加直方图算法”6.3改进的局部累加直方图算法 18HYPERLINK\l”_6。4_算法总结"6。4算法总结 19HYPERLINK\l"_6。5_实验结果”6.5实验结果ﻩ19HYPERLINK\l"_7_系统的性能评价"7系统的性能评价ﻩ22HYPERLINK\l”_7。1_查全率和查准率"7。1查全率和查准率ﻩ22HYPERLINK\l"_7.2_排序评价方法"7.2排序评价方法ﻩ23HYPERLINK\l"_结__论”结论ﻩ24HYPERLINK\l"_致__谢”致谢ﻩ25HYPERLINK\l”_参_考_文_献”参考文献ﻩ261绪论随着多媒体技术和计算机网络的飞速发展,全球的数字图像的容量正以惊人的速度增长。面对如此丰富且散布在世界范围内的海量图像资源,如何从海量的图像数据中高效、快速地检索出所需信息是当前许多应用领域所面临的重要问题.传统的基于关键词、文本的图像检索技术的不足日益凸显,主要体现在仅用关键词对图像资源描述的局限性,这种基于个体对图像特征主观认识的描述方法不能充分描述图像资源;而基于内容的图像检索技术(Content—BasedImageRetrieval,CBIR)的研究就是在这种现实需要的前提下提出并展开的.基于内容的图像检索这一课题目前已是一个非常活跃的研究领域,其在数字图书馆、数据挖掘及多媒体视觉内容检索等领域都起着十分重要的作用,在工业和科研领域具有广泛的应用性,例如医学研究机构的病理图像资料管理、公安机关的犯罪数据分析、气象局的卫星照片管理和网上时兴的电子购物等。但是CBIR评价研究还处于起步阶段,评价方案和评价标准都处在探索之中,而特征维度较高、缺乏大规模的公用测试数据集等问题也给CBIR评价的研究工作带来了很大的困难和挑战。本论文的研究工作就是在这样的情况下开展的。1.1国内外的研究现状1.1.1国内的研究现状随着我国社会和经济的发展,使得从公共媒体到家庭娱乐,从自然科学到社会科学,每一个领域都渗透着对多媒体技术和因特网技术的应用,都要求对各种资料的智能化的管理。随着我国国防科技和航天事业的快速发展,军事领域对图像检索技术也提出了更高的要求,大量的宇航图片和卫星图片的产生,要求高效率的管理和查找。因此,在国内不论是民用还是军用,都使图像检索技术的研究具有极为重要的应用价值。在我国从上个世纪末至今,基于内容的图像检索技术逐渐成为研究和应用的热点。目前,我国的医药卫生领域,工业生产和机械制造加工领域,农业生产领域,国防科技领域,以及娱乐文化领域等都逐渐研究并应用这项技术。在医学领域,利用基于内容的图像检索技术对医学病理图像进行检索,辅助医生的诊断和治疗。工业生产中,利用这项技术对加工的产品进行质量检测,在新研制的汽车维修和零件销售中,进行网上选购和订货。农业生产中对农作物进行病虫害的监测和防治工作。军事领域中,开发智能导弹自动选择目标实施攻击。这些领域都是我国己经和正在发展及应用的实例[1]。从目前究和应用的现状来看,基于内容的图像家检索技术主要应用在专业图库中进行图像的检索.如在商标图库中,在扫描得到的报纸库中,在农产品如烟叶图库中.目前,市场上推出的基于图像内容的检索系统软件虽然各有所长,但是始终不能尽如人意,而且针对海量数据的特点如何快速地进行图像的检索还需要解决。1.1.2国外的研究现状在国外,基于图像内容的检索技术是随着数字图书馆的发展,而逐渐发展并成为一个研究热点。1994年美国启动了持续四年的“数字图书馆”项目。1998年,美国自然科学基金会,国防部高级研究计划署,国家航空航天局,国家医学图书馆,国会图书馆,国家人文科学基金会和联邦调查局联合自主第二期计划的的实施,掀起了全球性的数字图书馆研究热潮[2]在数字图书馆中,其中一个关键的问题是检索问题,集中在以下两个方面:一是解决目前Internet的信息检索问题,二是多媒体信息的检索。因为图像属于一种视觉信息,所以图像检索问题在两个方面中都存在[3]。IBM公司的QBIC系统可能是最著名的产品,它可以作为独立的软件产品使用,也可以作为IBM公司的数字图书馆的一个组成部分.QBIC系统实现了基于颜色、纹理或形状的组合查询,以及文字关键字的查询。查询接口方式实现了基于模板图像的查找,基于调色板的查找,基于草图的查找。Virage公司的VIR图像工程系统也具有独立性及附属性,并且被应用于AltaVista的网络图片查询工具AVPhotoFinder中.Excalibur公司的Excalibur视觉检索产品是在公司长期研究的模式识别理论和数据库技术的基础上研制出来的,现已被成功地应用于Yaho上,即图像冲浪组件,实现了基于内容的图像检索。这些产品共同特征是:都是基于图像特征矢量的检索,数据库中的每一幅图像都由一个不超过500个元素的特征矢量描述。特征矢量一旦产生,就永久性地存储下来,查询时的搜索只是基于特征矢量的查询。特征矢量之间的欧氏距离作为相似性度量的准则,按照距离的大小给出查询结果[4]。1。2选题意义及本文研究的内容1.2.1课题的目的和意义随着Internet网络技术的不断发展,网络用户越来越多,网络已成为目前最重要的信息来源之一。事实上,来自网络的信息量比任何一种渠道的信息量都要大。所涉及的领域之广、更新速度之快和搜集成本之低也是其他任何手段无法比拟的。网络将会改变人类的一切,这已不是谣言,而是一个不争的事实。但是,网络的确是一个名副其实的“双刃剑”,利用好它可以发挥它无穷的威力;反之,就会给自己带来无穷的祸害,给国家带来巨大的损失.从广义上讲,网络就是一个巨型数据库,人人都可以从中取到自己所需的东西。利用搜索引擎合法的在网上搜索特定信息本身就是网络的建设目的之一。目前,国内外许多研究者正在研究基于网络的信息收集和检索技术。特别是随着网络的普及,数据检索和收集显得越来越重要,已成为人们达到特定目的最有效的方法和手段之一.随着图像处理、图像理解和模式识别研究的发展和深入,以及对人眼图像理解机制的深入研究,基于图像的搜索引擎得到了很大的发展,从传统的语义注释的图像检索到基于图像内容的图像检索技术(CBIR,Content-BasedImageRetrieval)发展,标志着图像检索技术根本性的变革。CBIR技术是随着计算机视觉、图像理解与图像处理研究的进步而逐渐发展成熟的一种图像媒体检索技术.1。2.2研究的主要内容本文主要讨论了基于颜色直方图的图像检索技术一些基本的理论知识,着重研究的是用累加直方图算法来实现一个系统,并用该系统达到实现图像检索的目的,还要给出对该系统性能评价的一般标准。下面是本文的内容介绍:本文第一部分简要介绍了基于内容地图像检索技术的背景资料和研究发展状况,说明了研究该项技术的必要性.第二部分说明基于内容的图像检索的基本概念综述以及其关键技术。第三部分讲述基于内容的图像检索的原理工作过程和其特点。第四和第五部分主要讲颜色特征理论和直方图理论,这是为后面的算法研究打下理论基础。第六部分主要介绍累加直方图算法,这也是本文的最核心部分。后面一个部分讲的是基于内容的图像检索的评价标准。最后结论部分介绍的是总结和图像检索的研究趋势.2基于内容的图像检索的简介2。1基于内容的图像检索技术的概述基于内容的图像检索涉及到图像处理、计算机视觉、模式识别以及神经网络等学科,同时也和人脑的认识程度紧密相关,这诸多因素使得基于内容的图像检索的研究成为一项极富挑战性的课题.本章从基于内容的图像检索的基本原理、流程、关键技术、特点等多个方面对基于内容的图像检索进行介绍和分析。2.1。1基于内容的图像检索的基本概念所谓基于内容的图像检索技术(Content-BasedImageRetrieval,CBIR),它是指利用图像的颜色(灰度)、形状、纹理、语义等特征对图像进行查询,试图在理解图像内容的基础上,检索出与示例相类似的图像。这种检索不同于传统的检索,它用于检索的是反映媒体内容并与媒体存储在一起的各种量化特征,使用的是基于相似性度量的示例查询(QueryByExample)方法。它区别于传统的检索手段,融合了图像理解技术、模式识别技术,从而可以为信息用户提供更加有效的检索手段.2.1。2基于内容的图像检索的体系结构基于内容的图像检索涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科。目前图像检索系统的高性能还必须建立在人机交互的基础上,如图2。1为一种系统结构图[6]。系统结构中有三个数据库。原始图像数据库存储用于视觉显示的所有原始图像。考虑到在图像检索过程中可能对图像的分辨率由不同要求,因此,需对图像进行预处理.视觉特征数据库用来存储提取出的图像视觉特征,这是基于内容的图像检索的必备信息,主要涉及计算机视觉和图像理解技术。文本注释数据库包括图像的关键词和对图像自由描述的文本。它是基于内容的图像检索的必要补充,主要涉及文本信息检索和数据库管理技术。多维索引模块是为了提高在大规模图像库中检索图像时的运行速度。尽管目前大部分实验系统上未能采用这项技术,但它是未来高性能图像检索系统必不可少的部分。这个模块主要涉及计算几何、数据库管理和模式识别技术.搜索引擎模块包括查询接口子模块和查询处理子模块。前者主要是检索用户的信息需求,并显示系统的检索结果,后者确保系统能够以最佳的方式处理用户的查询.查询查询接口查询处理多维索引原始图像库可视化特征库文本注释库特征提取及索引图2.1基于内容的图像检索系统结构图2.2基于内容的图像检索的关键技术基于内容的图像检索系统的关键技术包括以下几个方面:(1)数学模型。数学模型是CBIR系统的核心,它决定了CBIR所能支持的查询类型和检索性能.建立的数学模型要充分反映图像对象的内容,反映与领域无关的和能够有效存储的物理特性及逻辑特征。(2)特征提取.特征提取是基于内容的图像检索的基础。特征提取算法应简单易用,且具有自动提取的功能,所选择的特征应尽可能表达原始图像的信息。同时可以借助一些先进的数学工具来提取图像特征。(3)索引技术.在对图像的检索中,最主要的方式是相似性检索。即在图像数据库中找到与给定图像最为相似的一幅。它的一般做法是提取出图像的特征建立特征库。由于图像特征一般都是高维的矢量数据,所以这时图像检索就转化为对空间数据库中高维数的近邻检索问题.为了能够高效的进行数据特征索引,从而实现图像信息的检索,目前对索引技术的研究主要集中在降低索引维数和建立良好的索引方法上.(4)累加直方图算法。累加直方图能体现信号在分布轴上各抽样点间的相关性,即分布轴上相对某个抽样点距离越近的点,在某种特性意义上就越相似于该抽样点。但是累加直方图能体现这个性质的前提是:信号本身要有这样的特性,即特征分布轴上距离小的两点要比距离大的两点更相似。3基于内容的图像检索原理和特点3.1基于内容的图像检索的原理及处理过程3.1。1基于内容的图像检索的原理目前,基于内容的图像检索的研究主要是借助图像的特征来进行的,其基本工作原理是在建立图像库时,分析输入图像,提取图像的特征作为特征向量,与图像一起存储在数据库中。图像检索时,则提取给定查询范例图像的特征或由用户指出要查询图像的特征,与数据库中的特征向量进行匹配,并根据匹配结果返回相应图像。一个基于内容的图像检索系统通常由四个组成部分(如图3.1):图像数据库管理、相似匹配、查询方式、结果输出与反馈机制。根据CBIR系统的原理,可归纳出以下几部分[7]:(1)图像数据库系统。由图像库、特征库、和知识库组成。图像库的内容为数字化的图像信息;特征库存储是从图像中提取的各种特征;知识库包含专门和通用的知识,以利于查询优化和快速匹配;有效地组织图像数据库并建立高效的索引,加快图像的检索速度。(2)图像预处理。图像格式转换、尺寸统一、图像增强与去噪声等功能。(3)特征提取。包括特征选择和提取特征,特征选择即选取适当的图像特征组成特征空间,一旦特征确定了,其对应的特征空间也就确定了。选择的特征对于相似的图像具有稳定性,对于不同的图像要具有较强的区分性。提取特征是指从包含大量信息的图像中分解出不同种类的特征信息.特征的提取可以是整幅图像,也可以是图像的某个区域或具体的内容对象。(4)相似匹配。如何进行图像匹配,即确定相似性度量算法。基于内容的图像检索中,图像之间的匹配不是传统意义下的精确匹配,而是一种相似匹配。检索是利用特征之间的距离函数来进行相似性匹配,模仿人类的认知过程,可以从特征库中寻找匹配的特征,也可以临时计算对象的特征。匹配引擎中包括一个较为有效、可靠的相似度函数集。特征1特征1特征n反馈信息检索结果特征提取特征比较特征数据库特征提取图像数据库范例图像或草图查询方式结果输出与反馈机制相似匹配图像数据库管理图3.1系统原理框图3.1.2基于内容图像检索的处理过程基于内容的查询和检索是一个逐步求精的过程,存在着一个特征调整、重新匹配的循环过程,如图3。2所示。(1)提查询要求。用户查找一个数据对象时,利用系统人机界面提供的输入方式形成一个查询条件。查询接口一般要对所提交的数据进行预处理,然后再传递给搜索引擎。(2)相似性匹配。用户提交的查询要求经处理形成查询特征,将查询特征与数据库中的特征按照一定的匹配算法进行匹配。用户的查询说明用户的查询说明·示例·一般性描述相似性匹配修改查询说明返回一组候选结果满意?结束从候选结果中选择一个示例NY图3。2基于内容图像检索的处理过程(3)返回查询结果.满足一定相似性的一组候选结果按相似度大小排列返回给用户,因此,系统人机界面要有显示浏览查询结果的功能。(4)调整查询特征。对系统返回的一组查询结果,用户可以通过遍历挑选满意的结果,也可以从候选结果中选择一个示例,进行查询特征调整,形成一个新的查询。如此逐步求精,直到满意为止.用户提交查询样本用户提交查询样本选择检索类型库中图像对查询样本提取特征输出检索结果从特征库中提取特征图像检索图3。3图像查询流程图3.2基于内容图像检索的特点基于内容的图像检索具有下列主要特点:(1)从图像内容中由计算机自动提取视觉特征,并根据这些特征从图像数据库中查找、检索出具有相似特征的图像数据。基于内容的图像检索直接对图像内容进行分析,抽取特征和语义,把检索过程与语义提取直接联系起来,使得检索过程更加有效,适应性更强。(2)使用相似匹配代替精确匹配。在传统的基于文本的图像检索中,是以精确匹配为主.在基于内容的图像检索中,通常采用相似匹配方式,从而获得类似图像,不断缩小检索范围,直至定位于所要求的目标,与传统数据库检索的精确匹配不同.(3)直观的可视化查询方式,交互性强.基于内容的图像检索通常采用范例检索方式,在许多现存的基于内容的图像检索系统中都运用其中的一种或几种相结合的查询方式。(4)满足多层次的检索要求。系统通常包含图像库、特征库,可满足多方面的检索要求。用户可以向系统提交与所需查询的图像一致或类似的例图、绘制草图或进行单个特征的检索、基于多个特征的综合检索、基于对象的检索等。4颜色特征理论颜色特征是图像检索中使用最广泛的一种视觉特征,也是最直观和最简单的一种,它具有很多优良的性质,它对于图像的平移、旋转、大小的变化具有良好的适应能力。颜色直方图是提取颜色特征最常用的一种表示方法。最早采用颜色进行图像检索是由Swain和Ballard提出的基于颜色直方图的检索方法[8],其核心思想是在一定的颜色空间中对图像中的各种颜色出现的频数进行统计,然后图像之间相似的问题就转化成比较图像直方图之间的相似性问题。4.1颜色模型4.1.1RGB颜色模型RGB模型是基于三基色模型的代表。整个颜色空间位于边长为1的立方体中,每个像素实际上任何可能量化的颜色都能用三维空间中第一个象限的一个点来表示,如图4.1所示:蓝(0,0,1)蓝(0,0,1)青(0,1,1)白(1,1,1)绿(0,1,0)RGB红(1,0,0)品红(1,0,1)黄(1,1,0)黑(0,0,0)灰度图4.1RGB颜色模型这个模型基于笛卡儿坐标系。原点上,任一基色均没有亮度,即原点对应于黑色.三个轴分别为R、G、B三基色.离原点最远的顶点对应于白色。亮度较低的等量的三种基色产生灰色的阴影,所有这些点均落在彩色立方体的对角线上,该对角线被称为灰色线。该模型是数字图像处理所使用的最重要的彩色模型。然而,RGB颜色模型与人的视觉感知有一定差距,例如给定一个颜色,人很难判定其中的R,G,B分量,这时使用面向视觉感知的颜色模型比较方便一些。4.1.2HSV颜色模型从数字图像中一般都得到RGB值,但RGB颜色空间中的颜色不能与感知上的颜色模型联系.在所有的颜色空间中,HSV模型对应于画家配色模型,它能较好反映人对颜色的感知和鉴别能力,非常适合基于颜色的图像相似比较,而且HSV和RGB颜色空间的转换是可逆的.视频采集卡得到帧图像一般采用RGB模型,因此要把RGB模型转换成HSV模型,具体算法如下[9]:设定义为:则v=/255(4.1)(4.2)这里,,。4。2颜色特征提取颜色是一种能简化目标提取和分类的重要描述符,所以选择合适,对颜色的表达方式是很重要的.另一方面,对颜色的特征表达依赖于所用的颜色模型,最好选择与人的感觉相一致的颜色空间.最早在基于内容的图像索引的色彩直方图中得到应用.颜色特征定义比较明确,抽取也相对容易,并且具有尺度不变性、旋转不变性和位置不变性等特点,因此在图像检索中得到广泛的重视和研究,并提出了很多改进算法。最早的全局色彩特征索引方法是由Swain和Ballard提出的基于色彩直方图的检索法,其主要思想是在一定的色彩空间中对图像各种色彩出现的频数进行统计,既描述的是不同色彩在整幅图像中所占的比例。而并不关心每种色彩所处的空间位置,所以颜色直方图特别适合于描述那些难以进行自动分割的图像和不需要考虑物体空间位置的图像。颜色直方图可以基于不同的颜色空间和坐标系。大部分的数字图像采用RGB色彩空间,但这种空间结构并不符合人们对颜色相似性的主观判断.因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图.除了基于这些颜色空间的直方图外,还提出了许多改进的方法,例如,何恒等提出的综合颜色和纹理特征的模糊直方图方法,该方法将图像分快处理,得到图像在HSV空间的颜色模糊直方图,然后用纹理特征对颜色模糊直方图进行扩展,从而得到综合模糊直方图,同时还给出了抽取图像颜色和纹理特征的方法和建立图像综合模糊直方图的计算程。王禹等提出的基于广义直方图的图像检索方法[10],该方法把图像和它的平滑图像组合起来,形成一个二元组即“广义图像”,广义图像的直方图称为广义直方图。除此之外还有累积直方图法、均值直方图法等。5直方图理论5.1颜色直方图颜色直方图是最常用的颜色特征提取方法之一,其核心思想是在一定的颜色空间中对图像各种颜色出现的频数进行统计。目前,几乎所有的基于颜色特征的检索算法都是以颜色直方图为基础的。它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像[11].计算颜色直方图需要将颜色空间划分为若干个小的颜色区间,每个区间成为直方图的一个柄(bin)。这个过程称为颜色量化(colorquantization).然后,通过计算颜色落在每个小区间的像素数量可以得到颜色直方图。横坐标表示颜色的色彩归一化后的值,纵坐标表示每个小的颜色区间中所对应的图像像素的总和。颜色直方图可以对应于不同的颜色空间。最常用的是RGB颜色空间,因为大部分的数字图像都是用这种颜色空间表达的。当图像用RGB颜色空间表示时,彩色图像的直方图可以用R、G、B三个单色的直方图来表示或者用一个RGB联合分布的颜色直方图来表示。当用三个单色直方图表示时,各个直方图表示的是图像在这种颜色分量的统计分布,总共有三个不同的概率分布。而彩色图像直接用一个颜色直方图表示时,其统计的是不同颜色出现的频数,以色彩作为横坐标,纵坐标为色彩出现的频数.在RGB颜色空间中,颜色直方图可以看成是一个离散函数,即(5.1)其中,k表示图像的特征取值,L表示特征可取值的个数,凡表示图像中具体征值为k的像素个数,n表示图像像素的总个数。由此看出,颜色直方图具有下列性质:位置无关性直方图描述了每个灰度级的像素的个数,但不能为这些像素在图像中的位置提供任何线索。当一幅图像被压缩为直方图后,所有的空间信息将全部丢失。因此,任一特定的图像具有唯一的直方图,例如图5.1中(a)、(b)、(c)和(d)四幅图像,如果阴影部分具有相同的灰度值而且面积相等,那么这四幅图像的直方图却是完全相同的,这说明了不同的图像可能具有完全相同的直方图。(a)(a)(b)(c)(d)图5.1直方图的位置无关性叠加性如果一幅图像由两个不连接的区域组成,并且每个区域的直方图己知,则整幅图像的直方图是该两个区域的直方图之和。显然,该结论可推广到任何数目的不连接区域的情形。总体性(a)(a)(b)(c)(d)图5.2直方图的总体性直方图是总体灰度概念,从直方图中可以看出图像整体的性质.如图5。2所示:直方图(a)表示图像总体偏暗:直方图(b)表示图像总体偏亮;直方图(c)表示图像的灰度动态范围太小,许多细节必然分辨不清楚;直方图(d)表示图像灰度级分布均匀,给人以清晰、明快的感觉。5.2直方图的矩对直方图来说,一、二、三阶中心矩分别为:(5.2)(5。3)(5.4)设,,分别为图像Q的H(色度),S(饱和度),V(亮度)的阶中心矩,分别为图像I中的H,S,V的阶中心矩,则距离度量函数为:(5。5)其中分别为加权系数。5.3直方图均衡化算法(1)直方图修正.空域图像增强的基本方法是通过对图像做灰度T:一般情况下,例如灰度级线性拉伸,我们直接指定所要进行的变换T.而直方图修正也是灰度变换的一种,它试图寻找这样的灰度变换函数T,它能把映射为,使得的直方图具有指定的(希望的)形式。因此它不是事先指定变换函数T,而是从及中计算得到T.(2)直方图均衡化。直方图均衡化是一种最常用的直方图修正技术,它是把给定图像的直方图分布改造成均匀直方图分布,使输出像素灰度的概率密度均匀分布。用信息学的理论来解释,即具有最大嫡(信息量)的图像为均衡化图像。直方图均衡化的基本原理是:当图像中当所有的灰度级出现的概率是一个均匀分布时,图像所暴露出来的信息量最大。考虑如下的变换:(5。6)即取变换函数为累积分布函数CDF。所以有:(5。7)由上式又能得出:这样就得到了我们想要的均匀分布.5。4基于直方图的图像检索技术分析灰度直方图是反映灰度图像的亮度概率分布的有效工具。颜色特征是图像最直观、明显的特征,一般采用直方图来描述。基于颜色检索的基本思想是将图像间的距离归结为其颜色直方图间的差距,从而图像检索也就转化为颜色直方图的匹配。第一,直方图的计算。图像直方图是一个N维向量,为灰度或颜色的级别数,图像直方图对图像的平移和旋转具有不变性。当对图像直方图进行归一化,将中灰度或颜色的频数变成频数比率,归一化直方图对图像的尺寸变化具有不变性。(1)归一化直方图的计算记为图像P某一特征值为的像素数,N为图像P的总像素数,则图像P的该特征的直方图为:其中(5.8),N均为整数。(2)累积直方图的计算己知图像某一特征的归一化直方图为则该特征的累积直方图可由下式计算:其中(5。9)为整数。第二,直方图的匹配。常用两种距离度量函数:设分别为图像的归一化直方图。(1)一般欧氏距离函数(5.10)(2)加权距离函数(5.11)传统的颜色直方图,要计算和存储整幅图像颜色空间的直方图,计算量和存储量巨大,这对于图像检索是没有必要的,因为人能觉察到的图像颜色一般不过几十种。因此这些都需要分析研究、进一步去改进。6累加直方图算法6。1累加直方图在许多应用中,图像检索结果只能由人来做主观评价。人眼对颜色的分辨能力是有限的,例如对色调(Hue)的微小变化不敏感.换言之,在相同亮度和饱和度下,色调在一定范围的变化,人眼无法觉察。如何适应人的这个视觉特性,人们首先想到了加大量化间隔,将相近的颜色量化到Hue轴同一坐标上。有实验表明,采用一般直方图,当量化间隔时,检索效果有很大改善。但这种简单量化存在两个严重问题,首先,对两个相近颜色,这种量化既可能将它们量化到同一个Hue坐标上,也可能量化到不同的两个Hue坐标上。可见,简单的加大量化间隔会导致误检。再者,色调(Hue)的分布有其自身的特殊性,从视觉角度来看,其相似性的分布并非均匀分布,如蓝色的相近色的分布范围要比黄色的更宽些,简单的等间隔量化并不适合色调(Hue)信号。一般直方图方法对每个颜色分量平等对待,没有考虑颜色轴上相邻颜色的相似性,在一些情况下可能会漏检。如有三幅单色图像,颜色分别为红色、粉红色和蓝色,用欧几里德距离对三幅图像进行度量,结果粉红图像与红色图像的相似程度等同于蓝色图像与红色图像的相似程度,这不符合人的视觉感觉.在图6。1中给出的三幅图像的直方图,人的视觉感觉很容易判断和较相似,而它们与的区别显著。但是用前述的距离度量方法,结果不如人意,例如欧几里德距离:(6。1)H1H1H2H3图6。1三幅颜色直方图利用二次距离可以在一定程度上克服这一缺陷,但是相比其复杂的计算,其性能的提高是有限的。累加直方图可以较好的解决这一问题。累加直方图是以颜色作为横坐标,纵坐标为颜色累加出现的频数,以此绘出的图形。这样图像的累加直方图空间可以定义为:(6.2)表示种颜色的像素的累加频数:图6.1直方图对应的累加直方图如图6。2所示。可见,在累加直方图中,相邻颜色在频数上是相关的。累加直方图消除了一般直方图中常见的零值,也克服了一般直方图量化过细过粗检索效果都会下降的缺陷。图6.2与图6。1直方图对应的累加直方图累加直方图的距离度量采用一般直方图的前三种方法。例如用欧氏距离,图6.2的距离比较如下:(6.3)与人的视觉感觉相符.累加直方图是密集的,即使其对应的一般直方图是稀疏的(有较多的0值)。相比一般直方图,累加直方图的存储量和计算量有很小的增加,但是,累加直方图有更好的鲁棒性,因此我们可以用更宽的量化间隔来减少存储量和计算量。6。2算法实现分块非等色调区间局部累加直方图计算在实际计算时,把每帧图像分成2×2的子块。对每一子块,对色调取量化间隔为,分别计算每个相似色调区间的局部累加直方图;对饱和度S和亮度V空间进行非均匀量化,量化为3个间隔:[0,0.2]、[0.2,0。7]、[0.7,1],并按上述量化间隔计算一般直方图[12]。(1)一般直方图计算:(6.4)其中L为量化间隔数,为帧图像某一特征量的第k区间,是帧图像某一特征量在区间取值的象素的个数。(2)累加直方图计算:(6.5)(3)近似匹配度量设,分别为帧图像Q和S的归一化直方图,对色调按欧氏距离法进行度量:(6。6)对饱和度和亮度用相交法进行度量:(6。7)按加权法计算每一子块总匹配度:(6.8)最后,若两帧图像每个子块都小于域值T,则认为匹配。6.3改进的局部累加直方图算法对色彩比较复杂的自然景物图象,一般累加直方图算法在检索中就会将不同色度的信号混淆起来。使用局部累加直方图代替一般的累加直方图需要对色度相似区进行合理的划分[13]。算法1:当对色度的量化间隔为1°时,采用为区间的长度,将H轴共分成6个局部区间,通过分别计算每个局部区间的累加直方图进行检索。算法2:色度轴上各种颜色的分布实际上是连续过渡的,各颜色区之间并不存在截然的界限.算法1以为间隔来划分相似色区域,虽然保证了在各局部区间内使用累加直方图的条件,但在区间分界处附近忽视了颜色的相似连续性,会造成与量化间隔过大而产生的相同问题。在算法2,先采用算法1计算出每个局部区间的累加直方图,再改变区间的划分为计算出这时每个局部区间的累加直方图,最后将这2次计算的累加直方图逐项相加取平均,作为最终的特征直方图用于检索.这样在以欧氏距离为相似度测度时,更能体现色度信号在分布轴上各抽样点间的相关性。算法3:将色度进行变换后,消除了一些参数变化的影响.算法3在此基础上对以为间隔进行新的相似色区间划分并按算法1计算局部累加直方图进行检索。算法4:类似算法2对算法1的改进,先用算法3计算出每个局部区间的累加直方图,再改变区间划分并计算出这时每个局部区间的累加直方图。最后将这2次计算的累加直方图逐项相加取平均,作为最终的特征直方图用于检索。6.4算法总结在以欧氏距离为相似度测度时,累加直方图能体现信号在分布轴上各抽样点间的相关性,即分布轴上相对某个抽样点距离越近的点,在某种特性意义上就越相似于该抽样点。但是累加直方图能体现这个性质的前提是:信号本身要有这样的特性,即特征分布轴上距离小的2点要比距离大的2点更相似。色度信号相关的性质比较简单,故累加直方图算法的检索结果还比较令人满意[14]。而对色彩比较复杂的自然景物图像,一般累加直方图算法在检索中就会将不同色度的信号混淆起来,而在各局部区间内分别应用累加直方图法就可以解决这个问题.累加颜色直方图检索算法是将颜色直方图中每个分量进行逐步累加,生成新的直方图,利用新的直方图进行图像的相似匹配,完成图像的检索。该算法能够收到较好的检索结果,但它必须有一个前提,即信号本身在特征分布轴上距离小的两点要比距离大的两点更相似。为此,有人提出局部累加直方图检索算法。该算法把色度沿分布轴分成若干个局部区间,而在各个局部区间内分别应用累加直方图算法。实验证明,局部累加直方图检索算法的检索效率要优于一般累加直方图检索算法。6.5实验结果(1)测量欧几里德距离和加权距离下面是两幅花朵的图片,现在在Matlab环境中编程实现用累加直方图方法测欧氏距离和一般直方图法测加权距离,经过实验测得:用累加直方图法测得的欧氏距离为0。3442用一般直方图法测加权距离为0。0065图6.3测欧氏距离所用到的图片(2)通过Matlab程序实现对输入一幅彩色图像,先将其灰度化,再绘制直方图,最后输出原来的输入图像和原图像的直方图。下图分别给出了实验结果:图6.4输入的图像和输出的直方图(3)图像检索实例在对系统进行了多次调试运行后,系统基本达到设计目标,下图6.5和图6.6所示为两次检索结果的实例。可以看到,根据用户提供的查询关键图,系统从用户选择的图像库中检索到与关键图相似的图片并排序返回给用户。实验中选择了100多幅真彩图作为测试图像,基本达到了预期效果。左边一幅为待查询图,其余从左到右相似度依次减小。以天空为范例的检索结果为:图6。5以天空为范例的检索结果以大海为范例的检索结果为:图6。6以大海为范例的检索结果7系统的性能评价7。1查全率和查准率查全率与查准率是信息检索中的标准评价方法[15],现在已被越来越多地使用在基于内容的图像检索当中[16~18].QBIC中就使用了该方法。以下用图7.1的a,b,c,d的关系来说明检索过程的查全率和查准率[19]:ccbad图7。1a,b,c,d关系示意图(图中a+b+c+d=Qa+c=Aa+b=B)图中Q为整个图像数据库,A代表相关图像的集合,B代表检索出的图像集合。则查准率(7。1)查全率(7.2)误检率(7.3)即表示的意思如下:查全率的主要含义是在一次查询过程中,用户所查到的相关图像的数目和数据库中与目标图像相关的所有图像数目之比;而查准率主要指在一次查询过程中所查到的相关图像数目同该次查到的所有图像数目之比。用户在评价算法的时候,可以预先选定含有特有目标的图像作为一组相关的图像,然后根据返回的结果计算查全率和查准率。查全率和查准率越高,说明该检索算法的效果越好。用查全率R作为x轴,查准率P作为y轴,绘制一条查准率-查全率曲线,简称为PVR曲线。设PVR曲线为,则与-轴围成的面积为:(7.4)称为PVR指数.据研究,该指数越大,图像检索性能越好。由此可以看出,查全率反映检索的全面性,而查准率则反映检索的准确性,因此可以用查全率和查准率来评价系统的有效性.该方法的局限性在于没有考虑检索结果中相似图像所处的位置,同时,高的准确率与查全率并不一定表明一个系统工作得好,这还要视具体的应用而定[21]。7.2排序评价方法设查询的返回图像幅数为N,在N幅返回图像中,为检索到的相关图像的数目,为相关图像的排序序号,为实际的相关图像数,则评价参数如下[22]:检索到的相关图像的平均排序为(7.5)理想的相关图像的平均排序为(7.6)相关图像的丢失率r为(7.7)表示理想情况下的平均排序,即返回相关图像全部排在最前面时的平均序号.越接近,表示查询效果越好。此外,还有人提出了使用以下标准化的平均排序方法:(7.8)对于最理想的检索,是0。结论本文开篇先谈了基于内容的图像检索的国内外现状,这也主要是说明该课题研究的必要性。接着比较详细地介绍了目前基于内容的图像检索技术中的关键技术和检索原理和检索流程,为下面进一步的研究打下理论基础.又对利用直方图算法所用到的基础理论进行介绍,主要介绍的是其中的颜色特征理论和颜色直方图理论,因为这是本文直方图算法的重点理论部分。在本文的第六部分又详细介绍了本文的核心部分即累加直方图算法理论及实际中的实验结果。最后内容还提到对基于内容的图像检索系统的评价以及图像检索今后的研究趋势。经过实验,我对我的系统进行了多次的修改,基本实现了预计的目标,图像检索的功能比较好的实现出来了,面且还证明了累加直方图算法相比较于其它的算法是比较优越的一种算法。目前,在基于内容的图像检索领域,在诸多研究方面,如视觉特征提取、多特征组合检索,以及高维索引的结构等,己经取得定进展,然而依然还有许名有待进一步解决的问题,(1)从自动分析到人机交互。基于计算机视觉的模式识别系统和图像检索系统的根本区别在于后者中人的参与是不可缺少的.早期人们强调全

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论