已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
研究生课程考核试卷科 目: 数字图象处理 教 师: 黄鸿 姓 名: 井涛 学 号: 20120802040 专 业: 仪器科学与技术 类 别: 学术 上课时间: 2012 年 10月至 2012 年 12月 考 生 成 绩:卷面成绩平时成绩课程综合成绩阅卷评语: 阅卷教师 (签名) 重庆大学研究生院制基于综合特征的图像检索系统摘要基于内容的图像检索(CBIR)是一个非常热门的研究领域。本文在对颜色特征、形状特征和纹理特征的研究基础上,将三种特征结合在一起,实现了可以自定义权重的综合特征的图像检索系统,并在平台上实现了这一系统。图像特征的提取和相似性度量是CBIR的两个关键技术。对于颜色特征,本文采用HSV空间中的颜色矩表示颜色特征;对于形状特征,本文采用图像的不变矩作为形状特征;对于纹理特征,为减少计算量,本文首先对图像进行预分割,提取分割后区域基于傅立叶描述子的纹理特征作为整个图像的纹理特征。在相似性度量方面,采用曼哈顿距离作为度量标准,得到各个特征的相似度向量。本文在平台上实现了这一图像检索系统,实现自定义权重以及综合特征下的图像检索,并在655副图像的大数据库中随机抽取24副图像进行检索实验,得到了较好的效果。关键词:图像检索,颜色矩,不变矩,傅立叶描述子AbstractNowadays content-based image retrieval (CBIR) has become a very active field. On the basis of study on the color features, shape feature and the texture characteristics, in order to achieve a comprehensive retrieval system, these three features are combined together in the paper, which has been built on.There are two key techniques in CBIR, which are image feature extraction and similarity measure. The color characteristic in this paper is expressed in the method of extracting color moments in HSV space. The shape feature used in this system is the invariantmoments of images. As to texture characters, boundaries Fourier descriptor is used after the image is divided.This paper bulit an image retrieval system based on which combines these three features and realizes user-defined weights. This retrieval system has a good effect on a database of 24 images.KeyWords:Image retrieval, Color moments, Invariant moments, Fourier descriptor1 图像检索的发展历程从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(Content-based Image Retrieval,简称CBIR)技术。2 基于内容的图像检索2.1 基于内容的图像检索的概念 基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。2.2 CBIR的研究现状在上世纪90年代,随着计算机和网络技术得到广泛应用之后,基于内容的图像检索技术取才得了较大的突破,人们也逐渐地将对基于内容的图像检索技术的研究成果应用到实际的工作和生活中,而对这种技术的需求的日益增长也驱动人们对基于内容的图像检索的技术向更高的层次进行研究。从当前的CBIR的研究的热点和未来的发展趋势的来看,可大致将其研究分为三层3:1 最低层次的检索,在这个层次主要是利用全局特征(例如:颜色、纹理、形状等底层特征)去描述图像的内容,进行检索,这也是最直接的层面;2较高层次的检索,该层次主要是利用图像对象语义来描述图像的内容,进行检索,这种技术是底层特征的基础上加入了图像语义特征(例如:对象与对象之间的空间关系等);3最高层次的检索,该层次是利用图像概念级语义来描述图像的内容,进行检索,该技术是建立在图像对象语义特征提取的基础上加入了图像的概念级语义(例如:用户对图像的理解、情感等高层语义)。尽管对CBIR技术的研究已经经过了很长时间,但目前较为常用的CBIR技术基本上都是基于底层特征的检索。现有的CBIR底层特征的检索系统主要包括基于颜色的图像检索系统、基于纹理的图像检索系统和基于形状的图像检索系统,下面就对上述三种检索系统进行一下简单的概述。2.2.1 基于颜色特征的图像检索颜色是描述图像内容最直接的视觉特性。颜色特征是一种定义比较明确和简单的特征,人的视觉对它的敏感度最大,人眼可以很直观地利用颜色特征区分出两幅图像的不同之处,因此颜色特征成为在CBIR研究中最早被用到的图像特征。 颜色特征的表示方法主要包括颜色索引、颜色矩等。颜色索引是一种以颜色直方图和直方图相交算法为基础的颜色特征表示方法,该方法在上述基础上,首先,将颜色空间划分为多个固定的子空间;其次,统计每个固定的子空间中像素的数目;最后,用直方图相交算法计算图像之间的相似度,按照相似度的大小对检索结果进行输出。该方法除了具有颜色特征通用的优点外,还有个突出优点是计算简单。但也存在两个不足之处:一是它没有办法反映出颜色的空间分布信息,例如两幅图像中对象空间分布的位置不同时,这两幅图像可能具有几乎完全一致的颜色直方图。二是量化方法的不一样也可能对检索结果也可能产生很大的影响,比如原来两幅图像的颜色直方图很相似,但是由于量化过大,使得某些颜色消失,最终得到的两幅图像的颜色直方图大相径庭,这样造成了图像检索的准确度大大折扣。由于颜色直方图在空间信息方面的缺失,后来又出现了颜色矩的概念来表示颜色特征,该方法先将图像按照一定的规则进行分块,然后对每一块提取颜色直方图。随后,出现了按物体对象的空间分割法,将图像按照图像中对象的分布进行分割,然后提取每个对象的颜色特征和对象之间的空间信息。上述两种方法都是在颜色整体特征的信息中加入了图像的空间分布信息,但是这两种方法存在的共同的缺陷是对于任意图像,如何对图像进行合适的分割。除了上述颜色特征的表示方法外,还有颜色相关向量法和颜色聚类法,这两种方法也在颜色的特征中添加了空间信息,在实际的应用中不常见,还处于研究阶段。2.2.2 基于纹理特征的图像检索和颜色一样,纹理是也是图像中一种不可或缺的视觉特性。纹理没有统一的定义,一般可以用图像的某种局部性质来对纹理下定义,纹理描述了局部区域中像素之间的关系,同时也描述了图像中的空间分布信息。对纹理可以通过粗糙度、方向性、对比度和规则性四个方面来描述。应用较为广泛的基于纹理特征的图像检索技术包括采用共生矩阵,和基于数学模型如小波变换的纹理特征检索。2.2.3 基于形状特征的图像检索形状描述的是图像中各种物体的外在特征,所以基于形状的检索系统中最关键的技术是如何表示图像中物体的特有的外在特征和如何对提取出的形状特征进行特征匹配,目前常用的描述形状特征的方法主要包括:矩描述法、边界描述法和几何参数法。以前表示形状特征的常用方法有链码、曲线、傅里叶描述子和B样条曲线等6。后来又出现了小波描述逼近法和超二次曲线法。形状特征的提取需要人工对图像进行分割、提取目标,就目前的发展状况,还没有实现对形状特征的自动提取。而人眼对颜色和纹理特征比较敏感,提取方法也相对比较简单,所以在目前的检索系统中使用最多的底层特征是颜色和纹理特征。3.基于综合特征的CBIR为了结合各个底层特征的优点,本文同时提取图像的颜色、形状和纹理三种特征结合为一个综合特征,并实现结合权重的自定义。3.1 颜色特征在颜色特征方面,为减小运算量,采用颜色矩作为检索的特征,分别提取被检测图像和数据库中图像的一、二、三阶矩。由于HSV颜色空间的色调、饱和度、明度与人眼对颜色的主观认识相对比较符合,与其他颜色空间相比HSV空间能更好的反映人类对颜色的感知,所以本文采用HSV颜色空间下的颜色矩作为颜色特征。使用曼哈顿距离进行颜色矩相似度度量。颜色信息集中在图像颜色的低阶矩中,主要是每种颜色分量的一阶矩(均值)、二阶矩(方差)、三阶矩(斜度),可以有效地表示图像中的颜色分布。三个颜色矩的数学定义如下:其中表示像素的颜色值为的概率,为图像中像素点的个数。若用表示两幅图像,则它们的矩的距离公式为:其中,是指定的加权洗漱,一般要设置为,提高了平均颜色的比重。提取到待匹配图和数据库图的颜色矩后,利用曼哈顿特征进行度量,即可得到颜色特征的相似性向量。3.2 形状特征本文利用形状不变矩作为图像检索的形状特征。利用目标区域所占的区域的矩作为形状描述参数是常用的形状描述方法。矩不变量由于具有不随图像的位置、大小和方向而变化的特点,对于提取图像中的形态特征来说,是一个非常有效的工具。区域的阶矩定义为: 其相应的中心距定义为: 其中, 即重心坐标。是目标区域灰度质心。的归一化阶中心矩定义为: 其中 下列7个二维不变矩是由归一化的二阶和三阶中心矩得到的。它们对平移、旋转、镜面以及尺度变换具有不变性:此组不变矩不受平移、旋转以及大小比例改变的影响。提取待匹配图片和数据库图片的不变矩特征后,再利用曼哈顿距离进行相似性度量,即可得到形状特征的相似性向量。3.3 纹理特征由于图像检索的数据库一般比较大,如果直接对整幅图的纹理特征进行提取和分析,运算量将会非常大。所以本文先对图像进行分割,然后再对分割后的图像进行基于傅立叶描述子的纹理检测和纹理特征提取,以减少运算量。3.3.1 图像预分割为了减小运算量,突出图像的主要部分,我们在进行纹理特征提取之前对图像进行预分割。通常认为,图像特征主要体现在大连通域处,我们基于这个原理进行分割。首先将RGB图像二值化,进行形态学处理包括开运算和闭运算后,进行连通域分析,取最大的连通域作为目标区域进行纹理特征的检测。3.3.2 在离散情况下,设边界上的点组成的有序点集可表示为一个复数序列对其进行离散傅里叶变换为:傅立叶描述子的反变换为:从上式可以看出离散傅立叶变换是一个可逆的线性变换,所以在这个过程中信息既没有增加也没有减少。傅立叶描述子将目标放在频域进行分析,得到的目标频谱中低频分量代表物体的宏观形状属性,而高频分量则可以代表物体的细节特征,某些情况下即纹理特征。3.3.3 纹理特征提取与检索我们取图像中最大连通区域作为傅立叶描述子处理的目标区域,但是由于二值化后连通域内部的点已经没有频率分析的意义。所以,我们提取最大连通域的边界,只对边界的有序复坐标做傅立叶描述子分析,得到图像的纹理特征。图1 图像预分割边界纹理分别对图1的边界进行长度为256点的傅立叶描述后,得到其频谱图如图2。图2 两纹理图傅立叶描述子比较可以看出代表形状的低频分量占据了很大的能量,利用这样的特征向量在进行相似度度量时,纹理特征所占的比重会远小于形状特征,而且直观上看,两者的特征很难进行区分。所以我们去除频谱中的低频分量(去掉前15个点),只保留频谱中的高频分量,得到如下图所示的频谱图:图3两纹理图傅立叶描述子高频分量部分可见两者的高频纹理特征具有较大的区别性。同样利用度量,即得到纹理特征的相似性向量。3.4 综合特征我们综合颜色特征、形状特征、纹理特征三种特征进行检索,设三种特征的相似性向量分别为:,和,且在检索时分别赋予权重、和,综合相似性向量为:利用作为相似度的判据,即可得到图像相似度检索的结果。4 图像检索系统设计本文在Matlab平台上设计了基于三种特征综合的图像检索系统,设计界面如图4所示。图4 检索系统界面由于采用了三种特征进行综合的图像检索,运算时间较长,所以在655副图像的大数据库中随机抽取了24副图片作为小数据库,存放在程序目录下的Pic文件夹中,4.1 界面功能介绍4.1.1 图像文件路径设置在这一区域输入图像文件的路径,默认路径为程序目录下的“Pic”文件夹。图5 设置路径区域4.1.2 选择待匹配图像图6 选择待匹配图片通过“选择待匹配图像”的下拉菜单选择待匹配的图像,选择后即显示在下方区域。4.1.3 自定义权重图7 自定义权重区域在这一区域进行综合特征权重的自定义,可以通过滑动“Slide”进行设置,设置值会显示在后面的矩形框中,也可以在矩形框中输入权值,权值范围为0-1。图8 自定义权重示意4.1.4 待匹配图性质检测图9 待匹配图性质检测这一区域可以检测待匹配图的一些性质,包括HSV颜色空间三通道的颜色直方图,利用分水岭算法实现的边界检测,以及在纹理特征部分提取的纹理特征傅氏描述。图10 待匹配图颜色直方图图11 待匹配图边界图图12 待匹配图纹理傅氏描述子4.1.5 检索结果显示选择好待匹配的图片,并设置好权重后,单击“开始检索”按钮,即开始进行检索。图13 检索过程示意图等待进度结束后即程序运行完毕,得到检索结果如图14所示。由于只是在小数据库内进行检索,因而除了第一相似图外,其他图像相似度并不很高。图14 检索结果示意图4.2 检索示例以下是几个在此系统上进行图像检索的示例。图15 检索结果示意图1图16 检索结果示意图2图17 检索结果示意图3图18 检索结果示意图44.3 检索系统使用说明和注意事项4.3.1 使用注意事项1目前仅支持24副图片下的检索,如果想增加数据库数量,请在对应文件夹内按名称命名顺序依次增加,“25.jpg、26.jpg、”,并在GUI程序Run.m中“开始检索”按钮的回调函数(即function pushbutton_Start_Callback)中将图片数量变量num的取值进行对应修改。2需要先设置图片路径。如果在程序目录下的“Pic”文件夹下,则无需修改。3检索前需选择待匹配图片,否则将会提示:4设置三种特征的权重必须为0-1之间的数字,不能超过这个范围或者为其他字符,否则将会提示:5进行待匹配图性质显示时,要先选择需要显示的性质,否则将会提示:4.3.2 子程序说明1程序主目录下的“Pic”文件夹存放了24副图片,作为图像检索的数据库;2hsvfeature.m ,提取HSV颜色空间的颜色矩特征的子程序;3Shape_7_moment.m ,提取图像不变矩的子程序;4Watershed.m ,基于分水岭轮廓检测的图像轮廓特征提取子程序,但是由于检索效果不好,所以没有采用到综合特征中去;5Fourier_texture2.m ,基于傅立叶描述子的纹理特征提取子程序。5 参考文献1 王向阳. 一种基于彩色边缘综合特征的图像检索算法J. 模式识别与人工智能, 20102 纪敏.MPEG-7颜色、纹理和形状描述子J.计算机工程与应用,2004,40(26):44-473 李向阳.基于内容的图像检索技术与系统J.计算机研究
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招38人!2025年湟中区面向社会公开招聘社区工作人员历年真题汇编带答案解析
- 2026辽宁大连瓦房店市教育系统自主招聘教师58人历年真题库附答案解析
- 若尔盖县2025年公开招聘社区工作者(24人)备考题库及答案解析(夺冠)
- 2025华夏银行成都分行社会招聘(11月)参考题库附答案解析
- 2025中能建数字科技集团有限公司专业人才社会招聘32人历年真题库附答案解析
- 2025重庆巴南区人力资源和社会保障局招聘公益岗2人历年真题库带答案解析
- 2025北京国专知识产权有限责任公司招聘4人(二)备考题库附答案解析
- 2026年消防条令纲要知识考试题库及完整答案(典优)
- 2025年11月沈阳市医疗卫生系统面向部分医学院校应届毕业生公开招聘175人历年真题汇编附答案解析
- 2025保山市昌宁县珠街彝族乡卫生院编外人员招聘(2人)模拟试卷附答案解析
- 2025年南宁铁路机考题库及答案
- 煤矿重大灾害治理顶层设计方案
- 黄斑变性的护理
- 部编人教版小学4四年级语文下册(全册)课件集【新教材】
- 内蒙古乌兰察布市基层诊所医疗机构卫生院社区卫生服务中心村卫生室地址信息
- 文本14会电会审
- 田径场地设计与画法
- 差压式气密检漏仪的设计与性能分析论文
- 车用驱动电机原理与控制基础PPT课件(200页)
- 辽宁省汽车维修管理制度汇编
- 线材与端子拉力测试标准
评论
0/150
提交评论