基于内容的图像搜索.doc_第1页
基于内容的图像搜索.doc_第2页
基于内容的图像搜索.doc_第3页
基于内容的图像搜索.doc_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要在人们获取的各类信息中,听觉信息占20%,视觉信息占60%,其他信息占20%。由此可见,图像信息在人们的信息生活中占据着重要的地位。如何更快,更好地获取自己所需要的图像信息,一直是我们亟待解决的一个重要课题。随着Internet的快速发展,越来越多的人期望从这些信息中获得自己需要的图像信息。然而,面对这么多的图像信息,如何获得自己需要的东西,并非简易的事,于是,基于内容的图像搜索技术应运而生。关键词:基于内容的图像检索;视觉特征;网上信息搜集;图像搜索的定义基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。通过基于内容的技术检索Web图像,首先需要从Web中剥离图像,组成图像集,对图像集中的各个对象进行基于内容的特征分析、相似度匹配。 立足于图像内容,对图像进行分析和检索。相比而言,尽管图像检索已经出现了诸如直方图、颜色矩、颜色集等多种表征图像特征的方法,但是要突破对低层次特征的分析,实现更高语义上的检索,实现难度大,进展慢。不过,基于内容的图像检索建立在多媒体信息的内容语义上,能够更为客观地反映媒体本质的特征。基于内容的图像检索系统一般包括图像处理模块、查询模块、对象库和特征库和知识库图像搜索的发展自2 0 世 纪90年代初以来,基于内容的图像检索技术作为一门有别于基于关键词的图像检索的新兴信息检索技术,受到普遍关注,逐渐成为一个热门课题。该项检索技术由系统对图像进行特征描述、提取与识别,克服了传统的基于关键词检索中人工注解图像的主观性、不准确性和工作量大的缺陷。从早期对罪犯指纹的识别与管理、面貌特征的识别与管理侧等专用系统的研究开始,经过相当长一段时间的发展,在理论上和技术上做了不少探索,产生了许多较成熟的基于图像特征的检索算法(如基于颜色特征检索的颜色累加直方图法和颜色集法、基于纹理特征检索的Tamura纹理法、灰度共生矩阵法和马尔可夫随机场模型法、基于形状特征检索的形状不变矩法和傅里叶形状描述符法等),并相应地开发出一些有价值的通用系统。 譬如,国外较著名的有:美国Ramesh Jain等人设计的,视觉信息管理系统VIMS (Vision Information Management System);IBM A l ma den研究中心开发的“基于内容检索系统QBIC;Virage公司开发的Virage, Excalibur技术公司开发的RetrievalWare, MIT媒体实验室开发的Photobook等。国内较有代表性的有:中国科学院计算技术研究所和北京图书馆联合开发的“基于特征的多媒体信息检索系统M工RESc8 ,清华大学开发的Internet上静态图像的基于内容检索的原型系统,浙江大学开发的Photo Navigator, Photo Engine等。图像搜索算法研究纹理可认为是灰度在空间以一定的形式变化而产生的图案,可用来对图像中的空间信息进行定量描述,是真实图像的固有特征之一。在MPEG7中,图像的纹理描述符分为同质纹理、纹理浏览和边缘直方图。3.1同质纹理同质纹理对图像的用62个数值来表达,每个数值量化8bit。同质纹理包括强度均值、强度偏差、能量值、能量偏差等特征,抽取过程如下图所示。 图一(1)采用Radon变换和维Fourier变换,将图像转换到频率域。(a)Radon变换。Radon变换是一种直线积分的投影变换,某个角度口的沿着直线L(R,口)的线积分如下: 式中占是从Y轴沿逆时针计算,尺是直线与原点的距离,舡是图像函数。万()是delta函数,只在t=0点有”冲激”,即=1;在其它各处,函数值为零。delta函数具有广f(x)d(x一口)出=厂(口)的性质。po(R)是投影,它将一个2D图像分解为每个角度的lD投影。 (b)Fourier变换。不同方向的纹理具有不同的傅立叶频谱特征,所以可在图像的傅叶立域考察图像纹理的特性。投影Po(R)的一维Fourier变换为: (2)Gabor滤波。人的视觉系统对图像的观察是非均匀和非线性的,对频率的感知符合对数特性,在这一点上Gabor变换最符合人类的视觉机理。Gabor变换可将图像分解为一系列频道,提供纹理的多尺度、多方向性特征。MPEG.7同质纹理描述符把图像的频率空间在角度方向上按30度角等分,即,其中r是角度索引,在径向上用以二分之一等比划分(分5个等级),划分的频率区域称为特征频道(G),共有30个特征频道。在径向上,特征频道的中心频率为,s0,1,2,3,4),其中s是径向索引,COO是最高中心频率34。特征频道的频道径向宽度为,sO,l,2,3,4,其中且是最大带宽l,2。每个特征频道从最外边开始,从右到左、从高频率到低频率的顺序编号,特征频道表示为(G),索引卢。对频率分布进行多尺度多方向划分后,二维Gabor变换叠勺函数为:(3)计算强度均值、强度偏差、能量和能量偏差。(a)强度均值和强度偏差。强度均值表示图像像素强度的均值,强度偏差是图像像素强度的偏差。强度均值表示图像像素强度的均值,强度偏差是图像像素强度的偏差。(b)能量和能量偏差。根据频率分布和Gabor函数,第f特征频道的能量e。定义为:。能量是一个1维数组,用Energy表示,长度为30,即EnergyO,,Energy29。采用【4】的方法将每个特征频道的值统一量化成8bit。3.2 边缘直方图入眼对对象的边缘比较敏感,所以基于边缘来计算特征比较符合人的视觉特性。边缘直方图描述符描述局部图像区域中边缘的五种空间分布:垂直边缘、水平边缘、450边缘、1350边缘、无方向江苏省系统工程学会第十届学术年会边缘。抽取过程和5种边缘如下: (a)垂直方向边缘算子(b)水平方向边缘算子(c)450方向边缘算子(d)135。方向边缘算子(e)无方向边缘算子图2 五种边缘及算子(1)将原始图像分成4x4的不重叠子图,每个子图继续划分成若干个相同大小的图像块。(2)将每个图像块分割成2x2=4个像素块,将每个像素块视为一个像素,采用每像素块中所有像素的平均值表示一个像素块。(3)对每个2x2的图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论