已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,3基于内容的图像检索,问题的提出当我们的数字图像数量很多时(达到上千张、甚至上百万张),如何快速有效地找到需要的数字图像是一项有挑战性的工作。从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-basedImageRetrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等那么,如何利用计算机辅助检索图像呢?(与文本检索不同,图像与图像之间的比较是一个复杂的问题),2,3基于内容的图像检索,传统的图像检索方法通过图片的元数据或标引文字进行检索,例:图像元数据宽度:210高度:172主题:玻璃瓶与草背景:淡灰内容:6个有草的玻璃瓶3个瓶有红色液体3个瓶有透明液体,3,4,3基于内容的图像检索,传统的图像检索方法标引文字的检索的局限性是:图片的标引文字主要靠人工输入。对大数据量的场合(如Web资源、数字图书馆等)应用困难标引文字无法精确完整的刻画图片内容文字描述一维线性的媒体,而图片是二维非线性的媒体生成或利用元数据的过程实质是在两种差异很大的媒体间的翻译过程,有很大的随意性和信息损失,5,3基于内容的图像检索,基于内容的图像检索方法一图胜千言,考虑绕过这些转换(翻译)过程直接利用图片去检索图片,这就是基于内容的检索的出发点基于内容的图像检索的英文缩写:CBIRContent-BasedImageRetrieval到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索。,6,综合利用颜色、纹理、形状特征,逻辑特征和客观属性等,实现图像检索,7,3基于内容的图像检索,基于内容的图像检索方法大量原型系统已经推出,技术正在逐步走向成熟,已经出现一些商用系统。商用系统如:IBM的QBIC、Virage的VIRImageEngine。原型系统如:UCB的BlobWorld(形状)、Stanford的系统(颜色)。检索效果仍需改进。,8,3基于内容的图像检索,相似图片搜索,9,10,11,相似图片-百度,12,3基于内容的图像检索,商品图像搜索1.Like(被Google收购)2.淘淘搜3.Ebay,13,3基于内容的图像检索,移动图像搜索和识别1.GoogleGoggles2.Kooaba3.百度识别(Mobile),14,3基于内容的图像检索,15,3基于内容的图像检索,OCR识图,16,3基于内容的图像检索,基本原理基于内容的图像检索,利用图像本身固有属性,如颜色,形状,纹理,空间布局等来表达和检索图像。,17,18,3基于内容的图像检索,基于内容的图像检索系统基于内容的图像检索系统的4种检索方式:1)利用图片样本检索(QueryByExample)可以由用户准备图片样本可以在图片库中浏览系统给出各类代表图像从系统中随机抽取(检索是一个逐步求精的过程),19,基于内容的图像检索系统基于内容的图像检索系统的检索方式2)利用草图检索3)利用图像特征模板检索如颜色特征模板,指定各种颜色的比率等。4)以上方式结合先用草图或指定特征获取图片样本,再用图片样本检索,20,左侧的就是一个颜色模板,举例:用颜色特征模板进行检索,21,3基于内容的图像检索,基于内容的图像检索的必要性三种层次特征描述图像内容:低层特征:颜色、纹理和形状等特征中层特征:图像中的对象、背景以及空间关系语义特征:场景、事件、情感等图像特征分类:颜色、纹理、形状和空间关系,22,3.1基于颜色特征的图像检索,定义:颜色是一种全局特征,描述了图像或图像区域所对应景物的表面性质。,颜色特征优势和缺陷是图像物理特征中最直接的视觉特征,颜色特征非常稳定,而且颜色特征计算简单。不能很好的描述对象的空间特征颜色特征描述方法直方图法、累积直方图法、局部累积直方图法、颜色布局法、中心矩法等。,23,3.1基于颜色特征的图像检索,使用颜色特征进行图像检索需要解决三个主要问题:选择合适的颜色空间描述颜色特征、表示成向量以便建立索引和相似性匹配、计算距离显示结果;颜色空间模型颜色直方图,其检索模型,存在问题及改进颜色矩:一阶矩、二阶矩和多阶矩;颜色聚合向量颜色相关图。,24,颜色直方图的相似性,25,内容匹配的主要策略,三种主要颜色匹配策略颜色比率匹配颜色布局匹配色彩空间匹配,26,3.1基于颜色特征的图像检索,1)颜色比率匹配两幅相似的图像各自所包含的各种颜色的比率是相似的,因此可以利用描述颜色构成比率的特征进行检索。如彩色直方图、累积直方图、主色调等。,27,3.1基于颜色特征的图像检索,颜色比率匹配举例2:从1万张图片中检索的结果,28,3.1基于颜色特征的图像检索,颜色比率匹配举例2:从1万张图片中检索的结果,29,3.1基于颜色特征的图像检索,2)颜色布局匹配颜色比率匹配法的缺陷:只能描述颜色的全局统计信息,不能描述颜色的空间分布颜色布局匹配通过比较图像与样本的颜色分布位置的相似程度进行匹配。这类匹配选取的特征如图像的分块直方图、颜色对距离直方图等。,30,31,3.1基于颜色特征的图像检索,彩色布局匹配举例1:从1万张图片中检索的结果,32,3.1基于颜色特征的图像检索,彩色布局匹配举例2:从901张图片中检索的结果,33,3.1基于颜色特征的图像检索,3)色彩空间匹配色彩空间对特征有重要影响,如在HSV空间中可以忽略亮度信息的影响。一般来讲,在HSV空间中利用分块累积直方图的检索效果较好,34,3.2纹理特征匹配,4.3.2纹理特征匹配纹理是一种不依赖颜色或者亮度并能反映图像中同质现象的全局性特征,它描述了图像或图像区域所对应景物的表面性质。,35,3.2纹理特征匹配,4.3.2纹理特征匹配纹理图像的灰度分布具有某种周期性,即便灰度变化是随机的,也具有一定的统计特性和规律性。基本属性:粗糙度对比度方向度线像度规整度光滑度,36,2.纹理特征匹配1)基本原理:粗糙度反映纹理的尺寸,37,2.纹理特征匹配1)基本原理:对比度反映纹理的清晰度,38,2.纹理特征匹配1)基本原理:方向反映实体是否有规则的方向性。,39,包含多个纹理区域的图象,纹理是以像素的邻域灰度空间分布为特征;是图像强度局部变化的重复模式,40,一些典型的纹理图象,41,2)匹配方法:基于统计特征的纹理分析共生矩阵,心理学特征等基于信号处理的纹理分析小波变换,Gabor滤波器等基于结构特征的纹理分析基于模型的纹理分析Markov随机场模型等,2.纹理特征匹配,42,2)匹配步骤:从上述纹理分析的方法中得到一组描述纹理的特征量;提取这些纹理特征的数字特征(如期望、方差等),将它们组成归一化的特征向量;在某种距离空间内(如欧氏距)寻找给定特征向量的最近匹配。,43,基于统计特征的纹理特征提取,用于测量灰度级分布随机性的一种特征参数叫做熵,定义为:用灰度级共生矩阵还可以定义能量特征、对比度特征和均匀度特征:,44,一个基于统计特征的纹理匹配的例子,45,一个基于统计特征的纹理匹配的例子,46,基于结构特征的纹理分析,纹理的结构分析法分为三步:图像增强;基元提取;计算纹理基元的特征参数及构成纹理的结构参数,47,纹理特征匹配举例1:从1万张图片中检索的结果,48,纹理特征匹配举例2:从1万张图片中检索的结果,49,4.3.3形状1)基本原理形状是刻划物体的本质特征之一,通常与目标联系在一起,可以针对面积(可用象素点的个数计算)、环形性(即周长*周长/面积,周长也用象素点的个数表示)、主轴方向、偏心率、圆形率、连通性、正切角等形状特征进行匹配。形状通常分为两种类型:一类是基于轮廓特性的,如傅里叶描述一类是基于区域特性的,如几何不变矩,50,形状的描述方式:通过全局形状性质来比较两个形状;形状直方图边界匹配轮廓匹配通过局部形状性质来比较两个形状;形状参数偏心率球状性等,51,52,53,匹配方法举例:边界匹配,两种表示边界的方法象素序列表示法:将轮廓表示成沿轮廓曲线长度的函数。多边形近似法三种边界匹配方法FourierDescriptors多边形匹配法弹性匹配,54,匹配方法举例:边界匹配,55,匹配方法举例:边界匹配,56,体现图内对象之间的关系称为空间关系;空间关系的分类:拓扑、方位和距离等;基于空间关系的图像检索,首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域;然后定义拓扑、方位、距离等各种空间关系;最后依据这些定义提取出每幅图像的空间关系向量。,4.4.4空间,57,空间关系匹配,4.4.4空间检测出图象中所包含的物体后,可以确定它们之间的空间关系,如拓扑、方位、距离等空间关系,然后可以利用这些空间关系进行图象检索。,58,59,基于空间关系特征检索的步骤,将图像数据库中的所有图像映射为多维特征空间的点;对应每种相似性准则来定义一个距离度量;建立多维特征点的索引;将所查询的图像映射到特征空间中的一个点或一个区域,然后选取与查询点靠近或者位于查询区域范围内的点;作为检索结果,返回选择点所对应的图像。,60,不同图像特征的特点总结颜色特征:对图像的方向、大小等变化不敏感纹理特征:是区域中的统计特征,具有旋转不变性形状特征:与目标相关空间关系特征:不同特征的比较,61,4.3.2相似度比较颜色、纹理、形状等图像特征被提取出来后,形成特征向量,就可以利用这些特征向量来表达对应图像。相似度度量方法:闵可夫斯基距离二次型距离马氏距离库尔贝克-莱博乐散度杰弗里散度,62,4.3.3索引方案建立图像特征向量具有较高的维度,因此不适合传统的索引结构,建立一个高效的索引方案前,通常需要降维。降维方法:主分量分析K-L变换,63,4.3.4用户交互图像检索实现的是“人机交互、相互反馈”的方式,图像检索系统包括查询说明部分和结果浏览部分。查询说明:类别浏览概念查询草图查询示例查询局部查询,64,GoogleGoggles,名片,65,条形码,66,QBIC,允许使用颜色,颜色比例,纹理和草图以及关键词等视觉信息查询大的数据库.在它的新系统中,基于文本的关键字与基于内容的相似性结合在一起;网站:,67,VisualSEEK和WebSEEK,VisualSEEK和WebSEEK都是由哥伦比亚大学开发的一种实验性系统。采用代理自动搜索可视信息并对其进行分类,目前已分类的图像有66万多幅,形成了一个极富创新性的图像目录。主题分类是它的主要优点。WebSEEK的检索途径有三种,一是使用关键词进行自由全文检索,但不支持短语检索;二是利用不同的类目等级进行主题浏览;三是在检出图像的基础上利用其可视属性进一步检索。,68,Virage,Virage公司的产品它为图像管理提供了一个开放的框架Virage引擎表达了图像原色等视觉特征,原色可以是非常一般的,如颜色,形状和纹理,或针对具体域的,如面部征和癌细胞特征网址:,69,Photobook,它是媒体实验室开幕的一套交互式图像数据库浏览和查询的工具它包括三个子部分,分别用于抽取形状,纹理,面部等特性用户可以在每个子部分中按照对应的特征进行查询;在最近版本ourEyes中,icard提出了在图像注释和检索中包括人这一提出建立在没有一种单独的特征可以很好地对图像建模,而且人的理解又是主观的这样一种观测之上因此他们提出了模型集(socie
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农民夜校移风易俗课件
- 体位引流护理的标准化流程
- 甘肃电器科学研究院2025年度聘用制工作人员招聘备考题库参考答案详解
- 2025年国家空间科学中心复杂航天系统电子备考题库技术重点实验室复杂系统研制与开发人员招聘备考题库及参考答案详解
- 2025年江西一地招聘辅警52名备考题库及参考答案详解1套
- 国家知识产权局专利局专利审查协作北京中心福建分中心2026年度行政助理招聘备考题库带答案详解
- 2025年湛江市坡头区城市管理和综合执法局公开招录编外人员备考题库及一套完整答案详解
- 2025年基因检测服务市场可行性研究报告
- 2025年基因检测技术商业化可行性研究报告
- 持续优化合同范本
- 2025版小学语文新课程标准
- 2025年河北省中考化学真题 (解析版)
- 【个案工作介入青少年厌学问题研究12000字(论文)】
- 村级事务监督工作报告
- T/TAC 10-2024机器翻译伦理要求
- 兄妹合伙买房协议书
- 家庭农场项目可行性报告
- 施工升降机防护方案
- 温室大棚可行性报告修改版
- JISG3141-2017冷轧钢板及钢带
- 瑞加诺生注射液-药品临床应用解读
评论
0/150
提交评论