(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf_第1页
(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf_第2页
(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf_第3页
(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf_第4页
(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(计算机软件与理论专业论文)基于纹理特征的图像检索技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 图像数据库的核心技术是图像检索。图像检索则是近年来海量信息处理面临 的“瓶颈”。基于内容的检索最具有本质性,已经成为当前国内外研究的热点。图 像检索技术的两大关键是图像特征的提取和相似性度量。在人类视觉属性中,纹 理作为基本的视觉特征之一,分布十分广泛。针对纹理的研究虽已经历了相当长 的时间,但对纹理的明确定义直至目前尚未出现,纹理应用于图像检索的时间也 是相对短暂的。基于纹理特征的图像检索是基于内容的图像检索研究中的前沿技 术。 本文分析、比较了经典的纹理特征提取方法和纹理模型,以及常用的相似度 计算方法,指出其各自的优缺点。而后,着重对纹理特征的提取和纹理特征相似 性的度量进行了深入研究。 本文运用g a b o r 基小波技术提取纹理特征。该方法融合了g a b o r 变换、小波 技术、多分辨率技术的优势,在不同的尺度和方向上获得纹理特征的信息,共同 构成纹理特征矢量。根据g a b o r 纹理特征在不同方向上能量分布的特点,对其进 行了改进,使得g a b o r 纹理特征具有了方向旋转不变性。 在纹理特征相似性的度量研究方面,提出了一种新的纹理相似度计算方法一 一基于聚类空间模型的纹理相似性度量。在该模型中,应用簇集结构,表示纹理 特征的分布属性。将g a b o r 纹理在特征空间中进行聚类处理,获得表现图像纹理 分布的主要聚集及其权值,构成簇集,以较少代价获得了更为简洁、明晰的纹理 表示:簇集之间的相似匹配,引入e m d 进行计算。深入研究了e m d 定义、特点、 计算理论、计算方法,并对e m d 作为度量的概念进行了数学证明,完成了聚类 空间模型的构建。 实现了一个原型系统,对本文提出的检索技术进行了仿真实验。针对单纹理 的图像检索,给出了与传统方法的比较结果;特别是对多纹理图像的检索,分析 了纹理分割给检索结果带来的负面影响。基于聚类空间模型,提出了一种无纹理 分割的部分匹配方法,避免了纹理分割可能带来的检索误差。实验结果表明,采 用本文提出的改进g a b o r 纹理特征以及基于聚类空间模型的相似性度量方法,进 行图像检索,与人类视觉认知的结果更趋一致,完全能够满足基于纹理特征的检 索要求。 关键词:纹理;特征提取;相似性度量;簇集;聚类空间模型;e m d a b s t r a c t t h ek e yt e c h n o l o g yf o rt h ei m a g ed a t a b a s ei st h ei m a g er e t r i e v a l ,w h i c hh a s b e c o m eab o t t l e n e c ko ft h em a s si n f o r m a t i o np r o c e s s i n g i nf a c t ,t h ec o n t e n t so f i m a g e sa r et h ei n b e i n go fi m a g er e t r i e v a l c o n t e n t - b a s e di m a g er e t r i e v a l ( c b i r ) h a s b e e na na c t i v er e s e a r c ha r e ai nt h ef i e l do fi m a g ep r o c e s s i n g f e a t u r ee x t r a c t i o na n d s i m i l a r i t ym e a s u r ea r et w om o s ti m p o r t a n ti s s u e so fc b i r i nr e a lw o r l d ,a l m o s te v e r y o b j e c th a si t so w nt e x t u r a lp r o p e r t i e s e v e r y o n ec a nr e c o g n i z et e x t u r e ,b u ti ti sm o r e d i f f i c u l tt ob ed e f i n e d t e x t u r ea sap r i m i t i v ev i s u a lc u eh a sb e e ns t u d i e df o ro v e r t w e n t yy e a r s ,b u tt h ea p p l i c a t i o n s o ft e x t u r ea n a l y s i st o i m a g ed a t a a n di m a g e r e t r i e v a lh a v eb e e nv e r yl i m i t e dt o - d a t e i nr e c e n ty e a r s ,t e x t u r e b a s e di m a g er e t r i e v a l h a sa l r e a d yb e c o m eah o tt o p i ci nc b i r w ef i r s t l yr e v i e wa n dc o m p a r ed i f f e r e n tm e t h o d so ft e x t u r ef e a t u r ee x t r a c t i o n a n dt e x t u r em o d e l s ,a n dc a t e g o r i z es o m ec o m m o ns i m i l a r i t ym e a s u r e s ,s h o w i n g s t r e n g t h sa n dl i m i t a t i o n so fe a c hm e t h o d o u rm a i nr e s e a r c hw o r ki st os t u d yw h a ti s t h ee f f e c t i v et e x t u r ef e a t u r ea n dh o wt oa c c u r a t e l ym e a s u r et h es i m i l a r i t i e sb e t w e e n t e x t u r ei m a g e s i nt h i st h e s i s ,w ep r o p o s et h eu s eo fg a b o rw a v e l e tf e a t u r e sf o ri m a g er e t r i e v a l t h i sk i n do ft e x t u r ef e a t u r e si n t e g r a t e st h ea d v a n t a g e so fg a b o rt r a n s f o r m ,w a v e l e t a n dm u l t i r e s o l u t i o n at e x t u r e ,t h e n ,i sr e p r e s e n t e db yav e c t o ro fv a l u e s ,e a c h c o r r e s p o n d i n gt o t h ee n e r g yi ns p e c i f i e ds c a l ea n do r i e n t a t i o ns u b b a n d w ea l s o p r o p o s eas i m p l em e t h o dt oi m p r o v et h eg a b o rt e x t u r ef e a t u r e s d e p e n d e do nt h e c h a r a c t e r i s t i co ft o t a le n e r g yf o re a c ho r i e n t a t i o nw em a k eac i r c u l a rs h i f to nt h e f e a t u r em a pt os o l v et h er o t a t i o nv a r i a n tp r o b l e ma s s o c i a t e dw i t hg a b o rt e x t u r e f e a t u r e s s i m i l a r i t ym e a s u r eo ft e x t u r ef e a t u r e si st h eo t h e ri m p o r t a n t c o n t e n ti nt h i st h e s i s w ep r o p o s ean o v e lm e t h o dt om e a s u r es i m i l a r i t yo ft e x t u r ef e a t u r e s ,w h i c hw ec a l l e d a sc l u s t e rs p a c em o d e l ( c s m ) i nc s m ,t h es i g n a t u r e s ,i n s t e a do fh i s t o g r a m s ,a r eg e t b yc l u s t e r i n ga l g o r i t h mt o f i n dd o m i n a n tc l u s t e r sa n dt h e i rw e i g h t si nt h ef e a t u r e s p a c e ,a n du s e dt or e p r e s e n tt h ef u l ld i s t r i b u t i o n so fi m a g et e x t u r ei nac o m p a c tw a y t h ee a r t hm o v e r sd i s t a n c e ( e m d ) i sa p p l i e dt om e a s u r es i m i l a r i t i e sb e t w e e nt e x t u r e s i g n a t u r e s w ed o ac o m p r e h e n s i v es t u d yo nt h ee m d ,i n c l u d i n gi t sd e f i n i t i o n , p r o p e r t i e s ,c o m p u t i n gt h e o r e t i cb a s i sa n da l g o r i t h m w ep r o v et h ee m di s am e t r i c i i a n dc o n s t r u c tt h ec s m s u c c e s s f u l l y w ed e v e l o p e dad e m os y s t e ma n df i n i s h e de x p e r i m e n t so nt y p i c a lt e x t u r ei m a g e d a t a b a s ew i t ho u rt e c h n o l o g yo ft e x t u r e r e t r i e v a l 。s p e c i a l l ya n a l y z i n gt h en e g a t i v e e f f e c t so ft e x t u r es e g m e n t a t i o nt om u l t i p l et e x t u r ei m a g e sr e t r i e v a l ,b a s e do nc s m , p a r t i a lm a t c h e si sa p p l i e dt od om u l t i - t e x t u r ei m a g e sr e t r i e v a lw i t h o u ts e g m e n t a t i o n s oa v o i d i n gt h es e a r c h i n ge r r o r s ,w h i c ha r i s ef r o ms e g m e n t a t i o n o u re x p e r i m e n t a l r e s u l t sa r ec o n s i s t e n tw i t hh u m a np e r c e p t i v i t ya n df u r t h e rs h o wo u rm e t h o d o f t e x t u r e b a s e di m a g er e t r i e v a li ss a t i s f i e dt h ed e m a n d sf o ri m a g er e t r i e v a l k e yw o r d s :t e x t u r e ;f e a t u r ee x t r a c t i o n ;s i m i l a r i t ym e a s u r e ;s i g n a t u r e ;c l u s t e rs p a c e m o d e l ;e m d 1 1 1 插图索弓 1 1 传统的图像检索过程1 1 2 基于内容的图像检索过程2 3 1g a b o r 滤波器的空间域和频率域1 7 3 2g a b o r 函数的实部和虚部1 8 3 3g a b o r 滤波器中相应的半峰幅值的周期1 9 3 4 方向角度为0 时滤波的半幅周期2 0 3 5 不同方向的两个相邻滤波的半幅周期2 1 3 6g a b o r 小波的实部和虚部2 2 3 7 纹理图像及其能量分布2 2 3 8 应用改进g a b o r 纹理特征获得的检索结果2 3 3 9 提取g a b o r 纹理特征的流狸2 5 4 1 二维空间中的e m d 实例2 9 4 2 单纯形法的可行域3 1 4 3 运输问题单纯形法的求解过程3 2 4 4 随机取自v i s t e x 的1 0 幅单纹理图像3 5 5 1 实现的原型系统界面3 7 5 2 原型系统的检索流程3 8 5 3 单纹理图像检索实例1 4 0 5 4 单纹理图像检索实例2 4 1 5 5 检索效果对比曲线4 1 5 6 多纹理图像检索实例4 3 5 7 自然图像检索实例1 4 4 5 8c i r e s 的检索结果4 5 5 9 自然图像检索实例2 4 6 i v 图图图图图图图图图图图图图图图图图图图图图图图图 附表索引 表4 1 运输表3 0 表4 2 计算e m d 的运输表3 2 表4 3 图4 4 中各纹理图像之间的e m d 相似距离3 6 v 湖南大学 学位论文原创性声明 本人郑重声圳j :所呈交的论文是本人在导师的指导下独立进行研究所 取得n 勺研究成果。除了文中特别加以标注引用的内容外,本论文卅i 包含任 们其他个人或集体已经发表或撰写的成果作品。对本文的i j l 究做f l 重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律f j 粜山水人承担。 作者签名:黄甬矗囊l i i i :枷s 年f 月4 曰 学位论文版权使用授权书 本! 学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向l 到家有关部门或机构送交沦文的复印件和电子版,允许论文 被务l g l 借阅。本人授权湖南大学叫以将本学位论文的全部或部分内容编 入仃天数扔j 进行榆索,j - 以采用影印、缩印或扫描等复制手段保存和汇 编本、位沦义。 小学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密团。 作者签名 导师签名 ( 清在以一i :孝i i 应方框内打“”) 苣确k 加_ 落 f i 期:2 时年厂月i 2k 1 日期:乞缈年厂月1 6 曰 第1 章绪论 1 1 传统的图像检索技术 在当今的信息化时代,随着现代电子技术、计算机技术、网络通信技术和多 媒体技术的迅猛发展,大量的数字媒介被用来记录信息,数字图像是其中一种用 以记录真实世界景象的重要方式。各行各业,包括在人们的社会生活中,各种内 容的大规模数字图像库不断出现。有效地建立、管理和充分利用图像信息库资源, 一直是国内外科技工作者关注的问题。能够有效地在庞大的图像库中搜索到需要 的图像信息,是进行数字图像管理和分析的关键技术。 图1 1 传统的图像检索过程 传统的图像检索方式是基于标注文本的信息检索技术,其工作流程如图1 1 所示。进行检索前,以人工处理的方式对每一幅图像进行文本标注,在一定限制 的字数范围内描述图像内容,形成描述图像的标注数据库,以标注为关键字,与 图像数据库关联起来;检索时,实际上只对图像标注数据库进行操作,进行文本 匹配,从而达到对相应图像进行检索的目的。目前,互联网上的图像搜索,如 g o o g l e 、百度等著名的搜索引擎,大多仍是采用这种对图像标注文本进行匹配检 索的方式。这种看似简单的图像检索方法,却存在重要的缺陷。首先,人工标注 的方式效率太低,无法满足如现在的w e b 网络资源、数字图书馆等大型多媒体信 息库的需求,要一张张图像的进行文本标注,耗费的时间无法预计。标注的速度 也无法跟得上图像数量增长的速度,如美国国家航空和宇宙航行局( n a s a ) 的 地球观测系统每天约产生1 t 的图像数据。其次,“一幅画胜过千言万语”,一 幅图像所包含的丰富信息,通常难以用几个关键词或短短几行文字完全表达。同 时,人工标注带有过多的主观色彩,实施标注的人员和图像的使用者、以及不同 的图像使用者之间,对一幅图像的理解也不会完全一致。例如,一幅被标注为“蝴 蝶在花丛中”的图像,无论是对花的种类感兴趣的用户,还是对蝴蝶的外形感兴 趣的用户,这样的标注都没有什么实际意义。 从上个世纪八十年代,基于内容的图像检索技术( c o n t e n t b a s e di m a g e r e t r i e v a l ,c b i r ) 引起人们的重视,以图像的视觉特征作为系统检索的依据,克 服了应用传统文本标记法进行图像检索的繁杂性、不确定性和主观性等缺陷,很 快成为了一个活跃的研究领域。 1 2 基于内容的图像检索技术 基于内容的图像检索( c b i r ) 技术由机器自动提取包含图像内容的可视化特 征:颜色、纹理、形状、轮廓、对象的位置和相互关系等,对数据库中的图像和 查询样本图像在特征空间进行相似匹配,检索出与样本相似的图像。c b i r 系统 的典型结构和一般流程如图1 2 所示。 图1 2 基于内容的图像检索的过程 作为传统标注文本数据库检索的拓展,相比之下,c b i r 主要具有以下特点: 传统的数据库中,符号数据,如标注文本或图像标号,可以用基本数据类型 精确地表示,检索匹配是精确匹配。而图像数据是一段二进制的数据流,对 图像进行像素和像素的精确匹配不科学。事实上,人对两个图像的相似和不 相似的判断是根据图像中所包含的内容,很难将其精确描述,因此内容的表 达也只能是近似的。 2 图像数据的表达不是单一的,多种表达方法并存是可能的。表达方法的选择 要依赖于特定的用户和特定的应用领域,随着识别技术的发展还可能采用更 新或更好的表达方法。 符号数据本身就具有语义信息,在符号数据命名的过程中就赋予了特定的信 息。图像中的内容本身并不包含语义,对图像的匹配主要是对图像内容特征 进行相似匹配。 由于对内容表达的不精确,一次检索得到的结果可能包含一些不相关的图像, 这种情况对于基于内容的图像检索在一定限度内是可以容忍的,但重要的一 点是在检索中不能将相关的图像漏掉。 对一个c b i r 系统进行性能评估的比较通用的两个准则是效率( e f f i c i e n c y ) 和 有效性( e f f e c t i v i t y ) ,分别代表检索的速度和查找与查询图像相似图像的成功率。 对检索效果的评价主要在于检索结果的正确与否,即检索的有效性,它主要使用 的是查准率( p r e c i s i o n ) 和查全率( r e c a l l ) 两个指标。查准率的含义是在一次查 询过程中,系统返回的查询结果中的相关图像的数目占所有返回图像数目的比例, 反映系统拒绝无关图像的能力。查全率则指系统返回的查询结果中的相关图像的 数目占图像库中所有相关图像数目( 包括返回的和没有返回的) 的比例,反映系 统检索相关图像的能力。用户在评价查询结果时,可以预先确定某些图像作为查 询的相关图像,然后根据系统返回的结果来计算查准率和查全率。这两个指标的 值越高说明检索方法的效果越好。 杏准塞:坌室些塑旦堡生塑差望堡塑塑旦 8 4 检索出的图像数目 查全率:坌室堂塑望堡塑羞望堡塑墼旦 图像库中所有相关图像数目 早期对c b i r 技术的研究重点大多放在视觉特征的提取,包括颜色、纹理、 形状、轮廓等。近年来研究者又引入了更多领域的知识:从知识表示的角度运用 人工智能领域的推理及神经网络技术来提取特征和分类图像;构造面向对象的 c b i r 系统;开发面向网络的c b i r 系统;并行c b i r 技术也被提上议程。c b i r 技术已经成为融合了模式识别、人工智能、图像处理等多个知识领域的研究热点, 能够并已开始广泛应用于w w w 上的图像搜索、图像过滤、数字图书馆、视频内 容检索、预防犯罪( 指纹识别) 、军事、知识产权( 商标) 、建筑与工程设计、文 化遗产、医疗诊断、地理信息系统和遥感等多个领域。 1 3 基于内容的图像检索典型系统 基于内容的图像检索技术在国内外已经取得了不少成果。技术上各种新的方 法层出不穷,一些较为权威的、有影响力的学术期刊已有专栏介绍,s p i e ( t h e 3 i n t e r n a t i o n a ls o c i e t yf o r o p t i c a le 1 i g i n e e r i n g ,国际光学工程学会) 每年都有专门关 于基于内容图像检索的国际会议论文集,并且许多原来研究计算机视觉的科研小 组都开展了基于内容图像检索方面的研究。应用上已经取得初步成果并获得了社 会各界的广泛关注和支持。国内外一些大学在这方面也已经展开了相当多的研究。 目前已经推出了许多知名的c b i r 原型系统“1 ,例如i b m 的o b i c 系统”1 , 哥伦比亚大学开发的v i s u a l s e e k 系统”,u i u c 大学开发的m a r s 系统,m i t 实 验室开发p h o t o b o o k 系统0 1 ,以及b e r k e l y 大学开发的c h a t b o t 系统“3 等。下面分 别对q b i c 、v i r a g e 和v i s u a l s e e k 作一些简要介绍。 o a i c 的系统结构由图像入库、特征提取、查询三部分组成。在图像特征方面, q b i c 提供了颜色、纹理、形状和手绘草图等索引方法,颜色特征使用的是6 4 位颜色直方图,纹理特征使用的是改进的t a m u r a 模型,形状特征采用了面积、 圆形度、离心率、及一组变换矩来描述。采用k l 变换以降低维数,再利用 r t 树建立索引。 v i r a g e 系统可分为四个层次,分别是图像表达层、图像对象层、领域对象层 和领域事件层。其中的图像先经过预处理,再进彳亍特征提取,并提供了四种 可视特征( 颜色、成分、纹理和形状) 检索,这些特征被称为“原语”。每种 特征属性被赋予0 到1 0 的权值。通过对不同单个特征空间中的距离赋予权重, 构成总特征空间中的复合距离,通过调节权重和检索的特征值,表达不同的 检索请求。通过颜色特性检索是最简单明了的,该软件对选出的基础图像的 色调、色彩以及饱和度进行分析,然后在图像库中查找与这些颜色属性最接 近的图像。成分( c o m p o s i t i o n ) 特性指相关颜色区域的近似程度。用户可以 设定一个或多个属性权值来优化检索。要达到最佳平衡度需要反复试验,但 检索过程还是相当快的。通过对四个属性权值的调整,显示出不同的检索结 果,根据相似度排序。 v i s u a l s e e k 图像查询系统是一种在互联网上使用的基于内容的检索系统。它 由图形用户界面、服务器应用、图像检索器和图像归档四部分组成,提供了 基于颜色和纹理的索引法,其中对整幅图像的颜色分布使用的是全局颜色直 方图,对区域颜色检索使用的是二进制颜色集。纹理特征采用的是基于小波 的提取方法。v i s u a l s e e k 提供了一套供人们在w e b 上搜索和检索图像及视频 的工具,已经在电子图书馆领域得到一些应用。 1 4 本文的研究重点 可视化图像特征的提取和图像特征相似度的比较、计算是c b i r 的两大关键 技术”1 。 在图像特征提取方面,颜色是最早被研究的图像特征,使用颜色直方图对图 4 像全局或局部的颜色特征加以分析和提取,具有简单、对图像大小和旋转变化不 敏感等优点,成为被研究和应用最广泛的图像检索特征。但颜色直方图的缺点是 对亮度、噪声敏感,计算量大,易于丢失颜色分布信息等。虽然有各种改进方法 不断出现,都还没有找到根本的针对颜色方面的解决方法。1 。另外,在颜色空间 r g b 、h s v 、l a b 的选择上,也是各有利弊,尚未达到共识。形状( 区域) 特征 起初一直被寄予很大的期望,被认为是最接近用户需求的匹配特征:用户只需勾 画自己所需图像的草图或目标轮廓,就能检索出符合要求的图像。但是,由于目 前计算技术发展所限,轮廓的提取较为困难,无论是采用傅立叶算子还是采用无 关矩,都有耗时过长、效果不佳的问题。另外,让一个普通用户,绘制一个所需 图像的轮廓,对用户的要求未免过高。 近年来,对纹理特征的研究越来越受到重视。纹理对颜色、光线变化的不敏 感性,以及纹理在自然世界中分布的广泛性,使得纹理已成为重要的图像特征类 型“。在上一节中介绍的诸多著名c b i r 系统都将纹理作为不可缺少的图像检索 特征。基于纹理的图像检索已经成为基于内容的图像检索领域中一个重要的研究 方向。本文以图像纹理特征作为主要研究对象,围绕基于纹理图像检索的两大关 键技术一一纹理特征的提取和纹理相似性的度量进行深入探讨,主要的研究内容 包括: ( 1 ) 分析了图像纹理的特点,以及基于纹理的图像检索技术的发展现状,并对现 有的纹理特征的提取方法和纹理特征相似度的计算方法进行了横向比较,总 结了各种方法优势与缺陷。 ( 2 ) 全面阐述了应用g a b o r 基小波技术提取纹理特征的方法。针对g a b o r 纹理特 征在方向上的能量分布特点,进行了改进,获得了具有旋转不变性的g a b o r 纹理特征;并对其中相关重要参数的选择进行了讨论。 ( 3 ) 在图像特征分布的表示方式上,通过对传统直方图结构的分析,针对直方图 的缺陷,以所获得的g a b o r 纹理特征为基础,提出了适合纹理的簇集结构, 用以表示图像纹理特征的分布属性。并对簇集结构的形成及其特点做了详细 介绍。 ( 4 ) 提出了一种新的纹理图像相似性度量方法,即基于聚类空间模型的纹理特征 相似度计算。与通用的用于相似度计算的矢量空间模型相比较,在聚类空间 模型中是对簇集之间的相近程度进行匹配,并通过对e m d 的定义、计算、 特点进行了深入地探讨,引入e m d 进行纹理特征簇集的相似度量。 ( 5 ) 有针对性的构建了典型的纹理图像库,使用前述纹理特征的提取方法和聚类 空间模型,设计了一个原型系统,进行纹理图像检索,并主要以“是否和人 类视觉认知相符”这一语义级的标准,对检索结果进行评价。对单纹理图像, 给出了本文检索方法与常用方法的性能比较。 ( 6 ) 重点研究了多纹理图像、自然图像的检索。考虑到当前尚不成熟的纹理分割 技术对检索结果的影响,本文基于对自然图像检索的查询特点,依靠聚类空 间模型进行相似性度量的优势,以部分匹配的方式,实现了无分割的多纹理 图像的检索。 1 5 论文结构 第l 章:绪论介绍了相关的研究背景、价值和目标,论述r 与本文相关的研究内 容的技术进展状况,并简要阐述了本文所要研究的重点内容。 第2 章:对纹理属性进行分析,围绕纹理特征的提取和特征相似度的比较两大关 键技术,详细介绍和比较了基于纹理特征的图像检索技术,包括经典的 模型和方法等。 第3 章:分析、研究应用g a b o f 基小波技术提取图像纹理特征的方法和计算,并 对所得的g a b o r 纹理特征进行了改进。 第4 章:提出了种新的纹理相似性度量方法一一基于聚类空间模型的纹理相似 度计算。在该模型的构建中,对纹理特征簇集,以及衡量簇集相近距离 的e m d 进行了全面地研究。 第5 章:应用前文阐述的检索技术,设计了个基于纹理的图像检索原型系统。 对检索技术中关键参数的选取进行了讨论。构建了纹理图像库,完成了 一系列针对性实验。对单纹理图像检索给出了性能比较。重点探讨多纹 理图像检索的特点,分析了纹理分割对柃索的负面影响,提出了无需分 割处理的多纹理图像检索。 结论:对全文的工作做出总结, 结论:对全文的t 作做出总结, 并对下一步的工作进行了展望。 并对下一步的工作进行了展望。 第2 章基于纹理的图像检索技术现状 2 。1 引言 纹理的概念最初起源于人类的触觉一一“对一个事物( 或物体) 表面的触感”, 这是人类身体肌肤的感觉。在此基础上,将人类视觉与此关联起来,人对纹理的 理解就不再局限于身体接触,而是成为了一个重要的视觉信息1 。在我们周围的 环境,纹理的分布十分广泛,也十分复杂。1 对于视觉上的纹理理解研究已经超过 了三十年,发展了包括随机场模型和多分辨率技术等,对纹理进行描述和分析的 各种技术,在纹理分割、纹理分类、纹理合成等多个方面都进行了有关的研究工 作“。尽管对纹理分析的研究历史比较长,但是真正将其实际应用到图像数据的 处理还只是在近若干年才开始的。 作为一个重要的、新兴的应用方向,针对大规模图像和视频信息进行基于内 容的图像检索是纹理分析的一个重要贡献。应用纹理作为视觉特征,人们可以在 图像库搜索到相似的图案( p a t t e r n ) 。例如,要查询“所有云层覆盖率低于百分之 二十的地球卫星图像”或者“从四川省的航拍图中寻找有竹林覆盖区域的图像”, 此类检索要求都需要通过纹理特征的提取和比较来完成。 2 。2 纹理特征的提取技术 与另一个基本视觉特征一一颜色不同,纹理体现的是一个区域的属性,而不 仅仅是一个点。对单独的点来说,是不存在纹理属性的。虽然每个人都能够辨识 纹理,但是很难给纹理下一个准确的定义,直到目前为止,还没有一个被所有研 究者认可的精确纹理定义。因此,图像的纹理描述及特征提取就成为了富有挑战 性的研究内容。 2 2 1 纹理描述 当前,通常比较粗略的可将纹理定义为:纹理是对图像的象素灰度级在空间 上的分布模式的描述,反映物体的质地,如粗糙度、光滑性、颗粒度、随机性和 规范性等“。纹理特征就是从物体图像中计算出一个值,对物体灰度级变化的特 征进行量化。通常,纹理与物体的位置、走向、尺寸、形状有关,但与平均灰度 级,即亮度,是无关的。 纹理的描述技术大体上可以分为三大类:统计法、结构法和频谱法“。”3 。 统计方法是最早的纹理描述方法之一。它又分为空间域方法和变换域方法, 7 包括白相关函数、纹理边缘、结构元素、灰度的空间共生概率( s p a t i a lg r a y t o n e c o - o c c u r r e n c ep r o b a b i l i t i e s ) 、灰度行程和自回归模型。统计方法将纹理描述为光 滑、粗糙、粒状等特征。基于直方图的纹理度量是典型的统计方法。由于在灰度 直方图中各个像素的灰度是独立进行处理的,不具有像素之间相对位置的信息而 受到限制。因此,研究图像的两个象素组合中灰度配置的情况时,不仅应考虑强 度分配,还应考虑具有相同强度值或近似强度值的象素位置,才能更好地表现纹 理特征。 结构方法就是假定纹理模式由纹理基元的空间排列组成,使用模式基元和特 定的排列规则来描述纹理。结构法研究的主要内容是基元及其空间关系。基元一 般定义为具有某种属性而彼此相连的单元的集合,属性包括灰度、连同区域的形 状、局部一致性等。空间关系包括基元的相邻性、在一定角度范围内的最近距离 等等。根据基元间的空间联系,纹理可以分为弱纹理或强纹理。进一步细分,可 以根据基元的空间共生频率来划分,也可以根据单位面积内的边缘数来区别。基 元也可以定义为灰度行程。 频谱方法的典型是对图像进行傅立叶变换,从傅立叶频谱成分的分布中来求 得纹理特征“。频谱分析技术是用区域自相关函数或傅立叶变换域的能量分布来 检测纹理的周期,包括计算峰值处的面积、峰值处的相位、峰值与原点的距离平 方、两个峰值间的相角差等手段。 2 2 2 纹理特征 对应上文中纹理描述方法的介绍,下面给出几个目前在图像检索中常用的经 典纹理特征: 2 2 2 1 灰度共生矩阵 二次统计量( s e c o n d o r d e rs t a t i s t i c s ) 的代表就是以灰度共生矩阵( g r a y l e v e l c o o c c u r r e n c em a t r i x ,g l c m ) 为基础的纹理特征计算。由于共生矩阵可以算是最 早、最为经典的方法,有必要作一些介绍。共生矩阵用两个位置的象索的联合概 率密度来定义,它不仅反映亮度的分布特性,也反映具有同样亮度或接近亮度的 象素之间的位置分布特性,是有关图像亮度变化的二阶统计特征。它是定义一组 纹理特征的基础。灰度共生矩阵被定义为从灰度为i 的点离开某个固定位置关系 d 一( d ,巩) 点上的灰度为,的概率或频度: 只( f ,) ,( i ,j = 1 ,2 ,川) ( 2 1 ) 式( 2 1 ) 中 表示灰度级数,i 、表示灰度。 若计算关于所有的6 的灰度共生矩阵c ,就等于计算图像的所有二次统计量, 这样的信息量就会过大。实际使用时一般只有0 度、9 0 度、4 5 度、1 3 5 度四种位 移供选择适当的d 。 8 其中一些有用的描述子如下 最大概率: m a x ( q ) 表示对p 的最强响应 元素差异的k 阶矩阵: 芝( f 一c n 该描述子当c 的大值接近主对角线时具有相对的低值。 逆元素差异的k 阶矩: c “( i 一,) ,i _ , 对上面的描述子有相反效果。 _ 致性:了了c 2 “ _q 当c ,;都相等时有最大值。 熵: 一c “l 0 9 2 c “ 是一个随机性的度量,当c 的所有元素有最大的随机性时,此描绘子具 有最大值。 用共生矩阵描述纹理特征的方法的最大缺陷在于:这些统计特征没有和人类 在视觉上对纹理特征的鉴别之间建立对应关系。 2 2 2 2t a m uk a 纹理特征 基于人类对纹理的视觉感知的心理学的研究,t a m u r a 等人提出了纹理特征的 表达“”。t a m u r a 纹理特征的六个分量对应于心理学角度上纹理特征的六种属性, 分别是粗糙度( c o a r s e n e s s ) 、对比度( c o n t r a s t ) 、方向度( d i r e c t i o n a l i t y ) 、 线像 度( 1 i n el i k e n e s s ) 、规整度( r e g u l a r i t y ) 和粗略度( r o u g h n e s s ) 。其中,前三个分 量对于图像检索尤其重要。接下来我们着重讨论粗糙度、对比度和方向度这三种 特征的定义和数学表达。 粗糙度粗糙度的计算可以分为以下几个步骤进行。首先,计算图像中大小 为2 2 个象素的活动窗口中象素的平均强度值,即有 r + 2 k 一1v + 一一1 1 4 2 ,三,:。繇2 2 。 ( 2 z ) 其中k = 0 ,1 ,5 而占化一是位于化一的象素强度值。然后,对于每个象素, 分别计算它在水平和垂直方向上互不重叠的窗口之间的平均强度差。 , ,_ ) ,) 2 p ( x + 2 一1 ,y ) 一爿( x 一2 一1 ,y j ( 2 3 ) e 蛐x ,y ) 。l a k ( t y + 2 “1 ) 一a i ,y 一2 k - i ) l 其中对于每个象素,能使e 值达到最大( 无论方向) 的七值用来设置最佳尺寸 ,0 ,y ) o2 。最后,粗糙度可以通过计算整幅图像中的平均值来得到, 表达为: 2 磊三善荟s g ,) 2 4 ) 式( 2 4 ) 中的m 和n 分别为水平和垂直方向的象素总数。 表示粗糙度特征的另一种改迸形式是采用直方图来描述,的分布,而 不是像上述方法一样简单地计算的平均值。这种改进后的粗糙度特征能 够表达具有多种不同纹理特征的图像或区域,因此对图像检索更为有利。 对比度对比度是通过对象素强度分布情况的统计得到的。确切地说,它是 通过口。= p 。肛4 来定义的,其中。是四次矩而仃2 是方差。对比度是通过如 下公式衡量的: k ;品 ( 2 5 ) “4 该数值给出了整个图像或区域中对比度的全局度量。 方向度方向度的计算需要首先计算每个象素处的梯度向量。该向量的模和 方向分别定义为 i a g j = 蚓制) 2 ( 2 6 ) 0 ;t a n 。1 ( ,a 月) + 叫2 其中h 和a v 分别是通过图像卷积下列两个3 3 操作符所得的水平和垂直方 向上的变化量。 一10111l 一101000( 2 7 ) 一10l一111 当所有像素的梯度向量都被计算出来后,一个直方图h 。被构造用来表达臼值。 该直方图首先对日的值域范围进行离散化,然后统计了每个组( b i n ) q b 相应的i a g i 大于给定阈值的像素数量。这个直方图对于具有明显方向性的图像会表现出峰值, 对于无明显方向的图像则表现得比较平坦。最后,图像总体的方向性可以通过计 算直方图中峰值的尖锐程度获得,表示如下: 4 善渺1 阢o ) ( 2 s ) 式( 2 8 ) 中的p 代表直方图中的峰值,h ,为直方图中所有的峰值。对于某个峰 1 0 值p ,代表该峰值所包含的所有的b i n ,而妒。是具有最高值的b i n 。 2 2 2 3 自回归纹理模型 最近二十年来,有大量的研究集中在应用随机场模型表达纹理特征。在这一方 面,m a r k o v 随机场( m a r k o vr a n d o mf i e l d ,m r f ) 模型取得了很大的成功“。自 回归纹理模型( s i m u l t a n e o u sa u t o r e g r e s s i v e ,s a r ) 就是m r f 模型的一种应用实 例。 在s a r 模型中,每个像素的强度被描述成随机变量,可以通过与其相邻的像 素来描述。如果5 代表某个像素,则其强度值g ( s ) 可以表达为它的相邻像素强度 值的线性叠加与噪音项( s ) 之和,如下所示: g ( s ) 一+ 口( ,k 0 + ,) + s ( s ) ( 2 9 ) 尚 其中“是基准偏差,由整幅图像的平均强度值所决定,d 表示了s 的相邻像 素集。口( r ) 是一系列模型参数,用来表示不同相邻位置上的像素的权值。f 0 ) 是均 值为0 而方差为盯2 的高斯随机变量。通过上式可以用回归法计算参数口和标准方 差盯的值,它们反映了图像的各种纹理特征。例如,较高的盯表示图像具有很高 的精细度,或较低的粗糙度。又比如,如果s 正上方和正下方的0 很高,表明图 像具有垂直的方向性。最小误差法( 1 e a s ts q u a r ee r r o r ) 和极大似然估计( m a x i m u m l i k e l i h o o de s t i m a t i o n ) 可以用来计算模型中的参数。此外,s a r 的一种变种称为 旋转无关的自回归纹理特征( r o t a t i o n i n v a r i a n ts a r 或r i s a r ) ,具有与图像的旋 转无关的特点。 定义合适的s a r 模型需要确定相邻像素集合的范围。然而,固定大小的相邻 像素集合范围无法很好地表达各种纹理特征。为此,有人提出过多维度的自回归 纹理模型( m u l t i r e s o l u t i o ns a r 或m r s a r ) ,能够在多个不同的相邻像素集合范 围下计算纹理特征。 2 2 2 4 小波变换 在数学领域中来讲,小波变换( w a v e l e tt r a n s f o r m ) 理论早在2 0 世纪3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论