




已阅读5页,还剩53页未读, 继续免费阅读
(电路与系统专业论文)细化参数的自相关图像纹理特征提取算法.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江火学硕上学位论文 摘要 随着多媒体技术和计算机网络的飞速发展,全世界的数字图像容量正以惊 人的速度增长。数字图像中包含了大量有用的信息,然而,由于这些图像是无 序地分布在世界各地,图像中包含的信息无法被有效地访问和利用。这就要求 有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术 ( c b i r ,c o n t e n t b a s e di m a g er e t r i e v a l ) 。在这种检索技术中,图像的特征提取和 匹配非常重要。图像特征包括颜色、纹理、形状和空间关系特征。由于纹理特 征能很好的表征图像,因而在模式识别和计算机视觉等领域得到了广泛的应用 和研究。 到目前为止,人们针对纹理特征提取已经做过大量的研究,但大多数研究 方案的抗几何形变能力差,不能有效抵制旋转、伸缩和平移( r s t ,r o t a t i o n , s c a l e ,t r a n s l a t i o n ) 的几何形变。已经有一些学者提出了利用自相关图像消除 平移、对数一极坐标变换消除旋转和伸缩的算法,但是在具体实现过程中仍然存 在“值域太窄”、“存在小数”和对数一极坐标系中平移的影响等问题。基于他们 提出的算法的启发,本文将研究一种细化参数的自相关图像纹理特征提取算法, 该算法具有旋转、伸缩和平移不变性,能更好的适应实际应用的需要。较之传 统算法,本算法对发生几何形变的纹理图像进行检索时能取得更好的检索效果。 本文算法的独特之处在于,在特征提取过程中,引入细化参数的对数一极坐标变 换,解决了对数一极坐标变换过程中出现的“值域太窄 、“存在小数”的问题; 引入对数一极坐标变换之后的自相关图像,消除了由于对数一极坐标变换将旋转 和伸缩的几何形变转换成为对数一极坐标系中的左右、上下平移的影响。 关键词:特征提取、几何形变、鲁棒性、细化参数、对数一极坐标、自相关图像 浙江人学硕i :学位论文 a b s t r a c t w i t ht h ed e v e l o p m e n to ft h em u l t i m e d i aa n dc o m p u t e rn e t w o r k ,t h ed i g i t a l i m a g ec a p a c i t a n c ei sg r o w i n g a l sa ne x p l o s i v es p e e da l lo v e rt h ew o r l d t h ed i g i t a l i m a g e sc o n t a i nal o to fu s e f u li n f o r m a t i o n ,b u ta st h e s ei m a g e sd i s t r i b u t e a l l e v e r y w h e r e ,t h e s eu s e f u li n f o r m a t i o nc a l ln o tb ea c c e s s e da n du s e d s oi td e m a n d sa f a s ta n de f f e c t i v et e c h n o l o g yt h a tc a nl o o k u pa n da c c e s st h ei m a g e ,t h i si st h es o c a l l e dc o n t e n t b a s e di m a g er e t r i e v a l ( c b i r ) i nt h ec b i r ,f e a t u r ee x t r a c t i o na n d m a t c h i n gb e c o m ev e r yi m p o r t a n tc o m p o n e n t s a n di m a g ec h a r a c t e ri n c l u d e sc o l o r , t e x t u r e ,s h a r pa n di n t e r s p a c e s b e c a u s et e x t u r ec a ns h o wt h ec h a r a c t e r so ft h ei m a g e , i th a sav e r yl a r g ea p p l i c a t i o na n dr e s e a r c hi nm o d e i d e n t i f ya n dc o m p u t e r - v i s i o n l o t so fw o r kh a sb e e nd o n eo nt e x t u r ea n a l y s i s ,b u tt h e s em e t h o d sa r en o t r o b u s tt og e o m e t r yd i s t o r t i o ns u c ha sr o t a t i o n , s c a l ea n dt r a n s l a t i o n s e v e r a la u t h o r s h a v ep r o p o s e ds o m er o b u s tf e a t u r ee x t r a c t i o nt e c h n i q u e ,u s i n ga u t o c o r r e l a t i o na n d l o g - p o l a rt r a n s f o r m a t i o n b u ti t s t i l lh a ds o m ep r o b l e ms u c h 笛“n a r r o wv a l u e r e g i o n ,“e x i s tt h ed e c i m a lf r a c t i o n s ”,i tc o u l dn o te l i m i n a t et h ei n f l u e n c eo fs h i f ti n l o g - p o l a rr e f e r e n c ef r a m e t h i st h e s i sp r o p o s e sar o b u s tf e a t u r ee x t r a c t i o na r i t h m e t i c b a s e do np a r a m e t r i c a la u t o c o r r e l a t i o nf o rt e x t u r e i m a g e ,w h i c h i sr o b u s tt o g e o m e t r i cd i s t o r t i o n s t h ec r e a t i o no ft h i sm e t h o di st h a t :i nt h ef e a t u r ee x t r a c t i o n p r o c e s s ,b yi n t r o d u c e dt h ep a r a m e t e r , i tr e s o l v ep r o b l e m so f n a r r o wv a l u er e g i o n a n d “e x i s tt h ed e c i m a lf r a c t i o n s ”;i ti n t r o d u c e da u t o - c o r r e l a t i o na f t e rl o g p o l a r t r a n s f o r mt oe l i m i n a t et h ei n f l u e n c eo fs h i f ti nl o g - p o l a rr e f e r e n c ef r a m e k e y w o r d s :f e a t u r ee x t r a c t i o n , g e o m e t r i cd i s t o r t i o n ,r o b u s t ,p a r a m e t r i c a l ,l o g - p o l a r t r a n s f o r i i l ,a u t o c o r r e l a t i o n l l 浙江大学硕十学位论文 图表目录 图2 - 1c b i r 系统的结构5 图2 - 2 图像内容特征类型以及相互关系6 图2 - 3 图像几何形变的意义1 3 图3 - i 自相关图像与图像纹理的关系1 6 图3 - 2d w t 计算过程2 2 图3 - 3d w t 逆变换计算过程2 2 图3 - 4 二维d w t 计算过程2 3 图3 - 5 图像的三级小波分解2 3 图3 - 6 金字塔结构小波分解2 4 图3 7 完全树结构小波分解2 4 图3 - 8 不完全树结构小波分解2 5 图3 - 9 对数极坐标变换示意图一2 6 图3 - 1 0d a u b e c h i e s 一3 小波波形图2 8 图4 - 1 距离变化简易示意图3 0 图4 - 2 坐标移动示意图31 图4 3 特征提取算法步骤3 6 图5 - 1 图像检索流程图3 8 图5 - 2b r o d a t z 纹理库的第一幅基准图4 0 图5 - 3d 1 的二维f f t 图像4 1 图5 4d 1 的自相关函数图像4 1 图5 - 50 1 在对数一极坐标系中的自相关图像4 2 图5 - 6l p c ( p ,曰) 的二维f f t 图像4 2 图5 7l p c ( p ,g ) 的自相关图像。4 3 图5 8 四种方法的检索正确率比较4 7 一v l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得 研究成果。据我所知,除了文中特剃斋羹以标注和致谢的地方羚,论文中不包含 他人已经发表或撰写过的研究成果,也不包含必获褥迸鎏基堂或蒸他教育 构的学位或证书丽使用避的材料。与我一黼王作鲍阕志对本研究所徽的任何贡 均己在论文中作了明确的说明并表示谢意。 学位论文作者签名:勘梳 签字日期:2 g 年月? 2e t 学位论文版权使用授权书 本学穰论文作者完全了解滥鋈盘鲎有关保留、使用学璧论文翡瓶定 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅曩 借阅。本人授权堂婆表堂可以将学位论文的全部或部分内容编入有关数据雾 进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在鳃密后适用本授权书) 学位论文作者签名:翻赫 导师签名: 签字躁絮翻形年胃1 2e l 签字蜀期:妒确年拶胃f m 学蕴论文作者毕业后去向:箭业 工作单位: 通讯地址: 电话: 邮编: 浙江大学硕士学位论文 第王章绪论 1 1 图像特征提取 随着多媒体技术和计算机网络的飞速发展,全世界的数字图像得到了飞速 的普及和发展。目前,数字图像的应用已渗透到社会生活的每一个角落,对军 事、工业、医学、通信、气象、媒体、娱乐等各方舔都产生了重大影响【l l 。两 且,由于近十年来数字成像技术以及大容量、低成本的新存储技术的发展,数 字图像的容量越来越大,为了对这些日益庞大的海量图像信息进行有效快速检 索,传统的基于关键字的图像检索技术已经无法满足检索需求。为了解决这一 矛盾,基于内容本身的图像检索技术( c b i r :c o n t e n tb a s e di m a g er e t r i e v a l ) 应运而生i 扪。 在c b i r 中,图像是通过自身可视化内容被标记和区分的,因而图像的特征 提取和匹配就变得菲繁重要了。棠焉的图像特征包括颜色特征、纹理特征、形 状特征和空闻关系特征1 3 l 。由于纹理特征能很好的表征图像,两且它存在于诲 多现实世界获取的图像中,如:砖块、沙子、木材等等,因而纹理特征得到了 广泛的应用和研究。 1 2 纹理特征提取 图像的纹理尚没有明确的统一定义,一般理解为图像灰度在空间上的变化 和重复,或图像中反复礁现的局部模式( 纹理基元) 和它们的摊列规则,它反映 了图像或物体本身的属性。纹理特耄芷是一静重要麓撬觉特征,它反映图像中的 同质现象,但不依赖于颜色或亮度。纹理特征包禽了物体表面组织结构排列的 重要信息以及它们与周围环境的联系。纹理特征能够很好的表征图像,而且普 遍存在于现实世界获得的图像中,是图像最重要的特征之一,因而,人们利用 纹理特征进行了大量的关于图像检索、图像分类等方面的研究和应用。而在这 个过程中,图像纹理特征提取就显得尤为重要了,特征提取效果的好坏,直接 影响到后继的研究和应用。 纹理特征提取指的是通过一定的墨像处理技术捆取出纹理特征,放焉获得 纹理定量或定性描述的处理过程。在这个过程中,纹理特征是从纹理图像中计 算出来的一个值,它对纹理内部灰度级变化的特征进行量化。通常,纹理特征 与纹理的位置、走向、尺寸、形状有关,但与平均灰度级( 亮度) 无关。纹理特征 提取的主要目的是将随机纹理或几何纹理的空间结构差异转化为特征灰度值的 差异,用一些数学模型来描述图像的纹理信息,包括图像区域的平滑、稀疏、 规则性等。因此,纹理特征提取应包括两方露的内容:检测出纹理基元和获褥 浙江大学硕,i :学位论文 有关纹理基元排列分布方式的信息【4 】。 目前常用的图像特征提取方法大致可以分为统计法、结构法和频谱法等 s l 。 其中,统计法利用像素间的局部相关性来刻画纹理,主要适用于分析像木纹、 森林、山脉、草地那样的纹理细而且不规则的物体;结构法则利用纹理的机缘 和合成规则描述纹理,主要适用于像布料的e p , b 0 图案或砖花样等一类纹理基元 排列比较规则的图像:频谱法根据人类视觉原理,利用在空间域和频率域同时 取得较好局部化特性的滤波器对纹理图像进行滤波,从而获得理想的纹理分析 特征【6 1 。 1 3 研究内容和创新点 1 3 1 研究内容 到目前为止,人们针对纹理特征提取已经做过大量的研究,提出了许多 方案。但大多数研究方案的抗几何形变能力差,不能有效抵制旋转、伸缩和 平移( r s t ,r o t a t i o n ,s c a l e ,t r a n s l a t i o n ) 的几何形变。r s t 是目标图像检 索的关键,而且r s t 目标图像检索技术具有强大的应用市场,因而抗几何形 变的r s t 特征提取技术成为图像检索领域的一个重要研究方向。针对抵抗r s t 差问题,又有些学者提出了利用自相关图像消除平移、对数一极坐标变换消除 旋转和伸缩的算法【6 j l ,但是在具体实现过程中仍然存在“值域太窄 、“存在 小数” 8 1 ,以及对数一极坐标变换无法消除平移的影响等问题。 本文将提出一种用于图像检索的纹理特征提取算法,该方法具有旋转、 伸缩和平移不变性,较传统的方法有更好的抗几何形变的能力。 1 3 2 研究创新点 基于前人算法的启发,本文将研究一种细化参数的自相关图像纹理特征 提取算法,该算法具有旋转、伸缩和平移不变性,能更好的适应实际应用的 需要。较之传统算法,本算法对发生几何形变的纹理图像进行检索时能取得 更好的检索效果。本文算法的独特之处在于,在特征提取过程中,引入细化 参数的对数一极坐标变换,解决了对数一极坐标变换过程中出现的“值域太窄”、 “存在小数 的问题;引入对数一极坐标变换之后的自相关图像,消除了由于 对数一极坐标变换将旋转和伸缩的几何形变转换成为对数一极坐标系中的左 右、上下平移的影响。 为了验证本算法的抗几何形变能力,采用国际标准b r o d a t z 纹理库中的 1 1 2 幅纹理图像做验证1 9 1 。通过对“2 幅标准纹理图像进行处理,使其发生 r s t 几何形变,然后对这些图像做检索,检验算法的最终应用效果。 一2 一 浙江大学硕十学位论文 1 4 论文结构 论文总体上分为五部分:第一部分主要介绍图像特征提取技术的研究现状 和相关理论背景,第二部分介绍了图像纹理特征提取的典型方法,第三部分是 在典型方法基础之上提出本文算法,第四部分是对本文提出的算法进行验证, 并与典型方法相比较,最后一部分总结全文,并提出后续工作内容。论文具体 结构如下t 第一章、绪论部分,简要介绍图像纹理特征提取的重要性,指明本文的研 究内容和研究创新点。 第二章、介绍图像检索、特征提取和纹理特征提取的相关概念以及理论背 景,并详细介绍目前研究中存在抗几何形变能力差的问题,以及抗几何形变的 r s t 特征提取技术的重要性。 第三章、重点介绍了人们对于纹理图像特征提取技术的典型方法,主要包 括共生矩阵方法、小波变换法、自相关图像方法以及最新的抗几何形变法,了 解这些方法的优点和缺点,为后续的研究奠定基础。其中详细介绍了最新的抗 几何形变算法在具体实现过程中出现的“值域太窄”,“存在小数”,以及对数一 极坐标变换并没有消除平移的影响等问题。 第四章、针对最新的抗几何形变法在具体应用过程中出现“值域太窄”、“存 在小数”,通过引入细化参数的对数一极坐标变换消除旋转和伸缩的影响,同时 也消除了原来算法具体实现过程中出现的“值域太窄”、“存在小数”的问题; 引入对数一极坐标变换之后的自相关图像,消除了由于对数一极坐标变换将旋转 和伸缩的几何形变转换成为对数一极坐标系中的左右、上下平移的影响。 第五章、采用国际标准b r o d a t z 纹理库中的1 1 2 幅纹理图像做验证。选取 一种简单的图像检索方法,利用本文提出的图像纹理特征提取算法与其它典型 算法相比较,通过比较各自的图像检索正确率来验证本文提出的算法的优越性。 第六章、总结和展望,对工作做出总结并分析图像纹理特征提取算法的未 来研究工作。 一3 一 浙江大学硕j :学位论文 第2 章理论背景 2 1 引言 多媒体技术、计算机网络和新存储技术的发展,极大的促进了数字图像的 发展、普及和应用,形成了一个巨大的、分布式的图像信息库。这些图像信息 库包含着包含了大量有用的信息,对人类社会的各个方面都产生了重大深远的 影响。面对这个庞大的图像信息库,如何有效地组织、管理和检索大规模的图 像数据库,以便让用户快速有效地查找到自己所需的信息,成为当前一个热门 的研究课题,这就促进了图像检索技术的发展。 2 2 图像检索技术 2 2 1 相关概念 所谓图像检索,是指从图像库中查找出符合要求的图像( 或者从连续的视频 图像中查找出符合要求的视频片段) 的过程。图像检索领域的研究分为基于文 本和基于内容两大类【1 0 l 。 2 2 2 基于文本的图像检索 从2 0 世纪7 0 年代开始,有关图像检索的研究就已开始,当时主要是基于 文本的图像检索技术【3 1 ( t e x t - b a s e di m a g er e t r i e v a l ,简称t b i r ) ,利用文 本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。 早在7 0 年代,数据库专家就开始研究如何对图像数据进行有效的管理。主 要方法是首先对图像建立关键词或文本以及一些附加信息,然后将图像的存储 路径和图像关键词之间建立联系,便于检索【1 。 8 0 年代是多媒体技术时代,图像的获取、创作、存储技术都取得了举世瞩 目的成就,而对图像信息的管理却未给予足够的重视。 9 0 年代是计算机网络时代,随着计算机视觉技术的发展,网络上多媒体信 息的产生、存储、传输、分析以及访问数量呈指数级增长,其中图像占据着重 要的地位。对图像建立关键词等文本描述信息的方式,已越来越不适应现代用 户信息检索的要求。 综上可知,基于文本的图像检索技术的过程是:首先对所有图像进行关键 字标注,然后再使用数据库技术和文本信息检索技术搜索图像。 这种技术的优点:检索操作简单,速度快。 这种技术的缺点: l 、人工注释图像工作量大; 一4 一 浙江人学硕l :学位论文 2 、主观性理解和表达造成注释信息不稳定; 3 、人工标注受到语言的限制,推广性差。 第二点直接影响图像检索结果的可靠性,于是基于内容的图像检索 ( c o n t e n t b a s e di m a g er e t r i e v a l ,c b i r ) 逐渐被人们所重视【1 2 l 。c b i r 技术以 图像视觉特征或与图像相似的草图作为用户查询和系统检索的依据。 2 2 3 基于内容的图像检索c b i r 为了突破基于文本的图像检索的诸多弊端,人们又转向研究图像中所包含 的内容信息作为图像的索引,计算查询图像和目标图像的相似距离,按相似性 匹配进行检索,即基于内容的图像检索( c o n t e n t b a s e di m a g er e t r i e v a l ,简 称c b i r ) 技术。 早期c b i r 的研究重点是视觉特征提取1 1 0 l 。后来在语义特征、多维索引、 用户接口、系统设计等方面又有所发展。近年来研究者又引进了更多领域的知 识:从知识表示的角度运用人工智能领域的推理和神经网络技术【1 3 1 4 “5 1 ,提取 特征和分类图像;构造面向对象的c b i r 系统1 1 6 1 ;开发面向w e b 的c b i r 系统1 1 7 1 ; 另外,并行c b i r 技术也被提上了议程【1 ;同时,许多c b i r 系统被开发出来【m “9 1 , 但这一领域还有很多问题有待解决。 图2 - 1c b i r 系统的结构 f i g 2 - 1s t r u c t u r eo fc b i rs y s t e m 基于内容的图像检索,就是利用图像本身包含的不同层次结构和语义信息 一5 一 浙江大学硕上学位论文 进行检索。现阶段主要研究的是如何利用颜色、纹理、形状和空间关系等视觉 特征和组合特征进行检索。基于内容的图像检索系统一般由输人模块、数据库、 查询模块和检索模块等组成,其结构与各部分的功能如图2 1 所示。 基于内容的图像检索主要包含特征提取、多维索引及用户接口三个基本技 术要素。下面将对它们给予简述: 1 、视觉特征包含颜色、纹理、形状、区域、空间层次等1 3 1 。 c b i r 中的特征可以简单的分为低级物理特征和高级语义特征f 比i 。其中物理 特征是指图像的基本特征,包括颜色、形状、纹理和空间关系等,其特点是易 实现自动提取,但较难确切表达检索需求。语义特征是人们对图像内容的概念 反映,可进一步分为逻辑特征和抽象特征两类。其中图像逻辑特征是指即图像 中具有一定语义的独立对象及相互关系,包括广义对象、狭义对象和对象的位 置关系等;图像抽象特征是指即图像所表征的抽象含义,是对图像内容的抽象 概括。图像内容特征的三个层面的其相互关系如图2 - 2 所示: 抽象特征 么 一种 对象关系 彳f 语义对象 逻辑待,仕 彳 图像基本特征 颜色、纹理、形状等 语义特征 物理特征 图2 2 图像内容特征类型以及相互关系 f i g 2 - 2i m a g ef e a t u r et y p e sa n di t sr e l a t i o n s h i p c b i r 中的每个特征所对应的匹配算法正日趋成熟。近年来研究人员发现视 觉特征提取仍不能很好地满足用户的需要,于是在提高其精确度的同时开始研 究高层的语义特征描述和相似匹配 2 0 , 2 1 l 。 2 、多维索引技术是使c b i r 能应用于超大型图像数据库的重要保障。高效 的索引技术是基于内容图像检索在大型图像数据库中发挥优势的保证。索引技 术随着数据库技术的发展而发展,随后被应用于基于内容的图像检索领域。提 高索引的效率有两种方法:缩减特征向量的维度和改进索引算法 1 0 , 2 2 i 。在n g 和 一6 一 浙江人学硕一i 二学位论文 s e d i g h i a n 对图像检索中多维索引技术进行评价的文章中,提出了一个针对于 图像检索的策略的三个步骤l 坨】: ( 1 ) 进行维度约减; ( 2 ) 对存在的索引方法进行评价; ( 3 ) 根据评价定制自己的索引方式。 多维特征矢量有维数多和富含语义等特点。 多维索引技术只是从如何改进索引算法以适应大规模数据库的角度来考虑 问题的 1 2 j 。在基于内容的图像检索中,由于描述图像内容视觉特征的各种表示 方法的不同,索引的难度也大大增加。如果从语义层次上对图像进行有效的分 类,对于系统索引处理和用户查询都有极大的帮助。 利用底层的视觉特征对图像进行语义层次的分类是一项十分艰巨的工作。 它必须建立在精确并且效率高的视觉特征提取技术的基础之上。就颜色特征的 提取来说,具有相同的色彩直方图的两幅图像未必有相同的含义,而用户所要 得到的不是色彩而是具有一定含义的图像。所以语义层次的图像分类更接近用 户的需要,当然也就更具有难度。 大多数图像检索系统采用辞典框架结构存储分类信息,研究较多的技术是 聚类和神经网络。分类是按已经存在的类别规则将图像进行分组,而聚类则是 在研究大量图像的特征的基础上通过学习产生出类别,然后按此类别再对未处 理的图像进行分类。1 9 9 7 年c h a r i k a r 等人在文章中讨论了聚类技术,并由此 提出了动态的图像检索【l o j 。它的优势在于可以动态地进行图像分类,另外聚类 技术也降低了索引的维度。1 9 9 5 年z h a n g 等人运用s o m ( s e l fo r g a n i z i n gm a p ) 神经网络技术,结合色彩与纹理特征分析对图像进行聚类【1 4 】。但仍有可能出现 如视觉特征相似而含义不同的情况。于是,有必要进一步对图像的语义分类进 行研究,特别是如何建立一个强壮的体系结构来定义图像中可以表征语义信息 的突出部分p 5 】。这样,人为干预就显得十分必要。况且目前图像的采集并没有 完全实现自动化,人工分类与聚类相结合的方法比较可行。 3 、图像检索系统通过用户接口从用户处获取查询信息,并向用户提交查询 结果。用户可以向系统提交与所需查询的图像一致或类似的例图或绘制草图; 还可以给出一种或多种特征要求。在有的系统中对图像进行语义分类,用户可 以交互地由系统引导直到找到自己需要的图像为止。在许多现存的c b i r 系统中 都运用了其中的一种或几种相结合的接口方式。就今后的发展来看,交互式、 特征与语义信息结合的接口更接近用户的需要。近l o 年来,基于内容的图像检 索系统已发展到几十种【2 3 1 ,其中著名的有c b i r 系统有m i t 的p h o t o b o o k f 2 4 1 , 1 b m 的q b i c t 巧l ,v i s u a l s e e k 和w e b s e e k l 2 6 l ,u c s b 的n e t r a 【2 7 1 等。 多数图像检索系统的查询与结果显示都是反复迭代进行,用户对每步检索 一7 一 浙江大学硕1 :学位论文 结果都要进行评价,并需修改查询定义才能查询f 2 8 l 。因此系统若将用户反馈信 息作为进一步检索的依据,则应尽可能地优化查询结果,以使得检索结果更符 合用户需要。这种系统与用户的交互过程就是相关反馈的基本思想。对于不同 类型的查询,系统对于用户反馈信息的处理各不相同,但都应考虑怎样在从用 户那罩得到更多信息的同时,不增加用户负担。相关反馈有两种方法: ( 1 ) 特征参数化,根据用户反馈来优化特征参数,以便使其能更好地表达 图像的内容。 ( 2 ) 通过反馈信息修改相似性函数中各个特征的权值。可以通过比较正例的 特征偏差与正、反例联合偏差来调整权重,如果正例的特征偏差越小,则该特 征对于当前检索越重要;或者根据全局相似性函数得到的图像序列,与根据每 个特征类得到的序列相比较,以更新不同特征类的权重口,对于目标与类别检 索,相关反馈则用来调整特定解释的可能性、更新根据特征值和相似性所作的 标记。 综上可知,c b i r 系统主要具有下的特点: 1 、从图像内容中提取信息线索,直接对图像进行分析并提取特征,使得检 索更加接近图像对象。 2 、提取特征的方法多种多样,包括颜色特征、形状特征、纹理特征和空间 关系特征等。 3 、人机交互进行,既发挥出人对于特征比较敏感的优点,又发挥计算机处 理大量数据的能力。 4 、基于内容的图像检索是一种近似匹配,它采用采用逐步求精的办法,而 传统的图像检索采用精确匹配算法。 在基于内容的图像检索技术中,选择与提取能充分反映目标基本属性的特 征,是图像检索的关键问题之一。特征提取效果的好坏,直接关系到图像检索 的最终效果。下面简要介绍一下特征提取技术。 2 3 特征提取技术 2 3 1 相关概念 所谓特征是指某事物区别于其他事物所具有的征象和标志。目标图像的特 征一般可以分为物理特征、结构特征和数学特征三类【6 1 。物理特征是指目标图 像的物理特性。结构特征是指目标图像各部分空间上的相互关系。数学特征是 指对目标图像特性的定量描述。其中,物理特征和结构特征最容易被人们的感 觉器官所接收,便于人们直观地识别对象。 特征的三要素指的是特征的相对性、唯一性和鲁棒性。其中,特征的相对 性指的是特征的有效性是针对所研究的问题而言,脱离了问题便毫无意义。特 一8 一 浙江人学顾十学位论文 征的唯一性指的是选择的特征集对应于模式库中的不同目标均不相同。特征的 鲁棒性指的是特征的抗外界干扰能力,在外界发生异常情况下保持原有性能的 能力。 目标图像提取的特征必须满足以下特点: 1 、目标识别要求特征不能过于复杂,且能快速计算; 2 、特征的数目不宜过多,以节省存储空间和计算时间; 3 、利用目标的图像信息识别目标,增强抗干扰能力: 4 、特征不随目标图像的旋转、伸缩和平移( r s t ) 变化而变化。 在图像处理过程中,噪声的影响可在预处理阶段滤除,从而r s t 不变性要 求就是目标识别过程中的核心问题。 特征提取是指通过变换的方法,把图像空间的高维特征变成特征空间的低 维特征。图像采集过程中形成的样本测量值数目就是其图像空间的维数,一般 情况下,图像空间是高维的,而且维数一般很大。 特征提取实现了维数压缩,但是应该保证样本属性不变,并且更有代表性, 更能反映本质,因此特征提取必须具有以下约束条件: 1 、提取的同类样本间的距离越小越好,非同类样本间的距离越大越好; 2 、提取的特征应满足对特征的一般要求和特殊要求; 3 、提取的特征能够抵抗噪声、旋转、伸缩和平移的影响。 对于平面图像而言,一般有扭曲、旋转、伸缩和平移四种基本几何形变。 而在上述四种基本几何形变中,图像的旋转、伸缩和平移是最常见和最复杂的, 因而,抗几何形变的r s t 特征提取技术是图像检索的一个重要研究方向,也是 实现r s t 目标图像检索的关键。 2 3 2 主要的特征提取技术 到目前为止,主要的图像特征提取技术包括颜色特征、形状特征、纹理特 征和空间关系特征等特征提取技术,下面分别介绍 i h 。 1 、颜色特征 颜色是描述图像内容的最直接的视觉特征,由于颜色具有一定的稳定性, 因此成为检索中最常用的视觉特征。一种常见的颜色特征是图像的颜色直方图, 颜色直方图不但计算简单,而且还对平移和旋转不敏感。但是,颜色直方图无 法充分捕捉颜色组成之间的空间关系,同时也丢失了图像的空间信息。而且, 颜色直方图还具有亮度敏感性、稀疏直方图对噪声敏感性、计算量大等缺点。 颜色具有一定的稳定性,因此成为检索中最常用的视觉特征。关于颜色直方图 之间的距离,目前主要有直方图的交、直方图的绝对值距离、n i b l a c k h e 和 b a r b e r 等采用直方图的欧几里德距离的度量方法。 2 、形状特征 一9 一 浙江人学硕1 j 学位论文 形状是图像的重要可视化内容之一,也是最接近用户需求的匹配特征。在 二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域。对于 基于形状的检索来说,形状的表示和匹配是需要解决的重要问题。传统的计算 机视觉中,曾先后用f r e e m a n 链码、曲线、f o u r i e r 描述符、二次曲线及样条 等来描述平面曲线。 形状匹配分为基于边界和基于区域两大类型,它们分别采用傅立叶描述子 和不变矩表述特征。对于更广泛的变形匹配问题,需要从研究变形模型着手。 弹性变形模型是研究和应用最早的模型,后来又有学者提出的主动轮廓模型, 则应用于边缘及轮廓的检索。此外还有根据部分先验信息采用参数控制模型表 示的方法,用于人脸识别、医学图像检索等方面。不少专家沿用二维表示中的 两个途径表示三维形状,在思想上没有突破。从二维图像中建立三维模型进行 匹配才是今后研究的主题,这方面的成果还比较少。对于形状的匹配来说,h o u g h 变换是非常经典的方法,而且对于噪声和遮挡具有良好的抗干扰性,但仅能解 决形状的旋转、伸缩和平移带来的匹配问题,而对实际应用中广泛的变形匹配 问题无能为力。 3 、纹理特征 纹理是指不依赖于一种颜色或亮度的同质的直观现象,是所有实际存在的 表面特有属性。它是以像素的邻近灰度空问分布为特征的,表明图像强度局部 变化的重复模式,包括表面结构排列的重要信息和它们与周围环境的联系。 早期对纹理特征提取的研究是在模式识别的背景下展开的,方式多为统计 方法,典型代表是基于二阶灰度统计特征的共生矩阵法。而后提出的对比度、 粗糙度、方向性、规律性等相似度量,比共生矩阵中的统计信息更符合人类感 知力。1 9 9 1 年c o h e n 等采用的高斯马尔克夫随机场模型进行纹理识别,取得良 好效果m 1 。同时,许多研究者开始将小波变换应用于纹理特征表述。m a n j u n a t h 等人对三种小波变换方法( 直角、树结构、g a b o r ) 做了比较之后,发现g a b o r 小波变换最符合人类视觉特征的表达。针对纹理特征计算量大、对噪声敏感等 特点,研究者们提出了一些方法,如g a b o r 过滤器法和扩展不规则碎片型分析 法l ,们。1 9 9 8 年m a n j u n a t h 提出了纹理辞典的概念1 3 l j ,它对重要的纹理类型自 动生成代码字,按其相似程度进行检索。目前也有不少研究者在研究利用神经 网络进行纹理分割0 3 1 。 4 、空间关系特征 局部特征提取具有更高的精确性,而好的图像分割技术将使局部特征提取 得到更令人满意的结果:在形状特征提取中对形状进行轮廓分割和分形等技术 都需要图像分割技术的支持,在颜色特征提取中采用颜色层描述方法,在纹理 特征提取中进行局部纹理分割。图像分割技术也使得小块图像之间的方向空间 一1 0 浙江大学硕i j 学位论文 关系被用作特征描述。 用空间特征来进行图像检索一直是图像检索的重要研究方向,目前已有不 少方法,如:二维字符串( 2 d - - s t r i n g ) 法,2 dc s t r i n g 法,2 db _ s t r i n g 法等。但是,将图像的空间关系转换为图像相似性的定量度量是一件较为困难 的事情。 在上面几种特征提取技术中,由于纹理特征能够很好的表征图像,而且普 遍存在于现实世界获得的图像中,是图像最重要的特征之一。因而,人们利用 纹理特征进行了大量的研究和应用。下面简要介绍一下纹理特征提取。 2 4 纹理特征提取技术 2 4 1 相关概念 纹理特征提取指的是通过一定的图像处理技术抽取出纹理特征,从而获得 纹理的定量或定性描述的处理过程。通常,纹理特征与纹理的位置、走向、尺 寸、形状有关,但与平均灰度级( 亮度) 无关。 纹理形成的机理是图像局部模式变化太小,一般无法在给定的分辨率下把 不同的物体或区域分开。这样,在一个图像区域中重复出现满足给定灰度特性 的一个连通像素集合构成了一个纹理区域。 纹理特征的基本特征是移不变性,即对纹理的视觉感知基本上与其在图像 中的位置无关。移不变性可被描述成是规则性或是不规则性。 纹理特征提取的主要目的是将随机纹理或几何纹理的空间结构差异转化为 特征灰度值的差异,用一些数学模型来描述图像的纹理信息,包括图像区域的 平滑、稀疏、规则性等。 因此,纹理特征提取应包括两方面的内容:检测出纹理基元和获得有关纹 理基元排列分布方式的信息。 2 4 2 主要的纹理特征提取技术 由于纹理是千差万别的,所以针对不同的应用系统常常需要设计不同的纹 理分析方法。纹理特征提取可以分为统计法、结构法和频谱法1 3 2 l ,它们各自有 着不同的特点: 1 、统计法是纹理分析中最基本的一类方法,它主要通过统计参数来表征图 像中像素灰度级分布的特征,主要适用于分析像木纹、森林、山脉、草地等纹 理细而且不规则的物体,一般复杂度较低,易于实现。典型方法有图像灰度直 方图法、图像灰度差值直方图法和图像灰度共生矩阵法等。 2 、结构法是利用纹理的基元和合成规则描述纹理,主要适用于像布料的印 刷图案或砖花样等一类规律性较强的人工纹理,在分析自然纹理图像时较难取 一1 】一 浙江火学硕一i :学位论文 得满意的效果。典型方法有自相关图像法。 3 、频谱法是根据人类视觉原理,采用多尺度、多分辨率、多通道的纹理分 析方法,利用在空间域和频率域同时取得较好局部化特性的滤波器对纹理图像 进行滤波,从而获得理想的纹理分析特征。频域变换( 如:小波变换) 是目前 发展最快、应用较多的方法。它可以提取纹理图像中多个分辨率和多个方向上 的信息,因而较好地反映了纹理的自身特性。 2 5 现存问题 2 5 1 存在问题 从上面可知,由于纹理特征能够很好的表征图像,而且普遍存在于现实世 界获得的图像中,是图像最重要的特征之一,因而人们利用纹理特征进行了大 量的研究和应用,也获得了很多不同的方法。 然而目前大多数方法都基于一个前提假设:所有图像都是从同一个视角获 得的,图像的角度、大小、位置都是一样的。但实际应用中的图像显然不满足 这个假设,因而这些方法的抗几何形变r s t 能力较差,实现的检索效果就变得 比较差了,检索结果不能满足实际用户的需求。 2 5 2 几何形变 对于平面图像而言,一般有扭曲、旋转、伸缩和平移四种基本几何形变。 而在这四种基本几何形变中,图像的旋转、伸缩和平移是最常见、最复杂的, 因而,抗几何形变是实现r s t 目标图像检索的关键。 几何形变可通过下面的公式形象的表示:假设目标纹理图像的灰度函数为 f ( x ,y ) ,发生几何形变后的图像灰度函数为厂( x ,y ) ,则厂( x ,y ) 可表示为: 厂。( x ,y ) = 厂( 0 c ( x c o s p y s i n p ) 一缸,o t ( x s i n l 3 + y e o s p ) 一) ,) ( 2 1 ) 其中,d 表示相对于坐标原点,象素点发生旋转的角度;仅表示图像的尺 度伸缩因子,( 血,缈) 表示象素点相对于x ,y 轴的平移量。则: 儿厢e o s ( a r c t a ny - - + 1 3 ) = 可( c o s ( a r c t a n y x ) c o s p s i n ( a r c t a n z x ) s i n p ( 2 2 ) x x 【z zj = 巧( 南螂p 一丽y s i n = x c o s p - y s i n p 一1 2 浙江人学硕l :学位论文 y :厢s i n ( a r c 伽羔+ p ) x = 厢( s i n ( a r c t a n z x ) c o s d + c o s ( a r c t a n - y 工) s i n p ( 2 3 一) x工 ( 2 ) = 厢( 南啷p + 南咖p ) = x s i n l 3 + y c o s l 3 图像几何形变的意义如图2 3 所示: j 笏 。) 0 ,) x 图2 - 3 图像几何形变的意义 f i g 2 3s i g n i f i c a t i o no ft h eg e o m e t r i c a l l yd i s t o r t e di m a g e s 几何形变的普遍存在性,决定了抗几何形变能力的强弱成为图像纹理特征 提取算法有效与否的重要标准。因而有必要了解目前几种典型的图像纹理特征 提取方法,了解它们的优缺点以及抗几何形变能力,为后续的研究奠定基础。 一1 3 浙江大学顾卜学位论文 3 1 典型算法概况 第3 章典型算法 由上文可知,图像纹理特征提取算法可以分为统计法、结构法和频谱法。 统计法是纹理分析中最基本的一类方法,一般复杂度较低,易于实现;结构法 是利用纹理的基元和合成规则描述纹理,主要适用于规律性较强的人工纹理; 频谱法是根据人类视觉原理,利用在空间域和频率域同时取得较好局部化特性 的滤波器对纹理图像进行滤波,从而获得理想的纹理分析特征。 图像灰度直方图算法【3 3j 是统计法中最简单的一种,直方图反映的是图像的 亮度在各个灰度级上出现的概率。自相关图像算法【3 4 i 是结构法的一种,通过测 量纹理特征在方向上相关于纹理基元的尺寸来描述图像的纹理特征,其突出特 点是平移不变性,在目前得到广泛的应用。而小波变换 3 5 i 算法是目前发展最快、 应用较快的频谱法,它可以提取纹理图像中多个分辨率和多个方向上的信息。 这些典型算法提取了纹理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论