已阅读5页,还剩73页未读, 继续免费阅读
(信号与信息处理专业论文)利用curvelet变换进行基于内容的图像检索.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学技术大学硕卜论文 摘要 _ 脚l 近年来,随着多媒体、网络技术的迅速发展,图像信息的应用日益广泛,对规 模越来越大的图像数据库、可视信息进行有效的管理,迅速、准确的找到用户所 需要的图像,成为一个广泛关注和迫切需要解决的课题。基于内容的检索可以自 动提取图像自身所包含的客观信息然后根据这些信息在图像中进行查找,检索 出相似的图像,不需要或仅仅需要很少的人工干预。针对基于内容的检索,本文 围绕图像信息的提取和相似性的计算这两个关键问题,深入分析了基于c u r v e l e t 变换的图像线边缘检测,着重研究了从图像边界轮廓提取全局和局部特征的方 法,同时对局部特征的相似度计算进行了深入的探讨。 本文的主要研究内容和成果如下: 基于c u r v e l e t 变换理论,提出了一种直接从c u r v e l e t 变换系数提取图像边缘 的方法。依据r a d o n 映射直线的原理,将线边缘的检测问题转换成r a d o n 变换 最大系数的检测,利用r a d o n 变换来降低噪声的影响。实验结果表明,本文提出 的算法,在有效检测形状边界弱边缘的情况下,具有较小的信息冗余度,提高了 边缘检测的精度。 着重研究了边界轮廓的全局和局部特征提取方法,探讨了h u 不变矩提取边 界轮廓全局特征的修正模型,并详细阐述了基于多边形顶点的局部特征提取方 法,提出了一种将l e v e n s h t a i n 距离用于局部特征相似性度量的改进算法。实验 结果表明,采用边界矩计算全局特征的速度提高了一个数量级,同样具有平移、 旋转以及尺度的不变性:采用l e v e n s h t a i n 改进算法的局部特征相似性比较,更 加符合人的形状视觉感知。 针对单独使用全局和局部特征检索存在的问题,研究了一种分级检索的系统 结构,将边界矩特征和局部形状特征分别用于一级和二级商标图像检索。实验结 果表明,采用全局和局部特征的组合比单个特征具有更好的检索效果,时问效率 也比较高,取得了检索的准确性和效率之间的较好的平衡。 关键词:基于内容图像检索,c u r v e l e t ,r a d o n ,边界矩,l e v e n s h t a i n 距离,局 部特征 ! 旦型堂垫查查堂堡:丝苎 a b s t r a c t r e c e n t l ) ,a l o n gw i t hm u l t i m e d i a a n di n t e r a c t sd e e pd e v e l o p m e n t ,t h e r ea r em o r e i m a g e sg e n e r a t e d h o wt om a n a g et h e s ei m a g ei n f o r m a t i o ne f f e c t i v e l y , r e t r i e v a lt h e i n f o r m a t i o n q u i c k l y a n d p r e c i s e l y h a sb e e n t a k i n g r e s e a r c h e r s lm u c ha t t e n t i o n c o n t e n d b a s e d i m a g e r e t r i e v a lc a ne x t r a c t o b j e c t i v e i n f o r m a t i o no f i m a g e a u t o m a t i c a l l y , c o m p u t et h es i m i l a r i t ya n df i n di m a g e st h a tw e w a n t a r o u n dt h et w o c r i t i c a lp r o b l e m s f e a t u r ee x t r a c t i o na n d s i m i l a r i t yc o m p u t i n g ,t h i sd i s s e r t a t i o ns t u d i e s l i n e a re d g ed e t e c t i o nb a s e do nc u r v e l e tt r a n s f o r m ,t h ee x t r a c t i o no f g l o b a la n dl o c a l f e a t u r e ,a n ds i m i l a r i t yc a l c u l a t i o na b o u tl o c a lf e a t u r e s , t h em a i nc o n t e n t sa n dr e s u l t so f s t u d yi n v o l v e di nt h i sd i s s e r t a t i o na r es h o w n a s f o l l o w s : b a s e do nc u r v e l e tt h e o r y , w e p r e s e n ta n e wm e t h o do f e d g ed e t e c t i o nt h a tc o u l d e x t r a c te d g ed i r e c t l yf r o mc u r v e l e t sc o e f f i c i e n t s g i v e nt h ep r i n c i p l et h a te a c ho f r a d o n sc o e f f i c i e n t s c o r r e s p o n d st o o n el i n e ,t h i sm e t h o dd e t e c t e d g eb yr a d o n s b i g g e s t c o e f f i c i e n t a tt h es a l t l e t i m e ,t h eo p e r a t i o no fr a d o nc u m u l a t i o nc a l l e l i m i n a t et h en o i s e sa f f e c t i o ne f f e c t i v e l y t h ee x p e r i m e n t ss h o wt h a t c u r v e l e t b a s e d e d g ed e t e c t i o nc a nf i n ds o m e w e a k e d g e se f f e c t u a l l y b eu pt ot h ec o n t o u rf e a t u r e 、w es t u d yt h e g l o b a la n dl o c a lr e s p e c t i v e l y w e c o m p u t et h es e v e nb o u n d a r yi n v a r i a n tm o m e n t s a st h eg l o b a lf e a t u r e g - r o u n do nt h e d e e pr e s e a r c ha b o u tv e r t e xl o c a lf e a t a r e ,w ep r o p o s eam o d i f i e dm a t c hc o s t u n c t i o n b a s e do nl e v e n s h t a i nd i s t a n c em e t r i c f r o mt h ee x p e r i m e n t s ,w et a i ls e e :t h et i m e c o n s u m p t i o nb a s e do nb o u n d a r ym o m e n t sh a sr e d u c e dt e nt i m e sa g a i n s tt h em e t h o d b a s e do n r e g i o ni n v a r i a n tm o m e n t s ,t h eb o u n d a r y m o m e n t sa l s os a t i s f i e st h ea l g e b r a i c i n v a r i a m s s o m er e s u l t sa b o u ts h a p es i m i l a r i t yi n d i c a t et h a tm o d i f i e dl e v e n s h t a i n d i s t a n c ea c c o r d sw i t hh u m a nv i s u a lp e r c e p t u a lm o r e n i c e l y w e a n a l y z et h ea c c u r a c ya n de f f i c i e n c yo f t w od i f f e r e n tr e t r i e v a lm e t h o d sb a s e d 2 中周科学技术人学颈i 论文 o ng l o b a la n dl o c a lf e a t u r e t h e nw eh a v ed e v i s e sa2 - 1 e v e l s y s t e mf o rt r a d e m a r k i m a g er e t r i e v a l a tf i r s t ,w ec o m p a r eb o u n d a r yi n v a r i a n tm o r r t e n t sa n dr e t u r ns o m e s i m i l a r s h a p e 。t h e n w e c o m p u t et h e l o c a l s i m i l a r i t yb y m o d i f i e dl e v e n s b t a i n d i s t a n c e a c c o r d i n gt ot h eq u e r yr e s u l t s ,o u rr e t r i e v a l s y s t e mh o l dm o r ef a v o r a b l e e f f e c t ,h a v eab e t t e rb a l a n c eb e t w e e n a c c u r a c ya n de f f i c i e n c y k e yw o r d s :c o n t e n t b a s e di m a g er e t r i v a l ,c u r v e l e tt r a n s f o r m ,b o u n d a r yi n v a r i a n t m o m e n t s ,l e v e n s h t a i nd i s t a n c e ,l o c a lf e a t u r e 中围科学技术大学硕士论文 1 1 课题的研究背景 第一章绪论 近年来,随着多媒体、网络技术的迅速发展,图像信息的应用同益广泛,对规 模越来越大的图像数据库、可视信息进行有效的管理成为迫切需要解决的问题。 传统的基于文本的图像检索技术t b i r ( t e x tb a s e di m a g er e t r i e v a l ) 采用常 规数据库管理图像数据,对图像进彳亍手工标注,建立关键词或文本标题以及一些 其它的附加信息来对图像进行描述,数据库根据这些来支持图像查询。但是,随 着多媒体技术的迅猛发展,这种采用对图像建立关键词等文本描述信息的方式已 经不能适应图像信息检索的要求。对图像进行加注文本信息是由手工完成的,随 着图像数据来源的目益广泛,这种方法费时费力;文本描述的信息是非常主观的, 不同的人对同幅图像的理解可能是不同的。因此采用传统的基于文本描述的图 像检索技术是不能够有效进行图像数据检索的。 基于内容的图像检索技术c b i r ( c o n t e n t b a s e d i m a g e r e t r i e v a l ) 相比于传统 的基于文本的检索技术,可以提供更有效的图像检索手段。基于内容的图像检索 与传统的基于文本的检索有显著的不同,它可以自动提取图像自身所包含的客观 信息,不需要或仅仅需要很少的人工干预。在基于内容的图像检索系统中,用户 可以采用不同的方式来进行查询请求,可以是一副完整的图像,也可以是用户想 象中的一副有关图像的素描轮廓;系统和用户之间的交互性很好,用户可以对系 统检索的结果进行评判,系统根掘用户的反馈信息进行动态的相似度权值的调 整,依次提高系统查询的准确性。通过人机交互,缩小计算机和人对相似内容图 像在认知上的差异,让计算机具有一定的学习能力。 c b i r 技术从提出到现在,在国内外已经取得不少的成就:技术上各种新的 方法不断涌现;学术上许多知名的期千u 已经有专刊介绍。在国外,特别是在美国, 这项技术已成为一个研究热点。一些科研部门、高等院校、商业公司以至政府机 构都纷纷投入大量人力和物力进行研究和开发,以期取得领先地位。i b m 公司位 于硅谷的a l a m d e n 研究中心开发的q b i c ( q u e r y b y i m a g ec o n t e n t ) 是最具代表 性的系统,通过友好的界面为用户提供颜色、纹理、草图、形状等多种检索方法。 6 中国科学技术大学硕士论文 由于基于内容的检索有着广泛的需要和较好的市场前景,国际化标准组织 m p e g 正在指定m p e g 7 ( 多媒体描述接口) ,对各种类型的多媒体数据进行规 范化描述。随着多媒体内容描述的标准化,图像内容的标准化也将随之丽标准化, 基于内容的图像检索也将朝着商业化的方向前进。 1 2 图像内容特征提取分类 目莳存基于内容的图像检索系统中,主要从西个方面来对萄像内容进行特征 描述,分别是颜色( c o l o r ) 、纹理( t e x t u r e ) 、形状( s h a p e ) 以及对象空问关 系。 基于颜色( c o l o r ) 的图像检索是根据图像中组成目标对象的颜色特征信息进 行检索,这种方法是基于内容图像检索技术中最先采用和最基本的方法。s w a i n 1 】 提出的颜色直方图是最基本方法,但缺乏图像的空间信息。随后p a s s a l 提出了色 彩聚合矢量c c v ( c o l o rc o h e r e n c ev e c t o r ) ,c c v 方法不仅统计了整幅图像中 各颜色的像素值,统计了图像中各颜色最大区域的像素,效果较好, n c c v 并没有 强调各颜色最大区域的形状以及与背景的关系,于是z a c h a r y 【3 1 等人又考虑了图 像的边缘信息,提出t c c v 2 t e v ( t h r e s h o l de d g ev e c t o r ) 算法颜色相关图 法f 4 j 强调同一颜色在图像中的空间距离相关性,其检索效果比上述几个方法都要 好,但计算量比较大s t r i c k e r 5 】提出的颜色矩算法主要是采用图像中各颜色的 均值和方差作比较,处理简单,可用它作为图像检索的初检,为下一步的细检缩小 搜索范围基于颜色特征的检索会丢失目标物体的空间信息,并且图像的色彩对 于光照条件异常敏感,在光照变化时,检索准确性也会大受影响。 另外一种用来描述物体内容的特征是纹理( t e x t u r e ) 。在图像处理中纹理用 来反映区域中象素灰度级的空间分布关系。纹理特征是不依赖于颜色或亮度变化 的反映图像本质的视觉特征。自然界中几乎所有物体表面所共有的就是其纹理特 征,纹理特征反映的是物体表面结构组织的排列以及和周围环境的关系。纹理的 定义和量化方法很多,可以从图像中非常具有结构规律的特性加以分析得到纹理 特征,或者可以对图像中颜色强度的空间分布信息进行统计得到纹理信息。 h a r a l i c k 【6 】纯粹从数学上研究了图像纹理中灰度级的空间依赖关系,根据图像中 象豢之阳i 的方位和距离关系构造了一个共生矩阵( c o m a t r i x ) ,然后从中提取有 中国科学技术大学碗士论文 意义的统计特性作为纹理特征的表达,使用的特征主要有能量、熵、相关性和惯 量,该方法最大的缺点是这些统计特性没有和人在 见觉上对纹理特征鉴别之阃建 立联系。t a m u r a 7 1 等人提出的纹理特征集,建立在人们对纹理的视觉感知的心理 学研究的基础上,这些特征包括粗裢度( c o a r s e n e s s ) 、对比度( c o n t f a s t ) 、方向 度( d i r e c t i o n a l i t y ) 、线像度( l i n e l i k e n e s s ) 、规整度( r e g u l a r i t y ) 和粗略度 ( r o u g h n e s s ) ,其中前三个对于图像检索比较重要,随着小波变换的发展,在纹 理分析中也得到广泛的应用,s m i t h 8 , 9 1 从小波子波段中提取统计特征作为图像的 纹理表示,耿得良好的检索效果;c h a n 9 1 1 0 】r 4 , 波中波段中提取特征,采用树结 构小波变换来进步提高图像分类能力;m a o i l 系统的比较各种小波变换形式, 基于g a b o r 小波变换的纹理检索方法的效果最好。用纹理特征的检索目前存在的 主要问题是各种方法所选择的纹理特征集依赖于具体韵纹理强像,往往是一种方 法所选择的纹理特征集对表达个纹理图像库有效,但对另一个纹理图像库来说 不一定可行。 形状( s h a p e ) 是图像表达和检索中的另外一个非常重要的特征内容。在进 行物体识别和判断的时候,形状是本质特征之一,不随物体的平移、旋转、尺度 等几何变换而变化。对物体形状特征有两种表示方法,一种是形状轮廓( c o n t o u r ) 特征,另外一种是形状区域( r e g i o n ) 特征。基于形状轮廓的描述主要有链码表 示陋1 ”、样条曲线陋2 0 1 、直线段描述严2 5 1 、傅立时描述子7 6 , 2 7 1 等等;基于彤! 帙 区域特征的描述主要有h u l 2 8 1 在1 9 6 2 年提出的7 个形状不变矩( m o m e n t i n v a r i a n t s ) 、形状面积、圆形度、主轴惯量、离心率以及矩形度等方法。由i b m 的f l i c k e r 等人设计的q b i c 图像检索系统中采用的就是区域描述方法形成的特 征矢量,形状之间的相似性使用加权欧几里德( e u c l i d i a n ) 距离进行度量。在基 于形状特征的图像检索中,形状边界的自动提取直是困扰图像处理领域多年的 难题。在目前的检索系统中一般采用手工勾勒的方式,对于海量图像数据此间题 将会显得更为严重。 空间关系是图像中各对象的基本关系之一,直角坐标系是其最直接的表示法 在g i s ( g e o g r a p h i c a li n f o r a a t i o ns y s t e 曲的应用中,人们对空闯关系的表征和 检索技术进行了研究,用种2 d 串 2 9 】的索引技术来表征空间关系,l i u 和s u n 还使用直角坐标的方法对物体之问的关系进 亍了分级性表示,既有粗略的表示法 中田科学技术大学硕i :论文 又有精细的表示法s is t l a p l 】定义了一套基本关系集来表达空间关系,主要包括 左、右、前、后、上、下、内、外、重叠等,这些定义简化了物体问的空间关系, 但是忽略了距离概念,使其应用场合受到限制, 1 3 论文的研究内容和组织结构 针对基于形状特征的图像检索技术中形状边界提取、形状特征提取,以及特 征向量的相似性度量等相关问题展开研究。本文着重研究了运用c u r v e l e t 变换用 于图像边缘检测的问题,并提出了一种有效的线边缘提取的方法,深入分析了边 界不变矩特征提取平移、旋转、尺度不变性,同时基于线边缘的局部特征提取, 对l e v e n s h t a i n 距离提出了一种平滑特征分量的改进模型,本文还探讨了使用全 局、局部特征和分级进行检索的性能差异。 本文的后续内容由以下几个章节组成: 第二章简单介绍了基于内容图像检索和传统基于文本检索的茬异,以及基于 内容检索的关键技术,最后介绍了几个基于内容检索的典型系统。 第三章深入讨论了c u r v e l e t 和r i d g e l e t 变换的框架结构。介绍了r i d g e l e t 变 换的原理和算法,以及由此导出的c u r v e l e t 变换的构成与实现,系统的阐述了实 现c u r v e l e t 变换的不同方法。 第四章主要面向基于内容图像检索中的形状边界的提取问题,提出了一种基 于c u r v e l e t 变换的局部线边缘检测方法( c u r v e l e t b a s e dl o c a ll i n e a r e d g e d e t e c t i o n ) c l l e d 。我们首先分析了基于组合理论的r i d g e l e t 和c u r v e l e t 变换在 边缘恢复时存在的卷绕( w r a pa r o u n d ) 效应;而后基于上述分析,提出了一种 根据子块r a d o n 变换最大系数,确定边缘点集合和集合中边缘强度最大的点,然 后根据有限r a d o n 交换中每个系数都会对应一个线边缘的主方向的原理,结合主 方向和最大边缘强度的点来确定局部线边缘的方法,有效消除了c u r v e l e t 变换在 边缘恢复时的卷绕效应;最后基于经典的边缘跟踪( e d g et r a c e ) 方法,我们研 究了根据c u r v e l e t 变换重要子块方向信息连接线边缘段的方法。 第五章详细的介绍和研究了不变矩全局形状描述,并根据多边形顶点描述的 局部形状特征,提出了一种将l e v e n s h t a i n 距离的改进算法用于局部形状相似性 度量。我们首先探讨了形状区域h u 矩在尺度变化时不变性原理,根据这一原理 中国科学技术人学硕士论文 修汇了h u 不变矩的归一化公式用于形状边界的不变矩特征描述。基于多边形顶 点的内角和到邻接顶点的距离等特征参数,在传统l e v e n s h t m n 距离编辑操作中, 加入了一种平滑顶点的操作,非常符合人对形状相似性的视觉感受,并提取形状 边界的多个局部特征,来寻找两个物体局部形状的最佳匹配,有效提高了局部形 状匹配的准确性。 第六章对基于形状全局和局部特征的分级检索进行了研究。系统的分析了采 用上述全局特征和局部特征进行检索的独立系统存在的问题,研究了分级检索系 统结构。使用分级检索,系统检索速度提高了一个数量级,准确性也有所提高。 第七章对本论文的工作做了总结和展望。概括了论文的主要研究工作和取得 的成果,并主要就论文中的不足之处提出一些今后研究的重点和方向。 中网科学技术人学硼l j 论文 第二章基于内容图像检索的研究现状及其关键技术 信息化社会的到来以及信息高速公路计划的普遍实施,人们越来越多地接触 到大量的图像信息,同时。每天都有大量的图像信息在不断产生( 如卫星、天文、 医疗、安全等部门) ,这些信息的有效组织和检索成为人竹 研究的课题。基于内 容的图像检索( c b i r ,c o n t e n tb a s e di m a g er e t r i e v a l ) 技术是解决这一问题的关 键。所谓基于内容检索,即从图像库中查找含有特定物体的图像( 也包括从连续 的视频图像中检索还有特定物体的视频片断) ,它区别于传统的检索手段,融合 了图像理解技术,从而可以提供更有效的检索手段。 本章介绍并讨论了基于内容检索的关键技术,比较了c b i r 技术和传统的基 于文本检索技术的差异,最后介绍了几个基于c b i r 技术的典型系统。 2 1 引言 基于内容的图像检索根据图像库的内容可分为通用检索系统和专用检索系 统,专用检索系统往往根据系统专门的要求设计检索方法,如:公安部门需要根 据指纹图像进行罪犯资料的查询,医学工作者需要从医学影像库中查找一些相关 的病人资料,而通用检索系统则要考虑满足各种需要,比如:基于互联网的图像 检索。由于不同的应用背景,不同的检索系统在实现中采用的技术也各有侧重。 2 2 基于内容的图像检索系统构成 基于内容的图像检索系统由数据库生成和查询两个基本子系统构成,如图 2 1 所示 3 2 】,每个子系统由相应的功能模块和部件组成。主要包括: ( 1 ) 交互控制。系统提供用户查询方式,然后把查询结果返回给用户,让 用尸1 浏览。现在大部分系统还提供用户反馈交互,以此提高系统查询的准确性。 ( 2 ) 特征内容提取。从包含大量信息的图像象素矩阵中分解出不同种类的 视觉特征信息,主要包括颜色、纹理、形状特征。提取的这些视觉特征可以是整 体的,也可以是局部的。 ( 3 ) 数据库。由图像库、视觉特征库以及文本注释库。图像库为数字化的 中国科学技术人学顾上论文 图像信息,在大型数据库中对于图像一般采用压缩的方法进行存储;视觉特征库 用来存储提取出来的视觉特征:文本注释包括图像的关键词和对强像自由描述的 文本,它是基于内容检索的必要补充,主要涉及文本信息检索和数据库管理技术。 ( 4 ) 索5 i 。图像特征一般都是高维的,对图像的检索对应空间数据库中高 维数据的近邻检索问题。在图像数据较多时,空问数据库具有很大的数据量,而 且数据维数较高,无论是计算量还是计算复杂度都远远超过传统的关系数据库。 为了能够高效地进行数据( 特征) 索引,从而提高系统检索的速度目前对索引 技术的研究主要有降维方法和建立高维索引,其中降维的方法有k l t ( k a r h u n e n l o e v e ) 变换,以及聚类方法删,高维索引方法有r - t r e e 【3 9 ,4 0 1 为代表 的高维空间索引。 ( 5 ) 相似度计算。基于内容的图像检索是利用特征之间的相似函数来进行 匹配,可以从特征库寻找匹配的特征,也可以临时计算对象的特征。匹配引擎包 括一个较为有效的、可靠的相似性测度函数集。 图2 ,i 墓于内容检索系统一般构成 中国科学技术大学顺十论文 2 3 基于内容的图像检索典型系统介绍 2 3 1q b i c d 3 i i b m 公司开发的q b i c ( q u e wb yi m a g ec o n t e n t ) ,系统组成分为图像入库、 特征计算、查询三部分,采用了颜色、纹理、形状和手绘草图等图像特征的索引 方法。其中颜色特征的表达有平均色、色彩直方图两种方法:纹理特征的表达采 用了粗糙度、对比度和方向性三者的综合;形状特征的表达采用了形状面积、圆 形度、离心率、主轴方向以及不变矩等方法。q b i c 的相关图像检索技术已经制 成独立产品,如:i b m 数字图书馆、超媒体管理器、d b 2 数据库的图像扩展等 工具软件。q b i c 是第一个商用的基于内容的图像检索系统,所采用的技术和系 统构架对后来的图像检索系统有深远影响。 2 3 2v i r a g e 3 4 】 v i r a g e 是由v i r a g e 公司开发的一个基于内容的图像搜索引擎。v i r a g e 系统中 图像特征的提取需要经过预处理,然后提取图像的特征索引,将这些特征称为“原 语”,可分为颜色、颜色布局、纹理以及空间结构等原语。v i r a g e 系统的特点在 于:支持上面4 种基本原语的任意组合方式的检索。用户可以根据自己的兴趣, 调节特征的权值。“原语”( p r i m i t i v e ) 可以进一步分为通用型( 如颜色,形状, 纹理等) 和特定领域原语( 如脸部识别,癌细胞检测等) ,各种有用的“原语”根 据领域要求而加入开放式构架。 2 3 3m a r s l 3 5 j m a r s ( m u l t i m e d i a a n a l y s i sa n dr e t r i e v a ls y s t e m ) 是由i l l i n o i s 大学u r b a n a - c h a m p a i g n 分校开发的。在研究范畴和其所采用的技术上,与其他系统都有很 大的不同。它是一个多学科领域共同研究的成果,包括:计算机视觉、数据库管 理和信息检索。m a r s 的特点是综合了数据库管理系统和信息检索,索引和检索 技术的融合。m a r s 的研究不是集中于要找到单一的最好的特征描述,而是如何 组织各种视觉特征到一个有意义的检索的结构体系中,此体系适用于不同的应用 ! 里型堂塾查茎兰堕生塑璺三 利不同的用户。m a r s 首先正式地提出了一个图像检索相关反馈的结构体系,并 且在检索的不同层次结合此技术,包括搜索向量优化,自动匹配工具选择和自动 特征适应。 2 3 4p h o t o b o o k 3 6 p h o t o b o o k 是m i t 媒体实验室实现图像浏览和查询的交互式工具。它把提取 的彤状、纹理以及恧部特征存放在三个s u b b o o k s ,用户可以根据响应的特征进 行查询。 p h o t o b o o k 的最新版本一f o u r e y s ,在图像检索中考虑了人的介入。这主要是 基于即使最好的单个特征也无法满足任何情况下的处理要求这一普遍存在的现 象。实验表明,改进过后的系统性能有明显提高。 对图像检索的研究涉及诸多学科,如计算机视觉、图像处理、模式识别、数 据库等等。目前国内外对其研究还处在初期阶段,各种标准和规范仍很不健全。 基于内容的图像检索的关键技术包括提取合适的图像视觉特征,建立良好的特征 描述模型以及使用高效的索引方法。正因为基于内容的图像检索的广泛需求和技 术实现的困难复杂性,使它日益成为国内外的研究热点。 本文的后续部分针对基于形状特征进行检索的几个关键技术做一些尝试性 的 :作。 中国科学技术大学硕士论文 第三章c u r v e l e t 变换及其算法分析 近年束,小波理论在信号处理中的应用得到了很大的发展,其地位也目益重 要。根本上讲,这得益于小波变换能够高效地对一维分段连续信号进行分析。对 于两维图像处理,常用的两维小波则是一维小波的张量积,采用分离的变换核先 对图像做水平方向的小波变换,然后再进行垂直方向的小波变换,这样的两维小 波变换的基是各向同性的( i s o t r o p i c ) ,变换系数的局部模极大值只能反映出这 个小波系数出现的位置是“过”边缘( a c f o s se d g e ) 的,而无法表达“沿”边 缘( a l o n ge d g e ) 的信息,这就使得传统小波变换在处理两维图像时表现出一定 的局限性。 为克服这一局限,1 9 9 8 年c a n d e s ( 现任加州理工应用与计算数学系副教授) 在其博士论文中提出了r i d g e l e t 变换的概念,采用r a d o n 对图像进行变换,把 图像中的一维奇异性,比如图像中的直线,映射成r a d o n 空间的一个点,并用一 维小波进行点奇异性的检测,从而有效解决了小波变换在处理两维图像时的问 题。然而,自然图像中的边缘线条以曲线居多,对整副图像进行单尺度 r i d g e l e t “分析并不十分有效,因此需要对图像进行分块使每个分块,使每个分 块中的线条都近似直线,再对每个分块进行m d g e l e t ,这就是多尺度r i d g e l e t 4 7 1 ( m u l t i s c a l er i d g e l e t ) 。多尺度r i d g e l e t 分析的冗余度是很大的,简单的闽值处 理不能够获得图像边缘的有效稀疏表示,严重影响了多尺度r i d g e l e t 变换在图像 处理中的应用。 针对多尺度r i d g e l e t 分析的问题,d o n o h o 【4 4 1 等人提出c u r v e l e t 概念,首先 对图像进行子带分解,然后对不同尺度的子带图像采用不同大小的分块,最后对 每个块进行r i d g e l e t 分析。每个子块的频率带宽w i d t h 、长度l e n g t h 近似满足关 系w i d t h = l e n g t h 2 ,这种频率划分的方式满足抛物线方程,近似曲线,使得 c u r v e l e t 变换对图像的表示更加有效。 本章详细论述了c u r v e l e t 以及r i d g e l e t 变换的原理,介绍了不同方法的算 一:! 旦! ! 兰丝查查兰塑= ! :! 笙墨 一 -_一 法实现,并根据试验简要分析了c u r v e l e t 和r i d g e l e t 变换在图像去噪、对比度 增强等应用中的性能。 3 2c u r v e l e t 和r i d g e l e t 变换的理论框架 3 2 1r i d g e l e t 变换的基本原理 r i d g e l e t 4 5 , 4 6 变换可以看作图像进行r a d o n 变换,把一条直线映射成r a d o n 域上的一个点,然后对每个方向上的r a d o n 变换所产生的系数进行小波分析,这 样就可以检测图像中线性边缘的方向和位置信息。 r i d g e l e t 函数的形式a - 1 2 融lc o s 0 + x 2s i n 0 一b ) a ) ,其中口是r i d g e l e t 变 换的尺度因子、b 是r i d g e l e t 变换位置参数即截矩偏移、目是r i d g e l e t 变换的方 向。双变量的r i d g e l e t 函数: 儿= 口“2 lc o s o + x 2s i n 0 6 ) d ) ( 3 1 ) 对于一个可积分的双变量函数0 ) ,r i d g e l e t 变换的形式? r s ( 。,b ,移) = f v o , b , o 扛沙b 净 ( 3 - 2 ) 重构公式如下: 几) = f ”e r 尺,咖叫。塑a ,珊塑4 n - ( 3 - 3 ) 图3 1 【4 7 1 是r i d g e t e t 函数的一个三维显示图,从图中可以看出r i d g e l e t 函数沿着 脊线x c o s 0 + 晶s i n 0 是不变的,而在脊线的垂直方向上,则是小波函数的变化曲 线。 中尉科学技术人学硕士论文 幽3 一ir i d g e l e t 函数三维显不幽 通过r a d o n 4 8 1 变换的原理可以把r i d g e l e t 变换和小波变换联系起来,x 4 y :- - 个双变量函数f ,其r a d o n 变换: w ( o ,) = i j ( x ,x :p g 。c o s 0 + x :s i n 0 一,) 出,d x : ( 3 - 4 ) 一般采取规范化的表示式,即一1 ,1 , 0 0 2 ;7 。对于某一固定的p ,为了表 达的方便, e f ( o , ,) 简写成彤:( f ) 则式( 3 4 ) 可写成: r z ( t ) = i i ( x , ,x 2 ) d ( x 。c o s 0 , + x 2s i n 0 , 一,) 出。也 ( 3 5 ) 这样就可以根据r a d o n 变换的性质,重写r i d g e l e t 变换的公式如下: r s 0 ,b ,曰) = f e i ( o , - 。”心一b ) a ) d t ( 3 6 ) 上式表明r i d g e l e t 变换是对r a d o n 变换的切片的一维小波分析,其中方向角曰是 固定的,而变量r 是小波分析的对象。从公式( 3 - 4 ) 、( 3 - 6 ) 可以看出,r a d o n 变换是r i d g e l e t 变换和小波变换之间的桥梁,三者之间的关系如下图所示。 图3 - 2r i d g e l e t 、r a d o n 和w a v e l e t 变换的联系 中国科学技术人学硕士论文 3 2 2c u r v e l e t 变换的基本原理 由前述可知,r i d g e l e t 变换即为采用r a d o n 变换的映射原理,把图像中的直 线变成r a d o n 空间中的一个点,这样就可以利用小波变换的点奇异性检测的优 势,从而对图像进行有效表示。然而,自然图像中的边缘线条以曲线居多,对整 副图像进行r i d g e l e t 分析并不十分理想,c u r v e l e t 变换的原理就是对图像各个 频率子带,采用一定的分块策略,把视觉上弯曲的一条线分割到不同的子块中, 在每个子块中,包含的都是一些近似直线,这样就可以利用r i d g e l e t 进行分析。 综合来讲,c u r v e l e t 4 9 - 5 1 1 变换的步骤可以如下: 1 子带分解。 把图像( x 。,x :) 分解到不同的予带 k 。 ,l ,i - - 。f ,p 。 、 2 分块。每一个子带加窗处理,每隔一个子带,窗口的宽度整加一倍。 3 r i d g e l e t 分析。对每一个正方形进行r i d g e l e t 变换分析。 其中a ,= 甲:,t 厂,巾:。g ) = 中( 2 2 5 f ) ,a ,的通带在k “,22 j + j j ,通带。包含的频 带宽度是2 。5 ,而通带。的长度,也就是窗口的大小是2 一,所以对于每个 r i d g e l e t ,满足w i d t h = l e n g t h 2 ,各向异向。 通常小波变换 5 2 1 所得到的频带分割是 25 ,2 ,而c u r v e l e t 变换为了满足各 向异性的要求,要求在尺度s 时,所得到的频带宽度1 2 n ,2 :一l ,可以通过小波 分解后频带的合并来得到c u r v e l e t 的频带要求。小波变换得到图像在f2 5 ,2 ”1l 频 带中的信息,然后合并两个相邻小波的频带形成c u r v e l e t 的频带,c u r v e l e t 在尺 度s = 1 时的子带对应的小波子带j = 1 :s = 2 时对应小波子带j = 2 ,3 ;s = 3 时对 应小波子带j = 4 ,5 。具体的c u r v e l e t 子带分解和对应的窗口宽度如图示。每隔小 波分解的一个子带,c u r v e l e t 分割窗的宽度整加一倍,这就满足了c u r v e l e t 频带 划分的要求,达到c u r v e l e t 变换的各向异性的性质。图3 - 3 是进行子带分解和分 块的示意图。 中国科学技术大学硕士论文 图3 3c u r v e l e t 子带分解和分块策略的示意图 3 3 基于f f t 的r i d g e l e t 变换 r i d g e l e t 变换是对r a d o n 变换后切片的一维小波分析,所以要实现离散 r i d g e l e t 变换,第一步是对图像进行离散r a d o n 变换,然后在r a d o n 变换域中对 沿着方向的切片进行一维离散小波分析。实现离散r a d o n 变换的方法很多,这里 重要介绍两种方法,一种是基于快速傅立时变换( f f t ) 的,另外一种是基于组 合理论的有限( f i n i t e ) r a d o n 变换,根据r a d o n 变换实现方式的不同,相应的 在进行小波分析时,所采用的方法也会有差异。本小节介绍基于f f t 的 r i d g e l e t l 4 9 , 5 。3 变换,下- d , 节介绍基于组合理论的r i d g e l e t l 4 7 驶换。 3 3 1 基于f f t 的r a d o n 变换 在r a d o n 变换领域有一个著名的定理一投影切片定理,在r a d o n 变换公式 ( 3 - 4 ) 的两边进行傅立叶变换,就得到的r a d o n 变换投影切片公式 4 8 , 5 3 1 : f ( a c o s 0 ,2s i n 0 ) = f 肜( r ,矽“d t ( 3 7 ) 上式表明r a d o n 变换可以通过在沿着过原点的辐射线上进行两维傅氏变换,然后 再进行一维傅氏反变换来实现。基于快速傅氏变换来实现数字r a d o n t 5 明变换的步 骤可以描述如下: 1 2 一d 肝丁,f 盯的结果是( 尼i ,k 2 ) ,一n 2 k ik 2 茎n 2 1 。 1 9 中国科学技术大学硕士论文 2 c a r t e s i a n 坐标到p o l a r 坐标的转化。 3 。1 一d ,研1 ,对于每一个角度,也就是沿着每条过原点的辐射线线进行 l f f l , 其中夕( 女,哎) 是对应图像矩阵厂( f 。,f :l o 茎i ,i :h 一1 的两维傅立叶变换。 傅立叶变换的结果为c a r t e s i a n 坐标,而接着的仃f r 变换则要求沿着角度方 向进行,是一种极坐标( p o l a r ) 下的变换。所以必须进行两种坐标的转换,即 c a r t e s i a n 坐标到p o l a r 坐标的转换。需要注意的是,这里所采用的极坐标有其特 殊的形式:传统的圆形辐射线变成了正方形,这种正方形我们把它叫做矩极格栅。 矩极
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新产品营销组合方案(3篇)
- 旺季汽车营销方案策划(3篇)
- 标线施划施工方案(3篇)
- 毕业支部活动策划方案(3篇)
- 涉及公路的施工方案(3篇)
- 热喷涂的施工方案(3篇)
- 生日策划校园活动方案(3篇)
- 石方填筑冬季施工方案(3篇)
- 竹筷日本营销方案(3篇)
- 绿化排水孔施工方案(3篇)
- 2026安徽省滁州市皖东公证处招聘司法辅助劳务派遣人员3人笔试备考试题及答案解析
- 初中英语写作教学中生成式人工智能的辅助应用研究教学研究课题报告
- 2026中国航空发动机产业发展现状与技术突破路径研究报告
- 2026浙江省绿电直连政策及新能源就近消纳价格政策解读
- 2026年及未来5年市场数据中国智能水杯行业市场深度研究及发展趋势预测报告
- 急性胰腺炎的综合治疗方案
- 新一轮千亿斤粮食产能提升行动方案全文
- 2026浙江事业单位统考嘉兴市招聘107人考试参考题库及答案解析
- 物业保安服务工作方案范文
- 《2023版CSCO小细胞肺癌诊疗指南》
- 肾内科学科建设发展规划
评论
0/150
提交评论