




已阅读5页,还剩54页未读, 继续免费阅读
(计算机应用技术专业论文)基于形状的图像检索.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于形状的图像检索 侯昆鹏( 计算机应用技术) 指导教师:李宗民( 教授) 摘要 基于内容的图像检索是当前多媒体技术和人工智能的热点课题之一, 它直接对图像内容( 如图像的颜色、形状、纹理、背景等) 进行分析,并 对图像特征进行合理的描述,使得检索过程更加有效,更能适应人的视觉 特征。形状是图像最显著的视觉特征之一,基于形状的图像检索是基于内 容的图像检索的一个十分重要的方面,通过提取物体的形状特征,利用形 状特征间的相似度实现图像的检索。本文的主要研究内容和贡献如下: ( 1 ) 对基于形状的图像检索的关键技术形状特征的提取和特征空 间中的相似性度量进行了深入的研究,详述了目前已有的几种算法,并从 应用的角度分析了它们各自的优缺点。 ( 2 x 提出了一种基于结构矩的图像特征提取方法。这种方法是将原有 密度函数变换到新的密度函数而得到的,具有良好的平移、旋转和尺度缩 放不变性,能够描述复杂结构图像的形状,是对不变矩方法的一种发展。 ( 3 ) 提出了一种基于三角函数的相似性度量方法。这种方法能够将数 轴上任意两点之间的距离归一化,大大降低了特征子之间的量纲差异对整 个特征距离的影响,提高了图像检索的准确性。 关键词:图像检索,形状,结构矩,三角函数距离 s h a p e - b a s e di m a g e r e t r i e v a l h o u k u n - p e n g ( c o m p u t e ra p p l i c a t i o nt e c h n o l o g y ) d i r e c t e db yp r o f e s s o rl iz o n g - m i n a b s t r a c t c o n t e n t - b a s e di m a g er e t r i e v a l ( c b i r 】i so n eo ft h em o s ta c t i v eh o t s p o t si n t h ef i e l d so fm u l t i m e d i ar e t r i e v a la n da r t i f i c i a li n t e l l i g e n c e i tc a l l d i r e c t l y a n a l y z ei m a g ec o n t e n ts u c h 鹄c o l o r , s h a p ea n dt e x t u r e ,e t c ,d e s c r i b ei m a g e f e a t u r e sr e a s o n a b l ya n dm a k er e t r i e v a lp r o c e s sm o r ee f f e c t i v ea n dm o r e a d a p t i v et oh u m a nv i s i o n s h a p ei so n eo fm o s tp r o m i n e n tc h a r a c t e ro fi m a g e s h a p e - b a s e di m a g e r e t r i e v a li so n eo fm o s ti m p o r t a n tp a r to fc o n t e n t - b a s e di m a g er e t r i e v a l i t e x t r a c t sa n dd e s c r i b e ss h a p ef e a t u r e sa n dr e a l i z e sr e t r i e v a lb yt h es i m i l a r i t yo f s h a p ef e a t u r e s 1 1 璩m a i nc o n t e n t sa n dc o n t r i b u t i o i l so ft h i st h e s i sa r es u m m a r i z e da s f o i l o w s : ( 1 ) t h ek e yt e c h n i q u e so fs h a p e - b a s e di m a g er e t r i e v a l ,w h i c hc o n c l u d e s e x t r a c t i o no fs h a p ef e a t u r e sa n ds i m i l a r i t ym e a s u r e m e n ti nf e a t u r es p a c e ,a r e s t u d i e di nd e p t h t h ep r e s e n ta r i t h m e t i ci sd e t a i l e d ;a l s ot h ea d v a n t a g e sa n d d i s a d v a n t a g e so f t h e ma r ea n a l y z e df r o mt h ev i e wo f a p p l i c a t i o n ( 2 ) an e we x t r a c t i o nm e t h o db a s e do ns t r u c t u r em o m e n ti sp r o p o s e df o r s h a p ef e a t u r ee x t r a c t i n g s t r u c t u r em o m e n ti sa c h i e v e db ys h j 衔n go r i g i n a l d e n s i t yf u n c t i o nt oan e wo n e i ti si n v a r i a n tw i t hr e s p e c tt op o s i t i o n , s c a l ea n d o r i e n t a t i o n , a n dc a nd e s c r i b et h ef o r mo fc o m p l i c a t e ds t r u c t u r e2 - do b j e c t s ( 3 ) an e ws i m i l a r i t ym e a s u r e m e n tm e t h o db a s e do nt r i g o n o m e t r i cf u n c t i o n d i s t a n c ei s p r o p o s e d t h i sm e t h o ds a t i s f i e sm e t r i cp r o p e r t i e s ,a n dc a n n o r m a l i 孺t h ed i s t a n c eb e t w e e nt w or a n d o mp o i n t so l ln u m b e ra x i s i tr e d u c e s i i i e f f e c t so ht h ew h o l ec h a r a c t e rd i s t a n c ec a u s e db yd i m e n s i o n a ld i f f e r e n c eo f c h a r a c t e rf a c t o r sa n di n c r e a s e sa c c u r a c yo fi m a g er e t r i e v a l k e yw o r d s :i m a g er e t r i e v a l ,s h a p e ,s t r u c t u r em o m e n t , t r i g o n o m e t r i cf u n c t i o n d i s t a n c e 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中国石油 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。 年月日 关于论文使用授权的说明 本人完全了解中国石油大学有关保留、使用学位论文的规定,即:学 校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存 论文。 ( 保密论文在解密后应遵守此规定) 学生签名:堡垒丝 导师签名:鱼髫:型 正 经 月 月 日 日 中国石油大学( 华东) 硕十论文第1 章前言 第1 章前言 1 1 课题来源、提出背景及意义 本课题来源于国家科技攻关课题数字化三维人体运动的计算机 仿真研究( 编号:2 0 0 1 b a 9 0 4 8 0 8 ) 。 近年来,随着存储技术、数字影像设备等相关技术的进步,许多领 域都出现了越来越多的数字图像。然而,如果我们不对他们进行有效的组 织,就无法达到高效率的浏览和检索。自上世纪7 0 年代初期,图像检索 便成为一个非常活跃的研究领域,其推动力主要来源于两大研究团体:数 据库系统和计算机视觉,它们从基于文本以及基于内容这二个不同的角 度,对图像检索作了研究。 基于文本的图像检索,其研究主要在数据库领域中进行。它的一个 典型框架是:首先对图像用文本进行注解,然后用基于文本的数据库管理 系统( d b m s ) 来进行图像检索。但是,基于文本的图像检索存在着两大困 难,尤其是当图像的数量非常大的时候,其一是手工对图像进行注释所需 的工作量太大,其二是图像注解的主观性和不精确性可能导致的检索过程 中的失配。 上世纪9 0 年代初期,由于大规模图像数据库的出现,由手工进行图 像注解这一方法所带来的困难已变得十分尖锐。为了克服这一困难,研究 者们提出了基于内容的图像检索,其思路是,不同于基于关键字的手工注 解,图像由其自身的视觉内容,如颜色、纹理等索引的,这便是基于内容 的索引。在这一思路的指导下,无论是在研究方面还是在商业方面,在短 时间内,发展了许多技术。 中国石油大学( 华东) 硕七论文第1 章前言 在基于内容的图像检索系统中主要是使用图像的颜色、纹理和形状 等特征来进行图像的匹配工作的。颜色特征是最可靠、使用最广泛的视觉 特征,它具有与生俱来的旋转不变性,对复杂背景图像相对健壮,与图像 大小和方向无关。颜色特征适用于色彩较为丰富的图像,如风景类图像。 对于纹理,目前尚没有明确的定义,一般把图像中局部不规则而整体有规 律的特性称为纹理。纹理特征适用于物体和背景不易分割的图像,单纯使 用纹理特征的检索并不总能得到纹理明显相同的图像,除非数据库中包含 许多含有主要纹理的图像。形状是刻画物体的本质特征之一,因此利用形 状检索可以提高检索的准确性和效率。但是,形状相似性在基于模式的视 觉中是一个困难的问题。理想情况下应该可以抽取用于描述图像视觉特性 的最佳形状特征,但是至今对于形状如何描述还没有正式的框架。从计算 的角度来说,一个好的形状特征应该满足对于噪声、遮挡和几何变形的鲁 棒性以及对于图像微小变化的稳定性。另外,相似的形状其特征向量应该 近似,并且与其它特征向量有较大不同。形状特征由于不易提取,一般只 对物体形状易于识别的图像较为适合,基于形状的检索常可能检索到意外 的结果,因此用的相对较少。 在本课题中,主要是研究基于形状特征的图像检索,目的就是要找到 更好的不受或很少受物体的尺寸、方向和相对位置这三个因素的影响形状 特征描述方法,以及与之相适应的相似性度量方法,以提高图像检索准确 率,使得形状特征在基于内容的图像检索中扮演更加重要的角色。 1 2 相关技术及现状 形状是刻画物体最本质的特征,也是最难描述的图像特征之一对基 于形状特征的检索来说,形状特征的提取、相似性度量准则的定义一直是 2 中国石油大学( 华东) 硕士论文第l 章前言 着重解决的两个技术难点。 1 2 1 形状特征提取 对形状特征的提取主要是寻找一些几何不变量,目前用于图像检索的 形状描述方法主要有两类:基于轮廓和基于区域的形状方法。前者利用图 像的边缘信息,而后者则利用区域内的灰度分布信息。 基于轮廓的形状特征提取是在边缘检测的基础上,用面积、周长、偏 心率、角点、链码、兴趣点、傅立叶描述子、矩描述子等特征来描述物体 的形状,适用于图像边缘较为清晰、容易获取的图像。这其中最具有代表 性的是傅立叶描述子法。傅立叶描述子法是通过对图形边界作傅立叶变换 作为形状特征的,一些早期的工作可以参看文献【”、文献 2 1 。考虑到对图 形数字化后的噪声的影响,r u i p l 等人对傅立叶描述子方法进行了改进, 改进后该方法不仅对数字后噪声具有鲁棒性,而且对几何变换同样具有鲁 棒性。基于轮廓的特征提取还有很多其它的方法,如文献【4 】中首先对图像 进行了高斯平滑,接着使用经典的兴趣点检测算法发现兴趣点,然后用兴 趣点的测度值作为图像特征进行匹配。t a 0 1 5 1 提出将图像边缘上的角点作 为特征点,然后使用d e l a u n a y 三角形进行划分,记录三角形的形状特征 来描述图像的形状特征,这种方法由于是基于边缘上的一些特殊点,因此 对噪声和点位置的变化较为敏感。j a i n e 采用边缘方向直方图来刻画形状 特征,具有简单、平移不变性等优点,但也存在不具备尺度、旋转不变性 等缺点。 基于区域的形状特征提取的主要思路是通过图像分割技术提取出图 像中感兴趣的物体,依靠区域内像素的颜色分布信息提取图像特征,适合 于区域能够较为准确的分割出来、区域内颜色分布较为均一的图像。这一 类特征提取方法中最具有代表性的是不变矩特征提取法。h u t 7 1 于1 9 6 2 年 中国石油大学( 华东) 硕士论文第l 章前言 首次提出了不变矩,后来又陆续提出了许多矩理论,如z , e r n i k e 矩嘞、伪 z e r n i k e 矧9 】、l e g e n d r e 8 斑等等。由于这些矩有良好的平移、缩放、旋转 不变性,因此被广泛的应用于基于内容的图像检索中。除此之外,还有许 多别的基于区域的特征提取方法,文献【1 川应用变形模板技术,把用户提供 的形状看作模板,与图像库中的形状进行匹配。由于是直接比较两个形状, 因此具有较高的精度,但同时计算量也较大,b i m b o 等【”1 提出了一种形状 弹性匹配算法,首先确定感兴趣区域,在这些区域中采用爬山优化算法获 取图像边缘并用这些边缘代表物体形状,这种方法的优点是对图像边缘进 行了筛选,缺点是需要人工干预。 1 2 2 相似性度量 图像的形状特征提取出来后,很直观的方法是直接使用特征向量的 距离来衡量两幅图的相似性。通常使用的是几何矩阵模型,将图像的特征 向量看成是特征空间中的点,两个点之间的距离表示它们之间的相似程度 【1 2 i 【1 3 1 1 4 1 。 目前常用的相似性度量方法有m i n k o w s k y 距离、欧氏距离、 m a n h a l a n o b i s 距离等【1 5 】【1 6 1 1 7 1 。 m i n k o w s k y 距离是若干种距离的通式表示,一阶的m i n k o w s k y 距离 为m a n h a t t a n 距离,二阶的为欧氏距离。m i n k o w s k y 距离的计算比较简单, 应用比较广泛。m i n k o w s k y 距离受到特征向量的量纲影响很大。在图像检 索过程中,必须对数据进行标准化处理以统一量纲,使它具备度量的可比 性和一致性。m i n k o w s k y 距离包含了特征属性的差异,可以从总体上估计 可视化非相似性。当特征向量具有不同取值范围,利用加权m i n k o w s k y 距离来进行图像相似性度量比较合适。m i n k o w s k y 距离没有考虑特征差异 的组合,同时也没有考虑特征向量的多重相关性,特别是当两个特征具有 4 中国石油大学( 华东) 硕十论文第1 章前言 高度相关性的时候,可能会对相似性度量产生很大影响。 欧氏距离是最简单的距离公式,由于它在一定程度上符合视觉人的 心理上对图像差异的感受,从而在基于内容的图像检索中得了较为广泛的 使用。但是欧氏距离完全不考虑向量各特征分量之间的关系,而且各特征 分量是同等重要的,这就大大影响其使用范围和有效性。 m a h a l a n o b i s 距离的优点是它重视样本的统计特征,排除了样本间的 相关性影响,对于一切线性变换都具有不变性,是m i n k o w s k y 距离的改 进。m a h a l a n o b i s 距离的关键是协方差的计算,当数据库较大时,协方差 的计算是相当耗时的【l 钉。 综上所述,目前基于形状的图像检索的这两项关键技术还很不成熟。 其中,形状特征的提取方法对匹配结果的好坏至关重要,它不仅会在一定 程度上决定将要采用的相似性度量准则,甚至会影响图像的最终匹配结 果。 1 3 主要研究内容 本文中,分别从图像的形状特征的提取和相似性度量方法两个方面来 进行研究。 图像特征提取 对目前已有的形状特征提取方法进行深入的研究,分析并实现常用的 特征提取方法,进行相应的图像检索实验。同时,针对这些特征提取方法 的各自的优缺点,试图找到一种能够描述复杂形状的描述子,这个描述子 应该具有良好的平移、旋转和尺度缩放不变性。 相似性度量 对常见的距离度量方法进行深入分析研究,并针对各自的优缺点,争 中国石油大学( 华东) 硕士论文第l 章前言 取找到一个适用于某一特定或某一类的特征空间的相似性度量的测度方 法,并进行相应的对比实验和性能评估。 1 4 论文组织结构 本文的组织结构如下: 第1 章前言。主要阐述了本课题的研究背景,简要分析了其研究意义, 概括了主要研究内容,介绍了相关技术与发展现状。 第2 章基于形状特征的图像检索技术。本章为论文的前期准备工作, 主要是对基于形状的图像检索的两个关键技术问题形状特征提取和 相似性度量方法进行了详尽的描述和总结,另外还对图像检索的性能评估 方法做了简要的介绍。 第3 章基于结构矩的形状特征提取。本章从一个新的角度发展了不变 矩方法,提出了结构矩形状特征提取方法。这种新的不变矩同样具有良好 的平移、旋转和尺度缩放不变性,而且能够描述复杂结构图像的形状。 第4 章基于三角函数的相似性度量。本章提出了一种新的相似性度量 方法一三角函数距离。这种距离能够归一化数轴上任意两点之间的距 离,从而降低了特征子的量纲差异对整个特征距离的影响,提高了图像检 索的准确性。 第5 章总结与展望。本章对论文工作进行了概括性总结,并对基于形 状的图像检索做了进一步展望。 最后列出了本文的相关参考文献。 6 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 第2 章基于形状特征的图像检索技术 在原始特征检索这个层次,基于形状特征的检索是用户最为需求的。 形状是对象的基本特征之一,而且他不像纹理等特征一样,形状是一个内 涵和外延都很清楚的概念,自然界的对象大部分可以通过其形状特征来加 以识别。形状作为一种最为重要的图像特征,是人们理解图像的一个重要 依据。在图像检索系统中人们更倾向于使用基于形状的图像检索方法,因 为它更符合人们的视觉感知。但是,基于形状的图像检索的真正实用化还 有许多的问题需要解决。例如,被认为比较成功的i b m 的q b i c 检索系 统也是基于颜色和纹理的算法上能取得较满意的效果,在基于形状的检索 时还差强人意。形状匹配是视觉信息系统、计算机视觉、模式识别和机器 人等课题的中心课题,同样基于形状的图像检索也是研究怎样有效地迸行 匹配的问题。 2 1 基于各种不变量的形状检索 除了噪声外,变换是计算机视觉中最容易解决的问题。由于几何学和 拓扑理论己经给出了很多关于变换的优秀结果,所以人们提出了许多处理 各种变换的不变量。 2 1 1 基于全局性几何特征 在经典的几何理论中,面积、周长、长轴,短轴,主轴方向、凹凸面 积、紧密度、实心度、偏心率是最常用的特征,它们得到了广泛的应用。 2 1 2 基于变换域特征 人们喜欢将信号转换到变换域对于不同的频率或基来分析特征。作为 7 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 最经典的变换方法,各种不同的矩和f o u r i e r 描绘子,小波描绘子、形态 描绘子在过去的二十年中得到了广泛的研究。 ( 1 ) 各种不同的矩 自从h h 【刀于1 9 6 2 年首次提出在模式识别中采用不变矩( i n v a r i a n t m o m e n t s ) 以来,矩方法在二维图像处理中得到了广泛而有效的应用。近 年来,矩方法又较成功地用于三维图像处理。矩这一概念首先在统计学中 被用于表征随机变量的分布情况,是随机变量很重要的数字特征。由于任 一二值图像或灰度图像都可以看作一个二维或三维密度分布函数,自然 地,矩在图像分析中就有用武之地。不变矩满足平移、旋转和尺度不变性, 在图像识别领域得到了广泛运用。将矩用于图像分析时,可用它来提取图 像的许多重要特征。到目前为止,被入们用于图像处理的矩主要有几何矩、 l c g e n d r e 矩、z c n i k e 矩和伪z e n i k e 矩,其中后三种矩系采用正交多项式 构造的,称为正交矩。 几何矩 h u 提出的图像识别的不变矩理论,为图像识别建立了一种统计特征提 前方法,得到了广泛运用。虽然几何不变矩最初提出是用来计算全局的图 像数据的,但也可以用它来对形状特征进行描述。l i t l 9 1 则给出了5 2 个不 变矩的计算方法,但我们常用的是下面介绍的七个不变矩。 对于连续的密度函数f ( x ,y ) ,以黎曼积分的形式给出,( p + q ) 阶二维 矩的定义为: 能 m 胛= jj x 9 y 4 八毛y ) d r d y p , q = o 12 ( 2 1 ) 与上式类似,我们可以定义f ( x ,y ) 的中心矩为: 8 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 。= jr e x - ;) 9 ( y - h 9 厂( x ,y ) d x d y ( 2 2 ) 其中,孑夕为中心坐标i = m 1 0 m o o ,夕= i r 1 0 l m 。 归一化后的中心矩用r l 。表示 r l w = 月g 0 0 ( 2 3 ) 其中,y = ( p + q ) 2 + 1 这里p + q = 2 ,3 由二阶矩和三阶矩可以导出一组不变矩,h u 不变矩: 旃= 7 2 0 + 叩0 2 丸= ( 节- r 0 2 ) 2 + 4 r 2 1 1 丸= ( 7 7 一3 ,7 1 2 ) 2 + ( 3 r 2 l - q ) 2 九= ( 带3 0 + 玎1 2 ) 2 + 研2 l + 7 7 ) 2 纯= ( 一3 r 1 2 ) ( r h o + r 1 2 ) 【( + 叩1 2 ) 2 3 ( , 1 2 l + ) 2 】 + ( 3 r 2 l 一) ( 7 2 i + r c s ) 3 ( r s o + r h 2 ) 2 一( 吼l + r 0 3 ) 唬= ( i t 2 0 - r ) ( ,7 3 0 + 1 1 2 ) 2 一( 瑁2 l + r 0 3 ) 2 】+ ( 4 r 1 1 ( ,7 如+ r h 2 ) ( 吁2 l + r 0 3 ) 磊= ( 3 r 2 1 一r 0 3 ) ( t 3 0 + r h 2 ) 【( ,7 3 0 + r h 2 ) 2 3 ( r h l + ,7 h ) 2 】 一( 砚。一3 r 1 2 ) ( 现l + 叩0 3 ) 3 铆3 0 + q 1 2 ) 2 一( r h l + ,) 2 1 h u 的这七个不变矩当中,前六个不变矩在平移、尺度、旋转情况下 保持不变,特别是第七个矩,可以反映物体形状的镜像对称性,如果两个 物体的形状是镜像对称的,则第七个矩仅仅具有符号的差别。 j a nf | , , t s s e r 2 0 1 通过复数矩的定义,扩展了胡氏不变矩,可以给出高阶 表达式,并且找到了一组独立的不变矩基底,为不变矩的应用打下了良好 基础,这里只给出相应的结论。 9 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 一组不超过4 阶的独立的不变矩基为: 甲1 = 西l 壬,2 = 九l 壬,3 = 九 甲4 = 吼1 【( + ,7 1 2 ) 2 - ( 仍i + ) 2 卜( 锄- ) ( r 3 0 + r h 2 ) ( 仉1 + ) 甲5 = 九壬,6 = 办 、l ,7 = + 2 + 甲s = ( 穆帅一琉4 ) 【( o + 7 1 1 2 ) 2 ( 仍i + ,7 0 3 ) 2 】+ 4 ( 现l + 确3 ) ( 仍o + 仍2 ) ( 玑l + 刁0 3 ) 甲9 = ( + ) ( r 1 3 0 + r , 2 ) 2 ( r 2 l + ) 2 】( - ) ( + r 1 2 ) ( r 2 i + ) q - , l o = ( ,7 舯6 巧2 2 + 7 融) 【( 协o + 仇2 ) 4 6 ( r ,o + 强2 ) 2 ( 珑l + ,) 2 + ( ,7 2 i + 1 7 j 1 + 1 6 ( r 3 广仍3 ) ( 刁如+ r h 2 x 砚l + 刁如) ( r 3 0 + r 1 2 ) 2 - ( 仉i + ,7 曲) 2 】 x l ;( 1 - r 1 3 ) 【( 7 + r 1 2 ) 4 6 ( + 聃2 ) 2 魄l + 孙) 2 + 娩l + r 0 3 ) 4 】 ( j 7 4 0 一6 r 2 2 + r 0 4 ) ( r h o + 仇2 ) 娩l + 孙) o + r 1 2 ) 2 一魄l + 孙) 2 】 l e g e n d r e 矩哪 定义n 阶l e g e n d r e 多项式为 只o ) = 丢n 止南斋( 矿 ( 2 4 ) ,日 , 在 一1 ,1 j z 或内,l e g e n d r e 多项式 己o ) 是一组正交基。 f 1 只o ) 只 ) c & = z m 2 - - - ! + _ l 8 定义f ( x y ) 的( m n ) 阶l e g e n d r e 矩为 k = 垦竺警业m 删力螂删= o ,l ,2 棚 对于离散化的大小为m * n 的图像,( y 。) ,其l e g e n d r e 矩为 l o 中国石油大学( 华东) 硕j :论文第2 章基于形状特征的图像检索技术 :堡竺掣兰兰k 乃) 地只) ( 2 6 ) | f ;lj = l ( ) = 谆礴驰m ) 姗 l e g e n d r d 矩的快速计算方法可以参考文献【2 1 1 。 z e r n l k e 矩 上面的矩不变量是一种原始信息不可恢复的编码方式,与此相应, z e m i k e 矩嗍可以看出是一种可恢复原始信息的编码。用z e m i k e 矩比较两 个形状时,常常忽略尺度信息,首先要将形状归一化。 具体计算步骤如下: 1 ) 求出所给形状的最小有界矩形,假设矩形的长、宽分别为a ,b ; 2 ) 将此矩形的中心平移到原点,再缩放2 4 a 2 + b 2 倍,把该形状放到 单位圆中; 3 ) 在这个单位圆中,计算所考虑的形状f ( x ,y ) 的z , e r i l i k e 矩,即计算数 列 一。 : 如= 等矽) v - ( x , 其中n 是大于或等于0 的整数;n l 是整数,且满足约束条件: 1 1 7 峰行,n - l m l 是偶数; p 幺( x ,y ) = ,( 办口) = r 。( p ) e x p ( j m 3 ) ,( p , o a ) 是( x ,y ) 所对应的极 坐标。 r ( p ) = 加茎”“一1 ) j i 三手夏 :i 磊; ! 三墨p ”“】 ( 2 7 ) 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 由于r 。( p ) = 也一。( p ) ,有a 。一。( 力= 以删( 力 如果取: r 一( p ) = ( n y - 1 4 0 【卜1 ) ,! 垒! 王二! :! 一p 井- 知】 ( 2 8 ) 蹦力2 萎y 而看蒿毒希两矿1 g 8 其中n = 0 , 1 ,2 ,0 0 ,i m i o ,对于 实体a ,b ,c ,d 和它们的特征集合a ,b ,c ,d ,有如下公式: s ( a ,6 ) s ( c ,力s ( a ,6 ) s ( c ,d )( 2 2 7 ) s ( 口,6 ) = f ( a n 印一c 矿i 彳- s ) 一彦1 8 4 )( 2 。2 8 ) ,是一个反映特征显著性的函数,它用来衡量指定特征对相似度的贡 献,口口时,相似函数是不对称的。 2 3 4 各种相似性度量的比较 m i n k o w s k y 距离的计算比较简单,应用比较广泛。m i n k o w $ k y 距离受 到特征向量的量纲影响很大。在图像检索过程中,必须对数据进行标准化 处理以统一量纲,使它具备度量的可比性和一致性。m i n l 【o w s k y 距离包含 了特征属性的差异,可以从总体上估计可视化非相似性。当特征向量具有 不同取值范围,利用加权m i n k o w s k y 距离来进行图像相似性度量比较合 适。m i n k o w s k y 距离没有考虑特征差异的组合,同时也没有考虑特征向量 的多重相关性,特别是当两个特征具有高度相关性的时候,可能会对相似 性度量产生很大影响。 欧氏距离的优点是当对坐标轴进行正交旋转时,欧氏距离保持不变, 样本集合仍然能够保持原来的相似性结构,缺点是完全不考虑向量各特征 分量之间的关系。 加权欧氏距离的优点是考虑了不同维数之间的不同的重要性,满足了 各特征分量之间的权值调节的需要。但是在做相似性度量的时候我们很难 为各个特征分量选择一个非常合适的权重。 m a h a l a n o b i s 距离的优点是考虑了不同样本间的统计特征,排除了样 中国石油大学( 华东) 硕七论文第2 章基于形状特征的图像检索技术 本间的相关性影响,克服了m i n k o w s k y 距离受量纲影响的缺点。但是当 图像数据库较大时,协方差的计算相当耗时。 非几何相似性度量吸收了几何相似性度量的优点,提出了一个广泛的 理论衡量方法。在实际应用中,它只适用于具有明显特征的对象,同时在 具体应用环境中还需要明确显著性函数的表达式。 总之,图像相似性度量一般采用几何模型,虽然在很多情况下,基于 几何模型的相似性度量与人类感受的相似性还存在很大差距,但它对某些 人类感受的相似性还是比较合适的,与基于内容的特征描述比较为相似 。 2 4 检索性能评估 检索策略性能评估的比较通用的两个准则是:效率( e f f i c i e n c y ) 和有效 性( e f f e c t i v i t y ) ,分别代表检索的速度和查找与所查询的图像相似的图像 的成功率。检索的性能用查准率( p r e c i s i o nr a t i o ) 和查全率( r e c a l lr a t i o ) 来评估【4 8 1 1 4 9 1 ,分别定义如下: 查准率= 塑糕瓣攀 查衅= 笔嚣黼慕辫 查全率反映系统检索相关图像的能力,而查准率则反映系统拒绝无关 图像的能力。 试验表明,查全率和查准率之间存在这相反的相互依赖关系如果 提高系统的查全率,就会降低其查准率,反之亦然。 中国石油大学( 华东) 硕士论文第2 章基于形状特征的图像检索技术 2 5 小结 本章为论文的前期准备工作,主要是对基于形状的图像检索的两个关 键技术问题形状特征提取和相似性度量方法进行了详尽的描述和总 结,另外还对图像检索的性能评估方法做了简要的介绍。 在形状特征提取方面,从基于各种不变量的形状检索和基于局部特征 的形状检索两个方面,详细介绍了目前在形状检索领域里常用的一些形状 特征提取方法。除了文中提到的这些方法之外,还有很多别的方法,但总 的来说,目前形状的表达还没有一个统一的方法,现有的形状表达方式或 多或少都存在着不足,有的在某些领域里效果很好,但在其他领域则不太 适用,因为不同领域的图像其形状特征往往差异较大,所以通常是针对特 定的领域设计专用算法,算法的专用性主要表现在对不同形状特征的取舍 上。 相似性度量作为图像检索中一个重要环节,它的选取策略不仅受自身 算法的影响,还要与某一特定的图像特征提取方法相适用,否则会影响到 最终的匹配结果。本章中介绍了目前在基于内容的图像检索领域内比较常 用的几种度量方法,尤其对几种几何相似性度量方法以及它们各自的优缺 点进行了详细的描述和评价。 性能评估小节则介绍了目前比较认可的两种图像检索性能评估方法, 为我们将来的工作提供了良好的评价基础。 中国石油大学( 华东) 硕士论文第3 章基于结构矩的形状特征提取 第3 章基于结构矩的形状特征提取 形状在人的视觉感知、识别和理解中是一个重要特征,由于几何形状 代表物体的本质特征,并具有平移、缩放和旋转不变等特点,因此在计算 机视觉中,几何形状的分析和识别具有十分重要的意义。 物体的形状具有多面性,导致其具有多种不同的表示方式。迄今还没 有任何一种表示方法可以完全符合人类对形状的识别和理解能力【5 0 l 。在 2 ,1 小节中我们已经对基于形状的图像常用的特征提取方法作了总结,其 中不变矩方法由于具有良好的平移、旋转和尺度缩放不变性及抗干扰性, 在研究中取得了许多重要成果。但是,不变矩是对物体的整体描述,对于 复杂物体的区分度比较低,不能有效地识别,为此,在这里我们将从一个 新的角度出发,提出了一种基于结构矩的图像特征提取方法【5 q 5 2 1 。这种 方法是对不变矩的发展,可以用以描述复杂物体的形状特征。 3 1 结构矩的描述 用于形状分析的矩m 可以定义为物体函数f e l 2 在区域q 上的投影, 性 ,f n ,l 壬,为定义在q 上的函数,表示如下: u 。5 2l ,( 曲。”( x ) d x ( 3 1 ) 近二十年来,研究者的目光均集中在函数集甲上,随着甲的不同,相 应的产生了不同的矩,如给定非正交基x p y q 即为几何矩。为更好地研究 矩的各种特性,t e a g u e 提出选用z e m i k e 、l e g e n d r e 多项式等不同正交基 代替非正交基,则定义了z e m i k e 矩和l e g e n d r e 矩,用小波基替代则获得 小波矩等等。这些方法在实际应用中发挥了重要作用,如图像与图形识别、 中国石油大学( 华东) 硕士论文第3 章基于结构矩的形状特征提取 景物匹配、图像检索和运动图像序列分析等。但是,在实际应用中,我们 发现有许多结构复杂的问题用以上所说的方法难以解决,如复杂的形状不 易识别等。 在信息光学中,我们看到有这样的思想,就是对图像结构复杂度给出 了分析方法岱3 1 。 所谓一幅图像的“结构”丰富与否,是指这幅图上光强随位置变化的急 剧还是平缓。物图像i 。( x ,y ) 的结构丰富的程度与下面的积分是一致的: 品= 1 0 ( x ,y 蚴 ( 3 2 ) f 就是说,在面积f 中总光能给定,即 品= j j l 。2 ( x ,岁皿砂= 常量 ( 3 3 ) 的前提下,& 越大则图像的结构越丰富。 ( a )秭 ( c ) 图3 - 1 光强分布示意图 如图3 一l 中的三个光强分布,它们的总能量都是3 2 ,但是,三条曲线 平方后再积分的值都不一样: 图3 1 ( a ) :f 1 0 2 出:1 2 8 图3 - 1 ( b ) :i i 0 2 d x = 1 3 4 图3 - l ( c ) :i i 0 2 d x = 1 8 0 即结构越丰富,这个值就越大。 3 0 中国石油大学( 华东) 硕士论文第3 章基于结构矩的形状特征提取 为此,我们考虑能否通过对物体函数f ( x ) 的变换,将其映射到另一个 变换空间,以达到识别目的。这样,可以定义一种新的矩,称为结构矩, 其表达式如下: 鸬f ( 厂) , = f ( 厂) 歹忑汹 ( 3 4 ) 其中,( 力为对,做变换,即为,的函数,其余如公式( 3 1 ) 的说明。 变换f 可以是线性变换,也可以是非线性变换。特别地,当变换f 为 常数时即为一般矩的定义( 3 1 ) 式。 令g ) - - - f ( f ( x ) ) ,则有q = g ( x ) 瓦百沽,再通过已有 的形状识别方法对这种形状复杂的物体进行识别。 根据( 3 ,4 ) 式,此处选一种情况进行分析。设厂 ,y ) 是一个有界二 维函数,选取f = f 2 ,基函数为非正交基x ,y 。,其( p + q ) 阶结构矩 用所。表示: m 。= 妒y q ,2 ( x , y ) a x d y q ” 其中,q = 0 , i ,2 , ( p + q ) 阶中心矩定义为: e l l at , t - a a, t 月2l _ l 。o x o ) 9o ,一儿) 9 f 2 ( 工,y ) d x d y ( 3 6 ) 其中,儿是质心坐标,p ,q = 0 ,l ,2 , = 鱼,y 。:塑 m o om o o 对于数字图像,有 中国石油大学( 华东) 硕士论文第3 章基于结构矩的形状特征提取 = x y 9 2 0 ,y ) j , = ( x - x o ) ( y - y o ) g f 2 ( 南力 j , 中心矩一是平移不变的,还需规范化得到尺度规范化矩 ( 3 7 ) ( 3 8 ) 叩一。等( r - ( p + g + 2 ) 2 , q + q 2 ) 因此我们可以根据h u 【7 1 不变矩构造出的7 个不变矩为: 磊= q 2 0 + r l 丸= ( 玎2 0 - 1 1 ) 2 + 4 r 2 1 1 九= ( 刁3 0 - 3 1 1 2 ) 2 + ( 3 r 2 i r 0 3 ) 2 九= ( r h o + r h 2 ) 2 + 研2 l + r 0 3 ) 2 九= ( 7 7 3 0 一3 r h 2 ) ( 编o + r h 2 ) ( r i c o + r h 2 ) 2 3 ( 珑t + ,7 0 ,) 2 1 + ( 3 r h i - r 0 3 x r h l + r 0 3 ) 3 ( r 3 0 + r h 2 ) 2 一魄l + ) 丸= 0 7 一可0 2 ) 【3 0 + r 1 2 ) 2 一( 玎2 l + r 0 3 ) 2 】+ ( 幻l l 【仞3 0 + r h 2 ) 仞2 i + r 0 3 ) 办= ( 3 r h l 一砺3 ) ( r i c o + r h 2 ) “? + v h 2 ) 2 - 3 ( r 2 1 + ,7 0 3 ) 2 】 一( r h o - 3 r h 2 ) ( 巩i + r 0 3 ) 3 ( r 3 0 + r h 2 ) 2 一( ,7 2 l + ,) 2 】 3 2 实验分析及结果 为了进行对比,我们以复杂的人体模型作为基础实验数据,采用一组 从不同角度拍摄的人体运动姿势图片来进行测试。对于弓步举手的动作随 机地选择在不同的角度进行拍摄,获得数量不等的图像作为测试数据库, 且分别给每一幅图像编号。 这里我们给出三组实验来验证结构矩。 中国石油大学( 华东) 硕十论文第3 章基于结构矩的形状特征提取 实验一:两幅图像相似性距离测试 我们从测试图库中选取两幅较为相似的1 5 号和1 6 号人体图像( 如图3 2 图3 3 所示) ,然后对它们之间的相似性距离进行比较。 图3 - 21 5 号人体图像 图3 31 6 号人体图像 表3 1 为1 5 号和1 6 号人体图像的7 个不变矩值及它们之间的欧氏距离。 l l t t 不变矩 1 5 撑1 6 拌 h u l0 4 4 0 9 4 7 3 6 2 7 3 2 5 6 0 4 0 9 2 0 7 7 8 6 2 9 2 0 4 h u 20 0 5 4 6 7 1 3 9 6 9 2 3 2 3 0o 0 4 9 7 5 8 2 1 2 5 1 4 5 4 l 结 h l l 30 0 3 3 3 0 8 0 4 1 9 2 9 1 0 7o 0 0 5 8 9 1 8 1 7 8 5 6 8 7 4 9 构 h u 40 0 0 4 6 0 2 7 3 8 7 3 2 8 1 6 40 0 0 1 5 3 2 5 7 5 9 2 9 1 8 1 2 h u 53 4 6 2 3 2 5 2 2 4 7 1 5 5 e - 0 0 61 4 3 5 9 4 0 1 1 0 1 3 6 7 e - 0 0 6 矩 h u 6一o 0 0 0 9 2 8 9 4 3 6 9 0 3 1 7 1 09 8 1 5 7 3 9 3 8 6 8 2 5 8 e - 0 0 5 h u 7- 5 6 8 8 4 7 7 9 0 1 1 8 5 0 e 一0 0 54 3 7 5 7 0 9 9 6 8 0 0 9 4 e 0 0 6 欧氏距离:1 6 0 0 5 8 4 e 0 0 2 h u l0 4 2 3 9 2 0 3 0 0 3 8 6 4 00 4 0 5 5 5 6 5 8 5 7 8 7 9 1 h u 20 0 3 3 8 6 1 3 1 2 1 0 2 9 3 40 0 4 0 8 6 9 9 1 5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2021-2026年中国高端采煤机市场供需现状及投资战略研究报告
- 中国号角扬声器行业市场调研分析及投资战略咨询报告
- 2025年中国周林频谱仪行业发展现状与投资战略规划可行性报告
- 中国塑料型材市场供需预测调查咨询报告
- 镁及镁合金项目可行性研究报告
- 造价工程培训课件
- 球团厂安全培训课件
- 中国现磨豆浆机行业发展前景预测及投资规划建议报告
- 宠物注射电子标签项目投资可行性研究分析报告(2024-2030版)
- 法学培训课件
- 机械制图教案(完整版)
- 工业互联网与智能制造
- 司母戊鼎的介绍
- 肺炎衣原体医学课件
- 2024年儿童童车行业分析报告及未来发展趋势
- 23秋国家开放大学《汉语基础》期末大作业(课程论文)参考答案
- 《公务接待》课件
- 中医内科学消渴课件
- 《新能源汽车动力电池及管理系统检修》 课件 模块3 新能源汽车动力电池PACK检修
- 工艺知识培训课件
- 公司关停并转方案
评论
0/150
提交评论