(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf_第1页
(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf_第2页
(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf_第3页
(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf_第4页
(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(计算机软件与理论专业论文)综合特征的商标图像检索技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重麽邮电太堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意。 冲n 2 泊 学位论文版权使用授权书 本学位论文作者完全了解重麽鱼g 电太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权 重迭自鱼太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:嚅复巳 导师签名: 签字日期: ) 哪年f 月1 珀 签字日期: 肺马 f 重庆邮电大学硕士学位论文 摘要 摘要 基于内容的图像检索技术( c o n t e n t - b a s e di m a g er e t r i e v a l ,c b i r ) 是从 2 0 世纪9 0 年代开始兴起的一种新的检索技术,它自动提取图像的颜色、 纹理和形状等视觉特征作为索引来进行检索。理论上它融合了图像处理、 模式识别、计算机视觉、数据库、搜索引擎等多个方面的技术,而且在 实际中也有着较大的商用价值。因此,自产生以来,一直都是众多研究 者所关心的一个热点研究领域。 本文以商标图像作为研究对象,对基于内容的商标图像检索技术进 行了研究。在图像特征提取算法上,提出了一种基于曲率和分块信息熵 矩阵奇异值特征的商标图像检索算法。而对于检索的相关反馈过程,提 出了一种基于模糊c 一均值聚类分类器的相关反馈算法。最后,为了对本 文算法进行验证,仿真实现了一个图像检索系统,并进行了算法对比实 验。 首先,针对使用单一特征检索效果不理想的问题,本文使用多个特 征综合起来进行检索。对于图像边界,使用r o b e r t 算子提取其边界曲线, 然后根据微分几何中曲线曲率的定义,利用该定义来计算曲线上每一点 的曲率,并统计得到边界曲率直方图。然后,在对图像区域分块的基础 上,计算每一分块子图像的信息熵,得到信息熵矩阵,求该矩阵的奇异 值作为图像区域特征。综合使用这两个特征进行相似性度量,得到检索 结果。 其次,使用相关反馈算法优化检索结果。本文的相关反馈算法是基 于模糊c 均值聚类分类器的。模糊c 均值聚类算法是由已知样本数据, 通过迭代求聚类中心和隶属度值的过程,而本文算法是由用户给出隶属 度值,然后通过隶属度值来求聚类中心和半径,构造分类器,最后达到 根据用户的主观感受重新排列检索结果的目的。 最后,结合本文的特征提取算法和相关反馈算法,仿真实现了一个 实验性的商标图像检索系统。利用该仿真系统对本文算法的有效性进行 了对比实验。 关键词:商标图像检索,曲率,信息熵矩阵,相关反馈,模糊c 一均 值聚类 i nt h i sp a p e r ,t h es t u d yi st h et r a d e m a r ki m a g e ,a n dt h es t u d yc o n t e n ti s t h ec o n t e n t b a s e di m a g er e t r i e v a lt e c h n o l o g y i nt h ef e a t u r ee x t r a c t i o n a l g o r i t h m ,t h i sp a p e rp r e s e n t sa na l g o r i t h mw h i c hs y n t h e s i z ec u r v a t u r ea n d t h es i n g u l a rv a l u eo fi n f o r m a t i o ne n t r o p ym a t r i x a n df o rt h er e l e v a n c e f e e d b a c kp r o c e s s ,t h i sp a p e rp r e s e n t sar e l e v a n c ef 色e d b a c ka l g o r i t h mw h i c h b a s e do nf u z z yc m e a n sc l u s t e r i n gc l a s s i n e r f i n a l ly ,i no r d e rt ov e r i f yt h e a l g o r i t h mo ft h i sp a p e r , s i m u l a t ea n di m p l e m e n ta nt r a d e m a r ki m a g e r e t r i e v a ls y s t e m ,a n dd ot h ee x p e r i m e n t a lc o m p a r i s o na l g o r i t h m f i r s to fa l l ,f o rt h ep r o b l e mw h i c hr e s u l ti sn o ts a t i s f a c t o r yu s i n ga s i n 9 1 ef e a t u r e ,t h ep a p e ru s e san u m b e ro fc h a r a c t e r i s t i c so fr e t r i e v a l f o r t h ei m a g eb o r d e r ,r o b e r to p e r a t o re x t r a c t st h eb o u n d a r yc u r v e so ft h e t r a d e m a r ki m a g e t h e nw i t ht h ed e n n i t i o no ft h ec u r v e so ft h ed i f 传r e n t i a l g e o m e t r y ,c a l c u l a t et h ec u r v a t u r eo ne v e r yp o i n to ft h eb o u n d a r yc u r v e s , a n dc o u n tt h ec u r v a t u r eh i s t o g r a m a n db a s e do nt h ei m a g es u b - i m a g eb l o c k , c a l c u l a t et h ei n f o r m a t i o ne n t r o p yo ft h ei m a g es u b i m a g eb l o c k ,a n d c a l c u l a t et h es i n g u l a rv a l u eo ft h ei n f o r m a t i o ne n t r o p ym a t r i x ,u s ei ta st h e r e g i o n a lc h a r a c t e r i s t i c so fi m a g e f i n a l l yu s i n gd i f f e r e n tm e t h o d sm e a s u r e s i m i l a r i t y ;g e tt h es e a r c hr e s u l t s s e c o n d l y ,t h i sp a p e ru s e st h er e l e v a n c ef e e d b a c ka l g o r i t h mt oo p t i m i z e s e a r c hr e s u l t s i nt h i sp a p e r ,t h er e l e v a n c ef b e d b a c ka l g o r i t h mi sb a s e do n t h ei m p r o v e df u z z yc - m e a n sc l u s t e r i n ga l g o r i t h m f u z z yc m e a n s c l u s t e r i n ga l g o r i t h mi sap r o c e s st h a tk n o w nt h es a m p l ed a t a ,t h r o u g ht h e i t e r a t i v ec a l c u l a t e st h ec l u s t e rc e n t e r sa n dt h ev a l u eo fm e m b e r s h i p b u ti n l i 重庆邮电人学硕士论文 a b s t r a c t t h i sp a p e rt h em e m b e r s h i pv a l u ei sg i v e nb yt h eu s e r a n dt h e nt h r o u g ht h e m e m b e r s h i pv a l u ec a l c u l a t et h ec l u s t e rc e n t e ra n dr a d i u s ,c o n s t r u c t e d c l a s s i f l e r ,a n df i n a l l yr e a c h e dt h ep u r p o s eo fb a s e do nt h eu s e r ss u b je c t i v e f e e lr e a r r a n g et h es e a r c hr e s u l t s f i n a l l y , c o m b i n e dw i t ht h ef e a t u r ee x t r a c t i o na l g o r i t h m sa n dt h e r e l e v a n c ef e e d b a c ka l g o r i t h m so ft h i sp a p e r ,s i m u l a t ea n di m p l e m e n ta n t r a d e m a r ki m a g er e t r i e v a ls y s t e m u s i n gt h i ss i m u l a t i o ns y s t e m ,m a k ea c o m p a r a t i v ee x p e r i m e n tf o rt h ea l g o r i t h mo ft h i sp a p e r k e yw o r d s :t r a d e m a r ki m a g er e t r i e v a l ,c u r v a t u r e ,e n t r o p ym a t r i x , r e l e v a n c ef e e d b a c k ,f u z z yc - m e a n sf l u s t e r i n g i i i 2 5 商标图像相关反馈过程优化1 2 2 5 1 基于权值调整的相关反馈算法1 3 2 6 商标图像检索评价标准:1 5 2 6 1 查准率和查全率1 5 2 7 本章小结16 第三章基于曲率和奇异值特征的商标图像检索算法l7 3 1 引言17 3 2 边界曲率特征描述符1 7 3 2 1 微分几何中的曲率定义1 7 3 2 2 边界曲线上曲率的确定18 3 3 分块信息熵矩阵奇异值特征描述符2 1 3 3 1 图像的信息熵2 l 3 3 2 分块图像的熵矩阵2 2 3 3 3 熵矩阵的奇异值2 3 3 4 综合曲率和信息熵矩阵奇异值特征的相似性度量2 4 重庆邮电 3 5 第四章 4 1 4 2 4 3 4 4 4 5 第五章 5 1 5 2 5 3 5 4 本章小结4 0 第六章总结及未来工作4 1 6 1 总结4 1 6 2 未来工作4 2 致谢4 4 攻读硕士学位期间从事的主要科研工作及发表的论文4 5 参考文献4 6 v 重庆邮电大学硕士学 1 1 课题研究 伴随着互联 图像集合中快速 世纪9 0 年代起, 领域的研究热点 基于内容的 以这些特征为索 极富挑战性,其应用也很广泛。而商标图像的检索技术以其实用性、有 效性受到越来越多研究者的关注。 商标是商品的重要标识,商标的本质作用是区别商品的来源或服务 的提供者。商标代表了商品的质量和生产厂家的信誉,一个厂家或公司 的商标是其重要的产权之一,如果受到侵害会引起严重的后果。因此, 区别性是商标的一项基本功能和本质特征。而商标自身的区别性需要有 一定的法律来保障,否则如果不同的生产或经营者在相同或类似的商品 上使用相同或近似的商标,就会在公众中引起混淆,使得商标失去了其 基本功能。所以,在相同或类似的商品上,商标应当只由一家企业注册 使用,其他人不经允许不得使用。 一个商标在注册使用前,都需要向有关部门申请,有关部门在对其 合法性进行审查后,商标才能够使用,同时得到法律的保护。而待注册 商标的审查工作中有一项重要内容就是判断该商标图形与已有的注册商 标图形有无相似的情况。以往这项工作主要是以人工的方式进行的,但 我国每年需要注册的商标数量越来越多,如果这项工作完全由人工完成, 不仅非常艰苦的,而且效率很低。因此迫切需要建立商标的计算机管理 系统,使用基于内容的图像检索技术来实现商标图像的自动检索。使得 商标管理工作更加便捷、高效、有力。 本文的工作就是针对上述商标管理工作中现有的问题,从基于内容 的图像检索技术出发,在特征提取和相关反馈方面对商标图像检索技术 进行研究和探索,从而为进一步完善和提高基于内容的商标图像检索的 精度和效率,并为其在实际商标管理工作中广泛应用起到推动作用。 重庆邮电大学硕士学位论文 第一章绪论 1 2 基于内容的图像检索技术研究现状 从上世纪9 0 年代早朝开始,由于大规模图像数据库的出现,传统 的由手工进行图像注解这一图像检索方法所带来的困难变得十分尖锐, 为了克服这一困难,研究者们提出了基于内容的图像检索,其思路是, 提取图像自身的视觉特征,如颜色、纹理、形状等作为检索索引,而特 征的提取过程由计算机视觉等技术自动完成。 特征提取是基于内容的图像检索的基础和关键。目前比较成熟的特 征是颜色、纹理和形状特征。这些特征具有计算简单,性能稳定的特点。 下面大致介绍常用的基于颜色、纹理及形状的图像检索方法。 ( 1 ) 基于颜色的方法。 基于颜色的方法主要应用于彩色图像的检索中,它是一种可靠、使 用广泛的视觉特征。它对复杂背景图像相对健壮,与图像大小和方向无 关,且计算简单。但是通常颜色的r g b 三色表示法不符合人眼视觉特性, 因此检索时一般需要把r g b 空间转化到其他颜色空间中处理,如h s v 空间就更加符合人眼的视觉感受。 颜色直方图是最通用的颜色特征表示形式。它运用了统计学的方 法,表示出三个颜色通道分布密度的联合概率。1 9 9 0 年s w a i n 和b a l l a d 提出了直方图相交算法【l 】,成为这一方面的奠基性工作,目前这一算法 仍被广泛使用。其它主要的颜色算法有:s t r i c k e r 和o r e n g o 提出的累积直 方图以及颜色矩方法【2 】;c a r s o n 提出的基于区域的直方图查询方法【3 】; m e h t r e 等提出的参考颜色表方法【4 】;s m i t h 提出的二进制集合颜色集方 法【5 】;k a n k a n h a l i 提出的主要颜色表示法【6 】;h u n a g 提出的颜色相关图法 【7 1 等等。 ( 2 ) 基于纹理的方法。 纹理是与物体表面材质有关的图像特征,通常将其定义为图像的某 种局部性质,或是对局部区域中像素之间关系的一种度量。多年来,纹 理分析方法分为两大类:统计分析方法和结构分析方法。前者从图像有 关属性的统计分析出发;后者则力图找出纹理基元,再从结构组成上探 索纹理的组成规律【8 。9 】。一般来说,统计分析方法能够取得较好的效果, 所以一直占据着主导地位。 早在7 0 年代早期,h a r a l i c k 等就提出用灰度共生矩阵来表示纹理特 征【1 0 】。w e s z k a 等人从实验中发现由灰度共生矩阵计算出来的简单统计 量如信息熵、角二阶矩等比复杂统计量更有效】。t a m u r a 等人采用了多 2 重庆邮电大学硕士学位论文 第一章绪论 个视觉纹理特征【1 2 】,分别是粗糙度、对比度、方向性、线性度、规则度 和平滑度,实验证明这几个特征符合人的主观视觉感受,取得了很好的 效果。p a s c h o s 提出一种可以快速识别彩色纹理图像的染色体矩法【1 3 】, h e 等提出一种基于纹理谱特征的纹理抽取方法【1 4 】,将图像分为3 3 的 纹理基元,由纹理基元的分布频率得到纹理谱特征。o j a l a 等提出用局部 二进制模式进行灰度纹理分类【1 5 】,这种方法有较好的尺度和旋转不变 性。另外,还有用小波变换来表示纹理的方法【l “1 。7 】包括正交小波变换、 双正交小波变换、树结构小波变换和g a b o r 小波变换等,其中g a b o r 小 波变换的效果最好,但是其复杂度较高。 从以上内容可知,纹理分析的方法是比较多的。当图像中不存在颜 色和形状信息时,纹理是进行图像检索与分类的重要特征,如果图像场 景中有树木和草,很容易用纹理,而不是颜色或形状,对图像进行分类。 ( 3 ) 基于图像形状的方法。 形状是刻画物体的本质特征之一,因此利用形状检索可以提高检索 的准确性和效率。但是,形状相似性在基于模式的视觉中是一个困难的 问题。理想情况下应该可以抽取用于描述图像视觉特性的最佳形状特征, 但是至今对于形状如何描述还没有正式的框架。从计算的角度来说,一 个好的形状特征应该满足对于噪声、遮挡和几何变形的鲁棒性以及对于 图像微小变化的稳定性。另外,相似的形状其特征向量应该近似,并且 与其它特征向量有较大不同。 总的来说,形状表示法可以分为两类,基于边界的和基于区域的。 对于边界,其较为简单的特征有形状数、周长、圆形性和紧密度等。 通常,它们只能用来识别差异较大的形状,因此大多用于初步过滤或者 和其它的形状特征结合起来使用。 边界矩【18 】可以减少边界表示的维数,其优点是易于实现,但是只有 少量低阶矩有物理意义。基于边界的f o u r i e r 描述子【旧】将笛卡尔坐标系 下的图像边界进行等间距抽样,然后将复数形式的点坐标进行离散 f o u r i e r 变换,得到一系列的f o u r i e r 系数,对图像的形状进行描述。这 种表示方法可以将二维问题转化为一维问题,并且前几个f o u r i e r 系数可 以用于近似表示边界的形状。边界方向直方图【2o 】用c a n n y 算子进行边界 检测并提取边界方向特征,具有尺度不变性,能够描述图像的大体形状, 并且对于图像中有局部噪声的情况鲁棒性比较好,但是它不具有旋转不 变性。b i m b o 和p a l a 提出用弹性匹配的方法【2 1 】进行基于形状的图像检索, 变形模板由初始模板和变形函数叠加而成,但是这种方法的计算和匹配 3 重庆邮电大学硕士学位论文 第一章绪论 复杂度都比较高,因此不适用于在线检索。m o l c h t a r i a n 等提出的 c s s ( c u r v a t u r es c a l es p a c e ) 方法【2 2 2 5 】是一种对平面曲线曲率零交叉点的 多尺度描述,并将图像转化为尺度空间图像的匹配,这种方法的复杂度 相对也比较高。 基于区域的方法中简单的特征有面积、重心和偏心率等。其它更通 用的方法还有矩不变量和网格等。矩是一种完备的数学表示,其优点是 能够直接作用于包含感兴趣目标的目标区域而不需事先把目标分离出 来。区域的矩是用所有属于区域内的点计算出来,因而不太受噪声的影 响,矩在图像检索中得到了广泛的应用。19 6 2 年h u 证明了利用二阶和 三阶中心几何矩组成的h u 矩组,在物体平移、缩放和旋转时保持不变。 j a i n 等将h u 矩组用于商标图像检索,取得了不错的检索结果。而h u 不 变矩组存在的主要问题是少量的低阶矩包含的信息还不足以充分地描述 形状特征,而高阶矩又比较难于取得。在几何矩中用正交多项式代替原 有的核函数,可以得到矩的通用形式,若分别带入l e g e n d r e 多项式和 z e r n i k e 多项式,就可以得到l e g e n d r e 矩和z e r n i k e 矩,由于l e g e n d r e 多项式和z e r n i k e 多项式都是正交基的完备集,因此l e g e n d r e 矩和 z e r n i k e 矩被称为正交矩。正交矩可以准确地重构图像。k h o t a n z a d 【2 6 1 等将z e r n i k e 矩用于图像的识别取得了不错的识别效果。t e h 【27 】等比较了 各种正交矩和非正交矩,发现z e r n i k e 矩性能更为出众。k i m 将z e r n i k e 矩用于商标图像检索2 眦9 1 ,其结果符合人的视觉感受。l u 【3 0 1 提出基于网 格的形状描述子,对图像从左到右、自上而下进行扫描,如果网格被形 状覆盖,则值为l ,否则为0 ,结果得到一个位图。这样形状就可以用二 值特征向量来表示。 1 3 论文的主要工作 本文以商标图像为研究对象,对基于内容的商标图像检索技术进行 了研究。主要是在特征提取方面提出了一种综合曲率和分块信息熵矩阵 奇异值检索算法;而在相关反馈方面提出了一种基于模糊c 均值聚类分 类器的相关反馈算法。最后,对上述算法进行了仿真对比实验。主要研 究工作如下: ( 1 ) 本文对商标图像检索过程中的主要关键技术,如特征提取算法、 相似性度量方法、相关反馈过程优化、检索结果量化评价等内容进行了 4 本文内容组织如下: 第一章介绍了论文课题的选题背景和意义,当前图像检索领域的研 究现状以及论文的主要工作及组织结构。 第二章主要从商标图像入手,对商标图像检索的各个关键技术进行 了综述。 第三章分别针对商标图像的边界特征和区域特征提出了曲率和分块 信息熵矩阵奇异值的特征描述符,并综合使用这两种特征进行商标图像 检索。 第四章首先将模糊数学中的隶属度概念引入检索相关反馈过程中, 然后根据模糊c 均值聚类分类器提出了一种相关反馈算法。 第五章在本文算法的基础上仿真实现了一个基于内容的商标图像检 索系统,将本文算法和其他检索算法进行了对比试验。 第六章对本文进行了总结,并对以后的研究工作做了展望。 5 重庆邮电人学硕十学位论文 2 1 引言 第二章商标图像 商标是商品的生产者经营者在 的商品上或者服务的提供者在其提 务来源的,由文字、图形或者其组 般的商标可以分为三种类型 一是文字商标,即仅包含字或词的商标。这种商标可以用字符索引 或者文字匹配软件来管理,其管理和查询时需要确认商标是不是与其它 注册商标在声音上相似或者在拼写上相似。如图2 1 所示。 二是图像商标,即仅包含图像或几何图形的商标。商标的主要属性 是图像的几何形状,因此形状相似性是判断此类商标是否相同或相似的 主要根据。如图2 2 所示。 三是组合商标,指同时包含文字和图像的商标。如图2 3 所示。 图2 1 文字商标 图2 2 图像商标 图2 3 组合商标 相对来说,文字商标和组合商标的管理比较容易,可以用文字注解 的方法进行检索。商标管理方面最主要的问题存在于图像商标,这些商 6 重庆邮电人 标是注册 在视觉上 标整体结 所示。 图2 5 相似的商标 由于图像商标注册的时候大都是以二值图像的形式注册的,因此颜 色特征在区分不同图像商标的时候并不有效。本文的主要研究的是基于 形状特征的图像商标检索。 形状是人类视觉系统进行物体识别时所需要的关键信息之一。它不随 周围的环境如亮度等变化而变化,是物体的稳定信息。而且人们对一幅图 像的理解很大程度上有赖于对图像中目标形状的区别和感知,因此基于形 状特征的图像检索越来越受到人们的重视。 但是基于形状特征的图像检索是基于内容的图像检索中的难点,因为 很难准确地对图像的形状特征进行描述,主要有三个原因: ( 1 ) 形状特征的提取受图像分割效果的影响,而目前,图像分割在理 论上仍缺乏简单易行同时又准确可靠的通用方法。在没有相关应用领域的 知识作为分割依据时,自动分割方法很难将相应的目标准确地提取出来。 本文研究的商标图像均为二值图像,所以不涉及分割的研究。 ( 2 ) 目标形状的描述也相当复杂,至今还没有找到与人对形状的感觉 完全一致的对形状的确切数学定义。从人的视觉来说,形状是一个具有高 层语义的概念,而用数学方法对其进行描述则处于低级语义层次,这两者 之间的语义鸿沟造成了对形状准确描述的困难,即数学上的描述和人眼感 觉的不相符。 ( 3 ) 从不同视角获取的图像中的目标形状,可能会有很大差别,为了 准确进行形状匹配,还需要解决受噪声污染、平移、尺度、旋转变换以及 7 边界轮廓的形状描述符是对包围目标区域的边界轮廓的描述。对边 界轮廓进行描述的方法很多,主要有基于傅立叶变换的轮廓描述符、基 于曲率尺度空间的轮廓描述符、小波变换的轮廓描述符等。此外还有数 学形态学、h o u g h 变换、链码等方法。下面给出一种常用的边界轮廓特 征检索算法:边界方向直方图3 。 2 2 1 边界方向直方图 边界是指图像周围像素灰度有阶跃变化或屋顶变化的那些像素的集 合,边界广泛存在于物体与背景之间、物体与物体之间,它是图像分割 所依赖的重要特征。 要提取边界轮廓描述符,首先就需要得到图像的边界轮廓曲线。图 像的边缘检测算子主要有r o b e r t 算子、s o b e l 算子、p r e w i t t 算子、g a u s s i a n 算子、c a n n y 算子等。而对于二值商标图像这里使用r o b e r t s 算子来提取 边界轮廓曲线。边缘检测的结果如图2 6 所示。 得到图像的边界信息后,需要表征这些图像边界。对于每个边界点, 根据图像中该点的梯度方向计算出该边界点处法向量的方向角: 日一,r r l g 【z ,- ,+ 1 ) 一g 【z ,_ ,一1 ) 。 g o + 1 ,) 一g ( f l ,) r 21 、 、, 其中,g ( f ,) 为图像的灰度。然后以5 度为单位,将3 6 0 度的角度空间量化 为7 2 级,计算每个边界点处法向量的方向角曰分别落在这7 2 级空间中的频 率,这样便得到了边界方向直方图,如图2 8 。最后用欧式距离来定义两幅 图像边界方向直方图的距离。边界方向直方图不受图像中对象位置的影 重庆邮电人学硕士学位论文 响,为了达到尺度不变性 其中,研f 为图像的边界 国囝囵圜 ( b )( c )( d ) 图2 6r o b e r t 边界检结果 ( a ) ( b ) 图2 7 边界方向直方图 9 ( d ) 重庆邮电人学硕士学位论文第二章商标图像检索技术理论基础 2 3 基于形状区域特征的检索算法 基于区域的形状描述符是通过利用区域内的所有像素集合起来获得 的,用以描述目标轮廓所包围的区域性质的参数。这些参数既可以是几何 参数,也可以是密度参数,还可以是区域2 d 变换( 如傅里叶变换或小波变 换) 的系数或傅立叶变换的能量谱。 在形状区域描述符中,矩以及几何矩不变量较为常用。 2 3 1 矩及几何矩不变量 矩在统计学中用于表征随机量的分布,如一阶原点矩就是样本均值, 而二阶中心距就是样本方差。而在力学中用于表征物质的空间分布,如用 一阶原点矩可以求物体的重心,而利用二阶中心距可以求物体的转动惯量 等。若把二值图像或灰度图看作是二维密度分布函数,就可把矩方法应用 于图像分析中。通过对图像各阶矩特征的提取,并加以组合使用,能够有 效的对图像形状区域特征进行描述【3 2 】。 矩方法具有数学上的简明性并且非常多样化。+ h u 于1 9 6 2 年首先提出 了基于直角坐标系的几何矩的概念【3 3 】。之后,运用几何矩的非线性组合, 得到一套具有期望的尺度不变性、平移不变性和旋转不变性的矩不变量。 t e a g u e 从图像重建角度出发,引入了基于正交多项式的z e r n i k e 矩【3 4 1 , 使用z e r n i k e 矩可以很容易地计算任意高阶的矩不变量。此外伪z e r n i k e 矩 和基于l e g e n d r e 多项式的l e g e n d r e 矩也是正交矩。之后,a b u m o s t a f a 和 p s a l t i s 又引入了复数矩的概念1 3 5 】。s h e n 等人提出了一套可分类具有细微差 别的相似物体的小波不变量【36 1 ,根据小波不变量的判别测度可自动选取适 于分类的不变量特征。下面主要介绍几何矩,以及由几何矩推导出来的矩 不变量。 二维几何矩是二维矩函数中最简单的一个,其核函数为像素坐标的 幕。几何矩的主要优点是,图像坐标变换很容易用矩空间中相应的变换来 表达和分析。 几何矩定义于直角坐标变量的幂函数定义的基本集缸p y - ) ,( p + g ) 阶 几何矩用聊。来表示: 扰w 2 i i 石p y 9 厂( 工,y ) 撕 ( p ,g = o ,1 ,2 ,)( 2 3 ) f 这里,f 是图像密度函数厂( x ,j ,) 定义的像素空间区域。 l o m 1 = 2 。o + o ,2 m 2 = ( 2 ,。一。,2 ) 2 + 4 l 。1 2 ,3 = ( 3 o 一3 “,2 ) 2 + ( 3 2 ,l 一心,3 ) 2 订4 = ( 3 o 一l ,2 ) 2 + ( 2 ,l + o 。3 ) 2 m 5 = ( 鸬,o 一3 段2 ) 3 ,o + 段2 ) 以3 ,o + 从,2 ) 2 3 ( 2 ,l + 3 ,o ) 2 + ( 3 2 ,l 一o ,3 ) ( 2 ,1 + o ,3 ) 3 ( 3 。o + 1 ,2 ) 2 一( 2 1 + o ,3 ) 2 】 彳6 = ( 2 o 一o ,2 ) ( 3 ,o + l 。2 ) 2 一( 2 ,l + o ,3 ) 2 + 4 1 1 ( 3 。o + l ,2 ) ( 2 1 + o ,3 ) 4 7 = ( 3 2 ,l 一o ,3 ) ( 3 o + l 2 ) ( 3 ,o ,l ,2 ) 2 3 ( 2 ,l + 0 3 ) z 1 ,。 一( 3 ,o 一3 1 ,2 ) ( 2 ,l + o ,3 ) 3 ( 3 ,o + l 。2 ) 2 一( 2 ,l + o ,3 ) 2 】 以上这组矩的不变量可以较好的表征图像的形状特征,能够用来识别 可能的不同大小和不同方向上的具有相同特征的某一类图像。它们构成了 一个能用于图像仿射变换的描述子集合。但是,需要指出的是,在这些几 何矩不变量中存在着高阶矩不变量计算不稳定、对噪声敏感的问题。 2 4 商标图像相似性度量方法 两幅商标图像的相似度度量也是基于内容的商标图像检索技术的一 个关键问题。以下给出几种常用的相似性度量方法,设q 为查询商标图 像,t 为目标商标图像,k 为q 的某一特征向量,w f 为t 的同一特征向 量。m 为特征向量的维数。 重庆 其中“肌) = 业字盟。 ( 5 ) m a h a l a n o b i s 矩: d ( g ,f ) = ( k ( 朋) 一w r 咖) ) r - 1 ( k ( 聊) 一w r ( 聊) ) ( 2 1 0 ) 其中,。1 表示协方差矩阵。 2 5 商标图像相关反馈过程优化 目前,对于图像检索技术的研究已经比较深入,提出的算法也比较 多,但在实际系统应用中仍然存在着不少问题,其中一个较为突出的问 题就在检索过程中是以计算机为中心,这样就使得一些查询结果并不能 完全满足客户的要求。其主要原因可以归结为以下几点: ( 1 ) 计算机视觉对于图像特征的表示、相似度定义与人对这些特征 的感知存在一定的差距。一般的相似性距离表示的只是图像特征空间中 的距离,而不是真正的图像语义之间的相似距离。 ( 2 ) 高层语义概念同低层特征之间的差距。以计算机为中心的方法 的前提假设是用户可以比较容易的将图像的高层语义对应到其低层特 征,在某些情况下这个假设是成立的,但有时该假设不成立,两层之间 存在着较大的差距。 1 2 重庆邮电人学硕士学位论文 第二章商标图像检索技术理论基础 ( 3 ) 人类感知的主观性。对于同一视觉内容,不同的人或者是同一 个人在不同的情况下可能有不同的理解,这就是人类感知的主观性。 ( 4 ) 有一些图像检索系统采用了多特征检索,由于不同的特征采用 不同的相似性度量方法,很难找到一个比较合适的各个特征的综合距离 以符合人对图像的相似度感知。 图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像 内容的认知是相当重要的。为了把用户模型嵌入到图像检索系统,最近 几年在基于内容的图像检索领域引入了相关反馈机制。 相关反馈机制的目标是从用户与查询系统的实际交互过程中进行学 习,发现并捕获用户的实际查询意图,并以此修正查询策略,从而得到 与用户实际需求尽可能相吻合的查询结果。由于相关反馈可以实时的修 改系统的查询策略,从而为图像检索系统增加了自适应能力。 1 9 9 8 年,r u i 等形式化地提出了图像检索中的相关反馈的体系结构 【37 1 。随后,美国麻省理工学院、美国伊利诺斯大学、荷兰阿姆斯特丹大 学等相继开展了相关反馈在图像检索系统中的应用。相关反馈技术作为 提高检索性能的一种有效技术,已成为图像检索系统不可分割的一部分。 下面给出一种基于权值调整的相关反馈算法。 2 5 1 基于权值调整的相关反馈算法 在图像检索的相关反馈方法中,这一类方法应用比较广泛。r u i 在 图像检索系统m a r s 中采用了多层图像表示方法和动态调整权值的方 法。r u i 提出了一个多层的图像表示方法,一个图像有k 个特征,每个 特征有多种表示,每种特征的表示是一个高维矢量,对于一次查询就是 从最低层特征的每一维开始比较,然后进行加权求和,直到检索到最高 层的每种特征之间的加权和。为改进检索结果,r u i 提出了动态调整权 的思路,即求正反馈图像的每一维特征的标准差,标准差越小权越大, 反之则越小。当某些查询可以用颜色、纹理等特征的组合来表示的时候, 这种方法非常有效,但是如果用户关心的只是图像中的某个对象,就很 难用这些视觉特征的组合来表示查询请求,因而查询结果会很不理想。 具体算法如下: 首先定义图像对象的模型。一个图像对象i 可表示为: ,兰,( d ,r )( 2 1 1 ) 其中,d 是原始的图像数据,如j p e g 格式的图像等:,= 饼,扛l ,2 ,毋 重庆邮电人学硕士学位论文 第二章商标图像检索技术理论基础 是此图像的低层特征集合;尺= 纯,扛l ,2 ,_ ,= 1 ,2 ,) 是某种给定特征 ,的表达形式。每一种本身可能就是由许多分量组成,可以写成如下 形式: 勺= 【勺l ,勺2 ,】 ( 2 1 2 ) 其中,k 是这个向量的维数。 为了充分表达图像的丰富内容,对该图像模型允许采用多个特征( 及 特征表达) 对图像进行描述,每个特征都有动态权值与之对应。图像特征 权值存在于上述模型的每一级上,有彬,和分别对应于图像特征z , 特征表达和特征表达的每一个分量。相关反馈的目的就是确定最能 体系用户信息需要的恰当权值。则图像检索过程可描述如下: 步骤一:将所有权值形= 彬,】初始化为,氓是一组无偏权 值,使所有的特征和特征分量具有相同的权重: 1 彬= ,= 1 2 岷,2 v f 1 2 5 玄 2 _ 3 ) 其中,l 是集合f 中的图像特征的数目,以是特征,的表达形式的数目, k f ,是的维数。 步骤二:示例图像为q 。用户查询要求通过权重彬分配到各个特 征z 上,在每个特征z 中,根据权重进一步把用户的查询要求分配到 各个特征表达向量珞上去。 步骤三:在某个特征表达上,图像i 和查询q 之间的相似度是根 据相应的相似度算法扰i 和权值来计算的: s ( 勺) = 朋l ( 勺,) ( 2 1 4 ) 步骤四:图像i 和查询q 之间在某个图像特征z 上的相似度是通 过合并每个特征表达上的相似度来得到的: s ( z ) = s ( ) ( 2 1 5 ) j 步骤五:最后,图像i 和查询q 之间的总相似度s 是通过合并各个 s ( z ) 给出的: s = 彬s ( ,) ( 2 1 6 ) 1 4 对于一个图像检索结果是否有效性的评价一般可以从以下两个方面 来考虑:一是人的主观感受;二是具体的量化的评价标准。而人的主观 感受则由于受其主观性和个体性的影响,很不容易把握,因此量化的评 价标准是一种较直观,且具有通用性的检索有效性的评价方法。 2 6 1 查准率和查全率 查准率和查全率是信息检索中的标准评价方法,现在已被越来越多 的使用在基于内容的图像检索当中。 设q 为整个图像数据库,a 为相关图像集,b 为检索结果集。a ,b ,c , d 分别代表结果中属于相关图像集的,结果中不属于相关图像集的,相 关图像集中不在结果中的,不相关的也不在结果中的。 则查准率: 脚川驴訾= 熹 ( 2 1 7 ) 查全率: r 叫刚) = 訾= 老 ( 2 1 8 ) 误检率: f :旦一 ( 2 1 9 ) 图2 8p v r 曲线 由此可以看出,查全率反映检索的全面性,而查准率反映检索的准 确性,因此可以用查全率和查准率来评价系统的有效性。该方法的局限 性在于没有考虑结果中相似图像所处的位置,同时,高的查准率与查全 率并不一定表明一个系统工作的好,这还要视具体的应用而定。 2 7 本章小结 本章阐述了商标图像检索的主要理论基础。分别给出了常用商标图 像特征提取算法,商标图像的相似性度量方法,相关反馈过程的优化方 法,以及检索结果的量化评价标准。 常用的单特征商标图像检索算法一般只考虑了边界特征或者是区域 特征,这样并不能准确、全面的反映一幅图像。所以在第三章中,本文 将提出一种将形状特征的两个方面结合起来进行检索的算法,来提高检 索的准确性和有效性。 1 6 重庆邮电大学硕士学位论文 第三章基于曲率和奇 3 1 引言 目前,由于还没有找到与 而单一的特征描述方法和高层 上完全不相关的特征描述在特 个或两个以上的图像特征结合 述。 在前一章所叙述的商标图像检索算法中,无论是基于轮廓的还是基 于区域的,都是仅从形状特征的一个方面来描述图像,因此都存在的片 面性的问题。为了得到更好的检索效果,需要把描述图像的多个特征综 合起来考虑,弥补单个特征检索时的不足,以获得更好的检索效果。 本章从图像形状的边界特征与区域特征入手,分别对图像边界曲线 上的曲率、分块区域的信息熵矩阵奇异值进行了研究,并提取这两种特 征作为图像整体的特征描述符,来综合表示图像形状特征。 3 2 边界曲率特征描述符 3 2 1 微分几何中的曲率定义 曲线上某点的曲率刻画了曲线上该点近旁的弯曲程度【38 1 。在微分几 何中将曲线上某点的曲率定义为: 令j 为弧长参数,对于曲线c :,= ,( s ) 上点p ( s ) 邻近的点尸 ( s + j ) ,设口( s ) 和口( s + s ) 分别是p 点和p 点的切线向量,夹角为 缈,如图3 1 所示。口( s ) 定义相对于弧长s 的旋转速度l i ml 妒l l 厶l 为 口 o 曲线在p 点的曲率,记作石( j ) 。 从以上的定义可以看出,平面曲线的曲率是由该点的切向量斜率变 化率以及弧长变化率决定的。 1 7 重庆邮电大学硕士学位论文 p 3 2 2 边界曲线上曲 计算曲率就需要得到图像的边界曲线,本文使用r o b e r t 算子来进行 图像的边缘检测【39 1 。 r o b e r t 算子利用了任意一对相互垂直方向上的差分可以看成是梯度 的近似求解这个原理,用对角线上相邻像素之差来代替梯度求解。如果 多嚣篇僦嚣 n , 厂v = 厂o ,+ 1 ) 一厂o + l ,) 、7 则正和丘的卷积算子分别为 六:畔川兰,爿 n 2 , 如果梯度的幅值为r ( f ,) = ( 六2 + l 2 ) 2 或近似为尺( f ,) = l 六| + i 无i ,那么通 过差分可以求得r o b e r t 算子在差分点( f + 1 2 ,歹+ l 2 ) 处连续梯度幅度的近 似值尺( f ,) 。如果适当选取阈值f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论