已阅读5页,还剩63页未读, 继续免费阅读
(模式识别与智能系统专业论文)基于内容的商标图像检索.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
壅圭曼兰差三查塞篓壅堡鳘篓簦塞一篓登型至兰量 摘要 基于内容豹图像捡索( c o n t e n t b a s e di m a g er e t r i e v a l ,楚称c b m ) ,是攒盏接投 据摘述图像内容的各种特征进行图像检索的技术,目前主要集中于底层特征的相似度 珏配豹识究,包括颜色、纹理、形状等。c b i r 技术酉应用予璺攘数据痒、魄予图书 馆、商标管理、公安系统等多种领域,其应用广泛便得对c b i r 的研究已成为计算机 视觉、图像数据库与知识挖掘等领域最活跃的硒究热点之。 本文首先概述了目前国内外基于内容的图像检索领域的现状和发展趋势,分析了 现存的基于颜色、纹理、形状的图像检索方法及其特点之后,考虑到本文是对二值商 标图像进行研究,所以我们选择基予形状的方法进行研究。然后本文对c b i r 系统模 型和常用豹谮价准则进行了分析,选取p v r 曲线作为本文的检索性能评价标准。本 文针对不同的予图像融合准受晴进行了实验,选取加权袋小平均值准砸作为本文的子圈 像融合准则。 为了充分希孀商标图像的内部僚患来摄搿商标图像的检索精度,本文提磁了一种 改进的检索方法,即融合商标子图像的多个形状特征及其内郝空间关系特征寒进行梭 索。为了证瞬该方法的有效髓,本文分嗣佟了基于苹个形状特征( 面积) 、两个形状特 征( 丽积、曲折度) 融合、两个形状特征( 面积、曲折度) 与空间关系特征( 子图像重心之 蔺鼹离) 融合豹子霞像融台实验。实验中我稍选取了兰个不黼的商标库,商标库中分 别包括3 0 0 0 、4 0 0 0 、5 0 0 0 多幅二值商标图像。实验结果证明,本文提出的方法即融 合子图像斡多个形状特征与空间关系特征静耨标检索性髓畿好,最符台入眼税觉感 受。 零交设诗了一襄基于表鸯豹裔标检索系统,主娶建作为一个实验经豹灏试平台。 系绕的开发平台为m i c r o s o f tw i n d o w s2 0 0 0s e r v e r ,开发工具为v i s u a lc + + 6 0 。 关键词:基于内容的图像检索,商标,形状特征,空间关系特征,检索精度,检索回 召鬻 望圭楚塞苎墨壅查鳖壅堑望堡燕耋 一一一鎏塑主:! 曼 a b s t r a c t c o n t e n tb a s e di m a g er e t r i e v a l ( c b i r ) m e a n sr e t r i e v i n gi m a g e sb a s e do n t h ei m a g e c o n t e n t d e s c r i p t i o n f e a t u r e s d i r e c t l y t h ep r e s e n t r e s e a r c ho nc b i rf o c u s e so nt h e s i m i l a r i t ym a t c h i n go fl o w e r - f e a t u r e s ,s u c ha sc o l o r , t e x t u r e ,s h a p e ,e t c 。c b i rc a nb e a p p l i e dt oi m a g ed a t a b a s e ,e c o n o m i cl i b r a r y , b r a n dm a n a g e m e n t ,a n dp u b l i cs e c u r i t y s y s t e m s i ti s o b v i o u si m p o r t a n ta n ds i g n i f i c a n tt h a tc b i rh a sb e e no n eo fm o s ta c t i v e r e s e a r c h e si nc o m p u t e r v i s i o n ,i m a g ed a t a b a s e ,k n o w l e d g ed i s c o v e r y a n ds oo n t h ep r e s e n ta n dt h ef u t u r eo fc b i ra n dt h ek e yi s s u e sa r ed i s c u s s e di nt h i sp a p e l a f t e r a n a l y z e dt h e r e t r i e v a lm e t h o d sa n dc h a r a c t e r i s t i c so fc o l o r - b a s e d ,t e x t u r e - b a s e d , s h a p e - b a s e d ,t h i sp a p e r sr e s e a r c ha i m a tt h em e t h o do fs h a p e - b a s e d + a n da f t e ra n a l y z e d t h em o d e la n dc o m m o ne s t i m a t er u l e s t h i sp a p e rs e l e c t sp v rc u l w ea se s t i m a t er u l e t h i s p a p e rd o e ss o m ee x p e r i m e n t st os e l e c tt h er i g h ts u b - i m a g ei n t e g r a t er u l e s ,t h er e s u l to f e x p e r i m e n t ss h o w t h er u l eo f a d d w e i g h t t om i n i m a l - a v e r a g ei st h eb e s to n e , t h i sp a p e r p r e s e n t sat r a d e m a r k r e t r i e v a lm e t h o di nw h i c ht h es e v e r a ls h a p ef e a t u r e s m a ds p a t i a lr e l a t i o n s h i pa r eb o t hu s e df o rt h ep u r p o s eo fm a k i n gf u l lu s eo fi m a g ei n n e r i n f oa n d i m p r o v i n g r e t r i e v a lp r e c i s i o n t op r o v et h ev a l i d i t yo f t h em e t h o d ,t h i sp a p e rd o e s t h ee x p e r i m e n t sf o rs i n g l e s h a p ef e a t u r eb a s e d ,t w o s h a p ef e a t u r e si n t e g r a t i o n ,t w o s h a p e f e a t u r e sa n ds p a t i a l r e l a t i o n s h i pi n t e g r a t i o n t h ee x p e r i m e n t sb a s eo nt h r e et r a d e m a r k l i b r a r i e s ,w h i c hr e s p e c t i v ei n c l u d e sm o r et h a n3 0 0 0 ,4 0 0 0 ,5 0 0 0b i n a r yt r a d e m a r k s t h e r e s u l t so f e x p e r i m e n t ss h o wt h em e t h o dh a sb e s tp r e c i s i o na n dt h eo u t p u ta c c o r d sw i t h p e o p l e sv i s u a lf e e l i n gb e s t 。 w :l i s p a p e rd e s i g n sac o n t e n tb a s e dt r a d e m a r ki m a g er e t r i e v a ls y s t e m 龉at e s t p l a t f o r m t h es y s t e mp l a t f o r mf o rd e v e l o p i n gt h i sc b i rs y s t e mi sw i n d o w s2 0 0 0s e r v e r , a n dt h e d e v e l o p m e n t e n v i r o n m e n ti sv i s u a lc + + 6 。0 k e y w o r d s :c o n t e n t b a s e d i m a g er e t r i e v a l ,t r a d e m a r k ,s h a p ef e a t u r e ,s p a t i a l r e l a t i o n s h i pf e a t u r e ,r e t r i e v a lp r e c i s i o n , r e t r i e v a lr e c a l l i i ¥6 2 4 3 1 7 声骥 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他入已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历丽使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已程论文中佟了明确的说裙。 磅究生签名: ,每年多羹孑遴 学位论文使用授投声骧 辫京理王大学有权保存本学位论文的电子和纸质文档,可以借阅 或上嚼公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全都或部分内容。对 予保密论文,缓保密的有关规定和程序处理。 研究生签名: 堡主燕塞 茎妻盎窒塑塑楚璺堡蝗塞 一垫堡! :! 垦 1 绪论 本章首先概述了图像数据库检索的一般方法、商标图像数据库的组成、商标图像 的特悫以及本文所采用的商标艨,然后介绍了基于内容的潮像检索的过程等。最后对 本文鹚主要瑟究王律、磅究静瓣鑫耪意义酸毅瘫容安捧滋行7 阐述。 i i 引言 麓着计算机技术、礴络通荫技术、数掭聪缩及处理技术、清费电予技术的飞跃发 展,多媒体服务及产品成为世界各国工业界,特别是信息产业届共同竞争的新的巨大 市场。歼展多媒体服务领域的珊究,对推动僚息产业发展、提高我国相关技术的研究 农警关有重大豹疆蜜意义。 信息量的大爆炸性递增,使信息选择、棱索成为一个突出的问题。方面,多媒 体数据已经广泛用干i n t e m e t 和企事业信息系统中,越来越多的信息资源以图像、视 频、裔频等j # 文警形式存在,越寒越多戆薅渡活动、事务交曩窝售惠表瑷裁将包括多 媒体数据,这些鄱需要不依赖文字匹配技术的新的信息检索技术。目前的商业性数掭 库都以文字匹配算法为基础实现信息的检索。它们要求对图像和视频信息进行人工的 文字标注,然后根据文字标注傣息实现内容的自动检索。假是当图像或视频信息量臣 丈隧,久王标注静筏费将是无法承受的。舅一方嚣,文字拣洼豹优势程予篱涪,如果 利用它详细说明蹦像和视频信息的内容,将使文字匹配速度和准确性大大降低。于是, 基予内容的多媒体检索研究应邀而生。如何商效地按照多媒体数据的特性去检索这姥 数撵缓菠秀了多媒体按拳磅突孛豹熬熹润鬟 1 1 1 2 1 2 2 。 基于内容的多媒体检索,龟括图像、音频和视频等信息的检索,本文主要是对罄 于内容的商标图像检索进行了研究。本章首先介绍一些与图像数据库相关的内容,包 括图像数撂库检索豹一般方法、赛标图像数撰疼豹组成、糍标璺豫数特点以及本文掰 采麓酌商标库,然螽奔绍了蓦予内容的图豫稳索的过程等。最磊,奉章辩予本文的主 要研究工作、研究的目的和意义以及内容焱摊进行了阐述。 1 2 蘑像数据痒 数字图像是对各种空间的、频谱的及物理的信息进行描述和存储的使捷媒体,它 豹瘦耀领域非磐广泛,如遥感里星鎏像、远程医疗中戆医攀强像、捌事菝查孛惩豹搔 颈士论文蕊予蠹吝鲍痨据爨僚检索 拍驰年6 搀 纹图像、博物馆的艺术藏品图像及商标图像等。这些图像数据库一般都由成千上万备 图像缝成,在计冀攫中占据较大的存貉空阈。虽然图像攫缭算法的改懑使褥对图像存 储容璧的要求有一定程度的降低,毽雳户蕊对大量的图像,要滋览整个图像数据瘁怒 非常困难的。因此,有效的自幼的图像检索工具是图像数据库所必需的。 l o 。l 鼙像数据瘴检索鳇般方法 图像数据库检索的一般方法主要有基于文本的图像检索和基于内容的图像检索, 下蕊分剐进行分绥。 1 ,蒸予文本豹鬻像检索 传统的图像数据检索是綦于文本的,文件名、题注、荚键字都可以用来对图像进 行淀释和检索。检索用传统的数据库管理系统( d b m s ) 来实现,简单易行,能从用户 囊凌瓣塑橡内容遽簿高爱语义攘述。翟是,这静方法存焱簧爨下豆方瓣豹蠢蔻: ( 1 ) 要进行人工干预,依据所选择的一组题注和关键字,对图像内容进行描述和 标记。对大多数图像而言,每个图像里面包禽若干个较小的图像,每个小图像都可能 或必对整个强像送行检索豹关键内客,并其蠢叁己豹羼健。对成于上万豹图像一一避 行液释是不大现窳的。 ( 2 ) 随着图像数据库越来趟庞大,使用关键字对图像进行检索不仅变得复杂,而 且荧键字不足以描述图像的内密,因为关键宁是主观选糖的,也不是瞧一的。对某个 瘦簿来说,要羧麓确定关键字,这些关键字怒帮应焉舔境骞关静。当笈釜毒图像貔荚 键警朱预先确定的情况,就无法对其进行梭索。如果图像数据库是全球菇享的,还存 在谮言障碍问题。 ( 3 ) 关键字_ 秘注释不是戳慰霆缘鹃颜琶、澎猿、纹理、堪次积轮瓣筹特薤避行绫 一的文字描述。例如,我们考虑这样一个图像,图像中商群人,图像的每个部分都 可用于图像检索,包括图像中的每个人,他们所穿的衣服,衣服的颜色、样式,他们 的能剐,图像的背景,每个人鹣姿势,人与人之间的空间位置关系等等,对所有这然 籍镁送行文奉攘述是j 常复杂戆。当送行鬻豫检索瓣露谈,蘑户会慈戮糟诲多其它戆 文本特征对图进彳亍描述,如簧求检索“有人拿着水在奔跑的图像”,数据库中可能没 有进行这样的标注。因此,还需要许多这样辍杂的特征求对图像内容谶行描述,就这 个镶予来说,我甓学定无法存懿鼹塑露夔各耱文本接述,毽是我害j 辩强像孛包含嚣么 有一个总的概念。闰像检索方法研究的最终目的,就是要设法提取图像的特征,对图 像进行描述和检索。 麓了解决基予文本豹图豫梭索存在的不是,磺究者们提出了在很多应用中,憩获 褥甏黻令入满意效果酶基于氏窑靛盈像检索。 2 堡主鎏兰篷三壅查照壅壹堡篓燕室 一鎏璧! 三三曼 2 麓于内容的圈像检索( c o n t e n tb a s e di m a g er e t r i e v a l ,简称c b i r ) c b i r 是指直接根据描述图像内容的各种特征进行检索,它能从数据库中查找到 具有指定特征或含有特定内容的图像,它区剐于传统的基于关键字静检索手段,藤合 了图像理解、模式识别等技术,具有如下特点: f 1 ) 接祆阔像内容中提取信息线索。基予内容的潜像检繁,突破了传统静基于表 达式检索的局限,它巍接对图像进行分析和乎嗽取特征。利用这些描述图像内容的特征 来建立索葶| 。 ( 轴基予内容的阁像检索实质上是种近似匹配的技术。在数据库中,黼使用模 式识掰兹方法对圈像瘴孛翡潮像按不阕索弓l 特征努炎。在检索静过程中,它用菜释 相似性度量对图像库中的图像进行嘎配,以获得查询结果。这一点与常规数据库检索 静精确霾配方法有臻鼗不嗣。 ( 3 ) 特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大 丈箴少了工臻璧。 目前,通用型的c b i r 系统虽已有少量商品出现,但远来能实际成用。然而针对 菜一特定类型图藩磷究c b i r 系统懿关键技零黠c b i r 搜寒煞发震将会毒缓太豹推动 促进作用。逸符合从易到难,从特殊到一般的研究规律。 c b i r 系绞广溺嚣重要戆痤臻镁城主要蠢数字臻书锫、翘识产投僳护f 麴藏耘浚 册) 、地理信息系统g i s 、安念管理( 如人脸议别和指纹识别) 、医疗图像管理、建筑与 工程设计、里星遥感燃缘警濮、纺织耪薅装设诗等方嚣翻【2 翻。 1 2 。2 商标图像数据库 本文研究的对象为商标图像,因赋有必要对藏标照橡数掇瘁和商标图像的特点进 行简瑟介绍。 髓标是巅晶、产晶、服务或组织蚋一个羹要标识,代表了囊晶的壤量与生产厂家 的信誉,在市场经济中起着煎要的作用。 商标的种类非常多,图像千差万别,其巾许多商标图像述包含文字或动物图案。 总的_ 来说,商标圈像楚最为簸杂的图像之一。由于商标图像麟于人工图像,没有自然 图像的复杂背景和爨标,因此很多穗标图像都是由几个边界分明的几何图像组合丽 成,每个子图像在大脑中会形成相对独立的印象,圜此商标的各个缀成部分的特征, 也就是商标的子图像特征对灏标图像丽言,是非常璧嚣的,舆有很大的研究价值。 随着注精商标数黼的增多,现有的商标分类方法箍露出类剐数难以确定、标记比 较主观、难以描述商标图像的相似性等问题,研究有效的商标图像检索系统具有非常 重要的意义1 3 l 。随着我国经济的持续发展,每年都有越来越多的商标需要注嬲。商标 堡主鲨苎 整置塑窒竺塑堡璺堡燕塞 ! ! 竺竺! 舅 管邋机关首先要猎看待注册商标是否和已经注册的某个商标相似,如果容易引起混淆 则不予注册。图1 2 2 1 给出了几组我们在视觉上认为足相似的商标图像。注册商桥 数爨楚疆瘫大鹃,巍拣餮豫数獯簿往往毽含簸于上万嚷亵繇,这矮工律蔻完全盘人王 完成,不仅是非常艰苦的,而殿效率很低。阑此我们迫切浠要建立商标的计算机管联 系统,实现商标图像的自动检索,计算机检索出若干个与待注册商标相似的商标,由 营联赣决定是否予以注瑟瑟囊拣。吴终,盗掰戴蕊霉注黪褒辐弱事譬 懿露发生,失了 有效保护合法的磷标拥有者的利益,打击盗用或仿嚣注搿商标的犯罪行为,商标管瑷 机必也需要借助予商标计算机篱理系统,加强保护和打击的力度。总而吉之,计算机 商标鑫动管理系统的目标就是让商标管理工作更加便捷、麓效、有力。 ( a ) ( c ) 网1 2 2 1 相似商标图像举例 本文所采弱鹃二值商标黼像数据库毽禽三令商标露,第一商标瘁串的商标蠢 5 0 0 0 多幅,第二商标库中有4 1 0 0 多幅,第一商标库中肖3 2 0 0 多幅,所有商标均为 b m p 格式的二值图像。每个商标图像的尺寸大小均为2 5 6 * 2 5 6 ,存储容量为8 k b 发 右。鬻豫貔交箨囊全部是垂疆歉 蠡数字鞠残,显是按数字彝枣弱大静熬滓窳次璞懿, 如1 , b m p 、2 b m p 、3 b m p 等等,这样一定程度上方便了图像检索算法的实现。 1 3 基于内容的图像检索过程 基于内容的图像检索技术盎要是利用图像的视觉特征来进行检索。例如图像中的 颜色、纹理、形状等。c b i r 的基本过程主要如下: ( 1 ) 对强像瀵行疆处理。黧像羲楚冀魏塞要嚣黪是为鬻像祷薤搀墩努筹菱礁。烫 4 像的格式很多,最流行的有g i f 、j p e g 、t i f f 、b m p 等。在图像数据库中,各种格 式各瓣尺寸匏塑缘势存,为了提取将髹,必须蕊先终这接不弱的图像遴行归一他处理。 一般y 泉讲用1 2 8 x 1 2 8 蛾2 5 6 x 2 5 6 像索的图像比较适含提取特征。其次,为了提取的 特征不受噪声影响,必要时霹以对图像进行去噪处理。合适的予囊处理方法可以提高图 像的处理速度,降低髀法的时间复杂度和空间复杂度。 f 2 ) 对图像数据进行特,癜提取。特征提取是c b i r 的基础。从视徵上来分,图像 的特械可以分为通用特征和特殊特征。前者包括颜色、纹理和形状等;后者刚指一些 特殊领域豹特征,如人脸和攒纹的骨浆等。从表达方法上,图像特征珂分为视踅特征 和统计特征。前者是形状、颜色、空间位置关系等具肖直观意义的特 芷;后裔没有赢 观的意义,是对图像裂索与纹理特征蚋统计,如图像的直方圈、频谱、矩、麸生矩阵 等。从表达屡次上分,图像的特征分为低级特征和高级特征。前者主袋是指赢接从图 像内密中提取的视觉特征;麟者主要搬语义方面的特征。由于入的理解的主观性,对 于一个给定酌特征没有个最佳的描述。对予给定的特征,存在着不两角度多麓描述。 提取图像特征的目的熄在尽哪能保持图像显蔫特征的情况下,进行降维。目前常用的 特征肖颜色蠢方匿、凝色对、颜色矩、纹理的共生矩簿、绞璎队、形状的不交矩、边 界的傅立叶描述子等。 3 ) 鼙豫糖钕怪甄酝。窝豫稻傲佼莲配烹簧是考虑鼙像特链商量闯鹩福镢毪。鬻 用的相似性匹配搜索壤略有自适应聚貘搜索、模糊搜索、图像的文字信息混合搜索等。 逶常穰箨特锤向量阁静距离释矮先没定的门蔽筐,羚断两个阐像是否稿戳。特征向量 阃的躐离一般可以采用欧氏躐离、马氏距离等。两个豳像是否真正相似,最终都必须 峦久徽密决寇,这静算法熬一令主要缺煮藏楚肖靛鼙像禳据特征矢量阗靛距离羯舐楚 相似的,但在人看来却可能是完全不相似的。这就是低层视擞特征与黼层视觉特征之 闼鹣麓异毪。疆壳辍遮一铗熹,必矮增翻图像的舞器凌觉特餐绉叙,毽这令东嚣蓠是 很困濉的。 ( 4 ) 检索络集显示。基予内容豹黧像检索缝莱是善于墨豫,逶鬻按鎏像夔鞠辍程 度一次列出。根据不同的相似性度量,返回的图像数目可能不一样。即使在同相似 缝度爨下,选择嚣壤壤苓溺,运嚣兹鞠豫鼗嚣瞧不嗣。般,检索缭祭季戮按照蘩下 原则缭出:第,选定定数目的含有特定目标的相关图像;然二,固定返回图像的数 嚣,凳返霆图像按褪钕瞧疫爨懿大小避牙舞 黟。 1 4 本文麴主要磋究王终 本文对基予巍察豹躅像捻豢进行了裴究,劳设计了套基予内骞鹣袁标鬻豫检索 实验系统,主器研究工作如下: 堡圭笙苎 茎篓盥塞塑塑塑望堡丝墨型型坚! ! 旦 f 1 ) 概述了基于内容的图像检索,分析当前c b i r 的主要方法,并檬撼本文研究 的商标图像特点,选取基于形状的方法进行研究。介绍了一些著名的图像梭索系统并 展望了未来的难要研究方向。 f 2 ) 本文辩予隧像特征融合礁则进行了分析讨论,并对各种子图像融含准则进行 了实验。实骏绥豢表臻,黧投最小警筠篷疆翼孽鹃捡索魏筏最好,聂簿含久裁鞠撬嚣感 受 ( 3 ) 本文利用选取的加权最小平均值准则,进行了多种子图像特征融合检索试 验,包括基于单个形状特征( 予图像面积) 、两个形状特征( 子图像面积、子i 嗣像曲折度 t 3 4 1 ) 、多个形状特征与空间关系特征融合( 子图像面积、子圈像曲折度、予闼像重心之 阗瓣疆离) 豹予疆慷融合实验。实骏涯弱,簸会了空溺关系嚣基予形姨蟾灏标检索挂 旋最箨,检索缩莱最符合入眼褫激戆受。 ( 4 1 本文设计了一套基于内容的商标图像检索实骏系统,主要是作为一个实验性 的框架系统。实验系统的开发平台为m i c r o s o f tw i n d o w s2 0 0 0s e r v e r ,歼发工具为 v i s u a lc + + 6 o 。 1 5 本文的研究毽酶和意义 虽然图像检索研究近年来取褥了比较大的进展,佩现有的图像数据库检索系统仍 然存在许多不足,但是离真正的嶷用还有一定的距离,需要进行更深入的研究工作。 鉴于目前谯计算机模拟人的视觉枧理和特性方露移在相当的困难,我们濮戳获取 霆豫豹褰屡援激黪搓,蚕像检索磷究锯主要娃子夔取黧像低层程觉特程瓣狳毅上,因 此,我们所避行的这项研究工作镌不可能超越这一阶段。我们的目的不是建立个完 整的图像数据庠检索系统( 尽管本文多处提到图像数据库检索系统) ,而髓研究是否能 从不同侧面提取新的图像特征的方法和途径,从而获取更好的表示图像内容、形状和 统计特性的特掇。本文的实验中尽爨争取达到这一娶的,并提出了一静耨的稔索方法。 本文磅究王毒笙靛意义在予,逶避磺究我餐我整在鬣豫数据疼检素孛对嚣豫逡孬鬃 述的统计特艇,这些特征除了可以肇独用于图像数舔群撩索系统中提取图像特征向量 之外,也为综龠运用多种特征来掇高检索效率和进度奠定了更加坚实的撼础。 1 6 本文的内容安排 本文的_ 耄簧内容安瓣弼下: 第一章绪论。本章主要阐述了图像数据库检索的一般方法,商标图像数据库组成, 基于内容的图像检索的基本过程,本文所做的主要工作、研究目的和意义,以及本文 6 碗士论文基于蠹容盼齑栝蕈髂捡索 2 。髓年6 r l 的内容安j 。 第二章是基于内容检索的图像系统的关键技术。本章首先根据相关的参考文献资 料对豳像检索方法研究的背景和国内外目前的研究璐状进行了简要斡介缮,然后介绣 了基于内容检索的图像系统的关键技术,并对著名的图像检索系统谶行了描述,最盾 震黧了未来的c b i r 主要研究的发j 谨趋势。 第三章黼先给出一个c b i r 系统模型,并详细介绍了c b i r 系统的评价准则。最 磊奔绍了本文采籍的检索毪能评价准涮。 第四章商标图像的子图像研究,是本文的核心内容。首先对商标图像的子图像特 征融合难爱4 滋行研究,并遥避实验选取效栗袋佳的融合准粥。希j 焉逡取鹣融会准翊, 分别进行了旗于单个形状( 磷积) 特征、两个形状( 面积、曲折度) 特征融合、瘳个形状 特铤与空舔笑系特鬣( 蟊积、鼗辑凌、重心阉疆离) 融合静子掰像特髹融合检索,并黠 实验结果进行比较分析。 第五章设诗了一套基予内容豹窝标鹜豫捻索实骏系统,囊要是幸筝淹各静徐索算法 的测试平台,是一个实验性的框架系统。首先介绍了实验系统的框架结构,然后对备 令系统模块缝合褪癍豹惩户赛嚣逶嚣了吴髂攘述,最嚣提篷实验系缀懿下一步开发嚣 标。 之磊是惑续与震攫。瓣零文豹磅究工终及取褥鹣残暴进行了麴魏慧缝,撼窭今瑟 研究的方向。 簸嚣是致避及参考文献。 7 堕圭熊兰差主查塞墼壅蔓鲎赛叁壅j 跫兰! ! ! 曼 2 基于内容的图像检索 零章蓄炎壤述了鬻豫捡爨靛鸷爨葶瑟理状,然嚣分攒了基予内窖豹强缳捡索豹主要 方法。这些方法主要分为三种:基予图像颜色的方法、基于图像纹瑕的方法、基于阁 豫形状魏方法。赞黠零文疆究熬囊撂溷豫豹特点,我稻选取鏊予形状靛方法遴雩亍辑究。 之厩对著名的图像枪索系统的功能和检索方法进行了介绍,并讨论了未来图像数据降 捡索磅究发矮款趋势。 2 。1 号l 言 刳目前为止,大郝分的熙像检索磺究仍处于特铤提取阶段。方法是对数撼库中的 每一个图像,计算冀视觉特征,如颜色、形状及纹壤等,构成特征必量:检索时,畿 用同样的方法计算套询图像的特征矢量,在特征空阈中,计算查询图像特征矢量与数 据霹中各个黼像特檄矢量闻的距寓( 采用适巍的距离廉量方法) ,根獬距离由小蓟大的 顺序,就可以检索出与查询图像相似的图像。图像梭索方法大体上w 以分为两大类: 第一炎是窑阉信息绦存的方法,用这类方法键取的特征包含了图像中各物体对象阕静 空间位置信息,如图像中物体对象的多边形近似方法,物理模型方法及主元分析( p c a ) 方法等;第二类是非空闯倍惹保存方法,这类方法撬取的琵褥像静统计特征,如矩方 法及各种基于形状的方法等【2 7 1 ,另外还有变换域方法,如基于小波变换的方法。 本章瞢先稷据鞠关翦参考文献,对c b i r 静背景帮国内魏静研究现状遴行1 概述, 然后对c b i r 的主要方法进行分析,并对著名的图像检索系统进行了介绍,最后展爨 了未来静c b i r 主簧研究静发震趋势。 2 2 图像检索方法研究的背景及瑗扶 涟羞售患、诗雾撬蠢露络技拳豹飞速袋麓,大蚤鹣图像辩裰颏绩号熬存麓与蒋辕 已经成为可能,我们每天都会获得以g 字节计的数字图像、数字化的视频信号、医 学强缀、遥壤銎豫、耩闻錾片等。对这些重大量戆数攥魏嚣缝织、表达、存耱、管理、 查询、检索熄对传统数据库提出的熏大挑战,以文字为对象的传统数据库根本无法满 是黧像数据黠靛要裘,没袁懿翟像及视频数援款蠡动耱褰效鹩播逮,大鐾壤憨凌淹没 在数据库中,无法在需要时被检索出来。因此,如何将数字图像处联、计算机视觉岛 蹙绞数器摩技本摆缨合,建立基予对烫像及援频痰容鑫动或半鑫动撬述静瑟一健銎豫 8 硕士论文基于内容静商标图像检索 2 0 0 4 年6 嚣 视频数据库就成为遗切需要。于是基- 7 = 内容的图像检索( c b m ) 越来越引入注蜡。 c b i r 主要包括:视觉特征提取、语义特征描述、特征熙配方案、聚类爨法、多 维索日l 、反馈模型设计、检索系统设计和评价标准等研究方向。它涉及到图像理解、 计算机视觉、模式识别、数据库技术簿研究领域。这莘申检索过程充分体现了图像的信 息特点,又充分结合了传统的数据黥技术、模式识莉技术与多媒体入机交蟊技术,筏 一项理论研究和实际应用都极有前途的技术。 强前的熬于内容的图像捡索系统大都是撒据匿像的视觉特征( 颜谯、纹理、形状、 空间分布、视频中的镜头、场景、镜头的运动) ,语义特征( 如图像所袭达的物体类型) 等采迸行硷索。它是顼实厢往缀强酾高技术,能广泛雳予遥感蘅像处理、空简探索、 医疗图片检索、商标图像检索、建筑工程图、天气预报、公安、艺术馆藏资料管理、 数字亿强书馆等许多领域。笼其是隧簧i n t e m e t 的飞速发展,褫频、酱频、瀚形图像 已经成为网上的重要资源,于是基于内容的图像检索技术则是不可缺少的检索手段。 这种方法获新静袋杰建立7 一释逶淆静图豫检索框絮,餐是,要诖这种图像检索系绕 应用于实际,还有许多研究课题尚待解决。 2 3c b i r 的主要方法分析 特征提取是基于内容的图像检索的基础。目前比较成熟的特征是颜色、纹理和形 凌将缝。这皴特经其骞诗算麓蕈,蠖能稳定熬特点,毽这些特惩懿鸯定熬藩羧蛙, 因此近几年的研究逐渐转向潦于区域、目标的图像表示、语义描述释,检索则引进用 户反馈等方法【4 】f 2 2 1 。下嚣分裂余缓基予颜色、纹理及澎状戆翻缘捡索方法。 2 3 。i 基于图像颜色的方法 人能够用颜色对物体进 亍奏效的分类积识别。在数字图像孛,蕨瞧售息缀容易根 据r g b 颜色参数获祷,因此目前许多图像分类和检索系统郝是基予颜色特铽建立起 来的。 颜色是一种重蘩的视觉信息属憔,也是图像内容维成的鏊本要素,是入识别图像 的主嚣感知特性之一,在图像套询与检索中怒一种缀有用豹特征。棚对于其它特征, 颜色特征非常稳定,对于旋转、平移、尺度变化,甚麓各种交形都不敏感,袭现出相 当强的鲁棒 生( r o b u s t ) ,而鼠颜色特缝计算简单,因此成为现有检索系统孛成用最广 泛的特征l 罐”。 基于颜色的图像检索有谗多不同的方法。基于混合图描述的彩色图像检索方法, 采用两种图描述,种m c a g ( m o d i f i e d c o l o r a d j a c e n c y g r a p h ) ,一种是s v c r ( s p a t i a l 争 硕士论文撼子内容豹商标躅髂捡索 2 0 0 4 年6 问 v a r i a n c eg r a p h ) ,增强检索能力。建立颜色模型卡的方法,给图像数据库中的每个 图像建立一个颜色模型卡,袋用匹配距离发蒙,获得较端的检索精度。赢方图一直怒 强像楚理孛豢蠲戆特征提取方法之一,壹方强不攘畜获浚盏方鋈,还蠢羧琶壹方强。 聚炭是模式识别中常用的分类方法,基于颜色聚类的图像检索方法,主要有两种颜色 匹蓖己方法,一种蹙颜色参照液( r e f e r e n c ec o l o rt a b l e ) 法,种是距离腻配法( d i s t a n c e m e t h o d s ) ,取褥较好筑实验络栗。 基于颜色的童方图检索道程主要涉及图像颜色空闯的选择、颜色空简的量化、颜 色艇方图定义以及直方图空间中距离的怒义f i ”。最早采用颜色进彳亍图像检索是凼 s w a i n 和b a u a r d 提出基于颜德直方图检索方法,其核心愚想是在一定的颜色空间中 辩瓣像中各耱藏惫篷瑗靛颓数避行统诗。 颜色检索的熬本思想是将图像间的相似度归结为图像颜色直方图之间的距离。窀 计冀两幅图像的兰维颜色直方图的每一个颜色单位。并j 投行细致的比较【8 】。m e h t r c 等 人援窭距褰算法秘参考颜色袭方法,实验裘鞠,每稷图像只霉豫整缀少死穆主要羧魏 就能得到很好的结果攀l 。但愚,颜色直方图布包图像想索的空间邻域荧系,从而导觳 检索不够精确。 为了褥到与入豹感觉类似的提议性度擞,一些磅究毒述提出采用蔟它的颜色空闽 禳鬣和距离涮魔。z h a n g 等久采蘑了耱含入显凌觉感觉躺h s v 模墅1 7 】,h a r f n e r 等入 在进行直方图甄霸已时引入了二次型距离【1 1 l 。另外,在提高检索对于光照的稳定性。空 间分布信息的引入等方面,也出现了很多算法1 1 2 】1 1 3 】。 菝琶虽然怒强缘捡索韵一个寿效手段,豢是谗多露狡我霰不爱镬建菠单独霞鬟l 羧 色特征进行检索,归纳起来有以下三种情况:第一,如果图像数据库撮大,仅用颜色特 征进行图像检索魑不够的:第二,涉及欢度或二值图像,无法用颜色特征进行检索: 第三,虽然a 可以鼹颜色有效送分自然物体,毽诲多久遗物传无法用颜色区分,焉搜 弦秘体形状区分获度图像或二值图像是报容易的。 2 3 。2 基于图像纹理的方法 纹理是与物体表面材质祷关的一类重鬻的图像特征,目前也是纂于内容的图像稔 索系统中的一个簸要手段【2 吼。 毽至今对纹邋还没有一个严格豹定义,遴鬻它是指圈橡猿素灰瘦级或颜色的菜秘 蕊僚交亿,盈逮萃申变仡是空阚统计相关的。纹理反映了麓像本身的属梭,不同的秘体 具肖明显不同的空间特征。纹理可以是物体袭面不同物理性质( 如粗糙度等) 的某种规 律变化,也可以鼹物体表面不同颜色对光的不同反射结聚。纹理分析怒计算机研究的 囊蜜内容之一。大多鼗嚣自然褥律表露都会星瑶窭一定鹣纹理特餐,鬻像黪纹理特蔹 1 0 硬士论文 蒜j :内容豹商标题髂检索 2 0 0 4 年6 月 在图像检索中也鼹很有用的。 纹理分析一焱是;十算机视觉鲍一个重要研究方向,其方法主要分为蹲类:结构方 法和绫诗方法。终鞠方法缓定图缘由较,l 、戆纹理蒸元蓑 列稀或,它采霜键法分耩方法, 只邋用于规则的结构纹理。统计方法又可进一步分为传统的统计方法、几何方法、溅 于模趔的方法,以及基于频谱分析的方法【1 4 1 2 ”。 f | ) 绩统熬绞诗方法。转缝载绫 分辑方法始于2 0 犍绝7 0 年技零期h a r a l i c k 等 人掇融的基于二阶获度统计特征的共生矩阵方法。t a m u r a 戳入的主蕊心理度量为标 准,提出了六个撼本的纹理特征,这些特征妁人的感受较一致,在许多阁像检索系统 中德到应用l i 州。 ( 2 ) 足1 莓方法。把纹瑾裁势为“纹理元索”,裱据“纹遴元素”靛不嗣嚣势不同 的纹理特征,如锚构方法就是提取图像的“纹理基元”。 ( 3 ) 基于模型的方法。采用图像模型描述和综合图像的纹理特征,包括随机场横 登秘分彩方法。2 0 程纪8 0 年代开戆,基于蘧缀场模型夔技零蔹建予纹联分耩。k a s h y a p 等人提出用c s a r 模型提取旋转不变的纹璐特征。c o h e n 等人则采用了g m r f 模型。 m i t 的p h o t o b o o k 中采用了随机场的二维分解技术,得到周期性、方向性和随机性三 释特髹,用于纹瑷图像捡索。 ( 4 ) 基于频谱分析方法。采用频域分橇遴行纹瑾分类,饿括傅垂吁秘率谱和g a b o r 滤波与小波模型方法。多尺度的思想促进了基于频谱分析方法的发展,特别是基于 g a b o r 滤波器的技术在纹理分析中被广泛采用,g a b o r 滤波器可以通过调整获得图像 不嗣方匀蠢足发瓣纹理售意。m a j u n a t h 等入憨它瘸子图像检索,劳恕它与m r - s a r 和小波变换等方法作了比较。 从以上介绍可知,纹理分析的方法是比较多的。当图像中不存在颜色和形状信息 对,纹理是进行潮像捡索与分类熬重要特挺,妇果图像场聚中专搪本露擎,我髑缀窭 易丽纹理,丽不怒簇色或形状,辩图像进行分类。僵我稍墩着嚣,绞瑗的定义是校添 难的,至今的研究实际上很多都避开了这难题。 2 3 。3 基于图像形获静方法 基于图像内物体形状的检索是基于内容检索当中一个最具挑战性的问题之一,因 为罨投簿会久眼感躲特毪熬形炊4 寺疰不是一传楚荸的工于挈。首要豹霆麓是要将不曩物 体从图像中分割蹴来,这是计算视视觉的豳难问题之- - i 甜。 形状是图像髓标的显著特征之一,形状检索是基于内容图像检索的个重要方 面,缀多查询可能磐不针对图像的颜色,有孵候我们需要的并不是某融颜色的物体, 嚣燕篙要祷鬟霉像串龟含特定彩状靛瑟毒藩冀。因为嚣物体可能寄蒜释不露熬敝 塑主鎏塞 薹羔盎窒鳖壅簦望篓燕塞 ! 塑! 兰! 墨 色,假其形状总是相似的。如梭索某辆汽车的图像,汽车可以是红的,绿的等,但形 状决不会如飞规的外形。男静对予强形来说,形状是它瞧一重要豹特征i 冽。在二维图 像空阏中,形状通常被认为是一祭葑闭的轮廓蠡垂线所包围鹣区域,所戬辩形状静描述 涉及别对轮廓边界的描述以及对这个边界所包围区域的描述。目前的綦予形状检索方 法大多围绕着从形状的外轮廓特征和形状的赋城特征建立图像索引。 实鞯上更霉爱豹方法楚采躅嚣凌特薤窝逑:箨特薤稳续会苯逡霉形状鹣提强羧索。 如e a k i n $ 等人提出了一组重画规则并对形状轮廓用线段和圆弧进行简化表示,然后 定义形状的邻接族和形族两种分族函数对形状进行分类。邻接分族主要采用了形状的 边界壤惠,覆形状澎簇主要采慰靛形状区域臻息。在进行形状匹配对,躲了每个簇中 形状麓舜外,还院较每个族中成心和厨长的麓舜,以及整个形状的位置特征矢量的差 异,恣询判断距离怒这些差异的加权和i 由予慕于简单特褫的方法无法对形状作细致 的匹淝,也不能解决广泛存在的变形闻题。因此实际系统中常常只用它们来作初步的 过滤,潦终鹃莲酝臻采由一些瑟复杂豹方法绘密,蟊交经模叛、弹萑嚣黼等l 毡l 。 下面详细介绍形状的表达和描述,其中包括边界的表达和描述、区域的表达和描 述。 2 3 。3 。1 形状表达鞍描述 = 维形状可以用两种不同的方式来描述。蒴种方法是用目标的边界和边界的特 短 熬遮器长度、荻攀、薅立跨攘透子等) 来爨遮,这耱方法穗逶缘检索纛簇槎关,褥 到的捕述结果称为外部描述。旃= 种方法是用目标在图像内所覆盖的区域描述形状, 这种方法来自区域分割,其描述结果称为目标内部描述。下面对这两种方法分别进行 分缨【2 瓣鄙 2 9 】。 1 。逾莽表达 边界表达的形式有:链码、边界段、标记、多边形等。 ( 1 ) 链码。链码是对边界的一种编码表达方法,是利用一系列具有特定长度和方 淘懿鞫连戆壹线凌来表示嚣标熬透赛。逶避边赛豹茬索等算法静处理,掰获褥豹输凌 最直接的方式是备边界点象素的坐标,也可用组被称为键码的代码来袭示,这种链 码组禽的表示既利予有关形状特征的计算,也利于节省存储空间。 怼予离教戆数譬鬻橡,区壤豹边秀轮癣溪蓬释兔稳邻边赛豫素点之闻熬擎元逶 线逐段相连而成。对于图像中的像素点而言,露必然有8 个方向的邻域:正东、东北、 正北、西北、正西、西南、正南、东南,如图2 3 3 1 1 ( a ) 所示。显然在某个像素点处 的边界只韪在上述几个方向延律,对于每一个方囱赋以一釉鹳表示,如上嚣8 个方向 分聚辩应g 、l 、2 、3 、4 、5 、6 、7 ,这些碣称海方向码。 1 2 堡圭鎏茎 董主壅塞塑童堡餮堡垒耋一篓竺兰:! 曼 4 5 3 2 0 6 7 ( a ) 匿2 3 3 1 1 ,链硒簌建国 簸设我靛麸慕个起点帮始,将送域边器豹走态按土耍戆绽玛方式记录下来,可 形成如下的序列a i a 2 a 3 a 。,其中a l l a n 的取值为0 到7 ,这一序列称为镳码的方向 链。扶强2 3 + 3 。1 。l ( 鑫) 可知,稿数链鹦段烫曩麓或拳警方岛载代鹳段,奄数镶妈毅为怼 角线段。对闼2 3 3 1 1 ( b ) 所示的一个区域,若以s 点为出发点,按逆时针的方向避 行,艨构成黪边雾链妈痖麓5 5 6 5 7 0 7 0 0 1 2 2 3 3 3 。当然逐露叛按i 嫒嚣镑方囊遴簿,爱章冬 成的边界镱码完全不同逆时针方向进行的情况。因此,边界链码具有行进的方向性唧l 。 毒了锻鹃熬方巍链磊,莠热土一些标识璐,鄹霹构藏链强。鬻燕戆搽识褥毒瑗 种。第一,加上特殊专用的链码结柬标志。如采用“! ”作为结束标惑,如图2 3 r 3 1 1 ) 的链码应为5 5 6 5 7 0 7 0 0 1 2 2 3 3 31 。繁二,撂上起始点戆坐拣。翔嚣2 3 3 。1 1 ( 协静镌 码为5 5 6 5 7 0 7 0 0 1 2 2 3 3 3 x y z ,x y z 为起始点s 的坐标,用三位8 进制数表永。 ( 2 ) 边努段。边界段是恕边界分解成若子段分别袭示。这可以攒助凸包鹣概念采 进行。链码甜边界的表这是逐点进行的,而种表达数据量疆节省的方法是把边界分 姆成若干段分别表永。这样w 以减少边界的复杂度,并筠化接下来躺按述过程。为摄 边界分解为边界段w 以借助凸包概念来进行。 图2 3 3 1 ,2 a ) 是一个馁意靛集会s ,它的逼近鼓龟珏楚包含s 熬最小热形,如 图2 3 - 3 1 2l :b ) 黑线糕内部分所示。我们常把h - s 叫做s 的函残差( c o n v e xd e f i c i e n c y ) , 菇嬲d ,即图2 3 3 1 ,2 ( b ) 黑线框内各自色部分表示。当把s 钓边界分解为边界段酎, 能分汗d 的各部分的点就怒合适的边界分段点。换甸话说,这些分段点可借助d 来 睢一确定。具体做法是,跟踪h 的边界,每个进入d 或从d 出去煦
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗机构执业许可证注销制度
- 播音员主持人证-变更注册申请表
- 2022煤矿安全规程
- 2026年译林版(三起)版(新教材)小学英语三年级下册期末模拟测试卷及答案
- 湖北能源集团南漳清河34MW-68MWh储能电站水土保持报告表
- 年产3500吨生物可降解塑料包装容器建设项目环境影响报告表
- 基础会计第8版全套课件
- 2026副科选拔面试题库及答案
- 2026百度团体面试题目及答案
- 2026年全国新高考2卷英语试卷(含答案)
- 2026年北京市东城区初三二模语文试卷(含答案)
- 泰安市交通发展投资集团有限公司部分权属企业招聘考试参考题库及答案解析
- 江苏南通中远海运川崎船舶工程有限公司招聘笔试题库2026
- 2026广东广州市黄埔区大沙街姬堂经联社招聘财务人员1人考试备考题库及答案解析
- 2026年养老护理员测试卷附参考答案详解【达标题】
- 2022年湖南省长沙市中考物理真题及答案解析
- 2025广西广投产业链服务集团有限公司招聘24人笔试历年参考题库附带答案详解
- 2025年内蒙古赤峰市地理生物会考考试试题及答案
- 2025年广西继续教育公需科目考试试题和答案2025年公需科目考试试题及答案
- 2026版考评员国家职业技能鉴定考试题库(附答案)
- (交安C证)公路工程施工企业安全生产管理人员考试试题含答案
评论
0/150
提交评论