(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf_第1页
(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf_第2页
(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf_第3页
(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf_第4页
(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)基于文本和内容的商标图像检索.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士论文基于文本和内容的商标图像检索 摘要 基于内容的图像检索是一个综合了数学、电子学、计算机科学、人工智能、模式 识别等各门学科的研究领域,是一个前景十分广阔而重要的应用领域。其主要思想是 根据基于图像视觉内容的特征如颜色、纹理、形状和空间分布等信息,提取图像的特 征向量作为索引进行相似性检索。商标是商品的一个重要标识,代表了商品的质量与 生产厂家的信誉,在市场经济中起着重要的作用,而基于内容的图像检索技术在商标 图像领域得到了广泛的应用,商标图像检索实际上是图像检索的一个子问题。本文对 现有的基于内容的商标图像检索方法进行了分析,提出了一种新的商标图像检索方 法,并设计开发了一个基于文本和内容的商标图像检索系统。 针对二值商标图像单色的特点,一般利用形状特征对其进行检索。关于形状的统 计值,可以用矩特征来表示。在图像处理中,矩可以作为一个重要的特征来表示物体, 据此特征来对图像进行检索等操作。本文对基于形状特征( h u 不变矩、l e g e n d r e 矩、 z e m i k e 矩、伪z e r n i k e 矩) 和模糊方向特征图像检索的多种方法进行了实验对比。 用p v r 指数作为图像检索性能评价准则。结果表明,在基于形状特征的检索中, l e g e n d r e 矩、z e m i k e 矩和伪z e r n i k e 矩的检索性能优于h u 矩;基于模糊方向特征检 索的效果优于h u 矩;在相同维数下,伪z e m i k e 矩的检索效果最好。 随着矩阶数和特征维数的增加,虽然加强了图像的描述能力,但同时也带来了信 息冗余和维数灾难等问题,加上高阶矩比低阶矩受噪声的影响大,因而并不是矩的阶 数越高,检索的效果越好。通过实验,我们探讨了l e g e n d r e 矩、z e m i k e 矩、伪z e m i k e 矩和模糊方向特征的最佳维数。 由于利用单个特征进行图像检索,未必有足够多的区别性信息,为了进行最佳的 检索,当有众多特征使用时,可以将多个特征进行融合,我们提出融合多个特征的新 方法来进行检索,并通过本文实现的商标图像检索系统进行了实验,对比实验证明该 方法的检索效果优于单个特征的检索。 因为图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像内容的理 解是相当重要的。在系统中增加文本信息,即增加用户对图像的理解进行检索,实验 证明,基于文本和内容的检索效果是最符合人眼的视觉感受的。 关键词:基于内容的图像检索,商标,形状特征,模糊方向特征,特征融合,p v r 指数 a b s t r a c t 硕士论文 a b s t r a c t c o n t e n t - b a s e di m a g er e t r i e v a li sac o m p r e h e n s i v es t u d yi n c l u d em a t h e m a t i c s ,e l e c t r o n i c s , c o m p u t e rs c i e n c ea n da r t i f i c i a li n t e l l i g e n c e i ti sm a i n l ya b o u th o wt oc a r r yo nt h es i m i l a r r e t r i e v a la st h ei n d e xb a s e do nt h ei m a g ec o n t e n tc h a r a c t e r i s t i c ss u c ha sc o l o r , t e x t u r e ,s h a p ea n d s p a t i a ld i s t r i b u t i o n a sa ni m p o r t a n ts y m b o lo fp r o d u c t s ,t h et r a d e m a r kr e p r e s e n t st h eq u a l i t yo f p r o d u c t sa n dt h em a n u f a c t u r e rp r e s t i g ea n dp l a y st h ev i t a lr o l ei nt h em a r k e t a n dt h er e t r i e v a l t e c h n o l o g yb a s e do nt h ei m a g ec o n t e n ti sw i d e l yu s e di nt h ef i e l do ft r a d e m a r ki m a g e s ot h e t r a d e m a r ki m a g er e t r i e v a la c t u a l l yi sas u b s e to fi m a g er e t r i e v a l t h i sp a p e rf i r s t l ya n a l y s i z e st h e m e t h o do ft r a d e m a r ki m a g er e t r i e v a lb a s e do nt h ec o n t e n t ;a n dt h e ni tp r o p o s e san e wm e t h o do f t r a d e m a r ki m a g er e t r i e v a l ;f i n a l l yi td e s i g n sa n dd e v e l o p sat r a d e m a r ki m a g er e t r i e v a ls y s t e m b a s e do nt h ec h a r a c t e r i s t i cf n s i o n f o rt h et r a d e m a r ki m a g e s ,t h er e t r i e v a li su s u a l l yd e v e l o p e db yt h es h a p ec h a r a c t e r i s t i c w e c a nu s et h em o m e n tc h a r a c t e r i s t i ct oe x p r e s st h es h a p es t a t i s t i c a l s i nt h ei m a g ep r o c e s s i n g ,t h e m o m e n tm a yb er e g a r d e da sa ni m p o r t a n tc h a r a c t e r i s t i ct od e s c r i b et h eo b j e c t ,w h i c hi so f t e n u s e di ns o m eo p e r a t i o n so fi m a g er e t r i e v a l t h i sp a p e rc o n t r a s ts o m er e t r i e v a lm e t h o d ss u c ha s t h es h a p ec h a r a c t e r i s t i cr e t r i e v a l ( h ui n v a r i a n tm o m e n t s ,l e g e n d r em o m e n t ,t h ez e r n i k em o m e n t , t h ef a l s ez e r n i k em o m e n t ) a n df u z z yd i r e c t i o nc h a r a c t e r i s t i cr e t r i e v a l a n dt h ep v rv a l u ei su s e d a st h ei m a g er e t r i e v a l p e r f o r m a n c ee v a l u a t i o nc r i t e r i o n t h er e s u l ti n d i c a t e st h a tt h el e g e n d r e m o m e n t ,t h ez e r n i k em o m e n ta n dt h ef a i s ez e r n i k em o m e n tr e t r i e v a la r eb e t t e rt h a nt h eh u m o m e n ti na s p e c to fs h a p ec h a r a c t e r i s t i cr e t r i e v a l ;t h er e t r i e v a lb a s e do nt h ef u z z yd i r e c t i o n c h a r a c t e r i s t i ci sb e t t e rt h a nt h eh um o m e n t t h ef a l s ez e r n i k em o m e n tr e t r i e v a lw o r k sb e s tu n d e r t h es a m ed i m e n s i o n a l o n gw i t hm o m e n te x p o n e n tn u m b e ra n dc h a r a c t e r i s t i cd i m e n s i o ni n c r e a s e ,s o m ep r o b l e m s o fi n f o r m a t i o n r e d u n d a n c ya n dd i m e n s i o nd i s a s t e rw i l l b eb r o u g h ti n a l t h o u g ht h ei m a g e d e s c r i p t i o na b i l i t yc a nb ei m p r o v e d i na d d i t i o n ,t h eh i g h e ro r d e rm o m e n ti sm o r ee a s i l yi n f l u n c e d b yn o i s et h a nt h el o w - o r d e rm o m e n t s ot h er e t r i e v a le f f e c ti sn o tp r o p o r t i o n a lt ot h em o m e n t e x p o n e n tn u m b e r t h r o u g ht h ee x p e r i m e n t ,w eh a v ed i s c u s s e dt h eb e s td i m e n s i o no f t h el e g e n d r e m o m e n t , t h ez e r n i k em o m e n t ,t h ef a l s ez e r n i k em o m e n ta n dt h ef u z z yd i r e c t i o nc h a r a c t e r i s t i c b e c a u s et h es i n g l ec h a r a c t e r i s t i co ft h ei m a g er e t r i e v a lc a nn o ta l w a y sb r i n ge n o u g h d i s t i n c t i o ni n f o r m a t i o n s ,w ep r o p o s et oc o n d u c tt h e r e t r i e v a lb yt h en e wm e t h o do fc o m b i n i n g m o r ec h a r a c t e r i s t i c st og e tt h eb e s te f f e c t t h er e s u l to fe x p e r i m e n to ft h et r a d e m a r ki m a g e r e t r i e v a ls y s t e mi n d i c a t e st h a tt h en e wm e t h o dw o r k sb e t t e rt h a nt h er e t r i e v a lb a s e do nt h es i n g l e c h a r a c t e r i s t i c 1 1 硕上论文基于文本和内容的商标图像检索 s i n c et h eu s e ro ft h ei m a g er e t r i e v a ls y s t e mi sh u m a nb e i n g ,i ti sv e r yi m p o r t a n tf o ru st og e t ac o m p r e h e n s i v eu n d e r s t a n d i n go fi m a g ec o n t e n tt h r o u g ht h ei n t e r a c t i v ew a y s oi ti sn e c e s s a r yt o a d ds o m et e x ti n f o r m a t i o ni nt h es y s t e m ,n a m e l yt oc o n d u c tt h e r e t r i e v a lb a s e do nt h ei m a g e u n d e r s t a n d i n go fu s e r s t h ee x p e r i m e n tr e s u l ts h o w st h a tt h ee f f e c to fr e t r i e v a lb a s e do nb o t h t e x ta n dc o n t e n tc o n f o r m st ot h eh u m a nv i s u a ls e n s e k e yw o r d s :c o n t e n t - b a s e di m a g er e t r i e v a l ,t r a d e m a r ks h a p ec h a r a c t e r i s t i c , f u z z y d i r e c t i o n c h a r a c t e r i s t i c ,c h a r a c t e r i s t i cf u s i o n ,p v rv a l u e i i l 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签:备: 盔鉴芏胡年月j 蝈 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:垒垦生秒a 年占月,2 日 硕i :论文基于文本和内容的商标图像检索 1 绪论 1 1 引言 随着信息、计算机网络技术的飞速发展,大量的图像和视频信号的存储与传输已 经成为可能,我们每天都会获得以g 字节计数的数字图像、数字化的视频信号、医学 图像、遥感图像、新闻图片等等。对这些巨大量的数据如何组织、表达、存储、管理、 查询、检索是对传统数据库技术提出的重大挑战,以文字为对象的传统数据库无法满 足图像数据库的要求,没有对图像及视频数据的自动和有效的描述,大量信息将淹没 在数据库中,无法在需要时被检索出来。因此如何将数字图像处理、计算机视觉技术 与传统数据库技术相结合,建立基于对图像内容自动或半自动描述的新一代图像数据 库就成为迫切的需要,近年来,基于内容的图像检索技术成为国内外研究的热点之一 1 , 2 , 3 , 4 , 5 , 6 1 。 数字图像作为一种重要的信息载体,具有直观、内容丰富、无语言的限制和便于 交流等特点,是一种常用的多媒体资源。它的应用领域非常广泛,如公共安全和犯罪 调查、知识产权保护、电子会议、远程教学、艺术收藏、博物馆管理和电子图书馆、 遥感和地球资源管理、科学数据库管理、商标和版权数据库管理、图像档案和通讯系 统和智能群体决策等等。 商标作为一个企业的标志,不仅是一个企业产品的标识,而且商标的设计还包含 了很多社会和文化的背景。企业商标的管理和保护是极为重要的。经过f 式注册的商 标受到法律的保护。在商标的管理中防止被重复注册或恶意的相似商标图像注册是一 件重要的事,也是商标管理的核心问题。为了防止相似商标的注册,必须找到一种有 效的检索方法来查找这种相似的商标图像,避免知名商标图像的相似图像被恶意注 册。随着全球经济跨国、跨地区发展势头的增加,商标数量逐年递增,给商标审查工 作带来了难度,同时也提出了更高的要求。基于人工编码的商标查找方式效率低下, 因此,需要建立一种准确、高效的商标图像自动检索系统。 本文对现有的基于内容的商标图像检索方法进行了分析,提出了一种新的商标图 像检索方法,并设计开发了一个基于文本和内容的商标图像检索系统。本章首先介绍 了选择该题目的目的和意义,分析了商标图像检索的研究现状及商标图像的分类、检 索方法,最后对于本文的主要研究工作和内容安排进行了阐述。 1 2 选题的目的和意义 商标是商品生产者、销售者或服务提供者为商品、服务设立的可视性标志,代表 i l 绪论颀f j 论文 着企业的声誉、产品的质量。 随着我国经济快速发展,商标注册申请量连年大幅增长,截至2 0 0 7 年1 1 月 底,我国商标注册总量已达3 0 1 3 7 万件。从2 0 0 2 年到2 0 0 6 年平均年增长约1 0 万件, 2 0 0 7 年达到7 0 8 万件。为保护注册商标的合法权益,在新的商标进行注册时,需要 审查待注册商标图像与已注册商标图像的重复性、相似性,从而决定是否具有注册资 格【7 1 。由于注册商标的数量非常庞大,这项工作若完全由人工完成,不仅非常艰苦, 而且效率很低。因此我们迫切需要建立商标的计算机管理系统,实现商标图像的自动 检索,由计算机自动检索出若干个与待注册商标相似的图像,再由管理者决定是否予 以注册。随着注册商标数目的增多,现有的商标分类方法显露出类别数难以确定,标 记比较主观、难以描述商标图像的相似性等问题,因此研究有效的商标图像检索系统 具有非常重要的意义【8 1 。 1 3 商标图像检索研究现状 目前,基于内容的图像检索是一个非常活跃的研究领域。该技术的核一t l , 是提取图 像内容的特征,计算查询图像和目标图像的相似距离,按相似度进行检索。图像的特 征一般是指图像的颜色、纹理、形状以及轮廓等等。在商标图像的检索方法中,国内 外学者己进行了较深入的研究。l a m 等使用无关矩、傅立叶描述子描述图像形状特征 9 1 ,e a k i n s 等用圆形性、相对面积和复杂度等作为形状特征进行检索【1 0 1 ;k i m 等提 出了用显著视觉特征z e r n i k e 矩进行检索】;j a ul i n gs h i h 等利用变形参数、形状 无关矩和边缘直方图等特征来描述商标图像,并对这几类特征分别加权计算整体相 似度【眩】。 国内的一些专家学者也对商标图像检索作了大量研究,获得了较大进展。黄元元 等提出了一种综合利用商标形状特征与其内部空间位置关系特征来检索二值商标图 像的方法 1 3 】;郭丽等提出一种使用全局和局部图像特征检索商标图像的方法【1 4 】:郭丽 等提出一种基于方向特征的商标图像检索方法【1 5 l ;石励等提出利用商标图像在极坐标 系的水平投影特征及垂直投影特征来描述商标图像的形状特征,利用投影特征向量的 欧式距离来度量图像的相似性程度的方法【1 6 1 。卢章平等提出用h u 不变矩和边界方向直 方图分别描述形状,采用等级度量方法进行特征融合并匹配,通过用户反馈算法达 到检索的目的1 1 7 1 。周丽华等提出基于图像纹理的统计特性的十种特征量1 1 引。 1 4 基于内容的商标图像检索 根据世界贸易组织与贸易有关的知识产权协议( t r i p s ) 第1 5 条的规定,对 商标作出如下定义:“任何一种能够将一个企业的商品或服务区别于其他企业的商品 2 硕i :论义基于文本和内容的商标图像检索 或服务的标记或标记的组合均应能够构成商标。”由此可见,商标是区别商品或服务 来源的标记。 在商品经济条件下,生产和经营同类商品的企业同益增多,商品生产者或经营者 之阳j 的竞争也日趋激烈。为了促进商品的销售,一些生产者在自己的商品上使用有别 于他人的商标,目的在于区别商品的出处,通过逐步建立商标信誉来吸引消费者购买 自己的商品。所以,商标的一个本质特征和基本功能是区别性。因此,在相同或近似 的商品上,一种商标应当只有一家企业注册使用,其他人不经允许不得使用。加强商 标管理,可以保护商标专用权,促使生产商保护商品的质量和维护商标的信誉,同时 保障消费者的利益,促进社会主义商品经济的发展】。 1 4 1 商标图像的分类 一般的商标可以分为三种类型: ( 1 ) 文字商标 所谓“文字商标”,是指仅用文字构成的商标,包括中国汉字和少数民族文字、 外国文字和阿拉伯数字或以各种不同字组合的商标。如图1 1 所示。 g o o g l e 图1 1 文字商标 文字商标目前在世界各国使用比较普遍。其特点是比较简明,便于称谓,有的词 表示一定的含义,可以使商品购买者产生亲近之感。 如“雪花”牌商标,用在饮料 商品上,会给人一种凉爽、清洁之感;“海鸥”、“梅鹿”等商标,在日用品和服装 等商品上使用,会给人一种轻松、自如、欢畅之感。文字商标还有使用人名签字商标 和企业名称缩写的。这种商标能使人对其商标的所有人加深印象,直接知道其商品的 生产者或经营者,从而树立企业形象。如“张小泉”剪刀,是张小泉剪刀厂生产的: “沈汽发”汽车发动机,是沈阳汽车发动机厂生产的;“盛锡福”帽子,是盛锡福店 经营的。 还有以数字作商标的,如“7 7 7 ”、“4 1 4 ”、“9 9 9 ”等,这种商标虽然不一定 表示什么意思,但其特点是不落俗套,别具一格,也逐渐被一些人所认识,同样可以 收到较好的效果。但是,文字商标也有其不足之处,就是受到民族、地域的限制。比 如汉字商标在国外就不便于识别。同样,外文商标在我国也不便于识别。还有少数民 绪论 碰 论文 族文字,也受着一定地域所限:因此,在使用民族文字的同时一般需要加其他文字 说明以便于识别。 ( 2 ) 图像商标 图像商标指仅包含图像或几何图形的商标。如图】2 所示。 这种商标丰富多彩,干变万化,可采用各种动物,植物以及几何图形等图形构成。 图像商标的特点是比较直观艺术性强,并富有感染力。图像商标还有一大特点,就 是不受语言的限制,不论哪国人讲何种语言一般都可以看懂有的一看即可呼出名 称有的即使不能直呼名称,也可以给人留下较深的印象。 管 崮l2 型像商标 ( 3 ) 组合商标 组合商标是指由两种或两种以上成分相结合构成的商标,也称复台商标。如图 l 3 所示。如带马的商标图像加上文字后,有的叫“军马”,有的叫“飞马”也有 的叫“奔马”等,即便于 = 别与称谓,同时又使其内容更加深化,也就更具有感染力。 也有的是以汉字、外文字与阿拉伯数字相组台的商标,分别表示不同的含义。可见商 标的种类非常多图像干差万别。 图13 组合商标 142 商标图像的检索方法 商标图像检索是实现商标查找的重要手段之一其目的是对商标图像之问的重复 性、相似性进行审查。我国商标主管部门发布的关于商标行政执法中若干问题的意 见指出:“商标相同或相似的判断:( 1 ) 以核准注册的商标为准,而不是以商标注册 人实际使用的商标为准:( 2 ) 以普通消费者的一般注意力为评判的主观标准,采取整 体比较与商标显著部分比较相结合的方法进行综合判断”。因此,相同商标一般指两 个商标相比较,文字、图形或者二者的组合相同,或者是在视觉上几乎没有差别。近 硕i j 论文基于文本和内容的商标图像检索 似商标一般指两商标相比较,文字的字形、读音、含义,或者图形的构图及颜色,或 者文字与图形的整体结构相似,它易使消费者对商品或服务的来源产生混淆。由此可 见,商标在可视化程度上的相似性大小是判断的重要依据之一,商标检索的核心问题 也就是要解决如何检测出相似的商标图像【3 9 1 。 由于数据库管理和计算机视觉的发展,图像检索自1 9 7 0 年以来,直成为人们 研究的热门课题。现有的商标图像检索方法可以按不同的标准划分,实际中常用的标 准有的按商标的组成结构来划分,有的按商标使用者、用途、享誉程度等标准来划分 1 3 7 ,对商标检索技术而言,一般根据检索机理划分为:类目检索、文本检索和基于内 容的检索。 ( 1 ) 基于类目检索商标 到目前为止,主要的商标图像检索管理系统还是用手工分配注册码的方式来反映 图像的内容。通过等级式分类目录对不同行业不同领域的产品和服务进行分类和组 织,并提供基于类目的浏览查找。著名的商标国际分类通用标准有商标注册用商品 和服务国际分类的尼斯协定( 简称尼斯协定) 。该协定于1 9 5 7 年6 月1 5 同在法国 南部城市尼斯签订,19 6 1 年4 月8 日生效。尼斯协定的成员国目前已发展到6 5 个。我国 于1 9 9 4 年8 月9 日加入了尼斯联盟。尼斯协定的宗旨是建立一个共同的商标注册用商品 和服务国际分类体系,并保证其实施。目前,国际分类共包括4 5 类,其中商品3 4 类, 服务项目1 1 类,共包含一万多个商品和服务项目。申请人所需填报的商品及服务一般 说来都在其中了。目前世界上已有一百三十多个国家和地区采用此分类表。我国自 1 9 8 8 年11 月lr 起采用国际分类,大大方便了商标申请人,更加规范了商标主管机关 的管理,密切了国际间商标事务的联系。尤其是1 9 9 4 年我国加入尼斯协定以来,我们 积极参与了对尼斯分类的修改与完善,已将多项有中国特色的商品加入尼斯分类中。 为了对包括图形要素的商标建立分类,另有商标图形要素国际分类的维也纳协定 ( 简称维也纳协定v i e n n ac l a s s i f i c a t i o n ) ,用于对图形要素进行编码分类显示。 该方法对商标图形要素划分为2 9 类,约1 1 1 个小类和1 5 6 9 个细目。如图1 4 所示。将图 形要素划分数码代号,有利于检索和查询。 i 绪论硕士论文 图1 4 维也纳分类码 如“2 6 1 5 0 7 ”表示几何图形中立体的金字塔,“2 9 1 5 ”表示颜色类中的紫罗兰色。基于 类目检索商标是目前商标申请过程中主流的检索方式【3 8 】。 ( 2 ) 基于文本检索商标 传统的图像数据检索是基于文本的,文件名、题注、关键字都可以用来对图像进 行注释或描述。这样对图像的检索就变成了对关键字的查找。这种查询操作是基于该 图像的文本描述进行精确匹配或概率匹配。然而,完全基于文本的图像检索技术存在 着如下难以克服的缺点: 对于图像库中的每一幅图像,都需要人工进行归纳和注释; 人工注释具有很强的主观性,同一幅图像,不同的人有不同的理解,甚至对 同一个人,在不同的时间也有不同的含义。而且一旦人工注释完成就难以更新和改变。 往往一幅图像包含丰富的含义,人工注释的少量文字难以充分表达图像的含 义。 由于网络的迅速普及,不同国家不同民族很难用同一种语言对图像进行注释, 而且对图像语义理解的差异也很大,因此不可能形成一种统一的检索方法。 9 0 年代初,随着大规模数字图像库的出现,上述问题变得越来越尖锐。为了实 现自动化、智能化的图像查询和管理方式,使查询者可以实现方便、快捷、准确的查 找,使管理者从大量的人工管理工作中解放出来,实现管理工作的无人干预,一种新 的图像检索技术基于内容的图像检索技术( c o n t e n t b a s e di m a g er e t r i e v a l ) 被提 6 硕l 论文 基于文本和内容的商标图像检索 出并迅速发展起来。 ( 3 ) 基于内容检索商标 采用基于内容的方式检索商标主要是根据商标图像的内容特征来进行匹配,如商 标图案的颜色、纹理、形状、位置关系等作为图像的内容进行匹配、查找。利用已有 的算法,进行特征提取和匹配,这些完全可以由机器自动完成,克服了手工注释的低效 和二义性。目前主要实现的是对低层可视化特征的提取和表示,目的是更好的满足对 图形商标、组合商标以及因各种原因缺失了完备说明的商标的检索。 结合上述提到的三个方面,检索商标图像的技术框架如图1 5 所示1 3 9 1 : 视 觉 相 似 程 度 检 索 优 先 级 图1 5 检索商标图像的技术框架 从视觉相似角度而言,类目检索、文本检索、内容检索程度依次递增,内容检索 所达到的相似度最高,因为内容检索侧重于图像本身的可视化特征,更符合人对图像 的直观感受,类目浏览中的相似概念比较抽象,文本检索方式虽然也比较抽象,但 是因为由用户自主提出检索词,因此对于展示用户头脑中的需求更具体一些。不过, 在具体实现中碍于技术实现难度,实用的检索优先级恰相反,由内容检索、文本检 索、类目检索依次递增。基于内容的商标检索出现较晚,成熟系统尚不多见。这种差 异反映出在商标检索上还有待更直观、直接的方式来实现商标的检索,以使视觉相似 度与检索方法和谐一致。 1 5 本文的主要研究工作 本文对现有的基于内容的商标图像检索方法进行了分析,提出了一种新的商标图 像检索方法,并设计开发了一个基于文本和内容的商标图像检索实验系统。主要研究 工作如下: 针对二值商标图像单色的特点,一般利用形状特征对其进行检索。关于形状的统 计值,可以用矩特征来表示。在图像处理中,矩和模糊方向可以作为重要的特征来表 7 l 绪论硕j j 论文 示物体,据此特征来对图像进行检索等操作。本文对基于形状特征( h u 矩、l e g e n d r e 矩、z e m i k e 矩和伪z e r n i k e 矩) 和模糊方向特征图像检索的五种方法进行了实验对 比,结果表明,在基于形状特征的检索中,l e g e n d r e 矩、z e m i k e 矩和伪z e m i k e 矩 的检索性能优于h u 矩;基于模糊方向特征检索的效果优于h u 矩:在相同维数下, 伪z e r n i k e 矩的检索效果最好。 随着矩阶数和特征维数的增加,虽然加强了图像的描述能力,但同时也带来了信 息冗余和维数灾难等问题,加上高阶矩比低阶矩受噪声的影响大,因而并不是矩的阶 数越高,检索的效果越好。通过实验,我们探讨了l e g e n d r e 矩、z e m i k e 矩、伪z e m i k e 矩和模糊方向特征的最佳维数。 由于利用单个特征进行图像检索,未必有足够多的区别性信息,为了进行最佳的 检索,当有众多特征使用时,可以将多个特征进行融合,我们提出融合多个特征的方 法来进行检索,通过本文实现的商标图像检索系统进行了实验,对比实验证明融合多 特征的检索效果优于单个特征的检索。 因为图像检索系统的最终用户是人,因此通过交互手段来捕获人对图像内容的理 解是相当重要的。在系统中我们增加了文本信息,即增加用户对图像的理解进行检索, 实验证明,基于文本和内容的检索效果是最符合人眼的视觉感受的。 本文设计了一套基于文本和内容的商标图像检索系统,主要是作为一个实验性的 测试平台,实验系统的开发平台为m i c r o s o f tw i n d o w s2 0 0 0s e r v e r ,开发工具为v i s u a l b a s i c6 0 1 6 本文的内容安排 本文的主要内容安排如下: 第一章,绪论。主要介绍了选题的目的、意义,分析了商标图像检索的研究现状 及商标图像的分类、检索方法,最后介绍了本文所做的主要工作。 第二章,是基于内容的图像检索。先介绍了基于内容的图像检索的发展过程和常 用的图像检索系统,接着介绍了图像检索的体系结构,最后分析了基于内容的图像检 索的主要技术。 第三章,根据本文研究的商标图像的特点,重点选取商标图像的形状特征和模糊 方向特征进行检索,利用形状特征( h u 矩、l e g e n d r e 矩、z e m i k e 矩和伪z e r n i k e 矩) 和模糊方向特征进行检索、分析和比较,最后介绍了图像检索算法的评价准则及本文 采用的检索性能评价准则。 第四章,基于多特征融合的商标图像检索。通过大量的实验确定了各种矩的最佳 维数,提出了利用距离融合函数来进行基于多特征融合的商标图像检索的方法。 硕: j 论文 基于文本和内容的商标图像检索 第五章,在图像检索中,将用户对图像的理解作为检索的一个重要技术,提出了 基于文本和内容的商标图像检索方法。 第六章,结束语。对基于内容的商标图像检索进行了总结,并对基于内容的商标 图像检索技术进行了展望。 最后是致谢及参考文献。 9 2 基十内容的图像检索 硕士论文 2 基于内容的图像检索 2 1 图像检索综述 随着信息社会的到来,计算机技术、网络通信技术、数据压缩及处理技术、 消费电子技术的飞速发展和广泛普及,图像、视频数据等信息呈现几何级数的增 长趋势,于是出现了大容量的图像视频数据库。对这些海量的数据如何进行组 织、管理、存储、查询和检索对传统上应用最广泛的数据库技术提出了重大的挑 战。传统数据库通常采用基于关键词的检索方式,这对于处理结构化比较强的文 本、数值信息效果比较好,然而对于图像信息的检索却具有相当大的局限性,由 于没有对图像进行自动和有效的描述,大量信息将淹没在数据库中,无法在需要 时被检索出来。因此,如何将数字图像处理、计算机视觉与传统数据库技术相结 合,建立基于对图像内容自动或半自动描述的新一代图像数据库就成为迫切的需 要,于是基于内容的图像检索c b i r ( c o n t e n t b a s e di m a g er e t r i e v a l ) 应运而生。 2 2 基于内容的图像检索 基于内容的图像检索最早是由k a t o 于1 9 9 2 年提出来的,他用c o n t e n t b a s e d i m a g er e t r i e v a l ( c b i r ) 来形容他所做的一个自动地通过图像的颜色和形状检索 图像的实验。基于内容的图像检索是指通过特征来检索所需图像的过程,而这些 特征可以被自动的从图像本身提取出来( 如:颜色、纹理和形状) 。它是一门涉 及面很广的交叉学科,包括:信号处理、图像处理、机器视觉、数据库、信息检 索和模式识别等相关技术。基于内容的图像检索使用了很多图像处理和计算机视 觉领域的方法,所以有人把c r i r 看成是计算机视觉的一个分支。它与计算机视 觉的关键差别在于:它着重从一组图像定位到所有具有该特征的图像。图像处理 覆盖了更广的方面,包括图像增强、图像压缩、图形传输和图像分析等。 人们将研究图像中所包含的内容信息作为图像的索引,其主要的方法是根据 图像的颜色、纹理、形状以及它们的空间关系等内容特征作为图像的索引,计算 待检索图像和目标图像的相似距离,按相似度匹配进行检索。作为传统数据库检 索的拓展,基于内容的图像检索系统主要是根据图像的内容进行检索。基于内容 的图像检索能直接根据描述媒体对象( 图像) 内容的各种特征进行检索,从数据库 中查找到具有指定特征或含有特定内容的图像,它区别于传统的基于关键字的检 索手段,融合了图像理解、模式识别等技术。具有如下特点: ( 1 ) 直接从图像媒体内容中提取信息线索。它突破了传统的基于表达式检索的 l o 硕l :论义基于文本和内容的商标图像检索 局限,直接对图像进行分析和特征抽取,利用这些描述图像内容的特征来建立索 引。 ( 2 ) 基于内容的图像检索实质上是一种近似匹配的技术。在数据库中,需使用 模式识别的方法对图像库中的图像进行不同索引特征分类。在检索过程中,它采 用某种相似性度量对图像库中的图像进行匹配,以获得查询结果。特征提取和索 引的建立,可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作 量。 ( 3 ) 整个过程是一个逐步逼近和相关反馈的过程。基于内容的图像检索系统 应具有很强的交互能力,用户参与整个检索的过程,这是图像数据库的一个重要 的方面。交互性增强了用户表达查询、评价查询结果和基于这些评价上做进一步 检索的能力。 2 2 1 图像检索的发展过程 2 0 世纪7 0 年代,基于内容的图像检索主要研究方向是基于文件系统的图像 管理【2 0 1 ,它的主要特点是直接对图像文件进行访问,操作简单;但是对于大型的 图像库,需逐一打开图像文件进行浏览,效率就比较低。 2 0 世纪7 0 年代至r j 8 0 年代,基于内容的图像检索主要研究方向前期是基于文本 方式的图像检索,通过对图像标注关键词来建立图像的索引;一般用传统数据库 管理图像的索引,图像数据采用外部文件进行存储,按间接方式访问图像;主要以 数据库专家的研究为主;其主要缺陷是基于特征的相似检索会导致检索结果的不 确定性,整个检索过程是一个逐步逼近和相关反馈的过程;后期研究方向为基于 知识和视觉特征的图像检索,主要特点是通过对图像或图像对象加注知识或特定 领域的视觉特征来建立图像的索引,这个时期的图像数据库主要面向特定的应用 领域,并取得了许多成果,如指纹、人脸识别系统;图像数据用外部文件存储,以间 接方式对图像进行访问;主要以人工智能和模式识别的研究为主,以图像检索的 精确特征匹配为主。 2 0 世纪9 0 年代,人们转向研究面向网络环境的支持基于内容检索的大规模图 像数据库系统,主要以面向w e b 环境下的图像信息检索为主,通过对图像所包含 的内容进行自动或者半自动的特征提取来建立图像索引;对图像内容的统一特征 存在着多种表达方法;图像检索主要面向更加通用的领域,图像查找是一种相似 性查询,检索过程是一个逐步逼近和相关反馈的过程;对图像文件的存储既可以 采用外部文件方式,也可以采用内部二进制的对象方式;主要以模式识别领域为 主,并得到其他领域研究人员的广泛关注。 2 0 0 0 年以后,则进入到标准化发展阶段,图像内容描述将遵循统一标准;基 于内容的图像检索技术将朝商业化方向迈进。 2 摹于内容的图像检索 硕:上论文 2 2 2 常用的图像检索系统 基于内容的图像检索始于九十年代初期,由于此项技术涉及的领域很多,因 此迅速成为研究热点,各大研究机构和公司如:i b m 、m i t 、c o l u m b i a 、s t a n f o r d 、 u i u c 等都推出了各自的系统;各大著名杂志如:i e e et r a n s o np a m i 、i e e e t r a n s o ni m a g ep r o c e s s i n g 、i e e et r a n s o nm u l t i m e d i a 、i e e et r a i l s o nc s v t 、 c o m p u t e rv i s i o na n di m a g eu n d e r s t a n d i n g 、p a t t e mr e c o g n i t i o n 、p a t t e r nr e c o g n i t i o n l e t t e r s 等纷纷设专刊介绍该领域的研究成果。目前,国内外很多机构研究人员都 沿着基于内容的图像检索这个研究方向成功地开发出许多带有商业性质或者研 究性质的c b i r 系统。 ( 1j q b i c i b m 公司的q b i c ( q u e r yb yi m a g ec o n t e n t ) 【2 7 】是第一个用于邮票、商标、 艺术博物馆等图像数据管理的商品化的基于内容的图像检索系统,它对后来的图 像检索技术发展具有重要的影响。q b i c 提供了3 类特征的检索功能:颜色特征、 形状特征和纹理特征。颜色特征的查询包括颜色百分比查询和颜色分布查询,利 用颜色百分比查询,用户可以找到具有相似颜色及比率的图像,而利用颜色分布 查询可进一步找到不仅颜色相似且颜色分布也相似的图像。纹理特征是对图像中 线条的粗糙性、对比性、方向性三者的综合考虑。形状特征查询包括对象形状查 询和轮廓查询。虽然该系统可以使用多种特征进行检索,但这些特征间是孤立而 没有联系的,同时用户使用该系统需要具有图像特征的一些基本知识,这就使得 该系统的易用性大打折扣。 ( 2 ) a r t i s a n a r t i s a n ( a u t o m a t i cr e t r i e v a lo ft r a d e m a r ki m a g e sb ys h a p ea n a l y s i s ) 是由 n o r t h u m b r i a 大学开发的用于抽象几何图形组成的商标图像检索的原型系统。 a r t i s a n 是一个模块化的系统,它可以处理专利局的特定格式的位图,抽取最重 要的形状特征并把它们存储在数据库中。任何新的形状特征可以与数据库中存储 的特征进行匹配,并检索出那些与查询形状最相似的图形。 ( 3 ) s t a r s t a r ( s y s t e mf o rt r a d e m a r ka r c h i v a la n dr e t r i e v a l ) 2 8 1 是新加坡国立大学系统 科学学院开发的结合颜色和形状特征的商标图像检索系统,它同时使用了商标图 像的三种主要特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论