(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf_第1页
(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf_第2页
(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf_第3页
(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf_第4页
(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf_第5页
已阅读5页,还剩58页未读 继续免费阅读

(机械设计及理论专业论文)商标检索方法研究与系统实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京航空航天大学硕士学位论文 摘要 对新的商标注册时,需要查询已有的商标数据库中是否存在相同或类似的商标,从而决定 其是否具有注册资格。随着注册商标的数目不断增加,基于人工编码的商标查询方式逐渐显出 弊端,工作量大,难以满足检索的实时性和准确性的要求,因而研究更准确更高效的商标检索 方法和建立商标自动检索系统在商标领域具有重要的意义。 本文分析了类目检索方法、基于文本检索方法和基于内容检索方法等方法,确定了对含有 文字信息的纯文字商标和混合商标采用基于文本检索方法,对纯图形商标采用基于内容检索方 法;主要研究了基于区域分块特征的商标图像检索方法,结合全局特征和局部特征,兼顾了整 体视觉和局部信息的影响,所采用的基于圆形目标区域的分块方法,相对于基于矩形目标区域 的四叉树分块方法,具有不受图像旋转变化影响的优点,并且形状主方向和有次序的分块特征 提取确保各子块图像有着相对确定的空间位置关系;重点提出了一种基于区域分布特征的商标 检索方法,采取基于形心半径外接圆目标区域的同心圆划分策略,提取其各子区域图像的归一 化的信息熵和一阶差分值作为形状特征,采用欧式距离度量。实验证明以上方法均具有良好的 检索性能和几何不变性。最后,本文开发了一个商标检索系统,作为一个实验性的平台,对各 种检索方法进行验证。 关键词:商标图像检索,文本检索,形状特征提取,文字匹配,商标数据库 商标检索方法研究与系统实现 a b s t r a c t w h e nan e wt r a d e m a r ki sr e g i s t e r e d ,i tw i l lb ec h e c k e dt h a ti ti ss a m eo rv e r ys i m i l a rt ot h e t r a d e m a r k si nt h ed a t a b a s e ,t h a tw i l ld e t e r m i n ew h e t h e ri th a v eq u a l i f i c a t i o nf o rr e g i s t r a t i o n ,d u et ot h e i n c r e a s i n gn u m b e ro fr e g i s t e r e dt r a d e m a r k s ,t r a d e m a r k sr e t r i e v a lb a s e do na r t i f i c i a lm e t h o ds h o w s s o m ed r a w b a c k s ,i t sw o r k l o a di s h e a v ya n di t i sd i f f i c u l tt om e e tt h er e a l - t i m ea n da c c u r a c y r e q u i r e m e n t s ,s or e s e a r c ho nm o r ea c c u r a t ea n dm o r ee f f i c i e n tt r a d e m a r ki m a g er e t r i e v a lm e t h o d sa n d t h ee s t a b l i s h m e n to fa u t o m a t e dt r a d e m a r kr e t r i e v a ls y s t e mi nt h ef i e l do ft r a d e m a r k si so fg r e a t s i g n i f i c a n c e t h ep a p e ra n a l y z e st h ec l a s s i f i c a t i o nr e t r i e v a lm e t h o d ,t e x t - b a s e dr e t r i e v a lm e t h o da n d c o n t e n t - b a s e dr e t r i e v a lm e t h o d , t e x t - b a s e dt r a d e m a r k sa n dm i x e dt r a d e m a r k sa r er e t r i e v e db y t e x t - b a s e dr e t r i e v a lm e t h o d ,g r a p h i c a lt r a d e m a r k sa r er e t r i e v e db yc o n t e n t = b a s e dr e t r i e v a lm e t h o d ,t h e p a p e rm a i n l ys t u d i e d t h et r a d e m a r ki m a g er e t r i e v a lm e t h o db a s e do nr e g i o na n ds u b - b l o c k ,i t c o m b i n e sg l o b a lf e a t u r e sa n dl o c a lf e a t u r e s ,t h eb l o c k e da p p r o a c hb a s e do nt h ec i r c u l a ra r e ai np a p e ri s b e n e rt h a no n eb a s e do n r e c t a n g l ea r e a , b e c a u s e i ti s n t i m p a c t e db yt h ec h a n g e si ni m a g e r o t a t i o n , b e s i d e s ,t h i sp a p e rp r o p o s e dam e t h o db a s e do nt h er e g i o n a ld i s t r i b u t i o no fat r a d e m a r k i m a g e ,u s i n gt h ec o n c e n t r i cc i r c l es p l i t t i n gs t r a t e g yb a s e do nt h ec e n t r o i da n dr a d i u sc i r c l et a r g e t r e g i o n ,e x t r a c t i n gi t sv a r i o u ss u b - r e g i o n sn o r m a l i z e de n t r o p y sa n dt h e i rf n s t - o r d e rd i f f e r e n c es c o r e sa s t h es h a p ef e a t u r e ,t h ee x p e r i m e n t sp r o v e dt h a tt h em e t h o d sh a v eac e r t a i nd e g r e eo fr e t r i e v a l p e r f o r m a n c ea n dg e o m e t r i ci n v a r i a n c e f i n a l l y at r a d e m a r kr e t r i e v a ls y s t e mi se s t a b l i s h e da n dm a d e a sa ne x p e r i m e n t a lp l a t f o r m ,t h ev a r i o u sr e t r i e v a lm e t h o d sa r ea u t h e n t i c a t e d k e y w o r d s :t r a d e m a r ki m a g er e t r i e v a l ,t e x t - r e t r i e v a l ,s h a p ef e a t u r ee x t r a c t i o n , t e x t - m a t c h i n g , 缸翟d e m a r kd a t a b a s e i i 商标检索方法研究与系统实现 图表清单 图1 1 中国注册商标注册申请量统计2 图1 2 纯文字商标举例2 图1 3 纯图形商标举例。3 图1 4 混合商标实例。3 图1 5 维也纳分类码。4 图2 1 商标检索方案9 图2 2 基于内容的图像检索原理1 0 图2 3 形状表示方法分类1 l 图2 4 三幅图像的对比15 图2 5 查询图像相关的图像集合1 7 图2 6 精度v s 回召率曲线1 8 图3 1r g b 图转换为灰度图2 0 图3 2 图像预处理。2 1 图3 3 最小外接矩形法提取的目标区域2 4 图3 4 形心半径外接圆法提取的目标区域2 5 图3 5 最小面积外接椭圆法提取目标区域2 6 图3 6 基于最小外接矩形的子块划分方式2 7 图3 7 基于形心半径外接圆的子块划分方式2 7 图3 8 基于最小面积外接椭圆的子块划分方式2 8 图3 9 二值特征序列提取实例2 9 图3 1 0 作为测试图像的十幅商标图像3 0 图3 1 l 十幅测试图像的变形图像3 1 表3 1 商标图像检索的p v r 指数( ) 3 1 表3 2 几何变换商标图像的检索p v r 指数3 2 图3 1 2 基于分块特征的检索结果3 2 图4 1 目标区域确定方式3 4 图4 2 基于最小外接矩形的划分方式3 5 图4 3 基于形心半径外接圆的划分方式3 6 图4 4 基于最小面积外接椭圆划分方式。3 7 图4 5 检索结果的p v r 曲线图4 0 表4 1 几何变换商标图像的检索p v r 指数( ) 4 1 v j 南京航空航天大学硕士学位论文 图4 6 基于分布特征检索的结果4 1 表5 1 商标检索系统的开发环境4 2 图5 1 系统框架结构模型4 3 图5 2 系统功能结构图4 4 图5 3 数据源建立。4 5 图5 4 数据关系图4 6 图5 5 系统总界面4 6 图5 6 非纯图形商标检索实例4 8 图5 7 商标图像预处理实例4 8 图5 8 纯图形商标检索实例4 9 图5 9 商标管理模块界面5 0 v i i 承诺书 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进 行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外, 本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所 涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标 明。 本人授权南京航空航天大学可以有权保留送交论文的复印件,允许 论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的学位论文在解密后适用本承诺书) 作者签名: 蛔丝趁盔一 e l期: 型旦! 墨:! 南京航空航天大学硕士学位论文 第一章绪论帚一早三有1 = 匕 1 1 研究背景和意义 商标是商品生产者、销售者或服务提供者为商品、服务设立的标志,它的产生和应用是商品 经济发展的产物。商标作为商品、服务的重要标识,代表着企业的声誉、产品的质量,是企业 最重要的工业产权之一它不仅本身有价值,还能创造价值,是一种宝贵的社会财富,并且正 日益成为激烈的市场竞争活动中不可缺少的武器。中国很多企业一般都为自己的产品进行商标 注册,这样就可以实现企业的自我保护。商标注册是为了取得商品的商标专用权,商标注册后, 其他人就不能在相同或近似的商品上注册或使用与自己商标相同或近似的商标,从而可以防止 本企业的的合法权益被侵犯,也就争取了市场。此外,还可以为创名牌打下基础。商标在获得 有效注册后,能长期稳定占领国际市场,扩大销售量,保持良好信誉,成为名牌商标,进而成 为驰名商标;如不及时注册,而被人抢先注册结果是虽然用了大量资金做广告,也毫无经济效 益,相当于为别人宣传,为别人服务,故商标注册有着非常重要的意义。 商标的注册和保护中,认定商标的相同和近似是最基本的问题之一,它贯穿于商标注册和 使用的每一环节。在商标注册申请阶段,商标注册部门要对申请注册的商标进行相同或者近似 性审查,如果该商标与在先注册或者在先申请的商标相同或近似,该商标将被驳回不予注册。 在申请注册的商标通过初步审查进入公告阶段,在先商标的所有人因申请注册的商标与其在先 商标相同者近似为由提出异议,商标注册部门要对异议人的在先商标与已公告的商标是否相同 或近似进行认定,如果认定相同或近似将驳回申请注册的商标。当事人对商标注册部门的上述 驳回决定和异议裁定不服向商标评审部门提出复审,商标评审部门要对申请注册的商标与在先 商标的相同或近似做出自己的认定。不仅如此,当在先商标的所有人以一项注册商标与其在先 商标相同或近似为由,请求商标评审部门撤销注册商标时,商标评审部门也需要对商标的相同 或近似做出认定。在商标使用过程中,在后商标的使用是否与在先商标构成侵权纠纷,行政执 法机关和司法机关同样要面临认定在后商标和在先商标的相同或近似问题。 随着我国经济快速发展,商标注册申请量连年大幅增长,如图1 1 所示。自从1 9 7 9 年我国恢 复全国商标统一注册以来,我国的商标注册年申请量从1 9 8 0 年的2 6 万件迅猛增长至1 2 0 0 8 年的 6 9 8 万件,特别是2 0 0 2 年以来,我国的商标注册年申请量以近1 0 万件的迅速增长,已连续7 年位 居世界第一【2 】。商标注册年申请量的迅猛增长,既反映了我国商标事业的蓬勃发展,同时也对 我国的商标注册工作提出了严峻的挑战。近年来,受到人员编制的限制,我国的商标审查能力 无法适从商标注册申请量飞速增长的需要,造成商标注册申请大量积压,商标周期不断延长, 截止2 0 0 7 年底,我国积压的商标注册申请量已达1 8 0 多万件【3 1 。由于注册商标的数量非常庞大, 商标检索方法研究与系统实现 这项:i = 作若完全由人工完成,不仅非常艰苦,而且效率很低。因此我们迫切需要建立商标的计 算机管理系统,实现商标图像的自动检索,由计算机自动识别出若干个与待注册商标相似的图 像,再由管理者决定是否予以注册。随着注册商标数目的增多,现有的商标分类方法显露出类 别数难以确定,标记比较主观等问题,因此研究有效的商标自动检索方法具有重要的意义。 啪o 瑚o 锕o 蜘0 4 0 弼0 0 加0 0 1 o 1 9 9 92 0 0 02 0 0 i2 0 0 22 0 0 3 2 c 0 4捌52 6 :j 72 0 0 80 图1 1 中国注册商标注册申请量统计 1 2 国内外研究现状 1 2 1 商标的分类 按照不同的划分标准,商标可以划分不同的类型,根据是否在商标局核准注册可划分为注册 商标和未注册商标,根据商标权利主题数量的不同可以划分为单所有人商标和共有商标,根据 商标法第3 条的规定,经商标局核准注册的商标为注册商标,包括:商品商标、服务商标、 集体商标、证明商标,根据内容的不同,一般将商标分为以下三种类型: ( 1 ) 纯文字商标 纯文字商标是指商标的构成要素是纯文字,不含其它图形成分的商标,如图1 2 所示。“文 字”包括中国汉字和少数民族文字、外国文字和阿拉伯数字或以各种不同字组合的文字。文字 商标的字体不限,文字的组合可以是杜撰、无任何意义的字和词,如“s o n y ”。 2 慵多肛嗽 图1 2 纯文字商标举例 南京航空航天大学硕士学位论文 文字商标目前在世界各国使用比较普遍,其特点是比较简明,便于称谓,有的词表示一定 的含义,可以使商品购买者产生亲近之感,文字商标还有使用人名签字商标和企业名称缩写的, 这种商标能使人对其商标的所有人加深印象,直接知道其商品的生产者或经营者,从而树立企 业形象。但是文字商标也有其不足之处,就是受到民族、地域的限制。比如汉字商标在国外就 不便于识别,外文商标在我国也不便于识别,还有少数民族文字也受着一定地域所限,因此, 在使用民族文字的同时,一般需要加其他文字说明以便于识别。 ( 2 ) 纯图形商标 纯图形商标指由纯图形构成的商标,如图1 3 所示。 这种商标丰富多彩,千变万化,可采用各种动物、植物以及几何图形等图形构成。纯图形 商标的特点是比较直观,艺术性强,并富有感染力。纯图形商标还有一大特点,就是不受语言 的限制,不论哪国人讲何种语言,一般都可以看懂,有的一看即可呼出名称,有的即使不能直 呼名称,也可以给人留下较深的印象。 多 图1 3 纯图形商标举例 ( 3 ) 混合商标 混合商标是指由文字和图形两种元素相结合构成的商标,也称组合商标,如图1 4 所示。混 合商标综合了纯文字商标和纯图形商标的不同特点,既有图形又含有文字,图文并茂,形象生 动,引人注意,易于识别,也便于呼叫名称。 9 魁坠丛| 旦虽 南德 ,、- f 坶 、_ r s r8 图1 4 混合商标实例 1 2 2 传统商标检索方法 一般地,传统的商标检索方法包括类目检索方法和基于文本的检索方法。 ( 1 ) 类目检索方法 到目前为止,主要的商标图像检索管理系统还是用手工分配注册码的方式来反映图像的内 容。通过等级式分类目录对不同行业不同领域的产品和服务进行分类和组织,并提供基于类目 的浏览查找。著名的商标国际分类通用标准有商标注册用商品和服务国际分类的尼斯协定( 简 3 商标检索方法研究与系统实现 称尼斯协定,n i c ec l a s s i f i c a t i o n ) 。尼斯协定的宗旨是建立一个共同的商标注册商品和服务国 际分类体系,并保证其实施。国际分类共包括4 5 类,其中商品3 4 类,服务项目l l 类,共包括 一万多个商品和服务项目。目前世界上已有一百三十多个国家和地区采用此分类表,我国自 1 9 8 8 年1 1 月1 日起采用国际分类,大大方便了商标申请人,更加规范了商标主管机关的管理, 密切了国际间商标事务的联系。为了对包括图形要素的商标建立分类,另有商标图形要素国 际分类的维也纳协定( 简称维也纳协定v i e n n ac l a s s i f i c a t i o n ) ,用于对图形要素进行编码 分类显示,最广泛使用的分类查询系统【4 】就是采用维也纳分类码对图像进行索引的,该分类由 商标图形要素按大类、小类及组分类的一览表组成,共分为2 9 个大类,约1 1 1 个小类和1 5 6 9 个细目,将图形要素划分数码代号,有利于检索和查询,如图1 5 所示,商标以3 层结构进行 编码,每类又分为若干子类,即第2 层,每个子类又进一步划分为多个细目。 图1 5 维也纳分类码 基于类目的商标检索方法有着一些重要的缺点: 1 ) 手工对商标图像进行分类比较耗时。每天有大量的待注册的商标需要审查,采用人工分 类的方法速度太慢。 2 ) 人工分类具有主观性。对于同一幅商标图像,不同的人可能会分配不同的分类码,可能 得到的结果各不相同。 3 ) 分类结构更新困难。基于分类的方法最初就得确定分类结构的,而随着行业的不断发展, 最初的结构未必合适,需要结构更新,对于这种结构性的分类,更新比较困难。 4 ) 描述的内容不够全面。一幅商标图像包含的内容是很丰富的,用简单的分类码进行标记 并不能全面地描述出商标图像的所有含义。 ( 2 ) 基于文本的检索方法 4 南京航空航天大学硕士学位论文 基于文本的检索方法就是采用自由词、关键词检索的方式,根据商标被标识的特征字段进 行查找,这样对图像的检索就变成了对关键字的查找。这种查询操作是基于该图像的文本描述 进行精确匹配或概率匹配,它的实质是字符串匹配原理。根据描述对象的不同,文本描述方法 分为两种:基于商标图像的外部特征描述和基于内容的文字描述,前者描述的外部特征包括商 标图像的注册号、商标名字、商标类型、使用商品、申请时间、申请人、申请人地址等于商标 图像内容无关的信息,而后者主要从图像内容出发,对商标意译、图形要素、形状等进行描述。 基于文本的检索方法比类目检索方式能更快地定位所需要查找的对象,使用方便,一般来讲分 类检索与文本检索式互相结合和促进的,类目的组织为关键词检索提供了数据组织的基础。同 时这种完全基于文本的图像检索技术存在也存在缺点: 1 ) 人工注释具有很强的主观性,同一幅图像,不同的人有不同的理解,甚至对同一个人, 在不同的时间也有不同的含义。而且一旦人工注释完成就难以更新和改变。 2 ) 由于网络的迅速普及,不同国家不同民族很难用同一种语言对图像进行注释,而且对图 像语义理解的差异也很大,因此不可能形成一种统一的检索方法。 3 ) 描述的不充分性,商标图像丰富的细节和它的许多引申意义是难以用文字表达出来的, 仅仅几个关键词很难将图像所反映的实质内容和语义关系描述清楚。 1 2 3 基于内容的商标检索方法 9 0 年代初,随着大规模数字图像库的出现,上述问题变得越来越尖锐。为了实现自动化、 智能化的图像查询和管理方式,使查询者可以方便、快捷、准确的查找,使管理者从大量的人 工管理工作中解放出来,实现管理工作的无人干预,一种新的图像检索技术基于内容的图 像检索技术( c o n t e n t - b a s e di m a g er e t r i e v a l ) 被提出并迅速发展起来。人们开始考虑将基于内容的 图像检索技术应用于商标图像检索领域。 基于内容的商标图像检索技术借助图像从底层到高层进行处理、分析和理解的过程,获取 其内容并根据内容进行检索。它涉及到图像处理、计算机视觉、模式识别和数据库等技术。到 目前为止,大部分的基于内容的商标图像检索研究仍处于特征提取阶段,主要是根据商标图像 的内容特征来进行匹配【5 】,如商标图案的颜色、纹理、形状、位置关系等作为图像的内容进行 匹配、查找。基于内容的商标检索具有如下特点: 1 ) 特征提取和匹配完全可以由机器自动完成,克服了手工注释的低效和二义性,也大大减 少了工作量。 2 ) 突破了传统的基于类目、文本检索方式的局限,直接对图像进行分析和抽取特征,利用 图像内容特征进行检索。 从视觉相似角度而言,类目检索、文本检索、内容检索程度依次递增,内容检索所达到的 相似度最高,因为内容检索侧重于图像本身的可视化特征,更符合人对图像的直观感受,类目 5 商标检索方法研究与系统实现 检索中的相似概念比较抽象,文本检索方式虽然也比较抽象,但是因为由用户自主提出检索词, 因此对于展示用户头脑中的需求更具体一些。不过,在具体实现中碍于技术实现难度,实用的 检索优先级恰相反,由内容检索、文本检索、类目检索依次递增。基于内容的商标检索出现较 晚,成熟系统尚不多见。这种差异反映出在商标检索上还有待更直观、直接的方式来实现商标 的检索,以使视觉相似度与检索方法和谐一致。 1 2 4 研究现状和存在的问题 国内外学者对于商标检索方法的研究主要集中在基于内容的商标检索方法上,商标图像的 内容信息一般包括颜色、纹理、形状等,对于商标颜色信息的描述,其方法主要有:统计直方 图、累积直方图、颜色布局、颜色相关图和颜色矩等。作为人工图像的商标图像,其颜色单调, 颜色又是相似审查时考虑的次要因素,故其形状特征较颜色特征更为显著,而且许多商标图像 属于单色无纹理的图像,因此利用形状特征进行检索是当前研究的重点和热点。对于基于形状 特征的描述主要分为:基于边界的特征描述和基于区域的特征描述。 以边界为基础的特征提取方面,f r e e m a n 等人提出用链码来描述商标图像的形状特征【6 】,用 网格近似点之间的链接方向来描述商标的边界曲线,但是此表述不具有旋转的自适应性,后来 他又提出一种向心链码的形状编码方法【7 】;i i v a r i n e n 在前人的基础上又提出链码直方图的的特 征表示方法【引,链码直方图不受起始点的选择的影响;k a u p p i e n 提出了基于物体轮廓坐标序列 的傅里叶描述子特征表示法( 9 1 ,基本思想是假定物体的形状是一条封闭的曲线,沿边界曲线上 的一个动点的坐标变化函数是一个以形状边界周长为周期的函数,这个周期函数可以展开成傅 里叶级数形式,其一系列系数就被称为傅里叶描述子;z h u 等提出基于极坐标变换的傅里叶描 述子的商标检索方法【l o 】;姚玉荣等人利用小波变换提取图像边缘,然后用边界矩对图像的边缘 进行描述【1 1 】,具有较好的平移、尺度和旋转不变性。 以区域为基础的特征提取方面,最普遍的是基于矩的方法,马跃先等提出了利用七个不变 矩特征进行商标图像检索的方法【1 2 】,满足图像的平移、尺度和旋转不变性;k i m 将z e m i k e 矩 用于商标图像检索【1 3 】,其结果符合人的视觉感受;j a i n 等提出了综合利用颜色直方图和h u 不 变矩方法进行商标图像检索【1 4 1 :侯阿临等提出基于联合不变矩形状特征的商标图像检索方法 1 1 5 :e a k i n s 等用圆形性、相对面积和复杂度等作为形状特征进行检索【1 6 】;孙兴华等提出了利用 子图像特征进行商标检索【1 7 1 ,先对商标图像进行子图像分割和抽取,然后提取子图像特征进行 检索;c h a n g 等使用二维隐马尔科夫模型方法进行商标检索【墙】;g u o 等提出在四叉树分解子块 上进行形状特征提取1 1 9 l ,使检索的精度有了进一步的提高。 总的来说,现有的商标检索系统基本上还停留在实验阶段,目前还没有任何一个商标检索 系统能够取代原始的人工编码的商标审查方式【捌,现有的商标图像检索方法在平移、尺度和旋 转不变性、对几何变形商标图像的检索能力、检索精度以及图像与人的视觉感受相一致等方面 6 南京航空航天大学硕士学位论文 还存在不足,需要不断研究新的有效方法,更好的满足用户需求,为将商标检索系统能够达到 实际运用贡献一份力量。 1 3 研究内容 本文对商标检索关键技术进行了学习和研究,研究了前人的商标检索方法,并且在此基础 上提出了本文的检索方法,最后设计开发了一个商标检索实验系统。具体研究内容如下: 1 ) 比较分析了传统的商标检索方法和基于内容的商标检索方法的优缺点,确定本文所用方 案,即纯文字商标和混合商标采用传统的基于文本的检索方法,采用字符串匹配原理实现,纯 图形商标采用基于内容的商标图像检索方法。 2 ) 研究了基于区域分块特征的的商标检索方法。此方法采用全局特征和局部特征相结合, 除了考虑商标图像的全局视觉特征外,还兼顾了局部特征对整体视觉的影响,全局特征主要用 的是不变矩、圆形度等,局部特征是提取的分块特征。本文所用的基于圆形目标区域的分块方 法相对于基于矩形目标区域的四叉树的的分块方法,具有更好的旋转不变性。实验结果证明有 良好的检索性能,具有平移、尺度和旋转不变性,符合人们的视觉感受。 3 ) 提出一种基于区域分布特征的商标检索方法。此方法先将圆形目标区域划分成若干个同 心圆环子区域,提取每个环形子区域图像的信息熵及其一阶差分值作为形状特征,然后采用欧 式距离进行相似性度量。此算法简单,易于实现,实验结果证明有不错的检索性能,具有平移、 尺度和旋转不变性,符合人们的视觉感受。 4 ) 建立一个商标管理库,主要完成商标信息的添加、删除和查看等功能,设计开发了一个 商标检索系统。其设计目标是一个实验性的框架系统,作为各种检索方法的测试平台,开发工 具为v c + + 6 0 和s q ls e r v e r2 0 0 0 。 1 4 论文结构 本文的结构安排如下: 第一章,绪论。主要阐述了本文的选题背景和意义,分析了国内外的研究现状及存在的问 题,阐述了本文主要做的研究工作和内容的安排。 第二章,商标检索关键技术。首先介绍了商标检索的过程或原理,其次研究了形状特征的 表达和描述的方法,这要在基于边界和区域两个方面进行的研究,之后又研究了相似性度量技 术,主要包括几何性相似度量和非几何性相似度量,最后分析了图像检索技术的评价标准。 第三章,基于区域分块特征的商标检索方法。主要包括商标图像全局特征的提取、分块特 征的提取算法和相似性度量算法的描述,最后给出了实验结果性能评价。实验结果证明有较好 检索性能,符合人们的视觉感受。 第四章,基于区域分布特征的商标检索方法。在前人的思想之上,提出了一种新的算法, 7 商标检索方法研究与系统实现 通过划分环形子区域,统计目标像素的区域分布特征,来进行商标检索。此算法简单,实验结 果证明检索性能良好,并且符合人们的视觉感受。 第五章,商标检索系统设计和实现,阐述了系统的结构,数据库设计的相关的内容,主要 包括数据的存储方案、数据库的访问方式和数据表的设计,最后给出了系统的模块界面。 第六章,结论和展望。对本文的研究工作做了一个总结,并给出了今后的研究方向。 8 南京航空航天大学硕士学位论文 第二章商标检索关键技术 商标可以分为纯文字商标、混合商标和纯图形商标,前两者有文字信息,尤其是纯文字商 标,文字信息就是其商标的全部信息,可以采用基于文本的检索方法,虽然基于文本的方法有 缺点,譬如手工注解量大、描述具有主观型和描述不充分,但是这主要是针对用文本描述纯图 形图像而存在的缺点,对于商标图像本身有文字信息的商标而言,并不存在这些缺点,而且采 用这种文字匹配的方式速度比较快,所以对纯文字商标和和混合商标即非纯图形商标采用基于 文本的检索方式。对于纯图形商标,如果采用基于文本的检索方式就会存在注解量大、描述具 有主观型和描述不手充分的所有缺点了,所以采用基于内容的检索方式,可大大减少工作量, 特征提取和相似匹配都采用计算机自动实现,便免了人工描述的主观性。描述图像的内容特征 有颜色特征、纹理特征和形状特征等等,由于商标图像颜色单调,没有纹理,故采用形状特征 进行匹配。综上所述,本文方案为对纯文字商标和混合商标采用基于文本的检索方法,运用的 是字符串匹配,对于纯图形商标采用的是基于内容的商标检索方法,运用的是形状匹配,如图 2 1 所示。本章介绍了基于内容的图像检索原理,在此基础之上研究了商标图像检索的的关键技 术,主要包括商标图像的形状描述方法,相似性度量技术和图像检索系统的的评价标准等。 图2 1 商标检索方案 2 1 基于内容的图像检索原理 9 0 年代初,随着大规模图像集合的出现,对图像进行手工注释方法越来越不能满足需求。 因而,人们提出了基于内容的图像检索( c b i r ) 。所谓基于内容的图像检索,是指直接根据描述 媒体对象内容的各种特征进行检索,它能从数据库中查找到具有指定特征或含有特定内容的图 像,它区别于传统的基于关键字的检索手段,融合了图像理解、模式识别等技术,具有如下特 点: 1 ) 直接从媒体内容中提取信息线索。基于内容的检索突破了传统的基于表达式检索的局限, 9 商标检索方法研究与系统实现 它直接对图像和视频进行分析并抽取特征。 2 ) 基于内容的检索是一种近似匹配。在检索的过程中,它采用某种相似性度量技术对图像 库中的图像进行匹配获得查询的结果。这一点与常规数据库检索的精确匹配方法有明显不同。 3 ) 特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,减少了工作量。 研究和开发基于内容的图像检索系统是目前研究的热点。它把图像处理、图像理解、计算 机视觉、认知心理学、数据库技术等几个领域的技术成果结合起来,是一个有前途的发展方向。 基于内容的图像检索系统一般包括两大子系统,即库生成子系统和查询子系纠2 1 】,如图2 2 所示,前者主要完成的功能是提取图像的特征并入库,在提取特征之前要进行图像预处理,查 询子系统主要完成查询功能,通过界面交互输入待测图像,提取待测图像的特征,使其与图像 特征库中的特征进行相似性匹配,根据相似度的大小输出检索结果。 i 用户界面 土 l 图像输入 j ,v l 图像预处理查询接口结果显示 上j 工可r l 特征提取检索匹配 上j r l 图像特征库 j 图2 2 基于内容的图像检索原理 由以上可以看出,基于内容的图像检索涉及到的主要技术部分主要有: 1 ) 图像的预处理。图像预处理的主要目的是为图像的特征提取打好基础,常用的预处理有 图像的格式转换、去噪声处理、二值化、边缘轮廓的提取等等,具体做什么图像预处理要根据 提取的特征的需要。 2 ) 图像特征的提取。特征提取是基于内容的图像检索的基础,也是最核心的部分,从视觉 上来分,图像的特征可以分为通用特征和特殊特征,前者包括颜色、纹理和形状等,后者则指 一些特殊领域的特征,如人脸和指纹的骨架等。从表达层次上分,图像的特征分为低级特征和 高级特征,前者主要是指直接从图像内容中提取的视觉特征,后者主要指语义方面的特征。由 于人的理解的主观性,对于一个给定的特征没有一个最佳的描述,目前常用的特征有颜色、纹 理、形状和空间位置关系等。 3 ) 图像的相似性匹配。图像的相似性匹配主要是图像特征向量间的相似性,目前主要有几 何形相似度量和非几何性相似度量,其中的几何性相似度量包括马氏距离、欧式距离等。非几 1 0 南京航空航天大学硕士学位论文 何性相似度量虽然提出了一种更广泛的理论,但是实际应用中却很少用,大部分还是基于各种 距离的度量方式。 4 ) 图像检索的评价标准。随着基于内容的检索技术的发展,相应的检索性能评价标准也成 了研究的一部分,到目前为止,还没有一个统一的评价准则。图像内容的主观性使得人们很难 定义一个好的客观准则,另外,因为缺少在相同数据集和查询条件下对不同检索系统进行有效 性的对比实验,也难以确定什么样的评价准则最为有效。目前,人们已经提出了很多人为的评 价尺度,大致可以分为三类:第一类是用户评价的方法,即让用户人为的评价和比较检索的性 能;第二类是用一些特征指标来度量,如用检索精度和检索回召率等;第三类是用图表的方式 进行评价。 2 2 形状特征表达与描述 形状特征是图像的一种基本特征,也是人类视觉系统进行物体识别时所识别的关键信息之 一,图像的形状信息不随图像颜色的变化而变化,是物体稳定的特征。形状特征描述须满足以 下特点: 1 ) 独特性:这一点在图像检索中非常重要,因为每幅图像必须具有一个独特的描述; 2 ) 完备性:形状描述不能似是而t h 3 ) 几何变换后的不变性:几何交换,如平移、旋转、缩放后的不变性,在目标识别中非常 重要; 4 ) 灵敏性:灵敏性要求形状描述能很容易地反映相似目标的差异; 5 ) 抽象性:指形状描述要能从细节中抽象出形状的基本特征,抽象性与形状描述的抗干扰 性直接相关。 图2 3 形状表示方法分类 目前常用的形状特征的表示方法主要分为基于边界的方法和基于区域的方法两大类【2 2 1 ,前 者是用目标的边界和边界的特征,常用的有周长、链码、多边形、傅里叶描述子和弹性匹配【2 3 】 商标检索方法研究与系统实现 等,而后者是用目标在图像内所覆盖的区域,常用的有面积、兴趣点、偏心率、矩和信息熵等, 如图2 3 所示。其中的形状数、周长、偏心率和矩等又被称为全局特征表示,即利用形状信息 计算出一维和若干维的数字特征向量,其中的链码、多边形、凸包、兴趣点等被称为局部特征 表示或离散表示,即形状被分成边界片段或区域子块,从而提取部分特征,组成串或图作为形 状特征。 2 2 1 基于边界的表示方法 基于边界的形状特征提取关键在于边缘检测的研究,在提取边缘的基础上,定义边缘的特 征描述。下面对其中一部分进行介绍: 1 ) 链码。链码是对边界的一种编码表达方法,是利用一系列具有特定长度和方向的相连的 离散的线段来表示目标的边界。对于图像中的像素点而言,它有八个方向的邻域:正东、东北、 正北、西北、正西、西南、正南和东南,对于每一个方向赋予一个代码表示,八个方向分别对 应0 、1 、2 、3 、4 、5 、6 、7 ,被称为方向码。假设从某个起点开始,将区域边界的走向按上面 的编码方式记录下来,可形成如下的序列a l a 2 a 。,其中口l a 。的取值为0 到7 ,这一序列 称为链码的方向链,用其表示图像的链码特征。 2 ) 周长。周长是指边界所包围区域轮廓的周长,一般常用4 方向连通边界和8 方向连通边 界来定义其连通性,得到一个近似长度,垂直的和水平的步幅为单位长度,在8 连通下的对角 步幅的长度为扼,而4 连通下的对角步幅包含两个直角步,其长度为2 。 3 ) 直径。直径是边界上相隔最远的两点之间的距离,即这两点之间的直连线段长度。有时 这条直线也称为边界的主轴或长轴( 与此垂直且最长的与边界的两个交点间的线段也叫边界的 短轴) 。 4 ) 多边形。多边形( 近似) 是指利用一系列线段的封闭集合来逼近大多数实用的曲线到任意 精度【2 4 1 ,在数字图像处理中,如果多边形的线段数与边界上的点数相等,即每对相邻点定义多 边形的一个边,则多边形可以完全准确的表达边界,实际中多边形表达的目的就是要用尽量少 的线段来代表本边界并保持边界的基本形状。常用的多边形表达方法有以下三种:基于收缩 的最小周长多边形法;基于聚合( m e r g e ) 的最小均方误差线段逼近法;基于分裂( s p l i t ) 的最 小均方误差线段逼近法。 5 ) 傅立叶描述符。可以将边界看作闭合曲线,将边界坐标序列看做一个复数序列,对该复 数序列做离散傅里叶变换,展开成傅里叶级数形式表示,傅里叶级数中的一系列系数是与边界 曲线的形状有关的,称为傅里叶描述符,用其描述形状特征。 6 ) 小波轮廓描述符。将边界坐标序列看做一个复数序列,对该复数序列做离散小波变换, 将变换后的小波系数可以作为平面闭合曲线的小波描述符。小波轮廓描述符的特点是受轮廓的 局部畸变影响较小以及用较少的系数可实现较高的轮廓描述精度。相比傅立叶描述符有更好的 1 2 南京航空航天大学硕士学位论文 精度和稳定性。 2 2 2 基于区域的表示方法 区域描述方法主要包括的参数如下: 1 ) 区域面积。区域面积是区域的一个基本特征,它描述了区域的大小,对于数字图像而言, 区域的面积定义为区域中的像素点数。此特征受尺寸、扭曲和缩放的影响,但是它具有旋转不 变性。 2 ) 矩形度。矩形度又称矩形拟合因子,定义为物体的面积与物体的最小外接矩形的面积的 比值,取值的范围为 0 ,l 】,矩形度反映了物体对它的最小外接矩形的充满程度。对于矩形物体 其矩形度为1 ,圆形物体的值为万4 ,三角形物体的值为0 5 。形状越纤细弯曲的物体其矩形 度越小。 3 ) 兴趣点。兴趣点是认知心理学中的注视焦点,在其附近的局部区域内一定蕴含了图像中 更多的显著细节,兴趣点作为一种局部特征,是指图像灰度在水平和垂直方向都发生很大变化 的一类特殊点口5 1 。一般情况下兴趣点被认为是角点,除此以外还可以是图像中具有复杂纹理特 征的特殊点,可以借助这些视觉突出的局部信息浓缩一副图像的信息量。兴趣点是一种重要的 图像视觉特征点,属于图像形状特征范畴,具有计算量小、信息含量高的特点,已经在三维解 释、运动估计及图像匹配等方面得到广泛应用。 4 ) 偏心率。也可叫伸长度,有如下两种计算方法:常用方法:计算边界长轴( 直径) 长度 和短轴长度的比值,此结果受物体形状和噪声的影响比较大;较好方法:用整个区域的所有 像素,抗噪声等干扰的能力较强。 5 ) 区域的矩。矩是一种完备的数学表示,其优点是能够直接作用于包含感兴趣目标的目标 区域而不需事先把目标分离出来。区域的矩是用所有属于区域内的点计算出来,因而不太受噪 声的影响,矩在图像检索中得到了广泛的应用。迄今为止,常见的矩描述子可以分为以下几种: h u 不变矩、正交矩( l e g e n d r e 矩、z e h l i k e 矩,p s e u d o z e m i k e 矩) 、复数矩和旋转矩等。 6 ) 信息熵。对于数字图像而言,图像由像素组成,不同灰度的像素出现次数的不同及其分 布空间位置的不同,使得图像呈现各种各样不同的形状。因此,不同形状

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论