




已阅读5页,还剩46页未读, 继续免费阅读
(通信与信息系统专业论文)商标图像检索研究与系统实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于内容的图像检索是根据描述图像视觉内容的特征向量进行相似性检索 其中图像视觉内容的提取可以是通用的 也可以是基于特定领域的 基于特定领 域的图像检索技术可以充分利用该领域内的有用知识 其检索结果更能符合用户 的需求 随着市场经济的发展 注册商标的数目不断增加 需要建立一种准确 高效的商标图像自动检索系统 因此基于内容的图像检索技术在商标检索领域得 到了非常广泛的应用 本文对基于内容的商标图像检索 尤其是对分块检索方法 进行了研究 提出了一种新的基于极坐标下分块的商标图像分块检索方法 并设 计 丌发了一个基于综合特征检索的商标图像检索系统 商标图像的分块检索是将商标图像分块后 利用全局和局部图像特征来检索 商标图像 每个子块图像特征能够反映图像的局部特征 而多个子块图像特征的 结合又能够对区域的整体形状进行描述 针对现有的四叉树分块方法的不足 提 出了一种极坐标下的分块检索方法 首先对商标图像进行预处理 得到规则二值 图像 计算目标像素的最小外接圆和图像的形状主方向 在以最小夕 接圆圆心为 原点 形状主方向为极轴方向的极坐标中将图像分块 提取各子块特征 构成形 状直方图并平滑处理 再结合全局形状特征来综合表示图像内容 最后采用新的 相似性度量方法计算图像间距离 实现商标图像的准确检索 实验证明 该方法 具有良好的平移 缩放 旋转和镜像不变性 得到的检索结果能很好地符合人的 视觉感受 本文设计开发了一套基于综合特征检索的商标图像检索系统 其目标是一个 实验性的框架系统 主要是作为各种检索算法的测试平台 可以很方便地定制不 同的分块检索算法 关键词 商标图像检索 分块图像特征 最小外接圆 极坐标下分块 镜像不变 性 商标图像检索研究与系统实现 a b s t r a c t c o n t e n tb a s e di m a g er e t e v a l i st op e r f o r mt h es i m i l a r i t yr e t r i e v a la c c o r d i n gt o t h ei m a g ef e a t u r e sr e p r e s e n t i n gt h ei m a g ec o n t e n t w h i c hm a yb ee x t r a c t e di nt h e g e n e r i co rs p e c i f i cd o m a i n s p e c i f i cd o m a i nb a s e di m a g er e t r i e v a lc a nb e n e f i tf r o m t h eu s e f h ld o m a i nk n o w l e d g ea n dt h ec o r r e s p o n d i n gr e t r i e v a lr e s u l t sc a l lm e e tt h e u s e r sr e q u i r e m e n tb e t t e rt h a nt h eg e n e r i co n e w i t ht h ed e v e l o p m e n to fm a r k e t e c o n o m yt h et r a d e m a r kp l a y st h em o r ea n dm o r ei m p o r t a n tr o l ei nt h ec u r r e n ts o c i e t y a n dt h ec o n t e n tb a s e di m a g er e t r i e v a lt e c h n i q u eh a sb e e nw i d e l yu s e di nt h et r a d e m a f k d o m a i n t h i sp a p e rd o e sr e s e a r c hm a i n l yo nc o n t e n tb a s e dt r a d e m a r ki m a g er e t r i e v a l e s p e c i a u yo ns u b b l o c k b a s e di m a g er e t r i e v a l p r e s e n t i n gan e ws u b b l o c k b a s e di m a g e r e t r i e v a lm e t h o du n d e rt h ep o l a rc o o r d i n a t es y s t e mf o rr e t r i e v i n gt r a d e m a r ki m a g e a n dd e s i g n st f a d e m a i kt m a g er e n e v a ls y s t e mb a s e do ni n t e g r a t e df 音a t u r e s t h es u b b l o c k b a s e di m a g er e t r i e v a lu s e sg l o b a la 1 1 dl o c a li m a g ef e a t u r e st o r e t r i e v et r a d e m a r ki m a g e t h ei m a g ei s p a r t i t i o n e di n t os e v e r a ls u b b l o c k s e a c h s u b b l o c ki m a g ef e a t u r e sr e n e c tt h ei m a g el o c a li n f o m a t i o na n dt h ec o m b i n a t i o no f m u l t i p l es u b b l o c k s i m a g ef e a t u r e sd e s c r i b et h ew h o l er e g i o ns h a p e t h i sp a p e r p r o p o s e sas u b b l o c k b a s e di m a g er e n 哼e v a lm e t h o du n d e rt h ep o l a rc o o r d i n a t es y s t e m f o rr e t e v i n gt r a d e m a r ki m a g e a f t e rp r e p r o c e s s i n gt h et r a d e m a r ki m a g e t h er e g u l a r b i n a r y i m a g e i so b t a i n e d t h e n t h em i n i m u mc i r c u m s c r i b e dc i r c l ea n ds h a d e p r i n c i p a lo r i e n t a t i o no ft h eo b j e c tr e g i o na r ec a l c u l a t e d a n dt h eo b j e c tr e g i o ni s d i v i d e di n t os o m eb l o c k si nt h ep o l a rc o o r d i n a t e w h i c hu s e st h ec e n t e ro ft h e m i n i m u mc i r c u m s c r i b e dc i r c l ea st h eo r i g i na n dt h ed i r e c t i o no ft h es h a p ep r i n c i p a l o r i e n t a t i o na st h ed i r e c t i o no ft h ep o l a ra i s a n dt h ef c a t u r e so fa l ls u b b l o c k sa r e e x t r a c t e dt oc o m p o s es h a p eh i s t o g r a m sa n dt h e ns m o o t h e d t h e n c o m b i n e dw i t h g l o b a lf e a t u r e st os y n t h e t i c a l l yr e p r e s e n tt h ec o n t e mo ft h ei m a g e f i n a l l y an e w i m a g es i m i l a r i t yi su s e dt oc o m p u t et h ed i s 协n c eb e t w e e ni m a g e s e x p e m e n tr e s u l t s s h o wt h a tt h i sm e t h o dc a nk e e pg o o di n v a a n c eu n d e rt r a n s l a t i o n r o t a t i o n s c a l ea n d m i r r o r a n dt h er e t r i e v e dr e s u l t sm a t c hh u m a nv i s u a lp e r c e p t i o nv e r vw e l l t h i sp a p e rd e s i g n sat r a d e m a r ki m a g er e t r i e v a ls y s t e mb a s e do ni n t e g r a t e d f c a t u r e s w h i c hi sa i m e dt ob ea ne x p e r i m e m a ls y s t e ma n dc a nb eu s e dt ot e s td i f f e r e n t r e t r i e v a l a l g o r i t h m s i t i sa l s o v e r y c o n v e n i e n tt oc u s t o m i z et h ed i f k r e n t s u b b l o c k b a s e dr e t r j e v a lm e t h o d s 1 1 k e yw o r d s t r a d e m a r ki m a g er e t r i e v a l s u b b l o c ki m a g ef e a t u r e s m i n i m u m c i r c u m s c r i b e dc i r c l e s u b b l o c ku n d e rt h ep o l a rc o o r d i n a t e m i r r o r i n v a r i a n t i i i 插图索引 1 1c b i r 系统工作流程示意图 2 2 1 形状主方向的确定及目标区域的提取 1 2 2 2 图像分块分解示意图 1 3 3 1 灰度直方图 1 6 3 2 用质心半径法提取目标区域 1 7 3 3 质心位移对目标区域的影响 1 8 3 4 求最小外接圆 2 0 3 5 用最小外接圆法提取目标区域 2 0 3 6 确定形状主方向 2 1 3 7 极坐标下的分块方法 2 2 4 1 镜像图像间各分块对应关系 2 7 5 1 商标图像检索实验系统流程图 3 1 5 2 商标图像检索实验系统主界面 3 2 5 3 设置检索条件对话框 3 2 5 4 精度v s 回召率曲线 3 5 5 5 用于测试不变性的检索结果 3 6 5 6 用于测试视觉一致性的检索结果 3 8 图图图图图图图图图图图图图图图图图 附表索引 表5 1 商标图像检索p v r 指数 3 8 v 湖南大学 学位论文原创性声明 本人郑重声明 所呈交的论文是本人在导师的指导下独立进行研究所取 得的研究成果 除了文中特别加以标注引用的内容外 本论文不包含任何 其他个人或集体已经发表或撰写的成果作品 对本文的研究做出重要贡献 的个人和集体 均已在文中以明确方式标明 本人完全意识到本声明的法 律后果由本人承担 作者签名 5 扶坞 日期 加易年弓月谚日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留 使用学位论文的规定 同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版 允许论文被 查阅和借阅 本人授权湖南大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索 可以采用影印 缩印或扫描等复制手段保存和汇编 本学位论文 本学位论文属于 1 保密口 在 年解密后适用本授权书 2 不保密团 请在以上相应方框内打 作者签名 弘弱 导师签名 冲彩彳 留如考 日期 加易年弓月增日 日期 柳 年岁月z 驴日 1 1 引言 第1 章绪论 商标 t r a d e m a r k 是商品生产者 销售者或服务提供者为商品 服务设立的可 视性标志 代表着企业的声誉 产品的质量 为保护注册商标的合法权益 在新 的商标进行注册时 需要审查待注册商标图像与已注册商标图像的重复性 相似 性 从而决定其是否具有注册资格 随着近年来全球经济跨国 跨地区发展势头增加 商标数量逐年递增 以我 国为例 据统计 2 0 0 1 年我国商标注册申请量为2 7 万件 到2 0 0 4 年 年申请量 翻了一番 达到5 8 8 万件 截至2 0 0 5 年6 月底 我国的注册商标累计总量已达 2 3 7 万件 商标申请数量的激增为商标审查工作带来了难度 也提出了更高的要 求 基于人工编码的商标查询方式难以满足检索的实时性和准确性要求 因此需 要建立一种准确 高效的商标图像自动检索系统 基于内容的图像检索是根据描述图像视觉内容的特征向量进行相似性检索 其中图像视觉内容的提取可以是通用的 也可以是基于特定领域的 基于特定领 域的图像检索技术可以充分利用该领域内的有用知识 其检索结果更能符合用户 的需求 目前基于内容的图像检索技术在商标检索领域得到了非常广泛的应用 1 2 基于内容韵图像检索 早期的图像检索是基于关键字的检索 这些关键字由人工迸行标注 效率低下 且不准确 得不到令人满意的检索结果 c b i r 使用图像的可视特征对图像进行检 索 其中的特征提取和索引的建立可由计算机自动完成 避免了人工描述的主观 性 c b i r 是根据描述图像内容的各种特征进行检索 它能从数据库中查找到具有 指定特征或含有特定内容的图像 它区别于传统的基于关键字的检索手段 融合 了图像理解 模式识别等技术 具有如下特点 1 从图像内容中提取信息线索 基于内容的图像检索 突破了传统的基于 表达式检索的局限 它直接对图像镜像分析和抽取特征 利用这些描述图像 内容的特征来建立索引 2 基于内容的图像检索实质上是一种近似匹配的技术 在数据库中 需使 用模式识别的方法对图像库中的图像按不同索引特征分类 在检索的过程 商标图像检索研究与系统实玑 中 它采用某种相似性度量对图像库中的图像进行匹配 以获得查询结果 这一点与常规数据库检索的精确匹配方法有明显不同 3 特征提取和索引建立可由计算机自动实现 避免了人工描述的主观性 也大大减少了工作量 目前已经推出了许多知名的c b i r 原型系统 例如i b m 的q b i c 系统 1 哥伦 比亚大学开发的v i s u a l s e e k 系统 1 u i u c 大学开发的m a r s 系统 m i t 实验室开 发p h o t o b o o k 系统 3 以及b e r k e l v 大学开发的c h a t b o t 系统 3 等 通用型的c b i r 系统虽已有少量商品出现 但远未能实际应用 然而针对某一 特定类型图像研究c b i r 系统的关键技术对c b i r 技术的发展将会有很大的推动促进 作用 这符合从易到难 从特殊到一般的研究规律 c b i r 系统广阔而重要的应用领域主要有数字图书馆 知识产权保护 如商标 注册 地理信息g i s 安全管理 如人脸识别和指纹识别 医疗图像管理 建 筑与工程设计 卫星遥感图像管理 纺织和时装设计等方面 c b i r 系统工作流程如图1 1 所示 包括两个阶段 特征值预先提取阶段和图像 搜索阶段 在特征值预先提取阶段 图像数据库中每幅图像的特征值被计算出来 并存放在特征数据库中 图像搜索阶段先提取待搜索图像的特征值 并和特征数 据库中的信息进行比较 以获得最匹配的结果 疃夔匝卜圈野随圃 一一一一j 雪誓i 耋器一一 一一 一一一一一一一一一 图像搜索阶段 陌磊丽 门而疆孬口 雨面匏孙r 藏两凛 l 一 图1 1c b l r 系统工作流程示意图 c b i r 系统依赖于两个关键技术 特征值提取和特征值匹配 文献 6 就各种图 像特征值提取方法和特征值匹配时采用的各种相似性度量方法的检索性能进行了 测评 发现h s v 颜色直方图 颜色一致性向量在c o r e l 综合图库上具有较高的结 果正确率 一阶距离度量方法 见公式1 1 i 为图像的n 维特征向量 计算复 杂度低且性能较好 d p q 艺 l i p 一g i 1 1 1 3 基于内容的商标图像检索 商标图像检索是实现商标查找的重要手段之一 其目的是对商标图像之间的 重复性 相似性进行审查 我国商标主管部门发布的 关于商标行政执法中若干 问题的意见 指出 商标相同或相似的判断 1 以核准注册的商标为准 而不是 以商标注册人实际使用的商标为准 2 以普通消费者的一般注意力为评判的主观 标准 采取整体比较与商标显著部分比较相结合的方法 进行综合判断 因此 相同商标一般指两个商标相比较 文字 图形或者二者的组合相同 或者是在视 觉上几乎没有差别 近似商标一般指两商标相比较 文字的字形 读音 含义 或者图形的构图及颜色 或者文字与图形的整体结构相似 它易使消费者对商品 或服务的来源产生混淆 也可见 商标在可视化程度上的相似性大小是判断的重 要依据之一 商标检索的核心问题也就是要解决如何检测出相似的商标图像 现有的商标图像检索方法可以按不同的标准划分 实际中常用标准有按商标 组成结构划分 按商标使用者 用途 享誉程度等标准划分 1 对商标检索技术 而言 一般根据检索机理划分 包括类目检索 文本检索 基于内容检索 1 3 1 基于类茸检索商标 目前 类目检索是实践中使用最为普遍的方式之一 通过等级式分类目录对 不同行业不同领域的产品和服务进行分类和组织 并提供基于类目的浏览查找 著名的商标国际分类通用标准有 有关商标注册用商品和服务国际分类的尼斯协 定 简称 尼斯协定 n i c ec 1 a s s i f i c a t i o n 我国在1 9 8 8 年以前采用的是 国内分类法 自1 9 8 8 年1 1 月开始采用尼斯国际分类 尼斯分类包括4 5 个大类 其中商品3 4 类 服务项目1 l 类 茫包含一万多个商品和服务项目 同时为了对 包括图形要素的商标建立分类 另有 建立商标图形要素国际分类的维也纳协定 简称 维也纳协定 v i e n n ac l a s s i f i c a t i o n 1 用于对图形要素进行编码分 类显示 该分类由商标图形要素按大类 小类及组分类的一览表组成 并根据情 况加以注释 所有分类包括2 9 个大类 下面设有子类 如 3 3 1 1 4 a 表示动物 类中的熊猫图像 2 9 1 5 表示颜色类中的紫色 基于类目检索商标是目前商 标申请过程中主流的检索方式 1 3 2 基于文本检索商标 采用自由词 关键词检索的方式 根据商标被标识的特征字段进行查找 并 可使用简单的布尔操作符连接查询词 构造查询表达式 如美国联邦政府注册商 标库 t r a d e m a r ks c a nf e d e r a l 通过d i a l o g 提供检索 检索功能包括特征字段检 索 布尔逻辑检索 截词检索 号码检索 3 又如中国商标数据库网站 提供的 3 塑堡塑堡丝童丝窒兰重垒塞垫 检索功能 结合类目和文本查找 查找字段包括注册号 中文 拼音 英文 商品 服务名称 日文片假名 商标所有人 图形要素 图形要素根据维也纳协定中的 号码规则书写 文本检索的实质是字符串匹配原理 通过对商标特征的文本描述 建立索引 实现提问与特征标识的匹配 文本检索方式比类目浏览能够更快速地 定位所需要查找的对象 使用方便 不过类目检索与文本检索一般是相互结合和 促进的 类目的组织为自由词 关键词检索提供了数据组织的基础 1 3 3 基于内容检索商标 随着商标数目的不断增长 前两种检索的弊端逐渐显露 一方面手工分类的 人工消耗比较大 而且分类 标引的一致性不易保证 另一方面 对于一些抽象 商标图像既不易归类 也不易通过文本方式来描述 针对这些不足 人们考虑将 基于内容的图像检索技术应用于商标图像的检索应用中 以实现更直观 客观的 商标检索 基于内容的图像检索始于2 0 世纪9 0 年代 因此 以基于内容检索方 式查询商标图像也属于较晚兴起的研究 该领域的早期研究之一是1 9 9 2 年日本的 t k a t o 建立的商标形状检索系统 3 基于内容的商标检索根据商标图像的内容特征来匹配 如商标图案的色彩 图像中某个对象的形状等 目前主要实现的是对低层可视化特征的提取和表示上 目的是更好地满足对图形商标 组合商标 以及那些因为各种原因缺失了完备说 明的商标的检索需求 这类商标难以通过文本形式得到很合适的描述 采用基于 内容的方式检索商标 需要提取并标出商标图像显著的可视化特征 通常采用形 状 颜色特征 然后与已有商标图像的特征库匹配 根据两个商标图像的可视化 相似程度判断它们是否具有雷同嫌疑 如基于内容检索所一般采用的q b e q u e r y b ye x a m p l e 用户可提交图像示例 根据示例的特征查找与之相似的其它图像 基于内容的商标检索同样可以实现基于示例的检索 商标图像特征一般包括颜色 c o l o r 形状 s h a p e 以及版面 l a y o u t 等特征 在纹理特征上一般不明显 商标图像检索实际上是图像检索的一个子集 与图像检 索相似 商标图像检索重点需要解决两个问题一一图像特征的表示问题以及相似 度计算问题 同时在特征提取上需满足比例不变性 旋转不变性 1 4 本文主要研究工作 本文对现有的商标图像分块检索方法进行了研究 提出了一种基于极坐标下 分块图像特征的商标图像检索新算法 并设计了一套基于综合特征检索的商标图 像检索系统 其主要研究工作如下 4 1 本文对基于内容的商标图像检索进行了综述 介绍了常用的全局形状特征 提取方法 如傅立叶描述符 形状不变矩 并重点对分块检索方法进行了 分析 详细描述了四叉树分块检索方法的步骤 指出了该方法的不足 2 针对四叉树分块检索方法的不足 提出了一种极坐标下的分块检索方法 得到的各分块间有着明显的几何特征 充分利用这些特征 保证了分块图 像特征的镜像不变性 进一步增强了旋转不变性 可以更好的满足了人的 视觉感受 3 本文设计开发了一个基于极坐标下分块图像特征的商标图像检索系统 其 设计目标是一个实验性的框架系统 作为各种检索算法的测试平台 可以 方便地定制出各种不同的分块检索算法 1 5 内容结构 本文的主要内容安排如下 第一章绪论 主要阐述了基于内容的图像检索的基本过程 商标图像检索的 一般方法 本文所做的主要研究 以及本文的内容安排 第二章对基于内容的商标图像检索进行了综述 介绍了常用的全局形状特征 提取方法 如傅立叶描述符 形状不变矩 并重点对分块检索方法进行了分析 详细描述了四叉树分块检索方法的步骤 指出了该方法的不足 第三章针对匹叉树分块检索方法的不足 提出了一种极坐标下的分块检索方 法 首先对商标图像进行预处理 以目标对象的最小外接圆作为目标区域 确定 图像的形状主方向 以形状主方向为基准 在极坐标下把图像目标区域分块 分 别提取每一子块的形状特征构成形状直方图 最后结合全局形状特征来综合表示 图像的特征 第四章先介绍了几种常见的距离度量方法 采用了三 距离来计算各单个特征 距离 对于分块图像特征 采用了相应的相似性度量方法 实现了镜像不变性 对内部分量 各特征距离分别进行归一化处理后 进行综合特征检索 第五章首先介绍了实验系统的工作流程 框架结构 然后介绍了实验性能评 价方法 与四叉树分块方法对比 进行了三方面实验 分析了实验结果 之后是总结 对本文的研究工作及取得的成果进行了归纳总结 提出今后研 究的方向 最后是参考文献及致谢 塑堑垦堡丝童堡垒 蚕釜耋丝 2 1 引言 第2 章商标图像检索研究现状 商标图像特征一般包括颜色 形状以及版面等特征 与其它图像相比 作为 人工图像的商标图像 其形状特征较颜色特征更为显著 而且许多商标图像属于 单色无纹理的二值图像 因此一般利用形状特征进行检索 而形状特征的表达必 须以对图像中物体或区域的划分为基础 对于一般的图像 当前的技术无法做到 准确而鲁棒的自动图像分割 对于商标图像 其包含的物体或区域可以直接获得 所以形状特征能很好地应用于商标图像检索 通常来说 形状特征有两种表示方法 一种是轮廓特征的 一种是区域特征 的 前者只用到物体的外边界 而后者则关系到整个形状区域 这两类形状特征 的最典型方法分别是傅立叶描述符和形状无关矩 我们在本章中将详细介绍这两 种方法 傅立叶描述符和形状无关矩等特征描述的是图像的全局特征 没有利用局部 图像特征和局部图像间的空问关系 而分块检索方法将图像分块后再提取各子块 的特征 可以全面的描述图像内容 提高检索性能 我们着重介绍了目前常用的 四叉树分块检索方法 并分析指出了该方法的不足 2 2 形状特征表示方法 目前有很多关于商标图像的形状特征表示方法 l m 等使用无关矩 傅立叶 描述子描述图像形状特征 1 e a k i n s 等用圆形性 相对面积和复杂度等作为形状 特征进行检索 1 k i m 等提出了用显著视觉特征z e r n i k e 矩进行检索 1 j a ul i n g s h i h 等利用变形参数 形状无关矩和边缘直方图等特征来描述商标图像1 下面 我们详细介绍几种典型的形状特征 2 2 1 傅立叶描述符 傅立叶形状描述符 f o l i r i e rs h 印ed e s c r i p t o r s 的基本思想是用物体边界的傅 立叶变换作为其形状描述 假设一个二维物体的轮廓是由一系列坐标为 札 的 像素组成 其中o j l 而 是轮廓上像素的总数 从这些边界点的坐标中可 以推导出三种形状表达 分别是曲率函数 c u r v a t u r ef u n c t i o n 质心距离 c e n t r o i d d i s t a n c e 和复坐标函数 c o m p l e xc r d i n a t e sf u n c o n 轮廓线上某一点的曲率定义为轮廓切向角度相对于弧长的变化率 曲率函数 置 j 可以表示为 足 j 可以表示为 6 k 加芸郎 其中秽 j 是轮廓线的切向角度 定义为 m a n 1 笔 y 警 乩 车 船 2 1 2 2 质心距离定义为从物体边界点到物体中心瓯 豇 的距离 如下所示 r j x 一k 2 j 一y 2 2 3 复坐标函数是用复数所表示的像素坐标 z s 一 儿一儿 2 4 对这种复坐标函数的傅立叶变换会产生一系列复数系数 这些系数在频率上 表示了物体形状 其中低频分量表示形状的宏观属性 高频分量表达了形状的细 节特征 形状描述符可以从这些变换参数中得出 为了保持旋转无关性 我们仅 仅保留了参数的大小信息 而省去了相位信息 缩放的无关性是通过将参数的大 小除以d c 分量 或第一个非零参数 的大小来保证的 请注意变换无关性是基 于轮廓的形状表示所固有的特点 对于曲率函数和质心距离函数 我们只考虑正频率的坐标轴 因为这时函数 的傅立叶变换是对称的 即有l 凡f l 毋l 基于曲率函数的形状描述符表示为 i 旧i i r 卜 凡 2 2 5 其中f 表示傅立叶变换参数的第f 个分量 类似的 由质心距离所导出的形 状描述符为 厶 i 斟 黔 俐l 汜s 对于复坐标函数 正频率分量和负频率分量被同 时采用 由于d c 参数与形 状的所处的位置有关而被省去 因此 第一个非零的频率分量被用来对其它变换 参数进行标准化 复坐标函数所导出的形状描述符为 止 l 掣 斜 静 俐 眩 为保证数据库中所有物体的形状特征都有相同的长度 在实施傅立叶变换之 前需要将所有边界点的数目统一为m 例如 m 可以取为 鲋 这样就可以采 用快速傅立叶变换来提高算法效率 7 塑堡里堡竺童墼至至垒鎏釜兰 2 2 2 胁不变矩 作为一组关于形状的统计值 矩不变量的表示形式有多种 如i e g e n d a 矩 z e r n i k e 矩等 我们对图像的形状特征提取采用胁矩表示 其在图像像素数目一 定的情况下 具有对图像的旋转 r o t a t e 平移 s h i f t 尺度变化 s c a l e 和镜 像 m i r r o r 的不变性 定义l 图像的 p 口 阶矩 给定二维连续函数厂 x y 式 2 8 定义了其 p g 阶矩 m 朋 卜9 y 9 厂 z j 出咖 p q o l 2 2 8 阶矩定义如式 2 9 所示 m 釜兰x 9 y 9 厂 工 y p g o l 2 2 9 z lv l p 和q 可取所有的非负整数值 它产生一个矩的无限集 根据帕普利斯 p a p o u l i s p 和g 可取所有的非负整数值 它产生一个矩的无限集 根据帕普利 斯 p a p o u l i s 唯一性定理 这个无限集完全可以确定二维图像函数 x 本身 其零阶矩只有一个 即 兰窆 x 对于二值图像 令其背景值为o 形状 区域内值为1 则零阶矩表示该形状区域的面积 每一个图像矩除以零阶矩得到 的商具有形状的尺度变化无关性 定义2 图像的 p 口 阶中心矩 为了保证形状特征的平移不变性 还必须计 算中心矩 即以图像的质心为原点计算图像的不变矩值 由零阶矩和一阶矩可以 算出图像的质心 x y x y 蝎o 如l 肘矗 2 1 0 则该图像矩阵的 p q 阶中心矩计算公式如式 2 1 1 所示 阳 艺 z x p y y 9 厂 x y p g o 1 2 2 1 1 j 2 l v 2j 如果对中心矩根据形状区域面积进行归 化 即将邱9 用 础 2 胆代替 则得到的不变矩可以满足尺度无关性 这里的尺度为形状区域的尺度 而不是整 个图像的尺度 定义3 图像的协不变矩 计算图像的七个面积归一化中心矩 l 2 0 h 鸬i 脶 鸬 胁不变矩即是关于这七个矩的函数 满足形状的平 移 旋转 尺度和镜像不变性 其计算如式 2 1 2 所示 庐l 2 0 0 2 妒2 2 0 一 0 2 2 4 l 九 3 0 一3 芦1 2 2 0 3 3 p 2 1 r 4 3 0 1 2 2 0 3 2 1 2 2 1 2 妒5 3 0 一3 1 2 3 0 十卢1 2 如 1 2 2 3 0 3 2 1 2 0 3 3 2 l 0 3 2 1 0 3 2 1 2 3 3 0 1 2 2 丸 2 0 一 0 2 3 0 1 2 2 3 0 3 2 1 2 4 3 0 1 2 0 3 2 1 7 3 2 1 一 0 3 3 0 十 1 2 3 0 1 2 2 3 0 3 2 1 2 3 0 一3 2 i 0 3 2 1 0 3 2 1 2 3 3 0 1 2 2 基于矩的形状描述可以保存原有形状的信息 矩 也足以重建原始函数 厂 x y 但是 胁不变矩的不变性是在连续情况下 假设图像像素数目在线性变 换过程中保持不变的条件下进行的 而在离散情况下 图像变换是不连续的 除 平移 镜像变换外 旋转和尺度变换均会导致图像像素数目的变化 从而使计算 结果产生误差 由于图像的大小会影响不变矩特征值 因此 在进行图像相似性 匹配时 应首先将图像库中的图像规范为相同尺寸大小的图像 再将其灰度化 二值化 得到二值图像后 就可以实现提取其不变矩特征的算法 考虑到矩的计算 代价较大 因此 可以预先使用算法提取出其矩不变量特征 存放于图像的形状特 征索引库中 然后提供给图像检索算法执行图像查询 除了上述的七种无关矩以外 还有许多计算形状无关矩的方法 在文献 1 7 中 y 妇g 和a l b r e g t s e n 在g r e e n 定理的基础上提出了在二值图像中快速计算矩的 方法 由于许多有效的不变量都是从反复的实验中得到的 k a p u r 等开发了一系 列算法用来系统地寻找特定的几何不变性 g r o s s 和l a t e c k i 还开发出了一种方 法 能够在图像数字化的过程中保持物体边缘的定性微分几何 另外 文献 1 9 还提到了一种代数曲线和不变量的框架 用来在混杂的场景中表示复杂物体 它 用多项式拟合来表示局部几何信息 用几何不变量进行对象的匹配和识别 2 2 3 离心率 离心率又称偏心率 伸长度 为提高图像检索的准确度 可以从 p g 阶中 心矩定义图像的离心率 e c c e n t r i c i t y 特征量 按式 2 1 3 计算 e c 丝 二鱼 缬 2 1 3 产岛o 七2 离心率特征肪表示了图像的最大轴向与图像的最小轴向的比率 在一定程度 上描述了图像区域的紧凑性 同样也满足物体平移 旋转 尺度和镜像不变性 2 3 分块检索方法 上述商标图像检索方法大多基于全局匹配 强调图像的整体特征 忽略了局 9 堡堡墼堡竺垂丝窒皇重篁耋鎏 部图像特征和局部图像问的空间关系 事实上 局部图像特征和局部特征问的空 间关系同样是图像检索中非常重要的特征 描述局部图像间的空间关系主要有两类方法 一类方法首先对图像进行自动 分割 划分出其中所含的对象或颜色区域 然后根据这些区域对图像索引 另一 类方法则简单地将图像均匀划分成若干规则子块 对每个图像子块提取特征建立 索引 2 3 1 基于图像分割的方法 这类方法中的图像空间关系特征主要包括二维符号串 空间四叉树和符号图 像 匹兹堡大学的c h a n g 提出了用二维符号串 2 d s t r i n g 的方法 其基本思 想是将图像沿x 轴和y 轴方向进行投影 然后按2 d 子串匹配进行图像空间关系 的检索 该方法比较简单 但缺点在于仅利用对象质心不足以表达对象的空间位 置关系 两且描述的空间关系太简单 实际的空问关系要复杂得多 特号图像 s y m b 0 1 i ci m a g e 方法是基于图像中全部有意义的对象已经被预先分割出来的假 设 将每个对象用质心坐标和一个符号名字代表 从而构成整幅图像的索引 这 些方法都假设所有对象都可以通过一定的特征被精确地识别出来 因而只需要关 注如何匹配对象的空间关系即可 然而 对象并非总是由某些确定的特征构成的 a l w i s f 2 0 0 23 将商标图像中的对象划分为线条 角 封闭圆 对这些对象分 别匹配 与之相似的做法是卡内基梅隆大学开发的t r a d e m a r k 系统 2 0 0 2 不过 后者采用了不同的分类 分为圆 多边形 线条 周丽华等 2 0 0 0 卢 根据信息论 中熵的概念 提出商标图像的单元信息熵 基于单元熵矢量的欧氏距离计算相似 度 避免图像整体熵对位置信息的欠缺 黄元元等 2 0 0 2 o 利用形状与空间位置 特征来检索二值商标图像 检索也是以图像中对象为单元 根据形状判断两个图 像间的对应对象 然后根据对应对象的空间位置的距离计算两者的相似度 侧重 于对商标图像内部对象的捕捉 孙兴华等 2 0 0 2 研究并提出在商标检索中局部 特征比全局特征可能起到更好的检索效果 因此对如何结合各类特征的融合准则 进行了探索研究 此外 除了少数特殊应用外 图像自动分割对大多数应用来说是相当困难的 下面我们介绍一些常用的图像分割算法 在文献 2 7 中 l y b a n o n 等用基于形态学动作进行自动图像分割 他们用各种 类型的图像来测试算法效果 包括光学天文图 红外线的海洋图和磁力图等 这 种模拟方法在处理以上科技图像有良好的效果 但处理一般图像的效果还有待进 一步证实 l i 2 8 1 等提出了基于的模糊熵的分割算法 这种方法是以这样的事实为 前提的 即熵的局部最大值对应于图像上各个区域之间的不确定性 它对于那些 直方图上没有明显起伏的图像是非常有效的 所有以上提到的算法都是自动的 其主要优点是可以从大量的图像中提取边 1 0 硕士学位论文 界而不占用用户的时间和精力 然而 如果通用领域内没有经过预处理的图像 这种自动的分割技术效果就不太好 通常 算法所划分的仅仅是区域而不是对象 如果想在图像检索中获得高层语义上的对象 实体 就需要人工的辅助 s a m a d a n i 和h a n 提出计算机辅助下的边界提取法 将用户手工输入和计算机图像边界生 成算法结合起来 d a n e e l s 等 盯提出了一种有关有效轮廓的更完善的方法 该方 法首先在用户输入的基础上 用贪婪法获得快速初始收敛 然后再动态地改进边 框轮廓 r u i 等 提出了基于色彩 纹理空问中的聚类算法 首先由用户指出图 像上感兴趣的区域 再用这个算法将该区域聚合成有意义的对象 2 3 2 基于圈像子块的方法 为了避免准确的图像自动分割的困难 同时又要提供一些有关图像区域空间 关系的基本信息 一种折衷的方法是将图像预先等分成若干子块 可能是重叠的 然后分别提取每个子块的各种特征 每个子块图像特征反映了图像的局部特征 而多个子块图像特征的有序结合反映了各局部特征间的空间关系 从而反映了图 像的全局特征 也就是说 分块检索方法综合利用全局和局部图像特征 对图像 内容进行更好的描述 可提高检索性能 在检索中 我们首先根据特征计算图像 的相应子块之间的相似度 然后通过加权计算总的相似度 常用的方法有四叉树分块方法 即将整幅图像看成暇叉树的结构 逐层将图 像分块 每一子块图像内容用某种特征来描述 下面详细介绍四叉树分块方法的 步骤和不足之处 2 3 2 1 四叉埘分块步骤 1 确定形状主方向及提取目标区域 为了使分块图像特征具有旋转不变性 可以根据形状主方向对图像进行旋转 使得旋转后的形状主方向水平向右 形状主方向取决于图像的形状特征 可以根据主轴方向与水平方向的夹角 记 为p 求得 其中图像的主轴方向就是图像目标像素区域的最适椭圆的长轴方 向 由图像的k l 变换 可知 卢是具有最大特征值的特征矢量方向 可以根据图 像的中心矩进行计算 即 棚鲫 魄一 扛i i 万 琢 弘 2 1 4 其中口p g 为图像的 p g 阶中心矩 i 歹 为图像质心 根据夹角声和三阶中心矩 p o 确定形状主方向口 计算公式为 口 伫 小o 2 1 5 口 z i hj i j o o 得到图像的形状主方向a 后 以重心 x y 为原点将图像旋转a 角度 对于旋 转后的图像提取下列4 个坐标变量 m m i n x i7 1 x y 1 x m a x x i 丁 x y 1 2 1 6 y m i n y l r x y 1 y 一 m a x y r x y 1 以坐标 工 i y n i 为左上角 坐标 z y 为右下角构成一个矩形且 x i 蜘i x y 称矩形r 为图像的目标区域 基于目标区域的形状分析 具有良好的平移不变性 因而后续对图像的形状分析均基于目标区域 图2 1 所示 为一个确定形状主方向及提取目标区域的例子 其中 图2 1a 所示为图像的形 状主方向及其垂直方向 图2 1b 所示为对旋转后的图像进行目标区域提取的例 子 矩形区域为图像的目标区域 a 形状主方向的确定b 目标区域的提取 固2 1 形状主方向的确定及目标区域的提取 2 四叉树分解及特征提取 图2 2 所示为对图像进行分块分解的示意图 即将目标区域以重心为中心 水平方向和垂直方向为轴分解为4 个一级子块b b 4 用同样的方法对每一个 子块进行分解 得到1 6 个二级子块b 5 b 2 0 经过两次分解后 总共可以得到2 0 个子块 如果再对每一个二级子块进行分解 则可以得到6 4 个三级子块 将整 个目标区域看作是第o 级子块 那么将o 3 级子块加起来总共就可以得到8 5 个 子块 从图2 2 可以看出 四叉树分解是一种由粗到细 逐级分解的分层方法 它 可以较好地描述图像所含像素点在空间上的分布情况 对全局和局部图像特征进 行了多层次描述 通过选择分解四叉树的层数 可以控制得到的子块个数以及对图 像内容描述的精度 将目标区域划分为多个子块后 就可以对每一个子块抽取相应的形状特征 得 到一个形状特征序列 称为分块图像特征 图像之间的相似性可以根据分块图像 硕士学位论文 特征进行度量 尉芰 豳i a 一次分解b 二次分解 c 分块四叉树分解 图2 2 图像分块分解示意图 2 3 2 2 不足之处 四叉树分块检索方法用四叉树分解的方法将商标图像划分为多级予块 抽取 图像全局特征和各子块的特征进行图像相似性度量 相对于只利用全局图像特征 进行检索 提高了检索性能 但是经过仔细分析和实验 我们发现该方法仍然存 在以下不足 l 依赖于旋转图像后对齐形状主方向来保证旋转不变性 而实验证明图像经 缩放 旋转后 形状主方向会产生一定偏差 就造成两幅图像对应子块位置实际 上并不一致 严重影响了检索效果 2 商标图像在作镜像变换后 应该认为和原图像相似 即用于商标图像检索 的特征必须具有镜像不变性 而该方法不具有镜像不变性 这是四叉树分块方法 的 个严重不足 存在这些不足的原因在于四叉树分块得到的各子块间没有明显的几何特征 子块序号不能反应子块间的位置关系 所以该分块检索方法无法利用各子块问的 几何位置关系 只是把各子块特征按照序号排列 商标图像检索研究与系统实现 2 4 本章小结 本章先介绍了一些目前常用的全局形状特征提取方法 如傅立叶描述符 协 不变矩和离心率等 这些特征都具有良好的平移 尺度 旋转和镜像不变性 接 着又介绍了分块检索方法 详细描述了四叉树分块检索方法的步骤 该方法首先 确定形状主方向 根据形状主方向旋转图像 以最小外接矩形作为目标区域 采 用四叉树分解的方法进行分块 分别提取各子块的形状特征 经过分析实验 指 出了该方法的不足 不具有很好的旋转不变性 不具有镜像不变性 3 1 引言 第3 章基于极坐标的分块方法 基于分块图像特征
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 傲慢与偏见情节介绍
- 储能电站施工培训课件
- 节能环保钢技术-洞察及研究
- 储粮化学药剂安全培训
- 宠物宠物宠物宠物宠物市场细分需求预测:2025年宠物消费市场产品创新动态报告
- 新能源行业2025年技术创新与市场需求增长策略分析报告
- 幼儿园蒙特梭利教育法教师聘用及教学支持合同
- 造价咨询合同补充协议范本(工程造价咨询制度)
- 金融服务产品区域经销商代理合作协议书范本
- 美食城场地租赁及餐饮品牌合作运营合同
- 2025-2026学年统编版(2024)初中道德与法治八年级上册(全册)教学设计(附目录 P133)
- 劳务外包协议书
- 2025年初级社工考试《综合能力》真题及答案
- 2025至2030中国草莓果酱行业发展研究与产业战略规划分析评估报告
- 2025纪念中国人民抗日战争胜利80周年心得体会五
- 2025义务教育劳动教育标准课程考试题库(含答案)
- 驾照科目四模拟考试题及答案大全
- 电商用户社区与运营创新创业项目商业计划书
- 土地增值税清算培训课件
- 2025年营养指导员师岗位技能及理论知识考试题库(含答案)
- 2025年青海省格尔木市辅警招聘考试试题题库及答案详解(易错题)
评论
0/150
提交评论