(计算机应用技术专业论文)小波及视觉感知纹理特征在基于内容的图像检索中的研究.pdf_第1页
(计算机应用技术专业论文)小波及视觉感知纹理特征在基于内容的图像检索中的研究.pdf_第2页
(计算机应用技术专业论文)小波及视觉感知纹理特征在基于内容的图像检索中的研究.pdf_第3页
(计算机应用技术专业论文)小波及视觉感知纹理特征在基于内容的图像检索中的研究.pdf_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小波及视觉感知纹理特征在基于内容的图像检索中的研究 小波及视觉感知纹理特征在基于内容的图像检索中的研究 摘要 近年来 随着多媒体技术和互联网的飞速发展 产生的数字图像数量正以惊 人的速度增长 这些图像在军用及民用各个领域都有着重要的作用 如何对图像 进行有效的检索 已成为国际上的研究热点 传统的基于文本的图像检索技术将图像看做数据库中的一个对象 用关键字 或自由文本对其进行描述 然而 完全基于文本的图像检索技术存在着严重的问 题 主要原因在于就目前的计算机视觉和人工智能技术而言 还无法自动对图像 进行标注 而必须依赖于人工对图像做出标注 由此导致手工工作量巨大 同时 由于手工的标注很难做到准确与完整 因此不可避免地带有主观偏差 因此 上 世纪9 0 年代初提出了针对解决上述问题的基于内容的图像检索技术 基于内容的 检索技术查询时针对的是对象而不是标识 它需要从图像中提取指定的特征 如 颜色 纹理 形状等 然后从图像库中检索相似的图像或者视频内容 由于基 于内容的图像检索能够提供比传统的基于文本的图像检索更丰富的内容 因此受 到越来越多的研究人员的关注 本文对小波及视觉感知纹理特征在基于内容的图像检索理论进行了研究 论 文首先研究了如何选取有判别力的基于小波变换的纹理图像特征 从而有效减少 图像索引的维数 其次提出了符合人类视觉的新的基于小波变换的纹理图像特 征 再次探讨了如何提取图像的局部特征 特别是重点研究了基于小波变换的明 显点的图像检索理论 并对试验结果的进行了评估 关键字 基于内容的图像检索纹理特征小波变换明显点 小波及视觉感知纹理特征在基于内容的图像检索中的研究 r e s e a c ho nc o n t e n t b a s e d im a g er e t rie v aib a s e do n w a v eie ta n dvis u al p e r c e p tio f tt e x t u r ef e a t u r e s a b s t r a c t r e c e n t l y w i t ht h ed e v e l o p m e n to fm u l t i m e d i at e c h n o l o g ya n di n t e m e t t h ev o l u m eo f d i g i t a li m a g ei sb e c o m i n gb i g g e ra n db i g g e r t h ei m a g eh a si m p o r t a n ta p p l i c a t i o ni n m i l i t a r ya n dc i v i ld o m a i n s h o wt or e t r i e v ei m a g ee f f e c t i v e l yh a sb e c a m eah o t r e s e a r c ht o p i c t r a d i t i o n a li m a g eq u e r yt e c h n o l o g yb yt e x t q b t d e p e n d so nm a n u a ll a b e l e di m a g e h o w e v e r q b th a sd i s t i n c ts h o r t c o m i n g s d i f f e r e n tp e o p l eh a sd i f f e r e n tp e r c e p t i o no n t h es a m ei m a g ec o n t e n t a n dm a n u a ll a b e l i n gl e a d st ot h a ti ti s i m p o s s i b l et ow o r k w i t ht h el a r g ea m o u n ti m a g ed a t ai nt h ei n t e r n e t i n19 9 0 s c o n t e n t b a s e di m a g e r e t r i e v a l c b i r w a sp r o p o s e d c o n t e n t b a s e di m a g er e t r i e v a lu s e st h ei m a g ei t s e l f s u c ha sc o l o r s h a p ea n dt e x t u r ef e a t u r e i n s t e a do fa n y d e s c r i p t i o no ft h ei m a g ea st h e q u e r yc o n d i t i o n t h er e t r i e v a ls y s t e me x t r a c t st h eq u e r yi m a g e sf e a t u r e s a n ds e a r c h e s i ns y s t e md a t as e t s c o m e n t b a s e di m a g er e t r i e v a lh a sb e e ne x t e n s i v e l yi n v e s t i g a t e d b ym o r ea n dm o r er e s e a r c h e r mt h ep a p e r w er e s e a c ho nc o n t e n t b a s e di m a g e r e t r i e v a lb a s e do nw a v e l e ta n dv i s u a l p e r c e p t i o nt e x t u r ef e a t u r e s f i r s t w es t u d yt h ep r o b l e mo f r e d u c i n gt h ed i m e n s i o n o ff e a t u r ev e c t o rf o rt e x t u r ei m a g er e t r i e v a lb a s e do nw a v e l e td e c o m p o s i t i o n t h e r e d u c t i o nt e c h n i q u ei su s e dt oo v e r c o m eu n n e c e s s a r yc o m p u t a t i o nb u r d e na n de v e n i n h a n c et h er e t r i e v a lp e r f o r m a n c e s e c o n d t h i sp a p e rp r o p o s e ss o m en e wt e x t u r e f e a t u r e s b a s e do nw a v e l e tt r a n s f o r m s u b b a n d sw h i c hc o i n c i d ew i t hh u m a ne y e s p e r c e p t i o n t h i r d w ea n a l y s i sl o c a lf e a t u r e sf o ri m a g er e t r i e v a l i no r d e rt oe x t r a c tt h e s a l i e n tp o i n t sm o r ee x a c t l y w ep r o p o s ea ni m p r o v e ds a l i e n tp o i n t s d e t e c t o r t h e e x p e r i m e n t a lr e s u l t sd e m o n s t r a t et h a tt h em e t h o di se f f e c t i v e k e yw o r d c o n t e n t b a s e d im a g er e t rie v a i t e x t u r ef e a t u r e s w a v ele t t r a n s f o r m s a ii e n tp c i n t s i i 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的二 研究成果 据我所知 除了文中特别加以标注和致谢的地方外 论文中不包含其 他人已经发表或撰写过的研究成果 也不包含未获得 注 垫遗直墓丝重要挂型壹疆的 奎拦亘窒2 或其他教育机构的学位或证书使用过的 材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留 使用学位论文的规定 有权保留并 向国家有关部门或机构送交论文的复印件和磁盘 允许论文被查阅和借阅 本人 授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索 可以采用 影印 缩印或扫描等复制手段保存 汇编学位论文 同时授权中国科学技术信息 研究所将本学位论文收录到 中国学位论文全文数据库 并通过网络向社会公 众提供信息服务 保密的学位论文在解密后适用本授权书 学位做储繇囊孝矽 签字日期游扣犷 聊签字硼 1 绪论 1 1 研究的背景 多媒体数据检索在上个世纪9 0 年代被提出并己成为目前国内外的一个研究 热点 1 2 4 5 7 8 9 1 0 1 1 1 2 1 3 1 4 1 5 图像检索技术是多媒体搜索引擎的一项重要 技术 就目前的研究和应用来看 基本上有两种查询方式 基于文本的查询和基 于样例的查询 q u e r yb ye x a m p l e 传统的基于文本的图像检索技术将图像看做数据库中的一个对象 用关键字 或自由文本对其进行描述 然而 完全基于文本的图像检索技术存在着严重的问 题 主要原因在于就目前的计算机视觉和人工智能技术而言 还无法自动对图像 进行标注 而必须依赖于人工对图像做出标注 基于文本的图像检索技术具有两 个缺点 不同的入对于相同的内容的解释存在差异 人工标注的大量劳动使得标 注速度不可能与数字媒体的产生速度相匹配 因此难以实现互联网上的多媒体检 索 由此导致手工工作量巨大 周时出于手工的标注很难做到准确与完整 因此 不可避免地带有主观偏差 因此 上世纪9 0 年代初提出了针对解决上述问题的基于内容的图像检索技 术 基于内容的检索技术查询时针对的是对象而不是标识 它需要从图像中提取 指定的特征 如颜色 纹理 形状等 然后从图像库中检索相似的图像或者视频 内容 这种查询技术不需要用户对检索的内容进行描述 直接把图像本身作为检 索条件提交给检索系统 系统会根据用户提交的查询样例提取特征 并与己知的数 据进行比较 然后返回给用户查询结果 由于基于内容的图像检索能够提供比传 统的基于文本的图像检索更丰富的内容及实用的功能 因此受到越来越多的研究 人员的关注 基于内容的图像检索技术由于能够根据图像的视觉内容产生查询 从而方便 了用户 因此在许多领域具有广泛的应用静景 如艺术馆和博物馆馆藏资料的管 理 地球资源卫星遥感图像的检索 建筑和工程设计图纸的查询 医学病例图像 的检索 时装设计图案以及犯罪圯录调查等等 未来在随着多媒体技术及i n t e r n e t 网络的迅速发展 基于内容的图像检索技术研究成为目前一个相当重要而又富有 挑战性的研究课题 小波及砚觉感知纹理特征确i 基十内容的图像捡索中的研究 1 2 国内外的研究状况 由于基于内容的图像检索的研究在计算机视觉 图像处理及计算机图形学领 域都占有重要的地位 近年来受到了国内外学者的广泛关注 是国内外的一个研 究热点 目前国内外对基于内容的图像检索的研究较多 比如美国的哥伦比亚大 学 麻省理工学院 i b m 公司 r u t g e r s 大学 加州大学 德国的b o n n 大学 国 内的中科院 清华大学 北京大学 浙江大学 北京邮电大学 东南大学 微软 亚洲研究院 中国海洋大学等有相关研究项目 国外在基于内容的图像检索的研究方面起步 1 2 4 5 7 8 9 1 0 i i 1 2 1 3 1 4 1 5 1 7 1 8 1 9 6 5 6 7 6 8 6 9 7 0 7 1 7 2 7 3 7 7 目前已有不少应用于实践环境的基于内容 图像检索系统 如由i b m 公司开发的最早商业化q b i c 系统 以及由哥伦比亚大学 研发的w e b s e e k 系统和v i s u a i s e e k 系统 u cb e r k e l e y 开发的c h a b o r 系统 麻省 理工学院研发的p h o t o b o o k 系统等 但现有的基于内容的图像检索系统应用的技 术普遍比研究机构的最新成果落后 尽管这些图像检索系统应用了诸如直方图 颜色矩 颜色集 纹理 性状等多种表征图像特征的方法 但是要突破对低层次 特征的分析 实现更高语义上的检索 实现难度大 然而 由于基于内容的图像 检索建立在多媒体信息的内容语义上 能够更为客观地反映媒体本质的特征 因 此该领域仍然是国外许多科研机构的研究重点 近年来 随着我国经济的高速发展 其多媒体技术和计算机网络也飞速发展 这使得我国与世界上许多国家一样 产生的数字图像容量正以惊人的速度增长 这些图像在军用及民用各个领域都有着重要的作用 由于基于内容的图像检索能 够提供比传统的基于文本的图像检索更丰富的内容及实用的功能 因此在我国越 来越受到了研究人员的重视 清华大学计算机科学与技术系结合国家8 6 3 高技术 研究发展项目 w e b 上基于内容的图象检索 的研究 于1 9 9 7 年研制了一个 i n t e r n e t 上的静态图像的基于内容检索的原型系统 该项目的研究目标是开发能 在i n t e r n e t i n t r a n e t 环境下 通过友好的人一机界面 以颜色 纹理等图象特征 或样本图象检索图象的方法和工具 中国科学院计算技术研究所也在从事基于内 容的图像检索方面的研究 并以之作为其多媒体信息检索系统的一个重要部分 中科院自动化所也提出了基于独立成份分析的彩色图像特征提取方法 尽管在这一领域有大量的论文发表 但研究内容主要局限于低层次的特征 2 即便在低层次的特征上 也存在一些问题 比如对纹理特征 目前尚未使用的一 些模型仍然不能很好地描述 因此上无法实现任意纹理图像的精确检索 此外 如何在高层语意上实现检索也将是今后的研究的重点 例如如何让系统能够自动 识别理解目标及场景 目前我国科研工作者在该领域主要从事的内容包括图象分 割 时空域联合的视频分割和索引 支持基于内容检索的视频 图象编码和解码 技术 相似性度量与快速检索算法 视频 图象数据库管理系统与查询语言等 其中在基于纹理 色度 形状的检索和特征提取方面较多 随着信息技术的飞速发展及互联网的快速普及 网络教育资源受到越来越多 的重视 在信息大爆炸的时代里 信息量大的惊人 怎么样在这样一个信息的海洋 中快速找到自己满意的信息至为重要 长期以来 一直缺乏着对图象的有效的检 索工具 在i n t e r n e t 和多媒体p c 迅猛发展的今天 对此类工具的需求变得十分 迫切 基于内容的图象检索 c o n t e n tb a s e di m a g er e t r i e v a l 正是在这个背 景之下提出来 上个世纪9 0 年代以来 基于内容的图像检索的研究和应用得到了初步的发 展 基于内容的图象检索利用图像的颜色 形状 纹理 轮廓 对象的空间关系 等基本视觉特征进行检索 这些特征都是客观独立地存在于图像中的 因此这种 图像检索方法的主要特点是利用图像本身包含的客观视觉特性 不需要人为干预 和解释 能够通过计算机自动实现对图像特征的提耿和存储等 目前 在国内外 互联网上有两类图像检索技术 一类是基于关键词的图像 搜索引擎和基于内容的图像搜索引擎 前者是通过关键词的匹配来实现图像检 索 现有的大多数图像搜索引擎 如g o g l e y a h o o 等 都采用此类技术 另一类 则是基于内容的图像检索技术 此类技术代表了图像搜索技术的前沿 基于关键词的图像搜索引擎采用的是基于关键词的图像检索技术 因此可以 看作是文本搜索引擎的延伸应用 其原理与文本搜索引擎一样 只是搜索的关键 词不同 或在分类类别上存在差异 第二种是基于内容的图像检索技术 是基 于内容检索技术 c o n t e mb a s e dr e t r i e v a l 简称c b r 的一种 又称图像内容检 索 简称q m c 技术 是指除了利用传统的数据库对图像的文字信息进行存储管理 外 还要利用图像的颜色特征 形状特征 纹理特征等对图像进行查询 这种查 询过程融传统模式的识别技术与良好的多攥体人机交互技术为一体 是多种高技 术的合成技术 图像内容检索技术的应用现状基于内容的图像检索技术是一项新兴的检索 技术 目自订它在某些搜索引擎中已经被局部的使用 y a h o o l 的i m a g e 图像就提 3 小波及视觉感知纹理特征在基于内容的图像检索中的研究 供了这一检索功能 又如美国哥伦比亚太学开发的实验性系统也提供了这一检索 功能 其中就提供了从颜色及宽度 高度等可视数据类型角度进行内容搜索的功 能 这些检索还不够完善 大多局限在分类浏览中的某些特定的类目中 在其中 涉及到了很大一部分人工智能 总体来说目前基于内容的图像检索技术存在不精 确误导图片检索 客观性较差 检索速度慢 容易产生错误的检索结果 1 3 本研究工作的内容 针对基于内容的图像检索技术 本文对小波及视觉感知纹理特征在基于内容 的图像检索理论进行了研究 首先研究了如何选取有判别力的基于小波变换的纹 理图像特征 从而有效减少图像索引的维数 其次提出了符合人类视觉的新的基 于小波变换的纹理图像特征 再次探讨了如何提取图像的局部特征 特别是重点 研究了基于小波变换的明显点的图像检索理论 最后探讨了不同的图像相似度度 量对于图像检索性能的影响 并对试验结果的进行了评估 重点研究包括 l 如何选取有判别力的纹理图像特征 从而减少图像索引的维数 d i m e n s i o n r e d u c t i o n 2 研究符合人类视觉的新的纹理图像特征 3 如何提取图像的局部特征 特别是研究基于小波变换的明显点的图像检 索的理论 论文研究的内容具体包含下面三个方面 a 如何选取有判别力的纹理图像特征 从而减少图像索引的维数 如何选取有判别力的纹理图像特征 从而减少图像索引的维数 d i m e n s i o nr e d u c t i o n 是一个胪 困难问题 也一直是模式识别中的 一个难点 论文侧重研究对基于内容的图像检索问题 探讨如何选取有判别力的 纹理图像特征 从而减少图像索引的维数 将在以往他人工作基础之上 利用简单的模型对本问题进行研究 4 b 研究符合人类视觉的新的纹理图像特征 由于纹理图像没有确切地定义 以往纹理图像特征大多基于统计的方 法对纹理进行描述 7 0 年代初期由h a r a l i c k 等人提出了纹理特征的共生矩 阵表示及t a m u r a 等人则从视觉的心理学角度提出了纹理表示方法 表示的 所有纹理性质都具有直观的视觉意义 本论文重点对基于小波分析的符合 人类视觉的新的纹理图像特征进行研究 c 如何提取图像的局部特征 特别是研究基于小波变换的明显点的图像 检索的理论 n s e b e q t i a n e l o u p i a s m s l e w a n dt s h u a n g 7 3 7 4 等人对如何提取图像的局部特征 特别是研究基于小波变换的明显点的图 像检索进行了深入而又富有成效的研究 基于前人的工作 论文将研究何 提取图像的局部特征 特别是研究基于小波变换的明显点的图像检索的理 论 及如何对图像中的明显点进行更精确的定位作深入探讨 最后 对论文进行了总结及展望 对本文所做工作作了总结 并提出 了今后进一步研究的方向 5 小波及 见觉感知纹理特征伍牲十内容的幽像愉索中的 j l 究 2 小波分析理论 小波分析是近几十年来发展起来的一种新的时频分析方法 3 6 6 7 8 小波 分析的应用是与小波分析的理论研究紧密地结合在一起的 现在 它已经在科技 信息领域取得了令人瞩目的成就 如今 信号处理已经成为当代科学技术工作的重要组成部分 对于性质随时 间稳定不变的信号 处理的理想工具仍然是傅立叶分析 然而 在实际应用中 绝大多数信号是非稳定的 小波分析正是适用于非稳定信号的处理工具 图像处理是针对性很强的技术 根据不同应用 不同要求需要采用不同的处 理方法 采用的方法是综合各学科较先进的成果而成的 如数学 物理学 心理 学 信号分析学 计算机学 和系统工程等 计算机图像处理主要采用两大类方 法 一类是空域中的处理 即在图像空间中对图像进行各种处理 另一类是把空 间与图像经过变换 如傅立叶变换 变到频率域 在频率域中进行各种处理 然 后在变回到图像的空间域 形成处理后的图像 小波变换由于具有良好的时一频 局部化性能 有效地克服了傅立叶变换在处理非平稳的复杂图像信号时所存在的 局限性 因而在图像处理领域受到了广泛的重视 基于小波变换的图像分析是近 年来国内外一个非常活跃的研究领域 并在图像处理领域占有重要的地位 本论文简要介绍了小波变换的基本理论 并介绍了一些常用的连续小波和离 散小波的性质 它们的主要性质包括紧支集长度 滤波器长度 对称性 消失矩 等 都做了简要的说明 2 1 小波分析与多辨率分析 小波分析的应用是与小波分析的理论研究紧密地结合在一起的 3 6 6 7 8 真 正使小波在应用领域得到比较大发展的是m e y e r 在1 9 8 6 年提出的一组小波 其 二进制伸缩和平移构成l 2 8 的标准化正交基 在此结果基础上 1 9 8 8 年 s m a l l a t 在构造正交小波时提出了多分辨分析的概念 从函数分析的角度给出 了正交小波的数学解释 在空间的概念上形象的浣明了小波的多分辨率特性 给 出了通用的构造正交小波的方法 并将之前所有的正交小波构造方法统一起来 并类似傅立叶分析中的快速傅立叶算法 给出了小波变换的快速算法 m a l l a t 算法 这样 在计算上变得可行以后 小波变换在各个领域才发挥它独特的优势 解决了各类问题 为人们提供了更多的关于时域分析的信息 6 多分辨分析就是要构造一组函数空间 每组空间的构成都有一个统一的形 式 而所有空间的闭包则逼近l 2 r 在每个空间中 所有的函数都构成该空间 的标准化正交基 而所有函数空间的闭包中的函数则构成r r 的标准化正交基 那么 如果对信号在这类空间上进行分解 就可以得到相互正交的时频特性 而 且由于空间数目是无限可数的 可以很方便地分析我们所关心的信号的某些特 性 下面我们简要介绍一下多分辨分析的数学理论 定义 空间r 尺 中的多分辨分析是指r r 满足如下性质的一个空间序列 眈l 1 调一致性 一c 对任意 z 2 渐进完全性 乏巧 c l o s e 眨i j 2r 尺 f e e 7 3 伸缩完全性 厂 r 巧铮f 2 t 巧 4 平移不变性 v 尼 z 0 2 叫2 f j 办 2 叫2 t k 5 r i e s z 基存在性 存在 r 使得钫 2 叫2 卜尼 i 七 z 构成巧的r i s e z 基 关于r i e s z 的具体说明如下 若 f 是 的r i s e z 基 则存在常数a b 且 使得 么i l c l l l 气矽 一尼 眶 b ic l i 1 对所有双无限可平方和序列h 即 敝矩 z l c 1 2 1 2 成立 满足上述个条件的函数空间集合成为一个多分辨分析 如果矽 生成一个多 分辨分析 那么称矽 f 为一个尺度函数 可以用数学方法证明 若矽 r 是 的r i e s z 基 那么存在一种方法可以把 f 转化为 的标准化正交基 这样 我们只要能找到构成多分辨分析的尺度函数 小波及视觉感知纹理特征在娃于内容的图像检索中的研究 就可以构造出一组正交小波 多分辨分析构造了一组函数空间 这组空f 刚是相互嵌套的 即 2c 眨2c 圪ic v ockck 三 那么相邻的两个函数空间的差就定义了一个由小波函数构成的空间 即 o 巧 并且在数学上可以证明一o 且 e j 为了说明这些性质 我们首先 来介绍一下双尺度差分方程 由于对w 巧c 巧 i 所以对v g x 巧 都有 g 巧 也就是说可以展开成 上的标准化正交基 由于 f v o 那么矽 f 就可以展开成 m 磊 1 3 这就是著名的双尺度差分方程 双尺度差分方程奠定了正交小波变换的理论基 础 从数学上可证明 对于任何尺度的办 f 它在j l 尺度正交基力 l f 上的 展开系数玩是一定的 这就为我们提供了一个很好的构造多分辨分析的方法 在频域中 双尺度差分方程的表现形式为 o 2 a o 日 缈 矽 1 4 如果多 国 在国 o 连续的话 则有 多 缈 艺日 罟 o 1 5 j l l 厶 说明多 缈 的性质完全由多 o 决定rm 引 小波分析克服了短时傅立叶变换在单分辨率上的缺陷 具有多分辨率分析的 特点 在时域和频域都有表征信号局部信息的能力 时阳j 窗和频率窗都可以根据 信号的具体形态动态调整 在一般情况下 在低频部分 信号较平稳 可以采用较 低的时间分辨率 而提高频率的分辨率 在高频情况下 频率变化不大 可以用较 低的频率分辨率来换取精确的时间定位 3 6 6 7 8 因为这些特征 小波分析可 以探测正常信号中的瞬态 并展示其频率成分 被称为数学显微镜 广泛应用于 各个时频分析领域 8 2 2 从傅立叶变换到小波变换 从信号分析的典型应用可以看出 时频分析应用非常广泛 涵盖了物理学 工程技术 生物科学 经济学等众多领域 而且在很多情况下只是分析其时域或 频域的性质是不够的 这就需要引入新的时频分析方法 小波分析正是由于这类 需求发展起来的 在传统的傅立叶分析中 信号完全是在频域展开的 不包含任何时频的信息 这对于某些应用来说是很恰当的 因为信号的频率的信息对其是非常重要的 但 其丢弃的时域信息可能对某些应用同样非常重要 所以人们对傅立叶分析进行了 推广 提出了很多能表征时域和频域信息的信号分析方法 如短时傅立叶变换 g a b o r 变换 时频分析 小波变换等 其中短时傅立叶变换是在傅立叶分析基础 上引入时域信息的最初尝试 其基本假定在于在一定的时间窗内信号是平稳的 那么通过分割时间窗 在每个时间窗内把信号展开到频域就可以获得局部的频域 信息 但是它的时域区分度只能依赖于大小不变的时间窗 对某些瞬态信号来说 还是粒度太大 换言之 短时傅立叶分析只能在一个分辨率上进行 所以对很多 应用来说不够精确 存在很大的缺陷 3 6 6 7 8 而小波分析则克服了短时傅立叶变换在单分辨率上的缺陷 具有多分辨率分 析的特点 在时域和频域都有表征信号局部信息的能力 时间窗和频率窗都可以 根据信号的具体形态动态调整 在一般情况下 在低频部分 信号较平稳 可以采 用较低的时间分辨率 而提高频率的分辨率 在高频情况下 频率变化不大 可以 用较低的频率分辨率来换取精确的时间定位 因为这些特性 小波分析可以探测 正常信号中的瞬态 并展示其频率成分 被称为数学显微镜 广泛应用于各个时 频分析领域 小波分析属于时频分析的一种 传统的信号分析是建立在傅立叶变换的基础 上的 由于傅立叶分析使用的是一种全局的变换 要么完全在时域 要么完全在 频域 因此无法表述信号的时频局域性质 而这种性质恰恰是非平稳信号最根本 和最关键的性质 为了分析和处理非平稳信号 人们对傅立叶分析进行了推广乃 至根本性的革命 提出并发展了一系列新的信号分析理论 短时傅立叶变换 g a b o r 变换 时频分析 小波变换 分数阶傅立叶变换 线调频小波变换 循环 统计量理论和调幅一调频信号分析等 其中 短时傅立叶变换和小波变换也是应 传统的傅立叶变换不能够满足信号处理的要求而产生的 短时傅立叶变换分析的 基本思想是 假定非平稳信号在分析窗函数g t 的一个短时间间隔内是平稳 伪 平稳 的 并移动分析窗函数 使f t g t f 在不同的有限时间宽度内是平稳信 9 小波及视觉感知纹理特征在摧十内容的图像检索中的研究 号 从而计算出各个不同时刻的功率谱 但从本质上讲 短时傅立叶变换是一种 单一分辨率的信号分析方法 因为它使用一个固定的短时窗函数 因而短时傅立 叶变换在信号分析上还是存在着不可逾越的缺陷 小波变换是一种信号的时间一尺度分析方法 它具有多分辨率分析的特点 而且在时频两域都具有良好表征信号局部特征的能力 是一种窗口大小固定不变 但其形状可改变 时间窗和频率窗都可以改变的时频局部化分析方法 即在低频 部分上具有较高的频率分辨率 在高频部分上具有较高的时间分辨率和较低的频 率分辨率 很适合于探测正常信号中夹带的瞬态反常现象并展示其成分 所以被 誉为分析信号的显微镜 利用连续小波变换进行动态系统故障检测与诊断具有良 好的效果 2 2 1 傅里叶变换 在信号处理中重要方法之一是傅立叶变换 它架起了时间域和频率域之间的 桥梁 对很多信号来说 傅立叶分析非常有用 因为它能给出信号里包含的各种频 率成分 但是 傅立叶变换有着严重的缺点 变换之后使信号失去了时间信息 它不能告诉人们在某段时间里发生了什么变化 而很多信号都包含有人们感兴趣 的非稳态 或者瞬变 特性 如漂移 趋势项 突然变化以及信号的开始或结束 这些特性是信号的最重要部分 因此傅里叶变换不适于分析处理这类信号 虽然傅立叶变换能够将信号的时域特征和频域特征联系起来 能分别从信号 的时域和频域观察 但却不能把二者有机地结合起来 这是因为信号的时域波形 中不包含任何频域信息 而其傅立叶谱是信号的统计特性 从其表达式中也可以 看出 它是整个时间域内的积分 没有局部化分析信号的功能 完全不具备时域 信息 也就是说 对于傅立叶谱中的某一频率 不知道这个频率是在什么时候产 生的 这样在信号分析中就面临一对最基本的矛盾 时域和频域的局部化矛盾 在实际的信号处理过程中 尤其是对非平稳信号的处理中 信号在任一时刻 附近的频域特征都很重要 如柴油机缸盖表面的震动信号就是由撞击或冲击产生 的 是一瞬变信号 仅从时域或频域上来分析是不够的 这就促使去寻找一种新 方法 能够将时域和频域结合起来描述观察信号的时频联合特征 构成信号的时 频谱 这就是所谓的时频分析法 也称为时频局部化方法 3 6 6 7 8 l o 2 2 2 短时傅里叶变换 由于标准傅立叶变换只在频域里有局部分析的能力 而在时域里不存在这种 能力 d e n n i sg a b o r 于1 9 4 6 年引入了短时傅立叶变换 短时傅立叶变换的基本 思想是 把信号划分成许多小的时间间隔 用傅立叶变换分析每一个时间间隔 以便确定该时间间隔存在的频率 其表达式为 s 0 9 f 陟 f 涫 石一r e 圳d t 2 1 其中木表示复共轭 f t 是进入分析的信号 在这个变换中 g 起着频限 的作用 g t 起着时限的作用 随着时间f 的变化 g t 所确定的 时间窗 在 t 轴上移动 是f t 逐渐 进行分析 因此 g t 往往被称之为窗口函数 s 0 9 f 大致反映了f t 在时刻r 时 频率为c o 的 信号成分 的相对含量 这样信号在 窗函数上的展开就可以表示为在p 一万 f 卅 0 9 一g 0 9 6 这一区域内的状态 并把这一区域称为窗口 万和s 分别称为窗口的时宽和频宽 表示了时频分析中 的分辨率 窗宽越小则分辨率就越高 很显然 希望万和s 都非常小 以便有更 好的时频分析效果 但万和g 是互相制约的 两者不可能同时都任意小 事实上 据 士 且仅当g r 2 荔 e 辛为高斯函数时 等号成立 由此可见 短时傅立叶变换虽然在一定程度上克服了标准傅立叶不具有局部 分析能力的缺陷 但它也存在着自身不可克服的缺陷 即当窗函数g t 确定后 矩形窗口的形状就确定了 f 功只能改变窗口在相平面上的位置 而不能改变 窗口的形状 可以说短时傅立叶变换实质上是具有单一分辨率的分析 若要改变 分辨率 则必须重新选择窗函数g t 因此 短时傅立叶变换用来分析平稳信 号犹可 但对非平稳信号 在信号波形变化剧烈的时刻 主频是高频 要求有较 高的时间分辨率 即万要小 而波形变化比较平缓的时刻 主频是低频 则要求 有较高的频率分辨率 即s 要小 而短时傅立叶变换不能兼顾两者 2 2 3 小波变换 小波变换提出了变化的时间窗 当需要精确的低频信息时 采用长的时间窗 1 1 小波及视觉感知纹理特征在甚卡内容的图像检索中的研究 当需要精确的高频信息时 采用短的时间窗 小波变换用的不是时间一频率域 而是时间一尺度域 尺度越大 采用越大的时间窗 二尺度越小 采用越短的时间 窗 即尺度与频率成反比 2 3 连续小波变换 定义 设少 f r r 其傅立叶变换为汐 万 当多 国 满足允许条件 完全 重构条件或恒等分辨条件 g 解如 o 2 2 时 我们称y f 为一个基本小波或母小波 将母函数y 经伸缩和平移后得 眦 2 南叭t 口b a b r a o 2 3 称其为一个小波序列 其中a 为伸缩因子 b 为平移因子 对于任意的函数 f t r 只 的连续小波变换为 帅6 似产 坨p 等冲 2 4 其重构公式 逆变换 为 川 瓦1m 叫1w 八 m 等胁如 2 5 由于基小波 生成的小波 f 在小波变换中对被分析的信号起着观测窗的 作用 所以 还应该满足一般函数的约束条件 f l 沈 2 6 故i c o 是一个连续函数 这意味着 为了满足完全重构条件式 6 c o 在原点必 须等于0 即 汐 o 广g t d t o 2 7 为了使信号重构的实现在数值上是稳定的 处理完全重构条件外 还要求小波 沙 的傅立叶变化满足下面的稳定性条件 1 2 彳 艺胁一 国 1 2 b 2 8 式中0 a 4 自相似性 对应不同尺度参数a 和不同平移参数b 的连续小波变换之间 是自相似的 5 冗余性 连续小波变换中存在信息表述的冗余度 小波变换的冗余性事实上也是自相似性的直接反映 它主要表现在以下两个 方面 1 由连续小波变换恢复原信号的重构分式不是唯一的 也就是说 信号f t 的小波变换与小波重构不存在一一对应关系 丽傅立叶变换与傅立叶反变换是一 一对应的 1 3 小波及视觉感知纹理特征在基十内容的图像检索中的研究 2 小波变换的核函数即小波函数 f 存在许多可能的选择 例如 它们可 以是非正交小波 正交小波 双正交小波 甚至允许是彼此线性相关的 小波变换在不同的 a b 之间的相关性增加了分析和解释小波变换结果的困 难 因此 小波变换的冗余度应尽可能减小 它是小波分析中的主要问题之一 2 4 离散小波变换 在实际运用中 尤其是在计算机上实现时 连续小波必须加以离散化 3 6 6 7 8 因此 有必要讨论连续小波儿 6 和连续小波变换 口 6 的离散化 需要强调指出的是 这一离散化都是针对连续的尺度参数a 和连续平移参数b 的 而不是针对时 白j 变量t 的 这一点与我们以前习惯的时间离散化不同 在连续小 波中 考虑函数 虬脚 想妒 丝 这罩b r a r 且a 0 为方便起见 在离散化中 总限制a 只取正 值 这样相容性条件就变为 q j c o 肾 2 t s 通常 把连续小波变换中尺度参数a 和平移参数b 的离散公式分别取作 口 口 b 勉 6 0 这里 z 扩展步长a o 1 是固定值 为方便起见 总是假定 a o l 由于m 可取正也可取负 所以这个假定无关紧要 所以对应的离散小波 函数y 卅 即可写作 啊 y 学 嘶肌帅 一地 而离散化小波变换系数则可表示为 c j j 加以 t d t 1 0 门万饩 7 0 l k 1 儡 谚 卜 k 和s 是 l8 伸缩和旋转方向变换的次数 尺度因子口一m 保证能量独立于伸缩变换次数m 假定图像用函数 伍 来表示 它的二维g a b o r 小波变换定义为 w 册疗 jl x y g m 厅 x x l y y 1 a x l a y l 其中 i c 表示复数的共轭 一系列的不同尺度 不同方向的g a b o r 滤波器可以有效 地提取纹理图像的不同频率和不同方向的信息 w 刀 工 y 的统计信息 例如 均值 和标准差 可以构成特征向量f q z s x 对纹理 图像进行有效的索引及表示 3 2 2 本章提出的方法 3 2 2 1 相似性度量 在计算机视觉中 厶 和h e l l i n g e r 距离被常常用作图像间的相似性 度量 在本论文中 我们利用加权的厶 l 和h e l l i n g e r 距离作为图像之间 的相似性度量 因为加权后的 和h e l l i n g e r 距离更适合应用于图像检 索 假设两幅图像j 和 设f 和 表示相应的特征向量 加权的厶 和 h e lli n g e r 距离可以相应的表示为 d l l i l 厂 一f j l f y l d l 2 l f 厂f 一 1 2 厂 2 j a l l f j 历一 f f 了1 2 1 厂 3 2 2 2 特征选择函数 f i s h e r 判别函数被常应用于模式识别中来进行有效特征的选择 其基本的 思想是 选择两类之间那些均值差别大 方差差别小的特征 f i s h e r 判别函数 可以表示为 1 9 小波及视觉感知纹理特征在基于内容的图像检索中的研究 g 唑札2 刀 其中 擅和 止是两类功 和缈 相应的第 个特征旷的均值 万店和盯业是两 类彩 和彩 相应的第贸个特征 的方差 g 的值越大 表明两类 和缈 的 第 个特征 6 可分性越好 针对加权的l 和h e l l i n g e r 距离 我们定义相应的f i s h e r 判别函数 如下 印2 裂 斧 糕2 2 o k uj k 啦譬 我们将以上三个判别函数相应的叫做l 和h e l l i n g e r 距离特征判别函数 3 2 2 3小波子带选择算法 如何选取有判别力的纹理图像特征 从而减少图像索引的维数 d i m e n s i o n r e d u c t i o n 是一个肛w 困难问题 也一直是模式识别中的一个难点 论文侧重 研究对基于内容的图像检索问题 探讨如何选取有判别力的纹理图像特征 从而 减少图像索引的维数 将在以往他人工作基础之上 利用简单的模型对本问题进 行研究 图像特征的提取与表达是基于内容的图像检索技术的基础和关键环节 一 方面必须选择 提取足够多的能够充分表达图像的特征 另一方面 如何去除对 图像检索效果产生干扰的或冗余的无关的信息 也是必须考虑的闷题 而后者不 仅能够降低特征向量的维数 减少检索的时间复杂度 而且有助于提高图像检索 的成功率 本小节利用上小节提出的特征判别函数来进行有效的特征选择 特征选择的 2 0 目的在于选择有效的特征 以降低特征向量的维数 根据小波理论和图像检索理 论 选择有效的特征就是选择有效的小波子带 然而 选择最优的小波子带集是 一个n p 困难问题 n p h a r d 7 本文针对图像检索的特点 讨论如何选择有 效的小波子带 从而降低特征向量的维数的问题 针对图像检索而言 我们可以 简单得把图像数据库中的图像分成两类 一类是与检索样图具有相似特征的图 像 即我们希望要检索到的图像 剩余的另一类是与检索样图不相似的图像 即 图像特征差别大的 不希望要检索到的图像 因此 算法的基本的思想是 通过 计算检索样图与图像数据库中每个小波子带的特征判别函数值 并对每个小波子 带的特征判别函数值的均值由大到小进行排列 选择前几个特征判别函数值大的 小波子带作为有效子带 下面利用上小节提出的特征判别函数来进行有效的特征选择 假设图像经小 波分解后得到力个小波子带 目的是选择其中的1 1 1 7 个作为有效的小波子 带 从而降低特征维数 减少计算时间 提高检索的准确率 本文提出的小波子带选择算法包括如下几步 1 假设图像数据库包含历幅纹理图像 针对每幅图像进行 层小波分解 得 到刀个小波子带 1 7 3 1 4 2 计算检索样图和每个图像数据库图像之间的第j 个小波子带的判别函数 g 矗 g 孬 g 翻 其中 萨l 恁 g 嚣为特征判别函数 3 计算图像数据库所有的第j 个小波子带的判别函数的均值 扣 篓 扔 d 2 砌 同样的 可以计算得到所有 个小波子带判别函数的均值 矗 办 轰 4 把上步计算得到所有刀个小波子带判别函数的均值 矗 磅 岛 按降序排列 选择其中的较大的前 驯个作为有效的小波子带 经过采用选择后的小波子带由 7 个减少为 个 特征向量由砌维降低为甜 维 经选择后的 个小波子带可作为有效的小波子带来提取图像特征进行图像检 2 1 小波及视觉感知纹理特征在壮于内容的图像检索中的研究 索 3 2 2 4 实验结果 为了验证本章提出的算法有效性 实验采用了国际比较通用的v i s t e x 纹理 图像库进行图像检索实验 c o p y r i g h t1 9 9 5b yt h em a s s a c h u s e t t si n s t i t u t eo f t e c h n o l o g y 一些v is t e x 纹理库样本见图2 首先对每幅纹理图像进行4 一层 小波分解 4 5 共得到1 3 个小波子带 利用小波子带选择算法选取1 0 小波子 带作为有效子带 选择后的图像特征向量由原来的2 6 维减少到2 0 维 针对 g a b o r 小波变换 对每幅纹理图像进行4 个尺度 6 个方向的小波分解 8 9 共得到2 4 个小波子带 利用小波子带选择算法选取1 2 小波子带作为有效子带 选择后的图像特征向量由原来的4 8 维减少到2 4 维 文献 4 5 8 9 即利用所有的小波子带作为有效的特征子带进行图像检 索 进行了对比实验 厶 三 和h e l l i n g e r 距离被用作图像间的相似性度量 图4 图5 为图像检索的两个实验结果 实验结果的平均查准率一查全率图 p r e c i s i o n r e c a l lg r a p h 如图3 所示 从图3 中可以看出 实验结果表明 本文提出的方法能够有效去除冗余的或无关的小波子带 选择有判别力的小波子 带 不仅能够降低特征向量的维数 而且有助于提高图像检索的平均查准率一查 全率 取得了比较理想的检索实验效果 2 2 09 08 口7 口6 05 0 4 0 3 m 圆鲻 鬻 图2 v is t e x 纹理库样本 0010203d40506 0708 口9 r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论