




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆邮电大学硕士论文摘要 摘要 随着互联网上多媒体数据的日益增多,人们面对的信息量是以“海量”来形 容的。如何从网上众多信息中检索出自己的所需,是信息检索的一个难点。传统 的基于文本的检索由于其自身的限制以及多媒体数据的特殊性,已显得很不适用, 基于内容的检索在这种情况下应运而生,并迅速成为检索技术的研究热点。目前 对于基于内容的图像、视频检索的研究较多,基于内容的音频的检索则相对滞后。 同时,随着小波分析技术的蓬勃发展,小波在信号分析方面的优势也曰渐展露。 基于此,本文在认真总结前人研究成果的基础上,将小波分析技术应用到基于内 容的音频检索中,着重分析了音频特征提取、音频分割与音频聚类三个方面的问 题。 本文的工作和研究成果主要包括以下几个方面:( 1 ) 研究了小波分析在音频 方面的应用,提取了三个小波域的音频特征近似平均幅度、近似静音比和近 似过零率,分析了不同音频在这几个特征上的区别,并研究了此特征在音频分割 与聚类中的性能;( 2 ) 针对传统音频分割方法的弊端,提出了一种“帧持续”的 改进方法。实验证明,该方法降低了音频分割的敏感性,分割精度有了明显提高; ( 3 ) 深入研究了k 均值分类算法,并结合决策树思想提出了一种k 均值决策树分 类方法,利用该方法将k 均值多类分类法构造为多次二分类法,避免了k 均值算 法对初始聚类数的依赖。通过实验,分析了该方法的性能。 关键词:基于内容的音频检索,小波分析,音频分割,音频聚类,k 均值 重庆邮电大学硕士论文摘要 a b s t r a c t w i t ht h ei n c r e m e n t so fm u l t i m e d i ad a t ao nt h ei n t e r n e t t h ei n f o r m a t i o nq u a n t i t y w h i c hw eh a v et of a c es h o u l db ed e s c r i b e da sj i l l i o n h o wt og e tw h a tw en e e df r o mt h e l a r g en u m b e ro fi n f o r m a t i o no nt h ei n t e r a c ti s b e c a m ead i f f i c u l t yo fi n f o r m a t i o n r e t r i e v a l b e c a u s eo fi t so w nl i m i ta n dt h es p e c i a lf e a t u r eo fm u l t i m e d i ad a t a , t e x t b a s e d r e t r i e v a li sn o ta p p l i c a b l ea n ym o r e i nt h a tc a s e ,c o n t e n d b a s e dr e t r i e v a l ( c b r ) c a m e f o r t ha n db e c a m eah o t s p o t c o m p a r i n gw i t hi m a g ea n dv i d e or e t r i e v a l ,a u d i or e t r i e v a l s t u d yi sb e h i n d h a n d w i t ht h ed e v e l o p m e n to fw a v e l e tt e c h n o l o g y , t h ea d v a n t a g eo fw a v e l e ti ns i g n a l a n a l y s i si sb e c o m em o r ea n dm o r eo b v i o u s i n c o r p o r a t i n gt h ep a s tf r u i t s ,a n a l y z et h e f e a t u r ee x t r a c t i o n , a u d i os e g m e n t a t i o na n dc l a s s i f i c a t i o ni ne m p h a s i z e n l er e s e a r c hw o r ka n dr e s u l t so f t l l i sd i s s e r t a t i o nc a nb ec o n c l u d e da sf o l l o w s : ( 1 ) r e s e a r c ht h ea p p l i c a t i o no fw a v e l e ta n a l y s i st e c h n o l o g yi ns i g n a la n a l y s i s , e x t r a c tt h r e ea u d i of e a t u r e si nw a v e l e td o m a i n - - m a a , m s ra n da z c r ,a n a l y z et h e d i f f e r e n c eb e t w e e nd i f f e r e n ta u d i o so nt h e s ef e a t u r e s ,a n ds t u d yt h e i rp e r f o r m a n c e si n a u d i os e g m e n t a t i o na n dc l a s s i f i c a t i o n ( 2 p r e s e n tam e t h o dc a l l e d “f r a m ec o n t i n u a n c e a i ma ti m p r o v i n gt h ea b u s eo f t r a d i t i o n a lm e t h o d h lt h ee x p e r i m e n t ,t h et e c h n i q u er e d u c et h es e g m e n ts e n s i t i v i t ya n d i n c r e a s et h es e g m e n tp r e c i s i o n ( 3 ) s t u d yt h ek - m e a n sa l g o r i t h mi n d e p t h ,a n dp r e s e mk - m e a n sd e c i s i o nm e t h o d m a k et h ek - m e a n sa l g o r i t h mm u l t i - c l a s s i f i c a t i o nt od o u b l ec l a s s i f i c a t i o n ,a v o i dt h e a f f e c t i o no fo r i g i n a lc e n t r o i dt oc l a s s i f i c a t i o np r e c i s i o na n da n a l y z ei t sp e r f o r m a n c e t h r o u g he x p e r i m e n t k e yw o r d s :c o n t e n t - b a s e da u d i or e t r i e v a l ,w a v e l e ta n a l y s i s ,a u d i os e g m e n t a t i o n ,a u d i o c l a s s i f i c a t i o n , k - m e a n s i l 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得重废邮电盔堂或其他教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均己在论文中作了明确的说明并表示谢意。 学位论文作者签名:夺缡 签字日期:痢年f 月影同 学位论文版权使用授权书 本学位论文作者完全了解重庆邮皇盍堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权重庆监电盍堂 可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论 文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:枣缡 导师签名:郑链明 签字日期:硼年,月f 日签字日期:初刁年g 月分日 重庆邮电大学硕士论文第一章绪论 1 1 研究背景 第一章绪论 随着计算机处理速度和存储容量的增加以及计算机网络的飞速发展, 多媒体数据越来越多地出现在计算机和互联网上,多媒体信息的无序使得 用户在其搜索和管理上都非常不方便。快速便捷地进行多媒体信息的检 索、查询和浏览,成为人们的迫切愿望。 传统的信息检索( i n f o r m a t i o nr e t r i e v a l ,i r ) 技术主要是基于文本的, 目前已经发展的非常成熟,例如我们已经非常熟悉的诸如g o o g l e 、y a h o o 和b a i d u 等搜索引擎采用的就是这种技术。基于文本的i r 是利用一组关键 字组成的查询来搜索需要的文本文档,即定位文档中的查询关键字来发现 匹配的文档。如果一个文档包含较多的查询项,就认为该文档比其他包含 较少查询项的文档更“相关”。最后,将文档按照“相关”度排序并显示 给用户作为检索结果。 虽然最初对多媒体信息的检索也采用了文本检索技术,但却是通过人 工方式生成多媒体文档的文本标注,如文件名、歌曲的演唱者等,然后采 用文本检索技术实现对多媒体信息的检索。基于文本的多媒体信息检索方 式有其固有的无法克服的缺陷。首先,多媒体信息的数量庞大并不断增长, 人工标注的方法不仅成本高,而且根本无法完成对如此大规模多媒体数据 的标注;其次,多媒体信息的一些重要特征,如图像的纹理、音乐的旋律、 音调、音色等,很难或者根本无法用文本表达清楚;最后,文本i r 技术 很难实现基于内容的多媒体信息检索,如检索和指定的音频数据相同的信 息,检索包含用户哼唱歌曲的片段等。因此,研究灵活、有效的多媒体检 索方法,最大程度地实现多媒体信息的再利用,是一项紧迫而又重要的研 究工作。为了能够快捷、准确、方便地在多媒体数据中查找到有用的信息, 就需要基于内容的多媒体检索技术。 所谓基于内容的检索,就是从多媒体数据中提取出特定的信息线索, 然后根据这些线索从大量存储在数据库中的多媒体数据进行查找,检索出 具有相似特征的多媒体数据出来。基于内容的检索技术是一个交叉的研究 领域,例如与此相关的领域包括:音频数字信号处理、语音识别、信息检 索、全文检索、音频数据库、数据库系统、认知科学、模式识另j j 、专家系 重庆邮电大学硕士论文第一章绪论 统、知识处理、人工智能、知识发现、数据挖掘等。基于内容的检索并不 是照搬这些技术,而是应用在信息系统以及i n t e r n e t 这样的大规模多媒体 数据库环境下,提出新的方法和理论,形成独立的具有实际应用范围的一 门研究领域。 声音媒体是除视觉媒体外最重要的媒体,基于内容的音频检索是指通 过音频特征分析,对不同音频数据赋以不同的语义,使具有相同语义的音 频在听觉上保持相似。基于内容的音频检索是一个较新的研究方向,由于 原始音频数据除了含有采样频率、量化精度、编码方法等有限的注册信息 外,本身仅仅是一种非语义符号表示和非结构化的二进制流,缺乏内容语 义的描述和结构化的组织,因而音频检索受到极大的限制。 基于内容的音频信息检索技术( c o n t e n t b a s e da u d i oi n f o r m a t i o n r e t r i e v a l ,c b a i r ) 研究如何利用音频的幅度、频谱等物理特征,响度、 音高、音色等听觉特征和词字、旋律等语义特征实现基于内容的音频信息 检索。近年来,它已成为国内外研究的热点之一。 与文本信息检索相比,基于内容的检索要复杂的多。在音频检索中, 需要经过特征提取、音频分割、音频识别分类和检索这几个步骤,如图1 1 所示。 图i 1 基与听觉内容的音频检索 音频是连续的时间序列信号,犹如不可能对几十分钟或几个小时视频 一起处理一样,也不可能对持续时间很长的音频处理,所以首先需要对连 续的音频信号进行分割。将连续音频信号分割成长短不一的音频单元后, 再对每个音频单元进行识别,将它们归属为不同的音频类别,如语音、音 乐和环境背景音等。 综上所述,在目前的多媒体信息处理中,音频信息处理占有很重要的 地位,但由于媒体源本身的特点和现有技术的制约,使得对音频信息的进 一步分析利用受到了限制,而音频分类与分割技术可以很好解决这一问 题,为音频结构化和音频信息深度分析和利用提供了孥实的基础。 2 重庆邮电大学硕士论文第一章绪论 1 2 音频特征及分割分类技术研究现状 对音频进行处理之前,通常要进行预处理,将音频流切分成时间长度 较短的单元,音频分割是在此基础上从音频流中提取不同的音频类别,也 就是说在时间轴上对音频流按类别切分,形成单一类别的小段音频。所谓 的音频分类就是指对这些小段音频进行识别的过程。从本质上讲音频分类 是一个模式识别过程,包括特征抽取和分类两个基本过程。目前,该领域 的研究重点主要在三个方面:1 ) 音频特征分析与提取;2 ) 音频分割方法;3 ) 分类器的设计与实现。 1 2 1 音频特征分析与抽取 音频特征分析与提取是音频分类的基础,所选取的特征应该能够充分 表示音频频域和时域的重要分类特性,对环境的改变具有鲁棒性和一般 性。 m u s c l ef i s h 1 1 是一个商业化的基于音频感知特征的音频检索引擎。 m u s c l ef i s h 分析音频数据的听觉特征包括基音、振幅、声音亮度、带宽和 倒频谱,可以对语音、音乐和其他音频数据分类,并对语音和音乐做深入 的分析。 j o n a t h a n f o o t e i z 】开发了一种基于量化树的方法,它提取音频数据的倒 频谱特征m f c c ,并借鉴了语音分析中的方法,利用音频数据的频谱表示 并构造一个量化树,最后的特征是一种量化柄的直方图。 c a r n e g i em e l l o n 大学的t s u h a nc h e n 和p o l y t e c h n i c 大学的z h ul i u 、 y a ow a n g 3 1 等人对音频分类与分割研究中通常选取的音频特征进行了详尽 的分析,基本概括了音频特征分析领域早期研究成果,包括:短时过零率, 音调( p i t c h ) ,带宽,短时频谱,频谱质心,m e l 变换对数倒谱系数等。 微软亚洲研究院的h a oj i a n g 、l i el u 4 1 等人为了提高环境声音的识别 精度,提出了噪音率和带周期等新的音频特征,取得了不错的效果。 随着音频分类与分割技术研究的发展,音频分类更加细化,如何提取 能够准确标征和新的音频类别的特征是特征分析研究的重点。 1 2 2 分割方法 音频分类与分割研究中,大部分的工作主要集中在特征分析和分类算 法两个方面,对于分割方法的研究很少。 重庆邮电大学硕士论文 第章绪论 传统的音频分割方法通常是采用简单的滑动窗口方法h , 2 】,即用固定长 度的滑窗对音频流进行分割,在滑窗内部按“投票规则”将音频流平滑为 一个类别,然后将具有相同音频类别的滑窗合并得到最终的分割结果。这 种方法忽略了滑窗外部的音频流对分割的影响,是一种静态分割方法;而 平滑过程本身就是带有一定误差的简单处理;同时,滑窗大小对于分割精 度有很大的影响,因此滑窗大小的确定是该方法的一个难点。 微软亚洲研究院的l i el u 和h o n g j i a n gz h a n g ( 5 , 6 , 7 1 等人在他们的研究 中根据音频流的特性,提出了一些平滑规则,并利用这些规则对音频流进 行平滑,然后合并类别相同的音频段。该方法本质上是对误分类的修正, 分割操作只是基于简单的同类合并规则,容易导致误分割,同时也是一种 静态分割方法。 1 2 3 分类器的设计与实现 目前,音频分类器的实现主要基于以下几类方法: 基于规则的音频分类方法: 该方法的基本思路是:选取可以识别某种音频类别的合适的特征,然 后设定该特征的一个阈值,根据事先约定的规则,用实际计算的特征值与 闽值比较,来识别音频类别。这种方法操作简单,但也由于其简单,所只 适用于识别特征简单音频类别,比如静音。这种方法存在以下缺点: 1 ) 决策规则和分类顺序并不一定是最优的: 2 ) 上层的决策错误会积累到下一层面形成“雪球”效应; 3 ) 分类误差大,需要人的先验知识和实验分析,特别是阈值的确定。 所以基于规则的分类方法分类精度较低,只适应于区别性明显的简单 的音频类别分类工作,难于满足复杂的、多特征的音频分类应用。但由于 这种分类器简单、容易实现,在大部分传统音频分类工作中,基于规则的 分类器应用广泛【i ,2 ,8 1 ,j t ,f o o t e 2 1 采用的一种有监督的贪心算法构造分类 决策树就是其中的代表;国防科大多媒体实验室的李家顺 9 1 等人开发的音 频分类系统,也是建立在基于规则的分类器基础之上的。 基于统计学习算法的音频分类方法: 早期的基于统计学习算法的音频分类研究主要集中在神经网络算法 的应用上,其代表是f e i t e n b ,f r a n d r 等人的研究工作【1 0 l ,他们训练一 种神经元网络直接将声音类别映射到所标注的文本。z h ul i u 3 1 根据音频特 征为每类音频训练简单的多层感知机,并且根据o n e c l a s s o n e n e t w o r k 4 重庆邮电大学硕士论文第一章绪论 的结构实现它们的连接,进行天气预报、新闻、广告等电视节目的视频场 景的分类。 近两年随着人工智能,机器学习领域的快速发展,为开展具有自主学 习能力和自动音频分类研究工作提供了很好的基础,越来越多的研究者将 隐马尔可夫模型,k 阶最近邻算法,高斯混合模型等统计学习算法应用到 了音频分类研究中。 e w o l d ,t b l u m 【l j 等人采用最近邻( n n ) 算法构造分类器:文献 3 】 提出了一种基于神经网络的分类器用于电视节目的分类;文献【1 1 】中使用 了不同算法构造分类器,包括g m m 和k n n 算法;微软研究院的l i el u 等人提出了一种鲁棒的音频分类方法,在该方法中采用了基于n 模型的音 频分类方法【5 】;南京大学软件学院的卢坚博士等人提出了一种基于隐马尔 可夫模型的音频分类方法【1 2 】,用于语音、音乐以及它们的混合声音类型的 分类。 最小距离音频分类方法: 该分类器利用模板匹配的思想,为每一个音频类型建立一个模板,然 后计算实际音频帧的特征向量,用特征向量匹配模板向量( 通常是计算它 们在向量空间中的距离) ,来识别音频类型。在澳大利亚人工智能研究院 的e l i a sp a m p a l k 等人开发的基于s o m ( s e l f - o r g a n i z i n gm a p s ) 的音乐聚 类系统【1 3 】中就采用了模板匹配的类型方法,通过计算模板向量和特征向量 的欧拉距离来进行匹配;国防科大多媒体实验室的李恒峰、李国辉等人开 发的基于内容的音频分类与检索系统a r s 采用基于模板的音频检索算法。 同时,这种方法在说话人识别研究中也被广泛使用。 1 3 音频特征及分割分类技术的发展趋势 1 3 1 音频特征分析和提取方法的研究 音频种类繁多,且内容富于变化,这客观上加大了特征分析和提取的 难度。目前,音频特征提取根多的是依赖直觉和多次实验的尝试,缺乏理 论上的客观分析。文献【8 】对音频分类特征的提取做了初步的尝试,其中借 鉴了f i s h e r 分类的思想,采用类内和类问离散度矩阵来衡量特征空间的有 效性,根据两者的关系来消除那些具有强关联性的冗余特征,从而降低特 征空间的维度。如何发现区别性显著的音频特征,并采用一定的方法合理 降低音频特征空间的维度是未来研究工作的个重点。 重庆邮电大学硕士论文第一章绪论 1 3 2 特定音频类别的识别 实际的音频流中包含着比较复杂的多的音频类别。更微观的声音类型 的判别能够更好的为音频深度处理和辅助视频分析提供帮助。所以分类的 细化和特定声音的识别是未来音频分类研究中的重点。 1 3 3 压缩域上的音频分割与分类技术 现实应用中大部分的音频数据是以诸如m p 3 、a v i 、w r e n 、r n l 等演所 格式存储的,未来的工作重心将转移到对压缩格式的音频数据的研究,以 提高实用住。 1 4 小波的提出及应用 小波变换( w a v e l e tt r a n s f o r m ) 是本世纪8 0 年代发展起来的一个强有 力的信号分析工具,小波变换继承和发展了窗口f o u r i e r 变换时频局部化 的思想,同时又克服了傅立叶变换和窗口傅立叶变换的缺点,具有窗口自 适应性,能对信号作不同尺度的分析,所以在信号处理中得到广泛的应用。 小波分析的应用领域十分广泛,包括:数学领域的许多学科;信号分 析、图像处理;量子力学、理论物理;军事电子对抗与武器的智能化;计 算机分类与识别;音乐与语言的人工合成;医学成像与诊断;地震勘探数 据处理;大型机械的故障诊断等方面;例如,在数学方面,它已应用于数 值分析、构造快速竖直方法、曲线曲面构造、微积分方程求解、控制论等。 在信号分析方面的滤波、去噪声、压缩、传递等。在图像处理方面的图像 压缩、分类、识别与诊断、去污等。在医学成像方面的减少b 超、c t 、核 磁共振成像的时间,提高分辨率等【1 4 l 。 小波分析方法是一种窗口大小( 即窗口面积) 固定但其形状可改变, 时间窗和频率窗都可改变的时频局域化分析方法,即在低频部分具有较高 的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和 较低的频率分辨率,这一特性适用于分析音频这种短时平稳长时间非平稳 的信号,其在音频方面的应用也日益广泛。 6 重庆邮电大学硕士论文第一章绪论 1 5 本文研究的主要内容及论文结构 1 5 1 本文研究的主要内容 音频分割与分类是音频结构化的基础,是音频内容分析,检索和深度 处理的前提。相对于多媒体研究领域内的图像和视频处理技术,音频处理 技术还很不成熟,音频分类算法在人工智能、机器学习技术的推动下发展 迅速,但依然面临很多挑战,目前还没有适合于实际应用的完善的音频分 割与分类系统。 本文的研究的主要内容有: 小波分析的研究及适用于音频分析的小波的选择 本文深入分析了小波变换理论,对不同的小波进行了研究,通过实验, 选取了最适宜于音频信号分析的小波来对音频进行处理,提取小波域音频 特征。 音频特征的分析与提取 音频特征分析与提取是音频分割与分类的基础,所选取的特征应该能 够充分表示音频频域和时域的重要分类特性,对环境的改变具有鲁棒性和 一般性。本文利用小波多分辨分析的优势,对音频信号进行小波变换,提 取其近似系数进行特征的分析与提取。 音频分割 大部分音频处理研究工作对音频分割涉及的很少,传统的分割方法大 多采用简单的滑窗法和基于规则的方法。本文分析了传统滑窗法的缺陷, 提出了一种“帧持续”的滑窗法,该方法是对传统滑窗法的改进。实验证 明,该方法降低了分割的敏感性,提高了分割精度。 音频聚类研究 音频聚类是音频识别检索的关键步骤,本文采用k 均值算法进行音频 聚类。不仅算法简单快捷,而且实验中取得了较好的分类精度。 1 5 2 论文结构 本文共包括六章,后续章节基本是按照上述研究内容逐一展开的。第 二章介绍了小波分析的相关基础,分析了小波在音频信号分析方面的应 用;第三章介绍了特征分析与提取,并结合小波在音频分析方面的优势, 提出了三个新的小波域的特征;第四章介绍了音频分割原理及主要的音频 7 重庆邮电大学硕士论文第一章绪论 分割方法,分析了传统滑窗分割法的缺陷,提出了一种改进的滑窗分割方 法,运用第三章所提取的小波域特征进行音频分割,并通过实验证明该方 法提高了分割精度;第五章阐述了k 均值分类的算法思想,并结合决策树 方法提出了一种k 均值决策分类算法,在分类实验中对该方法的分类性能 进行了衡量;最后一章总结和评价了论文的全部工作,并对未来的研究工 作进行了展望。 重庆邮电大学硕士论文 第一二章小波分析基础与研究 第二章小波分析基础与研究 小波分析及其应用是一门新的学科,在短短的十多年内得到了蓬勃的发展。 随着小波理论研究的深入和日趋成熟,其应用己逐步渗透到许多领域。一般说来, 传统上使用f o u r i e r 分析的地方,现在都可以用小波分析取代并取得更好的结果, 它能对几乎所有的常见函数空间给出简单的刻画,也能用小波展丌系数描述函数 的局部性质,特别是在信号处理和语音分析中,由于它的局部分析性能优越,在 数据压缩、去噪和边缘检测等方面比现有手段更为有效。小波分析在时域和频域 同时具有良好的局部化特性,克服了传统f o u r i e r 分析的不足,由于它对高频采取 逐渐精细的时域步长,从而可以聚焦到被分析信号的任意细节。近年来小波理论 得到了进一步的发展,人们构造出同时具有多种优良性质的小波,同时也从另外 一个角度去放宽正交小波基的条件,去研究更一般的非j 下交向量族,使得小波理 论不断完善。随着小波理论的不断完善,它的应用领域也越来越广泛。 本章对小波分析的发展史进行了简单的回顾,同时介绍了关于小波分析的一 些基本概念、定理及算法,并研究了小波在音频方面的应用。 2 1 小波分析的起源背景 自f o u r i e r 提出了f o u r i e r 分析这全新的观点后,在分析领域内产生了极为重 要的影响,使数学、物理学科发生了很大的变化,引起了众多科学家的广泛关注。 f f t ( 快速傅立叶变换) 的提出更使f o u r i e r 方法从理论走向实践,成为人们进行 分析的强有力的工具。 但是f o u r i e r 分析有如下一些主要不足之处: 为了从模拟信号中提取频谱,就要取出无限的时问量,使用过去的和将来 的信息只为计算单个频率的频谱。 属于某一给定的区间反映不出厂( f ) 在时间区域上的信息。 因为信号的频率反比于其时间周期,因此对高频谱信息而言,时间区域应 相对窄;而对低频谱信息而言,时间区域应相对宽。即应给一个可调时频窗,f o u r i e r 分析不能做到这一点,从而不适于做局部分析。 因此,在信号处理界和数学界中,人们长期以来都在寻求一种新的信号表示 方法,它应该综合三角函数系和h a a r 系两者的优点。 b a l i a n 提倡寻求关于时间变量与频率变量都适合的基底,希望在给定的时间 9 重庆邮电大学硕士论文第一二章小波分析基础与研究 内,把一个震动的信号表示成为每一个都同时拥有足够确定的位置与频率的初等 小波的叠加。g a b o r 于1 9 6 4 年提出了加窗f o u r i e r 变换,定义了一对互逆的变换公 式: ,一g f ( p ,g ) 2 云上弛) g ( x 一9 弦啪出 ( 2 t 1 ) 1 f ( x ) 2 赢s l g f ( p ,g ) g ( x g ) 8 ”勿由 2 g ( x ) 为给定的窗函数( 例如可以选取g ( x ) 为g a u s s 函数) 。窗口f o u r i e r 变换作为 一种时频局部化分析工具,弥补了f o u r i e r 分析的一些不足,但由于其窗口的大小 及形状均为固定值,所有并不能完全满足信号分析的要求。 由于小波分析的时频分析窗口大小固定但是形状可以改变,即反映信号的高 频成分需要较窄的时间窗,而反映信号的低频成分需要较宽的时州窗,因此能够 满足时频局部化要求。 函数( f ) e 1 1 ( r ) n ,2 ( 月) 被称为小波函数是指它满足下面的条件: ( 2 3 ) ¥o j ( f ) 爿口严妒f 盟1 ( 2 4 ) 口 贝打又定义函数t ( ,) l 2 ( r ) 的小波变换为: 朋= 掣f 町( 口,b ) q z o , 等 ( 2 5 ) 由w ( t ) e 1 1 ( r ) ,可知l 。j 少( f ) 出i 0 , m e z ,此时对应的小波函数是2 啄( ,一f ) 】,f ,= o ,1 2 一 位移的离散化。通常对f 进行均匀离散取值,以覆盖整个时间轴。为了防 止信息的丢失,我们要求采样间隔f 满足n y q u i s t 采样定理,采样率大于等于该尺 度下频率通带的二倍。所以每当m 增加l 时,尺度口增加一倍,对应的频率减小 一半,可见采样率可以降低一半而不致引起信息的丢失( 带通信号的采样率决定 于其带宽,而不是决定于其频率上限) 。所以在尺度下,由于妒( 嘶7 t ) 的宽度是( ,) 的,同时也不会引起信息的丢失。这样,致,( f ) 就改成: i 一 2 【町o 一吲f o ) 】= a o2 【簖t k r o 记为p k 一( f ) ( 2 8 ) 离散小波变换定义为 弓( 倒,露f o ) = j ( f ) y 酊,( t ) d t ,= 0 ,l ,2 ,k e z ( 2 9 ) 在实际中,我们一般取= 2 ,这时o r = 1 ,2 1 , 2 2 ,2 ,。 当口= 2 时,沿r 轴的相应采样间隔是2 7 f o ,此时,虬,( ,) 变为: 一z 22 妒( 2 一。t - k r o ) 即,j ( f ) ,= 0 ,1 ,2 ,;七z ( 2 1 0 ) 我们把f 轴用f 0 归一化,= l ,于是有: y ,j ( f ) = 22 i p , ( 2 - - t k ) ( 2 1 1 ) 此时,对应的阡为:阡( ,t ) = j 厂( f ) 妒础。矽 2 2 3 多分辨率分析 多分辨分析是函数在r ( r ) 空间内,将函数f ( x ) 描述为一系列近似函数的极 限。每一个函数都是函数八力的平滑版本,而且具有越来越精细的近似。这些近 重庆邮电大学硕士论文 第一二章小波分析基础与研究 似是在不同尺度上得到的f 。 为了得到l 2 ( r ) 的基底,先从l 2 ( r ) 的某个子空间中先建立起基底,然后利用 极其简单的变换,再把基底扩充到l 2 ( r ) 中去。 在r ( r ) 空间中的多分辨分析是指满足下列条件的一空| 目j 序列 _ ,j z : 单调性:一t - 一- l ,j z 。 渐进完全性:u r ( r ) ,n 巧= o 。 - - ” 伸缩性:对任意z ,f ( x ) 一,则f ( 2 x ) 一r 平移不变性:f ( x ) 一,则f ( x 一2 7 k ) 一,j i z 。 星兹( r i e s z ) 存在性:存在函数g ( x ) k ,使得 g 一意) ,七z 构成的 里兹基,即对任意的烈力,存在唯一的序列吼1 2 ,使得: 矿( x ) = a k g ( x j j ) ( 2 1 2 ) 考虑p ( r ) 中的另一闭子空间 w j ,满足:+ = _ 1 ,是在一,上的 补,若w ,是v ,是正交的,则: 彤。匕= 吩一l ( 2 1 3 ) 若空间v 由矿( f ) 生成,空间w 由( f ) 生成,则妒( r ) 为l 2 ( r ) 的尺度函数,而( f ) 为e ( r ) 的小波函数,将( r ) 和妒( f ) 伸缩和平移可得到: 妒m ( f ) = 2 。”妒( 2 t 一七) ( 2 1 4 ) 妒m ( f ) = 2 “( 2 t - k ) ( 2 1 5 ) 因为力 生成空间, 生成空间,它们都属于- 1 所以存在二尺度序 列玩 和 ,使得: 妒( f ) = 钆妒( 2 f k ) ( 2 1 6 ) 妒( f ) = ( 2 ,- k ) ( 2 1 7 ) 将上两式写成频域形式,有: ( 2 国) = 月7 ( 缈) ( ) ( 2 1 8 ) v ( 2 t o ) = g ) ( ) ( 2 1 9 ) 仇) 和 称为正交镜像滤波器,魄) 为分解低通滤波器, ) 为分解高通滤 波器,h ( t o ) 和g ( 国) 为滤波器的传递函数。 以多分辨分析为基础,对信号c o 进行小波正交分解与重构的m a l l a t 塔式快速 算法如下。 分解算法: = 一2 i 。1 ( 2 2 0 ) 咧= m 1 ( 2 2 1 ) 重庆邮电大学硕士论文第二章小波分析基础与研究 重构算法: 一= 嚏一2 。+ g j 一2 。彤 ( 2 2 2 ) 式中,础代表分辨率,下的离散细节信号,即该分辨率下小波变换所得到的序列, 对应于高频成分,代表分辨率,下的离散“模糊”信号,即该分辨率下对原始信 号的平滑逼近,对应于低频成分r n 。 上面介绍了多分辨分析的定义以及多分辨分析为基础对信号进行小波正交分 解与重构的m a l l a t 塔式快速算法。 2 2 4 几种常用的小波 根据不同的标准,小波函数具有不同的类型,这些标准通常是下面几点。 ( f ) 、妒( ) 、( f ) 和矿( ) 的支撑长度,即当时阳j 或频率趋向无穷大时, 妒( f ) 、( 国) 、( f ) 和( 国) 从一个有限值收敛到0 ( 注:o ( t ) 为尺度函数,小波函 数 f ,( ,) 可以由它求出来,这将在后面有详细论述) 。 对称性,它在图像处理中可以很有效地避免移相。 g t ( t ) 和矽( ,) 的消失矩阶数,这对于压缩是非常有用的。 正则性,它对信号或图像的重构获得较好的平滑效果作用上是非常有用 的。 在本节中,我们主要介绍几种常用的基本小波。 h a a r 小波 h o a r 函数是小波分析中最早用到是一个具有紧支撑的j 下交小波函数,也是最 简单的一个小波函数,它是支撑域在f o ,1 】范围内的单个矩形波。h a a r 函数的定 义如下: y ( f ) = 1o f 三 2 1 三f 1 ( 2 2 3 ) 2 0 其他 h a a r 小波在时域上是不连续的,所以作为基本小波性能不是特别好。但它也 有自己的优点,如: 1 1 计算简单 2 ) y ( f ) 不但与妒( 2 f ) 【_ ,z 】正交( 陟( r ) ( 2 f ) 西= 0 ) ,而且与自己的整数位移 正交即i ( f ) p 一_ i ) 西= o ,k z 。 因此,在口= 2 ,的多分辩率系统中h a a r 小波构成一组最简单的j 下交归一的小 1 4 重庆邮电大学硕士论文 第二章小波分析基础与研究 波族。 d a u b e c h i e s ( d b n ) 小波 d a u b e c h i e s 小波是由世界著名的小波分析学者i n r i dd a u b e c h i e s 构造的小波函 数,我们一般简写成d b n ,n 是小波的阶数。小波妒( f ) 和尺度函数( f ) 中的支撑区 为2 n l ,( f ) 的消失矩为n 。除n = 1 外,d b n 不具有对称性( 即非线性相位) 。 d b n 没有明确的表达式( 除n = 1 外) ,但转换函数的平方模是很明确的。 令p ( y ) = c ? - 1 “y ,其中,c ? - 1 “为二项式的系数,则有 i m o ( c o ) 1 2 _ - p 割尸p 詈j ( 2 2 4 ) 式中,( 缈) = 去魄e j k m 。 d a u b e c h i e s 小波函数提供了比h a a r 函数更有效的分析和综合。d a u b e c h i e s 系 中的小波基记为d b n ,n 为序号,且n = l 。2 ,1 0 。 s y m l e t s a ( s y m n ) t b 波系 s y m l e t s 函数系是由d a u b e c h i e s 提出的近似对称的小波函数,它是对d b 函数 的一种改进。s y m l e t s 函数系通常表示为s y m n ( n = 2 ,3 ,8 ) 的形式。 s y m l e t s 函数系的构成思想主要是利用上述构成d b n 小波系中的函数m 。,建 立一个函数( 力爿r n o ( c 口) j 2 ,其中:= f ”,然后分解( z ) 如下形式 矽( z ) = u ( z ) u ( 二) ( 2 2 5 ) w ( z ) 中不等于l 的跟会成对出现,如果一个等于z ,另一个就等于l 孑,适当 地选择函数u ,使它所有跟的模都小于l ,就得到d b n 小波,此时函数( ,所构成 的滤波器为最小相位滤波器,如果选择【,时,改变原则,使它构成的滤波器的对 称性更好一些时,就得到了s y m n 小波系,他的其它特性与d b n 类似。 ( 至) m e y e r ( m e y r ) 小波 m e y e r 小波的小波函数和尺度函数伊都是在频域中进行定义的,是具有紧支 撑的正交小波。 i ( 2 万) - i 2 e b 2s i n ( 三v ( 丢吲1 ) x 了2 r qm 峰了4 , r 矿( 国) = ( 2 矿m 2 c o s ( 量v ( 丢例_ 1 ) ) ,了4 7 马印峰等 ( 2 2 6 ) 【 。 叫等,鞠 重庆邮电大学硕士论文 第二章小波分析基础与研究 ( 国) = ( 2 疗) “2 ,悱了2 7 1 ( z 矿c o s ( 三v ( 丢例_ 1 ) ) ,等历等 o , p 挈 j 通过改变辅助函数v ( a ) ,可得到不同的m e y e r 小波系 ) m o r l e t 小波 它是高斯包络下的单频率复正弦函数: 一 妒( ,) = c e 2 e o s ( s x ) c 是重构时的归一化常数。 ( 2 2 7 ) 它具有无穷阶导数 ( 2 2 8 ) m o r l e t 小波没有尺度函数( f ) ,而且是非正交分解。 c o i n e t ( c o i f n ) 小波系 c o i f l e t 函数是由d a u b e c h i e s 构造的一个小波函数,它具有c o i f n ( n = 1 , 2 ,3 ,4 ,5 ) 这一系列。c o i f l e t 具有比d b n 更好的对称性。从支撑长度的角 度来看,c o i f n 具有和d b 3 n 及s y m 3 n 相同的支撑长度,从消失矩的数目来看,c o i n 具有和d b 2 n 及s y m 2 n 相同的消失矩数目。 2 3 小波分析与傅立叶分析的比较 傅立叶变换( f d 是信号分析和处理的有力工具,在以快速傅立叶变换算法为代 表的一系列有效算法出现后,傅立叶变换( f d 不但在信号处理领域起着支柱作用, 而且在其他工程领域也获得了广泛的应用 1s 】。 傅立叶变换定义了“频率”的概念,用它可分析信号能量在各个频率成分中 的分布情况。对信号厂( r ) ,其傅立叶变换定义为: ,( ) = 厂( ) = i f ( t ) e 叫“d t ( 2 2 9 ) 傅立叶变换是一种可逆的变换,傅立叶逆变换定义为 1, ,( f ) = f ( r o ) = j li f ( m ) e “d r o ( 2 3 0 ) z y t 式( 2 2 9 ) 、式( 2 3 0 ) 形成傅立叶变换对,并对信号厂( ,) 实施分解和综合。 但在傅立叶变换后信号在时域信息全部丢失,而在傅立叶变换前的原时日j 函 数只包含时域的信息而无任何频域的信息。 我们用傅立叶变换对非平稳信号进行分析,不能提供完全的信息,也即通过 傅立叶变换,我们虽然可以知道信号所含有的频率信息,但不能知道这些频率信 1 6 重庆邮电大学硕士论文第二章小波分析基础与研究 息究竟出现在哪些时间段上,可见,若要提取局部时间段的频域特征信息,傅立 叶变换显得太不实用了。 为了研究信号在局部范围的频域特征,1 9 4 6 年g a b o r 提出了加窗f o u r i e r 变换 ( 也称g a b o r 变换,简称s t f t ) 。基本思想是:取一个光滑的函数g ( t ) 作为窗口 函数,它在有限区间外恒等于0 或很快地趋近于0 。用譬o 一刀) 同待分析函数相乘, 然后再进行傅立叶变换: g j ( o j ,f ) = i f ( t ) g ( t f ) 9 1 “d t - - ( f ( t ) g o ,( ,) ) ( 2 3 1 ) a 其中 g - ,( ,) = g ( t r ) e “= g ( t r ) e “ ( 2 3 2 ) 时间t 和频率国一t 的分辨率( 即局域化性质) 是受h e i s e n b e r g 测不准原理所制 约的。选定了窗函数g ( f ) 后,时间分辨率q 和频率分辨率吒就确定了。 下面我们将以上提到的小波分析方法与傅立叶变换进行比较,就更可以显示 小波变换特长所在。 傅立叶变换的实质是把能量有限的信号厂( r ) 分解到以 p 一 为正交基的空 问上去;小波变换的实质是把能量有限的信号苁玲分解到肜,( ,= 1 ,2 ,d 和k ,所 构成的空间上去。 傅立叶变换用到基本函数只有s i n ( a ,t ) 、e o s ( 6 0 t ) 和e x p ( i 珊t ) ,具有唯一性;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度财务人员个人转正工作总结(6篇)
- 电脑耗材培训课件
- 电脑知识培训计划表课件
- 高考小说探究的种类课件
- 第1课《消息二则:我三十万大军胜利南渡长江》课件 2025-2026学年统编版语文八年级上册
- sem考试试题及答案
- 电网安全知识培训课件
- 电网业务基础知识培训内容课件
- 电线的种类教学课件
- 2025医院消毒供应中心工作标准流程图表
- 二、问题解决型(指令性目标)QC成果案例
- 企业外包业务安全生产专项检查表(全面)1管理学资料
- 航海英语听力与会话第四版朗读题70篇
- 手机保密专题教育课件
- 公司QHSE(职业健康安全环境)体系管理程序文件
- 管理咨询与中国管理咨询实践
- 信息通信建设工程预算定额 (2017版)第四册+通信线路工程预算定额
- 2023年高中音乐课件情怨(独唱)-电视剧《胡雪岩》主题歌
- 广东省珠海市香洲区2022-2023学年八年级下学期期中英语试卷
- PICC常见并发症的预防及处理
- 发电机常规试验作业指导书
评论
0/150
提交评论