




已阅读5页,还剩51页未读, 继续免费阅读
(检测技术与自动化装置专业论文)基于匹配追踪的语音时频建模和增强的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 在现代信号处理中,语音信号是一类典型的非平稳信号。对于这类频率随时间变化 的信号,传统的时间域和频率域的分析方法都不能够全面的反映信号的特征,而时频分 析是分析和处理此类非平稳信号的有力工具。它将信号表示为时间和频率的联合函数, 揭示了时间域与频率域的联合时频分布信息,清楚地为我们描述了信号频率随时间变化 的分布关系。 从时频分析的角度看,语音信号的时域和频域特性和噪声的时域、频域特性有着明 显的差异,通过时频建模的方法可以达到语音增强的目的。本文提出语音信号的局部余 弦基建模。构造局部余弦基字典,其对时间轴的分割适应于语音信号时频结构的变化, 而且有较高的时频分辨率。使用局部余弦基原子的时频分布来对语音信号进行时频分 析。该分布继承了魏格纳一维利时频分布高时频聚集性的优点,同时避免了魏格纳一维 利时频分布中存在交叉项的弱点。通过仿真试验,本文验证了使用局部余弦基模型对语 音信号进行建模的可行性和有效性。 在各种基于语音生成模型的增强算法中,如何准确地提取模型参数一直是个难点。 本文选用自适应信号分解方法匹配追踪法提取时频模型参数。选择合适的字典对含 噪信号进行匹配追踪分解后,噪声在时频面中被稀释,而语音成分则相对地聚集在时频 面上某个区域。匹配追踪算法具有自适应性,在每一步中都会提取到跟待分解信号相关 性最强的时频原子的参数。仿真结果显示,基于匹配追踪的语音信号局部余弦基建模, 可使语音信号中的时频特征能够很好地聚集在字典中的原子上,然后从含噪语音中尽量 多地提取语音成分,且这种语音增强方法不需要先验地获知有关信号和噪声的统计特 性。 匹配追踪分解可以通过控制迭代的次数来达到滤除噪声的目的。但是当信噪比过低 时,噪声原子的能量可能比语音原子的能量大,这样匹配追踪分解就会把噪声原子误当 语音原子给分解出来。为此,本文提出匹配追踪分解与子空间方法结合的方法,带噪语 音信号的矢量空间可以认为由一个信号加噪声的子空间和一个纯噪声子空间构成。可以 利用信号子空间处理技术,消除纯噪声子空间,然后对语音信号进行分解,实现语音增 强。仿真结果显示,子空间中进行的匹配追踪分解在低信噪比和加有色噪声的情况下都 有效地达到语音增强的目的。 关键词:局部余弦基模型;匹配追踪算法;语音增强;时频分析 a b s t r a c t a b s t r a c t i nm o d e m s i g n a lp r o c e s s i n g ,s p e e c hs i g n a li sat y p i c a le x a m p l eo fn o n s t a t i o n a r ys i g n a l , c h a r a c t e r i z e d b y al i m i t e dd u r a t i o n ,a n dt i m ev a r i e d j o i n tt i m e - f r e q u e n c y a n a l y s i s ( t i m e f r e q u e n c ya n a l y s i s ) i s as o p h i s t i c a t e dm e t h o dt o a n a l y z e i t sc h a r a c t e r i s t i c s t i m e - f r e q u e n c ya n a l y s i sf o c u s e do nt h et i m e - - f r e q u e n c yc h a r a c t e r i s t i c so ft h ec o m p o s i t i o no f r e a ls i g n a l ao n e - d i m e n s i o n a ls i g n a li s r e p r e s e n t e dt ot w o - d i m e n s i o n a lt i m e f r e q u e n c y d e n s i t yf u n c t i o n i nt h ec a s e so fl o ws i g n a lt on o i s er a t i o ,t i m e - f r e q u e n c ya n a l y s i sc a na l s ob e u s e dt oa c h i e v eg o o dr e s u l t s a san e ws i g n a lp r o c e s s i n gm e t h o d ,i t sa p p l i c a t i o na r e a sa r e m o r ea n dm o r e 、析d e f r o mt h ev i e wo ft i m e - f r e q u e n c ya n a l y s i sp o i n t ,i nt i m ed o m a i na n df r e q u e n c yd o m a i n , t h es p e e c hs i g n a l sa n dt h en o i s eh a v eac l e a rd i f f e r e n c e i n s p i r e db yt h i s ,t h i sp a p e rp r e s e n t s t h et i m e - f r e q u e n c ym o d e l i n gm e t h o dt os p e e c he n h a n c e m e n t t h i sp a p e ri n t r o d u c e dal o c a l c o s i n e - b a s i sb a s e dd i c t i o n a r y , i ts e g m e n t st h et i m ef r a m ea n da d a p t ss p e e c hs i g n a l sc h a n g e s o ft h et i m e - f r e q u e n c ys t r u c t u r e w ea l s og e tah i g h e rf r e q u e n c yr e s o l u t i o n t ob r e a kt h e c o n s t r a i n to fu n c e r t a i n l yp r i n c i p l ei nt r a d i t i o n a ls p e c t r o g r a p h i ca n a l y s i sm e t h o d ,w ep r o p o s e u s i n g t h ec o m b i n a t i o no fl o c a lc o s i n e b a s i sa t o m s w v dt o a n a l y z et h es p e e c h s t i m e f r e q u e n c ys t r u c t u r e t h i sm e t h o dh a sh i g ht i m e - f r e q u e n c yr e s o l u t i o na sw v d b u tt h e c r o s s - t e r mi n t e r f e r e n c ei nw v d t h r o u g ht h ea n a l y s i sb e t w e e nt i m ea n dt i m e f r e q u e n c y p l a n , w ep r o v e dt h a ti ti sr e a s o n a b l et ou s el o c a lc o s i n e b a s i sd i c t i o n a r yt om o d e ls p e e c h s i g n a l i na l lk i n d so fs p e e c he n h a n c e m e n ta r i t h m e t i c ,h o wt og e tt i m e - f r e q u e n c ym o d e l p a r a m e t e re x t r a c t i o ni sad i f f i c u l tp r o b l e m w eu s em a t c h i n gp u r s u i td e c o m p o s i t i o nm e t h o dt o g e tt i m e - f r e q u e n c ym o d e lp a r a m e t e re x t r a c t i o n c h o o s i n gas u i t a b l ed i c t i o n a r y , t od e c o m p o s e n o i s e ds i g n a l ,t h en o i s ei nt h et i m e - f r e q u e n c yp l a n ei sd i l u t e d ,a n ds p e e c hc o m p o n e n ti s c o m p a r a t i v e l yg a t h e r e di nt h et i m e f r e q u e n c yp l a n ei nag i v e nr e g i o n i ne a c hs t e p ,w ew i l l e x t r a c tt h ep a r a m e t e r so fa t o m sw h i c ha r et h em o s tr e l e v a n tw i t hs p e e c hs i g n a l t h e s i m u l a t i o nr e s u l t ss h o wt h a t ,m a t c h i n gp u r s u i tm e t h o di sa u t o - a d a p t e d t h et i m e - f r e q u e n c y c h a r a c t e f i s t i e so ft h es p e e c hs i g n a lc a nb eg o o dg a t h e r e di nt h ea t o m si nt h ed i c t i o n a r y m a t c h i n gp u r s u i td e c o m p o s i t i o nc a nc o n t r o lt h ei t e r a t i v en u m b e rt oa c h i e v et h ep u r p o s e o ff i l t e r i n gn o i s e b u tw h e nt h es i g n a lt on o i s er a t i oi st o ol o w , t h ee n e r g yo fn o i s ea t o m sm a y b eh i g h e rt h a nt h es p e e c ha t o m s ,t h i sw i l lb r e a kd o w nt h en o i s ea t o m sa ss p e e c ha t o m s t o t h i se n d ,t h i sp a p e rp r e s e n t sm a t c h i n gp u r s u i td e c o m p o s i t i o nc o m b i n e s 淅t l ls u b s p a c em e t h o d t h ev e c t o rs p a c eo fn o i s ys p e e c hi sc o n s i d e r e da san o i s ys p e e c hs p a c ea d d e dap u r en o s e s p a c e w ec a nu s eo fs u b - s p a c ed e c o m p o s i t i o nt e c h n o l o g yt or e m o v ep u r en o i s es u b - s p a c e s i m u l a t i o nr e s u l t ss h o wt h a tt h em a t c hp u r s u i tw i t ht h es u b - s p a c e ,a p p l i e st ot h ev a r i o u ss n r s p e e c he n h a n c e m e n t k e yw o r d :l o c a lc o s i n e - b a s i sm o d e l ;s p e e c he n h a n c e m e n t ;m a t c h i n gp u r s u i t ; t i m e f r e q u e n c ya n a l y s i s 1 1 1 独创性声明 本人声明所呈交的学位论文是拳人在导师指导下进行的研究工作及取 得的研究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意 期:榭7 月争阳 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容缟入有关数据库 进行检索,可以采用影印,缩印或扫描等复制手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致 保密的学位论文在解密后也遵守此规定 签名:索昕 导师签名: 第一章绪论 第一章绪论 1 1 研究背景 语音信号是人类传播信息和感情交流的重要媒体,也是人类最重要,最有效、最常 用,最方便的通信方式。其中语音增强技术的研究已成为国内外语音信号处理的重要研 究课题。研究的必要性在于: 1 语音增强技术在其它应用领域发展的迫切需要 目前语音识别已达到较高的技术系统识别率,但前提是在理想环境或实验室环境 中,若在噪声环境中,尤其在强噪声环境中,语音识别系统的识别率将会普遍地大幅度 下降。例如,一个用纯净语音训练的错误率不到1 的语音识别系统,在学生食堂的识 别错误率将高于5 0 ;在汽车噪声环境下,语音增强作为前端处理用于提高识别器输入 端信号的信噪比,当识别精度在9 0 以上时,系统至少能获得1 0d b 的信噪比增益f l 】。 在另一语音信号处理的领j 彝一低速率语音编码中,语音生成模型是低速率参数编 码的基础,由于噪声的存在,使得在语音编码过程中对语音参数的提取出现误差,当噪 声干扰严重时,会导致语音重构时出现较大的误差,甚至完全不可懂。另外在军事场合 等极端条件下,噪声的存在使得普通的语音通信几乎无法进行。在上述情况下,必须对 含噪语音信号进行预处理,以抑制背景噪声,提高通话质量,增强语音处理系统的抗干 扰能力,保持系统的稳定性。 2 提高语音可懂度的需要 对于有历史价值的磁带、唱片,录音纪录中的噪声与失真,对于语音残障人士的语 音失真,又有迫切提高语音可懂度的需求。 3 提高语音质量的需要 现实生活中,语音信号不可避免的受到周围环境噪声的影响。例如传输媒介引入的 噪声、通信设备内部的电噪声、其他讲话者的语音等,将不再是纯净的原始语音,而是 被噪声污染的带噪语音。当噪声干扰严重时,会导致语音重构时出现较大的误差,甚至 完全不可懂。另外在军事场合等极端条件下,噪声的存在使得普通的语音通信几乎无法 进行。语音增强是解决噪声污染的一种有效方法,它的一个主要目标是从带噪语音信号 中提取尽可能纯净的原始语音。使听者轻松、准确地听到语音信号。 由于语音信号又是一种典型的非平稳的信号【2 1 ,其特点是持续时间有限,并且是时变 的。作为一种典型的非平稳信号,从时频联合的角度分析语音信号受到越来越多的关注。 时频分析着眼于真实信号组成成份的这种时变谱特征,将一个一维的时间信号以二维的 时间一频率密度函数形式表示出来,旨在揭示信号中包含多少频率分量,以及每一分量是 怎样随时间变化的。在语音信号信噪比低的情况下时频分析也可以达到很好的效果,它 的这种特性使得时频建模应用于语音增强成为新兴信号处理方法,近年来受到越来越广 泛的重视,其理论在不断发展,应用领域不断扩展【3 1 。正弦建模在语音和音频信号处理 中得到广泛应用,如语音压缩、语音变换、语音合成以及说话人的分离等等,其目标是 江南大学硕士学位论文 为输入信号寻找一组正弦信号分量,将这些信号分量看作原始信号的模型,在此模型的 基础上实现对原始信号的处理。正弦建模的过程实际上是信号分量的提取过程,也可以 看作是一种分解过程。匹配跟踪作为一种自适应的信号分解算法,可以用于正弦建模, 并且为语音或音频信号正弦建模提供一个新的框架。 1 2 研究现状 语音增强处理中的一个众所周知的问题就是设法解决改进语音质量与提高语音懂 度的矛盾。因为在去除含噪声语音中噪声的同时,一部分有用的语音成分也被去除或衰 减,这样就降低了语音的可懂度,而且,对噪声成分去除的越多,语音质量的改进将越 明显,但对语音可懂度的影响可能越大。目前,有一些对低信噪比带噪语音进行语音增 强的方法,可以显著地降低背景噪声,改进语音质量,但并不提高语音可懂度,甚至略 有下降。解决这一问题的关键是如何准确估计出应该去除的噪声信号。近年来,人们对 在采集带噪声语音的同时可单独获得参考噪声的情况,做了大量的自适应噪声抵消技术 的研究,并取得了较大的成功。但是,对于仅有带噪声语音可利用情况下的语音增强, 则是正在研究中的课题。该类课题的研究需要建立更为准确的语音生成模型、深入研究 人的听觉系统及研究如何仅从含噪语音中准确估计噪声,挑战性较大。 目前大多数语音增强算法都是建立在语音的生成模型及感知模型基础上的【4 j 。这些 方法中有传统的正弦建模,基于短时能量的共振峰模型和听觉感知模型。 正弦建模的目的是获得信号的正弦表示,其过程就是从输入信号中估计( 或提取) 各 个正弦分量的参数,即三元组( a k ,c o k ,九) ,其中吼,q 和吮分别表示各个正弦分量的幅 度、频率和相位参数【5 】。不同的实现技术会将得到不同的建模结果。g e o r g e 和s m i t h 提 出基于均方误差( m s e :m e a ns q u a r ee r r o r ) 的分析合成技术。在他们的分析合成系统中, 采用m s e 的建模准则,要求合成信号尽可能地逼近原始信号。这是一个闭环分析合成 过程,随着正弦分量数目的增加,模型的精度越来越高,模型误差逐渐降低。因此该分 析合成过程是收敛的1 6 j 1 7 j 。 基于短时傅里叶变换( s t f t :s h o r tt i m ef o u r i e rt r a n s f o r m ) 的谱峰值检测技术是一种 启发式方法【剐。该方法建立在如下观察的基础上:如果语音信号是严格的周期信号,那 么各个正弦波参数将对应于s t f t 的谐波采样1 9 1 1 0 】。更为重要的是,s t f t 的能谱图在 这些基因频率整数倍的位置上,呈现出峰值点特征。在语音信号是准周期的情况下,信 号能谱图中仍然出现多个谱峰值点,不过这些峰值点的频率不一定是谐波相关。这些谱 峰值点可以用来鉴别基本的正弦波结构。该过程可分为两个阶段g 分析与合成。在分析 阶段的主要操作是s t f t 和共振峰值检测。s t f t 是在对语音信号加窗后,通过离散傅 里叶变换( d f t :d i s t r i b u t ef o u r i e rt r a n s f o r m ) 实现的。谱峰值检测是在能谱图( 即周期图) 上进行的。能谱图中对应于峰值点( 极大值点) 的频率和幅度,就是相应的正弦波分量的 频率和幅度参数。再根据正弦波的频率,可以从d f t 变换中,得到对应的相位参数; 在合成过程中,如果直接使用分析得到的参数合成各帧语音,则会出现帧边界不连续的 现象,严重影响合成语音的质量。因此在合成过程中采用了帧到帧的插值技术。 2 第一章绪论 传统的正弦模型和基于短时能量的共振峰模型都是建立某种准则,每步迭代从输入 信号中查找并删除能量最大的正弦分量,保证了模型的收敛性但是,对于人耳听觉感知来 讲,能量最大的信号分量不一定是感觉最明显的。v e r m a 提出了一种新的建模方法【1 1 1 。该 方法采用基于帧的感知加权技术,结合人类听觉系统的心理声学特征,根据心理声学模型 计算输入信号的全局掩蔽阈值,每步迭代都查找并剔除输入信号中感觉最明显的正弦信 号分量【1 2 l 。 1 9 9 3 年,s m a l l a t 和z z h a n g 首次提出应用过完备原子库对信号进行分解的匹配 追踪方法【1 3 】。匹配追踪( m p :m a t c h i n gp u r s u i t ) 作为一种自适应的信号分解算法,为语音 和音频正弦建模提供了一个新的框架。在语音增强、甚低码率语音编码方面,m p 方法 更显示出极大的优越性。 1 3 本文的主要工作 受人耳对噪声的强抑制作用的启发,在语音感知分析理论的基础上,不同于传统的 语音增强方法思路,本文研究了基于局部余弦基模型的语音增强方法。局部余弦基模型 是一种广义的正弦模型,通过自适应分解算法将含噪语音信号分解成包含了语音感知信 息的局部余弦基的组合,然后根据语音信号和噪声在时频面上的不同特性,通过对局 部余弦基原子的筛选来达到对含噪语音信号进行增强的目的。本文的主要工作包括三个 方面内容: 1 ) 提出对语音信号进行局部余弦基建模,研究了使用局部余弦基原子的魏格纳 维利分布( w v d :w i g n e r - v i l l ed i s t r i b u t i o n ) 来对语音信号进行时频分析。仿真 结果表明本文所采用的时频分析方法更适合揭示语音信号的精细时频结构表 示。 2 ) 研究了使用匹配追踪算法来提取局部余弦基模型的参数,并构造出离散化的局 部余弦基原子字典。匹配追踪算法弥补了基展开不足的缺陷,它按照每次最优 标准求解信号分解的稀疏逼近解,为推导信号的稀疏逼近模型提供了一个逐步 求精的分解框架,而且计算代价相对较低。仿真结果表明,无论在高斯白噪声 情况下,还是在有色噪声情况下,匹配追踪算法都可以准确的提取语音信号的 局部余弦基模型参数。 3 ) 提出了基于匹配追踪的局部余弦基建模与子空间方法结合的语音增强。从时频 分析的角度看,语音信号的时域、频域特性和噪声有着明显的差异,受此启发, 本文引入了局部余弦基字典,提出使用时频建模的方法进行语音增强。为解决 语音信号局部余弦基原子和噪声原子误判问题,本文又研究了使用子空间方法 分离含噪语音信号,在得到的信号子空间中判决,降低误判风险,以达到更好 的语音增强的目的。 1 4 论文结构 本文的组织结构如下: 江南大学硕士学位论文 第一章:主要介绍了课题的提出背景、国内外研究现状和本文的主要研究内容。 第二章:本章对于传统的基展开不足的问题进行论述,介绍了匹配追踪算法原理, 和基于这一算法的时频原子的性质,推导出时频原子的w v d 分布。 第三章:本章论述对语音信号的局部余弦基建模问题。提出从自适应信号分解的角 度用可精确覆盖时频平面的局部余弦基分析语音信号精细时频结构的方 法。使用m p 算法将语音信号分解成局部余弦基原子的组合,并提取局部 余弦基原子模型参数。仿真结果显示m p 分解得到原子的w v d 不仅有更 佳的时频聚集性,而且对二次型时频表示中的交叉项有一定抑制作用。并 介绍了如何使用匹配追踪算法来提取语音信号的局部余弦基模型参数,在 高斯白噪声和有色噪声环境下做了仿真,结果显示都可以有效提取模型参 数。 第四章:本章分析研究了匹配追踪用于信号增强的原理、方法及其实现。本文所研 究的语音增强算法的重要环节之一是语音端点检测。对含噪语音的统计特 性逐帧计算,自适应的得到判决门限,故其在低信噪比环境下仍然有较准 确的检测效果;提出了局部余弦基原子相干性量化区分准则;对基于匹配 追踪的局部余弦基建模语音增强在输入信噪比较低时可能出现信号原子 被误判为噪声成分的问题,引入子空间方法。首先分离出噪声子空间,再 于信号子空间进行匹配追踪分解。仿真结果显示,此方法无需知道噪声的 先验信息,其对高斯白噪声和有色噪声环境下的语音皆有较好的增强效 果。 第五章:对本文的研究内容和方法进行了总结,并对以后的研究工作进行了展望。 4 第二章匹配追踪白适应分解算法 第二章匹配追踪自适应分解算法 传统的信号分解变换是将信号分解在一组完备的正交基上,而且这种变换必然是可 逆的,如傅立叶变换,短时傅立叶变换,小波变换等。随着信号分解理论的发展,近年 来信号的非正交分解引起研究者越来越多的兴趣。为了实现对信号更灵活、简洁、自适 应的表示,在小波分析的基础上,c o i l m a n 、w i c k e r h a u s e r 1 4 1 和m a l l a t 、z h a n g f l 3 】提出了 信号在过完备库上分解的思想。 本章首先从信号分解和建模的角度,回顾了信号处理中基展开技术的发展,然后由 基展开的不足引出了自适应信号分解;最后是详细介绍了自适应信号分解方法m p 的基础理论、算法及实现,并推导了基于m p 分解的语音信号时频原子的w v d 分布。 2 1 基展开 在信号分析中,对信号的表示往往采用两种基本形式:时域形式和频域形式。从信 号的时域描述,可分辨出信号的某些特征,如变化的快慢,取值范围,连续或离散等, 然而信号的某些频域描述更为人们所关注。有时在时域内看不清的问题,在频域则一目 了然。频域分析方法较时域分析方法有许多突出优点,尤其是f f t 变换的提出使得频域 分析成为信号分析不可缺少的工具。在数字信号处理中,为了有效和快速地对信号进行 处理和分析,常常需要将原始时间域信号转换到频率域上,并利用在频域中的特有性质 更方便地进行一些加工处理,最后在变换到时间域以得到所需结果。 现实世界中存在着各种各样的信号,如人类的语音、动物的叫声、雷达或声纳信号 等。信号分析的主要目的就是寻找有效的表示方法,使信号的某种特征显示出来以便分 析。 将长度为的时域离散信号f ( n ) 进行某种变换,将其分解为m 个基函数仇( 挖) 的 线性叠加形式: 旦 f ( n ) = c k p k ( n ) ( 2 1 ) k = l 其中c k 称为变换系数或展开系数。式2 1 提供了一种通用的信号表达形式。从信号展开 的基函数所( 刀) 的选择出发,信号分解概括起来可分为两大类:正交基展开和基于过完 备原子库的展开。 当式2 1 中展开函数 见 为一组互相正交的函数时,这样的分解过程就称之为正交 分解。在维向量空间y 中,任意个线性无关向量都可称之为它的一组基。y 中任 一向量都可以表示成这组基的线性组合,且表示式是唯一的。 在信号处理领域,常用的正交分解包括傅立叶变换,短时傅立叶变换,小波变换。 2 1 1 傅立叶变换 在信号处理技术的发展中,傅立叶变换起着十分重要的作用,它把信号从时间域表 示转换到频率域表示。信号频率域分析方法较经典的信号时域分析方法有许多突出优 s 兰堕奎兰堡主兰垡丝茎 点。 傅立叶变换建立了信号由时域到频域变换的桥梁,而傅立叶反变换则建立了信号从 频域到时域的桥梁,这两个域间的变化形成一一对应的映射关系,如式2 2 所示: if ( e o ) = if ( t ) e 吖科班 一 【f ( t ) 2 去e f ( 咖 ( 2 2 ) 傅立叶变换在信号分析领域有着极其重要的作用,例如:信号在时域的卷积运算转 化为在频域的相乘运算;对于一个信号厂( f ) ,如果其傅立叶变换f ) 集中在h 噱之 内,对它进行采样,通过理想的低通滤波器,贝, l j f ( t ) 可以由它的采样值唯一的恢复过来。 傅立叶变换在处理平稳信号方面显示出强大的优越性,但对于非平稳信号,既要区 分各种频率成分,而且需要知道每个时刻附近的频率成分,那么傅立叶分析的方法就显 得无能为力了。这是因为傅立叶变换是全局变换,而非平稳信号的统计特性是随时间变 化的,对信号局部性能的分析必须依靠信号的局部变换。信号的局部性能需使用时域和 频域的二维联合表示,才能精确描述。 2 1 2 短时傅立叶变换 为了提取信号傅立叶变换的局部信息,g a b o rd 在他的论文1 6 1 中引入了一个时间局 部化的窗函数c o ( t 一“) ( 其中参数u 用于平移时域窗口以便覆盖整个时域) ,并求其傅立 叶变换。使用窗函数的傅立叶变换也称之为短时傅立叶变换,有些文献也称之为加窗傅 立叶变换。 信号f ( t ) 的s t f t 变换定义为: s 行0 ( 彩,甜) = i e - j 耐f ( t ) c o ( t - u ) d t ( 2 3 ) 其中c o ( t ) 为窗函数,满足c o ( t ) r ( r ) ,且t c o ( t ) r ( 尺) 。 由于窗函数的能量集中在一个很窄区间内,短时傅立叶变换在时域和频域都只依赖 于原函数局部区域值,达到提取信号的局部信息的目的,在时变的信号处理中得到了应 用。 但是由于短时傅立叶变换的时间频率窗口是严格固定的,其大小也是由窗口函数 的性质决定的。由于时间频率窗口固定,时间分辨率也固定,因此只能适应于一定时 频范围的信号分析与处理,对于检测高频信号和低频信号不是非常有效。这促使了小波 变换的引入。 2 1 3 小波变换 函数或信号的小波变换定义为1 7 】: 呐= e 们) 去( 孚) 出 其中虬。( f ) 是满足一定条件的小波函数, ( 2 4 ) s 为尺度参数,u 为时域平移参数或位置参数。 6 第二苹匹配追踪臼适心分解算法 其傅立叶变换为见,( c o ) = 4 7 6 ( s c o ) e 1 ”。运用p a r s e v a l 公式,小波变换也可以写成频域 积分的形式: 1 w s ( 甜,s ) 2 寺l 厂( 缈) 统,( c o ) d c o ( 2 5 ) 与s t f t 一样,小波变换也具备时频局部化特性,能够提取信号的时频局部特性。 但是与短时傅立叶变换不同的是小波变换中引入了尺度参数s ,在不同的尺度参数下, 小波函数的时频支撑区域是不同的,时间一频率窗口的大小不再固定。从而可以根据不 同的需要,如可以根据高频和低频不同特性,使时间频率窗口变窄或加宽。 在实际的离散信号处理中,通常对尺度参数进行“二进划分”,即选择s = 2 一o ( ,z ) , 把频率轴划分为邻近的频带,各相邻频带之间构成一种倍频程关系,每个频带的采样率 都与其带宽成比例。这样小波分解的结果是:输入信号被表示成一系列倍频程的信号细 节与一个低通滤波的信号轮廓。 2 1 4 基展开的不足 从傅立叶变换到小波分解,信号分析处理能力不断增强,它们之间的区别表现在时 频分解能力上,表现在提取信号的局部时频信息的程度上。如果将信号的展开看作对时 频空间的划分,它们的区别见图2 1 。 l 时阊 时同 图2 1 不同变换的时频空间划分示意图 f i g 2 - lt r a n s f o r md i f f e r e n ts p a c eo ft i m e - f r e q u e n c yd i a g r a m 从图中可以直观地看到,傅立叶变换只对频率轴进行了均匀划分;短时傅立叶变换 增加了对时间轴的划分,但是各个时频窗口的形状大小基本一致;小波变换的时频窗口 可变,但由于倍频程关系的约束,不能分解处于同一个频带中的多个正弦信号分量。 从以上分析可见,从傅立叶变换到小波变换的基展开,虽然分析能力不断增强,但 7 兰堕奎兰堡圭兰竺堡苎 仍存在许多不足。原因就在于:基展开是用一个有限的函数或向量集合去表示任意信号, 但没有考虑信号本身的特征。由于基展开函数是固定有限的,从而表达信号的能力和范 围也就有限。 如果选择一个过完备展开函数集合,根据信号的特征自适应地选择展开函数,那么 信号分解就可以更紧凑,就可以用更少的展开函数来表达信号的基本特征。 2 2 冗余展开及自适应信号分解 在n 维向量空间v 中,完备集是指由m 个向量构成的集合 碣以,九 ( m n ) , 这m 个向量中至少包含一组基向量。当m n 时,该集合被称为超完备的或冗余的。 这种冗余将使信号自适应分解与紧凑表达成为可能。向量的冗余性使得如下方程2 6 存 在非零解 。 丸= o ( 2 6 ) 这样对于信号厂就会具有无数种展开形式: = 厶= o ( 2 7 ) 即厂= d a 的解是不确定的、不唯一的。因此可以采用各种不同的策略和方法计算展开 表达式。在不同策略和方法下得到的展开结果是不一样的,而在策略的选择中可以考虑 信号的特征,以达到自适应分解的目的。 与基展开不同的,冗余展开的基函数之间不存在向基向量那样的固定结构,不能通 过矩阵求逆操作来计算展开系数。因为选择确切但并非最稀疏解的计算代价太高,所以 可按照次最优标准求解信号分解的系数逼近解,自适应分解算法的研究给此提供了很大 便利。 在科学领域,使用合适的数学模型来表示自然信号,一直是人们感兴趣的课题。其 中加法信号模型在信号处理领域一直得到广泛的使用,用公式可将此模型表示为: m ) 2 善( 川 ( 2 8 ) 其中f ( n ) 表示信号,哥( 厅) 表示信号的基函数,q 表示基对应的系数。在这里信号被分 解为加权的基函数叠加的形式。在此模型下,人们总希望以尽可能简洁的形式来描述信 号。如果一个表达式不仅准确而且简洁的表达出一个信号,则可以对信号的压缩、去噪、 识别等后继处理十分有利。 传统的信号表示方法如用正弦函数或小波函数等完备基来表示信号,这些基函数均 有较强的物理意义,并对于某些特定类型的信号取得了较好表示效果。但这类表示方法 都试图使用性质相同的一类基函数来表达任意信号,一旦基函数确定后,对于一个信号 只有唯一的一种分解方法,从而对于一般信号不能总得到信号的稀疏表示。更好的信号 分解方式应该根据信号的特点,自适应的选择合适的基来分解信号,这对于含有分布较 8 里三雯堕墼堕堡旦堕璧坌笙墨鲨 广的时域和频域局部化信息分量的信号来说尤其显得重要。 本文以语音信号为研究对象,以近年来兴起的自适应匹配追踪算法,实现信号的稀 疏分解,并构造模型。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025福建厦门外图集团有限公司17个岗位招聘若干人笔试历年参考题库附带答案详解
- 2025浙江绍兴兰亭国有控股集团有限公司招聘(派遣制岗位)笔试以及人员笔试历年参考题库附带答案详解
- 2025年济宁市任城区事业单位公开招聘工作人员(教育类)(125人)模拟试卷及一套完整答案详解
- 2025广东广州花都产融建设发展投资有限公司第二次招聘项目用工人员及安排笔试历年参考题库附带答案详解
- 2025广西玉林北流市山围镇卫生院公开招聘5人考前自测高频考点模拟试题及1套参考答案详解
- 2025江苏南京交通职业技术学院招聘高层次人才14人考前自测高频考点模拟试题及1套完整答案详解
- 2025湖南长沙市生态环境局芙蓉分局招聘编外合同制工作人员考前自测高频考点模拟试题有答案详解
- 2025黑龙江哈尔滨市五常市万宝学校9大岗位招聘28人模拟试卷及答案详解(网校专用)
- 2025广东深圳市宝安区陶园中英文实验学校招聘精英教师16人考前自测高频考点模拟试题及一套答案详解
- 2025年度哈尔滨“丁香人才周”(春季)事业单位引才招聘1347人考前自测高频考点模拟试题有完整答案详解
- 讲好中国故事英语演讲2-3分钟
- 介绍莫兰迪的课件
- 进位制完整版本
- DB32/T+4860-2024+电镀园区环境管理技术规范
- 室内安装标识标牌施工方案
- GB/T 17775-2024旅游景区质量等级划分
- 小学数学情境教学设计案例分析
- 《福建省整体装配式卫浴间标准设计图集》
- 中药冷敷技术操作方法及常见疾病的中药冷敷技术
- 地方政府的组织结构课件
- 【公开课教案】《蹲踞式起跑》教案
评论
0/150
提交评论