已阅读5页,还剩52页未读, 继续免费阅读
(信号与信息处理专业论文)语音信号时频建模的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 语音信号是一种典型的时变信号,正是这种非平稳性携带丰富的信息。准确地对语 音信号进行建模表示是语音编码、语音压缩、语音识别等后续处理的前提和基础。时频 分析理论和方法可以对信号在时域和频域同时分析,它是分析非平稳信号的有利工具, 近年来已成为信号处理等领域的一个研究热点,它也为语音建模提供一个新的理论和方 法,因此,研究语音信号的时频建模有着理论意义和应用价值。本文针对语音信号的时 频建模进行了研究,具体研究工作如下: 首先,提出小波多分辨率的正弦谐波谱语音建模。传统正弦谐波谱模型存在帧长固 定问题,不能使信号的每个谐波成分获得最佳分辨率,造成重构语音谱失真严重,小波 变换具有多分辨率特性,与正弦谐波谱模型相结合,解决了固定帧长的问题。小波变换 将语音信号分成如若干个不同频率的子带信号,然后利用正弦谐波谱模型对各个子带进 行独立分析,最后合成重建,实现语音信号时频建模。仿真实验显示该模型的信号重构 误差比传统模型降低约两个数量级,通过p e s q 测试得到的m o s 分值约提高0 3 。 其次,研究基于改进s 变换的语音信号时频分析。s 变换为短时f o u r i e r 变换和小 波变换的一个结合体,针对语音信号选择合适的母小波,对s 变换进行改进,得到一种 改进的s 变换,最后利用改进s 变换对语音信号进行时频分析。仿真实验与短时f o u r i e r 变换和小波变换两种时频方法比较,结果显示由改进s 变换得到语音信号的时频结构更 加细致。 最后,提出基于小波字典的匹配追踪算法的语音信号时频建模。匹配追踪核心思想 是寻找最佳匹配原子,首先选择d a u b e c h i e s 小波原子组成匹配追踪的原子字典,然后利 用匹配追踪算法将语音信号分解成若干个最佳匹配的小波原子,将最佳匹配的小波原子 进行累加,实现语音信号的重构。仿真实验通过与基于正弦字典的匹配追踪算法的结果 对比,验证了基于小波字典的匹配追踪算法的有效性和优越性。 关键词:语音信号;时频建模;正弦谐波谱模型;小波变换:s 变换;匹配追踪 a b s t r a e t a b s t r a c t s p e e c hs i g n a li san o n - s t a t i o n a r yt i m e - v a r y i n gs i g n a l ,c a r r y i n ga l lk i n d so fi n f o r m a t i o n m o d e l i n ga c c u r a t e l yi si m p o r t a n tt os u b s e q u e n tp r o c e s s i n gs u c ha ss p e e c hc o d i n g ,s p e e c h c o m p r e s s i o n s p e e c hr e c o g n i t i o n t i m e - f r e q u e n c ya n a l y s i si s a l le f f e c t i v et o o lf o rn o n - s t a t i o n a r ys i g n a la n a l y s i s ,o n ea san e w r e s e a r c ha r e ao fs i g n a lp r o c e s s i n gi nr e c e n ty e a r s ,c a l l a n a l y z es i g n a li nb o t ht i m ed o m a i na n df r e q u e n c yd o m a i na n do f f e ran e wt h e o r ya n dm e t h o d f o rs p e e c hm o d e l i n g ,s oi th a st h e o r e t i c a ls i g n i f i c a n c ea n da p p l i c a t i o nv a l u et od i s c u s ss p e e c h m o d e l i n g t i m e - f r e q u e n c ym o d e l i n gf o rs p e e c hs i g n a li ss t u d i e di nt h i sp a p e r , a n dt h er e s e a r c h w o r ki s 雏f o l l o w s : f i r s t l y , as i n u s o i d a lh a r m o n i cs p e c t r u mm o d e lb a s e do nw a v e l e tm u l t i r e s o l u t i o na n a l y s i s i s p r o p o s e d s i n u s o i d a lh a r m o n i cs p e c t r u mm o d e lh a st h ep r o b l e mo ff i x e df r a m el e n g t h , w h i c hc a nn o tg e tt h eb e s tr e s o l u t i o no fe a c hh a r m o n i c ,a n dt h er e s o l u t i o nd e t e r m i n e st h e e f f e c to fs p e e c hm o d e l i n g t h ec o m b i n a t i o no fw a v e l e tt r a n s f o r ma n ds i n u s o i d a lh a r m o n i c s p e c t r a lm o d e lh a sm u l t i r e s o l u t i o nc h a r a c t e r i s t i c s ,w h i c hs o l v e st h ep r o b l e mo ff i x e df r a m e l e n g t h ,d e c o m p o s i n ga ni n p u ts p e e c hs i g n a li n t om u l t i - r e s o l u t i o ns u b - b a n ds i g n a l su s i n gt h e w a v e l e tt r a n s f o r m ,a n ds i n u s o i d a lh a r m o n i cs p e c t r u ms p e e c hm o d e li s a p p l i e dt oe a c h s u b b a n ds i g n a lr e s p e c t i v e l y , f i n a l l y , e a c hs u b b a n ds i g n a lm o d e l e di ss y n t h e s i z e d ,w h i c hc a l l e d t i m e f r e q u e n c ym o d e l i n g t h es i m u l a t i o ne x p e r i m e n t ss h o wt h a tt h es i g n a lr e c o n s t r u c t i o n e r r o ro ft h ep r o p o s e dm o d e li sr e d u c e db ya b o u tt w oo r d e r so fm a g n i t u d e ,a n dm o s sg r a d e s h a v ei n c r e a s e da b o u t0 3t h r o u g hp e s qt e s t i n g s e c o n d l y , t i m e f r e q u e n c ya n a l y s i so fs p e e c hs i g n a lb a s e do ni m p r o v e dst r a n s f o r mi s d i s c u s s e d st r a n s f o r mi sac o m b i n a t i o no fs h o r t t i m ef o u r i e rt r a n s f o f i na n dw a v e l e tt r a n s f o r m , w h i c hh a st h ea d v a n t a g e so ft h eb o t ha n dh a sb r o a dp r o s p e c t s s e l e c tt h ea p p r o p r i a t em o t h e r w a v e l e ta c c o r d i n gt os p e e c hs i g n a lc h a r a c t e r i s t i c st oi m p r o v et h est r a n s f o r ma n di m p r o v e ds t r a n s f o r mc a nu s e dt oa n a l y z es p e e c hs i g n a la n de x t r a c tt h ep a r a m e t e r so ft h es p e e c hs i g n a l , s i m u l a t i o ne x p e r i m e n t ss h o wt h et i m e - f r e q u e n c ys t r u c t u r eo ft h ei m p r o v e dst r a n s f o r mi s f m e rc o m p a r e dw i t l ls t f ta n dw a v e l e tt r a n s f o r m f i n a l l y , t h et r a n s i e n tt i m e - f r e q u e n c ym o d e l i n go fs p e e c hs i g n a lb ym a t c h i n gp u r s u i tw i t l l aw a v e l e t - b a s e dd i c t i o n a r yi sp r o p o s e d t h ec o r ei d e ao fm a t c h i n gp u r s u i ti ss e a r c h i n gf o rt h e b e s tm a t c h i n ga t o m s ,a n da f t e rb u i l d i n gw a v e l e t - b a s e dd i c t i o n a r y 研t l ld a u b e c h i e sw a v e l e t s , m a t c h i n gp u r s u i ti su s e dt of i n dt h eb e s tw a v e l e ta t o m ,a n dt h e ns p e e c hs i g n a li sr e c o n s t r u c t e d b yas e r i e so ft h eb e s tw a v e l e ta t o m s s i m u l a t i o ne x p e r i m e n t ss h o wt h a tt h ep r o p o s e dm o d e l i sm o r ee f f e c t i v ea n ds u p e r i o rt h a nm a t c h i n gp u r s u i tw i t hs i n u s o i d a ld i c t i o n a r y k e y w o r d s :s p e e c hs i g n a l ;t i m e - f r e q u e n c ym o d e l i n g ;s i n u s o i d a lh a r m o n i cs p e c t r u mm o d e l ; w a v e l e tt r a n s f o r m ;st r a n s f o r m ;m a t c h i n gp u r s u i t i l 目录 目录 摘要i a b s t r a c t :i i 第一章绪论1 1 1 课题提出一1 1 2 国内外研究现状1 1 3 本文主要研究工作2 1 4 本文结构安排3 第二章时频分析基本理论一5 2 1 时频分析基础5 2 2 几种时频分析方法一7 2 2 1s t f t 7 2 2 2 小波变换8 2 2 3 w d 9 2 2 4m p 算法1 0 2 3 本章小结1 l 第三章基于小波变换的正弦谐波谱建模1 3 3 1 传统的正弦谐波谱建模1 3 3 1 1 正弦模型1 3 3 1 2 语音短时频谱特征1 4 3 1 3 正弦谐波谱建模1 5 3 2 小波变换的正弦谐波谱建模l8 3 2 1 小波变换的多分辨率分析1 8 3 2 2 多分辨率的正弦谐波谱建模1 9 3 3 仿真实验与结果分析2 1 3 4 本章小结2 5 第四章基于s 变换的语音信号的时频建模2 7 4 1s 变换的基本原理2 7 4 1 1 连续s 变换2 7 4 1 2 离散s 变换2 7 4 2 改进的一种广义s 变换2 8 4 2 1 母小波的函数的选取2 8 4 2 2 改进的广义s 变换算法2 9 4 3 基于改进s 变换的语音信号精细时频分析2 9 4 3 1 改进的s 变换谱2 9 4 3 2 仿真实验与结果分析3 0 目录 4 4 本章小结3 3 第五章基于小波字典m p 算法的语音信号瞬时时频建模3 5 5 1 基于正弦字典的m p 建模3 5 5 1 1 时频原子3 5 5 1 2 正弦字典。3 5 5 1 3 正弦字典m p 算法3 5 5 。2 基于小波字典的m p 算法瞬时时频建模3 7 5 3 仿真实验与结果分析3 7 5 4 本章小结4 0 第六章总结与展望4 3 6 1 总结4 3 6 2 展望4 3 致谢4 5 参考文献4 7 附录:作者在攻读硕士学位期间发表的论文5 1 n 第一章绪论 1 1 课题提出 第一章绪论 语音信号是非平稳时变信号,携带着各种信息。而语音编码、合成、识别和增强等 处理便需要提取语音信号中包含的各种信息i l 】,提取语音信号中各种信息的过程就是对 语音信号建模的过程,能够准确的提取语音信号中的各种信息是语音编码、语音识别、 语音增强、语音合成等后续处理的一个重要前提,所以研究语音信号的建模具有重大的 研究意义。 时频分析方法利用时间频率联合分布函数表示非平稳信号,可以对语音信号同时在 时域和频域进行分析,不仅能够揭示出语音信号中包含的各个频率分量,而且能够看出 各个频率分量随时间的变化过程。时频分布方法为信号建模提供一个新的框架,将各种 时频分析方法应用到语音等信号的建模当中,称为时频建模。 在各种时频分析方法中,短时f o u r i e r 变换( s h o r tt i m ef o u r i e rt r a n s f o r m ,s t f t ) 窗长 固定,其频谱分辨率和时间分辨率相互矛盾;小波变换具有自适应窗口,分辨率很高; 结合s t f t 和小波变换的优点,提出的s 变换目前在国际上得到越来越多的关注【2 】。w v d 作为一种典型的二次型时频分布具有交叉干扰项;匹配追踪( m a t c h i n gp u r s u i t ,m p ) 是 一种自适应的分解方法,不含交叉项,在图像处理、信号处理中广泛应用,是近年来的 一个研究热点【3 】。m p 因分解复杂而计算量大,因此研究m p 的快速算法,将更益于m p 算法在各行业的广泛应用。 自1 9 8 6 年,m c a u l a y 和q u a t i e r i 的正弦模型正式问世以来,就引起了大家的广泛 注意【4 】,国内外很多专家学者也致力于正弦模型的研究【5 1 1 6 1 7 1 1 8 。正弦模型简单常用、高 效,是一种为输入的信号寻找一系列正弦信号分量累加的模型,反映了信号分量的提取、 分解过程,广泛应用于语音信号处理和音频等非平稳信号处理领域,如语音增强、语音 变换、语音分离、语音压缩和语音合成等 9 1 1 1 0 1 1 1 1 1 。 除了正弦模型外,一种基于m p 的瞬时建模的模型也提出,并得到了一致好评,瞬 时模型能对语音信号的任一时刻信息建模,应用范围更加广泛,结合时频分布技术的瞬 时建模在实际应用中潜力巨大。 1 2 国内外研究现状 语音建模是语音信号处理领域重要研究课题,国内外学者对其作了大量研究工作, 并取得了很好的研究成果。1 9 8 6 年m c a u l a y 和q u a t i e r i 提出正弦模型,之后国内将正 弦模型用于汉语普通话语音分析合成,说话人转换、语音编码、音频压缩等【9 】【1 0 1 1 1 1 1 。国 外学者将其应用于音乐信号,并提出正弦+ 噪声模型5 1 。 随着时频分布的优势的体现,国内外学者尝试将时频理论应用到正弦模型中,并取 得了很好的效果。g o o d w i nm 将自适应分解用于正弦模型,使正弦模型具有了一定的多 分辨率特性 6 1 。1 9 9 6 年,国外学者提出了几种基于时频变换的正弦模型,给出了基于小 江南大学硕士学位论文 波变换、基音同步小波变换和小波包变换的时频建模的一种思路和理论雏形【7 】。2 0 0 3 年 和2 0 0 5 年国外一些学者分别对上述理论雏形进行了完善,使该种思路有了一个系统框 架【引。 2 0 0 1 年提出利用变分数阶傅里叶变换用于信号的时频建模1 1 2 】;随后,m p 方法为感 知梯度正弦建模提出一种新的框架,分析了基于m p 的正弦建模过程以及感知加权匹配 跟踪正弦建模算法,并提出了感知梯度正弦建模方法【1 3 1 ;2 0 0 6 年,国内提出采用局部化 简单的原子的线性组合对复杂信号时频域建模的参数自适应时频思想利用时间切 变g a b o r 原子对信号时频建模,g a b o r 原子加入时间切变算子,再进行时移、频移,得 到参数化的时间切变g a b o r 原子集,并给出参数估计方法,进而对非平稳信号中的线性 和非线性变频成份进行时频域的建模分析i l 训。 s 变换结合了短时傅里叶和小波变换优点,在非平稳信号处理应用上有很大优势, 目前基于s 变换的时频分析已用到地震信号、生物医学信号中【1 5 j 【16 】【1 7 1 1 1 8 】;针对语音信 号的一些自身特有的特征,选择合适的小波基函数对其进行改进,并应用到自然界大量 存在的语音信号中具有重大的研究意义。 m p 算法为正弦模型提供一个框架,形成一种时频建模方法,用各种不同幅值、频 率、相位的正弦波组成过完备原子库,然后进行语音信号自适应分解【3 】【内】。该方法适应 处理具有谐波特性的语音信号。r e y e snr 和c a n d e a sp v 提出了基于m p 算法的信号瞬 时建模,并将其用于参数音频编码,取得了很好的效果2 0 】【2 1 1 。但m p 算法分解复杂,计 算量也很大。 1 3 本文主要研究工作 考虑时频分析技术可以同时对语音信号在时域、频域进行分析的优势,将时频分析 应用于语音信号的建模。小波变换分辨率高,为语音信号分析提供一个自适应的窗口框 架,考虑将小波变换应用于语音信号正弦谐波谱模型,进行时频建模;s 变换是短时傅 里叶变换和小波变换的一个组合体,具有它们共同的优点,结合语音信号本身的特点, 选出合适的小波基函数,对传统的s 变换算法进行改进,得到一种广义的s 变换,然后 用来处理语音信号所携带的各个信息;基于正弦字典的m p 算法适合处理自然界具有谐 波分量的谐音语音信号,对不具有谐波分量的语音信号建模则需要大量的正弦原子,建 模效果不理想,提出基于小波字典的m p 算法的语音信号时频建模。 本文的主要研究工作具体包括以下几点: ( 1 ) 研究基于小波多分辨率的正弦谐波谱语音建模。正弦谐波谱模型帧长固定, 小波变换为正弦谐波谱模型提供了一种多分辨率框架,克服了帧长固定问题。小波变换 将语音信号分成一个个不同频率的子带信号,然后利用正弦谐波谱模型对各个子带进行 独立分析,最后将它们合成重建,从而实现对语音信号的时频建模。仿真实验显示,小 波多分辨率的正弦谐波谱得到的重构误差比正弦谐波谱模型约降低两个数量级,由 p e s q 测试得到的m o s 分值约提高o 3 。 ( 2 ) 介绍了s 变换基本原理。s 变换为s t f t 和小波变换的结合体,其结合了两者 2 第一苹绪论 的优点。s 变换表现为依赖频率的窗函数,含有相位因子,能对小波变换进行一个“相 位校准 ,且时间频率关系适合直观视觉分析。 ( 3 ) 研究基于改进s 变换的语音信号时频分析。针对语音信号选择合适的母小波, 对s 变换提进行改进。改进后的广义s 变换成为一种新的时频分析工具,利用其对语音 信号进行时频分析,提取语音信号的参数,仿真实验得到较精细的时频分布结构图。 ( 4 ) 研究基于小波字典的m p 算法的语音信号瞬时时频建模。正弦原子具有谐波 特性,重建具有谐音分量的语音信号所需正弦原子较少,重建非谐音分量的语音信号则 需要特别大量的正弦原子,因此它只对具有谐音分量的语音信号重构效果好。提出基于 小波字典的m p 算法采用有限个小波原子重建语音信号,首先选择d a u b e c h i e s 小波原子 组成m p 的原子字典,然后利用m p 算法将语音信号表示成若干最佳匹配的小波原子的 累加,实现语音信号重构。仿真实验对正弦字典的m p 和小波字典的m p 算法的重构误 差进行了比较,验证了后者的优越性。 1 4 本文结构安排 第一章首先介绍了课题的提出背景、语音建模和时频建模的国内外研究现状,以及 本文主要研究工作和结构的安排。 第二章概括总结时频分析的基础知识,并对一些常用的时频方法包括s t f t 、小波 变换、w i g n e r - v i l l e 分布和m p 算法进行阐述。 第三章首先介绍了传统的正弦模型概念以及短时频谱的特征和正弦谐波谱模型,阐 述了正弦谐波谱模型对语音信号的重建过程,然后提出基于小波变换的语音信号正弦谐 波谱建模方法,将语音信号通过小波变换分解成多分辨率的若干个子带语音信号,利用 正弦谐波谱模型对这些子带语音信号进行独立建模,最后将建模后的各个子带语音信号 进行相加合成。 第四章介绍了s 变换方法,结合语音信号,选择合适的小波的基函数,提出改进的 一种s 变换方法,并应用于语音信号时频分析。 第五章首先介绍了基于正弦字典的的基本原理,正弦字典仅对具有谐波特性的语音 信号建模效果良好,然后提出基于小波字典的m p 算法,并选择d a u b e c h i e s 小波原子组 成过完备原子库。最后利用m p 算法在小波字典中寻找与语音信号最佳匹配的一系列小 波原子,从而实现对语音信号的瞬时建模。 第六章首先对本文介绍的内容方法和主要研究工作进行了总结,并对以后的研究工 作进行了展望。 3 江南大学硕士学位论文 4 第二章时频分析基本理论 第二章时频分析基本理论 本章首先介绍时频分析的基础知识,然后对几种常用的时频表示方法:s t f t 、小 波变换、w i g n e r - v i l l e 分布和m p 进行阐述。 2 1 时频分析基础 从数学角度上来看,在函数空间任意完备正交集上展开信号便可以获得信号的不同 表示。关于信号分解的方法有很多种,大体分为正交分解和非正交分解两类,也可以分 为固定基分解和自适应分解两类。信号分解在很大程度上影响时频分析,在一定程度上 决定了时频分析方法的优劣,信号分解可以更好地帮助理解信号的特征,是信号处理领 域的基本方法,也是信号分析技术的起点。 设信号x ( r ) 是t 维空间x 中的一个元素,且j 由一组向量仍,仍,仍张成,即 仇,经,仍。这组向量馈,仍,仍可能线性相关,也可能线性无关。若线性无关, 则称它们是空间x 中的一组“基 ,若同时仍,仍,仍两两正交,则称之为空间x 中 的一组“正交基 。常用的正交的函数集的基本函数有很多种,比如沃尔什函数、正弦 函数和贝塞尔函数等。 和有无数组的t 个线性无关的向量一样,在一个t 维空间中同样可以找到无穷多个 分解基。而选择一个好的分解基需要考虑完备性、正交性和局部性等几个因素: ( 1 ) 完备性:能够分解一种类型信号的所有。 ( 2 ) 正交性:有好的线性无关,能够避免分解的冗余。 ( 3 ) 相似性:与待分析信号的固有特征相似或相近 ( 4 ) 局部性:具备良好的能量集中性能。 当然,上述四个因素很难全部得到满足,即便是经典的f o u r i e r 分析方法,所具有 的基函数也只能是很好地具有正交性与完备性两个因素。 设语音实信号x ( f ) ,将其转变成复信号的形式z ( r ) ,称为解析信号,定义为 zo)=xo)+jyo)(21) 其中y ( r ) 为一添加的“虚信号”。 若将解析信号写成极坐标的形式: z ( f ) = a ( t ) e 7 ,( ( 2 2 ) 则解析信号的瞬时幅值口( f ) 和瞬时相位矽( f ) 分别表示为 z ( f ) = x 2 ( f ) + y 2 0 )( 2 3 ) 和 : 。婴(2arctant 4 )矽( f ) = 掣 ( 4 ) l x v jj 解析信号过滤掉实信号中的负频率部分,不会带来虚假的信息,也不会造成信息损失。 ( 1 ) 瞬时频率和群延迟 5 江南大学硕士学位论文 在语音信号等这样的非平稳信号分析中,一些瞬时的物理量能更准确的表示信号, 起着重要作用。瞬时频率和群延迟就是这样的物理量。 定义相位函数对时间的导数为瞬时频率,即 f ( t ) = 万1 掣a t ( 2 5 ) z 万 可以证明,瞬时频率的时间平均和非平稳信号谱的平均频率相等。 解析信号的频域信号z ( f ) 的群延i gg ( f ) 表示频率分量为厂的延迟: 彬卜瓦1 警 ( 2 6 ) 对应的离散信号的群延迟定义为: g ( 后) = 二l 眵( 后+ 1 ) 一矽( 七一1 ) 】 ( 2 7 ) ( 2 ) 时间分辨率、频率分辨率以及不确定原理 非平稳信号的处理,往往需要窗函数,窗函数的选择对提高时间分辨率、频率分辨 率起着关键性的作用。 时间分辨率:语音信号x ( f ) ,其能量的密度函数记作l x ( f ) 1 2 ,在a t 内的能量为 i x ( f ) 1 2 a t ,则信号总能量e : e = m l a r t ( 2 8 ) 由式( 2 8 ) 可以得出任意时刻的能量密度,也就是说,信号的时间函数具有无限的时 间分辨率,而频率分辨率却为零【2 2 1 。 频率分辨率:对频谱为x ( f ) 的非平稳信号,能量密度函数记作i x ( 厂) 1 2 ,在a f 内的 能量为i x ( 厂) 1 2 矽,信号总能量: e = i ( 厂) 1 2 a f ( 2 9 ) 由式( 2 9 ) n - i 以得出任意频率的能量密度【2 2 1 。信号的频率函数具有无限的频率分辨 率,时间分辨率为零。 不确定性原理:对于有限能量的任意信号,其时宽和频宽的乘积总是满足下面不等 式: 址矽1 4 兀 【2 1 0 ) 其中,a t ,a f 为时间分辨率和频率分辨率口2 1 。不确定性原理又称h e i s e n b e r g 不等 式,由( 2 1 0 ) 式可以看出,信号的时宽和带宽不可能同时有限。其重要意义在于不存在 同时拥有任意小的时宽和频宽的窗函数,当窗函数为高斯窗时,( 2 1 0 ) 式可能取到等号。 两个极端的例子是:冲激信号的时宽为0 ,带宽为0 0 ;单位直流信号的时宽为o o ,带宽 为0 。 对解析信号z ( ,) 进行时频分析,首先要设计时频分布的时间和频率的联合分布函数 6 第二章时频分析基本理论 p ( t ,f ) ,它也是在时间f 和频率厂的能量密度函数,可表示出单位时间、单位频率的能 量,令为在f ,厂时频点处,时间频率网格,矽内的能量,则有 p ( t ,f ) a t a f = 易 ( 2 1 1 ) 定义非平稳信号伫( r ) 的时变自相关函数为r ,( f ,f ) ,因计算r ,( ,r ) 过程中作了滑窗 处理,所以r ,( f ,f ) 也被称为局部相关函数,对r ,( f ,f ) 做f o u r i e r 变换,就可得到能量时 频分布,即 p ( t ,厂) = f :r ,o ,f ) p 一2 珂d f ( 2 1 2 ) 这表示,取不同的局部相关函数就能得到不同的时频分布【2 3 1 。 时频分析性质要求:利用时频分析方法对非平稳信号实际分析,一般要求具有表示 能量分布特性,希望满足以下一些性质【2 3 j : 性质1 :时频分布是非负的 性质2 :关于时间和频率的积分应给出信号总能量层,即 ll p ( ,f ) d t d f = e ( 2 1 3 ) 性质3 :边缘特性 fp ( t ,f ) d t = l z c s ) 1 2 (214)dt z ( s ) l 1 4 ) , = i ( 2 fp ( t ,f ) d f = f z ( t ) 1 2 ( 2 。1 5 ) , = f ( 2 。1 5 ) d - a o 性质4 :时频分布一阶矩得到瞬时频率和群延迟 性质5 :有限支撑,信号只在某个时间区间取非零值,且信号的频谱只在某个频谱 区间取非零值,利用任何一种时频分布非平稳信号进行分析,都希望时频平面上具有高 聚焦性 交叉项:在二次型时频分布或双线性时频分布中存在,来源于不同信号分量之间的 交叉作用,是干扰产物。抑制交叉项是使用二次型或双线性时频分布的首要工作。 2 2 几种时频分析方法 现实生活中的很多信号如说话人的声音信号,演奏音乐的音乐信号等是非平稳信 号,仅仅关心信号单纯随时间或频率的变化情况是不够的,此时需要同时考虑信号在时 间和频率上发生的变化,因此时频分析方法便得到了广泛的应用。 时频分析方法主要分为线性时频分析和二次型时频分析两大类。线性时频分析由傅 里叶变换演变而来,满足线性可加条件,常用的包括s t f t 、g a b o r 变换和小波变换:二 次型时频分析由功率谱或能量谱演变而来,不满足线性可加条件,典型代表有 w i g n e r - v i l l e 分布( w i g n e r - v i l l ed i s t r i b u t i o n ,w v d ) 等c o h e n 类时频分布。本节分别对 s t f t 、小波变换、w v d 和m p 四种方法进行介绍。 2 2 1s t f t 1 9 4 6 年g a b o r 提出s t f t ,其本质是对f o u r i e r 变换加窗,通过窗滑动,形成一种时 7 江南大学硕士学位论文 频表示。设非平稳信号x ( f ) l 2 ( r ) ,则它的s t f t 为 s 砑l ( r ,厂) = lx ( r ) h ( r - t ) e - j 2 硝7 d r ( 2 16 ) 窗函数办( f ) 的时移、频移使s t f t 具有了局域特性。能量密度谱为 s p e c ,( t ,f ) = l s t f t ,( t ,利 ( 2 1 7 ) 反映了动态时频谱能量分布。 在s t f t 中,窗函数选定后,时频窗与时间和频率无关,其时频分析的能力通过时 频窗形状、面积度量。一般来说,面积越小,局部化描述时频能力越强,反之,越弱。 由( 2 1 6 ) 式不难看出,选择合适的窗函数对提高s t f t 的性能有重大意义。因为要提 高s t f t 的时间分辨率,那么窗的宽度要尽可能长;而要提高s t f t 频率分辨率,窗宽 度必须要尽可能短,同时由不确定性原理可知,时间分辨率、频率分辨率乘积受到定值 限制,时间分辨率和频率分辨率是一对矛盾体。在对非平稳信号的实际分析时,s t f t 在选择窗函数时必须在时域和频域的矛盾中取折中。 s t f t 能够描述局部时间段频率信息,但时域和频域分辨率不随时间、频率变化。 对非平稳信号而言,希望做到对以高频信息为主的某一段用短时间窗,对以低频信息为 主的某一段用长时间窗。所以对时变的非平稳信号,s t f t 很难找到合适的时间窗口去 适应不同时间段1 2 2 。 2 2 2 小波变换 设函数x ( t ) r ( r ) ,i a ( f ) 称为小波的基函数,则小波变换定义为, b 呱( 啪) = 川o ) d r = m ) 旁( 等) d r ,口 o ( 2 1 8 ) 小波变换本质上是将一维信号映射到( 口,6 ) 平面,在( 2 1 8 ) 式中,小波的基函数j ( f ) 有多种选择,如正交小波、非正交小波、双正交小波等,在处理各种非平稳信号时,应 分析各种信号特点选择合适的小波基。 为更清楚直观的说明小波变换的时频特性,定义厶为中心频率,令口= t o f ,b = t , 带入( 2 1 8 ) 式,得 哪以力。南“力纵砉。叫”办 q j 小波变换可以看做小波基在频域中心频率厶的带通滤波器通过平移得到的带通滤 波器组。小波变换在时域和频域都能够表征信号局部特征,是一种时域窗和频域窗都可 以改变的时频分析方法。改变尺度参数,中心频率发生平移,进而对低频率信号进行分 析。不断改变中心频率,使小波变换可以对不同频率的信号进行分析,从而达到逐渐精 细的目的【2 4 1 。多分辨率与滤波器组结合,这丰富了小波变换的理论基础,也使小波变 换的应用范围变广。 小波变换具有多分辨率( 多尺度) 特性,通过选择平移因子b 和尺度因子a 两个参数 可以得到一个伸缩窗,根据实际情况可以对伸缩窗的窗长进行实时调节,若处理某段低 8 笙三皇堕塑坌堑苎奎里笙 频信息,则调宽时间窗:反之,处理高频信息,则缩窄时间窗。小波变换具有自适应性, 通过伸缩和平移等运算,可以对信号进行多尺度的细化分析,解决了s t f t 不能解决的 许多困难问题。 小波变换方法虽然克服了s t f t 的缺点,但也有其自身的缺陷。首先,利用小波变 换对非平稳信号分析所得到的信号谱图虽是其时频表示,但时间尺度关系却不适合视 觉的直观分析;其次,当小波变换的基函数选定之后,在分析非平稳信号的整个过程中 小波的基函数不能进行随意的更改,选定的小波的基函数在全局分析的效果可能很好, 但在信号某个局域的分析效果可能并不理想;再者,在实际应用或理论中,对选择小波 的基函数,还没有什么原则和判据,所以小波的基函数的选用是一个难点问题。目前, 在实际应用和理论中,常常是通过不断的试验,然后比照分析不同的试验结果后选择较 优的小波的基函数【2 2 1 2 4 1 。 2 2 3 、v v d w v d 是一种最典型、最常用的二次型时频分布,具有较高的分辨率,是分析非平 稳信号的一种有力工具。 对于连续时间语音信号x ( t ) ,设其解析信号为z ( f ) ,z ( r ) 是其共轭,则w v d 的定 义 w v d :( f ,) = z ( 卜吾) z ( f + 2 ) e - j 2 珂d f ( 2 2 0 ) w v d 用频谱表示 :( f ,厂) = 一冬) z + ( 厂+ 冬) e - j 2 厢? d y w v d z ( fd y( 2 2 1 ) :( f ,厂) = i 一冬) z + ( 厂+ 冬) ( 2 ) 从( 2 2 0 ) 和( 2 2 1 ) 式不难看出w v d 具有明确物理意义,是信号能量在时域和频域的 分布。解析信号z ( f ) 虽然含有复值,但w v d 对所有的时间值和频率值都是实的。同时 由时频边缘特性得出,w v d 在整个时频平面会出现负值。 w v d 也可看做s 1 f t 以z ( o ) 为窗函数,时间轴和频率轴分别压缩两倍,然后再乘 以相位因子及幅度因子。自身作为窗函数对信号分析具有自适应匹配效果,所以w v d 的分辨率明显高于s t f t 2 5 1 ,一定意义上解决了s t f t 存在的问题。 w v d 处理多分量信号时含有线性时频分布所没有的交叉项干扰的问题。w v d 作为 一种二次型时频分布,不满足线性叠加定理,但却满足时频分布的二次叠加原理【2 3 】。 令 z ( t ) = a l z l ( ,) + a 2 2 2 ( f )( 2 2 2 ) 则二次叠加原理 e z ( t ,门= i 口。1 2 只。( f ,) + l 口2 1 2 只:o ,厂) + 口,口;e ,刀( f ,厂) + 口:口? :,:。( f ,厂) ( 2 2 3 ) 在( 2 2 3 ) 式中,a 2 口:e :一( r ,厂) 和口。口;。以o ,厂) 表示交叉项,即“虚假信息,是不同分 量信号之间的交叉作用。 w v d 的交叉干扰项比较严重,会造成时频分辨率模糊,时频可读性降低,影响对 9 江南大学硕士学位论文 时频特征的提取干扰对信号分量的正确判断和对伪信号的错误判断。所以抑制交叉项便 是w v d 重点考虑的问题。 2 2 4m p 算法 m a l l a ts ,z h a n gz 提出的m p 核心是迭代贪心算法【3 l 用组合优化方法对信号稀疏 表示,从过完备原子库( 也称字典) 选择合适的若干向量,线性加权逼近信号,其研究 重点是怎样从过完备原子库中选择合适的向量。 设有限维h i l b e r t 空间为h ,空间h 中过完备字典为d ,d 中有x 个原子,原子为如, 则d = 秘z ) ,z = o ,1 ,2 x - 1 ,的范数为k l = 1 。 设输入信号x ( n ) 在空间h ,将正交投影到过完备原子库d 中,选择最接近信号x 研) 的原子作为合适原子j z 。,将输入信号分解成与s z 。相同方向和垂直方向的向量叠加2 叼 x ( n ) = s z o + e a ( n ) ( 2 2 4 ) r x ( n ) 是分解残差信号, 是向量内积,构成s z o 的展开系数。r x ( n ) 是x ( 力) 投 影后的残余向量,因此s z 。和r x ( n ) 正交,由勾股定理 0 x ( 胛) 0 2 = l 1 2 + l e g ( 行) 1 1 2 ( 2 2 5 ) 要使残差最小, 要尽可能的取大 l i = s u p l i ( 2 2 6 ) m p 迭代算法对于残差信号戤(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全检查巡查准则
- 2026西北大学招聘150人备考题库附答案详解
- 2026恒安标准人寿保险有限公司天津分公司招聘备考题库及答案详解1套
- 2026江苏南京大学YJ20260647教育研究院特任副研究员招聘1人备考题库及一套完整答案详解
- 2026贵州省纺织产业发展集团有限责任公司度选聘职业经理人5人备考题库及一套完整答案详解
- 2026中国传媒大学第二批教学科研岗招聘13人备考题库参考答案详解
- 2026四川德阳市罗江区就业创业促进中心城镇公益性岗位招聘2人备考题库(区人社局)完整参考答案详解
- 2026春人教版数学一年级下册期末复习重点必练易错专项练习卷附参考答案
- 2026中核八二一广元运业有限公司海南分公司招聘4人备考题库及一套答案详解
- 2026广东中山市西区聚星学校秋季学期教师招聘24人备考题库及答案详解1套
- 河南省南阳市高中毕业生登记表普通高中学生学籍册
- 快递公司安全生产岗位责任制
- 2026国家广播电视总局直属事业单位招聘(166人)笔试模拟试题及答案解析
- 2025-2030中国压缩空气储能行业营销创新及项目投资专项咨询研究报告
- GA 1817.1-2026学校反恐怖防范要求第1部分:普通高等学校
- 2026年大豆花生提质固氮绿色增产ARC生物耦合技术应用指南
- 2026湖北水利发展集团有限公司财务专业人员招聘13人考试参考题库及答案解析
- 【单元卷】教科版(2024)小学一年级科学下册第二单元 常见的动物(含答案与解析)
- 首都机场航空器活动区机动车驾驶证考试试题与答案
- 2025-2026学年小学数学(人教版)六年级上学期期末模拟试题及答案(共5套)
- 2026年高考全国二卷语文真题试卷含答案
评论
0/150
提交评论