第四章短时傅里叶变换ppt课件_第1页
第四章短时傅里叶变换ppt课件_第2页
第四章短时傅里叶变换ppt课件_第3页
第四章短时傅里叶变换ppt课件_第4页
第四章短时傅里叶变换ppt课件_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,4.1 概述,2,语音的生成模型由线性系统组成,系统输出的傅里叶频谱反映了激励与声道频率响应特性。 语音信号的频谱具有非常明显的语音声学意义,可以获得某些重要的语音特征,如共振峰频率和带宽等。 话音波是一个非平稳过程,标准傅里叶变换不能用来直接表示语音信号。 由于语音信号的特性是随时间缓慢变化的,因而可以假设它在一短段时间内保持不变。短时分析应用于频域分析就是短时傅里叶变换,即有限长度的傅里叶变换。 短时傅里叶变换可以精确地恢复语音波形。短时傅里叶变换最重要的应用是语音分析-合成系统,3,短时幅度谱的计算过程,4.2.1 短时(加窗)傅立叶变换的定义,4,4.2.1 短时傅立叶变换-定义,

2、定义:短时傅立叶变换也叫短时谱(加窗的方式) 短时谱的特点: 1)时变性:既是角频率的函数又是时间n的函数 2)周期性:是关于的周期函数,周期为2,5,短时傅里叶变换是窗选语音信号的标准傅里叶变换。下标n区别于标准的傅里叶变换。w(n-m)是窗口函数序列。不同的窗口函数序列,将得到不同的傅里叶变换的结果。 短时傅里叶变换有两个自变量:n和,所以它既是关于时间n的离散函数,又是关于角频率的连续函数。 与离散时间序列傅里叶变换和连续傅里叶变换的关系一样,若令2k/N,则得离散频率的短时傅里叶变换,它实际上是在频域的取样,4.2.1 短时傅立叶变换-定义,6,这两个公式都有两种解释: 当n固定不变时

3、,它们是序列w(n-m)x(m) (-m)的标准傅里叶变换或标准的离散时间序列的傅里叶变换。此时与标准傅里叶变换具有相同的性质,而Xn(k)与标准的离散傅里叶变换具有相同的特性。 当或k固定时,和Xn(k)看做是时间n的函数。它们是信号序列和窗口函数序列的卷积,此时窗口的作用相当于一个滤波器,4.2.1 短时傅立叶变换-定义,7,4.2.1 短时傅立叶变换-定义,频率分辨率f、取样周期T、加窗宽度N三者关系: 窗形状对短时傅立叶变换的影响 矩形窗主瓣窄,衰减慢; 汉明窗主瓣宽,衰减快; 窗宽对短时频谱的影响 窗宽长频率分辨率高,能看到频谱快变化; 窗宽短频率分辨率低,看不到频谱的快变化,8,4

4、.2.2 短时傅立叶变换-标准傅里叶变换的解释(n固定,的函数,短时傅里叶变换可写为 当n取不同值时窗w(n-m)沿着x(m)序列滑动,所以w(n-m)是一个“滑动的”窗口。 由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。与序列的傅里叶变换相同,短时傅里叶变换随着作周期变化,周期为2,9,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,10,根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系 式中*表示复共轭运算。同时功率谱是短时自相关函数 的傅里叶变换。 下面将短时傅里叶变换写为另一种形式。设信号序列和窗口序列的标准傅里叶变换为 均存在。当n取固定值时,w(n-m

5、)的傅里叶变换为,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,11,如果 被看成是w(n-m)x(m)序列的标准傅里叶变换,同时假设x(m)及w(m)的标准傅里叶变换存在,为: 当n固定时,序列w(n-m)的傅里叶变换为,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,12,根据傅里叶变换的频域卷积定理,有,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,语音信号x(n)的标准傅里叶变换,移动窗口的标准傅里叶变换,短时傅里叶变换,13,写成卷积积分形式: 将改换为-后,可以写成,可见,为了使 能够充分地表现 的特性,要求对于 来说, 必须是一个冲激脉冲,14,用波形乘以窗函数,不仅为

6、了在窗口边缘两端不引起急剧变化,使波形缓慢降为零,而且还相当于对信号谱与窗函数的傅里叶变换进行卷积,采样。 为此窗函数应具有如下特性: 频率分辨率高,即主瓣狭窄、尖锐;(矩形窗) 通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣衰减大。(海明窗) 这两个要求实际上相互矛盾,不能同时满足。 窗口宽度N、取样周期T和频率分辨率f之间存在下列关系f1/NT 可见二者是矛盾的。 窗口宽度频率分辨率 时间分辨率 窗口宽度频率分辨率 时间分辨率,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,15,第一个零点位置为2k/N,显然它与窗口宽度成反比。 矩形窗,虽然频率分辨率很高,但由于第一旁瓣的衰减只有1

7、3.2dB,所以不适合用于频谱成分动态范围很宽的语音分析中。 海明窗在频率范围中的分辨率较高,而且由于旁瓣的衰减大于42dB,具有频谱泄漏少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。 汉宁窗是高次旁瓣低,第一旁瓣衰减只有30dB。 对语音波形乘以海明窗,压缩了接近窗两端的部分波形,等效于用作分析的区间缩短40%左右,因此,频率分辨率下降40%左右。所以,即使在基音周期性明显的浊音频谱分析中,乘以合适的窗函数,也能抑制基音周期与分析区间的相对相位关系的变动影响,从而得到稳定的频谱。因为乘以窗函数将导致分帧区间缩短,所以为跟踪随时间变化的频谱,要求相邻帧之间一部分区域重叠,4.2.2

8、短时傅立叶变换-标准傅里叶变换的解释,16,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,总结: 以上分析可知,窗傅立叶变换W(ej)很重要。为使Xn(ej)忠实再现X (ej)的特性, W(ej) 相对于X (ej)来说必须是一个冲激函数。 N越大, W(ej)的主瓣越窄,则Xn(ej)越接近于X (ej) 。 当N时, Xn(ej) X (ej) 。 但是N值太大时,信号的分帧已失去了意义。尤其是N值大于语音的音素长度时, Xn(ej)已不能反映该语音音素的频谱了。因此,应折衷选择窗宽N,17,其中图(a)是海明窗的窗选信号,图(b)是其对数功率谱;图 (c)是矩形窗下的窗选信号,图(

9、d)是其对数功率谱。 从图 (a)可以明显看出时间波形的周期性,此周期性同样在图(b)中表现出来。图中基频及其谐波在频谱中表现为等频率间隔的窄峰。图(b)中的频谱大约在300400Hz附近有较强的第一共振峰,而约在2000Hz附近有一个对应于第二、三共振峰的宽峰。此外,还能在3 800Hz附近看到第四个共振峰。最后,由于声门脉冲谱的高频衰减特性,频谱在高频部分表现出下降的趋势,给出了N500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,18,图4-3给出了N50的比较结果(窗口持续时间为5ms)。 由于窗口很短

10、,因而时间序列(图(a)和(c)及信号频谱(图(b)和(d)均不能反映信号的周期性。 与图4-2相反,图4-3只大约在400、1400及2200Hz 频率上有少量较宽的峰值。它们与窗内语音段的前三个共振峰相对应。比较图4-3(b)及(d)的频谱后,再次表明矩形窗可以得到较高的频率分辨率,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,19,结论: 窗口宽度与短时傅里叶变换特性之间的关系 用窄窗可得到好的时间分辨率 用宽窗可以得到好的频率分辨率。 但由于采用窗的目的是要限制分析的时间以使其中波形的特性相对稳定没有显著变化,因而要折衷考虑,4.2.2 短时傅立叶变换-标准傅里叶变换的解释,20,

11、w(n) -一个滤波器的单位函数响应 -该滤波器的输出 x(n)-滤波器的输入 过程:调制+滤波,4.2.3 短时傅立叶变换-滤波器的解释一(固定,n变化,图4-4 短时傅里叶变换滤波器解释的第一种形式(a)复数运算,21,w(n,w(n)是窄带低通滤波器,将x(n)的频谱向左搬移了 ,或等效将 频率上的频谱搬移到了零频率处。因此为使输出端有,w(n)是窄带低通滤波器,22,23,4.2.3 短时傅立叶变换-滤波器的解释二(分解为实虚部,图4-4 短时傅里叶变换滤波器解释的第一种形式 (b)只有实数运算,24,令m=n-m,4.2.3 短时傅立叶变换-滤波器的解释三,25,为窄带低通滤波器。第

12、一种形式为低通滤波器; 由于第二种形式中的滤波器单位函数响应为 ,所以它为带通滤波器,4.2.3 短时傅立叶变换-滤波器的解释,26,如果将w(n)的滤波运算除外,短时傅里叶变换实际上是信号对复数频率的幅度调制。 第一种形式是在输入端进行调制,x(n)乘以 相当于将x(n)的频谱从移到零频处;而w(n)(直角窗或海明窗等)为窄带低通滤波器。 后一种形式是在输出端进行调制,此时先对信号进行带通滤波,滤波器的单位函数响应为w(n) ,而调制后输出的是短时谱中心频率为的数值,4.2.3 短时傅立叶变换-滤波器的解释,27,恢复出x(n)的过程称为短时傅里叶反变换,是由短时谱合成语音信号的问题 由于

13、是n和的二维函数,因而必须对在所涉及的两个变量,即时域及频域内进行取样,取样率的选取应保证 不产生混叠失真,从而能够恢复原始语音信号x(n,4.3 短时傅立叶变换的取样率,28,当为固定值时, 是一个单位函数响应为w(n)的低通滤波器的输出。设低通滤波器的带宽为BHz,则 具有与窗相同的带宽。根据取样定理, 的取样率至少为2B才不致混叠。 低通滤波器的带宽由w(n)的傅里叶变换 的第一个零点位置01决定,因而B值取决于窗的形状与长度。,4.3 短时傅立叶变换的取样率-时间取样率,29,4.3 短时傅立叶变换的取样率-时间取样率,正弦序列的表达式为 幅值A、初相的含义与模拟正弦信号相同 正弦序列

14、的数字角频率0的含义与一般模拟信号模拟角频率0的概念不同。 离散信号定义的时间为kTs,显然有0 =0 Ts,模拟角频率0的单位是rad/s, 数字角频0的单位为rad/s s = rad。0表示相邻两个样值间弧度的变化量。 书上的0用直接表示,30,以直角窗和海明窗为例,其第一个零点位置分别为 2/N和4/N 数字角频率与模拟频率F之间的关系为 (其中T是信号取样周期,fs是取样率),因而用模拟频率表示的 的带宽为,4.3 短时傅立叶变换的取样率-时间取样率,若使用哈明窗, 的近似带宽为,31,4.3 短时傅立叶变换的取样率-频率取样率,当n为固定值时,Xn(ej)为序列x(n)w(n-m)

15、的傅里叶变换。为了用数字方法得到x(n),必须对Xn(ej)进行频域的取样。由于Xn(ej)是关于的周期为2的周期函数,因而只需在2范围内等间隔地取样。设取样点数为L,则各取样频率值为 k = 2k / L (k =0,1,L -1) 这里L即为取样频率。上式的含义为在单位圆内至少取L个均匀分布的频率,在这些频率上求出相应的Xn(ejk)值。这些频率取样经过反傅里叶变换IDFT恢复出来的时间信号应该是x(n)w(n-m)进行周期延拓的结果,延拓周期为L = 2k /k 。 为了使恢复的时域信号不产生混叠失真,L值需要大于或等于信号长度N,即02范围内取样至少应有N个采样点,在正常情况下取L=N

16、,32,4.3 短时傅立叶变换的取样率-总取样率,总取样率SR为时域取样率和频域取样率的乘积,即 当L=N时,直用窗时,SR2fs,而海明窗时SR 4fs,即短时谱表示所要求的取样率比原信号本身时域的取样率fs要高2或4倍。 在大多数实际窗中,B 可以表示为fs /N的倍数,即 其中,k是比例常数,所以SR= 2kfsL/N 2kfsN/N=2kfs ,即SRmin=2kfs 与一般取样频率相比即得到的“过速率采样比”为 SRmin/fs=2k 。如海明窗为4,33,4.3 短时傅立叶变换的取样率-总取样率,虽然推导出的取样率在理论上是信号的最小取样率,但存在一些例外,此时 可以在时间或频率域

17、内欠速率取样,而x(n)仍能准确地恢复。 而增加或减少采样率的问题在语音信号处理中是常见的。某些实际系统致力于使存储量(或传输比特率)为最小,此时欠采样具有实际的重要意义,如通道声码器就是据此压缩传输码率的。 例如,当窗口宽度很大时,B很小,低通滤波器带宽很窄。因此当w为固定值时,只需取一个Xn(ejw)即可代表wk时的Xn(ejwk) 谱值;声码器只需传送一个参数码。对所有频率(k0,1,L - 1)只需传送L个谱值(通常,L值为1016)就可以代表x(m)w(n - m)的频率,即可恢复有良好质量的语音了,34,4.4 语音信号的短时综合-滤波器组求和法,对于某个频率k,如果已知Xn(ej

18、),则由,若令,则,得,35,4.4 语音信号的短时综合-滤波器组求和法,hk(n)是一个带通滤波器,其中心频率为k。yk(n)是第k个滤波器hk(n)的输出,36,式(4.28)的图形解释,37,定义 (4.28) 可得 (4.28) 可见, 是一个冲激响应为 的带通滤波器的输出,其中心频率为,38,39,带通滤波器的频率响应为 上式用图4.7(b)表示,中心频率为 ,带宽为 ,假定所有通道都使用了相同的窗函数,即,4.32,4.32,40,41,考虑整个带通滤波器组时,其中每个带通滤波器具有相同的输入,其输出相加在一起,如图4.8所示,输出为y(n),输入为x( n ),整个系统的复合频率

19、响应为 (4.33,42,如果 在频率域上正确抽样(NL,L为窗宽),可以证明对于所有都满足 (4.37) 作业:证明(4.37),提示:使用傅里叶变换定义,43,4.37) 代入 (4.33)可得 (4.38,所以复合系统的冲激响应为,4.39,所以用滤波器组相加法恢复的信号可以表示为,44,4.4 语音信号的短时综合-滤波器组求和法,45,4.4 语音信号的短时综合-滤波器组求和法,LN时,y(n)正比于x(n)且与窗口w(n)的形状无关,LN时,通过合理地选取窗函数,也可以使y(n)得以精确地恢复,46,在实际的实现过程中, Xn(ejk)由于仅有与窗口相同的带宽,所以传输或存储时的取样

20、率可大大降低。即在第k个通道上每输入Dk个抽样计算一次,此时图4-6就变为图4-8。图中,在分析输出后加上抽取器并在综合输入端加上插入器后, Xn(ejk)的取样率降低了Dk倍。 即取样器在每Dk个取样中删去Dk - 1个取样,或等效为每隔Dk个取样值计算一次。 而插值是在降低速率后的每个取样之间填充Dk - 1个零值,然后再用一个合适的低通滤波器滤波,47,4.4 短时综合的滤波器组相加法的MATLAB程序实现,程序filterbank1.m对应于图4.6中的(b)图,先调制后滤波,实现流程图见图4.10。 图4.6中的(b)图,48,分析,综合,传输、存储、处理加工,49,50,程序fil

21、terbank2.m对应于图4.6中的(a)图,先滤波后调制,实现流程图见图4.12,程序运行结果见图4.13。 图4.6中的(a)图,51,分析,综合,传输、存储、处理加工,52,53,4.4 语音信号的短时综合-快速傅里叶变换求和法,Xn(ej)可看作序列x(m)w(n-m)的标准傅叶变换。为实现反变换,可将Xn(ej)进行频域取样,即令wk=2k/L(k0,1,L - 1),则有,若以n为参量,将 Xn(ej)在各 wk的值用离散傅里叶反变换的方法求得各n时刻的序列值,然后再除以窗口长度而得到x(n)。但是这种方法由于 Xn(ej)采用了时域欠速率取样而极易产生混叠,54,4.4 语音信

22、号的短时综合-快速傅里叶变换求和法,假设在时间域上用周期为R抽样速率对Xn(ej)取样,则可令,上式中r为整数。用各个,可求出其离散傅里叶反变换yr(n,显然yr(n)=x(m)w(n-m)n=rR = x(n)w(rR - n,55,由上式可见,y(n)仍是x(n)与w(n)的卷积和,只是其中每隔R个样值参与一次运算,对r求和,得(4-49,设RN4,则n取不同值时有,56,57,58,式中,W(ej0)/R为常系数。上面只是证明了y(n)正比于x(n),实际上求y(n)时仍要用,不难证明,如果w(n)的傅立叶变换频带受限,同时设Xn(ejk)在时间上被正确取样,即R选得足够小以避免混叠,则

23、不论n为何值均满足,4-52,因此式(4-50)变为,4-53,即先将Xn(ej)在频域上离散化为Xn(ejk) ,再对其进行周期为R的取样,得到,再由上式用快速傅立叶反变换求出yr(n),最后在长度为N的范围内对r求和后得到y(n,59,滤波器组求和法与快速傅立叶变换求和法之间存在着对偶性,即一个与频率取样有关,而另一个却与时间取样有关。滤波器组求和法所要求的频率取样率应能使窗变换满足下面的关系,而快速傅立叶变换求和法要求时间取样应选得使窗满足以下关系,4-54a)与(4-54b)具有对偶关系。 而当Xn(ej)发生变形时(例如传输过程中有噪声,相当于增加一项 En(ej)),滤波器组求和法

24、将比较优越,因为它对噪声的敏感性较小,4-54a,4-54b,60,61,下面给出短时综合的叠接相加法的MATLAB程序实现的运行结果,62,语音的时域分析和频域分析是语音分析的两种重要方法。 这两种方法均有局限性: 时域分析对语音信号的频率特性没有直观的了解; 频域特性中又没有语音信号随时间的变化关系。 时间依赖于傅里叶分析的显示图形称为语谱图。 语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优点,明显地显示出语音频谱随时间的变化情况,4.5 语谱图,63,语谱图实际上是一种动态的频谱。 语谱图的纵轴为频率,横轴为时间。任一给定频率成分在给定时刻的强弱用点的黑白度

25、来表示,频谱值大则记录得浓黑一些,反之则浅淡一些。 用语谱图分析语音又称为语谱分析,记录语谱图的仪器就是语谱仪。 语谱仪实际上是使一个带通滤滤器的中心频率发生连续变化,来进行语音的频率分析。 带通滤波器有两种带宽:窄带为45 Hz,宽带为300 Hz。窄带语谱图有良好的频率分辨率及较差的时间分辨率;而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。 窄带语谱图中的时间座标方向表示的是基音及其各次谐波;而宽带语谱图给出语音的共振峰频率及清辅音的能量汇集区;这里,共振峰呈现为黑色的条纹,4.5 语谱图,64,所有元音的特征都是强度变化的规则的垂直条纹。 条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音周期。 条纹越密表示基音频率越高,例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论