语音信号处理第4讲_第1页
语音信号处理第4讲_第2页
语音信号处理第4讲_第3页
语音信号处理第4讲_第4页
语音信号处理第4讲_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4.1概述4.2语音分帧4.3语音信号的时域分析4.4语音信号的频域分析语音信号分析语音信号分析 语音信号处理的前提和基础,只有分析出可表示语音信语音信号处理的前提和基础,只有分析出可表示语音信号特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成号特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。和语音识别等处理。贯穿于语音分析全过程的是贯穿于语音分析全过程的是“短时分析技术短时分析技术” 语音信号从整体来看其特征及表征其本质特征的参数均是随时间而语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变化的,所以它是一个变化的,所以它是一个非平衡态过程

2、非平衡态过程,不能用处理平衡信号的数字信号,不能用处理平衡信号的数字信号处理技术对其进行分析处理。处理技术对其进行分析处理。 但是在一个短时间范围内(一般认为在但是在一个短时间范围内(一般认为在10-30ms10-30ms的短时间内),其的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有即语音信号具有短时平稳性短时平稳性。 根据所分析出的参数的性质的不同可以分为: 时域分析、频域分析、倒频域分析,线性预测分析等;分析方法的不同: 模型分析方法和非模型分析方法不论是分析怎么样的参数以及彩什么分

3、析方法,在按帧进行语音分析,提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、语音信号的端点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。 4.2 4.2 语音分帧语音分帧进行过预加重数字滤波处理后,接下来就要进行加窗分帧处理。一般每秒的帧数约为33-100帧,视实际情况而定。分帧虽然可以采用连续分段的方法,但一般要采用如图3-1所示的交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为0-1/2。分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用窗函数(n

4、)来乘s(n),从而形成加窗语音信号s(n)=s(n) (n)。 语音分帧语音分帧帧长与帧移: 取的点数为帧长,乘以采样周期得帧长时间 两帧间隔为帧移两帧一定要有重叠,否则有参数突变 在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长): 矩形窗:矩形窗: 汉明窗:汉明窗:elsenNnn, 0) 1(0, 1)(elsenNnNnn, 0) 1(0),1/(2cos46. 054. 0)( 语音分帧语音分帧1.1.窗口的形状窗口的形状 虽然,不同的短时分析方法(时域、频域、倒频域分析)以及求取不同的语音特征参数可能对窗函数的要求不尽一样, 一般来讲,一个好的窗

5、函数的标准是:在时域因为是语音波形乘以窗函数,所以要减小时间窗两端的坡度,使窗口边缘两端不引起急剧变化而平滑过渡到零,这样可以使截取出的语音波形缓慢降为零,减小语音帧的截断效应;在频域要有较宽的3dB带宽以及较小的边带最大值。 语音分帧语音分帧2.2.窗口的长度采样周期Ts=1/fs,窗口长度N和频率分辨率f之间存在下列关系:f=1/NTs可见,采样周期一定时,f随窗口宽度N的增加而减小,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。应该根据不同的需要选择合适的窗口长度。 语音分帧语音分帧有时窗口长度的选择,更重要的是要考虑语

6、音信号的基音周期。通常认为在一个语音帧内应包含17个基音周期。然而不同人的基音周期变化很大,从女性和儿童的2ms到老年男子的14ms(即基音频率的变化范围为50070Hz),所以N的选择比较困难。通常在10kHz取样频率下,N折中选择为100200点为宜(即1020ms持续时间)。这样,经过上面介绍的处理过程,语音信号就已经被分割成一帧一帧的加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理技术来提取语音特征参数。在进行处理时,按帧从数据区中取出数据,处理完成后再取下一帧,等等,最后得到由每一帧参数组成的语音特征参数的时间序列。 语音信号的时域分析就是分析和提取

7、语音信号的时域参数。进行语音分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号, 时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。特点是:表示语音信号比较直观、物理意义明确。实现起来比较简单、运算量少。可以得到语音的一些重要的参数。只使用示波器等通用设备,使用较为简单等。 短时平均能量及含义短时平均能量:每区一个n,得到一个112200( )( ) ()NNnnmmExmm x nmnE 短时能量及短时平均幅度分析短时能量及短时平均幅度分析E En n是一个度量

8、语音信号幅度值变化的函数,但它有一个缺陷,是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即它对高电平非常敏感(因为它计算时用的是信号的平方即它对高电平非常敏感(因为它计算时用的是信号的平方) )。短时平均幅度函数短时平均幅度函数M Mn n,它定义为:它定义为:M Mn n也是一帧语音信号能量大小的表征,它与也是一帧语音信号能量大小的表征,它与E En n的区别在于计的区别在于计算时小取样值和大取样值不会因取平方而造成较大差异。算时小取样值和大取样值不会因取平方而造成较大差异。10)(NmnnmxM(1)区分清/浊音: 大,对应浊音, 小,对应清音。(2)在SNR高的情况下,能进行有声/

9、无声判决 无声时,背景噪声的 小 有声时, 显著增大。判决时可设置一个门限(3)大致能定出浊音变为清音的时刻,或反之。存在的问题:短时能量函数对信号电平值过于敏感,在实际应用中(如定点设备)很容易溢出。此时可以用平均幅度函数代替,单对清/浊音,有/无声 的幅度差不如短时能量明显。 ,nnE M,nnE M,nnE M,nnE M 短时过零率(短时过零率(ZCRZCR)分析)分析短时过零率:一帧语音中语音信号波形穿过横轴短时过零率:一帧语音中语音信号波形穿过横轴( (零电平零电平) )的的次数。次数。对于连续语音信号,过零即意味着时域波形通过时间轴;对于连续语音信号,过零即意味着时域波形通过时间

10、轴;对于离散信号,如果相邻的取样值改变符号则称为过零。对于离散信号,如果相邻的取样值改变符号则称为过零。过过零率就是样本改变符号的次数零率就是样本改变符号的次数。 短时过零率分析短时过零率分析定义语音信号定义语音信号x xn n(m)(m)的的短时过零率短时过零率Z Zn n为:为:式中,式中,sgnsgn是符号函数,即是符号函数,即10)1(sgn)(sgn21NmnnnmxmxZ) 0(, 1) 0(, 1sgnxxx 短时过零率分析短时过零率分析(1)(1)区分清区分清/ /浊音:浊音: 清音平均过零率高,集中在高频端清音平均过零率高,集中在高频端 浊音平均过零率低,集中在低频端浊音平均

11、过零率低,集中在低频端(2)(2)从背景噪声中找出是否有语音。以及语音的起点。从背景噪声中找出是否有语音。以及语音的起点。清音随机噪声,高频浊音周期信号,低频 短时过零率分析短时过零率分析在实际应用中,短时平均过零率容易受到A/D转换的直流偏移、50Hz交流电源的干扰以及噪声的影响。减少这些干扰可以有两种方法:(1)采用带通滤波器消除信号中的直流和50Hz低频分量(2)用过门限率来修改过零率,减少随机噪声的影响过门限率反应了穿过正负门限的次数,如果存在随机噪声,只要信号没有超过-T,T的范围,就没有过零率的产生 短时相关分析短时相关分析 相关分析是一种常用的时域波形分析方法,并有自相关和互相关

12、之分。这里主要讨论自相关函数。 自相关函数具有一些性质,如它是偶函数;假设序列具有周期性,则其自相关函数也是同周期的周期函数等。可以应用于语音信号的时域分析中。 在语音信号分析中,采用的是短时自相关函数。 1 1短时自相关函数短时自相关函数 定义语音信号定义语音信号x xn n(m)(m)的的短时自相关函数短时自相关函数R Rn n(k)(k)的计算式如下:的计算式如下:这里这里K K是最大的延迟点数。是最大的延迟点数。 短时自相关函数具有以下短时自相关函数具有以下性质性质:(1)(1)如果如果x xn n(m)(m)是周期的是周期的( (设周期为设周期为N)N),则自相关函数是同周期的周期函

13、数,则自相关函数是同周期的周期函数, 即即R Rn n(k)=R(k)=Rn n(k+N(k+Np p) )。(2)R(2)Rn n(k)(k)是偶函数,即是偶函数,即R Rn n(k)=R(k)=Rn n(-k)(-k)。(3)(3)当当k=0k=0时,自相关函数具有最大值,即时,自相关函数具有最大值,即R Rn n(0)|R(0)|Rn n(k)|(k)|,并且,并且R Rn n(0)(0)等于等于确定性信号序列的能量或随机性序列的平均功率。确定性信号序列的能量或随机性序列的平均功率。1010( )( )()=( )()(),)0NknnnmNkmR kx m x mkx mnx nmkm

14、kKmk 1 1短时自相关函数短时自相关函数短时自相关函数存在的问题:随着k的变化,参加运算的项减少。极限k=N-1时无运算!改进方法:两个不同长度的窗2.2.修正的短时自相关函数修正的短时自相关函数矩形窗矩形窗1 1:矩形窗矩形窗2 2:10( )( ),) 0(NnnnmxmR kx mkkK其它值mNmm, 0) 1(0, 1)()0(),()()(Kkmnxmmxn)10(),()( )(KNkmnxmmxn其它值mKNmm, 0)1(0, 1)( 3 3相关函数的作用(1)区分清/浊音 浊音语音的自相关函数具有一定的周期性 清音语音的自相关函数不具有周期性,类似噪声。(2)估计浊音语

15、音信号的周期,即估计基音周期 短时平均幅度差函数短时平均幅度差函数短时自相关函数是语音信号时域分析的重要参量。但是,计算自相关函数的运算量很大,其原因是乘法运算所需要的时间较长。为了避免乘法,一个简单的方法就是利用差值。为此常常采用另一种与自相关函数有类似作用的参量,即短时平均幅度差函数(AMDF)。平均幅度差函数能够代替自相关函数进行语音分析的原理平均幅度差函数能够代替自相关函数进行语音分析的原理:如果信号是完全的周期信号如果信号是完全的周期信号( (设周期为设周期为N Np p) ),则相距为周期的整,则相距为周期的整数倍的样点上的幅值是相等的,差值为零。数倍的样点上的幅值是相等的,差值为

16、零。,.)2, 0( , 0)()()(ppNNkknxnxnd 短短时平均幅度差函数短时平均幅度差函数的定义:对于周期性的语音信号, 也呈周期性,与 相反的是: 在谷点时,对应的 是峰值平均幅度差函数和自相关函数有密切的关系可由下式表达:kNmnnnkmxmxkF10)()()(2/1)()0()(2)(kRRkkFnnn( )nF k( )nR k( )nF k( )nR k 短时平均幅度差函数短时平均幅度差函数 语音信号的频域分析就是分析语音信号的频域特征。 从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等, 而常用的频域分析方法有带通滤波器组法、傅里叶变

17、换法、线性预测法等几种。本章介绍的是语音信号的傅里叶分析法。 因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。 利用语音的短时傅里叶变换求语音的短时谱利用语音的短时傅里叶变换求语音的短时谱对第n帧语音信号,短时傅里叶变换,其定义如下:可知函数是时间n的离散函数,又是角频率 的连续函数,因此,可以从两个角度解释短时傅里叶变换的含义:(1)标准傅里叶变换(2)滤波器角度10)()(NmmjnjnemxeX( )() ( )nxmnm x m是窗口函数序列,不同的窗口函数

18、序列,将得到不同的傅里叶变换结果 讨论(1 1)当)当n n取固定值时,记取固定值时,记 ,标准,标准傅里叶变换为:傅里叶变换为:(2 2)固定不变,记固定不变,记=L=L,相当于一个滤波器,相当于一个滤波器当n取不同值时,窗 沿着 序列滑动()()( )jj mmjnmmXex mnm ey m e ()jnXe( )( )() ( )ny mx mnm x m标准的标准的FTFT()( ) ()()( )( )( )( )jLjLmnmmjLmmjLmXex mnm enmZ mx mx mnmemeZ ()nm( )x m 离散的短时傅里叶变换令 则在语音信号数字处理中,都是采用 短时傅里叶变换也叫短时谱 特点:(1)时变性:即是角频率的函数也是时间n的函数(2)周期性:是关于角频率的周期函数,周期为 短时功率谱短时功率谱 功率谱功率谱: :函数的功率谱函数的功率谱=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论