基于小波变换与自相关结合的基音周期检测.doc_第1页
基于小波变换与自相关结合的基音周期检测.doc_第2页
基于小波变换与自相关结合的基音周期检测.doc_第3页
基于小波变换与自相关结合的基音周期检测.doc_第4页
基于小波变换与自相关结合的基音周期检测.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于小波变换与自相关结合的基音周期检测苏州大学 电子信息学院,江苏 苏州 215007 祝 嘉摘 要: 本文提出了一种利用二进制小波变换和短时自相关函数相结合的算法来检测语音信号的基音周期。它克服了单纯的短时自相关函数法对含噪语音检测时阈值难以确定的缺陷。在对真实语音进行基音周期检测的计算机仿真实验中该算法取得了较为满意的结果。该算法对于噪声具有较好的稳健性和适应性。关键词: 小波变换;短时自相关函数;基音周期1、引言在语音信号处理中,基音周期的提取是一个非常重要的研究课题,一个好的基音周期的提取算法对于高质量的语音分析与合成、语音压缩编码、语音识别和说话人确认等方面都具有十分重要的意义。语音信号的基音周期提取问题实质上也就是准周期信号的周期估计问题,其中经典的算法也提出了不少,大体上可以分为时域方法(如自相关法)和频域方法(如倒谱法)。但到目前为止,还没有一个能在任何情况下都能较为满意地测出各种人(包括男人、女人、老人和小孩)的语音基音周期的方法。这是因为语音信号的变化十分复杂,声门激励波形并不是一个单纯的周期序列;声道的共振峰有时会严重的影响音源的谐波结构,使得很难直接提取仅和声门振动有关的音源信息;而基音周期的变化范围也较大,从女孩的2ms到男低音的14ms(即基音频率的变化范围为500HZ70HZ),这些都给传统的基音检测方法带来了不少的困难。近年来,随着现代信息处理方法的发展和时频分析的进一步发展,又提出了将时频联合起来分析、提取语音信号的基音周期,特别是在噪声环境下的语音信号的基音周期检测方面更是提出了许多有效的方法。下文研究将小波变换与短时自相关函数相结合的语音基音周期的检测方法,并用计算机仿真对真实语音进行基音周期检测,验证本方法的有效性。2、基本原理2.1 离散二进制小波变换小波是由一个满足条件(是一个振荡型函数,其直流分量为零)的函数经过平移和压缩而产生的一簇函数,记为: (1)其中为母尺度函数,为母小波函数;若给定数字信号,则存在连续信号,。的多分辨分析及二进制小波变换分别为: (2) (3)记分别为的Fourier变换,则有 (4) (5)式中为共轭镜像滤波器。由式(2)、(3)得 j=1、2、J j=1、2、J取时离散信号的二进制小波变换的递推公式为: j=1、2、J (6) j=1、2、J (7)约定:当j0时,为给定的数字信号。2.2 小波变换用于基音周期检测的原理 若将一个实函数称为光滑函数,只要它满足条件:,且 光滑函数的能量主要集中在低频段,因此,也可以看作一个低通滤波器的脉冲响应函数。若一个光滑函数为低通滤波器的脉冲响应函数,则与之卷积使的高频衰减而不改变低频部分,从而使磨光。 设为一光滑函数,分别为如下定义的小波函数: ,记 ,则对一个实函数,有以下小波变换: (8) (9) 可见,分别正比于经磨光后得到的函数的一阶导数和二阶导数,而函数的一阶导数的极值点对应于其二阶导数的零点,同时该点也是函数本身的拐点。而一阶导数的绝对值的极大值对应于函数的突变点。因此,的幅值极大点对应于的突变点,而的零点则与的拐点相一致。如果小波变换在精细的尺度上没有模极大值,那么函数在该处任何邻域中都无奇异性。 正是由于小波变换所具有的这一特性,使得它成为基音周期检测的一个有力工具。因为从语音的产生过程可以看出,由于声门的闭合使得语音信号浊音段呈现准周期性变化,并且会受到声道的影响。在声门闭合的瞬间,声道受到较强的激励,在语音信号中引起一个突变。显然,可以使用合适的比例因子,应用小波变换从信号中检测出声门闭合瞬时的突变信息,而两次突变的时间间隔恰为基音周期。2.3 小波变换和自相关结合法由于语音信号比较复杂,精确抽取基音周期时,自相关法仍存在一些不足。多次实验发现,当检测被噪声污染的语音信号的基音周期时,随着信噪比的减小,利用自相关法求出的基音周期的误差越来越大。针对这一问题,提出一种更为准确的基音周期检测方法小波变换和自相关结合法。其基本思想是:利用小波变换,滤除非锐变信息和噪声的影响,以加强声门闭合瞬间的锐变信息;把小波变换后的结果作为被处理信号,计算其自相关函数,找出超过一定门限的极大值点,测出相邻两个极大值间的时间间隔,从而得到语音基音周期。3、试验及结果按上一节的方法,选取具有紧支集的2次样条小波,它是3次样条函数的一阶导数,它们的Fourier变换分别为 (10)具有紧支集的2次样条小波相应的滤波器传递函数为 (11)N-1012H0.1250.3750.3750.125G0-2.02.00表1 2次样条小波对应数字滤波器H,G的有限脉冲响应值设该小波函数的输入中心频率为、带宽为,要求小波变换输出的中心频率为、带宽为,可根据下式选取值 (12)对于2次样条小波,约为4000Hz,带宽约为6400Hz。实践证明,一般情况下只需计算三个相邻的压扩因子下的小波变换就足以估计出基音周期了。由检测高频女音,确定压扩因子下界;由检测低频男音,确定压扩因子上界。若要求输出的中心频率500Hz,800Hz则由(12)式可求得 。故j3。图1(a,b,c) j对于小波自相关法的影响图1给出了j的选择对于小波自相关法的影响的试验结果。其中图1(a)为纯净的男音“a”的波形;图1(b)、图1(c)分别为当j2,j3时采用小波自相关法进行基音周期检测时语音信号第35帧(元音段)的自相关函数的波形。语音信号的采样频率为8KHz,语音长度为1秒钟。每个短时语音帧采用320点,即每帧为320/8000=40ms。(选择窗长为40 ms,即320点,是因为语音信号中最长的基音周期为20 ms, 而短时自相关法要求短时窗所确定的语音帧长必须不小于两倍的基音周期),每次计算短时窗所确定的语音帧移动160点。由图1(b)和图1(c)可知,虽然两种情况下均可准确地检测出平均基音频率为191Hz(即基音周期为5.24ms),但当j3时其检测的准确性显然要比j2时要高;j=2时,若寻找极大值的门限选得不合适,就会造成基音周期检测出现很大的误差。所以,选取j=j13,压扩因子为的小波变换可以获得较好的基音周期检测结果。图2(a,b,c,d) 两种方法比较实验曲线图2给出短时自相关法和小波自相关法分别对加噪的语音信号基音周期进行检测的实验结果;其中图2(a)为男音“a”加上白噪声后的波形,信噪比为4dB,其他参数同图1所用语音信号;图2(b)为这段语音信号第35帧的短时自相关函数波形;图2(c)为该段语音经小波变换(选用二次样条小波)滤噪后的波形,选用压扩因子为;图2(d)为滤噪后的波形作为被处理信号而求得的语音信号第35帧的短时自相关函数的波形。从图2(b)中可以看出,由于噪声的干扰使得用短时自相关法已无法精确求出语音的基音周期,而是把它错误地判别为清音。加噪前后用短时自相关法求得该段语音的平均基音频率分别为191Hz和187Hz。而图2(d)中用小波变换和自相关相结合法两次求得的结果均为191Hz。由此可见小波变换和自相关相结合法对噪声具有很好的稳健性。4、结论这种小波变换和自相关结合的基音周期检测方法,在选用压扩因子时,取得的检测结果最好。由计算机仿真结果可看出,此方法对于噪声的稳健性较好,当单纯使用短时自相关法已经无法检测出基音周期时,采用此方法仍可以取得很好的检测结果。参考文献: 1 Shubha Kadambe, G. Faye G Boudreaux-Bartels, Application of the Wavelet Transform for Pitch Detection

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论