实验7 声纹特征提取(实验指导书).doc_第1页
实验7 声纹特征提取(实验指导书).doc_第2页
实验7 声纹特征提取(实验指导书).doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验7声纹特征提取一实验目的1. 了解语音信号合成技术及声纹特征提取的基本方法。2学习声纹特征提取的MATLAB实现基本方法。二、实验内容1利用语音文件enframe.wav对语音数据绘制音谱图,要求窗长分别为512和128。2对语音文件enframe.wav中的语音数据加窗分帧,进行相关性分析,讨论第42帧音和第15帧语音数据的声纹特征。三、实验原理与方法1基于统计学基础的特征提取方法无论对于语音通信、语音合成或语音识别,特征提取的完成都是从语音信号提取出具有特征的音素。一般而言,由于倒频谱有着能将频谱上的高低频分开的优点,因此被广泛地应用在语音识别的研究上,对语音识别有用的信息,如对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息。例如过去常用的线性预测编码导出的倒频谱参数(LPCC)和梅尔频率倒谱参数(MFCC)等都是常用的语音特征。倒谱特征所含的信息比其他参数多,能较好地表征语音信号,语音质量好,识别正确率高,因此选用倒谱系数作为特征参数具有一定的优势。一般同态处理中对信号序列进行短时快速傅立叶变换,然后求其复对数的逆傅立叶变换便可得信号复倒谱。LPC倒谱特征与FFT复倒谱特征相比,前者求出的频谱包络能更好地重现谱的峰值,而且运算量仅是后者的一半,在实时语音识别中采用LPC倒谱作为特征向量较好。LPC倒谱特征提取合适的阶数后可较好地表征声道特性,但它是按实际频率尺度的倒谱系数,可根据人耳听觉特性将上述的LPC倒谱系数进一步按符合人听觉特性的梅尔(MEL)尺度进行非线性变换,从而求出LPC梅尔倒谱系数(LPCMCC)。LPC梅尔倒谱系数算法效率较高。既考虑了声道激励,又兼顾人耳听觉,理论上具有一定的可行性6。2线性预测及其倒谱系数线性预测(LPC)分析技术是目前被广泛应用的特征参数提取技术,许多成功得以应用的系统都采用基于线性预测技术提取的LPC倒谱系数(LPCC)作为系统的特征矢量。LPCC参数的提取基于语音的线性预测分析,线性预测分析从人的发声机理人手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。在获得滤波器的线性预测系数后,可以用一个递推公式得到其倒谱: i=1,2,p 式中, 为线性预测系数,为所求的LPCC参数,P是参数的个数。LPCC参数比较彻底地去掉了语音产生过程中的激励信息,主要反映声道特性,而且只需10余个倒谱系数就能较好地描述语音的共振峰特性,计算量小。其缺点是对辅音的描述能力较差,抗噪声性能也较弱。这里讲的LPC倒谱其实是复倒谱,所谓复倒谱就是信号通过z变换以后取对数,再求反z变换而得到的。线性预测分析方法是一种谱估计的方法,而且其声道模型系统函数H(z)反映了声道的频率响应和原始信号的谱包络,因此用做反z变换即可求出其复倒谱系数。该复倒谱系数根据线性预测模型直接得到,因此又称之为LPC倒谱系数(LPCC)。之所以线性预测分析法是目前进行语音特征分析的最有效、最重要的方法之一,这是由于:(1)它有效地解决了短时平稳信号的模型化问题,可把语音信号看成是由全极点模型产生的。(2)能很好地逼近共振峰,提供谱估计。(3)提供的语音信号模型参数(如基音、共振峰、谱、声道面积函数等)简洁而准确,计算量较小,便于实时处理。(4)可用于低速率传输的环境。(5)将LPC参数形成的模型参数储存起来,在语音识别中提高识别率和减少识别时间。这个函数的名字就是LPC,它的语法为:a=lpc(x,p),这里 x为一帧语音信号,p为计算LPC参数的阶数。通常为240点或256点的数据,p取l012,对语音识别已经足够了。但要采用迭代算法计算LPC倒谱参数则需要自己再另行编写一段复倒谱递推程序,其推导公式为: , 其中为LPC系数,而P为其阶数,一般LPC倒谱系数的阶数一般取832阶就可以比较好的表征声道特征。3语谱图的MATLAB实现算法y,fs,nbits=wavread(waveFile);F=enframe(y,200);specgram(y,512,8000);4线性预测的MATLAB实现算法y,fs,nbits=wavread(waveFile);F=enframe(y,200);f5=F(:,15);a=lpc(f5,12);est_f5=filter(0,-a(2:end),1,f5);e=f5-est_f5;acs,lags=xcorr(e,coeff);subplot(2,2,1);plot(1:199,f5(1:199),1:199,est_f5(1:199),-);sub

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论