实验二语音信号的特征提取_第1页
实验二语音信号的特征提取_第2页
实验二语音信号的特征提取_第3页
实验二语音信号的特征提取_第4页
实验二语音信号的特征提取_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档实验二语音信号的特征提取1、 实验目的1、 熟练运用matlab 软件进行语音信号实验。2、 熟悉短时分析原理、 mfcc 的原理。3、 学习运用matlab 编程进行mfcc 的提取。4、 、学会利用短时分析原理提取mfcc 特征序列。2、 实验仪器设备及软件matlab3、 实验原理1、 mfcc语音识别和说话人识别中,常用的语音特征是基于 mel 频率的倒谱系数(即 mfcc ) 。mfcc 参数是将人耳的听觉感知特性和语音的产生机制相结合。mel 频率可以用如下公式表示:fmel2595 log(1 f / 700)在实际应用中, mfcc 倒谱系数计算过程如下; 将信号进行分

2、帧, 预加重和加汉明窗处理, 然后进行短时傅里叶变换并得到其频谱。 求出频谱平方,即能量谱,并用 m 个 mel 带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。 因此将每个滤波器频带内的能量进行叠加, 这时第 k ,.个滤波器输出功率谱x ( k) 。 将每个滤波器的输出取对数, 得到相应频带的对数功率谱; 并进行反离散余弦变换,得到 l 个 mfcc 系数,一般l 取 1216 个左右。 mfcc 系数为mcn logx(k)cos (k 0.5)n/m,n=1,2,lk 1将这种直接得到的mfcc特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。2、

3、 lpc由于频率响应h (ejw)反映声道的频率响应和被分析信号的谱包络,因此用log | h (ejw) |做反傅里叶变换求出的 lpc倒谱系数。p通过线性预测分析得到的合成滤波器的系统函数为h (z) 1/(1 az i),其冲激响i 1应为h(n)。h(n)的倒谱为h(n) , h (z)h(n)z nn 1就是说h (z)的逆变换h(n)是存在的。设 h(0) 0将式h(z)h(n)z n 两边同时对 z 1求导n 1一 11-log-p1aiz1i 1h(n)z n 得到 nh(n)z z n 1n 1p一. i 1iaiz,于是有1 az ii 1(1pa1、aiz ) n h(n

4、)zi 1n 1iaiz i 1令其左右两边 n 1z的各次哥前系数分别相等,得随意编辑到h(n)和ai间的递推关系h(1) a1an 1ah(n)an(1 )ai h(n k),1i 1 napah(n) (1)ai h(n 1), ni 1 nn p,按其可直接从预测系数pai求得倒谱h(n)。这个倒谱是根据线性预测模型得到的,又称为 lpc倒谱。lpc倒谱由于利用线性预测中声道系统函数 h (z)的最小相位特性,因此避免了一般同态处理中求复对数的麻烦。四、实验步骤及程序mfcc特征序列(1)、实验步骤输入样本音频给样本音频预加重、分帧、加窗 将处理好的样本音频做傅里叶变换进彳t mel频

5、率滤波进彳t log对数能量对样本求倒谱输出mfcc图像(2)、mfcc提取程序流程图图3.1 mfcc特征提取(3)、mfcc特征提取实验源程序close allclearclcx=wavread( 1.wav);bank=melbankm(24,256,8000,0,0.5,m);bank=full(bank);bank=bank/max(bank(:);for k=1:12n=0:23;dctcoef(k,:)=cos(2*n+1)*k*pi/(2*24);endw = 1 + 6 * sin(pi * 1:12 ./ 12);w = w/max(w);xx=double(x);xx=f

6、ilter(1 -0.9375,1,xx);xx=enframe(xx,256,80);for i=1:size(xx,1)y = xx(i,:);s = y .* hamming(256);t = abs(fft(s);t = t.a2;c1=dctcoef * log(bank * t(1:129);c2 = c1.*w;m(i,:)=c2;endfigureplot(m);xlabel(帧数);ylabel(幅度);title( mfcc);五、实验结果与分析mfccmfcc0204060801001201401601s0200帧数图3.3 mfcc特征提取图像通过计算mfcc参数,获得了声纹识别的特征参数。由于 mfcc参数是对人耳听觉特征的描述,因此,可以认为,不同声纹的mfcc参数距离,能够代表人耳对两个语音听觉上的差异,可以为声纹的识别提供可靠的依据。六、 实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论