实验二 语音信号的频域分析_第1页
实验二 语音信号的频域分析_第2页
实验二 语音信号的频域分析_第3页
实验二 语音信号的频域分析_第4页
实验二 语音信号的频域分析_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验二语音信号的频域分析2021/5/91一、实验目的理解语音信号的频谱特点;理解语音信号的频谱分析方法;

MATLAB实现语音信号的频域分析。2021/5/92二、实验原理

语音信号本质上是非平稳信号。但我们可以假设语音信号在一个短时间内是平稳的,这样我们用稳态分析方法处理非平稳信号。应用在傅立叶分析就是短时傅立叶变换。语音的频域分析:包括语音信号的频谱、功率谱、倒频谱、频谱包络等.常用频域分析方法:带通滤波器组法、Fourier变换法、同态分析、线性预测法等。

2021/5/93短时傅立叶变换定义式:式中,w(n-m)是窗函数,n为离散时间,w连续频率。令,则可得到离散的短时傅立叶变换由上式可以看出:当n固定,就是序列的傅立叶变换;当w或k固定,就是一个卷积,相当于滤波器的运算。2021/5/94语谱图语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值。语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图,而窄带语谱图正好与之相反。宽带语谱图可以获得较高的时间分辨率,反映频谱的快速时变过程;窄带语谱图可以获得较高的频率分辨率,反映频谱的精细结构。两者相结合,可以提供两种语音特性相关的信息。语谱图上因其不同的灰度,形成不同的纹路,称之为“声纹”。2021/5/95倒谱分析语音信号同态处理方法是一种设法将非线性问题转化为线性问题来进行处理的方法。它能将两个信号通过乘法合成的信号,或通过卷积合成的信号分开。目的是要从声道激励响应分量与激励分量的卷积中分开各原始分量。这种由卷积结果求得参与卷积的各信号分量—解卷。对语音信号进行同态分析后,将得到语音信号的倒谱参数,因此同态分析也称为倒谱分析。2021/5/96同态信号处理的基本原理

语音信号不是加性信号,而是乘积性或卷积性信号,它不能用线性系统,而必须用满足其相应组合原则的非线性系统来处理。同态信号处理就是将非线性问题转化为线性问题来处理。乘积同态处理卷积同态处理2021/5/97卷积同态处理

同态处理理论的一个重要是任何同态系统都能表示为三个同态系统的级联,即同态系统可分解为两个特征系统和一个线性系统。第一个系统以若干信号的卷积组合作为其输入,并将它变换成对应输出的相加性组合。第二个系统是一个普通线性系统,它服从叠加原理。第三个系统是第一个系统的逆变换,即将信号的相加性组合反变换为卷积组合。2021/5/98语音倒谱的应用基音周期估计浊音信号的倒谱中存在峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中不存在峰值。利用倒谱的这个特点,我们可以进行语音的清浊音判决,并且可以估计浊音的基音周期。首先计算语音的倒谱,然后再可能出现的基音周期附近寻找峰值。如果倒谱峰值超过了预先设置的门限,则输入语音判断为浊音,其峰值位置就是基音周期的估计值;反之,如果没有超出门限的峰值的话,则输入语音为清音。2021/5/99共振峰估计对倒谱进行滤波,取出低时间部分进行逆特征系统处理,可以得到一个平滑的对数谱函数,这个对数谱函数显示了输入语音段的共振峰结构,同时谱的峰值对应于共振峰频率。通过此对数谱进行峰值检测,就可以估计出前几个共振峰的频率和强度。对于浊音的声道特性,可以采用前三个共振峰来描述;清音不具备共振峰特点。2021/5/910三实验用函数快速傅立叶变换函数

fft(x)fft(x,N)ifft(x)ifft(x,N)x是语音信号N是正整数,函数执行N点FFT2021/5/911三实验用函数语谱图绘制函数specgram调用格式:specgram(data,nfft,Fs,window,numoverlap)Data是语音信号nfft是fft的长度,一般取1024或者512。

fs就是采样率。

window是指窗的长度,一般和nfft相同即可。

numoverlap是帧重叠的长度,取1/4*nff就可以了。2021/5/912三实验用函数复倒谱:cceps实倒谱:rceps调用格式

y=cceps(x)y=rceps(x)2021/5/913四参考例程短时谱cleara=wavread('beijing1.wav');a=a(34000:105000);subplot(2,1,1)plot(a);title('originalsignal');grid;N=256;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endy=20*log(abs(fft(b)));subplot(2,1,2)plot(y);title('短时谱');grid2021/5/914语谱图clear[x,fs,n,bits]=wavread('beijing1.wav');subplot(2,1,1)plot(x)subplot(2,1,2)specgram(x,512,fs,100);xlabel('时间(s)')ylabel('频率(Hz)')title('语谱图')2021/5/915倒谱和复倒谱cleara=wavread('beijing1.wav');a=a(39000:39999);N=1000;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(3,1,1)plot(a);title('截取的语音信号')subplot(3,1,2)plot(d);title('加汉明窗时的倒谱')subplot(3,1,3)plot(c);title('加汉明窗时的复倒谱')2021/5/9162021/5/917基音检测clear[y,fs,nbits]=wavread(‘china.wav');time1=1:length(y);time=(1:length(y))/fs;framesize=floor(50*fs/1000);%帧长startindex=round(19000);%起始序号endindex=startindex+framesize-1;%结束序号frame=y(startindex:endindex);%取得该帧framesize=length(frame);frame2=frame.*hamming(length(frame));%加汉明窗rwy=rceps(frame2);%求倒谱ylen=length(rwy);cepstrum=rwy(1:ylen/2);2021/5/918fori=1:ylen/2cepstrum1(i)=rwy(ylen/2+1-i);endfori=(ylen/2+1):ylencepstrum1(i)=rwy(i+1-ylen/2);end%基音检测lf=floor(fs/500);hf=floor(fs/70);cn=cepstrum(lf:hf);[mx_cepind]=max(cn);ifmx_cep>0.08&ind>lfa=fs/(lf+ind)elsea=0;endpitch=a;2021/5/919%画图figuresubplot(3,1,1);plot(time1,y)subplot(3,1,2);plot(frame)time2=[-199:1:-1,0:1:200];subplot(3,1,3);plot(time2,cepstrum1)

2021/5/920

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论