版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音信号处理实验报告
基于MATLAB分析语音信号频域特征所在院系: 工学院专 业: 电子信息工班 级: 电信112姓 名:学 号指导教师:20140506日实验三 基于MATLAB分析语音信号频域特征一、实验目的由于语音信号是随着时间变化的短时分析法。本实验要求掌握傅里叶分析原理周期或共振峰。二、实验原理1、短时傅立叶变换由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为:其中w(n-m)是实窗口函数序列,n表示某一语音信号帧。令n-m=k',则得到换有两个变量n和ωnω散ω=2πk/N,、语谱图水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短谱。言。微结构,称为宽带语谱图;而窄带语谱图正好与之相反。宽带语谱图可以获得较高的时间分辨率语谱图上因其不同的灰度,形成不同的纹路,称之为“声纹”。声纹因人而异,因此3、复倒谱和倒谱复倒谱,声道系统的复倒谱之间满足下面的关系:由于倒谱对应于复倒谱的偶部的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系:浊音信号的倒谱中存在着峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用这个特点我们可以进行清浊音的判断,并且可以估计浊音的基音周期。4、基因周期估计浊音信号的倒谱中存在峰值5、共振峰估计二、实验结果1短时谱语谱图倒谱和复倒谱图4是加矩形窗和汉明窗的倒谱图和复倒谱。基因周期和共振峰估计四、参考程序cleara=wavread('beijing.wav');subplot(2,1,1),plot(a);title('originalsignal');gridN=256;h=hamming(N);form=1:Nb(m)=a(m)*h(m)endy=20*log(abs(fft(b)))subplot(2,1,2)plot(y);title('¶ÌʱÆ×');gridoriginalsignal10.50-0.50 0.5 1 1.5 2短时谱
2.5 3
4x104500-50-100-1500 50 100 150 200 250 300[x,fs,nbits]=wavread('beijing.wav')specgram(x,512,fs,100);xlabel('ʱ¼ä(s)');ylabel('ƵÂÊ(Hz)');title('ÓïÆ×ͼ');originalsignal10.50-0.50 0.5 1 1.5 2语谱图
2.5 3
4x1044000H率频
30002000100000.5 1 1.5 2 2.5时间
3 3.5 4 4.5cleara=wavread('beijing.wav',[4000,4350]);N=300;h=linspace(1,1,N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(2,1,1)plot(d);title('¼Ó¾ØÐδ°Ê±µÄµ¹Æ×')subplot(2,1,2)plot(c);title('¼Ó¾ØÐδ°Ê±µÄ¸´µ¹Æ×')加矩形窗时的倒谱20-2-4-60 50 100 150 200 250 300加矩形窗时的复倒谱20-2-4-60 50 100 150 200 250 300cleara=wavread('beijing.wav',[4000,4350]);N=300;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(2,1,1)plot(d);title('¼ÓººÃ÷´°Ê±µÄµ¹Æ×')subplot(2,1,2)plot(c);title('¼ÓººÃ÷´°Ê±µÄ¸´µ¹Æ×')加汉明窗时的倒谱20-2-4-60 50 100 150 200 250 300加汉明窗时的复倒谱50-5-100 50 100 150 200 250 300语音信号处理实验报告实验四 基于MATLAB的LPC分析所在院系: 工学院专 业: 电子信息工班 级: 电信112姓 名:学 号:指导教师: 汤永清20140506日实验四 基于MATLAB的LPC分析一、实验目的线性预测分析是有效的语音分析技术之一方误差达到小,可以确定唯一的一组线性预测系数。LP分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质。此LP分析还能够对共振峰、功率谱等语音参数进行精确估计LP分析得到的参数可以作为语音识别的重要参数之一。LP分析,只要限定窗的长度就可以保证LP本实验要求掌握LPC原理,会利用已学的知识,编写程序估计线性预测系数以及LPC的推演参数,并能利用所求的相关参数估计语音的端点、清浊音判断、基因周期、共振峰等。二、实验原理LPLP分析为线性时不变因果稳定系统V(z)建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。如果利用P个取样值来进行预测,则称为P阶线性预测。假设用过去P个取样值显然,误差越接近于零,线性预测的准确度在均方误差小的意义上为佳,由此可以计算出预测系数。通过LPC分析,由若干帧语音可以得到若干组LPC语音特征的矢量LPC特征矢量LPC特征矢量可以进一步得到很多种派生特征矢量自相关法值得注意的是,自相关法在计算预测误差时,数据段的两端都需要加P个零取样值,数量化时,有可能造成实际系统的不稳定。协方差法可以看出,这里的数据段两端不需要添加零取样值。在理论上,协方差法计算出来的预测系数有可能造成预测误差滤波器的不稳定但,在实际上当每帧信号取样足够多时,其计算结果将与自相关法的结果很接近协方差解法的大优点在于不存在自相关法中两端出现很大预测误差的情和PN在200左为了制约因素。所以,在语音信号处理中往往使用高效的自相关法。全极点声道模型将线性预测分析应用于语音信号处理非常好的声道模型。将式(2)所示的方程看成是滤波器在语音信号激励下的输入输出方程,则该滤波器称为z域,因为预测误差含有语音信号的基音信息,所以对于浊音,模型的激励信号源是以基音周组合参数由于人能从声音的音色、频高等各种信息中感知说话人的个性,因此可以想象,利用特则会更有效一些,因为它们分别反映了语音信号中的不同特征。多年来,人们对组合参数在说话人识别中的应用进行了大量研究。实验证明,组合参数可以提高系统的识别性能。组合参数虽然可以提高系统的性能,但很显然,无论是在特征参数提取环节,还是在模型训练和模型匹配环节都使运算量有所增加在。特征参数提取环节,要计算一种以上的特征参数运算量的增加会使系统的识别速度受到影响。语音帧能量是指一帧语音信号的能量,它等于该帧语音样值的平方和。选取与语音帧能语音帧能量是语音信号基本的短时参数之一,它表帧征一帧语音信号能量的大小,是语音信号一个重要的时域特征)由一帧语音求出的语音量的维数越少,则需要的运算复杂度越小,另外,获取语音帧能量的运算并不复杂)语音帧能量与LPC参数之间的相关性不大,它们反映的是语音信号的不同特征,应该有较好的效果。模型增益G三、实验结果(参考)我们使用的原始语音为“北风”,采样频率为11000Hz,运行程序见附录。30,看到图3.1所示的原始语音帧的3.2LPC这里我们可以改变线性误差的阶数来观察语音帧的短时谱LP。图3.3预测阶数对语音帧短时谱和LPC谱的影响图3.5给出了原始语音的语谱图和预测语音的语谱图三、附录分析参考程序)MusicSource=wavread('beijing.wav');Music_source=MusicSource';N=256;Hamm=hamming(N);frame=input('请键入想要处理的帧位置=');origin=Music_source(((frame-1)*(N/2)+1):((frame-1)*(N/2)+N));Frame=origin.*Hamm';[s1,f1,t1]=specgram(MusicSource,N,N/2,N);[Xs1,Ys1]=size(s1);fori=1:Xs1FTframe1(i)=s1(i,frame);endN1=input('请键入预测器阶数=');[coef,gain]=lpc(Frame,N1);est_Frame=filter([0-coef(2:end)],1,Frame);FFT_est=fft(est_Frame);err=Frame-est_Frame;subplot(2,1,1),plot(1:N,Frame,1:N,est_Frame,'-r');grid;title('原始语音帧vs.预测后语音帧')subplot(2,1,2),plot(err);grid;title('误差');pausefLength(1:2*N)=[origin,zeros(1,N)];Xm=fft(fLength,2*N);X=Xm.*conj(Xm);Y=fft(X,2*N);Rk=Y(1:N);PART=sum(coef(2:N1+1).*Rk(1:N1));G=sqrt(sum(Frame.^2)-PART);A=(FTframe1-FFT_est(1:length(f1')))./FTframe1;subplot(2,1,1),plot(f1',20*log(abs(FTframe1)),f1',(20*log(abs(1./短时谱');subplot(2,1,2),plot(f1',(20*log(abs(G./A))));grid;title('LPC谱');pausetemp=FTframe1-FFT_est(1:length(f1'));pitch1=log(abs(temp));pLength=length(pitch1);result1=ifft(pitch1,N);pitch1((pLength-32):pLength)=0;result2=ifft(pitch1,N);pitch=fftshift(rceps(err));origin_pitch=fftshift(rceps(Frame));subplot(211),plot(origin_pitch);grid;title('原始语音帧倒谱(直接调用函数)');subplot(212),plot(pitch);grid;title('预测误差倒谱(直接调用函数)');pausegrid;title('预测)')grid;title('预测误差倒谱(根据定义编写,去除高频分量)');原始语音帧预测后语音帧0.040.030.020.0100 50 100 误差
200 250 3000.010.0050-0.005-0.010 50 100 150 200 250 3001000-100
短时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 压疮的护理安全与防范
- 高血压中医护理的社区实践
- 食管裂孔疝的护理要点
- 北大口腔护理科研方法
- 分级护理中的患者评估
- 考研爆炸力学试题及答案
- 2026年中考考前模拟-语文(湖南卷)(参考答案及评分标准)
- 广东省深圳市龙华区2026届高三下学期5月高考预测卷英语英语答案
- 滑雪指导员创新方法强化考核试卷含答案
- 氯化炉工操作知识模拟考核试卷含答案
- 2026年北京市大兴区社区工作者考试试题解析及答案
- 数据调查外包合同
- 2026上海大歌剧院管理有限公司夏季工作人员招聘137人笔试备考试题及答案解析
- 17《红军桥》课件 美术三年级下册 (赣美版2024)
- 塔吊基础监理实施细则
- 2026年大连市教育基金会招聘工作人员备考题库附答案详解(研优卷)
- 水洗砂、碎石采购方案投标文件(技术标)
- 上海市二级注册建造师继续教育(建筑工程)考试题库
- 雨课堂学堂在线学堂云《人工智能安全与伦理(北京航空航天)》单元测试考核答案
- 马克思主义基本原理概论课《第七章共产主义崇高理想及其最终实现》教案
- GB/T 47067-2026塑料模塑件公差和验收条件
评论
0/150
提交评论