已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2015.10.141.介绍语音是人类相互交流和通信最方便快捷的手段。如何高效地实现语音传输、存储或通过语音实现人机交互,是语音信号处理领域中的重要研究课题。语音信号处理涉及数字信号处理、语言学、语音学、生理学、心理学、计算机科学以及模式识别、人工智能等诸多学科领域,是目前信息科学技术学科中发展最为迅速的一个领域。在语音处理技术中,线性预测是第一个真正得到实际应用的技术,可以用于估计基本的语音参数,如基因周期、共振峰频率、频谱特征及声道面积函数等。线性预测的基本原理是把待分析的信号用一个模型表示出来,信号是这个模型的输出,构成这个模型的参数是这个信号的重要特征,称为线性预测系数。一个语音取样的现在值可以用若干个语音取样的过去值的加权线性组合来逼近。加权系数称为预测系数。如果利用过去 p个样点值来进行预测,称为p 阶线性预测。线性预测编码就是利用过去的样值对新鲜值进行预测,然后将样值的实际值与其预测值相减得到一个误差信号,显然误差信号的动态范围小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。通常情况下,随着线性预测阶数p的增大,预测误差也将会越来越小,但是p也不是一直增加的,随着线性预测阶数p的增大,信号中的可预测部分也将越来越少,预测误差的变化趋于平稳,误差减小不再明显。此时,伴随着预测阶数p的增大,整个系统的计算量将会越来越大。为此,对于不同的信号,我们需要确定一个最优的预测阶数p,进而进行预测分析。在对原始语音信号进行处理之前我们要对信号进行预处理,语音信号的预处理也叫作前端处理,是指在特征提取之前,先对原始语音进行处理,使处理后的信号更能满足实际的需要,对提高处理精确度有重要的意义。一般预处理的步骤包括采样、预加重、加窗分帧和去噪等,本文采取分帧去除直流分量后再剔除噪声帧来进行预处理,本文求阈值的方法就是求出语音信号中的高斯白噪声,然后设置阈值,将没帧信号和阈值进行比较,如果比阈值小的就是噪声帧,直接去除。预处理结束后,我们对语音信号进行LPC分析,本文中通过Levinson-Durbin算法求出预测系数,在通过不同阶数P的滤波器得到预测误差从而找出最小误差值下的最优阶数P,最后作出最小误差与P的关系曲线图。2.LPC基本原理(1)语音信号的样值序列为s(n),n=1,2,3n,s(n)的预测值为 (1)线性误差为e(n) (2)设计传递函数为A(z),为LPC误差滤波器,设计预测误差滤波器A(z)就是求解预测系数,使得误差在预定准则下最小 (3)(2)理论上常用的是均方误差最小的准则,对各个系数求偏导,另其结果为0,得到 (4)S(n)的自相关序列为 (5)因为它是偶对称,因此 (6)所以上式可以表示为 , (7)设,式子(7)的矩阵形式为,所以就可以求出P个线性预测系数。3. Levinson-Durbin算法杜宾算法是一种有效计算预测系数的算法,它主要是采用递归算法求解,基本思想是:递归解法分步进行。在某一步已经有了一个解,这是第(i-1)阶预测器的系数。然后利用(i-1)阶方程组的解来表示,(i-1)阶方程组的解又可以用(i-2)阶方程组的解表示,依此类推。因此只要解出任意一阶方程的解,就可以通过递推解出任意方程组的解。利用杜宾算法我们从最低阶开始,从低阶到高阶逐阶递推。过程如下: (8) (9) (10) (11) (12) (13)上式(8)(13)对i=1,2,p进行递推求解,其最终解为 (14)在上面的一组式子中,i表示预测器阶数,如表示i阶预测器的第j个预测系数。对于p阶预测器,在上述求解预测器系数的过程中,阶数低于p的各个阶预测器系数也同时得到。4.结果图像分析 5.结论图像结果最佳预测点P值如下表所示 语音文件最佳系数PBird26Dog14GirlEng13MaleChns9从上图中我们可以看出来不同的语言信号在相同的算法下得到的最佳预测阶数是不同的,鸟儿语音所要的阶数是最高的,其余三个语音的阶数相差不大。6.附加程序BIRD语音程序clear all;clc;filename=Bird;load Bird wavedata;%读入语音 %对语音进行分帧len=200;inc=80; %设置帧长,帧移wavesize=size(wavedata,2);fsum=fix(wavesize-len+inc)/inc);%计算帧数f=zeros(fsum,len);%初始化i=1;n=1;while i=fsum j=1; while j=len f(i,j)=wavedata(1,n); n=n+1; j=j+1; end n=n+inc-len; i=i+1;end%去除噪声帧if size(wavedata,1)=threshold%阈值进行比较,比阈值大的就是有效帧 wvalid(n,:)=f(i,:);%设置有效语音矩阵 n=n+1endendvs=n-1;%将有效帧的个数赋给vsfor k=1:vs ap(1:50,1:50,k),g(k,1:50),ep(k,1:50),r0(1,k)=levinson_durbin(wvalid(k,:),50,dc);%调用函数求得预测系数,增益G,以及误差值enddiv=zeros(2,50);for p=1:50 div(1,p)=sum(ep(1:vs,p)./r0(1,1:vs)/vs;%使用方法一来获取最小均方误差与帧能量的比值end%绘制图形plot(1:1:50),div(1,:),-*k);title(归一化误差与阶数关系,(,filename,);xlabel(线性预测阶数p);ylabel(归一化误差)axis(1,50,0,1);grid on;杜宾算法函数function ap,g,ep,r0=levinson_durbin(waveframe,p,dc)fl =size(waveframe,2);%求帧信号的长度r=zeros(1,p);%自相关序列wave=waveframe-dc;%帧信号减去直流量for k=1:fl r(k) =wave(1:fl-k+1)*(wave(k:fl)/fl; %求自相关函数的渐近无偏估计endk=zeros(1,p);%反射系数e=zeros(1,p);%最小均方误差a=zeros(p,p);%线性预测系数矩阵k(1)=r(2)/r(1);%初始化e(1)=(1-k(1)2)*r(1);a(1,1)=k(1);for i=2:p%levinson_durbin递推算法 k(i)=(r(i+1)-a(i-1,1:i-1)*fliplr(r(1+1:i)/e(i-1); a(i,i)=k(i); for j=1:i-1 a(i,j)=a(i-1,j)-k(i)*a(i-1,i-j); end e(i)=(1-k(i)2)*e(i-1);endap=a;g=sqrt(e(1:p);ep=e(1:p);r0=r(1);犬吠的高斯白噪声
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年征兵智商测试题目及答案
- 2026年动词三单测试题及答案
- 2026年抽样检验测试题及答案
- 第10课 人字头教学设计小学书法练习指导五年级下册湘美版
- 高中地理 第3单元 第3节 城乡规划与可持续发展教案 鲁教版选修4
- 头套髯口工岗前操作规范考核试卷含答案
- 第9课 我给老师做哨子教学设计小学信息技术(信息科技)六年级下册青岛版(六三制)
- 2026年人力资源培训智能硬件合同
- 2026年农业营销设备租赁协议
- 2026年秦皇岛山海关桥梁厂医院医护人员招聘笔试备考题库及答案详解
- 2025年山东青岛市八年级地理生物会考真题试卷(含答案)
- 广东省广州市七区2021-2022学年高二下学期期末地理试题
- 2026贵州贵旅集团第十四届贵州人才博览会招聘71人笔试备考题库及答案详解
- 财务部审批付款制度
- 2024人教PEP版四年级英语下册 Unit 6 From farm to table B Lets learn 教案
- 2026年学习教育查摆问题清单及整改措施台账(四个方面16条)
- 吉林省长春市第103中学2026年初三年级下学期第一次考试英语试题试卷含解析
- 膀胱动脉栓塞术后护理查房
- 2026年新版八年级下学期道德法治核心知识点资料
- 市中医医院安保人员突发事件应急处置演练方案
- 2025年中国股权投资市场研究报告
评论
0/150
提交评论