数字语音处理及MATLAB仿真 (第3版)课件 第6章 语音信号线性预测分析_第1页
数字语音处理及MATLAB仿真 (第3版)课件 第6章 语音信号线性预测分析_第2页
数字语音处理及MATLAB仿真 (第3版)课件 第6章 语音信号线性预测分析_第3页
数字语音处理及MATLAB仿真 (第3版)课件 第6章 语音信号线性预测分析_第4页
数字语音处理及MATLAB仿真 (第3版)课件 第6章 语音信号线性预测分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音信号线性预测分析第6章6.1语音的发音机理与数学模型6.2线性预测分析原理6.3线性预测分析语音信号模型之间的关系主要内容6.4LPC方程的自相关解法及其MATLAB实现6.5模型增益G的确定6.6LPC应用—基音周期检测图1发音器官机理模型

图2浊音”m”时域图和声音图3清音”i”时域图和声音6.1语音的发音机理与数学模型u(n)----U(Z)s(n)----S(Z)语音信号的数字模型系统表达式:

Gu(n)*h(n)=s(n)GU(Z)H(Z)=S(Z)不同的参数产生不同的声音,参数求解方法?机器学习中,提取不同的参数,能够合成不同的声音,也能够识别不同的声音。

语音信号的数字模型时域:Z域:H(z)Gu(n)s(n)图5语音信号产生系统

一个语音取样的现在值可以用若干个语音取样过去值的加权线性组合来逼近。加权系数叫线性预测系数(LPC)

定义6.2线性预测分析原理

设语音信号的样值序列为:

p阶线性预测:根据信号过去p个取样值的加权和来预测信号当前取样值s(n)。(p阶线性预测器)设为s(n)的预测值,则有线性预测系数:6.2.线性预测分析原理

线性预测误差e(n):信号s(n)与其线性预测值之差。e(n)表示式为:6.2.线性预测分析思考题:研究误差的意义?图6原始信号与误差信号时域图LPC分析:即设计预测误差滤波器A(z)的过程,也就是求解预测系数,使得预测器的误差e(n)在某个预定的准则下最小。A(z)s(n)e(n)图7LPC误差滤波器6.2.线性预测分析A(z)称为LPC误差滤波器。强调:线性预测的基本问题就是由语音信号直接求出一组线性预测系数,使得在一短段语音波形中均方预测误差最小。6.2.线性预测分析由得将对各个系数求偏导,并令其结果为零:6.2.线性预测分析令s(n)的自相关序列为偶对称输入信号已知,则p个预测系数通过求解方程即可得到。6.2.线性预测分析6.3线性预测与语音信号模型之间的关系语音信号模型线性预测分析Gu(n)=e(n)

当一个语音信号序列是基于模型产生的,且激励源是具有平坦谱包络特性的白噪声时(相当于清音语音)且H(z)和所分析的语音序列有相同的谱包络特性;但在浊音语音情况下,激励源是一间隔为基音周期的冲激序列,但u(n)是一串冲激组成,意味着大部分时间里它的值是非常小的(零值)。由于采用均方预测误差最小准则来使预测误差e(n)逼近u(n),和u(n)能量很小这一事实并不矛盾,因此,为简化运算,我们认为,无论是清音还是浊音,模型都是适合于线性预测分析的。语音识别中需要提取LPC系数语音编码中需要提取LPC系数语音合成中需要提取LPC系数应用领域语音自动报站器语音查询、声控语音拨号6.4LPC方程的自相关解法及其MATLAB实现预测误差滤波器的输出方均值或输出功率最小。称这一最小方均误差为正向预测误差功率,即上式第二项为0。6.4LPC方程的自相关解法及其MATLAB实现以上两式组合起来得称为尤勒-沃尔克(Yule-Walker)方程方程的系数矩阵为托普利兹(Toeplitz)矩阵6.4LPC方程的自相关解法及其MATLAB实现为了解得线性预测系数,必须首先计算出自相关序列R(k),R(k)可用下式估计其中的求和范围n的不同定义,将会导致不同的线性预测解法。经典的方法有两种:一种是自相关法,另一种是协方差法。6.4LPC方程的自相关解法及其MATLAB实现

利用对称托普利兹(Toeplitz)矩阵的性质,自相关法求解可用Levinson-Durbin(莱文逊-杜宾)递推算法求解。该方法是目前广泛采用的一种方法。利用Levinson-Durbin算法递推时,从最低阶预测器开始,由低阶到高阶进行逐阶递推计算。自相关法的详细求解过程6.4LPC方程的自相关解法及其MATLAB实现自相关法递推过程如下:联立左面5式可对i=1、2…、p进行递推求解,其最终解为:

对于p阶预测器,在上述求解预测器系数的过程中,阶数低于p的各阶预测器系数也同时得到。6.4LPC方程的自相关解法及其MATLAB实现6.5模型增益G的确定对上式两边乘以s(n)并求平均值,等式右边为由得6.5模型增益G的确定等式左边为比较得出与因为得到6.5模型增益G的确定思考LPC优点LPC缺点用线性预测谱作为语音信号谱的解释图8LPC谱与实际谱的比较

LPC分析的频域解释图形比较:下图为原始语音信号和经过LPC逆滤波语音的时域波形图。

LPC分析的频域解释图9LPC残差和原始语音时域图图形比较:下图为原始语音信号和经过LPC逆滤波语音的频域波形图。

6.9LPC分析的频域解释图10LPC残差和原始语音频域图线性预测分析的阶数p可有效控制所得谱的平滑度:

LPC分析的频域解释图12不同阶数的语音LPC频谱图16kHz采样率时,清音和浊音语音相对应的归一化预测误差随阶数p的变化曲线如下图:

LPC分析的频域解释-31-

6.6线性预测分析应用举例

线性预测在语音处理中有很广泛的应用。本节主要讨论线性预测技术在估计语音参数方面的某些应用。-32-

基音检测

基音检测方法很多,以线性预测为基础的一种基音检测方法。对语音进行线性预测分析的结果,得到了一组预测系数

。以这

组系数为参数构成一个全极点滤波器,其传输函数为这就是语音信号模型中的滤波器,它的逆滤波器是预测误差滤波器,其传输函数为-33-将语音信号加在预测误差滤波器输入端,滤波器的输出便是预测误差信号,即

对应的z变换(或谱)为-34-

曾经讨论过线性预测与信号模型之间的关系。如果认为实际的语音信号是由一个全极点模型产生的,该模型是一个p阶线性预测器,那么预测误差信号e(n)可以认为是模型激励源的一个很好的逼近。根据这一认识,对于浊音语音来说,其预测误差信号必将在基音周期的开始时间出现一个很大的脉冲。-35-下图是浊音“啊”的波形x(n)和预测误差信号波形e(n),线性预测阶数为p=14,语音段长度为40ms,这段语音大约包含5个基音周期。因此,检测误差信号两相邻最大脉冲之间的距离即可对基音周期作出估计。但是,有一些浊音,例如鼻音,它们的预测误差信号的高峰脉冲常常并不突出和尖锐,因而很难靠它们来估计基音周期。-36-图11浊音段“啊”的波形及预测误差波形-37-

简化逆滤波器跟踪(SIFT)算法是检测基音周期的一种比较有效的方法。如图5.3所示,该方法分两步。-38-

图12SIFT算法框图截短预防频谱泄露1.聚焦局部信号中的周期性特征2.增强信号周期性的体现-39-首先,语音信号经过一个截止频率为lkHz的模拟低通滤波器,滤去较高的共振峰频率成分;然后以8kHz取样频率进行取样,并从每4个取样中抽取出一个取样来,这相当于把8kHz取样频率进行4次分频,因而最终等效于2kHz的取样频率;对取样信号加窗后用自相关法进行线性预测分析,阶数选为p=4(由于共振峰F3和F4已被滤去);根据LPC分析的参数构造逆滤波器A(z)(即预测误差滤波器),并让语音取样信号通过该滤波器,所得输出便是预测误差信号;预测误差信号加窗后便完成了第一步骤的全部计算。第一步:执行上面部分的功能-40-

第二步:执行图中下面部分对加窗后的预测误差信号进行相关分析,进一步减小了共振峰的影响,同时也减小了基音峰的动态范围;进行1:4插值,恢复原来语音信号采样率;进行峰值检测和去除“野点”的误差校正。下图是用SIFT算法估计一段语音得到的基音变化轨迹。-41-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论