版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,3.6 语音信号的线性预测 (linear prediction LPC),3.6.1 线性预测基本原理 3.6.2 线性预测和信号模型之间的关系 3.6.3 Levinson-Durbin 算法 3.6.4 格型滤波器 3.6.5 由已知数据计算预测系统的方法,.,传输函数,Av,冲激序列 发生器,声门脉冲 模型G(z),随机噪声 发生器,基音周期TP,AN,线性系统 声道V(z),辐射模型 R(z),清/浊音开关,.,3.6.1 线性预测分析的基本原理,1.线性预测分析的基本思想:,由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值。,线性预测,x(n-p),x
2、(n-p+1),.x(n-1),.,时间(样点),x(n),x(n-1),x(n-p),p个点,线性预测:,Auto-Regressive Modeling,.,通过使实际语音x(n)和线性预测结果 之间的误差e(n)在某个准则下达到最小值来决定唯一的一组预测系数 。 这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。,.,Z-1,Z-1,Z-1,x(n),e(n),+,-,根据e(n)最小均方误差准则,来决定唯一的一组预测系数,.,2.均方误差是预测系数的二次函数,.,在信号平稳的情况下,均方误差为权矢量的二次函数。是一个N+1维空间中一个
3、下凹的超抛物面,有唯一的最低点,2个权系数构成的3维空间中一个下凹的抛物面,.,预测误差与过去的样点不相关,3.均方误差最小导致预测误差与过去的样点不相关,.,.,4.标准方程式,.,.,5.最小均方误差的另一种求解方法,.,取遍所有的k,组成一个矩阵,称为Yule-Walker方程。,5. Yule-Walker方程,.,Toeplitz矩阵,.,(1)根据最小均方误差准则,求出预测系数ak (2)已知预测系数ak,求出最小均方误E(e2(n)min,.,对e(n)进行Z变换,有:,e(n),x(n),4.用e(n)和ak求x(n)(合成),.,3.6.2 线性预测和信号模型之间的关系,Av
4、,冲激序列 发生器,声门脉冲 模型G(z),随机噪声 发生器,基音周期TP,AN,线性系统 声道V(z),辐射模型 R(z),清/浊音开关,一、语音生成模型,.,清/浊开关,声道模拟 滤波器H(z),基音周期,冲激序列 发生器,随机噪声 发生器,增益,u(n),输出 语音x(n),将语音生成模型简化,将辐射、声道和声门激励进行组合,用一个时变数字滤波器来表示。,.,用全极点模型来描述声道滤波器特性,.,e(n),x(n),二、语音信号的线性预测模型,全极点的IIR滤波器,.,三、两模型中信号之间的关系为:,生成模型,线性预测模型,对同一语音信号,有:,.,预测误差e(n)就是激励信号Gu(n)
5、,预测系数apk就是声道滤波器的系数dk。 线性预测分析可以对生成模型的增益参数G和滤波器系数dk进行直接和高效率的计算。这样,结合清浊音的判断和基音周期的估计,得到语音信号生成模型的全部参数,实现语音的产生。,.,清/浊开关,基音周期,冲激序列 发生器,随机噪声 发生器,增益G,u(n),输出 语音x(n),LPC系数 a1,a2, ap,.,激励信号u(n)正比于误差信号e(n),其比例为增益常数G。求出G的依据是,在一帧中,误差信号的能量等于输入激励信号(Gu(n))的能量。,激励信号具有单位方差,N为帧长,e(n)Gu(n),四、求解G,.,在一帧内误差信号e(n)均方误差最小的原则来
6、求解ak。这个方法是合理的。,e(n) 均方误差最小对应其频谱是平坦的。而在频谱是平坦的只有脉冲波和白噪声两种,正好对应浊音和清音。,.,求出G和ak,可得时变滤波器的系统函数。在输入激励的作用下,可合成语音。语音的参数合成是就是在发送端利用线性预测方法求出G和ak,结合激励信号u(n),进行编码,传送到接收端,进行组合,合成声音。,参数 合成,a1,a2,ap,Gu(n),输入语音x(n),语音输出x(n),线性 预测 分析,五. 线性预测分析用于语音编码和语音合成,.,根据语音信号的短时平稳性,在短时帧内(20ms)认为信号是不变,则将激励信号u(n)和滤波器系数ak、G每隔20ms刷新一
7、次,相当于对激励信号u(n)和滤波器系数dk、G的采样频率为50Hz。由于采样频率大大降低,因此编码速率较低,可达2.41.2kb/s。,20ms,20ms,u(n)、ak、G,u(n)、ak、G,.,编码速率,用比特/秒(b/s或bps)来度量,用I表示。 I=R fs ,R代表每个语音采样值编码所需的比特数;fs是采样频率。 当fs=8kHz,每个采样值用8比特位来编码,则编码速率为64kb/s。,.,一般情况下,而是传递以下参数: (1)浊音的基音频率和振幅 (2)清/浊音标志 (3)G,a1,语音输出x(n),线性 预测 分析 基音频率 清/浊音判别,参数 合成,a2,ap,基音频率,
8、输入语音x(n),清/浊音标志,G,.,CDMA系统的关键技术 CDMA系统是以扩频调制技术和码分多址接入技术为基础的数字蜂窝移动通信系统。 可变速率声码器:声码器是对模拟语音信号进行数字化编译码的部件,其目的是在保证语音传输质量的同时数据传输速率尽可能低。 在移动通信中,一般采用线性预测编码(LPC)方式,其组成原理如图所示。,.,.,线性预测编码原理是,首先通过A/D转换器将模拟语音信号变成数字语音信号,经过线性预测分析从语音信号中求出一组预测器系数,一般为12组预测滤波器系数,使得一帧语音波形均方预测误差最小。另外,再经过基音检测、清浊音判决提取语音信号中的基音周期Tp、清浊音判决信息U
9、/V和代表语音强度的增益控制参数G。连同12组预测滤波器系数,共15个参数包含了语音信号中的主要信息。通过对每帧语音信号的分析,得到这15个参数,经过量化编码后发送出去。,.,在接收端,通过参数译码得到一帧语音信号的特征参数,包括基音周期Tp、清浊音判决信息U/V、增益控制参数G和预测滤波器系数。将这一组参数作用于语音合成滤波器,再经过D/A转换器就得到合成语音信号。,.,利用线性预测系数求共振峰,离散频谱|A(k)|的谷点就是共振峰的位置。通过求A(z)多项式的系数序列1,a1,a2,ap的DFT,就可以得到|A(k)|。,六. 线性预测系数用于共振峰估计,的峰值对应共振峰,的谷点对应共振峰
10、,.,离散频谱|A(k)|,谷点,1,-1.45,0.9,-0.45,-0.12,0.36,-0.30,0.39,0.12,-0.34,0.06 p=10 利用FFT,补零至2N。,.,求出预测系数,需要对自相关矩阵(已知的)求逆,一般Toeplitz矩阵是非奇异矩阵,它的逆矩阵存在。p表示阶数。,七、线性预测方程组的求解,系数矩阵,.,在已知自相关函数的前提下,根据e(n)均方误差最小的原则来求解ak,有:Levinson-Durbin算法和格型滤波算法。 Levinson-Durbin算法递推解Yule-Walker 方程。,.,3.6.3 Levinson-Durbin 算法(求预测系数
11、),Levinson算法逐阶梯推导示意图,1阶,2阶,3阶,p阶,.,一、相邻两阶的预测系数的关系推导,p阶,p+1阶,滤波器系数,.,p阶和p1阶Yule-Walker方程,.,p阶的Yule-Walker方程进行变换,增加一行一列得到扩大方程,.,扩大方程倒置得到预备方程,.,预备 方程,扩大 方程,p1阶Yule-Walker方程,.,p阶预测系数和p1阶预测系数的关系 p+1阶的解写成扩大方程和预备方程的解的组合,第p+1阶反射系数,.,第p+1阶反射系数的求解,上式各项左乘p+1阶系数矩阵,.,二、完整的预测系数的公式 已知p阶预测系数求p+1阶预测系数,p阶,p+1阶,.,p=1阶
12、的预测系数和最小均方误差,p=2阶的预测系数和最小均方误差,p=3阶的预测系数和最小均方误差,.,滤波器系数,三、滤波器系数的倒序列构成新滤波器,滤波器系数的倒序列构成新的滤波器,.,四、p+1阶预测滤波器,.,五、p+1阶预测系数矩阵倒置构成的新滤波器,.,直接对预测系数ak量化后再传输是不合适的,因为系数ak的很小变化都将导致合成滤波器极点位置的极大变化,造成不稳定的现象。因此必须将预测系数变换成其他更适合编码和传输的参数形式。,3.6.4 格型滤波器,.,1.前向预测和反向预测,H(z)是一个全极点IIR滤波器,可能造成滤波器不稳定。因此在滤波器的结构上采用格型结构,引入反馈,解决不稳定
13、的弱点。同时在算法上,不需要先计算相关矩阵,直接从语音样点上得到预测器系数。,.,前向预测,p阶,.,p阶,后向预测,.,前向预测误差,反向预测误差,按前向均方误差最小的准则来求得的预测系数,对于反向预测预测器也是最佳预测系数。,.,2. 和 的关系,.,3. 和 的关系,.,4.格型滤波器结构,x(n),.,5.零阶预测,6.预测误差滤波器分析滤波器,.,7.预测误差滤波器的逆滤波器合成滤波器,Z-1,Z-1,Z-1,x(n),.,线性 预测 分析 基音频率 清/浊音判别,参数 合成,r2,rp,基音频率,输入语音x(n),清/浊音标志,G,r1,8.格型滤波器语音合成技术框图,合成 语音,
14、一帧典型的LPC参数包括1bit清浊音标志,大约5bit增益参数G,6bit基音周期,56bit的每个反射系数(共有812个),故每帧约需60bit.若一帧时间为25ms,则编码速率为2.4kb/s。,.,9.格型滤波器的性质,(1)各阶反射系数的模值小于1,由于各阶预测误差功率均大于零,故:,(2)各阶反向预测误差互不相关或正交,各级间去耦,局部最优能保证全局最优,.,3.6.5 由已知有限个数据计算预测系统的方法(用其他量来代替自相关函数,得到预测系数 ),1.自相关法,代替,带入Yule-Walker方程,利用Levsion-Durbion 算法和格型滤波器求出预测系数和预测误差功率的估
15、计值。,.,依据:用时间平均的最小平方准则,代替集合平均的最小平方准则,得到同一个Yule-Walker方程,.,的求解,.,例题:已知信号的四个观察数据为x(n)=x(0),x(1),x(2),x(3)=2,4,1,3,求,p=1,N=4,.,2. 协方差法,代替集合平均的最小平方准则,.,例题:已知信号的四个观察数据为x(n)=x(0),x(1),x(2),x(3)=2,4,1,3,求,N=4,p=1,.,的求解,.,3. Burg法,(1)尽可能利用能够获得的有限个数的数据计算预测误差。采用类似协方差方法。,(2)保证滤波器的稳定性。采用格型滤波器,其反射系数,.,.,(3),(1)初始化,(2)计算下列各量,具体迭代时,从p=1,开始,.,(6),(5),(4),.,A = LPC(X,N) finds the coefficients, A= 1 A(2) . A(N+1) , of an Nth order forward linear predictor Xp(n) = -A(2)*X(n-1) - A(3)*X(n-2) - . - A(N+1)*X(n-N) such that the sum of the squares of the errors err(n) = X(n) - Xp(n) is minimized.,MATLAB命令,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工现场工序交接方案
- 2026年碳酸镁行业分析报告及未来发展趋势报告
- 2026年宽带滤光片行业分析报告及未来发展趋势报告
- 2026年一次性使用无菌输血耗材行业分析报告及未来发展趋势报告
- 2026年环氧玻璃钢行业分析报告及未来发展趋势报告
- 2026年DCS控制系统行业分析报告及未来发展趋势报告
- 2026年高纯销酸锶行业分析报告及未来发展趋势报告
- 2026年5G网络优化行业分析报告及未来发展趋势报告
- 产后出血预防指南培训
- 施工高支模安全方案
- 2026海南省征信有限公司招聘备考题库(含答案详解)
- 2026重庆市荣昌区人力资源和社会保障局招聘1人笔试备考题库及答案详解
- 2026年城市协管员招聘综合知识(城管知识)题库及答案
- 地下车库及主楼地下室腻子施工方案
- ICU患者突发心律失常应急预案演练脚本
- 2026届广东省汕头市潮阳实验校中考数学全真模拟试卷含解析
- 2026届江苏省南京市、盐城市高三一模数学试题(含答案)
- (一模)2026年深圳市高三年级第一次调研考试语文试卷(含答案解析)
- 小贷公司管理规章制度
- 图书发行考核制度
- 物业管理法律讲座课件
评论
0/150
提交评论