数字通信技术02-3.ppt_第1页
数字通信技术02-3.ppt_第2页
数字通信技术02-3.ppt_第3页
数字通信技术02-3.ppt_第4页
数字通信技术02-3.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.4 语音编码的合成分析方法,3,已知s(n),求x(n)的过程,称为分析。 已知x(n),求s(n)的过程,称为综合(合成)。 LPC声码器原理上的主要缺陷: 发端只有分析过程,没有合成过程,是一个开环系统; 激励模型过于简单。,一、合成分析法,4,合成分析法(AbS,Analysis-By-Synthesis)的基本思想:用合成来指导分析。 将合成器引入编码系统,使之与分析器相结合,在编码器中产生与译码器完全一致的合成语音,将此合成语音与原始语音相比较,根据一定的误差准则调整计算分析器的各个参数,使两者之间的误差达到最小。然后将误差最小时的语音参数传送到接收端,得到高质量的合成语音。,一

2、、合成分析法,5,在LPC基础上采用AbS的编码方法。AbS-LPC编码器包括三个基本部分: 时变滤波器(包括LPC和基音滤波器) 基于感知的最小化处理; 激励信号;,二、AbS-LPC编码器,6,AbS-LPC编码器与译码器,二、AbS-LPC编码器,7,二、AbS-LPC编码器,合成分析编码方法的特点: 发端是一个闭环系统; 对激励信号没有明显的分类,由闭环系统选择与原始语音误差最小的激励信号,使得合成语音质量比传统的LPC声码器好得多。,8,1、 时变滤波器 时变滤波器由LPC合成滤波器和基音合成滤波器级连组成。 LPC合成滤波器实现语音的短时预测; 基音合成滤波器实现语音的长时预测。,

3、二、AbS-LPC编码器,9,二、AbS-LPC编码器,语音的短时预测 短时预测(利用一帧时段内前P个样值预测当前的样值)可以用全极点模型描述,其传输函数为:,其中,H(Z)称为LP 综合滤波器;A(Z)被称为LP 分析滤波器。预测系数ai 是逐帧(帧长2030ms)更新。,10,语音的长时预测 长时预测(利用前几个子帧的参数预测当前子帧的参数)可以用全极点模型描述,其传输函数为1/P(Z ):,二、AbS-LPC编码器,11,二、AbS-LPC编码器,延时参数 D 为基音周期,bi是语音信号的长时预测系数,可以从语音信号中直接提取这两个参量,也可以从去除了短时相关性所得的余量信号中提取。 预

4、测系数个数 i 取1(q = r = 0) 3 (q = r = 1)之间,预测逐子帧(子帧长510ms)更新。,12,在语音谱中,能量较高的频段(如共振峰处)的噪声相对于能量较低频段的噪声不易被感知,在度量原始语音与合成语音之间的误差时可以计入这一因素,在语音能量高的频段,允许二者的误差大一些,反之则小一些,为此在计算二者误差时,引入频域感觉加权滤波器W(f)。,2、感觉加权滤波器 感觉加权滤波器:是根据人的听觉特性对预测残差信号进行处理,以产生较好的主观听觉效果。,二、AbS-LPC编码器,13,fs是抽样速率, 分别是原始信号与合成语音的傅里叶变换。在e达到最小值时, 在整个积分域内保持

5、常数值。,误差定义为:,二、AbS-LPC编码器,在能量大的语音频段内使W(f)小,而能量较小的频段使W(f)较大,从而可提高前者的误差能量而降低后者的误差能量。,14,感觉加权滤波器W(f) 在Z 域的表达式为:, = 01,它控制共振峰区域误差的增加程度。 当 =1时,W(Z ) = 1,此时不进行加权。 当 =0时, W(Z)等于语音的P阶全极点模型谱的倒数,由此得到误差信号频谱的能量分布与语音信号频谱的能量分布变化一致,但此时听觉效果不好,其原因在于人耳对语音的共振峰更敏感,相应地对其信噪比要求也更高。,二、AbS-LPC编码器,实际听音结果表明:8kHz采样频率下, 的经验值为0.8

6、。,15,感觉加权滤波器的频率特性,二、AbS-LPC编码器,16,3、激励信号源 激励信号是AbS-LPC模型的输入,包含不能由时变滤波器谱模型表征的残差结构,如超出长时线性预测范围的相关性就不能由长时线性预测包含,激励信号还包括不能用确定方法有效表征的随机结构。采用AbS方法的声码器都用激励信号源的种类命名。例如: (1)多脉冲线性预测编码(MP-LPC) (2)规则脉冲激励长时预测编码(RPE-LTP-LPC) (3)码本激励线性预测编码(CELP),二、AbS-LPC编码器,2.5 几种混合编码方法介绍,18,用一种稀疏的脉冲序列作为激励,不再提取基音。无论是清音还是浊音,都是用一帧中

7、的有限多个脉冲,以最优估计的幅度和位置,作为激励信号源。,一、多脉冲激励LPC,MP-LPC的原理:,合成语音有较好的自然度,而且有一定的抗噪声能力,从算法上避开了提取基音这一难题,但算法较复杂,运算量较大。 商用标准:INMARSAT-Aero系统的语音编码标准,9.6kb/s。,MP-LPC的特点:,19,用等间距、幅度变化的脉冲作为激励,每个子帧(5ms)估计一次最佳激励脉冲,对脉冲的幅度以及第一个脉冲的位置进行编码,并且与LP参数的编码一起送入信道。 在GSM标准中,每个子帧(5ms)激励源有40个脉冲(样点),共有13个非零脉冲,非零脉冲的间距相等,非零脉冲间有两个零值样点,第一个非

8、零脉冲出现位置有4种可能,分别在第1、2、3、4样点处。,二、规则脉冲激励编码LPC,RPE-LTP-LPC的原理,20,RPE-LTP-LPC编码框图,二、规则脉冲激励编码LPC,21,RPE-LTP-LPC解码框图,二、规则脉冲激励编码LPC,22,二、规则脉冲激励编码LPC,GSM编码方案每帧传输的比特分配,23,二、规则脉冲激励编码LPC,13kb/s REP-LTP采用主观加权最小均方误差准则逼近原始语音波形,具有波形编码特点。 采用长时预测、对数量化比等一系列措施,使其在13kb/s的速率上得到相当好的语言编码质量,其MOS分为3.8分。,REP-LTP-LPC的特点,24,二、规

9、则脉冲激励编码LPC,REP-LTP-LPC的特点(续) 它的抗误码性能较好。若不加纠错,则Pe=10-3时语音质量基本不下降, Pe=10-2时语音质量有所下降,但MOS分仍可达到3.0;加纠错后,在22.8kb/s的速率上,Pe=10-1时语音质量下降不多。 编解码延迟约30ms,加纠错后为80ms。 非语音信号编码效果不太理想,传送数据的效果也不理想。,25,CELP:在预先设计的一组激励序列矢量码本中按一定准则搜索每一个子帧的最佳码矢量作为激励信号,对滤波器的参数以及码本的标号和增益进行编码。,三、 码本激励LPC,CELP原理,26,三、 码本激励LPC,CELP编码器原理框图,27

10、,三、 码本激励LPC,CELP编码的特点,运用线性预测技术,构造声道模型; 运用矢量量化技术构成高效的残差激励; 运用合成分析法和感觉加权进行闭环搜索,从码本中搜索出最佳码矢量,作为激励信号。,28,CELP的码本,是将预测误差信号可能出现的各种样值的编码组合按一定规则排列存储在存储器中,就像字典一样,每一个样值的编码组合有一个地址码。收、发双方各有一个同样的码本。 发端预测出误差信号后,在本方的码本中搜索出与该残差信号最接近的码矢量的地址码,将地址码传输到收方。 收方根据收到的地址码在己方的码本中找出相应码矢量加到滤波器上,得到重建的话音。 由于传输的是码本的地址码,大大地减少传输的比特数

11、,从而降低编码速率。,关于CELP的码本(1),三、 码本激励LPC,29,CELP一般建有两个码本: 自适应码本:码字逼近语音的长时周期性(基音)结构; 固定的随机码本:码字逼近语音经短时、长时预测后的残差信号。 如果码本编得好,码本中的码字与实际的误差信号极为接近,同时码本中码字又少,就可以以较低的编码速率得到较好的话音质量。 利用AbS闭环系统以及码本搜索算法可以得到最佳自适应码矢量及其最佳增益ga、最佳随机码矢量及其最佳增益gs。两者加权相加后即为CELP激励源。,关于CELP的码本(2),三、 码本激励LPC,30,三、 码本激励LPC,G.728(LD-CELP),16k/s; G

12、.729(CS-ACELP),8kb/s; IS54、IS95(VSELP、QCELP),7.95kb/s、8.5kb/s; FS-1016(CELP),4.8kb/s。,商用标准,31,FS-1016编码器结构图,三、 码本激励LPC,MSPE准则,32,8kHz采样,帧长240个样点(30ms),一帧内有4个子帧(60个样点,7.5ms),每帧发送144个比特。 采用AbS闭环系统,发端有10阶短时线性预测、长时自适应码本搜索、随机码本搜索,感觉加权滤波器。 发送的参数是每帧的10个LSF参数(34bits);每子帧的自适应码本标号(偶数子帧6bits,奇数子帧8bits )及增益(5bi

13、ts) 、随机码本标号(9bits)及增益(5bits)。,FS-1016 4.8kb/s的CELP声码器的特点,三、 码本激励LPC,33,三、 码本激励LPC,关于QCELP QUALCOMM公司于1993年研制成功了采用QCELP(QUALCOMM CELP)专利声码器算法的全双工话音编译码器Q4400/Q4401声码器。,Q4400声码器可提供固定速率和可变速率两种工作模式。固定速率模式有4.0kb/s、4.8kb/s、8.0kb/s和9.6kb/s四种速率供用户选择。而变速率模式则可根据输入信号的能量从800b/s到9600b/s自动地调整最佳速率,每次调整间隔为一个帧长(20ms)

14、。,34,三、 码本激励LPC,关于QCELP,35,IMBE( Improved MBE):1991年定为 “INMARSAT-M”系统的语音编码标准。 DVSI(Digital Voice System Inc.)提出的AMBE (Advanced MBE)算法,进一步改进了合成语音的质量和鲁棒性。被选为INMARSAT ICO 系统和 “铱”系统的语音编码标准。,四、多带激励LPC,美国MIT大学林肯实验室1988年提出了多带激励MBE(Multi-Band Excitation)语音编码方案,MBE在2.4kb/s-4.8kb/s速率上能合成出音质比传统声码器好得多的语音,而且具有较好

15、的自然度和容忍环境噪声的能力。,36,传统声码器的缺陷是将全频带的语音简单地由清浊音和基音周期表示,导致合成语音自然度差。对于“干净”的语音信号,LPC声码器这种二元激励模型能够在2.4kb/s 甚至更低的速率上给出可懂度相当高的合成语音。但是对于含有噪声的语音信号,由于无法准确地提取语音参数,LPC声码器性能严重恶化。 事实上许多语音段既含有周期分量,又含有非周期分量。这种特性在频谱上的表现是:在某些频段的语音谱呈现周期谱的特征,而在某些频段上则呈现噪声谱的特征。,四、多带激励LPC,传统声码器的缺陷,37,CELP以语音线性预测模型为基础,对残差信号采用了矢量量化,搜索过程用A-B-S方法

16、,并采取感觉加权均方误差最小判决准则,在4.816kb/s 的速率范围内获得了巨大的成功。然而当速率进一步降低时,由于没有足够的比特表示激励矢量,残差信号的量化将产生较大的误差,致使合成语音信号的质量迅速下降。,四、多带激励LPC,传统声码器的缺陷(续),38,将语音谱在整个频带内按基音谐波频率为中心,以基音频率为带宽划分为若干个频带; 对每个频带根据频谱特征分别进行清浊音判决,形成多带激励谱。 整个激励谱由基音频率和它的谐波以及一组清浊音判决参数表示,较好地反映了语音信号的特征。 合成语音时,根据各带的清/浊音参数采用不同的激励信号合成语音,最后将分带合成信号相加形成全带合成语音。,四、多带

17、激励LPC,多带激励语音模型,39,MBE以多带激励代替LPC中的二元激励,无论是浊音、清音、还是过渡音,在编码过程中都要提取三种参数: 基音频率(或基音周期); 按基音频率的各次谐波分带后每个频带的谱包络参数(可以近似地认为每个分带内的谱包络保持不变); 每个频带的U/V判决信息。,四、多带激励LPC,多带激励语音分析算法,40,四、多带激励LPC,同时提取这三个参数所涉及的计算量相当大。通常采用一种次优的算法分两步来完成参数的提取。 首先确定基音频率和每个分带的谱包络参数,提取这些参数时可以采用与A-B-S类似的方法。 然后再对每个分带进行U/V判决。,41,美国电信工业协会(TIA)为了

18、选择北美陆地移动通信系统的语音编码标准,对工作在7.2kbps速率上的四种声码器的语音质量进行了测试。测试结果见下图。在7.2kbps的IMBE算法中,含有4.4kbps的语音编码,2.8kbps的差错控制编码。测试条件是不同的误码率和不同的运动速度。,四、多带激励LPC,MBE性能评估,42,四、多带激励LPC,IMBE与其它声码器的语音质量比较测试,43,1993年美国国防部语音信号数字处理协会(DDVPC)开始选择新的美国国防部2.4kb/s标准,于1996年3月最终选用TI公司和ASP公司联合推出的混合激励线性预测(MELP-Mixed Excitation Linear Prediction)声码器取代旧标准FS-1015. MELP声码器的采样率为8kHz,每180个样点为一帧,帧长为22.5ms,每帧量化比特为54bits,总的速率为2.4kb/s。,五、混合激励LPC,44,以混合激励代替基本LPC模型的二元激励,将周期脉冲激励源和白噪声源混合作为激励信号,较准确地描述过渡帧和弱浊音帧的激励信号。 吸取MBE算法的分带思想,在各个子带上对混合比例进行控制。 改进周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论