数字通信技术02-1.ppt_第1页
数字通信技术02-1.ppt_第2页
数字通信技术02-1.ppt_第3页
数字通信技术02-1.ppt_第4页
数字通信技术02-1.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2,2.1 语音编码的方法、性能和标准 2.2 信号的采样和量化 2.3 语音的产生模型和LPC声码器 2.4 语音编码的A-b-S方法 2.5 几种混合编码方法,内容,3,了解语音信号数字化的目的和要求;理解语音信号的波形编码、参数编码、混合编码的定义;掌握对语音编码信号性能的评价方法。 理解标量量化和矢量量化的原理及异同点。 了解语音信号的参数模型;掌握线性预测的概念、线性预测声码器的工作原理。 掌握参数编码中合成分析算法的基本原理和优缺点;了解常用的语音信号的混合编码方法。,要求,2.1 语音编码的方法、性能和标准,5,语音编码方法的分类: 波形编码 参数编码 混合编码,一、语音编码的方

2、法,6,1. 语音信号的波形编码 原理: 从语音信号波形的特点出发,在时间轴上对模拟语音按一定的速率抽样,对波形的采样值,或其预测值,或其预测的误差值进行量化并编码,编码后的信号为二进制数字序列。解码是其反过程,将收到的数字序列经过解码和滤波恢复成模拟信号。,一、语音编码的方法,7,特点: 以重构语音波形为目的,力图使重建语音波形保持原语音信号的波形形状。 适应能力强、语音质量好。 编码速率高。 在16至64kbit/s的速率上获得较高的编码质量,当速率进一步下降时,其性能会下降较快。,一、语音编码的方法,8,常见的波形编码方式: 脉冲编码调制(PCM)、增量调制(M) 自适应增量调制(ADM

3、)、自适应预测编码(APC)、自适应差分编码(ADPCM) 子带编码(SBC),一、语音编码的方法,9,2. 语音信号的参量编码 原理: 从语音信号的产生机理出发,构造语音信号的模型,提取描述语音信号的特征参数,对模型参数或其预测值进行编码。在收端,根据特征参数通过模型重构语音信号。,一、语音编码的方法,10,特点: 编码速率低,可压缩到2kbit/s-800bit/s; 合成的话音质量差,只能达到中等,自然度较低; 不以重构语音波形为目的,在解码端重构一个新的有相似声音但波形不尽相同的语音信号。 常见的方式: 线性预测编码(LPC),及其各种改进型,如MBE等。,一、语音编码的方法,11,3

4、. 语音信号的混合编码 原理: 混合编码将波形编码和参量编码组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形编码的高质量和参量编码的低速率,目前在1.2-16Kbit/s速率上能够得到高质量的合成语音。 特点: 低速率、高质量,一、语音编码的方法,12,常见混合编码方式: 多脉冲激励线性预测编码(MPLPC) 规则脉冲激励线性预测编码(RPELPC) 码本激励线性预测编码(CELP) 矢量和激励线性预测编码(VSELP) 多带激励(MBE)及改进型IMBE(Improved MBE)和AMBE(Advanced MBE) 混合激励线性预测(MELP),一、语音编码的方

5、法,13,说明 上述语音编码器的分类方法只是一种较通用的方法,并非十分严格。 除了传统的波形编码器和参数编码器以外,许多新型的语音编码技术都比较复杂,很难严格分类。 基于分析合成技术的线性预测编码器则既可以视为参量编码,也可以视为混合编码。,一、语音编码的方法,14,语音编码性能评价的参量: 1、语音编码质量 2、编码速率 3、编解码的复杂度 4、编解码延时,语音编码的基本目标: 在给定编码速率的条件下,用尽量小的编解码延时和复杂度,得到尽量好的重建语音质量。,二、语音编码性能的评价,15,1、语音编码质量 语音编码质量是衡量语音编码算法优劣的关键性能之一,在数字通信中常把语音质量分为四级:

6、广播级质量 长途电话质量 通信质量 合成语音质量,二、语音编码性能的评价,16,语音编码质量用质量评估指标衡量,分为以客观评定方法和主观评定方法两大类。 主观评定方法是以人类听话时对语音质量的感觉来评定。国际上常用的主观评定标准主要有: 平均意见得分MOS(Mean Opinion Score) 判断韵字测试DRT(Diagnostic Rhyme Test) 判断满意度测量DAM(Diagnostic Acceptability Measure) 可懂度指数AI (Articulation Index),二、语音编码性能的评价,17,MOS评定方法 由于语音质量高低的直接感受者是听众的主观感

7、觉,因此目前广泛采用的评定方法是MOS。获取MOS的方法是,由数十名试听者在不同的信道环境中试听并给予评分,然后求出统计平均分。 分数等级 采用5级分制:5分为优,4分为良,3分为中,2分为差,1分为不可接受。4分以及4分以上为高质量语音编码,达到长途电话质量, 3.5分左右为通信级质量,3分以及3分以下为合成语音质量。,二、语音编码性能的评价,18,对应于主观评定等级,还有一个收听注意力等级(Listening Effort Scale)。表2.1给出了主观评定等级制的质量等级、分数和相应的收听注意力等级。,二、语音编码性能的评价,19,客观评价的方法: 时域:信噪比、加权信噪比、平均分段信

8、噪比等 频域:谱失真测度、LPC倒谱距离测度等,说明: 以上方法都建立在度量均方误差的基础上,其特点是计算简单,但不能完全反映人对语音质量的感觉,对于速率为16kb/s以下的中低速率语音编码尤为突出。主要适用于速率较高的波形编码的质量测量。,二、语音编码性能的评价,20,2. 编码速率 语言编码后的速率用“比特/秒”度量或用“比特/样点”度量。后者表示平均每个样点所需的编码比特数。 通常编码速率高,则编码后的语音质量高,但所需的传输带宽就宽。,二、语音编码性能的评价,好的语音编码方法,是在保持语音质量的前提下降低速率。,21,3. 编解码的复杂程度 编解码的复杂度与算法有关。 通常算法复杂,则

9、话音质量好,编码速率低,但实现复杂,且体积大、功耗高、成本高,甚至编解码延时大。,二、语音编码性能的评价,22,二、语音编码性能的评价,4. 编解码延时 编解码延时也与算法有关。 通常算法复杂,则编解码延时大。也有专为减小延时的短延时算法。不过,质量好、延时短的算法,相应的编码速率也高。,23,5. 对语音编码的要求 在满足用户对语音质量要求的前提下,编码速率尽可能低。 在强噪声环境中,算法应有较好的抗误码性能,也就是说,当误码率较低时(例如为10-2)仍能保持良好的话音质量。 编、解码延迟应控制在几十毫秒之内,越短越好。 复杂性要适度,以便于使用大规模集成器件。,二、语音编码性能的评价,24

10、,二、语音编码性能的评价,6. 几种语音编码的质量比较,25,LD-CELP:低时延-码激励线性预测 MP-MLQ:多脉冲最大似然量化 ACELP:代数码激励线性预测 CS-ACELP:共轭结构-代数码激励线性预测,三、语音编码的标准,26,ETSI:欧洲电信标准协会 TIA:(北美)电信工业协会 RCR:(日本)无线通信系统研究发展中心 DVSI:数字声音系统公司,三、语音编码的标准,27,保密电话语音编码标准,三、语音编码的标准,窄带保密电话应用于带宽受限信道,目前只有美国公布了所用保密电话的标准。 FS-1015标准:2.4kb/s的LPC声码器,DRT为90% FS-1016标准:4.

11、8kb/s的CELP声码器,比FS-1015具有好得多的自然度及环境噪声能力。 混合激励线性预测(MELP)标准:编码速率为2.4kb/s,语音质量优于FS-1016。,28,各种语音编码标准的相对效果,三、语音编码的标准,2.2 信号的采样和量化,30,采样是将一个时间连续的信号变换为时间离散的信号,即用间隔均匀的样点表示时间连续的信号。 量化就是把连续取值的采样幅度变成有限取值。,信号的采样和量化,31,对于一个最高频率为WH的低通信号m(t),如果以T1/2WH秒的间隔对它进行等间隔采样,则m(t)将被所得到的采样值完全确定,即模拟信号m(t)可以从它的采样值中重构。 采样间隔的倒数称为

12、采样速率,用fs表示,则fs应满足: fs 2WH。 如果fs 2WH ,则会产生失真,这种失真称为混叠失真。,低通信号的均匀采样定理,一、采样,32,用低通滤波器还原出m(t),见图(g),一、采样,33,一、采样,34,带通信号的采样,如果取fs = 2fh,虽然没有错误,但却非常浪费频带。,一、采样,35,一、采样,36,一、采样,当f1远远大于B时,可以认为fs 2B,37,一、采样,音频信号的采样频率,三类音频信号基本参数的典型值,通常将语音信号的频带限制在话带内,这样做将使能量损失约1%。,38,标量量化 均匀量化 非均匀量化 自适应量化 差分量化 矢量量化,量化的实现方式有多种,

13、二、量化,39,1. 标量量化 标量量化:对每个采样值分别进行量化称为标量量化。 从数学角度看,就是将取连续值的无限集合x通过变换Q映射到一个只有L个离散值的集合yk,k = 1,2,L。,二、量化,40,当量化器Q的输入落入(xk,xk+1)时,量化器的输出为yk,即: y = Q(x) = yk, 当 x (xk,xk+1) 时, k = 1,2,L。 xk:第k个分层电平或判决电平 k:第k个量化间隔或量化区间, k= xk+1 - xk yk:第k个量化电平或重建电平 L:量化电平数,二、量化,量化过程,41,均匀量化: 1)对采样值直接量化 2)量化间隔k相等 3)量化电平取各量化区

14、间的中点,即 yk =( xk+1+ xk)/2 4)方法简单,易于实现,但量化后数据速率高。,二、量化,42,非均匀量化最佳量化: 1)对采样值直接量化 2)在输入信号的概率密度比较高的区域内选择较小的量化间隔,在概率密度比较低的区域选择较大的量化间隔。 3)实现复杂度:高;量化后数据速率:中;,语音信号是非平稳的随机信号,其短时均方差值变化超过40dB,考虑不同人,不同的语态以及不同的用户线长度,动态范围会更大,因此最佳量化器不适合对语音信号的直接量化。,二、量化,43,非均匀量化对数量化 : 原理:在发送端,先将信号按照对数特性使信号压缩,然后均匀量化,在接收端,将译码后的样植经过反对数

15、扩张,恢复应有的量化值。 特点:对小信号的量化间隔小,对大信号的量化间隔大,但量化级数保持不变。 性能:最大量化信噪比没有均匀量化器高,但输入信号电平在相当大的一段范围内变化时,其输出量化信噪比几乎不变,并能维持在较高的水平上。,二、量化,44,横坐标是输入信号与最大输入信号之比的dB值; 纵坐标是量化信噪比的dB值。,对数量化,均匀量化,二、量化,典型标准有:A率压扩和律压扩,45,自适应量化: 对采样值直接量化。 量化间隔根据输入信号的短时方差进行调整, 使得量化间隔的大小和输入信号电平相匹配。 实现复杂度:高; 量化后数据速率:中; 适应的动态范围大; 量化信噪比:较高。,二、量化,46

16、,自适应量化可视为瞬时均匀量化系统,在一个估值的时段内,对每个样值都是均匀量化。 注意:非均匀量化虽然对大信号和小信号的量化阶距各不相同,但不调整阶距。,二、量化,说明,47,前向自适应量化器对未量化的信号x(n)进行能量估计,即进行前向估值。 特点:能量估计不受量化噪声的影响,因而比较准确可靠,但是要用额外的比特来传送量阶信息。,二、量化,48,后向自适应量化器对量化的信号y(n)进行能量估计,即进行后向估值。 特点:不需要传输边信息。估值精度受量化噪声的影响,而且随着量化粗糙性的增加,其影响加剧;另外对码序列中由于传输产生的误差比较敏感,且会产生扩散,所得信噪比比前向自适应量化要差。,二、

17、量化,49,差分量化: 对输入信号的预测残差信号进行量化; 量化间隔相等; 去除相邻样点之间的相关性,减小信号的动态范围,从而提高量化精度或减小编码比特数; 实现复杂度:高;量化后数据速率:低;适应的动态范围大;量化信噪比:较高; 如果差分和非差分方案中采用相同的量化器,而且信号相邻样点间的相关性较高,那么差分量化器的性能将比非差分量化器的性能大大提高。对于语音信号,差分量化器的精度可以改善 4dB-7dB。,二、量化,50,2.矢量量化 矢量量化的物理解释: 前面所说的量化是标量量化,量化处理对单个抽样值进行,抽样值与量化值之间是一到一的映射。 矢量量化则是一种多维空间的映射。它将若干个时间

18、离散幅度连续的采样值分为一组,形成多维空间的一个矢量,再将此矢量在矢量空间中进行整体量化处理从而提高量化效率,降低数码率。,二、量化,51,二、量化,矢量量化的数学描述 设 X=x1, x2, x3, . ,xN T 是一个N维实数矢量,其中的元素是幅度连续的随机变量。在矢量量化器中,矢量X用另一个幅度离散的N维实数矢量Y匹配,即X被量化成Y。通常Y选自一个有限集合S=Yi(1 i M),其中Yi=yi1, yi2, yi3, . ,yiN T 。 集合S称为码本(codebook); Yi是码本中的一个矢量,也叫码字; M是码本的大小,称为码本容量。码本容量相当于标量量化中的量化电平数。,5

19、2,二、量化,矢量量化的示意图,53,二、量化,矢量量化的失真测度,失真测度的目的是减小量化失真。 失真的测度方法分为客观方法和主观方法。,主观法是以人的主观感受来衡量量化处理后信号质量的下降程度。,客观的方法是在给定比特率的情况下,使量化产生的畸变的统计平均值D达到最小。,54,二、量化,最常用的衡量畸变统计平均值的算法是均方误差(MSE)算法,计算式如下:,还有其它的衡量方法,例如,加权均方误差准则。该准则可以与人的主观感觉相关联。,55,二、量化,矢量量化器的设计,设计矢量量化器就是设计一个码本系统。 为了使量化失真D最小,矢量量化需要解决两个问题: 如何划分量化区域,形成合理的胞腔; 如何确定某个胞腔中的一个矢量作为码字。 解决方案:LBG算法 该算法所遵循的原则是: “最近邻原则”和“畸变最小原则”。,56,二、量化,(1) “最近邻原则” “最近邻原则”的数学表达式是:,可以这样理解,矢量Yi 是胞腔Ci 中的码字,如果输入矢量X 与(初始)码本中矢量Yi 之间的失真小于X 与其它任何码本矢量Yj 之间的失真,则X 属于胞腔Ci 。也就是说Ci可以最佳地表示X 。,57,二、量化,(2) “最小畸变原则” “最小畸变原则”的数学表达式是:,“畸变最小原则”的思想是:如果胞腔Ci 内所有输入矢量X 的集合为Ri ,则该胞腔内

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论