数字语音处理及MATLAB仿真 (第3版)课件 第8章 语音编码原理及应用_第1页
数字语音处理及MATLAB仿真 (第3版)课件 第8章 语音编码原理及应用_第2页
数字语音处理及MATLAB仿真 (第3版)课件 第8章 语音编码原理及应用_第3页
数字语音处理及MATLAB仿真 (第3版)课件 第8章 语音编码原理及应用_第4页
数字语音处理及MATLAB仿真 (第3版)课件 第8章 语音编码原理及应用_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第8章语音

编码1458.2语音编码的分类及特性8.4语音信号波形编码8.3语音编码性能的评价指标8.5语音信号参数编码8.6语音信号混合编码8.1概述语音编码第8章语音编码8.1概述

数字化方法是直接对语音信号进行模/数转换,但语音的数据量仍旧非常大,因此在进行传输和存储之前,往往要对其进行进行压缩编码,以减少其传输码率或存储量。8.1概述传输码率也称为数码率,表示传输每秒钟语音信号所需的比特数。在保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音。

语音编码的目的:8.2语音编码的分类及特性

波形编码参数编码混合编码按编码方式语音编码分为三种:

8.2.1波形编码8.2语音编码的分类及特性

波形编码是将时间域或变换域信号直接变换为数字信号,力求使重建语音波形保持原始语音信号的波形形状。要求重建语音信号s^(n)的各个样本尽可能地接近原始语音信号s(n)的样本值。8.2语音编码的分类及特性波形编码优点:适应能力强,算法简单,易于实现,语音质量好。波形编码缺点:编码速率高,一般在16kbit/s~64kbit/s之间。

传统的波形编码方法分类:

脉冲编码调制(PCM)64kbit/s

自适应增量调制(ADM)32kbit/s-16kbit/s

自适应差分脉冲编码调制(ADPCM)32kbit/s8.2语音编码的分类及特性8.2.2参数编码

参数编码又称声码器编码,是将信源信号在频域或其它变换域提取特征参数,然后对这些特征参数进行编码和传输,在译码端再将接收到的数字信号译成特征参数,根据这些特征参数重建语音信号。

参数编码器有:8.2语音编码的分类及特性共振峰声码器线性预测声码器余弦声码器。8.2.3混合编码二十世纪80年代产生混合编码。优点:保留参数编码技术精华,并引用波形编码准则去优化激励源信号,缺点:算法复杂、运算量很大。编码速率:4kbit/s~16kbit/s

包括:多脉冲激励线性预测编码(MPELP)

码本激励线性预测编码(CELP)8.2语音编码的分类及特性三种编码方式比较64K13.6K2K

8.2.4语音压缩编码的依据提高语音编码效率的基本途径:

充分利用语音信号冗余度和人耳的听觉特性。语音的冗余度主要来源于两个方面:语音信号幅度分布的非均匀性;语音样点之间的相关性。8.2语音编码的分类及特性8.3语音编码性能的评价指标

编码速率语音质量评价编解码延时算法复杂度评价一个语音编码算法性能的基本指标包括:综合考虑四个因素进行性能评价。

编码速率直接反映了语音编码对语音信息的压缩程度。度量方法有:“比特/秒”(bit/s):编码的总速率,一般用I表示;“比特/样点”(bit//p):代表平均每个语音样点编码时所用的比特数,用R表示。平均每样点比特数R越高,语音质量越容易提高,对传输带宽或存储容量要求也就越高。8.3语音编码性能的评价指标8.3.1编码速率现在大部分编码标准都是固定速率编码,其范围为0.8kbit/s~64kbit/s。其中:

保密电话的编码速率为:0.8kbit/s~4.8kbit/s

数字蜂窝移动电话和卫星电话编码器编码速率为:

3kbit/s~13kbit/s

蜂窝系统总的编码速率达到:20kbit/s~30kbit/s

普通电话网的编码速率为:16kbit/s~64kbit/s

宽带编码器编码速率为:48/56/64kbit/s8.3语音编码性能的评价指标主观评价方法和客观评价方法。

1.语音质量主观评价方法平均意见得分MOS:MeanOpinionScore8.3.2编码质量8.3语音编码性能的评价指标表8.1MOS分五级标准及对应语音质量MOS分

质量级别失真级别5

优不觉察4

良刚有觉察3

中有觉察且稍觉可厌2

差明显觉察且可厌但可忍受1

坏不可忍受8.3语音编码性能的评价指标2.语音质量客观评价方法

时域客观评价和频域客观评价。时域客观评价方法有信噪比、加权信噪比、平均分段信噪比等。频域客观评价方法有巴克谱失真测度BSD和MEL谱测度等。

特点:计算简单、结果客观、不受个人主观因素的影响。

缺陷:不能完全反映人类对语音的听觉效果。

8.3语音编码性能的评价指标3.PESQ语音质量评价法

2001年2月,感知语音质量评价PESQ方法被ITU-T确定为P.862建议,成为了窄带电话网络和语音编解码器端到端语音质量的客观评价方法。

P.862建议提供了(-0.5,4.5)内的原始输出评分PESQ值。

8.3语音编码性能的评价指标语音质量评价原始语音PESQ10dB语音PESQsp014.5a012.749sp114.5a112.669sp154.5a152.374sp174.5a171.629sp0110dBsp01sp1510dBsp15

编解码延时一般用单次编解码所需时间表示。公用电话网编解码延时通常要求:不超过5~10ms

移动蜂窝通信系统允许最大延时:不超过100ms8.3.3编解码延时

8.3语音编码性能的评价指标算法复杂度主要影响到语音编解码器的硬件实现。在同样速率的情况下,复杂一些的算法将会获得更好一些的话音质量。算法的复杂程度与硬件实时实现也有密切关系。8.3语音编码性能的评价指标8.3.4算法复杂度

算法复杂度运算能力衡量方法:存储器容量衡量方法:

8.3语音编码性能的评价指标MOPS:MillionOperationPerSecondMIPS:MillionInstructionPerSecond千字kwords千字节kb算法越复杂则运算量越大,需要较大容量的存储区方可实现。8.4语音信号波形编码

PCM是最简单的波形编码方法,它把语音信号样本幅值量化到N=2B

个码字中的一个,这样每个样本需用B比特来表示。假定信号带宽是WHz,根据取样定理,总的比特率(每秒钟比特数)将是2WB比特/秒。

8.4.1脉冲编码调制PCM

1.均匀量化PCM

均匀量化PCM:输入信号x(n)幅值的范围被分成N个相同宽度的区间,所有落入同一区间的样本都编码成相同的二进制码字。只要N足够大,可以合理地假定,量化误差e(n)在各个宽度为△的区间里是均匀分布的。8.4语音信号波形编码M=2B当M不同时,均匀量化的图形比较

那么有:

这表明,量化器每增加一个比特,信号量化噪声比增加6dB。当要求60dB的SNR时,B至少应取11。此时,对于带宽为4kHz的电话语音信号,若采样率为8kHz,则PCM要求的速率为88kbit/s。这样的比特率是比较高的。

8.4语音信号波形编码

均匀量化PCM在下列两个假设条件下效果是很好的:

8.4语音信号波形编码量化信号幅度值在已知的范围内是均匀分布的输入信号幅度变化范围是已知的2.对数PCM

非均匀量化:即让量化间隔大小不相等。对小的输入信号值量化间隔较小,对大的信号值量化间隔较大。这样,可以对任何输入信号电平保持近似相同的信噪比。

8.4语音信号波形编码μ-律压缩的定义是:

式中是信号的最大幅值,μ是参变量,控制压缩程度,μ=0表示没有压缩,μ值愈大压缩越厉害,故称之为μ-律压缩。

8.4语音信号波形编码8.4语音信号波形编码

8.4语音信号波形编码A-律压缩的动态范围略小些,在小信号时质量要较μ-律差些,A-律最小量化间隔是2/4096,而μ-律是2/8159,事实上这二者的差别是不易觉察到的。无论是A-律或μ-律,其特性在x值小时都是线性的,在x值大时则呈现对数压缩特性。

3自适应量化PCM

自适应量化是指量化器的特性自适应于输入信号的幅度的变化,即(a)量化间隔可变(b)增益可变8.4语音信号波形编码

8.4语音信号波形编码

这两种方法,都需要随时估计输入信号的时变幅值,以修正量化间隔△(n)或增益G(n)的值。如果传输信道没有引入误码,那么有

自适应方案:“前馈自适应”

“反馈自适应”

8.4语音信号波形编码

(1)前馈自适应前馈自适应是指信号的能量或方差是由输入信号本身估算出来的,一般是先估算出信号的方差后,令两种系统输出为:它们除了在发送端使用外,还作为边信息,随同语音样本码值一起传送到接收端去。8.4语音信号波形编码

时变方差正比于语音信号的短时能量,而我们知道,短时能量可定义为经低通滤波器后的输出,因此有:式中h(n)为低通滤波器的单位冲激响应,,可由采用的窗函数求出。8.4语音信号波形编码

则显然,也满足差分方程:

为保证稳定性,要求,参数α的取值影响的变化速度。例如,设窗函数为:8.4语音信号波形编码(2)反馈自适应

8.4语音信号波形编码1.基本的自适应预测编码系统

一、定义:假定一个语音样本可以近似地被它过去的p个样本的线性组合所预测,预测样本值:式中,(1≤i≤p)称为预测系数,p是预测阶数。8.4.2自适应预测编码

8.4语音信号波形编码

令e(n)表示实际值与预测值之间的误差:

e(n)即线性预测误差,也被称作线性预测残差。对上式两边取变换后有

8.4语音信号波形编码

如果对残差序列e(n)作量化和编码,在同样信号量化噪声比条件下,所需的量化比特数就可以减少,从而达到压缩编码的目的。基于这一原理的方法称作预测编码,当预测系数是自适应地随语音信号变化时,又称自适应预测编码。(8.20)8.4语音信号波形编码二、自适应预测编码系统如何提高信噪比8.4语音信号波形编码

从图8.4可以看到,不考虑传输信道的误码,系统解码后输出为:式中q(n)是残差信号e(n)的量化误差:注意重构的信号在编码端和解码端都可以得到。

8.4语音信号波形编码

、和分别是信号、残差和量化噪声的平均能量,是量化器的信噪比,是自适应预测增益。

图8.5给出了固定预测和自适应预测两种情况下预测增益和预测阶数p的关系。根据信号量化噪声比的定义有:8.4语音信号波形编码

由图可见,阶数p>4时,固定预测有10dB的增益,自适应预测有约14dB的增益。

8.4语音信号波形编码

三、自适应预测编码的三个特性:

(1)APC信噪比总是大于非预测编码。

(2)增益是随时间变化的,因为它是信号频谱的函数,谱的动态范围越大,信号样本之间相关性就越强,预测增益就越高。因此我们又把这种预测器称为基于频谱包络的预测。

(3)量化噪声近似于白噪声,所以输出噪声的谱是平坦的。8.4语音信号波形编码

2前馈与反馈自适应预测前馈自适应预测器计算预测系数是通过误差

最小来求得。ai是按帧时变的,即按10~30ms为一帧来决定求和的样本点数N和系数。预测器系数必须作为边信息传输到接收端。8.4语音信号波形编码反馈自适应,预测器系数是从序列出发,使误差

最小求得。无需任何附加的边信息传给接收端。8.4语音信号波形编码前馈和反馈自适应预测方法的简单比较8.4语音信号波形编码(1)前馈效果略优于反馈自适应预测;

但问题是必须传送预测系数到接收端。(3)反馈自适应预测算法稳定性较差,算法比较复杂。

(2)传输误码对反馈自适应预测编码的影响较大。由APC派生出来的编码方法,常用的有差分脉冲编码调制,增量调制和自适应增量调制等。1.差分脉冲编码调制DPCM(DifferencePCM,DPCM)

是APC的一种特殊情况,它的预测器具有简单的形式:8.4.3自适应差分脉冲编码调制

8.4语音信号波形编码

在DPCM中,被量化和编码的是,即传送的是相邻样本的差值,所以又称之为“差分脉冲编码调制”。采用自适应量化及高阶自适应预测的DPCM,又称之为ADPCM,它本质上也是自适应预测编码,即属于一种APC系统。8.4语音信号波形编码2.增量调制(DeltaModulation,DM)一、增量调制特点增量调制基本上是一种DPCM方法,它与一般DPCM的主要区别有二点:

一:增量调制中波形的取样率大大高于由取样定理确定的奈奎斯特取样速率;

二:差值信号使用二电平,亦即用1比特的量化器。8.4语音信号波形编码斜率过载颗粒噪声8.4语音信号波形编码二、增量调制误差(1)斜率过载失真和克服均匀量化时,Δ的始终保持恒定,因而x(n)的量化值构成的增加和减小都将是线性的。这样,在译码器中,所恢复的阶梯波的上升或下降有可能跟不上信号的变化,因而产生滞后,这就造成了失真,称为“斜率过载”失真,如图8.6的AB段。8.4语音信号波形编码

斜率过载期间的码字将是一连串的0或一连串的1。为了避免这种失真,要求阶梯波的上升和下降的斜率等于或大于语音信号的最大变化斜率,即

式中xa(t)是原始模拟语音信号,T是其取样时间间隔。8.4语音信号波形编码

(2)颗粒噪声当语音信号不发生变化或变化很缓慢时,预测误差信号将等于零或具有很小的绝对值。这种情况下预测误差信号被量化为△和-△的概率是相等的,因此,经量化后成为幅度为2△的等幅振荡,编码为0和1交替出现的序列。在译码器中所得到的将是峰-峰值等于2△的等幅脉冲序列。这便形成一种噪声,称为“颗粒噪声”,如图8.6的CD段所示。

8.4语音信号波形编码

从上式看出,为减小斜率过载失真,要求选取较大的△值;而为减小颗粒噪声,却应当将△值取得小些。这是相互矛盾的。因此,通常需要对这两方面的要求折中加以考虑。8.4语音信号波形编码

3.自适应增量调制(AdaptiveDM,ADM)ADM的基本思想是:使增量△自适应语音信号的平均斜率变化,当信号波形平均斜率变大时,△自动增大、反之则减小;从而缓解DM中由于△固定引起的矛盾。ADM一般采用反馈自适应方式,即增量△由量化后的代码来控制:例如:

其中△(n)满足8.4语音信号波形编码8.5语音信号参数编码

基于参数编码理论的编码器由于其数码率比较低,通常称为声码器。共振峰声码器,该声码器通过对语音信号整体进行分析,提取共振峰的位置、幅度、带宽等参数,构成浊音和清音两个声道滤波器。LPC声码器是低速率语音编码器(2.4kbit/s以下);基于全极点声道模型的假定,采用线性预测分析合成原理,对模型参数和激励参数进行编码传输。LPC声码器遵循二元激励假设,声码器只需对LPC参数、基音周期、增益和清浊音信息进行编码。8.5语音信号参数编码8.5.1LPC声码器原理

LPC声码器工作原理如下图所示图8.8LPC声码器原理图8.5语音信号参数编码

8.5语音信号参数编码LPC声码器不考虑重建信号波形是否与原来信号的波形相同,而努力使重建信号具有尽可能高的可懂度和清晰度,所以不必量化和传输预测残差,只需传输LPC参数和重构激励信号的基音周期和清浊音信息。

LPC声码器的缺点

8.5语音信号参数编码⑶在LPC中,谱包络中的共振峰位置及带宽估计有时会产生很大的失真。

⑵降低了方案的鲁棒性。⑴损失了语音自然度。

应用:

(1)通信领域;(2)军事通信领域

LPC声码器可以合成清晰、可懂的语音,但是抗噪声能力和自然度比较差。自1986年以来,美国第三代保密电话装置采用了速率为2.4kbit/s的LPC-10e(LPC-10的增强型)作为语音处理手段。8.5语音信号参数编码8.5.2LPC-10编码器

图8.9LPC-10的编码器框图8.5语音信号参数编码1.编码器

(1)编码器基本原理

编码器分两个支路同时进行:

一个支路用于提取基音周期T和清浊音U/V判决信息;

另一支路用于提取声道滤波器参数RC和增益因子RMS。8.5语音信号参数编码(2)计算声道滤波器参数利用协方差法对LPC分析滤波器计算l0阶LPC分析预测系数,并转换成反射系数RC,预测系数进行量化编码。8.5语音信号参数编码(3)增益因子RMS的计算用如下公式计算RMS:式中x(i)是经过预加重的数字语音;N是分析帧的长度。(4)基音周期提取和清/浊音检测输入数字语音经低通滤波器滤波,再经过二阶逆滤波。把取样频率降低至原来的1/4,再计算延迟时间为20~256个样点的平均幅度差函数AMDF,由AMDF的最小值确定基音周期。计算AMDF的公式为8.5语音信号参数编码(5)参数编码与解码在传输数据流中,将10个反射系数、增益因子(RMS)、基音周期T、清/浊音U/V、同步信号Sync编码成每帧54bit。由于传输速率为44.4帧/s,因此,码率为2.4kbit/s。同步信号采用相邻帧1、0码交替的模式。

表8.5是浊音帧和清音帧的比特数分配。8.5语音信号参数编码表8.5LPC-10的比特数分配(bit)清音浊音T/Voicing77RMS55Sync11k155k255k355k455k54k64k74k84k93k102误差校正020总计54538.5语音信号参数编码2.解码器图8.10LPC-10解码器框图8.5语音信号参数编码8.5语音信号参数编码LPC-10编解码器缺点:合成语音听起来很不自然,即使提高编码速率也无济于事。LPC-10优点:编码速率低

增强型LPC-10e采用如下一些措施来改善语音质量:(1)改善激励源①:采用混合激励代替简单的二元激励。②:采用激励脉冲加抖动的方式。③:采用单脉冲与码本相结合的激励模式。

(2)改进基音提取方法。

(3)选择LSP作为声道滤波器的量化参数。8.5语音信号参数编码8.6语音信号混合编码

保留参数编码的技术精华

用波形编码准则去优化激励源信号,

在4kbit/s~16kbit/s的速率上能够合成高质量语音。混合编码主要技术:合成分析技术和感觉加权滤波器,目标是改进激励模型,合成高质语音。

合成分析法的改进主要是对激励的改进,它通过寻找给定合成滤波器的最优激励,使其通过合成滤波器时产生的合成语音最接近于原始语音。

8.6语音信号混合编码8.6.1合成分析技术和感觉加权滤波器

感觉加权滤波器

感觉加权滤波器的依据是利用人耳听觉的掩蔽效应,在语音频谱中能量较高的频段即共振峰处的噪声相对于能量较低频段的噪声而言不易被感知。为此可以引入一频域感觉加权滤波器来计算二者的误差如下:8.6语音信号混合编码

其中:fs是抽样率,S(f)、分别是原始语音与合成语音的傅里叶变换。

8.6语音信号混合编码感觉加权滤波器的作用:

使实际误差信号的谱不再平坦,而是有着与语音信号谱相似的包络形状。8.6语音信号混合编码8.7语音信号宽带变速率编码

国际标准组织多年来一直在努力定义宽带语音编码标准。早期定义的宽带语音编码标准主要应用于会议电视,近期定义的则主要应用于移动通信和VoIP。宽带语音编码标准G.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论