无线通信技术基础-10话音编码技术_第1页
无线通信技术基础-10话音编码技术_第2页
无线通信技术基础-10话音编码技术_第3页
无线通信技术基础-10话音编码技术_第4页
无线通信技术基础-10话音编码技术_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无线通信技术基础第10章、话音编码技术内容介绍

在以话音为主要业务的移动通信系统中,话音编码技术是非常重要的,话音编码在很大程度上决定了接收到的话音质量和系统容量。

在移动通信系统中,无线信道的带宽是极其有限的资源,如何在有限的无线信道带宽中容纳更多的用户同时通话,一直是移动通信系统的核心问题。采用多进制调制可以提高带宽效率,但同时功率效率会降低。

低比特率的话音编码提供了解决问题的一种方法,在保证话音质量的前提下,话音编码器的比特率越低,一定的带宽内就可以容纳更多的话音通道。因此,产品制造商和服务提供商们一直在不断地寻求新的话音编码技术,以便在低比特率下提供高质量的话音。本章重点话音编码器的种类脉冲编码调制频域话音编码参量编码混合编码话音编码的选择和性能评估第10.1节、话音信号的特性要实现通信系统的数字化,首先要将模拟话音信号转换成数字信号。话音信号的波形是带限的,带宽一般在0.3~3.4KHz内。根据奈奎斯特取样定理,有限的带宽意味着它可以用一定的速率抽样,当抽样频率大于低通信号频率的两倍时,就可以从抽样值中完全恢复话音波形。话音信号的波形具有一些对编码设计有用的特性,这些特性可以使量化操作以很高的效率实现。概率分布密度函数:在中低幅度处的概率分布高,在幅度很高处的概率分布低,在这两个极端之间单调递减。自相关函数:话音相连的抽样值之间存在很大的相关性。对每一个话音抽样,有很大的成分可以从前面的抽样值中预测。功率谱密度函数:具有非平坦特性,在不同频域分别编码可以得到编码增益,能够用来在频域内明显地压缩话音编码的比特率。第10.2节、话音编码的分类移动通信系统的容量大都是带宽受限的,话音编码技术对通话质量、带宽利用率和系统容量都具有重大影响。低码率的数字话音编码可以提高信道容量,而纠错能力强的编码可以保证系统在较低的C/N条件下的通话质量。同时为了使话音编码具有实用价值(用于移动终端),话音编码技术还必须消耗很少的功率。话音编码的目的是在不超过一定的算法复杂程度和通信时延的前提下,占用尽可能少的信道带宽来传送尽可能高质量的话音。话音编码的算法越复杂,编码效率越高(比特率越低),但相应的时延、费用和功耗也就越高。必须在这两个相互矛盾的因素之间寻求一个平衡点,话音编码技术发展的目标就是使这个平衡点向更低比特率的方向移动。各种话音编码技术在话音信号的压缩方法上有很大区别。根据压缩方式的不同,可以把话音编码器分成两大类:波形编码器和参量编码器。第10.2节、话音编码的分类波形编码是直接对模拟话音信号的时域电压波形进行取样、量化和编码,使之变成数字话音信号。参量编码是根据人类语言的发声机理,找出表征话音特征的参量,只对这些特征参量进行编码的一种方法。第10.2节、话音编码的分类混合编码技术:混合编码是近年来随着移动通信的应用而发展起来的一种新的高性能话音编码技术。在混合编码的信号中既包含若干话音特征参量信息又包含部分波形编码信息。混合编码的速率一般在4~16Kbps,当编码速率在8~16Kbps范围时,话音质量可以达到商用话音通信的标准,因此,混合编码技术在数字移动通信中得到了广泛应用。移动通信系统中对话音编码的要求编码速率低。话音质量高。有较强的扰噪声干扰和抗误码性能。编译码时延小,应在几十毫秒以内。编译码器的复杂程度低,便于大规模集成化生产。体积小、重量轻、功耗低,适应便携式移动台。第10.3节、脉冲编码调制最基本的波形编码是脉冲编码调制(PCM)。PCM的优点是话音质量好,缺点是编码速率高、体积大。PCM不仅可以提供用户话音业务,还可以提供从2M到155M速率的非话音业务。PCM数字信号是通过对连续变化的模拟话音信号进行取样、量化和编码产生。取样过程将时间连续、幅度连续的模拟信号变为时间离散、幅度连续的模拟信号;量化过程将取样信号变为时间离散、幅度离散的数字信号;编码过程将量化后的信号编码成为一个二进制码组输出。PCM对话音信号的取样频率是8KHz,每次取样的量化值为8个比特,总的编码速率为64Kbps(8KHz×8bit=64Kbps)。量化是一个非常重要的步骤,它在很大程度上决定了整个话音编码的失真大小。PCM的量化和编码有二种标准,欧洲和我国等大多数国家使用A律标准(E1),而北美洲及日本使用μ律标准(T1)。第10.3节、脉冲编码调制1、量化噪声量化就是把一个信号的连续幅值分割成一系列有限的离散幅值的过程,用一组规定的电平,将经过抽样得到的瞬时抽样值进行有限比特的编码,也就是用一组有限长度的二进制编码来表示每一个有固定电平的量化值。与抽样不同,量化操作是不可逆的。根据奈奎斯特取样定理,只要取样频率大于话音波形最高频率的两倍,就可以没有失真地完全恢复话音波形。而量化是使用有限的阶梯来描述抽样后的连续幅度值(四舍五入,分级取整),必然会产生量化失真。量化失真的大小取决于量化阶梯的数量,如果量化使用了n个比特,那么就会有M=2n个离散的幅度阶梯。量化后的信号失真通常称作量化噪声。量化噪声是与信号独立的,它们与信号的关系是相加,不管有没有信号,噪声都存在。可以通过测量输出的量化信噪比(SQNR)来测试一个量化器的性能。第10.3节、脉冲编码调制2、均匀量化把输入信号的取值范围按照等间隔分割的量化称为均匀量化。均匀量化的幅度阶梯是等间隔的,也就是说,将整个抽样的动态范围均匀地划分成2n个阶梯,抽样得到的瞬时抽样值根据对应的台阶分级取整进行量化。均匀量化的好处是编码器和解码器很容易实现。主要缺点是它产生的量化噪声也是均匀的,与信号在取样点的幅度无关,无论抽样值的大小如何,量化噪声的均方根值都固定不变。因此,均匀量化会出现话音弱时信噪比低、干扰大,而话音强时信噪比高、干扰小的不利情况。由于话音大都集中在小信号范围内,均匀量化在话音幅度小的时候常常不能满足信噪比的要求,而在话音幅度大时又会出现没有必要的很大余量,信号的动态范围将会受到很大限制。为了克服这个缺点,实际应用中一般采用非均匀量化。第10.3节、脉冲编码调制3、非均匀量化非均匀量化就是根据输入波形幅度的非均匀概率分布密度函数(PDF)来分布量化电平,在保持量化总级数不变(即总编码速率为64Kbit/s)的前提下,把话音抽样的取值范围分成若干个区间,在抽样值小的区间增加量化级数,而在抽样值大的区间减少量化级数。一个简单而又有稳定的非均匀量化器是对数量化器,即先把模拟信号通过一个压缩(对数)放大器,再把压缩的信号通过一个标准的均匀量化器。在接收端,被压缩的量化抽样信号再进行扩张处理,这样量化信噪比就得到了有效的均衡。非均匀量化的实现方法通常有两种标准:一种是欧洲和我国等大多数国家采用的A律压扩;另一种是北美和日本采用的μ律压扩。第10.3节、脉冲编码调制第10.3节、脉冲编码调制4、自适应量化话音信号的功率电平具有很强的自相关性,即任何抽样的幅度与前一个抽样的幅度相关,幅度变化的速度很慢。根据这一特性可以比较容易地设计和实现简单的自适应算法。自适应量化器根据输入信号的功率变化,自动改变它的量化阶梯太小,它在时间轴上的收缩和扩张就像一个手风琴。第10.4节、自适应差分脉冲编码自适应差分脉冲编码调制(ADPCM)是一种能有效解决话音信号冗余度的方法。话音波形的相邻抽样常常具有很强的相关性,这表明相邻话音幅度之间差分的方差要比话音信号的方差小得多。在维持相同的话音质量时,ADPCM允许用32Kbps比特率的编码,是标准PCM的一半。ADPCM编码器以一种自适应的方式,通过改变量化阶梯的大小来充分利用信号的动态范围,量化器阶梯的大小依赖于输入信号的动态范围,即依赖于讲话者的话音特性,并且随时间变化。在ADPCM编码器中,编码器量化相邻抽样的差分值,解码器通过对已量化的相邻抽样的差分值积分,来恢复原始信号。ADPCM编码器可以运用信号预测技术来实现,预测是以话音信号的自相关特性为基础的。线性预测器不是用来对相邻抽样的差值进行编码,而是用来预测当前的抽样值,然后对预测值与实际抽样值之间的差值(预测误差)进行编码。第10.5节、频域话音编码频域话音编码是另外一种波形编码技术,它利用了人类产生及感觉话音的模型。在这类编码中,话音信号被分成一系列的频率成分(频带)并对它们单独进行量化和编码。根据每个频带的感知标准,不同的频带采用不同的编码优先权。这样,量化噪声就仅包含在本频带中,可以避免频带以外的谐波失真。这些方案的优点是:每个频带用于编码的比特数可以动态地改变,并且可以在不同的频带上共享。不同的频域编码算法的复杂程度各不相同。最常用的频域编码包括子带编码和自适应变换编码。子带编码把话音信号分成许多小的子带,然后根据感知标准来给每个子带编码,用来编码的比特数与各自感知的重要性成正比。自适应变换编码是对抽样的一个加窗序列的短期变换进行编码,这是一个更加复杂的技术,它涉及话音波形加窗输入信号段的块变换。第10.6节、参量编码波形编码的话音质量很好,电路实现也比较简单,但是编码速率比较高,需要占用较宽的频率带宽,这将会直接影响通信系统的容量。在蜂窝移动通信系统中,为了提高系统容量,必须采用速率更低的话音编码技术。研究低速率、高质量的话音编码一直是数字通信领域的一个重要课题。参量编码的概念:对反映话音信号特征的参量而不是对话音信号的时域波形本身进行编码和传输,可以大大降低话音编码的速率。参量编码与波形编码的原理完全不同,它首先在发送端对话音信号进行分析,得到话音信号的特征参量并进行编码,然后传输特征参量的编码数据,在接收端根据这些特征参量来合成和恢复话音信号。参量编码器比波形编码器要复杂得多,但是可以大幅度降低传输比特率。它的缺点是稳定性比较差,而且其性能依赖于说话者的话音特征。第10.6节、参量编码1、参量编码的基本原理人类的发音系统和话音产生的机理比较复杂,在对实际话音进行研究分析的基础上,抽取其主要特征,就可以得到便于处理的数字模型。根据发声的机制不同,人类的话音可以分为浊音和清音两大类。浊音又叫有声音(如:m、n、v);清音又叫无声音(如:f、s、sh)。整个发声过程可以分成两个步骤:第一步是激励,第二步是响应。激励:激励源是由横隔膜压迫肺部产生的气流,气流通过声带的振动产生周期性的浊音或由湍流而产生清音。可以用功率源模拟包括横隔膜和肺部气室的作用,用激励信号模拟气管、咽喉和声带的作用。响应:响应是由舌、唇、齿等口部器官来控制口腔及鼻腔构成的时变有损谐振器,产生不同的频率响应。可以用线性时变滤波器来模拟。第10.6节、参量编码发声机理是进行话音数字化参量编码的基础,在参量编码中,话音特征参数的提取是十分关键的。在实际应用中,通过细致地调整话音生成模型的参数,可以合成出高质量的话音信号。决定话音的基本特征参数是:基音、共振峰频率和强度以及清音/浊音判决。发送端只需要把这些特征参数传送到接收端,接收端就可以根据这些特征参数来合成出与发送端相同的话音信号波形。而传送这些特征参数所需要的数据速率大大低于传送波形抽样值所需的数据速率,因此参量编码方式的比特率与波形编码相比可以大大降低。由于只传送了话音的主要特征参数,所以合成的话音信号波形只能保持语言的可懂度而会失去一些自然度和声音特质。也就是说,低码率的参量编码是以牺牲一定的声音特质为代价的。第10.6节、参量编码2、线性预测编码线性预测编码(LPC)属于时间域的参量编码类型,这类编码器从时间波形中提取重要的话音特征参量。将线性预测分析法用于话音参量的编码,能够快速并且极为精确地估算话音参数,获得了广泛应用。在接收端,不同的LPC方案中再生激励信号的方法是不同的,三个常用的方法是:声码器、多脉冲激励和码本激励。声码器的方法是最流行的,在接收端使用两个信号发生器,一个是白噪声,另一个是以当前基音速率为周期的一个系列脉冲。多脉冲激励LPC用了多个的脉冲,并且顺序地调整每个脉冲的位置和幅度,使得频域上的加权均方差最小化,可以产生更好的话音质量。码本激励LPC(CELP)是一种广泛应用的话音编码技术,编码器和解码器有一个随机激励信号的预定编码本。第10.6节、参量编码3、其它类型的声码器信道声码器:是一种频域的声码器,它确定了许多频带话音信号的包络,经过抽样和编码后与其它滤波的输出编码一起多路输出。共振峰声码器:在概念上与信道声码器类似,但共振蜂声码器用的比特率可以比信道声码器更低,因为它所用的控制信号更少。倒频谱声码器:倒频谱声码器通过对数能量谱的反傅里叶变换生成信号倒频谱,分离激励和声道频谱。话音激励声码器:话音激励声码器减少了基音提取以及话音判决操作。采用一个低频带的PCM传输和高频信道编码的混合形式。通过提取、带通滤波以及消除基带信号,产生一个能量分布在谐波处并且频谱平坦的信号而再生话音。话音激励声码器工作在7.2~9.6Kbps之间,它的质量高于传统的基音激励声码器。第10.6节、参量编码4、矢量编码矢量编码技术是参量编码领域中的一项突破性技术。矢量编码所传送的不是话音参数本身,而是话音参数的码本号。理论上,矢量编码可实现极低速率的高质量话音编码。矢量编码是将代表话音的矢量构成一个庞大的码本,在发送端做线性预测时,是在码本中找出预测误差信号最小时所对应的样值组合的地址。然后,将这个码本的地址传送给接收端。由于接收端与发送端具有同样的码本,接收端根据接收到的码本地址就可以从码本中获取它所对应的预测误差信号,用该误差信号来激励声道就可得到重建的话音信号。由于在信道中只需要传送矢量在码本中的地址而不是传送样值序列本身,因此可以大大降低信道中的数据速率。矢量编码的关键是建立一个好的码本。第10.7节、混合编码波形编码:话音质量很好,电路实现简单,但是编码速率高。参量编码:可以实现很低的编码速率,但话音质量较差。混合编码:这种编码包括两条传输路径,一条路径产生线性预测编码并传送,另一条路径过滤出话音波形信号的低频部分并通过波形编码传送。在接收端,接收到的低频话音信号经过适当组合并平滑处理后做为激励信号来恢复话音信号波形。混合编码吸收了波形编码和参量编码两者的优点,在编码信号速率和话音质量两方面的性能都比较好。移动通信系统中使用的话音编码技术大都是采用混合编码方式。欧洲的GSM系统中,采用的是“规则脉冲激励-长期预测-线性预测编码(RPE-LTP-LPC)”方案,采用规则脉冲作为激励源。北美的数字移动通信系统中,采用的是“矢量和激励线性预测编码(VSELP)”方案,采用码本激励的方法。第10.7节、混合编码1、规则脉冲激励-长期预测-线性预测编码规则脉冲激励-长期预测-线性预测编码(RPE-LTP-LPC)是欧洲的研究人员在多种备选方案中经过反复的测试和比较,最后选定的用于GSM系统的话音编码标准。它的纯话音编码速率为13Kbps,加上信道编码后的总数据速率为22.8Kbps,语音质量的MOS评分可以达到4.0。RPE-LTP-LPC采用规则脉冲作为激励源,以便使合成波形接近于原话音信号波形。这种方案结合长期预测,消除了信号的多余度,降低了编码速率。这种算法比较简单,计算量适中,易于低成本的硬件实现。GSM系统话音信号的处理过程比较复杂。发送端要进行话音检测,将每个时间段分为有声段和无声段。在有声段,对话音信号进行编码产生编码话音帧;在无声段,对背景噪声进行估计,产生静寂描述帧(SID帧),在双方讲话的间歇给通话双方一个舒适的声音背景。第10.7节、混合编码编码器

话音编码器的输入信号是8000样本/秒的话音信号抽样序列。如果来自移动台,则是13bit均匀量化的PCM信号;如果来自PSTN,则是8bit非均匀量化(A律)的PCM信号,此时需转换为13bit的均匀量化信号。编码处理按帧进行,每帧20ms,含160个话音样本,编码后的数据是260bit的编码块,编码速率为13Kbps(260bit/20ms)。

RPE-LTP-LPC编码器包括5个部分:预处理、线性预测分析、短时分析滤波、长期预测和规则脉冲激励码编码,每个部分又包含若干个处理过程。解码器

解码器包含4个部分:RPE解码、长时预测、短时合成滤波和后处理。其中大部分处理子块在编码器也要采用,只有短时合成滤波器和去加重滤波器是新的过程第10.7节、混合编码2、矢量和激励线性预测编码矢量和激励线性预测编码(VSELP)是码本激励线性预测编码(CELP)中的一种变形。与REP-LTP-LPC不同,VSELP对余量信号处理的方法是采用矢量编码的方法。CELP建立和搜索码本的运算量很大,而北美和日本采用矢量和激励的方法,码本仅有几个基本矢量。VSELP是矢量编码的一种具体方法,采用这种码本结构可以大幅度降低运算量,而且具有很好的抗误码性能。也是采用20ms为一帧,总延迟比RPE-LTP-LPC略大一点。美国的TDMA数字蜂窝系统USDC选用的就是VSELP编码。在纯编码速率为8Kbps时MOS评分为3.7,基本上与13Kbps的RPE-LTP-LPC相当,加上信道编码后总数据速率为13Kbps。日本的PDC标准也采用VSELP,纯编码速率为6.7Kbps,加上信道编码后总数据速率为11.2Kbps。第10.8节、话音编码方式的选择选择合适的话音编解码是设计一个数字移动通信系统的重要步骤。必须在压缩后的话音质量、话音编码的速率、整个系统的花费和系统容量之间寻找一个平衡点。还必须考虑端到端的编码时延、编码器的算法复杂性、所需的直流功率、与现有其它标准的兼容性以及语音编码相对传输误码的稳定性等因素。移动通信信道主要受传输媒介影响的不利因素包括:衰落和干扰。话音编解码器必须对传输误差有足够的稳定性,这是很重要的。话音编码器的选择还与小区的大小有关。当小区足够小时,可以通过频率复用来获得更高的频谱利用率,运用简单的高速话音编解码器就足够了。而对于采用较大小区和低质量无线信道的蜂窝移动系统,带宽资源非常有限,而且用户数量庞大,需要采用低比特率的技术。多址技术和调制技术的种类也影响了话音编解码器的选择。第10.8节、话音编码方式的选择标准服务话音编码类型比特率(Kbps)GSM-900/1800蜂窝RPE-LTP-LPC13USDC(IS-54)蜂窝VSELP8CDMA(IS-95)蜂窝CELP1.2、2.4、4.8、9.6、14.4PDC微蜂窝VSELP4.5、6.7、11.2PHS(小灵通)微蜂窝ADPCM32CT2、DECT无绳电话ADPCM32各种移动通信系统的话音编码第10.9节、话音编码的性能评估客观检测法:客观检测可以给出再生话音与原始话音近似程度的一个定量值,包括:均方误差畸变、频率加权、分段信噪比、清晰度指数等等。客观检测没有办法给出像人的耳朵主观感觉话音质量那样精确的指示,接听者才是对话音质量的最后判决,所以客观测试与主观试听测试组成了话音编码器评估的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论