第十三讲语音编码_第1页
第十三讲语音编码_第2页
第十三讲语音编码_第3页
第十三讲语音编码_第4页
第十三讲语音编码_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三讲语音编码第1页,共69页,2023年,2月20日,星期二

但是以8KHz抽样,并且每个样值用8位二进制代码表示时,即采用A率13折线PCM数字语音信号时,信息速率为64Kbit/s。利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为32KHz。频带利用率=传输速率/带宽第2页,共69页,2023年,2月20日,星期二二.什么是语音压缩编码?Whatisthespeechcompressioncoding?

把数码率低于64Kbit/s的语音编码方法称为语音压缩编码技术第3页,共69页,2023年,2月20日,星期二三.语音编码分类Speechcodingclassification根据编码器的实现机理,分成三大类波形编码参数编码混合编码第4页,共69页,2023年,2月20日,星期二1、波形编码waveformcoding

从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。特点:利用抽样定理,恢复原始信号的波形第5页,共69页,2023年,2月20日,星期二优点:适应能力强,重建语音质量好缺点:编码速率较高类型:

PCM,

自适应增量调制(ADM),自适应差分编码调制(ADPCM),自适应预测编码APC速率通常在16------64kbit/s范围第6页,共69页,2023年,2月20日,星期二2.参数编码parametriccoding

提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。优点:编码速率低。缺点:语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度)类型:LPC线性预测编码速率通常是在4.8kbit/s以下第7页,共69页,2023年,2月20日,星期二3.混合编码hybridcoding介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。波形编码+参数编码Waveformcoding+parametersofthecode可在4----16kbit/s范围内达到良好的语音质量类型:子带编码第8页,共69页,2023年,2月20日,星期二语音编码技术voiceencodingtechniques

普通编译码器的音质与数据率

第9页,共69页,2023年,2月20日,星期二衡量话音编码器的参数theparametersofthefixedvoiceencoder数据输出速率延迟时间话音质量价格(实现代价)第10页,共69页,2023年,2月20日,星期二语音信号的冗余度Speechsignalredundancy幅度非均匀分布样本之间的相关性周期之间的相关性基音之间的相关性静止系数(话音间隙)长期相关性(longtermcorrelation)第11页,共69页,2023年,2月20日,星期二tnxa(nT)xa(t)

2.采样:

将时间连续信号变成时间离散信号。

采样频率通常为fs=8kHz。第12页,共69页,2023年,2月20日,星期二Idealsamplingandrealsampling第13页,共69页,2023年,2月20日,星期二

对离散时间信号进行量化,在每一时刻对xa(nT)独立进行量化,把给定的幅度连续的信号变成为有限多个幅度的集合中某个幅度值的过程。3.A/D转换A|Dtransition采样量化xa(t)xa(nT)x(n)xa1x1xkxakxak+1xk+1xLxaLxaL+1x(n)=Q[xa(nT)]第14页,共69页,2023年,2月20日,星期二000001010011111110101100/2第15页,共69页,2023年,2月20日,星期二量化误差(噪声)

e(n)=x(n)-xa(nT)-/2

e(n)

/22m=00其他(1)假设量化噪声是平稳的白噪声过程,有

E[e(n)e(n+m)]=(2)假设量化噪声与输入信号不相关,有

E[e(n)x(n+m)]=0m为任意值(3)在每个量化间隔上,量化噪声均匀分布,有

Pe(e(n))=1|e(n)|

/20其他第16页,共69页,2023年,2月20日,星期二量化信噪比QuantitativeSNR量化噪声的信噪比:SNR=x2/e2

x2语音信号序列的方差,e2噪声序列的方差,用分贝表示,SNR=10log(x2/e2)

SNR=signal’senergy/noise’senergy第17页,共69页,2023年,2月20日,星期二SNR=6.02B+4.77-20log(Xmax/x)=6.02B-7.27Xmax表示其峰值B为量化的比特数当语音信号的幅度服从拉普拉斯分布时,Xmax=4x

量化器每增加一个比特,SNR提高约6dB。当B=8,SNR=40dB,满足一般通信系统的要求。当量化噪声的信噪比达到60-70dB,才能保障有高水平通话质量,这时要求量化为11-13bits。一般的音频A/D、D/A转换芯片,量化为12bits。第18页,共69页,2023年,2月20日,星期二脉冲编码调制pulsecodemodulation(PCM)PulseCodeModulation第19页,共69页,2023年,2月20日,星期二PCM的量化方式QuantizationMethod均匀量化与非均匀量化第20页,共69页,2023年,2月20日,星期二非均匀量化non-uniformquantizing对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。对大信号来说,虽然绝对量化误差较大,但是因为:(1)大信号出现的机会不多,(2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。非均匀量化也是一种压缩。第21页,共69页,2023年,2月20日,星期二µ律压扩与A律压扩µandalawpressureexpansionm

律(m-Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。x为x为输入信号,规格化为-1<=x<=1m

为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100<=

m

<=500。第22页,共69页,2023年,2月20日,星期二µ律压扩与A律压扩µandalawpressureexpansion0<=|x|<=1/A1/A<=|x|<=1A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中对于采样频率为8kHz,样本精度为13位、14位或者16位的输入信号,使用m

律压扩编码或者使用A律压扩编码,经过PCM编码器之后每个样本的精度为8位,输出的数据率为64kb/s。这个数据就是CCITT推荐的G.711标准。第23页,共69页,2023年,2月20日,星期二自适应差值脉冲编码调制原理Adaptivedifferencepulsecodemodulationprinciple(ADPCM)差值脉冲编码(DPCM)1.编码思想提高通信质量必须减小量化误差减小量化级当抽样值范围确定时增加编码位数N第24页,共69页,2023年,2月20日,星期二增加编码位数可获得大的信噪比Increasethecodingcanobtainthedigitssignal-to-noiseratio在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比即:若缩小抽样值(被编码信号)的变化范围,就可以在保证信噪比不变的情况下,减小编码的位数。这就是差值编码的中心思想第25页,共69页,2023年,2月20日,星期二增量调制deltamodulation(△M)增量调制(delta

modulation,DM)是一种预测编码技术,是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示。DM编码系统又称为“1位系统”。第26页,共69页,2023年,2月20日,星期二

二、差值编码模型图Poorvaluecodingmodelfigure在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。第27页,共69页,2023年,2月20日,星期二

x(n)

+

d(n)

c(n)

d(n)

x(n)

-

x(n)

x(n)

差值编码模型译码+编码+第28页,共69页,2023年,2月20日,星期二图中:x(n)是原始样值(n时刻的抽样值)x(n)为减去量d(n)=x(n)-x(n)为差值可以看出:(1)、d(n)越小,在相同的编码位数时信噪比越大(2)、收发端必须有相同的减去量x(n)第29页,共69页,2023年,2月20日,星期二根据前些时刻的样值来预测现时刻的样值,只要传递预测值和实际值之差,而不需要每个样值的编码都传。这种方法就称为DPCM编码。三、DPCM系统system1、DPCM系统的概念:第30页,共69页,2023年,2月20日,星期二举例来说,设以1/Ts的速率对信号S(t)抽样,在时刻前可得到,,等一组样值.以前面N个样值作为基础对的预测值是第31页,共69页,2023年,2月20日,星期二不同时刻样值的加权系数:根据相关性情况,可设为常量或变量第32页,共69页,2023年,2月20日,星期二2、实现预测的横向滤波器(N阶预测器)Realizetheforecasttransversefilter(Norderpredictor)第33页,共69页,2023年,2月20日,星期二在每个抽样时刻到来时,滤波器输出将会给出下一个样值的预测值。一般来说,在抽样时刻t=nTs时所得的预测值与真正的样值并不相同。N阶预测器输出Norderpredictoroutput:第34页,共69页,2023年,2月20日,星期二差值脉冲编码就是对真正的样值与过去的样值为基础得到的估值之间的差值进行量化和编码。第35页,共69页,2023年,2月20日,星期二3、DPCM系统模型框图systemmodelframeworkchart下张22第36页,共69页,2023年,2月20日,星期二图中:x(n)为抽样信号的实际值第37页,共69页,2023年,2月20日,星期二d(n)=x(n)-x(n)图x(n)=x(n)+d(n)该系统的量化误差可以表示为:e(n)=x(n)-x(n)

=[d(n)+x(n)]-[x(n)+d(n)]

=d(n)-d(n)上式表明:DPCM系统的传输误差就是差值d(n)的量化误差.4、DPCM系统的抗噪声性能分析DPCMsystemofnoiseperformanceoftheanalysis第38页,共69页,2023年,2月20日,星期二系统信噪比定义为:SNR===预测器增益量化器的量化信噪比GP<1GP>1预测器有增益加预测器后反而不利第39页,共69页,2023年,2月20日,星期二GP:DPCM系统相对于PCM系统而言的信噪比增益DPCMsystemrelativetoPCMsysteminthesignal-to-noiseratioofthegain。量化器产生的信噪比即非预测的PCM系统的量化信噪比第40页,共69页,2023年,2月20日,星期二提高系统信噪比采取的措施Improvethesystemsignal-to-noiseratiomeasuresSNR=减小第41页,共69页,2023年,2月20日,星期二x(n)精确d(n)d(n)=x(n)-x(n)最佳预测量化误差最佳量化第42页,共69页,2023年,2月20日,星期二小结一.压缩编码的原因二.什么是语音压缩编码三.语音编码分类ADPCM系统DPCM一.差值编码思想二.差值编码系统模型图三.DPCM系统1.概念2.预测器模型图3.DPCM系统模型4.DPCM系统的抗噪声性能分析第43页,共69页,2023年,2月20日,星期二自适应差值脉冲编码调制Adaptivedifferencepulsecodemodulation(ADPCM)1、实质:DPCM+自适应量化和自适应预测固定预测固定量化2、定义能够实现自适应预测功能,或者自适应量化功能或者同时实现两种自适应功能的DPCM系统称为ADPCM系统。第44页,共69页,2023年,2月20日,星期二3.设计的目的Designpurpose

ADPCM充分利用了语音波形的统计特征和人耳听觉特性,其设计思路主要瞄准了两个目标:a:尽可能去掉语音信号中的冗余信号b:以有效的方式将可用比特分配给语音信号对消除冗余后的信号,从自适应角度进行最佳编码第45页,共69页,2023年,2月20日,星期二1.1预测的自适应Predictionoftheadaptive(1).极点预测器1.预测器的结构structureofpredictor(用重建信号x(n)进行的预测)+量化器预测器+X(n)X(n)d(n)d(n)编码X(n)P(Z)X(n)a:极点预测器的DPCM方框图第46页,共69页,2023年,2月20日,星期二b:预测器传递函数P(z)

N阶预测器公式:X(n)=第47页,共69页,2023年,2月20日,星期二进行Z变换后得:则预测器的传递函数为:为预测系数第48页,共69页,2023年,2月20日,星期二第49页,共69页,2023年,2月20日,星期二c:重建滤波器ReconstructionFilter+预测器x(n)x(n)X(n)d(n)H(Z)重建滤波器第50页,共69页,2023年,2月20日,星期二==E[x(n)]+E[x(n-1)]-2E[x(n)x(n-1)]22=2E[x(n)]-2E[x(n)x(n-1)]2分析:==第51页,共69页,2023年,2月20日,星期二(2)一阶最佳线性预测Firstorderthebestlinearprediction求最佳预测系数h1N=1时;X(n)=h1x(n-1)则差值信号为:d(n)=x(n)-h1x(n-1)+E[d(n)]=2=E{[x(n)-h1x(n-1)]}2=E[x(n)]+h1E[x(n-1)]-2h1E[x(n)x(n-1)]22=2-=2求使最小的h1的值2第52页,共69页,2023年,2月20日,星期二令得最佳预测系数h1opt=p1当N=1时的最大预测增益为:第53页,共69页,2023年,2月20日,星期二b.二阶线性预测Secondorderlinearforecast(N=2)d(n)=x(n)-h1x(n-1)-h2x(n-2)=E[d(n)]2=E{[x(n)-h1x(n-1)-h2(n-2)]}2令得最佳h1,h2第54页,共69页,2023年,2月20日,星期二大于或者等于零故二阶预测器总是优于一阶预测器第55页,共69页,2023年,2月20日,星期二C:N阶最佳线性预测Norderthebestlinearprediction求偏微分,并令为零=E[d(k)]2第56页,共69页,2023年,2月20日,星期二所以得到一组线性方程第57页,共69页,2023年,2月20日,星期二差值信号在预测系数取最佳值时最小第58页,共69页,2023年,2月20日,星期二最佳预测增益Bestpredictgain第59页,共69页,2023年,2月20日,星期二2.自适应预测adaptiveprediction1)前向自适应预测算法Priortotheadaptivepredictionalgorithm根据短时间的相关特性R(i),求短时的最佳预测系数特点:运算量大,延迟时间大,不能用于高速系统。第60页,共69页,2023年,2月20日,星期二采用不断修正预测系数{hi(n)}的方法来减小瞬时平方差E[d(n)],使{hi(n)}逐步的接近{hiopt(n)}.2)后向序贯自适应预测算法Thesequentialadaptivepredictionalgorithm2第61页,共69页,2023年,2月20日,星期二①LMS算法arithmetic(最小均方算法)(minimummeansquarealgorithm)

梯度系数,它决定了预测系数自适应速率第62页,共69页,2023年,2月20日,星期二②梯度符号算法Gradientsignalgorithm极点预测器零点预测器衰减因子(抗误码因子)第63页,共69页,2023年,2月20日,星期二1.2量化的自适应Quantitativeadaptive1、最佳量化Best

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论