版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
成都理工大学工程技术学院电子信息工程系主讲教师:徐灵飞数字信号的DSP实现成都理工大学工程技术学院主讲教师:徐灵飞数字信号的DSP实现1第7章信号压缩编码的DSP实现第一节非线性量化的DSP实现第二节预测编码的DSP实现第7章信号压缩编码的DSP实现第一节非线性量化的DS语音编码的分类按照压缩后传输所需要的数据速率可以分为:高速率语音编码,速率32kbit/s以上,PCM64kbit/s,主要用于公用电话网中高速率语音编码,速率16~32kbit/s,ADPCM,32kbit/s主要用于公用网。中速率语音编码,速率4.8~16kbit/s,GSM用得RPE/LTP(规则脉冲激励长时预测编码
)13kbit/s;VSELP(矢量和激励线性预测编码
)8kb/s主要用于数字移动通信话音邮件;低速率语音编码,速率1.2~4.8kbit/sCELP4.8kb/s,LPC1.2kb/s主要用于保密话音极低速率语音编码,速率1.2kbit/s以下语音编码的分类按照压缩后传输所需要的数据速率可以分为:PCM脉冲编码调制是PulseCodeModulation的缩写。PCM编码的方法是对语音信号进行采样,然后对每个样值进行量化编码。CCITT(现ITU-T)的64kbit/s语音编码标准G.711采用PCM编码方式,采样速率为8kHz,每个样值用8bit非线性的μ律或A律进行编码,总速率为64kbit/s。ΔM增量调制
是DeltaModulation的缩写。增量调制编码的方法是比较当前采样值和前一个采样值的大小,若当前采样值大于前一个采样值,则编码为1,否则编码为0。PCM脉冲编码调制是PulseCodeModulatADPCM
自适应差分脉冲编码调制
是AdaptiveDifferentialPulseCodeModulation的编写。ADPCM编码的方法是对输入样值进行自适应预测,然后对预测误差进行量化编码。CCITT的32kbit/s语音编码标准G.721采用ADPCM编码方式,每个语音样值相当于用4bit进行编码。ADPCM
自适应差分脉冲编码调制
是Adaptive1、语音编码的分类-波形编码波形编码:以尽可能重构语音波形为原则进行数据压缩,即在编码端以波形逼近为原则,对语音信号进行编码,解码端根据这些编码数据恢复出语音信号的波形。波形编码比较简单,编码前采样定理对模拟语音信号进行量化,然后进行幅度量化,再进行二进制编码。解码器作数/模变换后再由低通滤波器恢复出现原始的模拟语音波形,这就是最简单的脉冲编码调制(PCM),也称为线性PCM。可以通过非线性量化,前后样值的差分、自适应预测等方法实现数据压缩。1、语音编码的分类-波形编码波形编码:以尽可能重构语音波形为1、语音编码的分类-波形编码波形编码的目标是让解码器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,也即失真要最小。波形编码的方法简单,数码率较高,在64kbit/s至32kbit/s之间音质优良,当数码率低于32kbit/s的时候音质明显降低,16kbit/s时音质非常差。脉冲编码调制,自适应增量调制,自适应差分脉冲编码调制,自适应子带编码,自适应预测编码都属于这类编码方式。
1、语音编码的分类-波形编码波形编码的目标是让解码器恢复出的2、语音编码的分类-声码器参数编码(声码器):从听觉的角度注重语音本身的重现,通常都是基于某种语音产生模型的假定,在编码端分析出这种模型的参数并选择适当的方式对其进行高效的编码,解码端则利用这些参数和语音产生模型重新合成语音。参数编码过程中对语音信号特征参数进行提取和编码,力图使重建语音信号具有尽可能高的可懂性。2、语音编码的分类-声码器参数编码(声码器):从听觉的角度注声码器,是根据人的发生机理,在编码端对语音信号进行分析,分解成有声音和无声音两部分。声码器每隔一定时间分析一次语音,传送一次分析得到的有/无声和滤波参数。在解码端根据接收的参数再合成声音。声码器编码后的码率可以做得很低,如1.2kbit/s、2.4kbit/s,但是也有其缺点。首先是合成语音质量较差,往往清晰度可以而自然度没有,难于辨认说话人是谁,其次是复杂度比较高。通道声码器,共振峰声码器以及线性预测声码器都是这类参数编码器2、语音编码的分类-声码器2、语音编码的分类-声码器3、语音编码的分类-混合编码混合编码是将波形编码和声码器的原理结合起来,数码率约在4kbit/s—16kbit/s之间,音质比较好,最近有个别算法所取得的音质可与波形编码相当,复杂程度介乎与波形编码器和声码器之间多脉冲激励线性预测编码,规则脉冲激励线性预测编码,码本激励线性预测编码都是混合编码器。3、语音编码的分类-混合编码混合编码是将波形编码和声码器的原话音的分类浊音(voicedsounds):声道打开,声带在先打开后关闭,气流经过使声带要发生张驰振动,变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。清音(unvoicedsounds):声带不振动,而在某处保持收缩,气流在声道里收缩后高速通过产生湍流,再经过主声道(咽、口腔)的调整最终形成清音。清音的激励源被等效为一种白噪声信号。爆破音(plosivesounds):声道关闭之后产生压缩空气然后突然打开声道所发出的声音。话音的分类浊音(voicedsounds):声道打开,声带话音产生的数字模型周期脉冲序列发生器伪随机噪声产生器周期时变数字滤波器音量控制声道参数语音输出浊/清选择话音产生的数字模型周期脉冲序列发生器伪随机噪声产生器周期时变语音信号编码系统的应用语音信号编码系统的应用归纳起来可以分为两类:一类是编码-存储-回放系统,或称为数字语音录放系统。语音信号编码系统的应用语音信号编码系统的应用归纳起来可以分为语音信号编码系统的应用一类是编码-传输-解码系统,或称为数字电话通信系统。语音信号编码系统的应用一类是编码-传输-解码系统,或称为数字衡量语音编码性能的主要因素无论是数字语音录放系统还是数字电话通信系统对语音编码器都提出了一些共同的要求,其中包括语音编码速率,编码质量,编解码延时以及算法的复杂程度等。语音编码或称语音压缩编码研究的基本问题就是在给定的编码速率的条件下,如何得到尽量好的重建语音质量,或称为编码质量,同时应尽量减少编解码延时以及算法的复杂程度。或者说在给定编码质量,编解码延时以及算法复杂程度的条件下,如何降低语音编码所需要的比特率。衡量语音编码性能的主要因素无论是数字语音录放系统还是数字电话编码速率可以用比特/秒来度量,代表编码的总速率,一般用I表示。也可以用比特/样本来度量,代表了平均每个语音样点用多少比特编码,一般用R表示。二者的关系是:
信号类型采样频率(KHz)带宽(KHz)频率范围(Hz)电话83.2200~3400电话会议16750~7000激光唱盘CD44.12020~20000数字声广播机及数字声磁带482020~20000编码速率可以用比特/秒来度量,代表编码的总速率,一般用I表示编码速率在波形编码中,为了取得高质量的重建话音,一般取在参数编码中R可以低到0.25甚至0.1以下。编码速率在波形编码中,为了取得高质量的重建话音,一般取编解码的复杂程度编解码的复杂程度同语音编码的话音质量有密切的关系,在相同数码率的情况下,采用复杂一些的算法将会获得更好的话音质量。编解码算法的复杂程度同硬件的实现有密切关系,它将决定硬件实现的复杂程度、体积、功耗以及成本等,目前在许多应用中都是采用通用的数字信号处理芯片实时实现各种语音编码算法。编解码的复杂程度编解码的复杂程度同语音编码的话音质量有密切的编解码延时增加算法的复杂程度可以提高语音编码质量,但会增加编解码的延时。在实时处理的语音通信系统中,语音编解码延时同线路传输延时的作用一样,对系统的通信质量有很大的影响。编解码延时增加算法的复杂程度可以提高语音编码质量,但会增加编编解码延时延时影响通话质量的另一个原因是回声。在电话网中二/四线转换处,由于阻抗匹配不理想,甲端四线的收话音信号会泄漏到该端的四线的发路径去,它返回乙端发话者,这就形成了回声。当延时比较小时,回声同话机侧音及房间交混回响声相混,就感觉不到。当往返总延时超过约100ms左右,发话者就能听到自己的回声。如果回声传输路径衰减不够大,就会听到多次回声,从而严重影响通话质量。对于公用电话网,可能有几次音频转接,也就会有多次语音编解码,要求单次语音编解码延时不能超过5~10ms。编解码延时延时影响通话质量的另一个原因是回声。在电话网中二/提高语音编码质量的基本途径提高语音编码质量的基本途径两种利用语音信号的冗余度利用人耳的听觉特性语音信号的冗余度主要表现在:语音信号幅度分布的非均匀性样点之间的相关性提高语音编码质量的基本途径提高语音编码质量的基本途径两种脉冲编码调制(PCM)PulseCodeModulation第一节非线性量化的DSP实现脉冲编码调制(PCM)PulseCodeModulatiPCM的量化方式均匀量化与非均匀量化第一节非线性量化的DSP实现PCM的量化方式均匀量化与非均匀量化第一节非线性量化的u_LAW算法μ律的处理过程为:压缩和扩张;压缩是指在发送端对输入信号进行压缩处理,再均匀量化,相当于非均匀量化;扩张是在接收端进行相应的扩张处理,以恢复原始信号。
第一节非线性量化的DSP实现u_LAW算法μ律的处理过程为:压缩和扩张;压缩是指在发送u_LAW算法μ律的压缩特性方程为:
其中:μ=255压缩特性曲线为:第一节非线性量化的DSP实现其中:u_LAW算法μ律的压缩特性方程为:其中:μ=255第一u_LAW算法第一节非线性量化的DSP实现u_LAW算法第一节非线性量化的DSP实现u_LAW算法经过压缩的采样信号,按8位二进制进行编码,编码表如下:
第一节非线性量化的DSP实现u_LAW算法经过压缩的采样信号,按8位二进制进行编码,编u_LAW算法μ律扩张编码表为:
第一节非线性量化的DSP实现u_LAW算法μ律扩张编码表为:第一节非线性量化的A_LAW算法μ律的扩张特性方程为:
式中:A=87.6
第一节非线性量化的DSP实现A_LAW算法μ律的扩张特性方程为:式中:A=87.6A_LAW算法压缩特性曲线为:第一节非线性量化的DSP实现A_LAW算法压缩特性曲线为:第一节非线性量化的DSA_LAW算法经过压缩的采样信号,按8位二进制进行编码,编码表如下:
第一节非线性量化的DSP实现A_LAW算法经过压缩的采样信号,按8位二进制进行编码,编A_LAW算法A律的扩张码表为:
第一节非线性量化的DSP实现A_LAW算法A律的扩张码表为:第一节非线性量化的在小信号段,μ律变换对小信号有33.5dB的增益,A律变换对小信号有24dB的增益。目前国际上,常采用A律13折线压扩特性或μ律15折线的压扩特性。我国采用A律13折线压扩特性。采用13折线压扩特性后,小信号的量化信噪比改善量可达24dB,这是靠牺牲大信号量化信噪比(亏损12dB)换来的。第一节非线性量化的DSP实现在小信号段,μ律变换对小信号有33.5dB的增益,A律变换对PCM与时分多路复用(TDM)第一节非线性量化的DSP实现PCM与时分多路复用(TDM)第一节非线性量化的DSP对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。对大信号来说,虽然绝对量化误差较大,但是因为:(1)大信号出现的机会不多,(2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。非均匀量化也是一种压缩。第一节非线性量化的DSP实现对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以CCITTG.711规定的A律和u律PCM采用非线性量化,在64kbit/s速率话音质量能够达到网络等级。在PCM编码方法中,对样值采用3~4位编码就可以使对方能够听懂,但是噪音比较大,在PCM通信中,通常采用8bit编码。数字码分为三部分:极性码,段落码,段内码第一节非线性量化的DSP实现CCITTG.711规定的A律和u律PCM采用非线性量化,极性码:语音信号是双极性信号,最高位表示符号位,1表示正极性,0表示负极性,编码时首先将样值与零电平比较。A律十三折线和U律十五折线量化都是先将样值从零到最大值之间非均匀的分割成8个段落,然后在将8个段落均匀的分为16个等分,用三位码表示样值的幅度位于8个段落的哪个段落段内码表示样值的幅度属于段落中的哪个量化级,用4bit的信息表示。第一节非线性量化的DSP实现极性码:语音信号是双极性信号,最高位表示符号位,1表示正极性第二节预测编码的DSP实现第二节预测编码的DSP实现自适应脉冲编码调制(APCM)的概念自适应脉冲编码调制(adaptivepulsecodemodulation,APCM)是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。改变量化阶大小的方法有两种:一种称为前向自适应(forwardadaptation),另一种称为后向自适应(backwardadaptation)。第二节预测编码的DSP实现自适应脉冲编码调制(APCM)的概念自适应脉冲编码调制(adDPCM编码的原理DPCM采用预测编码的方式传输信号,所谓预测编码就是根据过去的信号样值来预测下一个信号样值,并仅把预测值与现实样值的差值加以量化,编码后进行数字信号传输。在接收端经过和发送端相同的预测操作,低通滤波器便可恢复出与原始信号相近的波形。DPCM是采用固定预测器与固定量化器的差值脉冲调制,它是分析ADPCM工作原理的基础。 第二节预测编码的DSP实现DPCM编码的原理DPCM采用预测编码的方式传输信号,所谓预DPCM编码的原理-发送端第二节预测编码的DSP实现DPCM编码的原理-发送端第二节预测编码的DSP实现DPCM编码的原理-接收端第二节预测编码的DSP实现DPCM编码的原理-接收端第二节预测编码的DSP实现010000110010000100001001101010111100DPCM编码在低频信号处有较好的应用。可以使用较少的信息来表示波形信号信息。第二节预测编码的DSP实现0100DPCM编码在低频信号处有较好的应用。第二节预010000110010000100001001101010111100“SlopeOverload”DPCM编码斜率突变在高频出不能使用简单的信息来表示样点前后之间的信息。误差引起严重的波形变形。第二节预测编码的DSP实现0100“SlopeOverload”DPCM编码斜率突变DPCM引起的误差DOKDtoosmallDtoolarge第二节预测编码的DSP实现DPCM引起的误差DOKDtoosmallDtooADPCM编码使用大的量化步进编码高频信息,使用小的步进编码低频信息。第二节预测编码的DSP实现ADPCM编码使用大的量化步进编码高频信息,使用小的步进编码ADPCM编码ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值;用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。接收端的译码器使用与发送端相同的算法,利用传送来的信号来确定量化器和逆量化器中的量化阶大小,并且用它来预测下一个接收信号的预测值。第二节预测编码的DSP实现ADPCM编码ADPCM综合了APCM的自适应特性和DPCMADPCM编码ADPCM编码技术能根据接收到的语音信号波形来预测下一个语音信号,这样它只需编码每一个接收信号中与之不同的部分,从而减少编码的位长。其编码的过程是这样的:ADPCM编码器接收到每秒8000次的语音信号抽样值。每接收到一个语音信号,它根据语音信号的PCM编码按照一定算法得到下次信号的预测值。最简单的预测方式就是把上次的语音信号的PCM编码值与上次的预测值进行对比,得到一个信号的差值,这个差值可以用很少的位长来表示。第二节预测编码的DSP实现ADPCM编码ADPCM编码技术能根据接收到的语音信号波形来CCITTG.72132kb/sADPCMCCITT推荐的G.721ADPCM标准是一个代码转换系统。它使用ADPCM转换技术,实现64kb/sA律或μ律PCM速率和32kb/s速率的ADPCM之间的相互转换。G.721算法的话音质量接近于A律或μ律64kb/sPCM的话音质量,MOS分为4.1,达到网络等级。采样频率为8KHz,每个样点采用4比特编码。CCITTG.72132kb/sADPCM主要用来实现对现有的PCM信道扩容,把2个2048kb/s30路PCM基群信号转换为一个2048kb/s60路ADPCM信号。因此对ADPCM编码器输出和输入都是采用A律或者μ律的PCM信号。第二节预测编码的DSP实现CCITTG.72132kb/sADPCMCCITT在各种语音信号系统,ADPCM常被用来做声音编解碼的方法,且CCITT已提出建议书G.726、G.721,所以有很多市面上的录音装置,都用这个方法,最好的况状下,此方法可将传输的数据量变成原来的¼.第二节预测编码的DSP实现在各种语音信号系统,ADPCM常被用来做声音编解碼的方法,ADPCM编码器结构StepSizeCalculationZ-1EncoderDecoderZ-1X(n)Inputsampled(n)DifferenceStepsizess(n)Adjustedstepsizess(n+1)L(n)ADPCMoutputsample4bitsX(n)estimateX(n-1)estimateoflastinputsample+_第二节预测编码的DSP实现ADPCM编码器结构StepSizeZ-1Encoder第二节预测编码的DSP实现B3(符号位)B2(数据位2)B1(符号位1)B0(符号位0)CCITTG.72132kb/sADPCM可以实现4:1的压缩比,能够将长度为16位的数据转换成4位的数据,相应的数据格式如下所示:第二节预测编码的DSP实现B3B2B1B0CCITTCCITTG.72132kb/sADPCM编码编程原理1、letB3=B2=B1=B0=02、if(d(n)<0)
thenB3=13、d(n)=ABS(d(n))4、If(d(n)>=ss(n))
thenB2=1andd(n)=d(n)-ss(n)5、if(d(n)>=ss(n)/2)thenB1=1andd(n)=d(n)-ss(n)/26、if(d(n)>=ss(n)/4)
thenB0=17、L(n)=(10002*B3)+(1002*B2)+(102*B1)+B0第二节预测编码的DSP实现CCITTG.72132kb/sADPCM编码编程原编码算法StepsizeTable[89]={7,8,9,10,11,12,13,14,16,17,19,21,23,25,28,31,34,37,41,45,50,55,60,66,73,80,88,97,107,118,130,143,157,173,190,209,230,253,279,307,337,371,408,449,494,544,598,658,724,796,876,963,1060,1166,1282,1411,1552,1707,1878,2066,2272,2499,2749,3024,3327,3660,4026,4428,4871,5358,5894,6484,7132,7845,8630,9493,10442,11487,12635,13899,15289,16818,18500,20350,22385,24623,27086,29794,32767};
第二节预测编码的DSP实现编码算法StepsizeTable[89]={第二节编码算法IndexTable[16]={-1,-1,-1,-1,2,4,6,8,-1,-1,-1,-1,2,4,6,8};第二节预测编码的DSP实现编码算法IndexTable[16]={第二节预测01234567891011121314151617789101112131416171921232528313437IndexStepSize18192021222324252627282930313233343541455055606673808897107118130143157173190209IndexStepSize36373839404142434445464748495051525323025327930733737140844949454459865872479687696310601166IndexStepSize545556575859606162636465666768697071128214111552170718782066227224992749302433273660402644284871535858946484IndexStepSize7273747576777879808182838485868788713278458630949310442114871263513899152891681818500203502235824623270862979432767IndexStepSizeIMAStep-sizeTable07IndexStep1841IndexStep36230IADPCM解码器StepSizeCalculationZ-1Decoder+Z-1X(n)Outputsampled(n)DifferenceStepsizess(n)Adjustedstepsizess(n+1)L(n)ADPCMinputsample4bitsX(n-1)第二节预测编码的DSP实现ADPCM解码器StepSizeZ-1Decoder+ZCCITTG.72132kb/sADPCM解码编程原理1、d(n)=(ss(n)*B2)+(ss(n)/2*B1)+(ss(n)/4*B0)+(ss(n)/8)2、if(B3=1)
thend(n)=d(n)*(-1)3、X(n)=X(n-1)+d(n)第二节预测编码的DSP实现CCITTG.72132kb/sADPCM解码编程原解码算法:StepsizeTable[89]={7,8,9,10,11,12,13,14,16,17,19,21,23,25,28,31,34,37,41,45,50,55,60,66,73,80,88,97,107,118,130,143,157,173,190,209,230,253,279,307,337,371,408,449,494,544,598,658,724,796,876,963,1060,1166,1282,1411,1552,1707,1878,2066,2272,2499,2749,3024,3327,3660,4026,4428,4871,5358,5894,6484,7132,7845,8630,9493,10442,11487,12635,13899,15289,16818,18500,20350,22385,24623,27086,29794,32767};
IndexTable[16]={-1,-1,-1,-1,2,4,6,8,-1,-1,-1,-1,2,4,6,8};第二节预测编码的DSP实现解码算法:StepsizeTable[89]={Inde第二节预测编码的DSP实现编码原始的信号经ADPCM编码并解码后的信号误差信号第二节预测编码的DSP实现编码原始的信号经ADPCM编第二节预测编码的DSP实现编码原始的信号经ADPCM编码并解码后的信号误差信号第二节预测编码的DSP实现编码原始的信号经ADPCM编第二节预测编码的DSP实现编码原始的信号经ADPCM编码并解码后的信号误差信号第二节预测编码的DSP实现编码原始的信号经ADPCM编第二节预测编码的DSP实现编码原始的信号经ADPCM编码并解码后的信号误差信号第二节预测编码的DSP实现编码原始的信号经ADPCM编第二节预测编码的DSP实现编码原始的信号经ADPCM编码并解码后的信号误差信号第二节预测编码的DSP实现编码原始的信号经ADPCM编第二节预测编码的DSP实现误差信号1误差信号2第二节预测编码的DSP实现误差信号1误差信号2谢谢谢谢成都理工大学工程技术学院电子信息工程系主讲教师:徐灵飞数字信号的DSP实现成都理工大学工程技术学院主讲教师:徐灵飞数字信号的DSP实现67第7章信号压缩编码的DSP实现第一节非线性量化的DSP实现第二节预测编码的DSP实现第7章信号压缩编码的DSP实现第一节非线性量化的DS语音编码的分类按照压缩后传输所需要的数据速率可以分为:高速率语音编码,速率32kbit/s以上,PCM64kbit/s,主要用于公用电话网中高速率语音编码,速率16~32kbit/s,ADPCM,32kbit/s主要用于公用网。中速率语音编码,速率4.8~16kbit/s,GSM用得RPE/LTP(规则脉冲激励长时预测编码
)13kbit/s;VSELP(矢量和激励线性预测编码
)8kb/s主要用于数字移动通信话音邮件;低速率语音编码,速率1.2~4.8kbit/sCELP4.8kb/s,LPC1.2kb/s主要用于保密话音极低速率语音编码,速率1.2kbit/s以下语音编码的分类按照压缩后传输所需要的数据速率可以分为:PCM脉冲编码调制是PulseCodeModulation的缩写。PCM编码的方法是对语音信号进行采样,然后对每个样值进行量化编码。CCITT(现ITU-T)的64kbit/s语音编码标准G.711采用PCM编码方式,采样速率为8kHz,每个样值用8bit非线性的μ律或A律进行编码,总速率为64kbit/s。ΔM增量调制
是DeltaModulation的缩写。增量调制编码的方法是比较当前采样值和前一个采样值的大小,若当前采样值大于前一个采样值,则编码为1,否则编码为0。PCM脉冲编码调制是PulseCodeModulatADPCM
自适应差分脉冲编码调制
是AdaptiveDifferentialPulseCodeModulation的编写。ADPCM编码的方法是对输入样值进行自适应预测,然后对预测误差进行量化编码。CCITT的32kbit/s语音编码标准G.721采用ADPCM编码方式,每个语音样值相当于用4bit进行编码。ADPCM
自适应差分脉冲编码调制
是Adaptive1、语音编码的分类-波形编码波形编码:以尽可能重构语音波形为原则进行数据压缩,即在编码端以波形逼近为原则,对语音信号进行编码,解码端根据这些编码数据恢复出语音信号的波形。波形编码比较简单,编码前采样定理对模拟语音信号进行量化,然后进行幅度量化,再进行二进制编码。解码器作数/模变换后再由低通滤波器恢复出现原始的模拟语音波形,这就是最简单的脉冲编码调制(PCM),也称为线性PCM。可以通过非线性量化,前后样值的差分、自适应预测等方法实现数据压缩。1、语音编码的分类-波形编码波形编码:以尽可能重构语音波形为1、语音编码的分类-波形编码波形编码的目标是让解码器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,也即失真要最小。波形编码的方法简单,数码率较高,在64kbit/s至32kbit/s之间音质优良,当数码率低于32kbit/s的时候音质明显降低,16kbit/s时音质非常差。脉冲编码调制,自适应增量调制,自适应差分脉冲编码调制,自适应子带编码,自适应预测编码都属于这类编码方式。
1、语音编码的分类-波形编码波形编码的目标是让解码器恢复出的2、语音编码的分类-声码器参数编码(声码器):从听觉的角度注重语音本身的重现,通常都是基于某种语音产生模型的假定,在编码端分析出这种模型的参数并选择适当的方式对其进行高效的编码,解码端则利用这些参数和语音产生模型重新合成语音。参数编码过程中对语音信号特征参数进行提取和编码,力图使重建语音信号具有尽可能高的可懂性。2、语音编码的分类-声码器参数编码(声码器):从听觉的角度注声码器,是根据人的发生机理,在编码端对语音信号进行分析,分解成有声音和无声音两部分。声码器每隔一定时间分析一次语音,传送一次分析得到的有/无声和滤波参数。在解码端根据接收的参数再合成声音。声码器编码后的码率可以做得很低,如1.2kbit/s、2.4kbit/s,但是也有其缺点。首先是合成语音质量较差,往往清晰度可以而自然度没有,难于辨认说话人是谁,其次是复杂度比较高。通道声码器,共振峰声码器以及线性预测声码器都是这类参数编码器2、语音编码的分类-声码器2、语音编码的分类-声码器3、语音编码的分类-混合编码混合编码是将波形编码和声码器的原理结合起来,数码率约在4kbit/s—16kbit/s之间,音质比较好,最近有个别算法所取得的音质可与波形编码相当,复杂程度介乎与波形编码器和声码器之间多脉冲激励线性预测编码,规则脉冲激励线性预测编码,码本激励线性预测编码都是混合编码器。3、语音编码的分类-混合编码混合编码是将波形编码和声码器的原话音的分类浊音(voicedsounds):声道打开,声带在先打开后关闭,气流经过使声带要发生张驰振动,变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。清音(unvoicedsounds):声带不振动,而在某处保持收缩,气流在声道里收缩后高速通过产生湍流,再经过主声道(咽、口腔)的调整最终形成清音。清音的激励源被等效为一种白噪声信号。爆破音(plosivesounds):声道关闭之后产生压缩空气然后突然打开声道所发出的声音。话音的分类浊音(voicedsounds):声道打开,声带话音产生的数字模型周期脉冲序列发生器伪随机噪声产生器周期时变数字滤波器音量控制声道参数语音输出浊/清选择话音产生的数字模型周期脉冲序列发生器伪随机噪声产生器周期时变语音信号编码系统的应用语音信号编码系统的应用归纳起来可以分为两类:一类是编码-存储-回放系统,或称为数字语音录放系统。语音信号编码系统的应用语音信号编码系统的应用归纳起来可以分为语音信号编码系统的应用一类是编码-传输-解码系统,或称为数字电话通信系统。语音信号编码系统的应用一类是编码-传输-解码系统,或称为数字衡量语音编码性能的主要因素无论是数字语音录放系统还是数字电话通信系统对语音编码器都提出了一些共同的要求,其中包括语音编码速率,编码质量,编解码延时以及算法的复杂程度等。语音编码或称语音压缩编码研究的基本问题就是在给定的编码速率的条件下,如何得到尽量好的重建语音质量,或称为编码质量,同时应尽量减少编解码延时以及算法的复杂程度。或者说在给定编码质量,编解码延时以及算法复杂程度的条件下,如何降低语音编码所需要的比特率。衡量语音编码性能的主要因素无论是数字语音录放系统还是数字电话编码速率可以用比特/秒来度量,代表编码的总速率,一般用I表示。也可以用比特/样本来度量,代表了平均每个语音样点用多少比特编码,一般用R表示。二者的关系是:
信号类型采样频率(KHz)带宽(KHz)频率范围(Hz)电话83.2200~3400电话会议16750~7000激光唱盘CD44.12020~20000数字声广播机及数字声磁带482020~20000编码速率可以用比特/秒来度量,代表编码的总速率,一般用I表示编码速率在波形编码中,为了取得高质量的重建话音,一般取在参数编码中R可以低到0.25甚至0.1以下。编码速率在波形编码中,为了取得高质量的重建话音,一般取编解码的复杂程度编解码的复杂程度同语音编码的话音质量有密切的关系,在相同数码率的情况下,采用复杂一些的算法将会获得更好的话音质量。编解码算法的复杂程度同硬件的实现有密切关系,它将决定硬件实现的复杂程度、体积、功耗以及成本等,目前在许多应用中都是采用通用的数字信号处理芯片实时实现各种语音编码算法。编解码的复杂程度编解码的复杂程度同语音编码的话音质量有密切的编解码延时增加算法的复杂程度可以提高语音编码质量,但会增加编解码的延时。在实时处理的语音通信系统中,语音编解码延时同线路传输延时的作用一样,对系统的通信质量有很大的影响。编解码延时增加算法的复杂程度可以提高语音编码质量,但会增加编编解码延时延时影响通话质量的另一个原因是回声。在电话网中二/四线转换处,由于阻抗匹配不理想,甲端四线的收话音信号会泄漏到该端的四线的发路径去,它返回乙端发话者,这就形成了回声。当延时比较小时,回声同话机侧音及房间交混回响声相混,就感觉不到。当往返总延时超过约100ms左右,发话者就能听到自己的回声。如果回声传输路径衰减不够大,就会听到多次回声,从而严重影响通话质量。对于公用电话网,可能有几次音频转接,也就会有多次语音编解码,要求单次语音编解码延时不能超过5~10ms。编解码延时延时影响通话质量的另一个原因是回声。在电话网中二/提高语音编码质量的基本途径提高语音编码质量的基本途径两种利用语音信号的冗余度利用人耳的听觉特性语音信号的冗余度主要表现在:语音信号幅度分布的非均匀性样点之间的相关性提高语音编码质量的基本途径提高语音编码质量的基本途径两种脉冲编码调制(PCM)PulseCodeModulation第一节非线性量化的DSP实现脉冲编码调制(PCM)PulseCodeModulatiPCM的量化方式均匀量化与非均匀量化第一节非线性量化的DSP实现PCM的量化方式均匀量化与非均匀量化第一节非线性量化的u_LAW算法μ律的处理过程为:压缩和扩张;压缩是指在发送端对输入信号进行压缩处理,再均匀量化,相当于非均匀量化;扩张是在接收端进行相应的扩张处理,以恢复原始信号。
第一节非线性量化的DSP实现u_LAW算法μ律的处理过程为:压缩和扩张;压缩是指在发送u_LAW算法μ律的压缩特性方程为:
其中:μ=255压缩特性曲线为:第一节非线性量化的DSP实现其中:u_LAW算法μ律的压缩特性方程为:其中:μ=255第一u_LAW算法第一节非线性量化的DSP实现u_LAW算法第一节非线性量化的DSP实现u_LAW算法经过压缩的采样信号,按8位二进制进行编码,编码表如下:
第一节非线性量化的DSP实现u_LAW算法经过压缩的采样信号,按8位二进制进行编码,编u_LAW算法μ律扩张编码表为:
第一节非线性量化的DSP实现u_LAW算法μ律扩张编码表为:第一节非线性量化的A_LAW算法μ律的扩张特性方程为:
式中:A=87.6
第一节非线性量化的DSP实现A_LAW算法μ律的扩张特性方程为:式中:A=87.6A_LAW算法压缩特性曲线为:第一节非线性量化的DSP实现A_LAW算法压缩特性曲线为:第一节非线性量化的DSA_LAW算法经过压缩的采样信号,按8位二进制进行编码,编码表如下:
第一节非线性量化的DSP实现A_LAW算法经过压缩的采样信号,按8位二进制进行编码,编A_LAW算法A律的扩张码表为:
第一节非线性量化的DSP实现A_LAW算法A律的扩张码表为:第一节非线性量化的在小信号段,μ律变换对小信号有33.5dB的增益,A律变换对小信号有24dB的增益。目前国际上,常采用A律13折线压扩特性或μ律15折线的压扩特性。我国采用A律13折线压扩特性。采用13折线压扩特性后,小信号的量化信噪比改善量可达24dB,这是靠牺牲大信号量化信噪比(亏损12dB)换来的。第一节非线性量化的DSP实现在小信号段,μ律变换对小信号有33.5dB的增益,A律变换对PCM与时分多路复用(TDM)第一节非线性量化的DSP实现PCM与时分多路复用(TDM)第一节非线性量化的DSP对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。对大信号来说,虽然绝对量化误差较大,但是因为:(1)大信号出现的机会不多,(2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。非均匀量化也是一种压缩。第一节非线性量化的DSP实现对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以CCITTG.711规定的A律和u律PCM采用非线性量化,在64kbit/s速率话音质量能够达到网络等级。在PCM编码方法中,对样值采用3~4位编码就可以使对方能够听懂,但是噪音比较大,在PCM通信中,通常采用8bit编码。数字码分为三部分:极性码,段落码,段内码第一节非线性量化的DSP实现CCITTG.711规定的A律和u律PCM采用非线性量化,极性码:语音信号是双极性信号,最高位表示符号位,1表示正极性,0表示负极性,编码时首先将样值与零电平比较。A律十三折线和U律十五折线量化都是先将样值从零到最大值之间非均匀的分割成8个段落,然后在将8个段落均匀的分为16个等分,用三位码表示样值的幅度位于8个段落的哪个段落段内码表示样值的幅度属于段落中的哪个量化级,用4bit的信息表示。第一节非线性量化的DSP实现极性码:语音信号是双极性信号,最高位表示符号位,1表示正极性第二节预测编码的DSP实现第二节预测编码的DSP实现自适应脉冲编码调制(APCM)的概念自适应脉冲编码调制(adaptivepulsecodemodulation,APCM)是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。改变量化阶大小的方法有两种:一种称为前向自适应(forwardadaptation),另一种称为后向自适应(backwardadaptation)。第二节预测编码的DSP实现自适应脉冲编码调制(APCM)的概念自适应脉冲编码调制(adDPCM编码的原理DPCM采用预测编码的方式传输信号,所谓预测编码就是根据过去的信号样值来预测下一个信号样值,并仅把预测值与现实样值的差值加以量化,编码后进行数字信号传输。在接收端经过和发送端相同的预测操作,低通滤波器便可恢复出与原始信号相近的波形。DPCM是采用固定预测器与固定量化器的差值脉冲调制,它是分析ADPCM工作原理的基础。 第二节预测编码的DSP实现DPCM编码的原理DPCM采用预测编码的方式传输信号,所谓预DPCM编码的原理-发送端第二节预测编码的DSP实现DPCM编码的原理-发送端第二节预测编码的DSP实现DPCM编码的原理-接收端第二节预测编码的DSP实现DPCM编码的原理-接收端第二节预测编码的DSP实现010000110010000100001001101010111100DPCM编码在低频信号处有较好的应用。可以使用较少的信息来表示波形信号信息。第二节预测编码的DSP实现0100DPCM编码在低频信号处有较好的应用。第二节预010000110010000100001001101010111100“SlopeOverload”DPCM编码斜率突变在高频出不能使用简单的信息来表示样点前后之间的信息。误差引起严重的波形变形。第二节预测编码的DSP实现0100“SlopeOverload”DPCM编码斜率突变DPCM引起的误差DOKDtoosmallDtoolarge第二节预测编码的DSP实现DPCM引起的误差DOKDtoosmallDtooADPCM编码使用大的量化步进编码高频信息,使用小的步进编码低频信息。第二节预测编码的DSP实现ADPCM编码使用大的量化步进编码高频信息,使用小的步进编码ADPCM编码ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即用小的量化阶去编码小的差值,使用大的量化阶去编码大的差值;用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。接收端的译码器使用与发送端相同的算法,利用传送来的信号来确定量化器和逆量化器中的量化阶大小,并且用它来预测下一个接收信号的预测值。第二节预测编码的DSP实现ADPCM编码ADPCM综合了APCM的自适应特性和DPCMADPCM编码ADPCM编码技术能根据接收到的语音信号波形来预测下一个语音信号,这样它只需编码每一个接收信号中与之不同的部分,从而减少编码的位长。其编码的过程是这样的:ADPCM编码器接收到每秒8000次的语音信号抽样值。每接收到一个语音信号,它根据语音信号的PCM编码按照一定算法得到下次信号的预测值。最简单的预测方式就是把上次的语音信号的PCM编码值与上次的预测值进行对比,得到一个信号的差值,这个差值可以用很少的位长来表示。第二节预测编码的DSP实现ADPCM编码ADPCM编码技术能根据接收到的语音信号波形来CCITTG.72132kb/sADPCMCCITT推荐的G.721ADPCM标准是一个代码转换系统。它使用ADPCM转换技术,实现64kb/sA律或μ律PCM速率和32kb/s速率的ADPCM之间的相互转换。G.721算法的话音质量接近于A律或μ律64kb/sPCM的话音质量,MOS分为4.1,达到网络等级。采样频率为8KHz,每个样点采用4比特编码。CCITTG.72132kb/sADPCM主要用来实现对现有的PCM信道扩容,把2个2048kb/s30路PCM基群信号转换为一个2048kb/s60路ADPCM信号。因此对ADPCM编码器输出和输入都是采用A律或者μ律的PCM信号。第二节预测编码的DSP实现CCITTG.72132kb/sADPCMCCITT在各种语音信号系统,ADPCM常被用来做声音编解碼的方法,且CCITT已提出建议书G.726、G.721,所以有很多市面上的录音装置,都用这个方法,最好的况状下,此方法可将传输的数据量变成原来的¼.第二节预测编码的DSP实现在各种语音信号系统,ADPCM常被用来做声音编解碼的方法,ADPCM编码器结构StepSizeCalculationZ-1EncoderDecoderZ-1X(n)Inputsampled(n)DifferenceStepsizess(n)Adjustedstepsizess(n+1)L(n)ADPCMoutputsample4bitsX(n)estimateX(n-1)estimateoflastinputsample+_第二节预测编码的DSP实现ADPCM编码器结构StepSizeZ-1Encoder第二节预测编码的DSP实现B3(符号位)B2(数据位2)B1(符号位1)B0(符号位0)CCITTG.72132kb/sADPCM可以实现4:1的压缩比,能够将长度为16位的数据转换成4位的数据,相应的数据格式如下所示:第二节预测编码的DSP实现B3B2B1B0CCITTCCITTG.72132kb/sADPCM编码编程原理1、letB3=B2=B1=B0=02、if(d(n)<0)
thenB3=13、d(n)=ABS(d(n))4、If(d(n)>=ss(n))
thenB2=1andd(n)=d(n)-ss(n)5、if(d(n)>=ss(n)/2)thenB1=1andd(n)=d(n)-ss(n)/26、if(d(n)>=ss(n)/4)
thenB0=17、L(n)=(10002*B3)+(1002*B2)+(102*B1)+B0第二节预测编码的DSP实现CCITTG.72132kb/sADPCM编码编程原编码算法StepsizeTable[89]={7,8,9,10,11,12,13,14,16,17,19,21,23,25,28,31,34,37,41,45,50,55,60,66,73,80,88,97,107,118,130,143,157,173,190,209,230,253,279,307,337,371,408,449,494,544,598,658,724,796,876,963,1060,1166,1282,1411,1552,1707,1878,2066,2272,2499,2749,3024,3327,3660,4026,4428,4871,5358,5894,6484,7132,7845,8630,9493,10442,11487,12635,13899,15289,16818,18500,20350,22385,24623,27086,29794,32767};
第二节预测编码的DSP实现编码算法StepsizeTable[89]={第二节编码算法IndexTable[16]={-1,-1,-1,-1,2,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 羊布鲁氏菌病防控技术规范
- 蔬菜水果农药残留快速检测
- 催乳通乳技术操作指引
- 针灸留针时间控制规范
- 心肺功能筛查操作指南
- 危险化学品应急预案备案
- 减脂期低卡轻食配餐服务指引
- 甜菜糖份积累提升技术方案
- 销售业绩统计考核管理制度
- 水肥一体化滴灌系统操作指南
- 《化工园区消防站建设指南(试行)》
- 2026年中国实体剧本杀消费洞察报告
- 电气二次基础培训课件
- 电力线路巡检报告模板
- 中考历史【小论文题】答题技巧
- 湘财券商招聘笔试测试题及答案
- 人力资源管理信息系统介绍
- 文创产品打样合同范本
- 多发性共患糖尿病疾病修正治疗(DMT)方案
- 2025年人工智能在航运业的应用
- 2024年A特种设备相关管理(A4电梯)考试题库附答案
评论
0/150
提交评论