第三讲语音信号数字化及信源编码_第1页
第三讲语音信号数字化及信源编码_第2页
第三讲语音信号数字化及信源编码_第3页
第三讲语音信号数字化及信源编码_第4页
第三讲语音信号数字化及信源编码_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

现代通信原理

2010.9~2011.1主要内容抽样技术量化技术

PCM编码原理增量调制原理信源压缩编码第三讲语音信号数字化及信源编码抽样的基本定理和方法是什么?量化的性能衡量标准是什么?最佳量化的设计方法是什么?为什么要采用非均匀量化?PCM系统的完整过程是什么?增量调制的基本原理是什么?信源编码的主要目的是什么?研究对象研究对象在数字通信系统中的位置以语音信号的数字化过程为例着重介绍,基本原理可适用于其他模拟信源的数字化PCM基本原理脉冲编码调制数字通信中的基本问题之一预滤波——限制原始语音频带抽样——时间离散化量化——幅度离散化编码——量化信号形成传输码组复习低通抽样定理一个频带限制在内的连续信号,如果抽样频率大于或等于,则可以由抽样序列无失真地重建恢复原始信号数学描述抽样信号:抽样信号的频谱:低通抽样频谱不混叠!原始信号的重建滤波得到原始信号频谱:重建信号的时域表达式:低通抽样低通抽样定理带来的启示抽样信号的频谱是原始信号频谱的复制和搬移只要频谱不发生混叠,就可以无失真恢复原始信号带通信号的抽样带通抽样-fH-fLfLfH-fL+kfs-fH+(k+1)fs带通信号的抽样保证频谱不混叠的条件带通抽样带通抽样带通抽样定理对于带通信号,抽样频率应满足下列关系式:

其中,N为不超过的最大正整数带通抽样定理给出了带通信号抽样的最低频率带通信号最低抽样频率在2B~4B之间除最低抽样频率外,仍可能有小于2倍最高频率的其他抽样频率当最高频率是带宽的整数倍时,最低抽样频率总为2B自然抽样抽样脉冲为任意形状脉冲表达式抽样脉冲序列:抽样序列:抽样信号频谱:实际抽样频谱形状不变,幅度乘以系数实际抽样平顶抽样-抽样保持每个抽样脉冲顶部不随信号变化——抽样保持电路实现可以等价为理想抽样后再经过一个冲激响应为矩形的网络来形成表达式平顶抽样理想抽样序列:平顶抽样序列:平顶抽样序列频谱:平顶抽样在频谱上引入孔径失真,在收端必须进行频率补偿,抵消失真。补偿滤波器的传递函数为使输出最大,取实际抽样在数字化过程中,抽样没有引起失真!标量量化

称为分层电平或判决阈值。通常把称为量化间隔。可采用量化特性曲线描述量化器输出与输入的关系。连续幅值无限数集合到离散幅值有限数集合的映射标量量化标量量化噪声量化引入的失真-量化误差量化噪声的度量量化器设计的任务最佳量化器:在给定输入信号概率密与量化电平数L的条件下,求出一组分层电平值与量化电平值使均方误差最小标量量化噪声在数字化过程中,量化引入了失真,需要把这种失真最小化!矢量量化输入是一个连续幅值的随机矢量输出是离散幅度的矢量,称为码本或重建码本,L为码本尺度把N维随机矢量空间分为L个子空间,每个子空间对应一个码本矢量矢量量化的失真度量最佳矢量量化量化矢量选择:总平均失真最小:矢量量化矢量量化与标量量化的比较矢量量化是把量化矢量(码字)分别存储在编码和译码两端的码书中,而信道中传输的不是量化矢量本身,而是码字的编号在相同的失真条件下,矢量量化所需要的速率比标量量化低得多,其编码效率更高在相同的速率下,矢量量化的失真比标量量化的失真明显的小矢量量化的复杂度随维数成指数增长,其复杂度比标量量化高矢量量化的应用低速率语音压缩编码提取的语音参数进行联合矢量量化,降低语音编码速率困难在于码本的设计及码本的快速搜索图像压缩编码矢量量化与标量量化的比较量化噪声量化器设计的约束条件信号的概率分布量化电平数量化器设计的优化目标最小化均方误差量化器设计的可控变量分层电平量化电平最佳量化最佳量化器的分层电平与量化电平与信号的概率密度函数有关,与量化电平数有关!没有统一的量化电平分割方法,这给工程实现带来很大的困难!如何解决这个问题?——近似!分层电平

物理意义:分层电平在相邻重建电平的中点重建电平 物理意义:重建电平在分层电平的质心

最佳量化器的求解求解方法:迭代!最佳量化器的求解

讨论特殊情况L>>1时,相邻分层电平间隔区的概率密度可认为是常数物理意义:最佳量化电平正好在分层电平的中点最佳量化器的量化噪声不过载噪声V为量化器最大量化电平思考题:此时量化有什么特征?最佳量化器的求解最佳量化器的量化噪声过载噪声总量化噪声量化信噪比量化信噪比是衡量量化器噪声的重要指标!是数字传输系统的整体噪声的组成部分之一!均匀量化在量化范围内,量化间隔相等不过载量化噪声——引用L>>1时量化噪声的结论,且噪声独立均匀量化量化噪声与信号统计特性无关!只有在信号均匀分布条件下,均匀量化器才是严格意义上的最佳量化器!量化信噪比一般表达式量化比特数规一化有效值dB表示式正弦信号的均匀量化均匀量化情况下,量化比特数增加一位,量化信噪比增加6dB!6dB语音信号的概率密度分布拉普拉斯分布随机信号,必定存在过载噪声语音信号功率量化信噪比过载噪声很小过载噪声很大语音信号的均匀量化语音信号的均匀量化关于D的讨论动态范围:满足量化信噪比输出要求的输入信号功率的变化范围对量化的要求最大的量化电平应尽可能参照最大的信号设定量化信噪比在最小信号下也应满足要求均匀量化器不过载量化噪声与信号分布无关,是一个固定值,因此在小信号时量化信噪比会很低,从而影响动态范围关于量化比特数的讨论均匀量化的比特数与量化信噪比的关系是确定——6dB/比特语音动态范围可达(40-50)dB,高质量电话(长途电话)的SNR至少应大于25dB以上。如果采用均匀量化,为了满足在50dB的范围内的SNR大于25dB的要求,必须采用n=12位的均匀量化器通信带宽要求:12×8K=96Kbps,带宽要求大于48KHz

要寻求其他的量化方法,降低带宽需求!非均匀量化概念量化间隔不相等对于语音信号而言,采用均匀量化是不合理的,小信号出现概率大,对噪声功率的贡献也大,为了使SNR提高,应当减小小信号时的量化间隔。为此,应采用非均匀量化,小信号时量化“细”,大信号时量化“粗”。即采用“瞬时压扩”的概念,以改善信噪比非均匀量化采用压扩特性的量化噪声原始信号经过压缩特性变化后进行均匀量化最佳非均匀量化求解压扩特性,使量化信噪比最大化最佳非均匀量化的求解

利用拉格朗日乘子法,求得均匀分布的最佳压缩特性语音信号最佳压缩特性最佳非均匀量化语音信号的最佳压缩特性提供的动态范围太小,不能满足要求!采用理想的对数压扩函数时量化器输出的信噪比与输入信号无关,但具有放大小信号、压缩大信号的作用,可用于工程应用!对数压扩非均匀量化对数压扩特性下的量化信噪比A律对数压缩特性量化压缩特性小信号段,信噪比增加了24dB(20lg16=24)律对数压缩特性量化压缩特性小信号段,信噪比增加了33.5dBA律压缩特性的数字化实现折线近似-13折线段规一化信号幅度在正区间分成不均匀8个区间区间长度以2倍递增A律13折线段近似压缩量化思考:为什么?编码量化电平变为二进制码组常用二进制码组编码编码对信噪比的影响信道传输过程中产生误码在信号恢复过程中产生失真,即噪声常用FBC语音信号的小信号出现概率大小信号时FBC产生的解码误差要小解码输出的总噪声为量化噪声与信道传输误码噪声之和!传输误码对信噪比的影响(均匀量化、NBC码)误码导致均方误差为考虑低误码率情况,此时仅考虑出现每个码组出现一个误码若采用自然码,且量化电平等该出现,第k位出错产生的误差为接收端信噪比编码SNR下降3dB的误比特率是衡量指标!A律编码表+1250的编解码编码①+1250>0

M1=1

决定极性码②+1250>256

M2=1 ③+1250>1024

M3=1

决定段落码④1250<2048

M4=0

⑤1024+512>1250

M5=0

⑥1024+256>1250

M6=0

决定电平码⑦1024+128<1250

M7=1

⑧1024+128+64<1250M8=1

解码1024+128+64+32=1248A律编解码举例最佳量化:重建电平在分层电平的中点!模拟语音信号频带在10Hz-20kHz,主要集中在低频段预滤波截取语音信号频谱最丰富的区域300Hz-3400Hz抽样低通抽样,8KHz抽样率量化A律或u律折线近似对数压缩量化,8比特8KHz×8bit=64Kbps编解码折线近似编码表,最佳量化特性解码波形重建消除孔径失真,采用补偿滤波器PCM增量调制增量调制的特点实现简单,码率低在比特率低时,增量调制的量化信噪比高于PCM增量调制的抗噪声能力强,能工作于较高误比特率信道广泛应用于军事通信、卫星通信等

基本原理 对信号变化趋势编码!编码器

——输入信号抽样值

——本地译码信号的重建抽样值(接收端重建样值)

——差值信号

——差值信号的量化结果

——单bit数码表示Q[]数码形成Z-1C(n)S(n)e(n)-+Sl(n)增量调制的编解码对信号下一时刻值进行预测,然后对实际值与预测值的差值进行编码!解码器

工作原理考虑理想的无误码信道解码实际编码译码器常用简单RC积分器和比较器来实现延时和量化,实现非常简单!增量调制的编解码解码器就是编码的预测部分!满载情况信号幅度以很大斜率上升时,可能出现差值一直为正的情况,出现连续的1输出信号幅度以很大斜率下降时,可能出现差值一直为负的情况,出现连续的0输出过载情况即使用连续的1或者0,也跟不上实际信号变化的情况临界过载条件增量调制的工作条件分析出现过载,则会导致量化信噪比大幅下降!考虑单频信号其斜率为最大斜率为临界过载(满载)条件对于给定的重建电平,增大采样频率可以提高临界过载频率对于给定的采样频率,增大重建电平可以提高临界过载频率增大重建电平和采样频率的代价是什么增大采样频率会导致信源速率的提升增大重建电平会导致量化噪声的增加信源速率和量化噪声之间存在某种折中增量调制的工作条件分析增量调制的量化噪声量化误差均方误差

设量化噪声功率谱在范围内均匀分布,收端滤波器带宽输出量化噪声在临界过载条件下的最大量化信噪比 误码引起的噪声解码结果的累积和表示若在n时刻发生误码,则则产生误码相当于叠加噪声功率假设滤波器带宽内功率谱是平的,则其功率谱密度RC积分电路增量调制的抗误码能力回顾临界过载时的单频信号功率存在误码时,增量调制的最大信噪比考虑工程实例若信噪比下降3dB对于增量调制的抗误码能力增量调制的抗噪声能力远高于PCM!增量调制的改进数字压扩自适应增量调制-CVSD利用斜率的不可突变性当连续出现“1”或“0”,即可认为信号有出现过载的可能,从而增大Δ当信号的斜率不会发生突变时,这一反馈过程可以使其本地译码信号跟上变化增量总和调制低频信号能够容忍较小的重建电平抑制高频分量可以减小过载的可能性PCM与简单增量调制的比较抽样频率PCM系统的抽样频率8K增量调制系统的抽样频率不能根据抽样定理来确定,而需要根据斜率过载条件以及信噪比来确定,一般情况下,为保证不发生斜率过载以及保证与PCM系统有相同的信噪比,增量调制的抽样频率将远高于PCM系统带宽PCM码速率64Kbit/s,带宽需求32K如要求与PCM有相同的传输质量,则增量调制要求抽样频率100K以上,带宽要求50K增量调制一般速率为32Kbit/s或16Kbit/s,但质量不如PCM

量化信噪比(比较单频正弦情况)抗信道误码性能:

优于PCMPCM与简单增量调制的比较DPCM产生的原因降低语音编码速率的必要性模拟单边带多路载波电话的带宽4K,而PCM的带宽的理论值为32K在频带受限的应用场合经济性太低,如卫星通信、移动通信等PCM占用高带宽的原因分析为满足语音信号的高动态范围而采用了多位的量化对每个采样点都进行量化,没有考虑语音信号的前后相关性增量调制对差值信号只进行一位编码,量化的精度不够,量化信噪比低,但其思想可以借鉴预测编码的概念相邻样点之间可能只有一个量化间隔或少数个量化间隔的差别,PCM传送的信息存在冗余在编码前就去掉相关性很强的冗余,然后再进行编码传送预测编码:根据过去的信号样值预测下一个样值,并且把预测值与现实的采样值之差进行量化加以编码和传送在接收端,经过相同的预测和滤波,即可得到原始信号波形预测编码DPCM基本原理原理框图数学描述DPCM性能一般总是大于1,称为DPCM处理增益,其值主要取决于预测的效果由于量化的是样值与预测值的差值信号,因此动态范围可以减小,同时也可有效减小量化误差,从而使DPCM在较低的编码率下获得较高的信噪比质量需要研究的问题是:如何设计预测器获得更好的SNR零点预测器极点预测器最佳预测器DPCM的量化信噪比增益极点预测器N阶预测器的输出是前N个预测值的线性组合DPCM的预测器设计零点预测器M阶预测器的输出是前M个量化值的线性组合DPCM的预测器设计DPCM的预测器设计零极点预测器把零点预测器和极点预测器组合在一起,即构成零极点预测器最佳预测器确定一组最佳预测系数,使得最小在全极点模型下,并忽略量化误差最终输出的信噪比与预测阶数有关DPCM的预测器设计ADPCM采用自适应的必要性由于不同的讲话人的语音信号的特性各不相同语音信号只能认为是短时平稳采用固定的预测系数不可能对所有的语音信号获得最好的结果,因此有必要采取自适应的算法ADPCM的设计思路尽可能消除语音信号中的冗余对消除冗余后的信号进行有效的比特分配,从自适应角度进行最佳编码自适应的方法自适应量化自适应预测自适应预测前向估值的自适应预测利用未量化的采样信号提取预测信息,有编码延时及边信息传输等问题后向估值的自适应预测利用已量化的样本或发送数据更新预测系数ADPCM自适应预测自适应量化针对被量化信号的变化状态,随时调节量化台阶大小以匹配输入信号的时变方差前向估值的自适应量化对输入信号尚未量化的样本计算出其前向估值大小需要缓存训练的样本,并传送相关的边信息,因此引入了编码延时和占用了一定的信道容量后向估值的自适应量化利用量化器的输出样本计算输出信号的方差估值并确定量化台阶没有延时,但影响估值的追踪速度ADPCM自适应量化语音信号数字化的研究思路信源编码信源编码的目的减少信源输出符号序列的冗余度,提高符号的平均信息量信源编码的思想针对信源输出的符号序列的统计特性,寻找一定的方法把信源输出序列符号变换为最短的码字序列,使每个码元所携带的平均信息量为最大,同时又尽可能保证无失真的恢复出原来的符号序列信源编码的核心就是研究压缩编码算法,用尽可能低的传输码率获得尽可能好的质量信源编码的目的:压缩冗余,提高带宽利用效率!信源编码是现代数字通信的重要组成部分!信源编码的主要方法匹配编码根据编码对象出现的概率分配不同长度的代码,以保证总的代码长度最短需要知道信号的概率分布,可采用数学模型建模的方式或根据大量样本信号进行统计得到典型编码算法:Huffman编码预测编码利用信号之间的相关性,预测未来的信号,对预测的残差信号进行编码变换编码利用信号在不同的函数空间分布的不同,选择合适的函数将信号从一种信号空间变换到另一种有利于压缩编码的信号空间,再进行编码常用的函数变换:DFT、Walsh、DCT、Haar识别编码分解文字、语音、图象的基本特征,与汇集这些基本特征的样本集进行对照识别,选择失真最小的样本编码传送可用于印刷、打印等标准形状的文字、符号和数据的编码信源编码信源编码算法信源编码定理一个熵为H的信源,当信源速率为R时,只要R>H,则能够以任意小的错误概率进行编码;反之,如果R<H,则无论采用多么复杂的编码器和译码器,错误概率都不可能达到任意小Shannon在1948年证明了该定理,但并没有指出具体的编解码算法信源编码失真度量编码失真原始信号x经过编码以及解码后恢复成x’,失真量即为x与x’之间的保真度或近似度的度量常用的失真度量:汉明失真、均方误差等以一定的、可以接受的失真换取较高的信源压缩效率信源编码语音与图像压缩编码类型带宽KHZ采样率KHZ比特/样点比特率kb/s电话语音0.3~3.48864宽带语音0.05~71614224调频广播0.02~153216512CD光盘0.01~2044.116705.6DAB/DAT0.01~204816768常用语音信号的编码速率类型格式分辨率帧频HZ比特/像素比特率Mb/s电视电话QCIF176×14429.97129.1会议电视CIF352×28829.971236.4常规电视ITU-R601720×5762516165.9HDTVITU-R7091920×11522516884.7语音与图像压缩编码常用图像信号的编码速率图像压缩编码图像压缩编码的必要性图像的数据量巨大,一般必须进行压缩编码图像压缩编码的依据图像信号在结构和统计上存在大量的冗余度结构冗余度:空间和时间上的强相关性统计冗余度:被编码信号概率分布的不均匀基于人眼的视觉特性人眼对某些失真较不敏感,察觉不到图像的某些细微变化图像压缩编码的评价压缩效率:压缩前后编码速率的比值压缩质量:恢复图像的质量编码算法的复杂度编解码延时图像编码采取的主要技术措施利用离散余弦变换,去除各象素点在空间域的相关性通过帧间预测差分编码,去除活动图像的时间相关性采用熵编码技术,使编码域信源的概率模型相匹配利用人眼的视觉特性,进行自适应量化编码通过缓冲存储器实现变长码输入与定长码输出之间的匹配图像压缩编码方法图像压缩编码举例Huffman编码基本思想对出现概率较大的信源符号编以较短的代码,对出现概率较小的信源符号编以较长的代码JPEG、H.261、MPEG-1、MPEG-2中对量化后的DCT系数进行Huffman编码编码算法

初始化,根据符号概率的大小按由大到小顺序对符号进行排序;把概率最小的两个符号组成一个节点;重复步骤2,形成一棵“树”;从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的;从根节点开始顺着树枝到每个叶子分别写出每个符号的代码编码特点霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代码。如果事先编写出一本解释各种代码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码。霍夫曼码没有错误保护功能,如果码串中有错误,哪怕是1位出现错误,会出现错误传播(errorpropagation)。霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑图像压缩编码举例预测变换编码利用图像信号的空间和时间冗余特性,用已知的相邻象素或图像块预测当前象素值,再对预测误差进行量化、编码和传输帧内预测编码,在一帧图像内进行预测,消除图像在空间的相关性帧间预测编码,在多幅图像之间进行预测,消除图像在时间域上的相关性关键在于预测算法的选取游程长度编码编码对象为信源符号在信息流中连续出现的长度,根据其出现概率的不同编成不同长度的码字常用于文件传真系统中图像压缩编码举例StandardOrganizationVideoCodingStandardTypicalRangeofBitRatesTypicalApplicationsITU-TH.261P*64kbits/sISDNVideoConferencingITU-TH.263,H.263+,H.263++WiderangePSTNVideoPhoneITU-TH.26L<64kbits/sWiderangeISO11172-2MPEG-1Video1.5Mbits/sCD-ROMISO13818-2MPEG-2Video4-80Mbits/sSDTV,HDTVISO14496-2MPEG-4VideoWiderangeWiderangeJVT(ITU-T,ISO)H.264WiderangeWiderange中国标准AVSWiderangeWiderange图像压缩编码标准语音压缩编码语音编码的基本问题给定编码速率的条件下,如何获得更高质量的重建语音给定重建语音质量的条件下,如何降低编码速率基本依据利用语音信号本身的冗余度以及人耳的听觉特性主要指标语音编码质量编码速率编码算法的复杂度编解码的延时语音压缩编码算法语音编码器波形编码器参量编码器频域时域非差分子带编码自适应变换域编码差分PCMDPCMM连续可变斜率MADPCMAPC线性预测编码信道声码器共振峰声码器倒频谱声码器语音激励声码器多脉冲激励LPC码本激励LPC矢量和激励LPC混合编码器波形编码力图使重建语音信号保持原始语音波形语音信号作为一般信号进行处理适应能力强,重建语音质量好编码速率较高,一般应用于64-16K速率参量编码(声码器)通过对语音信号特征参数的提取及编码,力图使语音信号有尽可能高的可懂度,保持语音的语意重建语音信号的波形与原始语音信号的波形可能有相当大的差别往往利用某种语音生成的模型,在幅度谱上逼近原始语音合成语音的自然度不好,抗背景噪声的能力比较差混合编码结合声码器的特点,同时又利用波形编码器的特点提取语音参数,优化激励信号使其达到与原始语音的波形匹配中速率语音编码4.8-16K,应用于蜂窝移动通信、卫星通信、军用通信低速率语音编码100bit/s-4.8Kbit/s语音压缩编码分类语音编码的标准G.711PCM(64kbps)G.721ADPCM(32kbps)G.7227kHz带宽64kbps速率内的音频编码G.723.16.3k/5.6k双速率多媒体语音编码G.72816kbps语音编码LD-CELPG.7298kbps多媒体语音编码线形预测编码LPC的原理原理:模型化人类语音信号产生的机制,提取模型参数,并且只传输模型的参数。语音信号的产生模型:语音的产生,声带和声道不同语音产生的原因:声音激励源和声道不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论