[工学]5第三讲语音信号数字化及压缩编码.ppt_第1页
[工学]5第三讲语音信号数字化及压缩编码.ppt_第2页
[工学]5第三讲语音信号数字化及压缩编码.ppt_第3页
[工学]5第三讲语音信号数字化及压缩编码.ppt_第4页
[工学]5第三讲语音信号数字化及压缩编码.ppt_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲 语音信号数字化及 压缩编码(2) *1 DPCM v降低语音编码速率的必要性 模拟单边带多路载波电话的带宽4K,而PCM的 带宽的理论值为32K 在频带受限的应用场合经济性太低,如卫星通信 、移动通信等 PCM占用高带宽的原因分析 v为满足语音信号的高动态范围而采用了多位的量化 v对每个采样点都进行量化,没有考虑语音信号的前后 相关性 Date2 v预测编码的概念 相邻样点之间可能只有一个量化间隔或少数个量化间 隔的差别,PCM传送的信息存在冗余 在编码前就去掉相关性很强的冗余,然后再进行编码 传送 预测编码,就是根据过去的信号样值预测下一个样值 ,并且把预测值与现实的采样值之差进行量化加以编 码和传送 在接收端,经过相同的预测和滤波,即可得到原始信 号波形 Date3 vDPCM基本原理 Date4 vDPCM性能 一般总是大于1,称为DPCM处理增益,其值主要取 决于预测的效果 由于量化的是样值与预测值的差值信号,因此动态范 围可以减小,同时也可有效减小量化误差,从而使 DPCM在较低的编码率下获得较高的信噪比质量 需要研究的问题是:如何设计预测器获得更好的SNR v零点预测器 v极点预测器 v最佳预测器 Date5 v极点预测器 N阶预测器的输出是前N个本地重建值的线性组合 由于H(Z)只有极点,称这种预测器为全极点预测器 Date6 v零点预测器 M阶预测器的输出是前M个量化值的线性组合 Date7 零极点预测器 把零点预测器和极点预测器组合在一起,即构成零极 点预测器 Date8 v最佳预测器 确定一组最佳预测系数,使得 最小 在全极点模型下,并忽略量化误差 最终输出的信噪比与预测阶数有关 Date9 增量调制( ,DeltaM) (1)简单增量调制 可以认为是 一位编码时的特例, 但编码的是差值信号。 编码过程 Date10 Q 数码 形成 Z-1 C(n)S(n) e(n) - + Sl(n) 解码 增量调制编码器 增量调制解码器 Date11 差值信号 Date12 译码过程 实际编码译码器常用简单RC积分器和比 较器来实现 和 Date13 (2)斜率过载和量化信噪比 当信号变化速率超出 波形变化速率 时,会出现斜率过载现象,以单频信号 为例 Date14 Date15 量化噪声 量化信噪比 Date16 通常认为 在 内均匀分布, 则低通滤波 后 Date17 临界过载时 信噪比与信号幅度有关,信号幅度小,信噪 比降低 Date18 例: 结论: 与 三次方成正比, 提 高一倍, 增大9 与 成反比,信号频率 提高一倍, 下降6 Date19 简单增量调制的性能改进 简单增量调制有两个问题: 斜率过载 动态范围 Date20 (1).数字压扩自适应增量调制 可同时解决动态范围和斜率过载问题。 基本概念:如同非均匀 中那样,改变量化间隔。 如果连续出现多个“1”或者“0,即可认为信号有出现过 载的可能,从而增大,使其本地译码信号跟上变化。 如果量阶随信号瞬时压扩,则称为瞬时压扩, 如果量阶随语音音节时间间隔中信号的平均斜率变 化而进行压扩,则称为CVSD连续可变斜率 一音节基音周期(520)ms Date21 (2).增量总和调制 可解决斜率过载问题 其要点是:将信号先进行积分,改变其 频率响应。使高频分量幅度下降(与预 加重相反),然后再进行 编码。 为此,在接收端为了不失真恢复原信号 ,需要将解码后信号进行微分。 Date22 信道误码对 的影响 对简单 有 Date23 例如: 抗误码性能优于 概念上来看:个别误码不会引起信号严重恶化 Date24 简单增量调制与PCM的性能比较 v抽样频率 PCM系统的抽样频率8K 系统的抽样频率不能根据抽样定理来确定,而需要 根据斜率过载条件以及信噪比来确定,一般情况下, 为保证不发生斜率过载以及保证与PCM系统有相同的 信噪比, 的抽样频率将远高于PCM系统 v带宽 PCM码速率64Kbit/s,带宽需求32K 如要求与PCM有相同的传输质量,则要求抽样频率 100K以上,带宽要求50K 一般速率为32Kbit/s或16Kbit/s,但质量不如PCM Date25 v量化信噪比(比较单频正弦情况) v抗信道误码性能 v 优于PCM v设备复杂度 v单路 简单,多路PCM简单 Date26 ADPCM v采用自适应的必要性 由于不同的讲话人的语音信号的特性各不相同 语音信号只能认为是短时平稳 采用固定的预测系数不可能对所有的语音信号获得最 好的结果,因此有必要采取自适应的算法 ADPCM的设计思路 v尽可能消除语音信号中的冗余 v对消除冗余后的信号进行有效的比特分配,从自适应角度进 行最佳编码 自适应的方法 v自适应量化 v自适应预测 Date27 v自适应量化 针对被量化信号的变化状态,随时调节量化台 阶大小以匹配输入信号的时变方差 前向估值的自适应量化 v对输入信号尚未量化的样本计算出其前向估值大小 v需要缓存训练的样本,并传送相关的边信息,因此 引入了编码延时和占用了一定的信道容量 后向估值的自适应量化 v利用量化器的输出样本计算输出信号的方差估值并 确定量化台阶 v没有延时,但影响估值的追踪速度 Date28 v自适应预测 前向估值的自适应预测 v思路与前向估值量化一致,同样有编码延时及边信息传输等问 题 后向估值的自适应预测 v利用已量化的样本或发送数据更新预测系数 Date29 信源编码 v信源编码的目的 减少信源输出符号序列的冗余度,提高符号的平均信息 量 v信源编码的主要方法 针对信源输出的符号序列的统计特性,寻找一定的方法 把信源输出序列符号变换为最短的码字序列,使每个码 元所携带的平均信息量为最大,同时又尽可能保证无失 真的恢复出原来的符号序列 信源编码的核心就是研究压缩编码算法,用尽可能低的 传输码率获得尽可能好的质量 Date30 匹配编码 v根据编码对象出现的概率分配不同长度的代码,以保证总的代 码长度最短 v需要知道信号的概率分布,可采用数学模型建模的方式或根据 大量样本信号进行统计得到 v典型编码算法:Huffman编码 预测编码 v利用信号之间的相关性,预测未来的信号,对预测的残差信号 进行编码 变换编码 v利用信号在不同的函数空间分布的不同,选择合适的函数将信 号从一种信号空间变换到另一种有利于压缩编码的信号空间, 再进行编码 v常用的函数变换:DFT、Walsh、DCT、Haar 识别编码 v分解文字、语音、图象的基本特征,与汇集这些基本特征的样 本集进行对照识别,选择失真最小的样本编码传送 v可用于印刷、打印等标准形状的文字、符号和数据的编码 Date31 v信源编码算法 信源编码定理 v一个熵为H的信源,当信源速率为R时,只要RH, 则能够以任意小的错误概率进行编码;反之,如果 RH,则无论采用多么复杂的编码器和译码器,错 误概率都不可能达到任意小 vShannon在1948年证明了该定理,但并没有指出具 体的编解码算法 v信源编码与失真度量 编码失真 v原始信号x经过编码以及解码后恢复成x,失真量即 为x与x之间的保真度或近似度的度量 v常用的失真度量:汉明失真、均方误差等 v以一定的、可以接受的失真换取较高的信源压缩效 率 Date32 语音与图像压缩编码 类型带宽 KHZ 采样率 KHZ 比特/样点比特率 kb/s 电话语音0.33.481296 宽带语音0.0571614224 调频广播0.02 153216512 CD光盘0.01 2044.116705.6 DAB/DAT0.01 204816768 Date33 类型格式分辨率帧频HZ比特/像素比特率 Mb/s 电视电话QCIF17614429.97129.1 会议电视CIF35228829.971236.4 常规电视ITU-R6017205762516165.9 HDTVITU-R709192011522516884.7 Date34 图像压缩编码 v图像压缩编码的必要性 图像的数据量巨大,一般必须进行压缩编码 v图像压缩编码的依据 图像信号在结构和统计上存在大量的冗余度 v结构冗余度:空间和时间上的强相关性 v统计冗余度:被编码信号概率分布的不均匀 基于人眼的视觉特性 v人眼对某些失真较不敏感,察觉不到图像的某些细微变化 v图像压缩编码的评价 压缩效率:压缩前后编码速率的比值 压缩质量:恢复图像的质量 编码算法的复杂度 编解码延时 v图像编码采取的主要技术措施 利用离散余弦变换,去除各象素点在空间域的相关性 通过帧间预测差分编码,去除活动图像的时间相关性 采用熵编码技术,使编码域信源的概率模型相匹配 利用人眼的视觉特性,进行自适应量化编码 通过缓冲存储器实现变长码输入与定长码输出之间的匹配 , Date35 图像压缩编码方法 Date36 图像压缩编码举例 vHuffman编码 基本思想 v对出现概率较大的信源符号编以较短的代码,对出现概率较小 的信源符号编以较长的代码 vJPEG、H.261、MPEG-1、 MPEG-2中对量化后的DCT系数进 行Huffman编码 编码算法 1. 初始化,根据符号概率的大小按由大到小顺序对符号进行排序; 2. 把概率最小的两个符号组成一个节点; 3. 重复步骤2,形成一棵“树” ; 4. 从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝) 或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅 是分配的代码不同,而代码的平均长度是相同的。 5. 从根节点开始顺着树枝到每个叶子分别写出每个符号的代码 Date37 编码特点 霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代 码。如果事先编写出一本解释各种代码意义的“词典”,即码 簿,那么就可以根据码簿一个码一个码地依次进行译码。 霍夫曼码没有错误保护功能,如果码串中有错误,哪怕是1位 出现错误,会出现错误传播(error propagation)。 霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件 中间的内容,然后再译码,这就需要在存储代码之前加以考 虑 Date38 v预测变换编码 利用图像信号的空间和时间冗余特性,用已知的相邻 象素或图像块预测当前象素值,再对预测误差进行量 化、编码和传输 帧内预测编码,在一帧图像内进行预测,消除图像在 空间的相关性 帧间预测编码,在多幅图像之间进行预测,消除图像 在时间域上的相关性 关键在于预测算法的选取 v游程长度编码 编码对象为信源符号在信息流中连续出现的长度,根 据其出现概率的不同编成不同长度的码字 常用于文件传真系统中 Date39 Standard Organization Video Coding Standard Typical Range of Bit Rates Typical Applications ITU-TH.261P*64 k bits/s ISDN Video Conferencing ITU-T H.263, H.263+, H.263+ Wide range PSTN Video Phone ITU-TH.26L64kbits/sWide range ISO 11172-2 MPEG-1 Video 1.5 M bits/sCD-ROM ISO 13818-2 MPEG-2 Video 4-80 M bits/sSDTV, HDTV ISO 14496-2 MPEG-4 Video Wide rangeWide range JVT (ITU-T, ISO)H.264Wide rangeWide range 中国标标准AVSWide rangeWide range Date40 语音压缩编码 v语音编码的基本问题 给定编码速率的条件下,如何获得更高质量的重建语音 给定重建语音质量的条件下,如何降低编码速率 v基本依据 利用语音信号本身的冗余度以及人耳的听觉特性 v主要指标 语音编码质量 编码速率 编码算法的复杂度 编解码的延时 Date41 语音压缩编码算法 语音编码器 波形编码器 参量编码器 频域 时域 非差分 子带编码 自适应变 换域编码 差分 PCM DPC M M连续可变 斜率M ADPCMAPC 线性预测编码 信道声码器 共振峰声码器 倒频谱声码器 语音激励声码器 多脉冲激励LPC 码本激励LPC 矢量和激励LPC 混合编码器 Date42 v波形编码 力图使重建语音信号保持原始语音波形 语音信号作为一般信号进行处理 适应能力强,重建语音质量好 编码速率较高,一般应用于6416K速率 v参量编码(声码器) 通过对语音信号特征参数的提取及编码,力图使语音信号有尽可 能高的可懂度,保持语音的语意 重建语音信号的波形与原始语音信号的波形可能有相当大的差别 往往利用某种语音生成的模型,在幅度谱上逼近原始语音 合成语音的自然度不好,抗背景噪声的能力比较差 v混合编码 结合声码器的特点,同时又利用波形编码器的特点 提取语音参数,优化激励信号使其达到与原始语音的波形匹配 v中速率语音编码 4.816K,应用于蜂窝移动通信、卫星通信、军用通信 v低速率语音编码 100bit/s-4.8Kbit/s Date43 语音编码的标准 vG.711 PCM (64k bps) vG.721 ADPCM (32k bps) vG.722 7kHz带宽64k bps速率内的音频编码 vG.723.1 6.3k/5.6k 双速率多媒体语音编码 vG.728 16k bps 语音编码 LD-CELP vG.729 8k bps多媒体语音编码 Date44 线形预测编码LPC的原理 v原理:模型化人类语音信号产生的机制,提取模 型参数,并且只传输模型的参数。 v语音信号的产生模型: 语音的产生,声带和声道 不同语音产生的原因:声音激励源和声道不同 声音分类:浊音和清音 v发声过程 口腔和鼻腔形成时变滤波器 Date45 LPC语音编码 语音信号相邻样点之间又很强的相关性,可以用过去的样点的线性组 合来预测未来的样点 预测的误差 因此 上式可看成信号e(n)激励一个全极点滤波器 得到语音信号 与人的发声过程吻合,采用清音及浊音二元激励模型即可合成语音 使误差均方最小,可求得一组预测系数ak, 传送:预测系数,基音周期和增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论