【精品】ppt资料---pcm编码详解.ppt

上传人：活*** IP属地：宁夏上传时间：2019-12-23 格式：PPT 页数：40 大小：416.50KB 积分：15 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

pcm与音频编码第3章话音编码重点脉冲编码调制 pcm 增量调制与自适应增量调制自适应差分脉冲编码调制 adpcm 难点非均匀量化增量调制子带编码波形声音的数据压缩波形声音的码率取样频率量化位数声道数全频带声音的压缩编码第1代压缩编码 pcm编码第2代压缩编码感知声音编码数字语音的压缩编码波形编码参数编码模型编码混合编码语音压缩编码的3类方法波形编码 perceptionmodel basedcompression benefits genericdrawbacks highestcompressionratesaredifficulttoachieve 16kb sexamples pcm adpcm subband参数编码源编码 productionmodel basedcompression benefits highestpossiblecompression2 4kb sdrawbacks signalsource s mustbeknowexamples vocoder混合编码 hybridcompression examples celp4 8kb s 16kb s 脉冲编码调制 pcm 防失真滤波器是一个低通滤波器用来滤除声音频带以外的信号波形编码器可暂时理解为采样器量化器可理解为量化阶大小 step size 生成器或者称为量化间隔生成器 pcm编码框图声音数字化有两个步骤第一步是采样就是每隔一段时间间隔读一次声音的幅度第二步是量化就是把采样得到的声音信号幅度转换成数字值但那时并没有涉及如何进行量化量化有好几种方法但可归纳成两类一类称为均匀量化另一类称为非均匀量化采用的量化方法不同量化后的数据量也就不同因此可以说量化也是一种压缩数据的方法均匀量化采用相等的量化间隔对采样得到的信号作量化那么这种量化称为均匀量化均匀量化就是采用相同的等分尺来度量采样得到的幅度也称为线性量化量化后的样本值y和原始值x的差e y x称为量化误差或量化噪声非均匀量化非线性量化对输入信号进行量化时大的输入信号采用大的量化间隔小的输入信号采用小的量化间隔这样就可以在满足精度要求的情况下用较少的位数来表示声音数据还原时采用相同的规则在非线性量化中采样输入信号幅度和量化输出数据之间定义了两种对应关系一种称为m律压扩 companding 算法另一种称为a律压扩算法采样频率为8khz 样本精度为13位 14位或者16位的输入信号使用m律压扩编码或者使用a律压扩编码经过pcm编码器之后每个样本的精度为8位输出的数据率为64kb s 这就是ccitt推荐的g 711标准 m律压扩和a律压扩 m律压扩北美和日本等地区13位pcm编码转换城8位 a律压扩欧洲和中国大陆等地区 14位pcm编码转换城8位输出信号均为64kb s pcm在通信中的应用提高线路利用率通常用下面两种方法频分多路复用把传输信道的频带分成好几个窄带每个窄带传送一路信号例如一个信道的频带为1400hz 把这个信道分成4个子信道 subchannels 820 990hz 1230 1400hz 1640 1810hz和2050 2220hz 相邻子信道间相距240hz 用于确保子信道之间不相互干扰每对用户仅占用其中的一个子信道这是模拟载波通信的主要手段时分多路复用把传输信道按时间来分割为每个用户指定一个时间间隔每个间隔里传输信号的一部分这样就可以使许多用户同时使用一条传输线路这是数字通信的主要手段例如话音信号的采样频率f 8000hz 它的采样周期 125ms 这个时间称为1帧 frame 在这个时间里可容纳的话路数有两种规格 24路制和30路制 pcm在通信中的应用 pcm在通信中的应用 24路制的重要参数如下每秒钟传送8000帧每帧125ms 12帧组成1复帧用于同步每帧由24个时间片信道和1位同步位组成每个信道每次传送8位代码 1帧有24 8 1 193位位数据传输率r 8000 193 1544kb s 每一个话路的数据传输率 8000 8 64kb s 30路制的重要参数如下每秒钟传送8000帧每帧125ms 16帧组成1复帧用于同步每帧由32个时间片信道组成每个信道每次传送8位代码数据传输率 r 8000 32 8 2048kb s 每一个话路的数据传输率 8000 8 64kb s pcm在通信中的应用 pcm信号复用的复杂程度通常用群 group 表示一次群基群的30路或24路北美叫做t1远距离数字通信线在欧洲叫做e1远距离数字通信线和e1等级二次群的120路或96路三次群的480路或384路预测编码预测编码 predictioncoding 是指利用前面的一个或多个信号对下一个信号进行预测然后对实际值和预测值的差进行编码两种典型的预测编码差分脉码调制 dpcm 自适应差分脉码调制 adpcm dpcm dpcm编码简称差值编码是对模拟信号幅度抽样的差值进行量化编码的调制方式抽样差值的含义请参见增量调制原始的模拟信号经过时间采样然后对每一样值进行量化作为数字信号传输这种方式是用已经过去的抽样值来预测当前的抽样值对它们的差值进行编码差值编码可以提高编码频率这种技术已应用于模拟信号的数字通信之中差分脉码调制 dpcm dpcm不对每一样值都进行量化而是预测下一样值并量化实际值和预测值之间的差 dpcm是基本的编码方法之一在大量的压缩算法中被采用比如jpeg的dc分量就是采用dpcm编码的举例说明dpcm编码原理设dpcm系统预测器的预测值为前一个样值假设输入信号已经量化差值不再进行量化若系统的输入为 0121123344 则预测值为 0012112334 差值为 011 1011010 差值的范围比输入样值的范围有所减小可以用较少的位数进行编码 dpcm 对于有些信号例如图像信号由于信号的瞬时斜率比较大很容易引起过载因此不能用简单增量调制进行编码除此之外这类信号也没有像话音信号那种音节特性因而也不能采用像音节压扩那样的方法只能采用瞬时压扩的方法但瞬时压扩实现起来比较困难因此对于这类瞬时斜率比较大的信号通常采用一种综合了增量调制和脉冲编码调制两者特点的调制方法进行编码这种编码方式被简称为脉码增量调制或称差值脉码调制用dpcm表示 dpcm 这种调制方式的主要特点是把增量值分为个等级然后把个不同等级的增量值编为位二进制代码再送到信道传输因此它兼有增量调制和pcm的各自特点设这个误差电压经过量化后变为个电平中的一个电平间隔可以相等也可以不等这里认为它是间隔相等的均匀量化量化了的误差电压经过脉冲调制器变为pam脉冲序列这个pam信号一方面经过pam编码器编码后得到dpcm信号发送出去另一方面把它经过积分器后变为与输入信号x t 进行比较通过相减器得到误差电压e t dpcm 实验表明经过dpcm调制后的信号其传输的比特率要比pcm的低相应要求的系统传输带宽也大大地减小了此外在相同比特速率条件下 dpcm比pcm信噪比也有很大的改善与 m相比由于它增多了量化级因此在改善量化噪声方面优于 m系统 dpcm的缺点是易受到传输线路上噪声的干扰在抑制信道噪声方面不如 m adpcm adpcm是自适应差分脉冲编码调制的简称最早使用于数字通信系统中该算法利用了语音信号样点间的相关性并针对语音信号的非平稳特点使用了自适应预测和自适应量化在32kbps 8khz速率上能够给出网络等级话音质量 adpcm 为了进一步改善量化性能或压缩数据率可采用自适应量化或自适应预测的方法只要采用了其中的任一种自适应方法均称为adpcm 自适应预测预测参数的最佳化依赖于信源的统计特性要得到最佳的预测参数是一件繁琐的工作而采用固定的预测参数往往又得不到好的性能为了既能使性能较佳又不致于有太大的工作量可以将上述两种方法折衷考虑采用自适应预测 adpcm 现在我们使用的是imaadpcm算法该算法中对量化步长的调整使用了简单的查表方法对于一个输入的pcm值x n 将其与前一时刻的x n 1 预测值做差值得到d n 然后根据当前的量化步长对d n 进行编码再用此sample点的编码值调整量化步长同时还要得到当前sample点的预测值供下一sample点编码使用通过此算法可将样点编码成4bit的码流一个符号位和三个幅度位 adpcm 该算法较简单通过查表简化了运算对于编码后的数据我们采用了wav文件格式该格式对编码后的数据流进行了包装由文件头和数据码流组成文件头中指出了音频数据所采用格式采样率比特率块长度比特数及声道数等信息数据码流以块为单位块头指出了该块起始的预测值和index值码流中每byte的高四位和低四位分别对应一个pcm 当前该算法以其简单实用的特点广泛应用到数字音乐盒和数字录音笔中自适应差分脉码调制 adpcm 具体方法是预测参数仍采用固定的但此时有多组预测参数可供选择这些预测参数根据常见的信源特征求得编码时具体采用哪组预测参数根据信源的特征来自适应的确定为了自适应地选择最佳参数通常将信源数据分区间编码编码时自动地选择一组预测参数使该区间实际值与预测值的均方误差最小随着编码区间的不同预测参数自适应的变化以达到准最佳预测自适应量化根据信号分布不均匀的特点系统具有随输入信号的变化而改变量化区间大小以保持输入给量化器的信号基本均匀的能力这种能力称为自适应量化例如 microsoft的adpcm采用二预测参数提供7组预测系数如右表所示编码时根据选定的准则如最小均方误差准则每个编码区间自动地选取一组最佳的参数增量调制与自适应增量调制增量调制 dm 增量调制也称调制 deltamodulation dm 它是一种预测编码技术是pcm编码的一种变形 pcm是对每个采样信号的整个幅度进行量化编码因此它具有对任意波形进行编码的能力 dm是对实际的采样信号与预测的采样信号之差的极性进行编码将极性变成 0 和 1 这两种可能的取值之一如果实际的采样信号与预测的采样信号之差的极性为正则用 1 表示相反则用 0 表示或者相反由于dm编码只须用1位对话音信号进行编码所以dm编码系统又称为 1位系统增量调制 dm 在输入信号变化快的区域斜率过载是关心的焦点而在输入信号变化慢的区域关心的焦点是粒状噪声为了尽可能避免出现斜率过载就要加大量化阶但这样做又会加大粒状噪声相反如果要减小粒状噪声就要减小量化阶这又会使斜率过载更加严重这就促进了对自适应增量调制 adaptivedeltamodulation adm 的研究自适应增量调制 adm 基本方法在检测到斜率过载时开始增大量化阶而在输入信号的斜率减小时降低量化阶例如宋 song 在1971描述的自适应增量调制技术中提出假定增量调制器的输出为1和0 每当输出不变时量化阶增大50 使预测器的输出跟上输入信号每当输出值改变时量化阶减小50 使粒状噪声减到最小这种自适应方法使斜率过载和粒状噪声同时减到最小又如使用较多的另一种自适应增量调制器是由格林弗基斯 greefkes 1970提出的称为连续可变斜率增量调制 continuouslyvariableslopedeltamodulation cvsd 它的基本方法是如果连续可变斜率增量调制器 continuouslyvariableslopedeltamodulator cvsd 的输出连续出现三个相同的值量化阶就加上一个大的增量反之就加一个小的增量自适应差分脉冲编码调制自适应脉冲编码调制 adaptivepulsecodemodulation apcm 是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术这种自适应可以是瞬时自适应即量化阶的大小每隔几个样本就改变也可以是音节自适应即量化阶的大小在较长时间周期里发生变化改变量化阶大小的方法有两种一种称为前向自适应 forwardadaptation 另一种称为后向自适应 backwardadaptation 前向自适应根据未量化的样本值的均方根值来估算输入信号的电平以此来确定量化阶的大小并对其电平进行编码作为边信息 sideinformation 传送到接收端后向自适应从量化器刚输出的过去样本中来提取量化阶信息由于后向自适应能在发收两端自动生成量化阶所以它不需要传送边信息自适应差分脉冲编码调制差分脉冲编码调制的思想根据过去的样本去估算 estimate 下一个样本信号的幅度大小这个值称为预测值然后对实际信号值与预测值之差进行量化编码从而就减少了表示每个样本信号的位数它与脉冲编码调制 pcm 不同的是 pcm是直接对采样信号进行量化编码而dpcm是对实际信号值与预测值之差进行量化编码存储或者传送的是差值而不是幅度绝对值这就降低了传送或存储的数据量此外它还能适应大范围变化的输入信号自适应差分脉冲编码调制 adpcm adpcm adaptivedifferencepulsecodemodulation 综合了apcm的自适应特性和dpcm系统的差分特性是一种性能比较好的波形编码它的核心想法是利用自适应的思想改变量化阶的大小即使用小的量化阶 step size 去编码小的差值使用大的量化阶去编码大的差值使用过去的样本值估算下一个输入样本的预测值使实际样本值和预测值之间的差值总是最小它的编码简化框图如下图所示 adpcm编译码器 g 721推荐标准这个标准叫做32kb s自适应差分脉冲编码调制在此基础上还制定了g 721的扩充推荐标准即g 723 使用该标准的编码器的数据率可降低到40kb s和24kb s g 722sb adpcm编译码器 g 722推荐标准叫做数据率为64kb s的7khz声音信号编码这个标准把话音信号的质量由电话质量提高到am无线电广播质量而其数据传输率仍保持为64kb s 子带编码 subbandcoding sbc 的基本思想是使用一组带通滤波器 band passfilter bpf 把输入音频信号的频带分成若干个连续的频段每个频段称为子带对每个子带中的音频信号采用单独的编码方案去编码在信道上传送时将每个子带的代码复合起来在接收端译码时将每个子带的代码单独译码然后把它们组合起来还原成原来的音频信号子带编码的编码译码器可以采用adpcm apcm pcm等等带宽的子带不等带宽的子带 g 722sb adpcm编译码器窄带和宽带音频信道频率特性全频带声音的第1代编码技术全频带声音指的是10hz 20 000hz范围里的所有可听声音也叫做宽带声音或高保真 high fidelity 声音第1代全频带数字声音 cd dat 的编码采用pcm编码采样频率 44 1khz或48khz量化精度 16位声道数目 1或2码率 705 6 768 kb s 或1 41 1 54 mb s 全频带声音的第2代编码技术目标在保持高保真声音质量 transparentcompression 的前提下降低码率减轻网络带宽的压力不但充分使用声音信息的统计冗余而且利用人耳的听觉特性即使用心理声

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

【精品】ppt资料---pcm编码详解.ppt

文档简介

温馨提示

最新文档

评论

【精品】ppt资料---pcm编码详解.ppt

文档简介

温馨提示

最新文档

评论

相关文档