




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
pcm与音频编码 第3章话音编码 重点 脉冲编码调制 pcm 增量调制与自适应增量调制自适应差分脉冲编码调制 adpcm 难点 非均匀量化增量调制子带编码 波形声音的数据压缩 波形声音的码率 取样频率 量化位数 声道数全频带声音的压缩编码 第1代压缩编码 pcm编码第2代压缩编码 感知声音编码数字语音的压缩编码 波形编码参数编码 模型编码 混合编码 语音压缩编码的3类方法 波形编码 perceptionmodel basedcompression benefits genericdrawbacks highestcompressionratesaredifficulttoachieve 16kb sexamples pcm adpcm subband参数编码 源编码 productionmodel basedcompression benefits highestpossiblecompression2 4kb sdrawbacks signalsource s mustbeknowexamples vocoder混合编码 hybridcompression examples celp4 8kb s 16kb s 脉冲编码调制 pcm 防失真滤波器 是一个低通滤波器 用来滤除声音频带以外的信号 波形编码器 可暂时理解为 采样器 量化器 可理解为 量化阶大小 step size 生成器或者称为 量化间隔 生成器 pcm编码框图 声音数字化有两个步骤 第一步是采样 就是每隔一段时间间隔读一次声音的幅度 第二步是量化 就是把采样得到的声音信号幅度转换成数字值 但那时并没有涉及如何进行量化 量化有好几种方法 但可归纳成两类 一类称为均匀量化 另一类称为非均匀量化 采用的量化方法不同 量化后的数据量也就不同 因此 可以说量化也是一种压缩数据的方法 均匀量化 采用相等的量化间隔对采样得到的信号作量化 那么这种量化称为均匀量化 均匀量化就是采用相同的 等分尺 来度量采样得到的幅度 也称为线性量化量化后的样本值y和原始值x的差e y x称为量化误差或量化噪声 非均匀量化 非线性量化 对输入信号进行量化时 大的输入信号采用大的量化间隔 小的输入信号采用小的量化间隔 这样就可以在满足精度要求的情况下用较少的位数来表示 声音数据还原时 采用相同的规则 在非线性量化中 采样输入信号幅度和量化输出数据之间定义了两种对应关系 一种称为m律压扩 companding 算法 另一种称为a律压扩算法 采样频率为8khz 样本精度为13位 14位或者16位的输入信号 使用m律压扩编码或者使用a律压扩编码 经过pcm编码器之后每个样本的精度为8位 输出的数据率为64kb s 这就是ccitt推荐的g 711标准 m律压扩和a律压扩 m律压扩 北美和日本等地区13位pcm编码转换城8位 a律压扩欧洲和中国大陆等地区 14位pcm编码转换城8位输出信号均为64kb s pcm在通信中的应用 提高线路利用率通常用下面两种方法频分多路复用 把传输信道的频带分成好几个窄带 每个窄带传送一路信号 例如 一个信道的频带为1400hz 把这个信道分成4个子信道 subchannels 820 990hz 1230 1400hz 1640 1810hz和2050 2220hz 相邻子信道间相距240hz 用于确保子信道之间不相互干扰 每对用户仅占用其中的一个子信道 这是模拟载波通信的主要手段 时分多路复用 把传输信道按时间来分割 为每个用户指定一个时间间隔 每个间隔里传输信号的一部分 这样就可以使许多用户同时使用一条传输线路 这是数字通信的主要手段 例如 话音信号的采样频率f 8000hz 它的采样周期 125ms 这个时间称为1帧 frame 在这个时间里可容纳的话路数有两种规格 24路制和30路制 pcm在通信中的应用 pcm在通信中的应用 24路制的重要参数如下 每秒钟传送8000帧 每帧125ms 12帧组成1复帧 用于同步 每帧由24个时间片 信道 和1位同步位组成 每个信道每次传送8位代码 1帧有24 8 1 193位 位 数据传输率r 8000 193 1544kb s 每一个话路的数据传输率 8000 8 64kb s 30路制的重要参数如下 每秒钟传送8000帧 每帧125ms 16帧组成1复帧 用于同步 每帧由32个时间片 信道 组成 每个信道每次传送8位代码 数据传输率 r 8000 32 8 2048kb s 每一个话路的数据传输率 8000 8 64kb s pcm在通信中的应用 pcm信号复用的复杂程度 通常用 群 group 表示一次群 基群 的30路 或24路 北美叫做t1远距离数字通信线 在欧洲叫做e1远距离数字通信线和e1等级 二次群的120路 或96路 三次群的480路 或384路 预测编码 预测编码 predictioncoding 是指利用前面的一个或多个信号对下一个信号进行预测 然后对实际值和预测值的差进行编码 两种典型的预测编码 差分脉码调制 dpcm 自适应差分脉码调制 adpcm dpcm dpcm编码 简称差值编码 是对模拟信号幅度抽样的差值进行量化编码的调制方式 抽样差值的含义请参见 增量调制 原始的模拟信号经过时间采样 然后对每一样值进行量化 作为数字信号传输 这种方式是用已经过去的抽样值来预测当前的抽样值 对它们的差值进行编码 差值编码可以提高编码频率 这种技术已应用于模拟信号的数字通信之中 差分脉码调制 dpcm dpcm不对每一样值都进行量化 而是预测下一样值 并量化实际值和预测值之间的差 dpcm是基本的编码方法之一 在大量的压缩算法中被采用 比如jpeg的dc分量就是采用dpcm编码的 举例说明dpcm编码原理 设dpcm系统预测器的预测值为前一个样值 假设输入信号已经量化 差值不再进行量化 若系统的输入为 0121123344 则预测值为 0012112334 差值为 011 1011010 差值的范围比输入样值的范围有所减小 可以用较少的位数进行编码 dpcm 对于有些信号 例如图像信号 由于信号的瞬时斜率比较大 很容易引起过载 因此 不能用简单增量调制进行编码 除此之外 这类信号也没有像话音信号那种音节特性 因而也不能采用像音节压扩那样的方法 只能采用瞬时压扩的方法 但瞬时压扩实现起来比较困难 因此 对于这类瞬时斜率比较大的信号 通常采用一种综合了增量调制和脉冲编码调制两者特点的调制方法进行编码 这种编码方式被简称为脉码增量调制 或称差值脉码调制 用dpcm表示 dpcm 这种调制方式的主要特点是把增量值分为个等级 然后把个不同等级的增量值编为位二进制代码 再送到信道传输 因此 它兼有增量调制和pcm的各自特点 设这个误差电压经过量化后变为个电平中的一个 电平间隔可以相等 也可以不等 这里认为它是间隔相等的均匀量化 量化了的误差电压经过脉冲调制器变为pam脉冲序列 这个pam信号一方面经过pam编码器编码后得到dpcm信号发送出去 另一方面把它经过积分器后变为与输入信号x t 进行比较 通过相减器得到误差电压e t dpcm 实验表明 经过dpcm调制后的信号 其传输的比特率要比pcm的低 相应要求的系统传输带宽也大大地减小了 此外 在相同比特速率条件下 dpcm比pcm信噪比也有很大的改善 与 m相比 由于它增多了量化级 因此 在改善量化噪声方面优于 m系统 dpcm的缺点是易受到传输线路上噪声的干扰 在抑制信道噪声方面不如 m adpcm adpcm是自适应差分脉冲编码调制的简称 最早使用于数字通信系统中 该算法利用了语音信号样点间的相关性 并针对语音信号的非平稳特点 使用了自适应预测和自适应量化 在32kbps 8khz速率上能够给出网络等级话音质量 adpcm 为了进一步改善量化性能或压缩数据率 可采用自适应量化或自适应预测的方法 只要采用了其中的任一种自适应方法 均称为adpcm 自适应预测 预测参数的最佳化依赖于信源的统计特性 要得到最佳的预测参数是一件繁琐的工作 而采用固定的预测参数往往又得不到好的性能 为了既能使性能较佳 又不致于有太大的工作量 可以将上述两种方法折衷考虑 采用自适应预测 adpcm 现在我们使用的是imaadpcm算法 该算法中对量化步长的调整使用了简单的查表方法 对于一个输入的pcm值x n 将其与前一时刻的x n 1 预测值做差值得到d n 然后根据当前的量化步长对d n 进行编码 再用此sample点的编码值调整量化步长 同时还要得到当前sample点的预测值供下一sample点编码使用 通过此算法可将样点编码成4bit的码流 一个符号位和三个幅度位 adpcm 该算法较简单 通过查表简化了运算 对于编码后的数据我们采用了wav文件格式 该格式对编码后的数据流进行了包装 由文件头和数据码流组成 文件头中指出了音频数据所采用格式 采样率 比特率 块长度 比特数及声道数等信息 数据码流以块为单位 块头指出了该块起始的预测值和index值 码流中每byte的高四位和低四位分别对应一个pcm 当前该算法以其简单实用的特点广泛应用到数字音乐盒和数字录音笔中 自适应差分脉码调制 adpcm 具体方法是 预测参数仍采用固定的 但此时有多组预测参数可供选择 这些预测参数根据常见的信源特征求得 编码时具体采用哪组预测参数根据信源的特征来自适应的确定 为了自适应地选择最佳参数 通常将信源数据分区间编码 编码时自动地选择一组预测参数 使该区间实际值与预测值的均方误差最小 随着编码区间的不同 预测参数自适应的变化 以达到准最佳预测 自适应量化 根据信号分布不均匀的特点 系统具有随输入信号的变化而改变量化区间大小 以保持输入给量化器的信号基本均匀的能力 这种能力称为自适应量化 例如 microsoft的adpcm采用二预测参数 提供7组预测系数 如右表所示 编码时 根据选定的准则 如最小均方误差准则 每个编码区间自动地选取一组最佳的参数 增量调制与自适应增量调制 增量调制 dm 增量调制也称 调制 deltamodulation dm 它是一种预测编码技术 是pcm编码的一种变形 pcm是对每个采样信号的整个幅度进行量化编码 因此它具有对任意波形进行编码的能力 dm是对实际的采样信号与预测的采样信号之差的极性进行编码 将极性变成 0 和 1 这两种可能的取值之一 如果实际的采样信号与预测的采样信号之差的极性为 正 则用 1 表示 相反则用 0 表示 或者相反 由于dm编码只须用1位对话音信号进行编码 所以dm编码系统又称为 1位系统 增量调制 dm 在输入信号变化快的区域 斜率过载是关心的焦点 而在输入信号变化慢的区域 关心的焦点是粒状噪声 为了尽可能避免出现斜率过载 就要加大量化阶 但这样做又会加大粒状噪声 相反 如果要减小粒状噪声 就要减小量化阶 这又会使斜率过载更加严重 这就促进了对自适应增量调制 adaptivedeltamodulation adm 的研究 自适应增量调制 adm 基本方法 在检测到斜率过载时开始增大量化阶 而在输入信号的斜率减小时降低量化阶 例如 宋 song 在1971描述的自适应增量调制技术中提出 假定增量调制器的输出为1和0 每当输出不变时量化阶增大50 使预测器的输出跟上输入信号 每当输出值改变时 量化阶减小50 使粒状噪声减到最小 这种自适应方法使斜率过载和粒状噪声同时减到最小 又如 使用较多的另一种自适应增量调制器是由格林弗基斯 greefkes 1970提出的 称为连续可变斜率增量调制 continuouslyvariableslopedeltamodulation cvsd 它的基本方法是 如果连续可变斜率增量调制器 continuouslyvariableslopedeltamodulator cvsd 的输出连续出现三个相同的值 量化阶就加上一个大的增量 反之 就加一个小的增量 自适应差分脉冲编码调制 自适应脉冲编码调制 adaptivepulsecodemodulation apcm 是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术 这种自适应可以是瞬时自适应 即量化阶的大小每隔几个样本就改变 也可以是音节自适应 即量化阶的大小在较长时间周期里发生变化 改变量化阶大小的方法有两种 一种称为前向自适应 forwardadaptation 另一种称为后向自适应 backwardadaptation 前向自适应 根据未量化的样本值的均方根值来估算输入信号的电平 以此来确定量化阶的大小 并对其电平进行编码作为边信息 sideinformation 传送到接收端 后向自适应 从量化器刚输出的过去样本中来提取量化阶信息 由于后向自适应能在发收两端自动生成量化阶 所以它不需要传送边信息 自适应差分脉冲编码调制 差分脉冲编码调制的思想 根据过去的样本去估算 estimate 下一个样本信号的幅度大小 这个值称为预测值 然后对实际信号值与预测值之差进行量化编码 从而就减少了表示每个样本信号的位数 它与脉冲编码调制 pcm 不同的是 pcm是直接对采样信号进行量化编码 而dpcm是对实际信号值与预测值之差进行量化编码 存储或者传送的是差值而不是幅度绝对值 这就降低了传送或存储的数据量 此外 它还能适应大范围变化的输入信号 自适应差分脉冲编码调制 adpcm adpcm adaptivedifferencepulsecodemodulation 综合了apcm的自适应特性和dpcm系统的差分特性 是一种性能比较好的波形编码 它的核心想法是 利用自适应的思想改变量化阶的大小 即使用小的量化阶 step size 去编码小的差值 使用大的量化阶去编码大的差值 使用过去的样本值估算下一个输入样本的预测值 使实际样本值和预测值之间的差值总是最小 它的编码简化框图如下图所示 adpcm编译码器 g 721推荐标准 这个标准叫做32kb s自适应差分脉冲编码调制 在此基础上还制定了g 721的扩充推荐标准 即g 723 使用该标准的编码器的数据率可降低到40kb s和24kb s g 722sb adpcm编译码器 g 722推荐标准 叫做 数据率为64kb s的7khz声音信号编码 这个标准把话音信号的质量由电话质量提高到am无线电广播质量 而其数据传输率仍保持为64kb s 子带编码 subbandcoding sbc 的基本思想是 使用一组带通滤波器 band passfilter bpf 把输入音频信号的频带分成若干个连续的频段 每个频段称为子带 对每个子带中的音频信号采用单独的编码方案去编码 在信道上传送时 将每个子带的代码复合起来 在接收端译码时 将每个子带的代码单独译码 然后把它们组合起来 还原成原来的音频信号 子带编码的编码 译码器 可以采用adpcm apcm pcm等 等带宽的子带不等带宽的子带 g 722sb adpcm编译码器 窄带和宽带音频信道频率特性 全频带声音的第1代编码技术 全频带声音指的是10hz 20 000hz范围里的所有可听声音 也叫做宽带声音或高保真 high fidelity 声音 第1代全频带数字声音 cd dat 的编码采用pcm编码 采样频率 44 1khz或48khz量化精度 16位声道数目 1或2码率 705 6 768 kb s 或1 41 1 54 mb s 全频带声音的第2代编码技术 目标 在保持高保真声音质量 transparentcompression 的前提下 降低码率 减轻网络带宽的压力 不但充分使用声音信息的统计冗余 而且利用人耳的听觉特性 即使用 心理声
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大阳山公司团建活动方案
- 2025-2030中国共享经济行业创新趋势与投资机会分析报告
- 大班行走活动方案
- 多人团建活动方案
- 大学助困活动方案
- 大桥修建活动方案
- 高档化妆品市场发展分析及行业投资战略研究报告2025-2028版
- 西餐连锁行业发展分析及投资前景预测研究报告2025-2028版
- 生物膜行业发展分析及投资价值研究咨询报告2025-2028版
- 矿山开采采矿权出让与土地复垦责任合同
- 心脏骤停病人的抢救与护理
- 小红书种草营销师(初级)认证考试真题试题库(含答案)
- 汽车行业智能汽车维修与保养方案
- 安全防汛培训课件
- 医药运输配送员培训
- 战略合作框架协议
- 药品经营使用和质量监督管理办法2024年宣贯培训课件
- DB11T 1445-2017 民用建筑工程室内环境污染控制规程
- 35kV线路工程电杆组立施工方案
- 走进西方音乐学习通超星期末考试答案章节答案2024年
- 《ISO 55013-2024 资产管理-数据资产管理指南》解读和实施指导材料(雷泽佳编制-2024)
评论
0/150
提交评论