




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国家 十一五 规划教材 数字语音编码 讲议同济大学电子与信息工程学院赵晓群编著机械工业出版社 2007年 第12章语音波形编码12 1概述语音波形编码是最基本的语音编码方式 是最早提出和实现的编码技术 语音波形编码 主要分 脉冲编码调制 PCM 自适应PCM ADPCM 子带编码 SBC 频域波形编码往往将SBC与PCM或ADPCM等技术结合在一起 以达到更加优良的编码效果 波形编码标准的进展 G 711标准 1972年CCITT提出 用于数字电话系统300 3400Hz 8kHz 64kbit sPCM G 721标准 1983年CCITT提出 用于数字电话系统扩容32kbit s ADPCM G 723标准 1986年ITU T提出 用于数字电话系统扩容24 32和40kbit s ADPCM G 726标准 1990年重新修订合并G 721和G 723 同时删除G 721和G 723注 这些标准演进的目标是增容通用电话网络的通信容量通信技术的发展要求有更宽语音或声频带宽的编码方案 G 722标准 1988年ITU T提出 宽带语音编码标准64 56和48kbit s 子带自适应PCM SB ADPCM 第12章语音波形编码12 2脉冲编码调制12 2 1均匀量化PCM最简单的波形编码方法编码方法 采样 量化 B比特编码 语音信号带宽WHz 2W速率采样 每样本用Bbit表示 总比特率 2WBbit s 特点 均匀量化PCM与普通A D完全相同 未利用语音信号的任何性质 未压缩 计算量化噪声 对x t 进行N 2B的 均匀量化 N足够大时 信噪比或式中 为输入信号平均能量 为量化噪声方差 Xmax为输入信号的峰值 2Xmax是信号的动态范围 量化器每增加1bit 量化SNR增加6dB 设输入信号限制在 则有 信噪比改写为 B的选择要考虑到输入信号已有的信噪比 B 11的均匀量化PCM可以满足高质量的电话通信要求 当满足 输入信号幅度变化范围是已知的 信号幅度值在已知的范围内是均匀分布的则均匀量化PCM可以获得很好的效果 语音信号是非平衡的 动态范围达30dB以上 随不同的人 不同场合 讲话声响相差甚远 不满足均匀量化的优化条件 为兼顾浊音 清音 需使用较多的量化位数 12 2 2对数PCM非线性量化可匹配概率分布 常用的非线性量化 对数PCM 工程上常用 律或A律量化器 非线性量化的工程方法 先进行非线性压缩后 再进行线性量化 对数压缩是比较理想 对数PCM 先对数幅度压缩 解码用指数函数扩张 设 x n 为输入语音 y n 为幅度压缩信号 为解扩信号 则压缩为 反变换为 量化后有 当量化阶数很大 假设量化误差e n 与x n 不相关 量化后对数幅度的反变换为 当很小e n 时 上式近似为 式中 f n x n e n 由于 则 表明 信噪比和信号方差无关 它仅取决于量化间隔 对数量化存在问题 需无穷量化阶数 实用中将对数压缩特性作某种近似 律压缩是最常用的一种 律压缩函数 律还原函数 律量化 可推导量化器信噪比 式中 Xmax为信号的最大幅值 为控制压缩程度的参变量 0时 无压缩 值大则压缩程度大 图12 1 给出了 律压缩的输入输出特性曲线 输入小幅度值时等效量化间隔小 输入大幅度值时等效量化间隔大 图12 2 律和均匀量化器的SNR与的关系特性 图12 2 100 不同量化位数B时 律量化 实线 和均匀量化 虚线 两种情况下 SNR与Xmax x的关系曲线 律在较宽的动态范围内 大致保持相同的SNR 100 8 Xmax x 20时 SNR与最大值之差 2dB B 7时 在较宽输入信号范围内 SNR保持在34dB左右 G 711标准 7位 律PCM 不包括符号位 B 11均匀量化PCM相当于7位 律PCM的性能 A律压缩特性A律最小量化间隔是2 4096 律是2 8159 二者的差别是不易觉察 比较 二者小信号时为线性 大信号时呈现对数压缩特性 律压缩的动态范围略小些 小信号时A律的质量较 律差些 A律或 律语音压缩系统皆称LOG PCM系统 最成熟 8bit的LOG PCM 64kbit s 普遍应用数字电话系统中 中国 欧洲 A律 北美和日本 律 标准 律或A律PCM编码器芯片早已问世 12 2 3自适应量化PCM自适应量化 量化器特性自适应于输入信号幅度的变化 自适应脉冲编码调制 APCM常用方法 量化间隔应自适应地改变 增加一个自适应增益控制 使输入信号方差保持为常数 图12 3 两种APCM的实现框图 依据自适应调整的速度 自适应量化分为 瞬时自适应 每个样本或者几个样本进行自适应调整 音节自适应 较长时间才进行自适应调整的方案 认为浊音期间或清音期间幅度方差基本保持不变 根据 n 和G n 的估计方法不同 自适应方案又分为 前馈自适应 反馈自适应 n 随x n 的方差变 G n 随x n 的方差变 前馈自适应 x n 的方差 2由信号本身估算 实现的系统 自适应参数 n 和G n n 和G n 发送端编码用 接收端解码用 边信息 时变方差 n 正比于语音信号的短时能量 短时能量定义为x2 n 经低通滤波器h n 后的输出 h n 由采用的窗函数决定 n 的变化快慢由h n 的带宽决定 n 和G n 作为边信息传送 影响系统的数码率 按帧 10 30ms 估算边信息所需的比特率很低 40dB信号动态范围内保持相对稳定的SNR 则要求或达到100 反馈自适应 输入信号x n 的方差 2由量化器输出或等效地由样本序列估算 实现的系统 计算 n 和G n 时 与前馈自适应的方法相同 计算 n 时 使用量化后的数据c n 无需传送边信息 前馈与反馈自适应的比较 反馈自适应 优点 n 或G n 无需保存或传送 数码率不增加 可实现逐点自适应修正 缺点 对码序列的传输误码较敏感 前馈自适应 比反馈自适应的信噪比略高 前馈自适应需要延时 反馈自适应是瞬时完成的 自适应量化都能给出超过 律或A律量化的信噪比 min小 无语音活动时量化噪声低 自适应量化是一种很有效的编码方法 第12章语音波形编码12 3自适应预测编码12 3 1基本的APC系统APC原理 利用线性预测分析原理实现的波形编码 p阶预测的预测值为 线性预测误差 残差 x n 为实际语音 为预测值 e n 为预测误差 上式的z变换为 e n 是语音信号x n 通过全零点的滤波器A z 后得到的 A z 的物理意义和解法在第7章都已有详细讨论 请复习 若预测效果好 则预测残差要小 对其量化和编码 可以减少量化位数 从而达到压缩编码的目的 利用这一原理的编码方法称作预测编码 当预测系数自适应地随语音变化 称为自适应预测编码 图12 5 基本的APC系统 分析预测编码提高量化信噪比的原理 不考虑误码 则系统解码后输出为 q n 是残差信号e n 的量化误差 注 重构的信号在发送端和接收端都可以得到 量化信噪比 是信号的平均能量 是残差的平均能量 是量化噪声的平均能量 定义自适应预测增益 由量化器决定的信噪比 自适应预测带来的增益 图12 6 固定预测和自适应预测的预测增益与p的关系 当阶数时p 4 固定预测有10dB的增益 自适应预测有近14dB的增益 归纳出APC有下列特性 1 对同样位数的量化器 Gp 1 即APC的信噪比 非预测编码 2 增益Gp是时间变化 谱的动态范围越大 预测增益就越高 3 量化噪声近似于白噪声 所以输出噪声的谱是平坦的 12 3 2前馈与反馈APC前馈APC的最佳预测器系数使下式误差为最小 式中 a1 a2 ap按帧 帧长10 30ms 时变的 输入语音信号x n 在接收端得不到 因此 a1 a2 ap必须作为边信息传输到接收端 反馈APC的最佳预测器系数使下式误差为最小 从图12 5可看到 在发送端与接收端都可以得到 因此 除了传送外 系统无需传送附加的边信息 上一节已讨论前馈APC问题 本节介绍反馈APC 以自适应残差编码算法为例说明反馈APC 由图12 5知 变量之间的关系如下 式中 n时刻的预测系数 通常每一个样本修正一次 p 预测阶数 根据实验p一般取4 8 自适应跟随x n 的变化 保证了较好的预测效果 反馈APC也称作序列自适应预测 的梯度法的修正公式为式中 修正量 正比于预测误差的能量 因接收端是得不到的e n 用其量化值代替 即计算 同时 选择修正式中的参数C 以合理调节的值 令 式中g 固定常数 用于控制自适应收敛速度 的短时平均能量 可用指数加权平方均式计算 表达式为式中Rmin 偏置项 补偿无语音时过小 这样得到预测系数的修正差值为 为防止误码的影响和保证算法的收敛 对修正式再修正为 在无信号时将逐渐回到bk 实验确定各参数 参考值 0 01 g 0 02 0 90 Rmin取值与x n 动态范围有关 x n 2048 2047时 Rmin 50 b1 0 7 其它bk 0 估计可用卡尔曼滤波 实验表明效果不明显 算法复杂 比较前馈 反馈自适应预测方法 1 前馈APC略优于反馈APC 前馈APC需传送预测系数 发送端较复杂 且占用码率 2 传输误码对反馈APC的影响较大 3 反馈APC算法不能保证合成滤波器是稳定的 再考虑算法的收敛性 有限字长的影响等等 使反馈APC算法比较复杂 12 3 3音调预测音调预测 利用浊音的准周期性进行预测 较成功的方法是加一个音调预测器PB z 如图12 7所示 设Tp是浊音段的基音周期 则PB z 的一般形式是 式中 1 2 3 音调预测系数 常分两步求最优解 计算基音周期 计算最佳预测系数 1 2 3 通过解下面的方程组来得到 式中r j 信号x n 的自相关函数 注意问题 1 与PA z 预测相对应 PB z 称作基于谱细微结构的预测 PB z 利用了语音中不同的剩余度 可以独立进行 基于频谱包络的预测PA z 称之为短时预测 基于频谱细微结构的音调预测PB z 称为长时预测 2 PA z PB z 预测器组合的次序是有关系的 将短时预测器PA z 放在前面较好 3 本节讨论前馈APC 方法也适于反馈APC 算法较复杂 加音调预测器后 APC的性能又有进一步地提高 音调合成滤波器的冲激响应是很长 传输误码会传播很远 12 3 4噪声谱形变一般APC系统 按方均误差最小的准则确定预测系数 其量化噪声谱一般是平坦的 白噪声的特性 听觉实验 听觉掩蔽效应使对噪声的主观感觉 取决于噪声谱包络形状和量化噪声的大小 图12 8 浊音谱与噪声谱比较 共振峰区信噪比变差 但其能量较强 掩蔽了噪声的影响 更好的设计方案是使量化噪声最小和考虑噪声谱包络的形状 控制量化噪声频谱形状的方法 在APC系统中增加噪声反馈滤波器 图12 9 带有噪声谱形变的APC系统框图 简称APC NS系统 增加了噪声反馈通路 F z 是噪声谱形变滤波器 它具有预测滤波器的形式 e n 预测残差 量化值为 q n e n 的量化噪声 Q z 为其z变换 q n 经过噪声谱形变滤波器F z 得到 由图12 9得 表明 当q n 的谱为平坦谱时 量化噪声的谱应该与1 F z 有相同的形状 量化层数较多时 量化噪声呈现白噪声特性 通过适当选择滤波器F z 实现噪声谱形变 接收端解码时不需要F z 不需要传输 讨论F z 的选择问题 若F z 0 无噪声反馈 系统为一般APC系统 若1 F z X z 输出噪声比例于语音信号谱 并不好 人耳对不同频段并非是同样敏感 低频段的感知更重要些 令 则一种折衷的选择是 式中 常数 0 1 控制共振峰区的噪声功率 1时 F z 1 0时 1 F z 1 A z 由实验决定 8kHz取样时 典型值为0 8左右 令 噪声形变后的系统输出信噪比为 式中 是无噪声谱形变时的输出信噪比 12 3 5差分PCM与G 726 1 差分脉冲编码调制 DPCM DPCM为一阶APC 其预测器具有以下简单的形式 式中a1 固定常数 由长期信号谱来优化 在DPCM中 被量化和编码的是残差信号 缺点 a1固定使该方法不可能最佳适应于所有讲话者 用高阶 即p 1 的固定预测 改善效果并不明显 改进 采用自适应量化和自适应预测的DPCM ADPCM 一般认为 APC指有短时 长时预测 噪声谱形变等部分的系统 ADPCM指仅包括短时预测的DPCM系统 2 增量调制 DM DM 基本上是一种DPCM方法 采用二电平1bit量化器 仅传送差值信号的极性 接收端解码时 根据接收的极性符号 在前一个样本上增加或减小一个增量即可 DM系统的比特率就等于波形的取样率 特点 取样率 Nyquist速率 相邻样本的相关性变大 实际上 DM中图12 10 DM的编码情况 量化误差来自两个方面 过载噪声 波形快变化时 解码信号跟不上原信号的变化而产生 颗粒噪声 波形缓变或无信号时 重构信号将以峰 峰值 围绕着0或固定值交替变化而产生 3 自适应增量调制 ADM ADM基本思想 增量 自适应于语音信号的平均斜率变化 当信号波形平均斜率变大时 自动增大 反之则减小 从而缓解DM中由于 固定引起的矛盾 ADM常采用反馈自适应方式 一个简单的自适应方法为 式中 min max 预先确定的增量 的上下限 M 可变系数 一般选择 另一种ADM是连续可变斜率增量 CVSD 调制 其自适应规则是 式中 0 1 0 D1 D2 控制自适应的速度 若 接近于l n 增减速率减慢 若 比1小很多 自适应速度加快 n 的最小值和最大值是固定的 CVSD在数码率低于24kbit s时 语质优于ADM 但在1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年临床执业医师考前冲刺练习试题附答案详解【基础题】
- 2025石油石化职业技能鉴定考试预测复习含答案详解(能力提升)
- 婴幼儿秋季腹泻的生理易感因素深度剖析
- 外墙装修工程合同(标准版)
- 2024年会计硕士能力提升B卷题库及参考答案详解(考试直接用)
- 2025年私人银行业务客户服务模式优化与创新研究报告
- 2025年建筑信息模型(BIM)在工程项目全过程管理中的项目可持续发展报告
- 2025年社区团购市场用户留存与社区电商模式研究报告
- 2025年环保产业技术创新与产业升级新能源利用研究报告
- 中小企业网络方案设计
- 2025年秋人教版(2024)初中数学八年级第一学期教学计划及教学进度表
- 2025年全国计算机等级考试三级网络技术模拟题及答案
- 软件行业基础知识培训课件
- GB 46039-2025混凝土外加剂安全技术规范
- 传染病医院质量控制检查标准表
- 卷烟零售户培训课件
- 刑事诉讼法案例课件
- 2025年杭州市上城区九堡街道社区卫生服务中心招聘编外4人笔试备考试题及答案解析
- 2025年煤矿从业人员安全培训考试题库及答案
- 医院净化空调系统基本知识
- 内蒙锡林郭勒盟卫生系统招聘考试(护理学专业知识)题含答案2024年
评论
0/150
提交评论