




已阅读5页,还剩50页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第五章语音编码 5 1概述5 2语音信号压缩编码的评价系统5 3语音信号的波形编码5 4语音信号的参数编码 2 编码 传输 存储和译码是语音数字传输和数字存储的必要过程 随着语音通信技术的发展 压缩语音信号的传输带宽 降低信道的传输速率 一直是人们追求的目标 语音编码在实现这一目标的过程中担当重要的角色 语音编码就是使表达语音信号的比特数目最小 一 编码 压缩 的重要性 5 1概述 第五章语音编码 3 二 编码速率 信息容量 用比特 秒 b s或bps 来度量 用I表示 I R fs R代表每个语音采样值编码所需的比特数 fs是采样频率 当fs 8kHz 每个采样值用8比特位来编码 则编码速率为64kb s 5 1概述 4 二 编码速率 信息容量 用比特 秒 b s或bps 来度量 用I表示 I R fs R代表每个语音采样值编码所需的比特数 fs是采样频率 当fs 8kHz 每个采样值用8比特位来编码 则编码速率为64kb s 5 1概述 5 三 编码的分类 1 波形编码 waveformcoding 基本原理是在时间轴上对模拟话音信号按照一定的速率来抽样 然后将幅度样本分层量化 并使用代码来表示 在接收端将收到的数字序列经过解码恢复到原模拟信号 保持原始语音的波形形状 话音质量高 编码速率高 如PCM编码类 a率或u率PCM ADPCM ADM 编码速率为64 16kb s 语音质量好 5 1概述 6 2 参数编码 声源编码parametriccoding 根据语音信号产生的数学模型 通过对语音信号特征参数的提取后进行编码 将特征参数变换成数字代码进行传输 在接收端将特征参数 结合数学模型 恢复语音 力图使重建语音保持尽可能高的可懂度 重建语音信号的波形同原始语音信号的波形可能会有相当大的区别 如线性预测 LPC 编码类 编码速率低 2 4 1 2kb s 自然度低 对环境噪声敏感 三 编码的分类 7 3 混合编码 Hybridcoding 将波形编码与参数编码相结合 在2 4 1 2kb s速率上能够得到高质量的合成语音 混合编码包括若干语音特征参量又包括部分波形编码信息 以达到波形编码的高质量和参量编码的低速率的优点 三 编码的分类 8 4 语音编码的极限速率语音中最基本的元素是音素 大约有128 256个 如果按通常的说话速度 每秒平均发出10个音素 则信息率为 I log2 256 10 bps 80bps把发音看成是以语音速率来传送 则语音编码的极限速率为80bps 从数字化标准的编码速率64kbps 到极限速率80bps 之间的距离 对于理论研究和实践有着极大的吸引力 9 语音质量是衡量语音编码算法优劣的关键性能之一 语音质量通常分为四类 1 广播级 宽带 0 7000Hz 高质量的语音 感觉不出噪声存在 2 网络或电话级 200Hz 3200Hz 信噪比大于30db 3 通信级 完全可以听懂 但和长途电话相比 有明显失真 4 合成级 80 90 可懂度 音质较差 听起来像机器讲话 失去了讲话者的个人特征 5 2语音信号压缩编码的评价系统 10 评价指标 清晰度或可懂度 音质 前者是指语音是否容易听清楚 后者指语音听起来有多自然 1 可懂度评价DRT DiagnosticRhymerTest 2 音质评价 MOS MeanOpinionScore平均意见得分DAM DiagnosticAcceptabilityMeasure判断满意度得分 1 主观评价方法 语音质量有主观和客观两种评价方法 5 2语音信号压缩编码的评价系统 11 MOS得分为五级 优 良 可 差和坏 满分为5分 相当调频广播质量 4分以上是长途电话网标准 3 5分为通信标准 3 0分仍有较好的可懂度 保持自然度 2 5分只维持可懂度 是战术通信标准 12 1 波形失真度 用信噪比来度量 2 频谱失真测量 3 谱包络失真测量 2 客观评价方法 13 均匀量化时 无论大的输入信号还是小的输入信号一律采用相同的量化间隔 为了适应大的输入信号 同时又要满足精度要求 就需要增加样本的位数 2V L 2V 2R 但是对话音信号来说 大信号出现的机会并不多 增加的样本数就没有充分利用 因此采用非均匀量化 一 非均匀量化的PCM编码 5 3语音信号的波形编码 14 其基本思想是 大的输入信号采用大的量化间隔 小的输入信号采用小的量化间隔 在满足精度要求的情况下用较少的位数来表示 译码时 采用相同的规则 也可视为将信号进行非线性变换后再作均匀量化 如对信号进行对数压缩 微弱的信号被放大 强的信号被压缩 译码时 指数扩张 非线性压缩 均匀量化 编码 xa nT 解码 非线性扩张 x nT 15 现在的非均匀量化中 一般采用两种压缩扩张非均匀量化方法 采样后信号幅度和量化数据之间有两种对应关系 一种称为u律压扩 companding 算法 另一种称为A律压扩算法 u律压扩主要用于北美和日本等地区的电话通信中 A律压扩主要用在欧洲和中国的地区的电话通信中 u律压扩 16 1 输入xa nT 的范围归一化为 1 1 2 输出FA x n 的范围为 1 1 3 A为压扩参数 它反映最大量化间隔和最小量化间隔的比值 A 87 56 A律压扩 17 我国的PCM30 32路基群也采用A律13折线压缩特性 律15折线主要用于美国 加拿大和日本等国的PCM24路基群中 CCITT建议G 711规定上述两种折线近似压缩律为国际标准 且在国际间数字系统相互连接时 要以A律为标准 因此这里重点介绍A律13折线 18 FA x 0 1 1 7 8 6 8 5 8 4 8 3 8 2 8 1 8 xa nT 19 A律压扩编码 采用8位二进制编码 C7C6C5C4C3C2C1C0C7 表示信号的极性 称为极性码 0为正 1为负 C3C2C1C0 表示每一段落的16个均匀划分的量化级 称为段内码 0000000100100011010001010110011110001001101010111100110111101111 C6C5C4 表示段落序号 称为段落码 000001010011100101110111 20 对输入动态范围为 5v 5v 用A律压扩编码 有 1 1280 0390625v 76543210 15v 1 22 5v 1 41 25v 1 80 625v 1 160 3125v 1 320 15625v 1 640 078125v 00v 输入信号为1 05v 则编码为 极性码 0段落码 101段内码 1 25 0 625 16 0 0390625 1 05 0 625 10 88取整数10 对应第10量化间隔 编码为1010最后完整的码字为 01011010 21 I 8kHz 8bit 64kbit s实际中 麦克风采集信号 量化为12 13 14 15 16位的输入信号 使用A律压扩编码 每个样本的量化位为8 A律压扩编码的速率 22 对输入信号范围 1 1 A律压扩编码的最小量阶为 min 1 128 16 1 2048 在同样的输入信号范围 均匀量化的线性PCM以A律压扩编码的最小量阶为量阶进行量化 得到线性PCM需要12比特编码 2V L 2V 2R 2 2R 1 20482R 2 2048R 12A律压扩编码则只需要8个比特位 A律压扩编码与线性PCM编码的对比 23 二 增量调制编码 1 增量调制的定义 增量调制 DM 也称为 调制 是对输入样本s k 和预测样本值se k 的差值d k 量化的最简单的一种情况 只有两种编码输出 0或1 一般情况下 如果差值大于0 则编码为 0 若差值小于0 则编码为 1 由于增量编码只须用1位对语音信号进行编码 所以对增量调制编码系统称为 1位系统 对于译码 每收到一个1码 则译码器的输出相对于前一个时刻的值上升一个量阶 每收到一个0码 则译码器的输出相对于前一个时刻的值下降一个量阶 24 2 增量调制 DM 的结构 se k 发送端 s k 量化器 预测器 I k sr k 编码 d k s k 输入样本se k 预测样本值d k 差值sr k 重建样本值I k 已量化的差值 根据前1个抽样值算出1个预测值 再取当前抽样值和预测值之差做编码用 25 3 增量调制 DM 的编码 预测器采取简单的一阶固定预测器 se k asr k 1 a为一个常数 一般情况下取 即a 1 用重建信号的前一时刻来预测当前时刻的预测样本值 se k sr k 1 sr k se k I k sr k 1 I k d k s k se k I k Q d k d k I k 0 1 26 se k sr k 1 se k sr k 1 d k s k se k 0d k s k se k 0I k Q d k I k Q d k sr k se k I k sr k se k I k 码字为0码字为1 s k sr 0 se 1 sr 1 se 2 0 0 sr 2 0 0 27 4 增量调制 DM 的译码 预测器 I k sr k 译码 se k se k sr k 1 sr k se k I k I k 码字 28 5 量阶固定的增量调制 线性增量调制LDM 的缺点 1 当输入信号变化快 用固定的量阶量化 可能造成量化波形跟不上实际波形 这种现象称为 斜率过载 29 2 当输入信号波形较平坦时 编码为0和1的交替序列 类似随机噪声的特性 这种现象称为 颗粒噪声 1 0 1 0 10 30 三 自适应增量调制编码 采用自适应的方法使量阶的大小随输入信号的统计特性变化 一般都采用后向量化 由量化器输出来自适应地调整量阶 通过推导有 I k k M k 1 M是关于码字c n 的函数 有如下表达式 M P 1若c n c n 1 M Q 1若c n c n 1 本次量化间隔 前一次量化间隔 量化调整因子 31 P 2若c n c n 1 Q 1 2若c n c n 1 k M k 1 32 另一种调整量阶方法是 如果码字中连续出现三个相同的值 量阶就加上一个大的增量 反之 就加一个小的增量 这种方法称为连续可变斜率增量调制 CVSD Motorola公司的集成电路芯片 如MC3417 MC3517 MC3418 MC3518 采用了CVSD 前者检测3位 后者检测4位连续的编码 33 34 在PCM中 每个波形样值都独立编码 与其他样值无关 这样 样值的整个幅值编码需要较多位数 比特率较高 造成数字化的信号带宽大大增加 35 然而 大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性 有很大的冗余度 利用信源的这种相关性 一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码 编码位数显著减少 信号带宽大大压缩 这种利用差值的PCM编码称为差分PCM DPCM 如果将样值之差仍用N位编码传送 则DPCM的量化信噪比显然优于PCM系统 36 四 自适应差分脉冲编码ADPCM 对于长途传输系统 64kb s的速率占用的频带太宽 通信的费用昂贵 因此人们寻找能够在更低的速率上获得高质量语音编码的方法 由此提出了G 72132kb sADPCMAdaptiveDifferencePulseCodeModulation编码标准 利用语音信号样点的相关性和非平稳特点 使用了自适应预测和自适应量化 37 1 ADPCM的基本思想 利用样本 采样值 与样本之间的冗余信息进行编码 对实际样本值与预测样本值之差进行量化编码 从而减少了每个样本信号的位数 ADPCM包括两部分的功能 APCM和DPCM APCM主要改变量化间隔 DPCM主要得到预测样本和差值 自适应量化可使信噪比改善4 7dB 自适应预测可使信噪比改善4dB ADPCM比PCM使用的编码位数减少 38 运用自适应的思想 用过去的样本值估算下一个输入样本的值 使实际样本值和预测值之间的差值总是最小 这部分功能称为DPCM 2 DPCM 量化器 自适应预测器 逆量化器 s k se k d k I k sr k dq k 编码 DPCM发送端 s k 输入样本se k 预测样本值d k 差值sr k 重建样本值dq k 重建差值I k 已量化的差值 产生误差 产生误差 39 e1 n 和e2 n 是量化器和逆量化器的量化噪声 一般情况下 e1 n 和e2 n 的瞬时值不等 d k I k e1 n dq k I k e2 n 在忽略量化噪声的情况下dq k d k d k s k se k sr k se k dq k se k d k se k s k se k s k 40 逆量化器 自适应预测器 I k dq k sr k DPCM接收端 se k 发送端和接收端采用相同的预测器 进行信号的重建 发送端和接收端中除了I k 是数字信号 其余信号均为时间离散 幅度未量化的物理量 sr k se k dq k 41 3 APCM 利用自适应的思想改变量化间隔 量阶 的大小 即用小的量化间隔去编码小的差值 使用大的的量化间隔去编码大的差值 这部分功能称为APCM 量化器 量阶自适应 d k I k 量阶 k APCM发送端 逆量化器 量阶自适应 I k dq k k APCM接收端 42 4 ADPCM的简单框图 ADPCM编码结合了APCM和DPCM两者的特性 量化器和预测器均是自适应 将I k 已量化的样值编码为4个比特 编码速率为32kb s s k d k 量化器 自适应预测器 逆量化器 se k I k sr k dq k 编码 发送端 量阶自适应 k 43 ADPCM发送端工作过程 输入样本s k 与预测样本值se k 相减后产生差值d k 对d k 进行自适应量化 对量化器输出I k 进行4个比特位的编码 1 码字送给接收端的解码器 2 对其进行本地解码 进行逆量化 得到差值信号dq k 与预测信号se k 相加得到本地重建信号sr k 利用sr k dq k 对下一时刻输入的s k 1 进行自适应预测 得到se k 1 44 ADPCM接收端 逆量化器 自适应预测器 I k dq k sr k se k 量阶自适应 发送端输入样本 s k se k d k 接收端输出重建样本值 sr k se k dq k 45 ADPCM接收端工作过程 将接收的码字进行解码 进行逆量化 得到重建差值信号dq k 与预测信号se k 相加得到重建信号sr k 利用sr k dq k 进行自适应预测 得到se k 1 自适应预测器和自适应量化器采用发送端的同样的对应结构和算法 46 低速率语音编码的应用 蜂窝移动电台网 卫星通讯 短波保密通信 ISDN IntegratedServiceDigi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 压力管理培训课件
- 压力容器运行安全培训课件
- 2025年可再生能源产业发展策略与市场前景研究报告
- 2025年医疗健康行业智能医疗设备市场前景研究报告
- 国家事业单位招聘2025国家退役军人事务部烈士纪念设施保护中心(烈士遗骸搜寻鉴定中心)招聘笔试历年参考题库附带答案详解
- 博望区2025年安徽马鞍山博望区政府相关部门招聘笔试历年参考题库附带答案详解
- 云南省2025云南红河州个旧市“锡引”人才青年党政干部储备人才专项招引(20人)笔试历年参考题库附带答案详解
- 2025贵州贵阳南明产业投资发展(集团)有限责任公司社会化招聘13人笔试参考题库附带答案详解
- 2025新疆新星运营公司本部及权属企业第一次招聘18人笔试参考题库附带答案详解
- 2025年鲁信创业投资集团股份有限公司社会招聘(5人)笔试参考题库附带答案详解
- 2025年煤矿企业主要负责人安全生产理论考试笔试试题含答案
- 苗族舞蹈课件
- 监狱公选面试题库及答案
- 具有法律效应的还款协议书6篇
- 2025年中国铁建集团招聘面试模拟题及答案详解
- T-AOPA0062-2024电动航空器电推进系统动力电机控制器技术规范
- 2025特种设备(电梯)安全管理人员A证考试试卷(200道)及答案
- 2024年一级建造师《民航机场工程管理与实务》真题及答案
- 2025年广东省中考英语试卷深度评析及2026年备考策略
- (2025年标准)买月饼协议书
- 2025年浙江省中考英语真题(原卷版)
评论
0/150
提交评论