5第五章_语音编码.ppt

上传人：c*** IP属地：河南上传时间：2020-02-09 格式：PPT 页数：55 大小：562KB 积分：20 举报 版权申诉

已阅读5页，还剩50页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1 第五章语音编码 5 1概述5 2语音信号压缩编码的评价系统5 3语音信号的波形编码5 4语音信号的参数编码 2 编码传输存储和译码是语音数字传输和数字存储的必要过程随着语音通信技术的发展压缩语音信号的传输带宽降低信道的传输速率一直是人们追求的目标语音编码在实现这一目标的过程中担当重要的角色语音编码就是使表达语音信号的比特数目最小一编码压缩的重要性 5 1概述第五章语音编码 3 二编码速率信息容量用比特秒 b s或bps 来度量用I表示 I R fs R代表每个语音采样值编码所需的比特数 fs是采样频率当fs 8kHz 每个采样值用8比特位来编码则编码速率为64kb s 5 1概述 4 二编码速率信息容量用比特秒 b s或bps 来度量用I表示 I R fs R代表每个语音采样值编码所需的比特数 fs是采样频率当fs 8kHz 每个采样值用8比特位来编码则编码速率为64kb s 5 1概述 5 三编码的分类 1 波形编码 waveformcoding 基本原理是在时间轴上对模拟话音信号按照一定的速率来抽样然后将幅度样本分层量化并使用代码来表示在接收端将收到的数字序列经过解码恢复到原模拟信号保持原始语音的波形形状话音质量高编码速率高如PCM编码类 a率或u率PCM ADPCM ADM 编码速率为64 16kb s 语音质量好 5 1概述 6 2 参数编码声源编码parametriccoding 根据语音信号产生的数学模型通过对语音信号特征参数的提取后进行编码将特征参数变换成数字代码进行传输在接收端将特征参数结合数学模型恢复语音力图使重建语音保持尽可能高的可懂度重建语音信号的波形同原始语音信号的波形可能会有相当大的区别如线性预测 LPC 编码类编码速率低 2 4 1 2kb s 自然度低对环境噪声敏感三编码的分类 7 3 混合编码 Hybridcoding 将波形编码与参数编码相结合在2 4 1 2kb s速率上能够得到高质量的合成语音混合编码包括若干语音特征参量又包括部分波形编码信息以达到波形编码的高质量和参量编码的低速率的优点三编码的分类 8 4 语音编码的极限速率语音中最基本的元素是音素大约有128 256个如果按通常的说话速度每秒平均发出10个音素则信息率为 I log2 256 10 bps 80bps把发音看成是以语音速率来传送则语音编码的极限速率为80bps 从数字化标准的编码速率64kbps 到极限速率80bps 之间的距离对于理论研究和实践有着极大的吸引力 9 语音质量是衡量语音编码算法优劣的关键性能之一语音质量通常分为四类 1 广播级宽带 0 7000Hz 高质量的语音感觉不出噪声存在 2 网络或电话级 200Hz 3200Hz 信噪比大于30db 3 通信级完全可以听懂但和长途电话相比有明显失真 4 合成级 80 90 可懂度音质较差听起来像机器讲话失去了讲话者的个人特征 5 2语音信号压缩编码的评价系统 10 评价指标清晰度或可懂度音质前者是指语音是否容易听清楚后者指语音听起来有多自然 1 可懂度评价DRT DiagnosticRhymerTest 2 音质评价 MOS MeanOpinionScore平均意见得分DAM DiagnosticAcceptabilityMeasure判断满意度得分 1 主观评价方法语音质量有主观和客观两种评价方法 5 2语音信号压缩编码的评价系统 11 MOS得分为五级优良可差和坏满分为5分相当调频广播质量 4分以上是长途电话网标准 3 5分为通信标准 3 0分仍有较好的可懂度保持自然度 2 5分只维持可懂度是战术通信标准 12 1 波形失真度用信噪比来度量 2 频谱失真测量 3 谱包络失真测量 2 客观评价方法 13 均匀量化时无论大的输入信号还是小的输入信号一律采用相同的量化间隔为了适应大的输入信号同时又要满足精度要求就需要增加样本的位数 2V L 2V 2R 但是对话音信号来说大信号出现的机会并不多增加的样本数就没有充分利用因此采用非均匀量化一非均匀量化的PCM编码 5 3语音信号的波形编码 14 其基本思想是大的输入信号采用大的量化间隔小的输入信号采用小的量化间隔在满足精度要求的情况下用较少的位数来表示译码时采用相同的规则也可视为将信号进行非线性变换后再作均匀量化如对信号进行对数压缩微弱的信号被放大强的信号被压缩译码时指数扩张非线性压缩均匀量化编码 xa nT 解码非线性扩张 x nT 15 现在的非均匀量化中一般采用两种压缩扩张非均匀量化方法采样后信号幅度和量化数据之间有两种对应关系一种称为u律压扩 companding 算法另一种称为A律压扩算法 u律压扩主要用于北美和日本等地区的电话通信中 A律压扩主要用在欧洲和中国的地区的电话通信中 u律压扩 16 1 输入xa nT 的范围归一化为 1 1 2 输出FA x n 的范围为 1 1 3 A为压扩参数它反映最大量化间隔和最小量化间隔的比值 A 87 56 A律压扩 17 我国的PCM30 32路基群也采用A律13折线压缩特性律15折线主要用于美国加拿大和日本等国的PCM24路基群中 CCITT建议G 711规定上述两种折线近似压缩律为国际标准且在国际间数字系统相互连接时要以A律为标准因此这里重点介绍A律13折线 18 FA x 0 1 1 7 8 6 8 5 8 4 8 3 8 2 8 1 8 xa nT 19 A律压扩编码采用8位二进制编码 C7C6C5C4C3C2C1C0C7 表示信号的极性称为极性码 0为正 1为负 C3C2C1C0 表示每一段落的16个均匀划分的量化级称为段内码 0000000100100011010001010110011110001001101010111100110111101111 C6C5C4 表示段落序号称为段落码 000001010011100101110111 20 对输入动态范围为 5v 5v 用A律压扩编码有 1 1280 0390625v 76543210 15v 1 22 5v 1 41 25v 1 80 625v 1 160 3125v 1 320 15625v 1 640 078125v 00v 输入信号为1 05v 则编码为极性码 0段落码 101段内码 1 25 0 625 16 0 0390625 1 05 0 625 10 88取整数10 对应第10量化间隔编码为1010最后完整的码字为 01011010 21 I 8kHz 8bit 64kbit s实际中麦克风采集信号量化为12 13 14 15 16位的输入信号使用A律压扩编码每个样本的量化位为8 A律压扩编码的速率 22 对输入信号范围 1 1 A律压扩编码的最小量阶为 min 1 128 16 1 2048 在同样的输入信号范围均匀量化的线性PCM以A律压扩编码的最小量阶为量阶进行量化得到线性PCM需要12比特编码 2V L 2V 2R 2 2R 1 20482R 2 2048R 12A律压扩编码则只需要8个比特位 A律压扩编码与线性PCM编码的对比 23 二增量调制编码 1 增量调制的定义增量调制 DM 也称为调制是对输入样本s k 和预测样本值se k 的差值d k 量化的最简单的一种情况只有两种编码输出 0或1 一般情况下如果差值大于0 则编码为 0 若差值小于0 则编码为 1 由于增量编码只须用1位对语音信号进行编码所以对增量调制编码系统称为 1位系统对于译码每收到一个1码则译码器的输出相对于前一个时刻的值上升一个量阶每收到一个0码则译码器的输出相对于前一个时刻的值下降一个量阶 24 2 增量调制 DM 的结构 se k 发送端 s k 量化器预测器 I k sr k 编码 d k s k 输入样本se k 预测样本值d k 差值sr k 重建样本值I k 已量化的差值根据前1个抽样值算出1个预测值再取当前抽样值和预测值之差做编码用 25 3 增量调制 DM 的编码预测器采取简单的一阶固定预测器 se k asr k 1 a为一个常数一般情况下取即a 1 用重建信号的前一时刻来预测当前时刻的预测样本值 se k sr k 1 sr k se k I k sr k 1 I k d k s k se k I k Q d k d k I k 0 1 26 se k sr k 1 se k sr k 1 d k s k se k 0d k s k se k 0I k Q d k I k Q d k sr k se k I k sr k se k I k 码字为0码字为1 s k sr 0 se 1 sr 1 se 2 0 0 sr 2 0 0 27 4 增量调制 DM 的译码预测器 I k sr k 译码 se k se k sr k 1 sr k se k I k I k 码字 28 5 量阶固定的增量调制线性增量调制LDM 的缺点 1 当输入信号变化快用固定的量阶量化可能造成量化波形跟不上实际波形这种现象称为斜率过载 29 2 当输入信号波形较平坦时编码为0和1的交替序列类似随机噪声的特性这种现象称为颗粒噪声 1 0 1 0 10 30 三自适应增量调制编码采用自适应的方法使量阶的大小随输入信号的统计特性变化一般都采用后向量化由量化器输出来自适应地调整量阶通过推导有 I k k M k 1 M是关于码字c n 的函数有如下表达式 M P 1若c n c n 1 M Q 1若c n c n 1 本次量化间隔前一次量化间隔量化调整因子 31 P 2若c n c n 1 Q 1 2若c n c n 1 k M k 1 32 另一种调整量阶方法是如果码字中连续出现三个相同的值量阶就加上一个大的增量反之就加一个小的增量这种方法称为连续可变斜率增量调制 CVSD Motorola公司的集成电路芯片如MC3417 MC3517 MC3418 MC3518 采用了CVSD 前者检测3位后者检测4位连续的编码 33 34 在PCM中每个波形样值都独立编码与其他样值无关这样样值的整个幅值编码需要较多位数比特率较高造成数字化的信号带宽大大增加 35 然而大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性有很大的冗余度利用信源的这种相关性一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码编码位数显著减少信号带宽大大压缩这种利用差值的PCM编码称为差分PCM DPCM 如果将样值之差仍用N位编码传送则DPCM的量化信噪比显然优于PCM系统 36 四自适应差分脉冲编码ADPCM 对于长途传输系统 64kb s的速率占用的频带太宽通信的费用昂贵因此人们寻找能够在更低的速率上获得高质量语音编码的方法由此提出了G 72132kb sADPCMAdaptiveDifferencePulseCodeModulation编码标准利用语音信号样点的相关性和非平稳特点使用了自适应预测和自适应量化 37 1 ADPCM的基本思想利用样本采样值与样本之间的冗余信息进行编码对实际样本值与预测样本值之差进行量化编码从而减少了每个样本信号的位数 ADPCM包括两部分的功能 APCM和DPCM APCM主要改变量化间隔 DPCM主要得到预测样本和差值自适应量化可使信噪比改善4 7dB 自适应预测可使信噪比改善4dB ADPCM比PCM使用的编码位数减少 38 运用自适应的思想用过去的样本值估算下一个输入样本的值使实际样本值和预测值之间的差值总是最小这部分功能称为DPCM 2 DPCM 量化器自适应预测器逆量化器 s k se k d k I k sr k dq k 编码 DPCM发送端 s k 输入样本se k 预测样本值d k 差值sr k 重建样本值dq k 重建差值I k 已量化的差值产生误差产生误差 39 e1 n 和e2 n 是量化器和逆量化器的量化噪声一般情况下 e1 n 和e2 n 的瞬时值不等 d k I k e1 n dq k I k e2 n 在忽略量化噪声的情况下dq k d k d k s k se k sr k se k dq k se k d k se k s k se k s k 40 逆量化器自适应预测器 I k dq k sr k DPCM接收端 se k 发送端和接收端采用相同的预测器进行信号的重建发送端和接收端中除了I k 是数字信号其余信号均为时间离散幅度未量化的物理量 sr k se k dq k 41 3 APCM 利用自适应的思想改变量化间隔量阶的大小即用小的量化间隔去编码小的差值使用大的的量化间隔去编码大的差值这部分功能称为APCM 量化器量阶自适应 d k I k 量阶 k APCM发送端逆量化器量阶自适应 I k dq k k APCM接收端 42 4 ADPCM的简单框图 ADPCM编码结合了APCM和DPCM两者的特性量化器和预测器均是自适应将I k 已量化的样值编码为4个比特编码速率为32kb s s k d k 量化器自适应预测器逆量化器 se k I k sr k dq k 编码发送端量阶自适应 k 43 ADPCM发送端工作过程输入样本s k 与预测样本值se k 相减后产生差值d k 对d k 进行自适应量化对量化器输出I k 进行4个比特位的编码 1 码字送给接收端的解码器 2 对其进行本地解码进行逆量化得到差值信号dq k 与预测信号se k 相加得到本地重建信号sr k 利用sr k dq k 对下一时刻输入的s k 1 进行自适应预测得到se k 1 44 ADPCM接收端逆量化器自适应预测器 I k dq k sr k se k 量阶自适应发送端输入样本 s k se k d k 接收端输出重建样本值 sr k se k dq k 45 ADPCM接收端工作过程将接收的码字进行解码进行逆量化得到重建差值信号dq k 与预测信号se k 相加得到重建信号sr k 利用sr k dq k 进行自适应预测得到se k 1 自适应预测器和自适应量化器采用发送端的同样的对应结构和算法 46 低速率语音编码的应用蜂窝移动电台网卫星通讯短波保密通信 ISDN IntegratedServiceDigi

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

5第五章_语音编码.ppt

文档简介

温馨提示

最新文档

评论

5第五章_语音编码.ppt

文档简介

温馨提示

最新文档

评论

相关文档