《讲话音编码》PPT课件.ppt_第1页
《讲话音编码》PPT课件.ppt_第2页
《讲话音编码》PPT课件.ppt_第3页
《讲话音编码》PPT课件.ppt_第4页
《讲话音编码》PPT课件.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第三讲 话音编码,1. 信息量大,2,2. 编码与压缩标准ITU-TSS Pulse code modulation: PCM Delta modulation: DM与ADM Adaptive PCM: APCM Differential PCM: DPCM ADPCM G.722 , SBC Global System for Mobile communications GSM协议,3,话音编译码器,波形编译码器 (waveform codecs) 话音质量高,但数据率也很高 音源编译码器 (source codecs) 数据率很低,产生的合成话音的音质有待提高 混合编译码器 (hybrid codecs) 使用音源编译码技术和波形编译码技术 数据率和音质介于它们之间,4,波形编译码器,波形编译码的基本思想 不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。 最简单的波形编码是脉冲编码调制, PCM (pulse code modulation) 仅对输入信号进行采样和量化 , 优点:编译码器简单,延迟时间短,音质高。 不足:数据速率比较高,对传输通道的错误比较敏感。,5,音源编译码器,音源编译码的基本思想 企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音 声码器(vocoder) 其话音生成模型中声道被等效为 时变滤波器(time-varying filter) 只需要传输:滤波器规格、发声标志、音节周期等等 特点:质量远远低于自然话音 ,保密性能好,6,混合编译码,混合编译码的基本思想 企图填补波形编译码和音源编译码之间的间隔 最成功并且普遍使用的编译码器 时域合成-分析AbS(analysis-by-synthesis)编译码器,7,8,3.2 PCM,PCM的概念(参见图3-7),模拟声波的数字化示意图,9,2.量化 均匀量化: 等距离分割信号的幅度范围 对每个分割区间,用一个整数值表示 例如信号幅度(-0.9,0.7),分成8个等距区间。 量化噪声: x(n)为未量化的采样值,e(n)为量化误差 实际应用中,很少采用,10,非均匀量化: 语音信号幅度的分布: 拉普拉斯分布密度 解释 信噪比 位数不增加,保证信号的质量 根据抽样非均匀分布的特点,设法让量化阶距随信号的概率密度的减少而增加。或者说把大的量化误差留给出现概率较小的样值。 用非线性变换y=F(x), 先将信号压缩后,再均匀量化。恢复时,用该变换的反函数x=F-1 (y) 对量化值进行扩展,就可得到重建信号。,11,非均匀量化: 非线性变换:对数变换ln 人耳对音量、人眼对光强的感知也呈现对数特性:声音响一倍,光亮一倍。 非均匀量化举例 大的信号采用大的量化间隔,小的信号采用小的量化间隔(P31) 量化间隔与信号的概率密度成反比。,12,3. 律压扩(-law),13,4.A律压扩 (A-law),14,3.4 增量调制与自适应增量调制,编码的数据压缩依据 幅度非均匀分布-非均匀编码 样本间的相关,即相邻样本之间的取样数据存在强相关。例如,取样频率8kHz,相邻样本间的相关系数0.85, 相距10个样本间,仍有0.3产生预测编码技术,15,1.增量调制Delta Modulation PCM:对采样信号的幅度编码 DM: sign(采样信号与预测的采样信号) 采样信号预测的采样信号:编码为1 否则 编码为0 只需要1位对话音进行编码,1位系统 参见图3-12,16,17,2. DM的问题 信号变化率大:斜率过载(slope overload) 信号变化率小:粒状噪声(granular noise) 3. ADM(Adaptive DM) 检测信号斜率, 过载时,加大Delta。 斜率减少时,减少Delta. 具体方案: Song在1971:每当输出不变时,Delta增大50% 每当输出值改变时, Delta减少50% Greefkes70年:输出连续出现三个相同的值,量化阶就加上一个大的增量,否则就加上一个小的增量,18,3.5APCM、DPCM,目的:对PCM 的量化数据(量化数据为s(k))压缩。一种根据输入信号幅度大小来改变量化阶大小的一种波形编码技术 1.APCM(Adaptive PCM) 方法:根据s(k)的方差,决定量化阶的大小。 量化阶大小的改变:每隔几个样本(瞬时)或者较长时间 量化阶的确定: 前向:为量化样本的均方差(入端) 后向:量化器最近刚输出的样本的均方差(出端)。 See fig 3-13,19,前向自适应(forward adaptation),根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(side information)传送到接收端 S(k)是发送端编码器的输入信号,Sr(k)是接收端译码器输出的信号,20,后向自适应(backward adaptation),从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶,所以它不需要传送边信息。,21,2.DPCM(差分脉冲编码、预测编码) 利用样本间的相关性,用过去的样本(1N个)去估计下一个样本的幅度值,该值称预测值。 对实际信号值与预测值之差进行编码。从而就减少了表示每个样本信号的位数 DPCM系统工作时,发端先发送一个起始值,接着就发送预测误差值。收端把收到的经过量化的预测误差值与本地计算出的预测值相加,即得到恢复信号。 举例,80(第一个分数),-1(相对于前一个),+5,-2,-10,,22,差分脉冲编码(DPCM),差分信号d(k)是离散输入信号S(k)和预测器输出的估算值Se(k-1)之差 Se(k-1)是对S(k)的预测值,而不是过去样本的实际值 接收端,23,自适应差分脉冲编码调制(ADPCM),ADPCM(adaptive difference pulse code modulation) 综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。 核心想法::利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。,24,接收端的译码器使用与发送端相同的算法,利用传送来的信号来确定量化器和逆量化器中的量化阶大小,并且用它来预测下一个接收信号的预测值,25,线性预测编码(LPC),线性预测编码LPC(linear predictive coding) LPC是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。 线性预测器是使用过去的P个样本值来预测现时刻的采样值x(n)。,26,GSM算法,使用较普遍的波

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论