语音信号处理课件-语音编码_第1页
语音信号处理课件-语音编码_第2页
语音信号处理课件-语音编码_第3页
语音信号处理课件-语音编码_第4页
语音信号处理课件-语音编码_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音信号的压缩编码一 .压缩编码原因语音信号的压缩编码是研究如何降低语音信号编码速率的问题。以语音信号为例,模拟形式下带宽一般不到 4KHz,经过调制后,所需传输带宽不会超过 8KHz。但是以 8KHz抽样,并且每个样值用 8位二进制代码表示时,即采用 A率 13折线 PCM数字语音信号时,信息速率为 64Kbit/s。利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为 32KHz。频带利用率 =传输速率/带宽v二 .什么是语音压缩编码?把数码率低于 64Kbit/s的语音编码方法称为语音压缩编码技术三 .语音编码分类根据编码器的实现机理,分成三大类波形编码参数编码混合编码1、波形编码从语音信号的波形出发,对波形的抽样值、预测值、预测误差进行编码,它以重建语音波形为目的,力图使重建波形接近原信号波形。特点:利用抽样定理,恢复原始信号的波形优点: 适应能力强,重建语音质量好缺点: 编码速率较高类型: PCM,自适应增量调制 ( ADM),自适应差分编码调制( ADPCM),自适应预测编码 APC速率通常在 16-64kbit/s范围v2.参数编码提取语音的一些特征信息进行编码,在收端利用这些特征参数合成语音。v优点: 编码速率低。v缺点: 语音的音质和自然度较差,很难辨别说话人。(有一定的可懂度 )v类型 :LPC线性预测编码速率通常是在 4.8kbit/s以下3.混合编码v介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编码的一些特征。波形编码 +参数编码可在 4-16kbit/s范围内达到良好的语音质量类型: 子带编码语音编码技术语音编码技术 普通编译码器的音质与数据率普通编译码器的音质与数据率衡量话音编码器的参数数据输出速率延迟时间话音质量价格(实现代价)语音信号的冗余度幅度非均匀分布样本之间的相关性周期之间的相关性基音之间的相关性静止系数(话音间隙)长期相关性( long term correlation)tnxa(nT)xa(t) 2.采样 :将时间连续信号变成时间离散信号。采样频率通常为fs 8kHz。vIdeal sampling and real sampling对离散时间信号进行量化, 在每一时刻对 xa(nT)独立进行量化,把给定的幅度连续的信号变成为有限多个幅度的集合中某个幅度值的过程。3. A/D转换采样 量化xa(t)xa(nT) x(n)xa1x1 xkxak xak+1xk+1 xLxaL xaL+1x(n)=Qxa(nT)000001010011111110101100/2量化误差 (噪声 ) e(n)=x(n)- xa(nT) -/2 e(n) /22 m=00 其他( 1)假设量化噪声是平稳的白噪声过程,有Ee(n)e(n+m)=( 2) 假设量化噪声与输入信号不相关,有Ee(n)x(n+m)=0 m为任意值( 3)在每个量化间隔上,量化噪声均匀分布,有Pe(e(n)= 1 |e(n)| /20 其他量化信噪比量化噪声的信噪比: SNR=x2/e2 x2语音信号序列的方差, e2噪声序列的方差, 用分贝表示, SNR=10log(x2/e2)SNR = signals energy / noises energySNR=6.02B+4.77 20log(Xmax/x) 6.02B 7.27Xmax表示其峰值 B为量化的比特数当语音信号的幅度服从拉普拉斯分布时, Xmax 4x量化器每增加一个比特, SNR提高约 6dB。当B=8,SNR=40dB, 满足一般通信系统的要求。当量化噪声的信噪比达到 60 70dB, 才能保障有高水平通话质量,这时要求量化为 11 13bits。 一般的音频 A/D、 D/A转换芯片,量化为 12bits。脉冲编码调制( PCM)Pulse Code ModulationPCM的量化方式均匀量化与非均匀量化非均匀量化对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。对大信号来说,虽然绝对量化误差较大,但是因为:( 1)大信号出现的机会不多,( 2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。非均匀量化也是一种压缩。律压扩与 A律压扩m 律 (m -Law)压扩 (G.711)主要用在北美和日本等地区的数字电话通信中。x为x 为输入信号,规格化为 1= x =1m 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取 100 = m = 500。律压扩与 A律压扩0 = |x| = 1/A1/A = |x| = 1A律 (A-Law)压扩 (G.711)主要用在欧洲和中国大陆等地区的数字电话通信中对于采样频率为 8 kHz, 样本精度为 13位、 14位或者 16位的输入信号,使用 m 律压扩编码或者使用 A律压扩编码,经过PCM编码器之后每个样本的精度为 8位,输出的数据率为 64 kb/s。 这个数据就是 CCITT推荐的 G.711标准。自适应差值脉冲编码调制原理( ADPCM)v差值脉冲编码( DPCM)v1.编码思想提高通信质量 必须 减小量化误差减小量化级当抽样值范围确定时增加编码 位数 Nv增加编码位数可获得大的信噪比在编码位数固定时,减小抽样值的变化范围,也同样可以提高信噪比即:若缩小抽样值(被编码信号)的变化范围,就可以在保证信噪比不变的情况下,减小编码的位数。这就是差值编码的中心思想增量调制 ( M)增量调制 (delta modulation, DM) 是一种预测编码技术,是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成 “0”和 “1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为 “正 ”,则用 “1”表示;相反则用 “0”表示。 DM编码系统又称为 “1位系统 ”。二、差值编码模型图在原来的抽样值中减去某一个值,然后对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出原始值。x(n) + d(n) c(n) d(n) x(n)-x(n) x(n)差值编码模型译码+ 编码 +图中: x(n)是原始样值( n时刻的抽样值)x(n)为减去量d(n)=x(n)-x(n) 为差值可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论