![[信息与通信]语音压缩方法综述.ppt_第1页](http://file.renrendoc.com/FileRoot1/2019-12/17/73b22687-6650-4a6a-8881-0a02583b1567/73b22687-6650-4a6a-8881-0a02583b15671.gif)
![[信息与通信]语音压缩方法综述.ppt_第2页](http://file.renrendoc.com/FileRoot1/2019-12/17/73b22687-6650-4a6a-8881-0a02583b1567/73b22687-6650-4a6a-8881-0a02583b15672.gif)
![[信息与通信]语音压缩方法综述.ppt_第3页](http://file.renrendoc.com/FileRoot1/2019-12/17/73b22687-6650-4a6a-8881-0a02583b1567/73b22687-6650-4a6a-8881-0a02583b15673.gif)
![[信息与通信]语音压缩方法综述.ppt_第4页](http://file.renrendoc.com/FileRoot1/2019-12/17/73b22687-6650-4a6a-8881-0a02583b1567/73b22687-6650-4a6a-8881-0a02583b15674.gif)
![[信息与通信]语音压缩方法综述.ppt_第5页](http://file.renrendoc.com/FileRoot1/2019-12/17/73b22687-6650-4a6a-8881-0a02583b1567/73b22687-6650-4a6a-8881-0a02583b15675.gif)
已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音压缩方法综述,巩永稳,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm)参数编码混合编码,语音压缩:,语音信号是模拟信号,不能直接在数字通信系统中传输,必须先进行模/数转换,再进行数/模转换,并且为了降低编码速率和提高语音质量而采用的一些优化编码技术等这一系列语音编码过程叫做语音压缩。,对语音压缩的要求:,编码速率要适合在常用语音信道内传输,一般要求编码速率在162kb/s范围内的情况较多。在一定编码速率下,语音质量应尽可能高,即译码后恢复语音的保真度要尽量高。编译码时延要小,总时延一般不要大于65ms。编译码算法复杂度不能太大,以适于用大规模集成电路实现。坚韧性要好,有较好的抗误码性能。,语音编码的意义:,提高通话质量(数字化+信道编码纠错)提高频谱利用率(低码率编码)提高系统容量(低码率、语音激活技术),语音压缩系统构成:,编码速率:编码速率可以用“比特/样点”(b/p)表示,它代表了平均每个语音样点用多少比特编码,一般用r表示。也可用“比特/秒”(b/s)来度量,它代表了编码的总速率,一般用v表示,则v和r可以通过取样频率联系起来:v=r*fs其中fs为取样频率,坚韧性:所谓坚韧性是指语音编码能够适应各种使用环境和条件,在较为不利的环境和条件下能正常工作。,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm)参数编码混合编码,语言编码的分类:,波形编码:将时域模拟话音的波形信号经过采样、量化和编码形成数字语音信号。编码速率较高:16k64k。包括:pcm、adpcm、m、cvsdm、apc等。占用较高带宽,适合有线。参量编码:基于人类语音的产生机理建立数学模型,根据输入语音得出模型参数并传输,在收端恢复。编码速率较低:1.2k4.8kbps。包括各种线性预测编码(lpc)方法和余弦声码器等。语音质量中等,不满足商用要求。混合编码:波形编码+参量编码(lpas)包括gsm的rpe-lpc编码和vselp编码。,语音编码的分类:,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm)参数编码混合编码,1、均匀量化pcm直接对语音信号进行a/d转换。语音波形信号就被表示成一组用数字编码的脉冲序列。这种编码方法被称为脉冲编码调制(pulsecodingmodulation,简称pcm)。,pcm编码原理如下图所示。,模数转换要经过抽样、量化和编码三个步骤。,抽样是把连续时间模拟信号转换成离散时间连续幅度的抽样信号。量化是把离散时间连续幅度的抽样信号转换成离散时间离散幅度的数字信号。编码是将量化后的信号编码形成一个二进制码组输出。,a/d变换,pam,量化,量化的过程是将信号转换成离散时间离散幅度的多电平信号。,pcm转换过程举例,原始信号,pam脉冲,pcm脉冲(有量化误差),011100011011001100,pcm输出,抗混叠滤波:工程测量中采样频率不可能无限高也不需要无限高,因为一般只关心一定频率范围内的信号成份。为解决频率混叠,在对模拟信号进行离散化采集前,采用低通滤波器滤除高于1/2采样频率的频率成份。(20-20000hz),量化误差e(n)可以定义如下:其中为量化后的信号,为量化前的采样信号。量化误差也称为量化噪声。对于均匀量化来说,量化噪声的功率仅取决于量化间隔。,假设量化误差e(n)在各个量化间隔的区间里均匀分布,则由于引入量化噪声,所得数字语音的信噪比为:,分别表示输入信号和量化噪声的方差或能量,为信号的最大幅度,b表示量化字长。,根据语音的分布统计特性,可以取,可以计算出当b=12时,采样频率8khz的均匀量化器所产生的数字语音的信噪比可达60db,基本上可以满足高质量的电话通信要求。此时pcm的编码速率为96kbit/s。,2、非均匀量化pcm在语音信号中,样本的幅度值不是均匀分布的,信号大量地集中在小幅度值上。如果对小幅度样本使用小的量化间隔,进行精确量化,而对大幅度样本使用大的量化间隔,则既可成功地提高信噪比,又可避免大信号的过载。,最常用的非均匀量化方法是对数压扩方法。编码时,利用语音信号的幅度统计特性,对幅度按对数变换进行压缩,然后再进行均匀量化。如律变换、a律变换等。,设为语音波形的采样值,则律压缩定义为:,即将输入语音压缩变换为,然后再进行均匀量化编码。,a律的压缩方法与律相似,按如下公式进行:,目前,非均匀量化的pcm编码广泛地应用在数字电话网中,北美和日本主要使用律压缩,我国则采用a律压缩。,fa(x),0,1,1,7/8,6/8,5/8,4/8,3/8,2/8,1/8,xa(nt),a律压扩编码,采用8位二进制编码:c7c6c5c4c3c2c1c0c7:表示信号的极性,称为极性码。0为正,1为负。,c3c2c1c0:表示每一段落的16个均匀划分的量化级,称为段内码。0000000100100011010001010110011110001001101010111100110111101111,c6c5c4:表示段落序号,称为段落码。000001010011100101110111,对输入动态范围为(-5v,+5v),用a律压扩编码,有:,1/1280.0390625v,76543210,15v,1/22.5v,1/41.25v,1/80.625v,1/160.3125v,1/320.15625v,1/640.078125v,00v,输入信号为1.05v,则编码为:极性码:0段落码:101段内码:=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整数10,对应第10量化间隔,编码为1010最后完整的码字为:01011010,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm)参数编码混合编码,3、自适应量化pcm,由于语音信号的特性是随时间变化的,能量时大时小,因此可以采用自适应的方法。对短时能量较大的信号,采用较大的量化间隔进行量化,相反地,对短时能量较小的信号,采用较小的量化间隔进行量化。这样无疑有助于减少量化噪声,提高量化后信号的信噪比。,差分编码调制,问题的提出dpcm的基本原理dpcm的特点dpcm的实际应用,问题的提出,pcm编码速率64kb/s才能符合传输话音的质量指标,每路电话占用频带大于模拟单边带系统,严重地限制了pcm在已经相当拥挤的那些频段中应用。压缩pcm系统所占用的频带宽度也就成为人们密切关注的问题。基于此目的提出dpcm。,差分编码调制,问题的提出dpcm的基本原理dpcm的特点dpcm的实际应用,dpcm的基本原理,话音信号的相关性预测传输样值差值实现通信的可能性预测值的形成量化误差与解码重建,话音信号的相关性,话音信号相邻抽样值之间存在很强的相关性信源本身含有大量的无效成分或次要成分。如果设法减少或者去除这些剩余成分,就可以大大提高通信的有效性。,dpcm的基本原理,话音信号的相关性预测传输样值差值实现通信的可能性预测值的形成量化误差与解码重建,预测,话音样值包含两个成份可预测成份:由过去一些适当数目的样值加权后得到。不可预测成份:预测误差(差值)。,只需传输差值序列可以代替原始序列中的有效信息。,样值差的动态范围小于样本本身,有可能再保证话音质量的前提下,降低数码率。信号自相关性越强,压缩率越大。,dpcm的基本原理,话音信号的相关性预测传输样值差值实现通信的可能性预测值的形成量化误差与解码重建,传输样值差值实现通信的可能性,d(0),传输样值差值实现通信的可能性,话音信号样值序列,可得,相邻样值之差,样值s(n)等于过去到现在所有差值的积累,传输样值差值实现通信的可能性,信道理想,可以恢复原始样值脉冲序列,说明,说明,说明,说明,说明,dpcm的基本原理,话音信号的相关性预测传输样值差值实现通信的可能性预测值的形成量化误差与解码重建,预测值的形成,dpcm是将差值脉冲序列进行量化编码后送到信道传输的。对差值编码来说,首先要解决差值的检出。关键问题是检测前邻样值。原理框图。,原理框图,发端,收端,预测值的形成,前邻样值,可得,dpcm是差值量化,在nts时刻的估计值sp(n)等于所有过去的差值量化值d(i)的累积,估计值sp(n)是样值s(n)的预测值,预测值的形成,s(0),sp(0)=0,预测值的形成,sp(0)=0,预测值的形成,0,ts,d(0)=s(0),s(0),s(1),sp(1),sp(0)=0,-ts,预测值的形成,dpcm的基本原理,话音信号的相关性预测传输样值差值实现通信的可能性预测值的形成量化误差与解码重建,量化误差与解码重建,样值的量化误差,差分编码调制,问题的提出dpcm的基本原理dpcm的特点dpcm的实际应用,dpcm的特点,当传输话音信号时,码速32kb/s的dpcm系统的通话质量,大致可达到64kb/spcm的水平。在远距离时pcm话变成32kb/s的dpcm信号,可在传输信道中扩大一倍电话容量,而其接口仍满足64kb/s。这是编码体制上的一个重要发展。,差分编码调制,问题的提出dpcm的基本原理dpcm的特点dpcm的实际应用,dpcm的实际应用,单纯的dpcm已用得不多,更多的是采用自适应差分脉冲编码调制(ad-pcm)。自适应是指能自动的改变量化间隔,使预测误差电平大时增大量化阶距,误差电平小时缩短量化阶距,从而进一步降低量化噪声。dpcm信号的编码位n最低为2,即2比特量化。如果把n降到1,成为1比特量化,就是增量调制(m)。,ad-pcm,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm)参数编码混合编码,ad-pcm,最佳量化特性ad-pcm系统工作原理,最佳量化特性,最佳量化特性是指均方量化误差最小的量化特性,量化级数n=2m,可知分层电平mk为相邻量化电平的中间值。量化电平qk为该量化间隔内经常出现的瞬时电平值。量化级数n很大时,可以近似认为在每一个量化间隔内p(x)为常数。,ad-pcm,最佳量化特性ad-pcm系统工作原理,ad-pcm系统工作原理,自适应量化的基本思想就是使均方量化误差最小,让量阶的变化与输入信号的均方根值相匹配,为了实现自适应量化,首先要对输入信号的均方根值s(n)进行估算,根据信号能量的大小来改变量阶(n)。根据检测信号能量途径不同,可分为前向自适应量化和后向自适应量化,前者直接从输入信号样值估计输入信号能量,后者从编码后的信码估计输入信号的能量。,ad-pcm系统工作原理,根据检测信号能量途径不同,可分为前向自适应量化和后向自适应量化,前者直接从输入信号样值估计输入信号能量,后者从编码后的信码估计输入信号的能量。,前向自适应量化后向自适应量化,前向自适应量化,前向自适应量化时,输入信号能量的估计值没有受到非线性量化器的影响,估值准确。但是量阶的信息(边信息)要与话音信息(主信息)一起送到收端解码器,否则收端无法知道发端该时刻的量阶值。边信息需要若干比特的精度。前向自适应量化不宜采用瞬时自适应量化方案。,ad-pcm系统工作原理,根据检测信号能量途径不同,可分为前向自适应量化和后向自适应量化,前者直接从输入信号样值估计输入信号能量,后者从编码后的信码估计输入信号的能量。,前向自适应量化后向自适应量化,后向自适应量化,不需要边信息,量阶的信息可以从接收信码中提取。可以采用音节或瞬时或者两者兼顾的自适应量化方式。因量化误差而影响估值的准确度,自适应动态范围越大,影响程度越小。尽管存在缺点,仍然不失特色,被广泛采用。,ad-pcm系统工作原理(后向型),编码,解码,后向自适应量化,后向自适应量化可以从量化后的信码电平来估算均方根值,然后估算出(n)。用(n)去控制量化器、编码器的量阶。(n)是由量化后的信码电平估算出来的,因此后向自适应不需要传送边信息(n)。接收端可由其量化自适应系统,从接收的信码中估算出解码器所需的(n)的值。,后向自适应量化,本时刻的量阶(n)可以用前一时刻量阶(n1)与前一时刻的码字电平i(n-1)的函数形式来估算。,可见第n时刻的量阶值(n)等于第n-1时刻的量阶(n-1)乘以mi(n-1)因子。mi(n-1)是码字电平i(n-1)的函数,码字电平越高,mi(n-1)的值也越大,第n时刻的量阶随n-1时刻的量阶,码字电平变化,可满足自适应要求。,主要内容,语音压缩技术导论编码方式分类波形编码(pcm、dpcm、ad-pcm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 叉车安全方面的测试题目及答案解析
- 会计从业考试资格题库及答案解析
- 车站安全生产培训考试题及答案解析
- 2025年HDPE微管行业研究报告及未来行业发展趋势预测
- 2025年分离膜外壳行业研究报告及未来行业发展趋势预测
- 2025年风电装机行业研究报告及未来行业发展趋势预测
- 2025年百秋李醇行业研究报告及未来行业发展趋势预测
- 2025年别墅装潢行业研究报告及未来行业发展趋势预测
- 2025年耳机配件行业研究报告及未来行业发展趋势预测
- 家具配件厂消防演练记录管理规定
- 国家保密培训课件
- 工商业光伏施工总承包合同
- 参考儿科急危重症抢救预案及流程
- 高铁司机长时间专注心理调节专题报告
- 关于医院“十五五”发展规划(2026-2030)
- T/CHTS 10130-2024高韧超薄沥青磨耗层技术指南
- 活动人员分工安排方案
- 米糠油项目可行性分析报告
- DB31T 1235-2020 高层民用建筑消防安全管理要求
- 《汽车构造基础知识》课件
- 《人工智能通识基础(慕课版)》-教学大纲、课程标准
评论
0/150
提交评论