已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音压缩编码-1、概述,吉林大学通信工程学院通信系,课程安排,背景介绍DPCM和ADPCMSBC子带编码VQ量化,背景介绍,课题背景国内外研究现状常用编码算法简介,语音编码发展方向,极低速率语音编码比特率低于2400bps的编码保密通信、语音邮件、网络通信、IP电话变速率语音编码在合成语音质量和系统容量中灵活折中CDMA通信系统中,且前景广阔不压缩语音编码压缩费用超过传输费用光纤通信、微波通信,压缩的意义,为什么需要压缩编码技术PCM编码占用带宽大8000Hz采样速率,每样本8位码数码率:64kbps有线传输中可以找到大容量传输介质:光纤无线接入侧的频谱资源相当紧张,GSM频点分配,理论基础,定义:低于64kbps的编码方案称为语音压缩编码压缩依据语音信号中存在的冗余人类的听觉感知机理,信号冗余,采样数据之间的相关8kHz速率时,相邻样值相关系数高达0.85周期相关:浊音的准周期性幅度的非均匀分布小幅度概率高,信息集中在低功率语音间隙的存在声道的形状及其变化速率有限,听觉感知机理,人耳对不同频段的声音敏感度不同低频比高频更敏感人耳对语音信号的相位不敏感人耳有掩蔽效应(maskingeffect)强音抑制弱音,语音编码的极限速率,语音最基本元素-音素:大约128256个通常说话速度:每秒平均发10个音素信息率:I=log2(256)10bps=80bps把发音看成是以语音速率传送,则语音编码的极限速率为80bps从数字化标准的编码速率64kbps,到极限速率80bps之间的距离,压缩比可达64kbps/80bps=800对于理论研究和实践有着极大的吸引力,压缩编码方法分类,波形编码原理简单,失真小数码率高参数编码数码率低音质较差,复杂度高混合编码较低的比特率上获得较高的语音质量,语音信号压缩编码的评价系统,语音质量(1)广播级:宽带(0-7000Hz)高质量的语音,感觉不出噪声存在(2)网络或电话级:200Hz-3200Hz,信噪比大于30db。(3)通信级:完全可以听懂,但和长途电话相比,有明显失真。(4)合成级:80%-90%可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。,语音信号压缩编码的评价指标,编码质量MOS(MeanOpinionScore)编码速率适当选取编解码复杂度不影响实时处理编解码时延不能超过100ms若超过必须采取回声抵消或回声抑制等措施,内容提要,课题背景国内外研究现状常用编码算法简介,ITU-T的正式标准,G.711(1972)64kbpsPCM用于固网G.721(1984)32kbpsADPCM用于卫星、海缆、VRCG.728(1992)16kbpsLD-CELP低延迟-码激励线性预测无绳电话、SCSC卫星、海事卫星、DSI设备、录音、移动系统等G.729(1996)8kbpsCS-ACELP(共轭结构-代数数码激励线性预测技术)可与32kbps的ADPCM同质量用于个人移动通信、低C/N卫星、高质量移动无线通信,分组语音G.722.2AMR-ACELP(自适应多速率)用于WCDMA和TD-SCDMA系统,现状,主流:CELP(码激励线性预测)4.8kbps的数码率上获得较高质量的语音,发展方向,中低速率的语音编码的实用化降低复杂度减少时延提高抗干扰、抗噪声能力进一步降低编码速率目前5-6kbps的速率-较高质量重建语音目标4kbps得到短时延、高质语音,发展方向,中长延时编码400-1200bps得到高质语音新算法正弦变换编码(STC)混合激励线性预测编码(MELPC)时频域插值编码(TFI)基音同步激励线性预测编码(PSELP)新分析技术非线性预测多精度时频分析高阶统计分析,内容提要,课题背景国内外研究现状常用编码算法简介波形编码技术参数编码技术,一、PCM编码,PCM:PulseCodedModulation抽样:8000Hz量化:非均匀A律87.6/13折线压扩特性编码:8位码极性码:第1位段落码:第2-3位段内码:第4-7位,二、DPCM编码,差分PCM编码对相邻样本的差进行PCM编码由于样本差值的动态范围远小于样本动态范围,因此达到相似性能可以减小编码位数技术实现关键问题编码位数的选取预测器系数选取:LMS,DPCM框图,三、ADPCM,自适应DPCM自适应预测系数调整自适应编码位数调整技术实现关键自适应预测器:指预测器的预测系数能随话音瞬时变化作自适应调整,从而得到高预测增益自适应量化器:指量化器的量化级(阶距)能随话音瞬时变化作自适应调整,从而得到高的量化信噪比。,3.子带编码(SubbandCode;SBC)子带编码(SBC)是首先用带通滤波器将语音信号分割成几个不同的频带分量(子带),再分别对每个子带进行抽样和编码。编码后的码流通过复接器复接,送到信道上传输。接收端再将它们分接、译码,并组合起来重建原始的输入信号。下图就是子带编码的原理方框图。,在语音信号的子带划分上,应考虑到各频段对主观听觉贡献相等的原则做合理的分配,使低频段的子带宽度较窄,高频段的子带宽度较宽。通常语音信号经带通滤波器组滤波后分成46个子带,子带之间允许有小的间隙,如图所示。,子带编码原理,在子带编码器的设计中,必须考虑子带数目、子带划分、编码的参数、子带中的比特分配以及带宽等主要参数。设一个子带编码系统包括m个子带,各子带带宽为Bk(k=1,m),每个子带信号经过频率为fsk=2Bk的抽样后,使用Rk个比特来进行量化和编码,那么该系统总的编码速率I应为式(3-3),各子带带宽相等,即等带宽子带编码,有式(3-4),式(3-3)可化简为式(3-5),例:一个4子带的SBC系统,子带分别为(0800Hz),(800Hz1600Hz),(1600Hz2400Hz),(2400Hz3200Hz),如果忽略同步的边带信息,子带的比特分配分别为3、2、1、0比特/样值,则SBC编码系统总的传输速率为,设B=3200Hz,m=4,R1=3,R2=2,R3=1,R4=0,代入上式,全带抽样编码的平均比特数为,矢量量化,标量量化和矢量量化矢量量化(VectorQuantization;VQ)应用很广:语音压缩编码;参数编码;图像压缩编码,例:在矢量量化器的设计中,设抽样频率为16kHz,码本由256个4维矢量组成,1)求矢量量化器输出的数码率?2)系统满意工作的最大消息带宽是多少?,内容提要,课题背景国内外研究现状常用编码算法简介波形编码技术参数编码技术,语音生成机构,声源:声带共鸣机构:声道(鼻腔、口腔与舌头)放射机构:嘴唇或鼻孔,语音产生机理,浊音气流通过声门时,声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流,激励声道产生浊音轻音声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分产生湍流就产生清音爆破音声道完全闭合的情况下突然释放产生爆破音,语音信号产生模型,清音/浊音示意图:,a1,语音输出x(n),线性预测分析基音频率清/浊音判别,参数合成,a2,ap,基音频率,输入语音x(n),清/浊音标志,G,模型中的参数,清浊音判决基音周期时变滤波器增益常数G数字滤波器参数ai特点:随时间缓慢变化,优点,能够用线性预测分析方法对滤波器参数ai和增益常数G进行非常直接和高效的计算,LPC模型阶数p的选择,保证有足够的极点模型化声道响应的谐振结构通常10kHz时有5个共振峰,一对极点对应一个共振峰,取p=10弥补鼻音中存在的零极点和其他因素的偏差取p=1214,二、,LPC-10编码器,美国确定LPC-10作为2.4kb/s速率上的推荐编码形式,用于第三代保密电话中发送端,原始语音信号采用8kHz采样,然后每180个采样值分为一帧(22.5ms),提取语音特征参数并加以编码传送。每帧总共编码为54bits,每秒传输44.4帧,因此总传输速率为2.4kb/s,s(n),采样(8kHz),基音检测(AMDF),清/浊音检测,预加重,线性预测分析,反射系数,增益G,参数编码,c(n),LPC-10编码器发送端,预加重:,提高语音谱中的高频共振峰,使语音频谱较为平滑,从而提高谱参数估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 历史教师资格试卷及分析
- 随州市专职消防员招聘考试题库及答案
- 房地产经纪题目及详解
- 2026年山东聊城市高三二模高考历史试卷试题(含答案详解)
- 石嘴山市专职消防员招聘面试题及答案
- 广告策划师品牌推广试题及解析
- 26年PD-L1检测用药匹配循证解读
- 26年医保基因检测目录调整要点
- 继发性舌咽神经痛护理查房
- 继发性尿崩症护理查房
- 2024年中国心脏脉冲电场消融系统(PFA)行业发展概况、市场全景分析及投资策略研究报告
- 职业技能竞赛互联网营销师(直播销售员)赛项考试题库500题(含答案)
- 厨房劳务承揽合同范本
- 下基层调研工作制度
- 尼康D90-使用指南
- T-GDWCA 0035-2018 HDMI 连接线标准规范
- JCT2460-2018 预制钢筋混凝土化粪池
- 电气化铁路有关人员电气安全规则2023年新版
- 小说文本解读和教学策略公开课一等奖市赛课获奖课件
- LS/T 3311-2017花生酱
- 十字花科蔬菜病害课件
评论
0/150
提交评论