版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、长沙理工大学现代通信技术实验室语音压缩编码培训讲义-1、概述长沙理工大学通信工程系长沙理工大学通信工程系胡双红胡双红hu_2010-12-20长沙理工大学现代通信技术实验室培训进度安排培训进度安排n课题介绍课题介绍nPCMnDPCMnADPCMn每两周一次课,一周上课,一周答疑每两周一次课,一周上课,一周答疑2010-12-20长沙理工大学现代通信技术实验室内容提要内容提要n课题背景课题背景n国内外研究现状国内外研究现状n常用编码算法简介常用编码算法简介2010-12-20长沙理工大学现代通信技术实验室语音编码发展方向语音编码发展方向n极低速率语音编码极低速率语音编码n比特率低于比特率低于24
2、00bps的编码的编码n保密通信、语音邮件、网络通信、保密通信、语音邮件、网络通信、IP电话电话n变速率语音编码变速率语音编码n在合成语音质量和系统容量中灵活折中在合成语音质量和系统容量中灵活折中nCDMA通信系统中,且前景广阔通信系统中,且前景广阔n不压缩语音编码不压缩语音编码n压缩费用超过传输费用压缩费用超过传输费用n光纤通信、微波通信光纤通信、微波通信2010-12-20长沙理工大学现代通信技术实验室压缩的意义压缩的意义n为什么需要压缩编码技术为什么需要压缩编码技术nPCM编码占用带宽大编码占用带宽大n8000Hz采样速率,每样本采样速率,每样本8位码位码n数码率:数码率:64kbpsn
3、有线传输中可以找到大容量传输介质:光纤有线传输中可以找到大容量传输介质:光纤n无线接入侧的频谱资源相当紧张无线接入侧的频谱资源相当紧张2010-12-20长沙理工大学现代通信技术实验室GSM频点分配频点分配2010-12-20长沙理工大学现代通信技术实验室理论基础理论基础n定义:定义:n低于低于64kbps的编码方案称为语音压缩编码的编码方案称为语音压缩编码n压缩依据压缩依据n语音信号中存在的冗余语音信号中存在的冗余n人类的听觉感知机理人类的听觉感知机理2010-12-20长沙理工大学现代通信技术实验室信号冗余信号冗余n采样数据之间的相关采样数据之间的相关n8kHz速率时,相邻样值相关系数高达
4、速率时,相邻样值相关系数高达0.85n周期相关:周期相关:n浊音的准周期性浊音的准周期性n幅度的非均匀分布幅度的非均匀分布n小幅度概率高,信息集中在低功率小幅度概率高,信息集中在低功率n语音间隙的存在语音间隙的存在n声道的形状及其变化速率有限声道的形状及其变化速率有限2010-12-20长沙理工大学现代通信技术实验室听觉感知机理听觉感知机理n人耳对不同频段的声音敏感度不同人耳对不同频段的声音敏感度不同n低频比高频更敏感低频比高频更敏感n人耳对语音信号的相位不敏感人耳对语音信号的相位不敏感n人耳有掩蔽效应人耳有掩蔽效应(masking effect)n强音抑制弱音强音抑制弱音2010-12-20
5、长沙理工大学现代通信技术实验室语音编码的极限速率语音编码的极限速率n语音最基本元素语音最基本元素-音素音素:大约大约128256个个n通常说话速度:每秒平均发通常说话速度:每秒平均发10个音素个音素n信息率:信息率: I=log2(256)10bps=80bpsn把发音看成是以语音速率传送,则语音编码的把发音看成是以语音速率传送,则语音编码的极限速率为极限速率为80bps80bpsn从数字化标准的编码速率从数字化标准的编码速率64kbps64kbps,到极限速率,到极限速率80bps80bps之间的距离,对于理论研究和实践有着之间的距离,对于理论研究和实践有着极大的吸引力极大的吸引力2010-
6、12-20长沙理工大学现代通信技术实验室压缩编码方法分类压缩编码方法分类n波形编码波形编码n原理简单,失真小原理简单,失真小n数码率高数码率高n参数编码参数编码n数码率低数码率低n音质较差,复杂度高音质较差,复杂度高n混合编码混合编码n较低的比特率上获得较高的语音质量较低的比特率上获得较高的语音质量2010-12-20长沙理工大学现代通信技术实验室语音信号压缩编码的评价系统语音信号压缩编码的评价系统n语音质量语音质量n(1)广播级)广播级:n宽带宽带(0-7000Hz)高质量的语音,感觉不出噪声高质量的语音,感觉不出噪声存在存在n(2)网络或电话级:)网络或电话级:n200Hz-3200Hz,
7、信噪比大于信噪比大于30db。n(3)通信级)通信级:n完全可以听懂,但和长途电话相比,有明显失真。完全可以听懂,但和长途电话相比,有明显失真。n(4)合成级:)合成级:n80%-90%可懂度,音质较差,听起来像机器可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征。讲话,失去了讲话者的个人特征。2010-12-20长沙理工大学现代通信技术实验室语音信号压缩编码的评价指标语音信号压缩编码的评价指标n编码质量编码质量nMOS(Mean Opinion Score)n编码速率编码速率n适当选取适当选取n编解码复杂度编解码复杂度n不影响实时处理不影响实时处理n编解码时延编解码时延n不能超过不
8、能超过100msn若超过必须采取回声抵消或回声抑制等措施若超过必须采取回声抵消或回声抑制等措施2010-12-20长沙理工大学现代通信技术实验室2010-12-20长沙理工大学现代通信技术实验室内容提要内容提要n课题背景课题背景n国内外研究现状国内外研究现状n常用编码算法简介常用编码算法简介2010-12-20长沙理工大学现代通信技术实验室ITU-T的正式标准的正式标准nG.711(1972) 64kbps nPCM 用于固网用于固网nG.721(1984) 32kbps nADPCM 用于卫星、海缆、用于卫星、海缆、VRCnG.728(1992) 16kbps nLD-CELP 低延迟低延迟
9、-码激励线性预测码激励线性预测n无绳电话、无绳电话、SCSC卫星、海事卫星、卫星、海事卫星、DSI设备、录音、移动系统等设备、录音、移动系统等nG.729(1996) 8kbps nCS-ACELP(共轭结构共轭结构-代数数码激励线性预测技术代数数码激励线性预测技术) n可与可与32kbps的的ADPCM同质量同质量n用于个人移动通信、低用于个人移动通信、低C/N卫星、高质量移动无线通信,分组语音卫星、高质量移动无线通信,分组语音nG.722.2nAMR-ACELP(自适应多速率自适应多速率)n用于用于WCDMA和和TD-SCDMA系统系统2010-12-20长沙理工大学现代通信技术实验室20
10、10-12-20长沙理工大学现代通信技术实验室现状现状n主流:主流:CELPn4.8kbps的数码率上获得较高质量的语音的数码率上获得较高质量的语音2010-12-20长沙理工大学现代通信技术实验室发展方向发展方向n中低速率的语音编码的实用化中低速率的语音编码的实用化n降低复杂度降低复杂度n减少时延减少时延n提高抗干扰、抗噪声能力提高抗干扰、抗噪声能力n进一步降低编码速率进一步降低编码速率n目前目前5-6kbps的速率的速率-较高质量重建语音较高质量重建语音n目标目标4kbps得到短时延、高质语音得到短时延、高质语音2010-12-20长沙理工大学现代通信技术实验室发展方向发展方向n中长延时编
11、码中长延时编码n400-1200bps得到高质语音得到高质语音n新算法新算法n正弦变换编码(正弦变换编码(STC)n混合激励线性预测编码(混合激励线性预测编码(MELPC)n时频域插值编码(时频域插值编码(TFI)n基音同步激励线性预测编码(基音同步激励线性预测编码(PSELP)n新分析技术新分析技术n非线性预测非线性预测n多精度时频分析多精度时频分析n高阶统计分析高阶统计分析2010-12-20长沙理工大学现代通信技术实验室内容提要内容提要n课题背景课题背景n国内外研究现状国内外研究现状n常用编码算法简介常用编码算法简介n波形编码技术波形编码技术n参数编码技术参数编码技术2010-12-20
12、长沙理工大学现代通信技术实验室一、一、PCM编码编码nPCM:Pulse Coded Modulationn抽样:抽样:8000Hzn量化:非均匀量化:非均匀A律律87.6/13折线压扩特性折线压扩特性n编码:编码:8位码位码n极性码:第极性码:第1位位n段落码:第段落码:第2-3位位n段内码:第段内码:第4-7位位2010-12-20长沙理工大学现代通信技术实验室二、二、DPCM编码编码n差分差分PCM编码编码n对相邻样本的差进行对相邻样本的差进行PCM编码编码n由于样本差值的动态范围远小于样本动态范由于样本差值的动态范围远小于样本动态范围,因此达到相似性能可以减小编码位数围,因此达到相似性
13、能可以减小编码位数n技术实现关键问题技术实现关键问题n编码位数的选取编码位数的选取n预测器系数选取:预测器系数选取:LMS2010-12-20长沙理工大学现代通信技术实验室DPCM框图2010-12-20长沙理工大学现代通信技术实验室DPCM(含预测器内部结构)2010-12-20长沙理工大学现代通信技术实验室三、三、ADPCMn自适应自适应DPCMn自适应预测系数调整自适应预测系数调整n自适应编码位数调整自适应编码位数调整n技术实现关键技术实现关键n自适应预测器自适应预测器n自适应量化器自适应量化器2010-12-20长沙理工大学现代通信技术实验室2010-12-20长沙理工大学现代通信技术
14、实验室2010-12-20长沙理工大学现代通信技术实验室内容提要内容提要n课题背景课题背景n国内外研究现状国内外研究现状n常用编码算法简介常用编码算法简介n波形编码技术波形编码技术n参数编码技术参数编码技术2010-12-20长沙理工大学现代通信技术实验室语音生成机构语音生成机构n声源:声源:n声带声带n共鸣机构:共鸣机构:n声道声道(鼻腔、口腔与舌头鼻腔、口腔与舌头)n放射机构:放射机构:n嘴唇或鼻孔嘴唇或鼻孔2010-12-20长沙理工大学现代通信技术实验室2010-12-20长沙理工大学现代通信技术实验室2010-12-20长沙理工大学现代通信技术实验室2010-12-20长沙理工大学现
15、代通信技术实验室语音产生机理语音产生机理n浊音浊音n气流通过声门时,声带的张力刚好使声带产气流通过声门时,声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气生张弛振荡式振动,产生一股准周期脉冲气流,激励声道产生浊音流,激励声道产生浊音n轻音轻音n声带不振动,而在某处收缩,迫使气流高速声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分产生湍流就产生清音通过这一收缩部分产生湍流就产生清音 n爆破音爆破音n声道完全闭合的情况下突然释放产生爆破音声道完全闭合的情况下突然释放产生爆破音2010-12-20长沙理工大学现代通信技术实验室语音信号产生模型语音信号产生模型清清/浊开关浊开关声道模
16、拟声道模拟滤波器滤波器基音周期基音周期脉冲序列脉冲序列发生器发生器随机噪声随机噪声发生器发生器LPCLPC系数系数增益增益G u(n)u(n)输出输出语音语音s(n)s(n)2010-12-20长沙理工大学现代通信技术实验室050100150200清 音 语音浊 音 语音振 幅时间 (样 点) 清音清音/ /浊音示意图浊音示意图:2010-12-20长沙理工大学现代通信技术实验室a a1 1语音语音输出输出xx(n)(n)线性线性预测预测分析分析基音频率基音频率清清/ /浊音判别浊音判别参数参数合成合成a a2 2a ap p 基音频率基音频率输入输入语音语音x(n)x(n)清清/ /浊音标志
17、浊音标志G G)()()(1knxanuGnxqkk2010-12-20长沙理工大学现代通信技术实验室模型中的参数模型中的参数n清浊音判决清浊音判决n基音周期基音周期n时变滤波器时变滤波器n增益常数增益常数Gn数字滤波器参数数字滤波器参数ain特点:随时间缓慢变化特点:随时间缓慢变化2010-12-20长沙理工大学现代通信技术实验室优点优点n能够用线性预测分析方法对滤波器参数能够用线性预测分析方法对滤波器参数ai和增益常数和增益常数G进行非常直接和高效的计进行非常直接和高效的计算算2010-12-20长沙理工大学现代通信技术实验室LPC模型阶数模型阶数p的选择的选择n保证有足够的极点模型化声道
18、响应的谐保证有足够的极点模型化声道响应的谐振结构振结构n通常通常10kHz时有时有5个共振峰,一对极点对应个共振峰,一对极点对应一个共振峰,取一个共振峰,取p=10n弥补鼻音中存在的零极点和其他因素的偏差弥补鼻音中存在的零极点和其他因素的偏差n取取p=12142010-12-20长沙理工大学现代通信技术实验室二、二、LPC-10编码器编码器n美国确定美国确定LPC-10作为作为2.4kb/s速率上的速率上的推荐编码形式,用于第三代保密电话中推荐编码形式,用于第三代保密电话中n发送端,原始语音信号采用发送端,原始语音信号采用8kHz采样,采样,然后每然后每180个采样值分为一帧个采样值分为一帧(22.5ms),提取语音特征参数并加以),提取语音特征参数并加以编码传送。编码传送。n每帧总共编码为每帧总共编码为54bits,每秒传输,每秒传输44.4帧,因此总传输速率为帧,因此总传输速率为2.4kb/s2010-12-20长沙理工大学现代通信技术实验室s(n)s(n)采样采样(8kHz)(8kHz)基音检测基音检测(AMDFAMDF)清清/ /浊音浊音检测检测预加重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026重庆市铜梁区维新镇第一批公益性岗位人员招聘1人备考题库含答案详解(培优b卷)
- 2026春季福建泉州市晋江市第五实验小学语文自聘教师招聘2人备考题库附参考答案详解(预热题)
- 2026福建漳州港务集团有限公司应届毕业生春季招聘6人备考题库完整答案详解
- 2026江苏南通如东县岔河镇村卫生室工作人员招聘2人备考题库含答案详解(典型题)
- 2026江苏南京工业大学教学科研岗招聘101人备考题库带答案详解(模拟题)
- 2026江西南昌大学高层次人才招聘64人备考题库及答案详解(真题汇编)
- 2026年4月安徽芜湖高新区(弋江区)国有企业人员招聘14人备考题库完整参考答案详解
- 2026国航股份浙江分公司地面综合服务岗位就业见习生、实习生备考题库附答案详解(突破训练)
- 2026山东济南市第五人民医院招聘卫生高级人才和博士(控制总量)8人备考题库附答案详解(夺分金卷)
- 2026上半年广东广州市越秀区教育局招聘事业编制教师83人备考题库带答案详解(达标题)
- 索尼拍照行业现状分析报告
- 5年高考数学真题分类汇编专题02常用逻辑用语(原卷版)
- 安徽2021-2025真题及答案
- JJG 1148-2022 电动汽车交流充电桩(试行)
- 向量为基,几何为本-以2025年全国新高考数学Ⅰ卷17题为例说题比赛
- 2026-2031年中国鲜冻马肉行业市场发展趋势与前景展望战略研究报告
- 军人二次召回通知书
- 曲臂车安全施工方案
- 《制氢现场氢安全管理规范》
- 防溺水事故应急预案
- 室分业务发展操作指导手册(试行)
评论
0/150
提交评论