




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021/3/7,长沙理工大学现代通信技术实验室,语音压缩编码培训讲义-1、概述,长沙理工大学通信工程系,胡双红 hu_,2010-12-20,长沙理工大学现代通信技术实验室,培训进度安排,课题介绍 PCM DPCM ADPCM 每两周一次课,一周上课,一周答疑,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景 国内外研究现状 常用编码算法简介,2010-12-20,长沙理工大学现代通信技术实验室,语音编码发展方向,极低速率语音编码 比特率低于2400bps的编码 保密通信、语音邮件、网络通信、IP电话 变速率语音编码 在合成语音质量和系统容量中灵活折中 CDMA通信系
2、统中,且前景广阔 不压缩语音编码 压缩费用超过传输费用 光纤通信、微波通信,2010-12-20,长沙理工大学现代通信技术实验室,压缩的意义,为什么需要压缩编码技术 PCM编码占用带宽大 8000Hz采样速率,每样本8位码 数码率:64kbps 有线传输中可以找到大容量传输介质:光纤 无线接入侧的频谱资源相当紧张,2010-12-20,长沙理工大学现代通信技术实验室,GSM频点分配,2010-12-20,长沙理工大学现代通信技术实验室,理论基础,定义: 低于64kbps的编码方案称为语音压缩编码 压缩依据 语音信号中存在的冗余 人类的听觉感知机理,2010-12-20,长沙理工大学现代通信技术
3、实验室,信号冗余,采样数据之间的相关 8kHz速率时,相邻样值相关系数高达0.85 周期相关: 浊音的准周期性 幅度的非均匀分布 小幅度概率高,信息集中在低功率 语音间隙的存在 声道的形状及其变化速率有限,2010-12-20,长沙理工大学现代通信技术实验室,听觉感知机理,人耳对不同频段的声音敏感度不同 低频比高频更敏感 人耳对语音信号的相位不敏感 人耳有掩蔽效应(masking effect) 强音抑制弱音,2010-12-20,长沙理工大学现代通信技术实验室,语音编码的极限速率,语音最基本元素-音素:大约128256个 通常说话速度:每秒平均发10个音素 信息率: I=log2(256)1
4、0bps=80bps 把发音看成是以语音速率传送,则语音编码的极限速率为80bps 从数字化标准的编码速率64kbps,到极限速率80bps之间的距离,对于理论研究和实践有着极大的吸引力,2010-12-20,长沙理工大学现代通信技术实验室,压缩编码方法分类,波形编码 原理简单,失真小 数码率高 参数编码 数码率低 音质较差,复杂度高 混合编码 较低的比特率上获得较高的语音质量,2010-12-20,长沙理工大学现代通信技术实验室,语音信号压缩编码的评价系统,语音质量 (1)广播级: 宽带(0-7000Hz)高质量的语音,感觉不出噪声存在 (2)网络或电话级: 200Hz-3200Hz,信噪比
5、大于30db。 (3)通信级: 完全可以听懂,但和长途电话相比,有明显失真。 (4)合成级: 80%-90%可懂度,音质较差,听起来像机器讲话,失去了讲话者的个人特征,2010-12-20,长沙理工大学现代通信技术实验室,语音信号压缩编码的评价指标,编码质量 MOS(Mean Opinion Score) 编码速率 适当选取 编解码复杂度 不影响实时处理 编解码时延 不能超过100ms 若超过必须采取回声抵消或回声抑制等措施,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景 国内外研究现状 常用编码算法简介,2010
6、-12-20,长沙理工大学现代通信技术实验室,ITU-T的正式标准,G.711(1972) 64kbps PCM 用于固网 G.721(1984) 32kbps ADPCM 用于卫星、海缆、VRC G.728(1992) 16kbps LD-CELP 低延迟-码激励线性预测 无绳电话、SCSC卫星、海事卫星、DSI设备、录音、移动系统等 G.729(1996) 8kbps CS-ACELP(共轭结构-代数数码激励线性预测技术) 可与32kbps的ADPCM同质量 用于个人移动通信、低C/N卫星、高质量移动无线通信,分组语音 G.722.2 AMR-ACELP(自适应多速率) 用于WCDMA和T
7、D-SCDMA系统,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,现状,主流:CELP 4.8kbps的数码率上获得较高质量的语音,2010-12-20,长沙理工大学现代通信技术实验室,发展方向,中低速率的语音编码的实用化 降低复杂度 减少时延 提高抗干扰、抗噪声能力 进一步降低编码速率 目前5-6kbps的速率-较高质量重建语音 目标4kbps得到短时延、高质语音,2010-12-20,长沙理工大学现代通信技术实验室,发展方向,中长延时编码 400-1200bps得到高质语音 新算法 正弦变换编码(STC) 混合激励线性预测编码(
8、MELPC) 时频域插值编码(TFI) 基音同步激励线性预测编码(PSELP) 新分析技术 非线性预测 多精度时频分析 高阶统计分析,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景 国内外研究现状 常用编码算法简介 波形编码技术 参数编码技术,2010-12-20,长沙理工大学现代通信技术实验室,一、PCM编码,PCM:Pulse Coded Modulation 抽样:8000Hz 量化:非均匀A律87.6/13折线压扩特性 编码:8位码 极性码:第1位 段落码:第2-3位 段内码:第4-7位,2010-12-20,长沙理工大学现代通信技术实验室,二、DPCM编码,
9、差分PCM编码 对相邻样本的差进行PCM编码 由于样本差值的动态范围远小于样本动态范围,因此达到相似性能可以减小编码位数 技术实现关键问题 编码位数的选取 预测器系数选取:LMS,2010-12-20,长沙理工大学现代通信技术实验室,DPCM框图,2010-12-20,长沙理工大学现代通信技术实验室,DPCM(含预测器内部结构,2010-12-20,长沙理工大学现代通信技术实验室,三、ADPCM,自适应DPCM 自适应预测系数调整 自适应编码位数调整 技术实现关键 自适应预测器 自适应量化器,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实
10、验室,2010-12-20,长沙理工大学现代通信技术实验室,内容提要,课题背景 国内外研究现状 常用编码算法简介 波形编码技术 参数编码技术,2010-12-20,长沙理工大学现代通信技术实验室,语音生成机构,声源: 声带 共鸣机构: 声道(鼻腔、口腔与舌头) 放射机构: 嘴唇或鼻孔,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,2010-12-20,长沙理工大学现代通信技术实验室,语音产生机理,浊音 气流通过声门时,声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流
11、,激励声道产生浊音 轻音 声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分产生湍流就产生清音 爆破音 声道完全闭合的情况下突然释放产生爆破音,2010-12-20,长沙理工大学现代通信技术实验室,语音信号产生模型,2010-12-20,长沙理工大学现代通信技术实验室,清音/浊音示意图,2010-12-20,长沙理工大学现代通信技术实验室,a1,语音输出x(n,线性 预测 分析 基音频率 清/浊音判别,参数 合成,a2,ap,基音频率,输入语音x(n,清/浊音标志,G,2010-12-20,长沙理工大学现代通信技术实验室,模型中的参数,清浊音判决 基音周期 时变滤波器 增益常数G 数字滤波
12、器参数ai 特点:随时间缓慢变化,2010-12-20,长沙理工大学现代通信技术实验室,优点,能够用线性预测分析方法对滤波器参数ai和增益常数G进行非常直接和高效的计算,2010-12-20,长沙理工大学现代通信技术实验室,LPC模型阶数p的选择,保证有足够的极点模型化声道响应的谐振结构 通常10kHz时有5个共振峰,一对极点对应一个共振峰,取p=10 弥补鼻音中存在的零极点和其他因素的偏差 取p=1214,2010-12-20,长沙理工大学现代通信技术实验室,二,LPC-10编码器,美国确定LPC-10作为2.4kb/s速率上的推荐编码形式,用于第三代保密电话中 发送端,原始语音信号采用8k
13、Hz采样,然后每180个采样值分为一帧(22.5ms),提取语音特征参数并加以编码传送。 每帧总共编码为54bits,每秒传输44.4帧,因此总传输速率为2.4kb/s,2010-12-20,长沙理工大学现代通信技术实验室,s(n,采样 (8kHz,基音检测 (AMDF,清/浊音 检测,预加重,线性 预测分析,反射系数,增益G,参数编码,c(n,LPC-10编码器发送端,2010-12-20,长沙理工大学现代通信技术实验室,预加重,提高语音谱中的高频共振峰,使语音频谱较为平滑,从而提高谱参数估计的精确度 预加重滤波器的传递函数为,2010-12-20,长沙理工大学现代通信技术实验室,基音周期,利用短时平均幅度差函数(AMDF)计算,2010-12-20,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年被动式超低能耗建筑技术原理与建筑节能产业可持续发展研究报告
- 中学生青春期健康教育工作总结
- 浅谈初中信息技术课堂教学现状与对策
- 从市场需求到产品创新的智能场景生成引擎研究报告
- 企业如何利用边缘计算征信技术提升竞争力
- 高校体育专业学生户外实践课程中期报告
- 环保型电动车技术分析
- 超感觉互动科技行业的深度解读与市场洞察
- 智能制造行业创新与发展策略研究报告
- 光伏电站生态监测系统:如何把握野生动物监测的绿色机遇
- DB32T3795-2020企事业单位和工业园区突发环境事件应急预案编制导则
- 500字作文标准稿纸A4打印模板-直接打印
- 高中数学《函数的概念及其表示》大单元专题教学设计
- 第09讲醛酮(教师版)-高二化学讲义(人教2019选择性必修3)
- 巡回医疗工作总结
- 高血压 糖尿病 健康宣教
- 国开电大软件工程形考作业3参考答案
- 食堂检查燃气安全培训记录
- 河南近10年中考真题道德与法治2014-2023年含答案
- 山姆配送服务流程
- 湖南省长郡中学、雅礼中学等四校2024届高一数学第二学期期末调研试题含解析
评论
0/150
提交评论