版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024/1/25语音编码技术2024/1/25学习目标学习完本课程,您应该能够:掌握语音编码的根本概念掌握语音编码的分类及原理了解语音编码质量的评定了解常用的语音编码算法2024/1/25课程内容
第一节语音编码技术介绍第二节移动通信系统中的语音编码技术2024/1/25第一节语音编码技术介绍语音编码技术介绍波形编码技术参数编码技术混合编码语音编码质量的评定2024/1/25语音编码技术介绍信源编码是指利用信源的统计特性,解除信源的相关性,去掉信源多余的冗余信息,以到达压缩信源信息率,提高系统有效性的目的。语音编码为信源编码,语音信号是模拟信号,语音的编解码就是将语音的模拟信号转换为二进制数字信号,到了接收端,再将收到的数字信号复原为模拟语音,同时语音编码的作用还有减少信源冗余、解除信源相关性,压缩话音码率、提高信源有效性语音编码技术有波形编码、参数编码和介于两者之间的混合编码三大类,下面简单介绍这三类编码技术。2024/1/25第一节语音编码技术介绍语音编码技术介绍
波形编码技术参数编码技术混合编码语音编码质量的评定2024/1/25波形编码技术波形编码技术是通过对语音波形进行采样、量化,然后用二进制码表示出来。波形编码的根本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是其反过程,将收到的数字序列经过解码和滤波恢复成模拟信号。由于这种编码系统保持了信号原始样值的细节变化,从而保存了信号的各种过渡特征,所以波形编码的语音质量一般较高。但是由于波形编码没有充分利用语音信号的冗余特性,使其压缩比不大,造成只有在较高速率上才能得到满意的语音质量,当编码速率降低到16Kbps以下时,编码语音质量将迅速下降。脉冲编码调制〔PCM〕和增量调制〔ΔM〕,以及它们的各种改进型自适应增量调制〔ADM〕、自适应差分编码〔ADPCM〕等,都属于波形编码技术。2024/1/25第一节语音编码技术介绍语音编码技术介绍
波形编码技术参数编码技术混合编码语音编码质量的评定2024/1/25参数编码技术参数编码技术利用人的发声机制,仅传送反映话音波形产生的主要变化参量〔主要是指表征声门振动的鼓励参数和表征声道特性的声道参数〕,在接收端根据发声机制,由传送来的变化参量人工合成话音。参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差异。这种编码技术可实现低速率语音编码,比特率可压缩到2~4.8Kbps,甚至更低,但语音质量只能到达中等,特别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码〔LPC〕及其他各种改进型都属于参量编码。2024/1/25第一节语音编码技术介绍语音编码技术介绍
波形编码技术参数编码技术混合编码语音编码质量的评定2024/1/25混合编码混合编码是波形编码和参数编码两种系统优点的结合:既利用了语音生成模型,通过对模型中的参数进行编码,减少了波形编码对象的动态范围或者数目,又使得编码的过程产生接近原始语音波形的合成语音,以保存语音的各种自然特征,提高了合成语音的质量。利用混合编码技术能够在4-16Kbps速率上能够得到高质量的合成语音。多脉冲鼓励线性预测编码〔MPLPC〕,规划脉冲鼓励线性预测编码〔KPELPC〕,码本鼓励线性预测编码〔CELP〕等都是属于混合编码技术。很显然,混合编码是适合于数字移动通信的语音编码技术。2024/1/25第一节语音编码技术介绍语音编码技术介绍
波形编码技术参数编码技术混合编码语音编码质量的评定2024/1/25语音编码质量的评定如何评价语音编码质量也成为语音编码领域所研究的一个重要课题。对此多年来人们提出了许多方法,归纳起来大致可分为两类,即客观评定方法和主观评定方法。客观评定方法用客观测量的手段来评价语音编码的质量,常用的方法有信噪比、加权信噪比、平均分段信噪比等。它们都是建立在度量均方误差的根底上,其特点是计算简单,但不能完全反映人对语音质量的感觉。这个问题对于速率为16Kbit/s以下的中、低速率语音编码尤为突出,因此主要适用于速率较高的波形编码类型。主观评定方法符合人类听话时对语音质量的感觉,因而目前得到广泛应用。最主要的主观评定方法是主观评定等级〔SubjectiveOpinionScale〕,或称平均评定得分〔MeanOpinionScore,缩写MOS〕。MOS得分采用五级评分标准,其方法是,由数十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分。2024/1/25主观评定等级表质量等级分数收听注意力等级优5可完全放松,不需要注意力良4需要注意,但不需明显集中注意力满意(正常)3中等程度的注意力差2需要集中注意力劣1即使努力去听,也很难听懂2024/1/25常见的语音编码方案〔1/2〕编码类型算法名称数据速率ITU标准编号应用MOS质量评分波形编码PCM均匀量化64kb/s
公共网
ISDN
配音4.0~4.5μ(A)μ(A)64kb/sG.711APCM自适应量化
DPCM差值量化32kb/sG.721ADPCM
SB-ADP
CM自适应差值量化
子带-自适应
差值量化64kb/s5.3kb/s6.3kb/sG.722
G.723参数编码LPC线性预测编码2.4kb/s
保密话声2.5~3.52024/1/25常见的语音编码方案〔2/2〕编码类型算法名称数据速率ITU标准编号应用MOS质量评分混合编码CELPC码激励LPC4.8kb/s
移动通信4.0~3.7VSELP矢量和激励LPC8kb/s
语音邮件RPE-LTP长时预测规则码激励13.2kb/s
ISDN移动通信
LD-CEL
PMPEG低延时码激励LPC多子带
感知编码16kb/s
128kb/sG.728
G.729CD5
AC-3感知编码
音响52024/1/25课程内容
第一节语音编码技术介绍第二节移动通信系统中的语音编码技术2024/1/25第二节移动通信系统中的语音编码技术移动通信系统对语音编码技术的要求移动通信系统中语音编码算法介绍2024/1/25移动通信对数字语音编码的要求速率较低,纯编码速率应低于16kbit/s;在一定编码速率下音质应尽可能高;编码时延应较短,控制在几十毫秒以内;在强噪声环境中,算法应具有较好的抗误码性能,以保持较好的话音质量;算法复杂程度适中,易于大规模集成。2024/1/25第二节移动通信系统中的语音编码技术移动通信系统对语音编码技术的要求
移动通信系统中语音编码算法介绍2024/1/25GSM系统的语音编码系统GSM的语音编码系统采用规那么码鼓励长期预测编码算法〔RPE-LTP〕。以下图为RPE-LTP算法的编解码原理图:2024/1/25RPE-LTP算法RPE-LTP算法的对象是窄带语音〔300~3400Hz〕经8000Hz采样进行13比特均匀量化后的数字信号。每20ms〔160样点〕为一帧。每帧比特数为2080,编码后成为大小为260比特的净话音数据块,所以编码后的速率为260bit/20ms=13kbit/s。我们这里介绍的是GSM中全速率〔FR〕的编码方式,除此之外还有半速率〔HR〕和增强型全速率〔EFR〕等编码方式。2024/1/25IS-96CDMA系统的语音编码系统IS-96CDMA系统的语音编码系统采用QCELP〔QualcommCodeExcitedLinearPrediction〕方案,即码鼓励线性预测的可变速率混合编码方案,该方案为美国Qualcomm通信公司的专利语音编码算法,其特点为:基于线性预测编码;使用矢量码表替代简单线性预测中产生的浊音准周期脉冲的脉冲位置和幅度,即使用码表矢量量化差值信号;可变速率:采用话音激活检测〔VAD〕技术,在话音间隙期,根据不同信噪比背景分别选择9.6kbit/s,4.8kbit/s,2.4kbit/s和1.2kbit/s4个档次〔1,1/2,1/4,1/8〕的传输速率,它可以使平均速率比最高速率下降两倍以上;参量编码的主要参量分为三类,且每帧不断更新。2024/1/25典型的QCELP方案实现框图2024/1/25QCELP方案的实现在首先对模拟话音按8KHz取样;其次按照20ms划分为一个话音帧,每一帧会有160个样点值;将160个样点值生成3个参数子帧〔滤波参数,音调参数,码表参数〕;3个参数不断更新,更新后参数按一定帧结构送至接收端,即完成整个语音编码过程。2024/1/25WCDMA中的语音编码AMR1999年初,3GPP(The3rdGenerationPartnershipProject)采纳了由Ericsson,Nokia和Siemens提出的AMR标准(AdaptiveMulti-RateStandard)作为第三代移动通信中的语音编码器的标准。AMR提供了多达8种的编码速率,而且每种速率都有了不同的容错度。AMR语音编码器拥有12.2K到4.75K不同的编码速率:一方面是为了提供不同无线传愉环境下不同容错率的编码器,从而使系统中语音质量和系统容量的折衷更加平稳、灵活,更加完美;另一方面也是为了满足系统可能的特殊要求,AMR有8种固定的信源速率模式,从4.75Kbit/s到12.2Kbit/s,2024/1/25AMR语音编码编码模式信源编码比特率AMR12212.20kbit/s(GSMEFR)AMR10210.20kbit/sAMR7957.95kbit/sAMR7407.40kbit/s(IS-641)AMR6706.70kbit/s(PDC-EFR)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏徐州市泉山国有资产投资经营有限公司投后管理岗招聘考试(第二轮)考试备考试题及答案解析
- 2026福建泉州幼儿师范高等专科学校招聘15人考试备考题库及答案解析
- exo介绍英语教学课件
- 2026山东淄博市淄川区事业单位招聘教师20人考试参考试题及答案解析
- 2026湖南常德市西洞庭食品工业园投资开发有限公司招聘人员笔试备考试题及答案解析
- 德阳经济技术开发区第四幼儿园2026年春期面向社会 公开招聘“两自一包”非在编教职工招聘考试参考试题及答案解析
- 2026河北兴冀人才资源开发有限公司外包人员招聘49人考试备考试题及答案解析
- 2026重庆智汇人才开发有限公司永川分公司招聘2人考试备考题库及答案解析
- 2025-2026广东中山南区街道招聘公办幼儿园临聘教职工7人考试参考试题及答案解析
- 2026中石油新疆销售有限公司博州分公司招聘4人考试备考题库及答案解析
- 2026年国有企业金华市轨道交通控股集团招聘备考题库有答案详解
- 2025年电子工程师年度工作总结
- 港口安全生产管理模版
- 健康中国2030规划纲要考试题库含答案全套
- 产房与儿科交接登记表
- 韩国语topik单词-初级+中级
- 克林顿1993年就职演讲+(中英文)
- 四川省房屋建筑工程和市政基础设施工程竣工验收报告
- 商业伦理与会计职业道德(第四版)第五章企业对外经营道德规范
- DB13 5161-2020 锅炉大气污染物排放标准
- 安全隐患排查工作检查表
评论
0/150
提交评论