浅论语音编码_第1页
浅论语音编码_第2页
浅论语音编码_第3页
浅论语音编码_第4页
浅论语音编码_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 语语 音音 编编 码码 制作人制作人 :110421227 戴福山戴福山一、概述一、概述二二、语音编码的理论基础语音编码的理论基础三、语音编码技术原理及应用三、语音编码技术原理及应用四、语音编码的发展方向四、语音编码的发展方向一、概述一、概述 语音编码是将模拟语音信号数字化的手段.语音信号数字化后, 可以作为数字数据来传输、存储、或处理,因而具有一般数字信号的优点。 话音数字化的技术基本可以分为两大类: 第一类方法是在尽可能遵循原波形的前提下, 将模拟波形进行数字化编码。其中三种最常用的技术是脉冲编码调制( CP M )、差分P C M ( D P C M ) 和增量调制( M ) ; 第二

2、类方法是对模拟波形进行一定处理, 但仅对话音和收听过程中能收听到的话音部分进行编码。第二类语音数字化方法主要与用于窄带传输系统或有限容量的数字存储设备的话音编解码器有关。采用该类技术的设备一般被称为声码器( 语音编码器) 。声码器技术现在正开始展开应用, 特别是用于帧中继和IP 上等语音。 二二、语音编码的理论基础语音编码的理论基础2.1 2.1 语音编码的目的语音编码的目的 为了使信号适于处理、传输和存储, 我们需要对语音信号进行压缩,语音编码就是要在保证语音质量的前提下得到尽可能少的数据, 所以也常把语音编码叫做语音压缩编码。2.2 2.2 语音压缩编码的可行性语音压缩编码的可行性 (1)

3、语音信号中存在大量冗余信息 (2)人耳中存在“听觉掩蔽( Auditory Masking) ”效应, 三、语音编码技术原理及应用 3.1语音编码的技术分类 波形编码声码器(参数编码)混合编码语音编码技术感知编码3.1.1 3.1.1 波形编码波形编码 波形编码针对语音波形进行的, 这种方法在降低量化每个语音样本比特数的同时又保持了相对良好的语音质量.波形编码包括时域编码和频域编码。(1 1)时域编码)时域编码 时域编码主要有脉冲编码调制(PCM)、差分脉码调制(DPCM)、增量调制(M)、自适应差分脉码调制(ADPCM)、自适应增量调制(ADM)、自适应预测编码(APC)等。 (2)频域编码

4、频域编码主要方式子带编码(SBC)自适应变换编码(ATC)返回返回3.1.2 声码器(参量编码) 所谓声码器是根据发音模型, 分析并提取语音信号的特征参数, 且只传送能够合成语音信息的参数, 不需要再现原语音的波形, 由于模型参数相对于语音信号而言数据量非常小, 所以参量编码的编码率很低, 但利用这种编码方法得到的语音质量不理想。典型的声码器有谱带式、共振峰式和按线性预测分析(LPC)所组成的声码器等。图2 是线性预测编码器。返回返回3.1.3 混合编码 由于前面两类编码方法各有优缺点, 所以后来的研究者更多的是考虑如何将它们综合起来以形成一种性能更优的编码算法, 混合编码就是基于这种想法被提

5、出的。其代表是一类称之为“按分析合成” (ABS) 的方法, 采用听觉加权技术, 在闭环的基础上寻找主观意义上失真最小的激励矢量.由于采用的激励信号模型不同, 这类方法派生出多种新的编码方法,典型的方法有剩余激励线性预测编码(RELP), 多脉冲激励线性预测编码(MPC), 码激励线性预测编码(CELP)。图3为RPE-LTP编码器的原理框图。返回返回3.1.4 感知编码 大部分的编码技术还融合了人类听觉系统的心理声学原理, 即感知器编码技术。这种编码方法利用了人耳听觉的心理声学特性, 凡是人耳感觉不到的成分不编码、不传送, 从而达到降低数据量而又不影响声音质量的目的( 见图4) 。返回返回3

6、.2 语音编码标准及应用 实际应用的语音编码算法将会综合考虑各种因素, 糅合以上各类编码方法得到的, 以期得到特定条件下最佳的编码性能。经过多年的发展,目前已有多个技术标准, 并应用于不同的领域。详见下表:四、语音编码的发展方向 当前语音编码总体上有三个大的发展方向。一个方向是语音编码进一步低速率化。另一方向是变速率语音编码。当然, 还有一个发展方向就是语音不压缩。 当然, 语音编码除了上述三个总体的发展方向以外,寻找最佳的语音激励模型和对人类听觉系统机理的不断认识将是近一段时间内的基础性研究工作。 极低速率语音编码是指比特率低于2400 bit/s的语音编解码器。在保密通信、语音邮件、网络通

7、信、IP电话等领域有广泛的应用前景。特别是在信息化战场上广泛应用于单兵作战通信设备上。 变速率语音编码是指在通信过程中, 通信系统根据需要动态地调整语音编码速率, 在合成语音质量和系统容量中取得灵活的折衷, 最大限度地发挥系统的效能。在当前应用广泛、前景广阔的码分多址( CDMA )移动通信系统中, 采用的变速率语音编码算法对于系统的容量和通话质量有非常重要的影响。随着技术的成熟, 它的应用领域也越来越广阔, 不仅限于移动通信系统, 在IP电话、互联网和卫星通信中都有很好的应用前景。 不压缩语音编码主要应用于地面微波通信和光纤通信系统中。 极低速率语音编码和变速率语音编码是当前语音编码的主要发展方向。但也有一些通信系统仍然采用不压缩语音编码。这是因为目前传输带宽增长很快, 特别是光纤通信的发展, 使得传输成本大幅度下降, 为语音编码付出的费用与所节省的传输费用相比变得不合算了, 语音不压缩传输所需费用反而更低。因此这些系统就采用了不压缩的语音编码算法, 大多数直接利用PCM 编码进行传输。这样可以保证很高的语音通信质量和比较简单的通信设备, 大大地降低了通信费用。 语音编码是语音信号处理的一个重要方面, 它和通信领域联系最为密切。而语音识别、语音合成、语音增强等方面在理论和方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论