各种音频编码方式的对比

上传人：y*** IP属地：天津上传时间：2021-05-25 格式：DOCX 页数：12 大小：22.65KB 积分：18 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、各种音频编码方式的对比作者 : 日期：各种音频编码方式的对比内容简介：文章介绍了 M 编码、 WMA 编码、 A PCM 编码、 LPC 编码、 P3 编码、 AC 编码、 CEL 编码等，包括优缺点对比和主要应用领域。P编码（原始数字音频信号流） ?类型 :A do制定者 :TU- 所需频宽： 11. Kbps ?特性：音源信息完整，但冗余度过大优点：音源信息保存完整 ,音质好缺点 :信息量大，体积大，冗余度过大 ?应用领域 : op?版税方式 : e?备注：在计算机应用中 ,能够达到最高保真水平的就是 PCM 编码 ,被广泛用于素材保存及音乐欣赏 ,、DVD 以及我们常见的文件中均有

2、应用。因此， PCM 约定俗成了无损编码 ,因为 PC代表了数字音频中最佳的保真水准,并不意味着 PCM 就能够确保信号绝对保真， PM 也只能做到最大程度的无限接近。要算一个PC音频流的码率是一件很轻松的事情，采样率值采样大小值声道数 bps 。一个采样率为 44.1 H，采样大小为 1 t，双声道的 PC 编码的 WAV 文件,它的数据速率则为 .1K162 =141 .2Kbs。我们常见的 Audio CD 就采用了 M 编码，一张光盘的容量只能容纳分钟的音乐信息。WMA（Win ows Medi Audio）类型： ud o 制定者：微软公司所需频宽： 32 2k ps（压

3、缩 01倍）特性：当 B t ate 小于 12K 时,A 几乎在同级别的所有有损编码格式中表现得最出色,但似乎 128k是 W一个槛，当 Bitrate 再往上提升时，不会有太多的音质改变。 ?优点:当 itrate 小于 128K 时,WMA 最为出色且编码后得到的音频文件很小。?缺点:当Bitrate 大于 1K 时,WMA 音质损失过大。 WA标准不开放 ,由微软掌握。 ?应用领域 :vop?版税方式：按个收取 ?备注：WMA 的全称是 Wi dws edia Audio ，它是微软公司推出的与 P格式齐名的一种新的音频格式。由于WMA 在压缩比和音质方面都超过了 MP3 ，更是远

4、胜于 RA（Real A o）,即使在较低的采样频率下也能产生较好的音质，再加上 WMA 有微软的 iow ea Paer 做其强大的后盾 ,所以一经推出就赢得一片喝彩。ADC（自适应差分 PCM） ?类型： Aud制定者 :I -T?所需频宽 : K p特性： ADP M（ adaptive ffr e pul e coe o ulation ）综合了 APCM 的自适应特性和 DPCM 系统的差分特性，是一种性能比较好的波形编码。?它的核心想法是：利用自适应的思想改变量化阶的大小，即使用小的量化阶（s ep size）去编码小的差值 ,使用大的量化阶去编码大的差值；使用过去的样

5、本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。?优点 :算法复杂度低 ,压缩比小（CD 音质 40kbps ）,编解码延时最短（相对其它技术）?缺点：声音质量一般 ?应用领域： oip版税方式： ee?备注: DPCM （ PCM Ad ptie i feren i l Pulse C de Md tion）,是一种针对 16bit （或者更高 ?）声音波形数据的一种有损压缩算法 , 它将声音流中每次采样的 16b t 数据以 4bi 存储, 所以压缩比 1： 4而压缩/解压缩算法非常的简单 , 所以是一种低空间消耗 ,高质量声音获得的好途径。 PC（L

6、near Pred cti e o i g，线性预测编码）?类型： Audio制定者 :?所需频宽： Kbp-4.K s特性 :压缩比大，计算量大，音质不高 ,廉价 ?优点：压缩比大 ,廉价缺点：计算量大 ,语音质量不是很好，自然度较低 ?应用领域： ip?版税方式 :Free备注 :参数编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参数 ,并将其变换成数字代码进行传输。译码为其反过程，将收到的数字序列经变换恢复特征参量, 再根据特征参量重建语音信号。具体说 ,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性，但重建信号的波形同原语音

7、信号的波形可能会有相当大的差别。如：线性预测编码（LC）及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s-4 8Kb t/s,甚至更低，但语音质量只能达到中等，特别是自然度较低。EP（Co E cited Linear red cton 码激励线性预测编码）类型： Audio ?制定者：欧洲通信标准协会（ ETSI ）?所需频宽： 4 16 ps 的速率 ?特性：改善语音的对误差信号进行感觉加权，利用人类听觉的掩蔽特性来提高语音的主观质量 ; 用分数延迟改进基音预测，使浊音的表达更为准确，尤其改善了女性语音的质量；? 使用修正的MSPE 准则来寻找 “最佳”的延迟，使得

8、基音周期延迟的外形更为平滑； ?根据长时预测的效率，调整随机激励矢量的大小 ,提高语音的主观质量 ; 使用基于信道错误率估计的自适应平滑器, 在信道误码率较高的情况下也能合成自然度较高的语音。结论 : E P 算法在低速率编码环境下可以得到令人满意的压缩效果；?使用快速算法 ,可以有效地降低CELP 算法的复杂度，使它完全可以实时地实现 ; ELP 可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境，尤其是背景噪声存在时更为重要。优点：用很低的带宽提供了较清晰的语音?缺点： -应用领域： voip ?版税方式 :Fre?备注： 1999 年欧洲通信标准协会（ I）推出了

9、基于码激励线性预测编码（CE P）的第三代移动通信语音编码标准自适应多速率语音编码器（AMR），其中最低速率为 4.75b/s, 达到通信质量。 ELP 码激励线性预测编码是 Code Excit d Linear Predi ti的缩写。 C LP 是近 10 年来最成功的语音编码算法。 LP 语音编码算法用线性预测提取声道参数，用一个包含许多典型的激励矢量的码本作为激励参数 ,每次编码时都在这个码本中搜索一个最佳的激励矢量, 这个激励矢量的编码值就是这个序列的码本中的序号。EP 已经被许多语音编码标准所采用 ,美国联邦标准 FS 01就是采用 CELP 的编码方法 ,主要用于高质

10、量的窄带语音保密通信。 E P（Cod -Exci ed Linear Peict n）这是一个简化的 P 算法,以其低比特率著称（ 8 0-9600 bs），具有很清晰的语音品质和很高的背景噪音免疫性。 C LP 是一种在中低速率上广泛使用的语音压缩编码方案。M G- ui lyr 1类型 :Audio制定者 :MEG?所需频宽： 384 b s（压缩 4 倍）特性 :编码简单 ,用于数字盒式录音磁带 ,声道， VCD 中使用的音频压缩方案就是 M EG-1 层。优点 :压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高 ,编码延时相应增加。可以达到 “完全透明 ”

11、的声音质量（ EB音质标准）?缺点 :频宽要求较高应用领域： oi 版税方式 :Free备注 :MPEG-1 声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次： ?-层1（La er ）:编码简单 ,用于数字盒式录音磁带 ?-层（L er 2） :算法复杂度中等，用于数字音频广播（AB ）和 VCD 等-层 3（Lay ） :编码复杂，用于互联网上的高质量声音的传输，如M音乐压缩 10 倍MUIA（MEG-1 audio ler ,即 MP）类型： udo?制定者:MPG?所需频宽:25619bps（压缩 68 倍）特性:算法复杂度中等，用于数字音频广播（DA

12、B）和 CD 等,2声道，而 MUS C由于其适当的复杂程度和优秀的声音质量，在数字演播室、D 、 VB 等数字节目的制作、交换、存储、传送中得到广泛应用。 ?优点 :压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高 ,编码延时相应增加。可以达到 “完全透明 ”的声音质量（ BU 音质标准）缺点 :应用领域 :voi ?版税方式： Fre ?备注:同 MP G-1 a io layer P（ MP G-1 a i lay r ）类型 :Au o?制定者： MPE所需频宽 :128 112kbps （压缩 101 倍）特性：编码复杂 ,用于互联网上的高质量声音的传

13、输 ,如 MP3 音乐压缩 1倍 ,2 声道。 3 是在综合 USIC M 和 AS E的优点的基础上提出的混合压缩技术，在当时的技术条件下，MP3 的复杂度显得相对较高，编码不利于实时，但由于M在低码率条件下高水准的声音质量, 使得它成为软解压及网络广播的宠儿。 ?优点：压缩比高，适合用于互联网上的传播?缺点 :在 12 KBitrate 及以下时，会出现明显的高频丢失应用领域： o p版税方式 :Fr ?备注：同 PEG-1 audio layer 1MPEG-2 audio l ye ?类型： ud o?制定者:MPE 所需频宽 :与 MPE -1 层 1，层,层 3相同特性： MP

14、EG 2的声音压缩编码采用与 MPEG 1声音相同的编译码器 ,层1、层 2和层3的结构也相同，但它能支持 1 声道和 7.1 声道的环绕立体声。 ?优点 :支持 5.1 声道和 7.声道的环绕立体声 ?缺点 :-应用领域 :v p版税方式：按个收取 ?备注:MPEG 2的声音压缩编码采用与 MPEG- 声音相同的编译码器，层 1、层 2 和层的结构也相同，但它能支持 5. 声道和 7.1 声道的环绕立体声。 AC（Adv ed Audio Coding ，先进音频编码）类型:Audio ?制定者： MP ?所需频宽： 96-128 kp?特性:AC 可以支持 1到4路之间任意数目

15、的音频声道组合、包括 5路低频效果声道、配音/多语音声道，以及 5路数据。它可同时传送 6 套节目，每套节目的音频及数据结构可任意规定。 ?AAC 主要可能的应用范围集中在因特网网络传播、数字音频广播 ,包括卫星直播和数字 M 、以及数字电视及影院系统等方面。 AAC 使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有 48 个主要音频通道， 16 个低频增强通道 ,1 个集成数据流 , 1 个配音， 16 种编排。优点 :支持多种音频声道组合，提供优质的音质?缺点： -应用领域： vo ?版税方式 :一次性收费备注 :A于 197 年形成国际标准 I 3 1 -。先进音频编

16、码（ dva ced Audi Codi g-A C）开发成功，成为继 MPEG 2 音频标准（ISOIE1818-3 ）之后的新一代音频压缩标准。 ?在 M EG-2 制订的早期，本来是想将其音频编码部分保持与MEG- 兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地，这个标准是不兼容 MP G-1 的，因此被称为 ME 2AAC 。换句话说，从表面上看，要制作和播放AAC ，都需要使用与MP3 完全不同的工具。HR类型： A dio制定者：飞利浦 ?所需频宽： 8Kbp 特性 :以增加 GSM 网络容量为目的 ,但是会损害语音质量 ;由

17、于现在网络频率紧缺 ,一些大的运营商已经在大城市密集地带开通此方式以增加容量。?优点：系统容量大 ?缺点：语音质量差应用领域 :G M 版税方式 :按个收费备注： HR 半速率 ,是一种 GSM 语音编码方式。R类型:Ad ?制定者：飞利浦 ?所需频宽 :13Kb s?特性：是一般的 GM 手机的通信编码方式，可以获得达到 4.1 左右 Qos 的语音通信质量（国际电联规定语音通信质量 Qos 满分为 5）?优点 :语音质量得到了提高缺点：系统容量降低应用领域 :GSM版税方式 :按个收费 ?备注:FR 全速率 ,是一种 GSM 语音编码方式ER类型： Audio ?制定者 :飞利

18、浦所需频宽 :13K ps特性 :用于 GSM 手机基于全速率 13Kbps 的语音编码和发送 ,可以获得更好更清晰的语音质量（接近 Qo 4.7）需要网络服务商开通此项网络功能 ,手机才能配合实现。 ?优点：音质好 ?缺点:需要网络服务商开通此项网络功能，且系统容量降低 ?应用领域 : 版税方式：按个收费 ?备注： FR 增强型全速率 ,一种 GSM 网络语音的编码方式。GSMAMR（dpi Multi-R t）?类型:Audio ?制定者：飞利浦?所需频宽 : Kps（4. Kb s 12.2 Kb ）特性 : 可以对语音进行替换和消音 , 平滑噪音 ,支持间断式传输，对语音进行动态

19、侦查。能在各种网络条件下提供优质的语音效果。 ?优点：音质出色 ?缺点:-?应用领域 :SM ?版税方式 :按个收费?备注： SM-AS 是一种广泛使用在 PRS 和 W-CD A 网络上的音频标准。在规范 ETI M6.0中对 S -AMR 进行了定义。 AMR 语音编码是 SM2 和 WCD 的默认编码标准 , 是第三代无线通讯系统的语音编码标准。 GM-AR 标准基于 CE （代数激励线性预测）编码。它能在广泛的传输条件下提供高品质的语音效果。EVRC（EnhancedVaria l Rae oder,增强型可变速率编码器）?类型： Aio制定者 :美国 ualcomm 通信公司

20、（即高通） ?所需频宽： 8Kp或 13Kb s?特性：支持三种码率（ 9.6 Kbps, 4 8 Kbps 和 bs），噪声抑制，邮件过滤。能在各种网络条件下提供优质的语音效果。优点 :音质出色缺点 :-应用领域 :CDM ?版税方式：按个收费备注： ERC 编码广泛使用于 CDA 网络。 EV C标准遵循规范 TIA I -12 的内容。 ER编码基于 CELP（松弛码激励线性预测）标准。该编码可以以 Rate 1（ 1b /pack t）, te1/2（80 it /p cke ）或是 Rat 1/8 （ its pack t）的容量进行操作。在要求下 ,它也能产生空包（ 0 its packet）。QCELP（Qu lCom Code Exc ed near P e ict ve ，受激线性预测编码）?类型： Au io ?制定者：美国 alc mm 通信公司（即高通）所需频宽 :8k 的语音编码算法（可工作

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

各种音频编码方式的对比

文档简介

温馨提示

最新文档

评论

各种音频编码方式的对比

文档简介

温馨提示

最新文档

评论

相关文档