音频基础知识及编码原理_第1页
音频基础知识及编码原理_第2页
音频基础知识及编码原理_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、根本概念比特率:表示经过编码压缩后的音频数据每秒钟需要用多少个比特来表示,单位常为kbps。响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采集多少个样本。Nyquist 采样定律:采样率大于或等于连续信号最高频率重量的2 倍时,采样信号可以用来完善重构原始连续信号。二、常见音频格式WAV 格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows 平台及其应用程序广泛支持,

2、压缩率低。MIDIMusical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交 输的协议,可以模拟多种乐器的声音。MIDI 文件就是MIDI 格式的文件,在MIDI 文件中存储的是一些指令。把这些指令发送给声卡,由声卡依据指令将声音合成出来。MP3全称是MPEG-1 Audio Layer 31992年合并至MPEG标准中。MP3能够以高音质、低采样率对数字音频文件进展压缩。应用最普遍。MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于C

3、oding 科技公司所特有的解码技术,二是由MP3 的专利持有者法国汤姆森多媒体公司和德国Fraunhofer 集成电路协会共同争辩的一项译码技术MP3Pro 可以在根本不转变文件大小的状况下改善原先的MP3 音乐音质。它能够在用较低的比特率压缩音频文件的状况下,最大程度地保持压缩前的音质。MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于Coding 科技公司所特有的解码技术,二是由MP3 的专利持有者法国汤姆森多媒体公司和德国Fraunhofer 集成电路协会共同争辩的一项译码技术MP3Pro 可以在根本不转变文件大小的状况下改善原先的MP3 音乐音质。它能够在

4、用较低的比特率压缩音频文件的状况下,最大程度地保持压缩前的音质。WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA 格式是以削减数据流量但保持音质的方法来到达更高的压缩率目的,其压缩率一般可以到达1:18。此外,WMA还可以通过DRMDigitalRightsManagement保护版权。RealAudio是由Real Networks音频信息,尤其是在网速较慢的状况下,仍旧可以较为流畅地传送数据,因此RealAudio 主要适用于网络上的在线播放。现在的RealAudio文件格式主要有RA(RealAudio)、RMRealMedia,RealAud

5、io G2、RMX(RealAudio Secured)等三种,这些文件的共同性在较宽阔的听众获得较好的音质。Audible 拥有四种不同的格式:Audible1、2、3、4。Audible 网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种Audible 专用音频格式中的一种1、2 和 3 承受不同级别的语音压缩,而格式4 承受更低的采样率和MP3 一样的解码方式,所得到语音吐辞更清楚,而且可以更有效地从网上进展下载。Audible 所承受的是他们自己的桌面播放工具,这就是Audible Manager,使用这种播放器就可以播放存放在PC 或者是传输到便携式播放器上的Audi

6、ble格式文件AAC AAC 是由Fraunhofer IIS-A、杜比和AT&T 共同开发的一种音频格式,它是MPEG-2 标准的一局部。AAC 所承受的运算法则与MP3 的运算法则有所不同,AAC 通过结合其他的功能 来提高编码效率。AAC 的音频算法在压缩力量上远远超过了以前的一些压缩算法比方MP3 等48 个音轨、15 个低频音轨、更多种采样率和比特率、多种语言的兼容力量、更高的解码效率。总之,AAC可以在比MP330%的前提下供给更好的音质。Ogg Vorbis 是一种的音频压缩格式,类似于MP3 等现有的音乐格式。但有一点不同的是,它是完全Vorbis 是这种音频压缩机制的名字,而

7、Ogg 则是一个打算的名字,该意图VORBIS 也是有损压缩,但通过使用更加先进的声学模型去削减损失,因此,同样位速率(Bit Rate)编码OGGMP3相比听起来更好一些。APE 是一种无损压缩音频格式,WAV文件的一半.12 .FLAC即是Free Lossless Audio Codec其特点是无损压缩。三、音频编码根本原理语音编码致力于:降低传输所需要的信道带宽,同时保持输入语音的高质量。语音编码的目标在于:设计低简单度的编码器以尽可能低的比特率实现高品质数据传输。静音阈值曲线:只在安静环境下,人耳在各个频率能听到声音的阈值。临界频带由于人耳对不同频率的解析度不同,MPEG1/Audi

8、o 22khz 内可感知的频率范围,依不同编码层,不同取样频率,划分成 2326 个临界频带。以下图列出抱负临界频带的中心频率与频宽。图中可看到,人耳对低频的解析度较好。5频域上的掩蔽效应:幅值较大的信号会掩蔽频率相近的幅值较小的信号,如以下图:2SPsound pressure 较大的声音会掩蔽SPLpre-masking和后向掩蔽(post-masking),post-masking 的时间会比较长,约是pre-masking 10 倍。时域遮挡效应有助于消退前回音。四、编码根本手段量化和量化器 化器有:均匀量化器,对数量化器,非均匀量化器。量化过程追求的目标是:最小化量化误差,并尽量减低

9、量化器的简单度这2 者本身就是一个冲突。均匀量化器:最简洁,性能最差,仅适应于 语音。对数量化器:比均匀量化器简单,也简洁实现,性能比均匀量化器好。cNon-uniform 量化器:依据信号的分布状况,来设计量化器。信号密集的地方进展细致的量化,稀疏的地方进展粗略量化。语音编码器语音编码器分为三种类形:a波形编器 ;b声码器 ;c混合编码器。 质量的样值并且消耗较高的比特率。 而声码器 vocoder不会再生原始波形。这组编码器 会提取一组参数 ,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不够好。混合编码器,它融入了波形编码器和声器的特长。波形编码器波形编码器的设计常独立于信号

10、。所以适应于各种信号的编码而不限于语音。1 时域编码PCM:pulsecodemodulation,是最简洁的编码方式。仅仅是对信号的离散和量化,常承受对数量化。DPCM:differential pulse code modulation,差分脉冲编码,只对样本之间的差异进展编码。前一个或多个样本用来推测当前样本值。用来做推测的样本越多,推测值越准确。真实值和推测值之间的差值叫残差,是编码的对象。ADPCadaptive differential pulse code modulatioDPCM残差更小,压缩效率更高。2频域编码频域编码是把信号分解成一系列不同频率的元素,并进展独立编码。as

11、ub-band coding 器(BPF)组把原始信号分割为假设干(例如m 个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率四周,分别经过BPF(共m 个)之后,再以规定的速率(奈奎斯特速率)对各子带输出信号进展取样,并对取样数值进展通常的数字编码,其设置m 路数字编码器。将各路数字编码信号送到多路复用器,最终输出子带编码数据流。对不同的子带可以依据人耳感知模型,承受不同量化方式以及对子带安排不同的比特数。btransform coding:DCT 编码。6 声码器channel vocoder:利用人耳对相位的不敏感。vocoder:能有效地处理合成信号。formant vocoder:以用语音信号的绝大局部信息都位于共振峰的位置与带宽上。linearlinear predictive vocoder:最常用的声码器。7 混合编码器波形编码器试图保存被编码信号的波形,能以中等比特率32kbps供给高品质语音,但 2 者的优点。RELP:在线性推测的根底上,对残差进展编码。机制为:只传输小局部残差,在承受端重构全部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论