版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、读书之法,在循序而渐进,熟读而精思一、基本概念1比特率:表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,单位常 为 kbps 。2响度和强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声 音的强度而变化,但也受频率的影响。总的说,中频纯音听来比低频和高频纯音响一些。3采样和采样率:采样是把连续的时间信号,变成离散的数字信号。采样率是指每秒钟采 集多少个样本。Figure 5: 1 lie affect of amplincj. (3) thv cont*m>ou% 若。i/l aiul (I) thp *arnpld inria.Nyquist采样定律:
2、采样率大于或等于连续信号最高频率分量的2倍时,采样信号可以用来完美重构原始连续信号。二、常见音频格式1. WAV格式,是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音 频格式,被 Windows平台及其应用程序广泛支持,压缩率低。2. MIDI是Musical Instrument Digital Interface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交 换音乐信号的方式,规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声音。MIDI文件就是MIDI格式的
3、文件,在 MIDI文件中存储的是一些指令。把这些指令发送给声卡,由声卡按照指令将声音合成出来。3. MP3全称是 MPEG-1 Audio Layer 3 ,它在1992年合并至 MPEG 规范中。MP3能够以 高音质、低采样率对数字音频文件进行压缩。应用最普遍。4. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于 Coding 科技公司所特有的解码技术,二是由 MP3的专利持有者法国汤姆森多媒体公司和德国 Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的 MP3音乐音质。它能够在用较低的比特率压缩音
4、频文件的情况下,最大 程度地保持压缩前的音质。5. MP3Pro是由瑞典Coding科技公司开发的,其中包含了两大技术:一是来自于 Coding 科技公司所特有的解码技术,二是由 MP3的专利持有者法国汤姆森多媒体公司和德国 Fraunhofer集成电路协会共同研究的一项译码技术。MP3Pro可以在基本不改变文件大小的情况下改善原先的 MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大 程度地保持压缩前的音质。6. WMA (Windows Media Audio) 是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般
5、可以达到1:18。此外,WMA还可以通过 DRM ( Digital Rights Management )保护版权。7. RealAudio是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据,因此RealAudio主要适用于网络上的在线播放。现在的RealAudio文件格式主要有 RA(RealAudio)、RM(RealMedia , RealAudio G2 )、RMX(RealAudio Secured) 等三种,这些文件的共同性在于随着网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音
6、的前提下,令带宽较宽敞的听众获得较好的音质。8. Audible拥有四种不同的格式:Audible1、2、3、4。A 网站主要是在互联网上贩卖有声书籍,并对它们所销售商品、文件通过四种 A 专用音频格式中的一种 提供保护。每一种格式主要考虑音频源以及所使用的收听的设备。格式1、2和3采用不同级别的语音压缩,而格式 4采用更低的采样率和 MP3相同的解码方式,所得到语音吐辞更 清楚,而且可以更有效地从网上进行下载。Audible所采用的是他们自己的桌面播放工具,这就是Audible Manager ,使用这种播放器就可以播放存放在PC或者是传输到便携式播放器上的Audible格式文件9. AAC
7、实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运更生则与MP3的运算法则有所不同,AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力 上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达 48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。10. Ogg Vorbis 是一种新的音频压缩格式,类似于 MP3等现有的音乐格式。但有一点 不 同的是,它是完全
8、免费、开放和没有专利限制的。Vorbis是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该 计划意图设计一个完全开放性的多媒体系统。VORBIS也是有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(Bit Rate)编码的OGG与MP3相比听起来更好一些。11. APE是一种无损压缩音频格式,在音质不降低的前提下, 大小压缩到传统无损格式WAV文件的一半.12. .FLAC即是Free Lossless Audio Codec的缩写,是一套著名的自由音频无损压缩编码,其特点是无损压缩。三、音频编码基本原理语音编码致力于:降低传输所需要的信道带宽,同时保持输入语音的高质量
9、。语音编码的目标在于:设计低复杂度的编码器以尽可能低的比特率实现高品质数据传输。1静音阈值曲线:只在安静环境下,人耳在各个频率能听到声音的阈值。10090ao70GQ5030题100*1011IIIII|1V11 1 4| 1 4 1II11flIIII1IltI1|i|1 | | I|A|1111111111III一,V11V1t11A ,!-上 - -JU!», J 一 L,IV 1 11 1 111J111 q I V VV11VV1 1 1 I>i111111tini1Iii il i » Iili>iiv I i i1V111|IV1|iII141W
10、flV111IIH11J_L_L_1_ _ _L_,_L上_ _ _I _I_L_L上J_11111111I1111I1A1I111I1I1ft1111|Ml1|111|1|Al f1|fl|1|11liII1IdIII|IIa|IH IIH|1Ii|Ift1-L J-LJ J JI- - - L - - 1-L.LJ.一,iniiiiiiiv1ii1iv a1liviviivIV1111Ml1III1111t II11111111i1V11111I1li11111V I111I1911IIV11111VV11II111|lV H11111VI11 m - i 丁' r i in- -
11、 - r i - mi-r -1 rmi.-ftlV11| M|111 | 1 1 91 11111IIV|l11iaiiII I hii111Ml sifliiiiinin!|1|9|i|11111l|1I Iil11I11111 witiir rtiitiir-r .IIII111411111111t 1V11V11111X<1t1111111111111t <111I1i11t7V1111111V11111V V1111IV11V* *:-l r-L,n tt-pr r,tftfr, .*r -ir r- r n r1 Xl 111Pli H1l>II14VW
12、1;4114V»|l1V111111H1111111A t1111hhH11Il lj 1 | | Il 1|11|l|1 II|P1|1|l1|="一7一 一j-=i-f ir- l-r -"i-r i>ir!-r 一 i 一 i- r irm ftt:irJIII|ti|go|it f*ipt|t|it/1111 TSJ1I111111I11 «111111111/IlillTMllllliIt«lvlivllllit三一寸 r-弓 r-t -i 4,11r n 片 R Tr 卡11 r i /十 r / 十iiii iiiIiIii
13、iI1vi1IiiiiIii/1V11 111I|l111JI1W flV111IP11Vfi t i i iliiii i i i i i a «ii i i n i h i i/ - . 一!-!_4一_- - -lT>J . !_4_LdJ; _1J J Ja A 1 i l | l h|T'fk-J l d t A flfll l il h A | # hiiii ii i i Iiiir*uajji iiiiini jn iiii1 ii i 1 viiii iiiii i h< 11 -J.'一 一j. . L 1一4_一- - - J-1i1
14、 11 1 I 111111 il 1 A 111 jZ 11Illi101 11 1 1 111111 | 1 V V1!1V 1 1 V111 11 1 tl 111111 I 1 H 1il111H 1 1 1 1JIkI Il I -I II11I,JLI dl I '1< HA'Ifliii ' ji |L 联,10=W1FrewencyE工) 绝对所觉口醍2临界频带由于人耳对不同频率的解析度不同,MPEGI/Audio将22khz内可感知的频率范围,依不同编码层,不同取样频率,划分成 2326个临界频带。下图列出理想临界频带的中心频率与 频宽。图中可看
15、到,人耳对低频的解析度较好。Band (Bark)Lower (Hz)Center (Hz)Upper (Hr)10501002100150200|32002503004如0350400540045051Q651057063。7630700770g77034092。99201QOOiQ&QIQ108011701270llr 127013?O1480112148016。117201317201S50200014200102150220115232025则270 Q1627002900315017315034003700IS3700400044 0019440048005300205300
16、580064002iS4007500770022F7700®50019500239500IC5001200024120001350015500251550019500-崎界置希Critical Bandwidth3频域上的掩蔽效应:幅值较大的信号会掩蔽频率相近的幅值较小的信号,如下图:00305040201Bp) Idtn£«>,(um %出LP50CO234ID1010Frequency (Hz)领域遮悔4时域上的遮蔽效应:在一个很短的时间内, 若出现了 2个声音,SPL(sound pressure level ) 较大的声音会掩蔽 SPL较小的声音。时
17、域掩蔽效应分前向掩蔽 (pre-masking )和后向掩蔽 (post-masking),其中 post-masking 的时间会比较长,约是 pre-masking 的 10 倍。seh&HQh 一弗 v£L(dE)pre- I simultiieous- I post-masking 11I0il50100 Q 50100ms 150200delay timeTime after masktr onset时做越悔 时域遮蔽效应有助于消除前回音。四、编码基本手段1量化和量化器量化和量化器:量化是把离散时间上的连续信号,转化成离散时间上的离散信号。常见的量化器有:均匀量化器
18、,对数量化器,非均匀量化器。量化过程追求的目标是:最小化量化误 差,并尽量减低量化器的复杂度(这2者本身就是一个矛盾)。(a)均匀量化器:最简单,性能最差,仅适应于电话语音。(b)对数量化器:比均匀量化器复杂,也容易实现,性能比均匀量化器好。(c) Non-uniform 量化器:根据信号的分布情况,来设计量化器。信号密集的地方进行细 致的量化,稀疏的地方进行粗略量化。2语音编码器语音编码器分为三种类形:(a)波形编器;(b)声码器;(c)混合编码器。波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号,因此会产生高质量的样值并且耗费较高的比特率。而声码器(vocoder )不会
19、再生原始波形。这组 辿器会提取一组参数,这组参数被送到接收端,用来导出语音产生模形。声码器语音质量不 够好。混合编码器,它融入了波形编码器和声器的长处。2.1 波形编码器波形编码器的设计常独立于信号。所以适应于各种信号的编码而不限于语音。1时域编码a) PCM: pulse code modulation,是最简单的编码方式。仅仅是对信号的离散和量化,常 采用对数量化。b) DPCM : differential pulse code modulation ,差分脉冲编码,只对样本之间的差异进行 编码。前一个或多个样本用来预测当前样本值。用来做预测的样本越多,预测值越精确。真 实值和预测值之间
20、的差值叫残差,是编码的对象。c) ADPCM : adaptive differential pulse code modulation ,自适应差分脉冲编码。 即在 DPCM 的基础上,根据信号的变化,适当调整量化器和预测器,使预测值更接近真实信号,残差更小,压缩效率更高。(2)频域编码频域编码是把信号分解成一系列不同频率的元素,并进行独立编码。a) sub-band coding :子带编码是最简单的频域编码技术。是将原始信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技术。它是利用带通滤波器(BPF)组把原始信号分割为若干(例如m个)子频带(简称子带)。将各子带通过等效于单边 带调幅的调制特性,将各子带搬移到零频率附近,分别经过BPF(共m个)之后,再以规定的速率(奈奎斯特速率)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字技术融合城镇产业提质增效建设方案
- 2026年主流软文推广平台:传声港AI驱动全域传播新范式
- 2026-2032年中国恒流驱动芯片行业市场全景评估及投资战略研判报告
- 自然灾害防治督查检查制度
- 2026年历史人物故事竞赛考试
- 2026海南卫星海洋应用研究院有限公司招聘7人备考题库及答案详解(历年真题)
- 2026中国兵器工业集团引信研究院有限公司纪检干事岗位招聘3人备考题库附参考答案详解【夺分金卷】
- 2026四川自贡市国有资本投资运营集团有限公司招聘1人备考题库及完整答案详解【名师系列】
- 2026苏州创元集团财务有限公司招聘2人备考题库附参考答案详解(巩固)
- 2026春季中国工商银行云南分行校园招聘180人备考题库及参考答案详解【夺分金卷】
- 《冠心病》课件(完整版)
- JBT 8688-2013 塑料离心泵标准规范
- 《准备单元雪地上的“足迹”》教学课件
- 2015年10月浙江省自考00504艺术概论试题及答案含解析
- 心理健康家庭教育指导活动
- 玻镁板吊顶施工工艺
- 防电信诈骗(课件)小学生主题班会通用版
- 高一物理必修一实验题
- 高考日语基础归纳总结与练习(一轮复习)
- LS/T 1223-2020应急储备大米储藏技术规程
- 周三多管理学精华重点
评论
0/150
提交评论