各种音频压缩格式_第1页
各种音频压缩格式_第2页
各种音频压缩格式_第3页
各种音频压缩格式_第4页
各种音频压缩格式_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

聲音软件学院林凡11/23/20231数字音频数字音频:將聲音大小轉換為許多數字,這種將聲音轉換成數字的過程就稱為音訊編碼(digitalaudiocoding)。基本数字音频編碼

(PulseCodeModulation,PCM)最直接也最容易的數位音頻編碼,分兩個步驟取樣:在固定時間取出聲音訊號(如每秒取10個)量化(Quantize):就是取出每個訊號的大小。11/23/20232取樣(Sampling)將聲波波形轉換成一連串的二進制數據來再現原始聲音使用類比/數位轉換器(analog-to-digital,A/D)11/23/20233取樣率(Sampling)每一秒鐘所取樣的數目(timespersecond)單位為HZ(赫茲)。CD:44,100(44.1kHz).DAT(DigitalAudioTape):32,44.1and48kHz.其他常見之取樣率:22.05and11.025kHz.11/23/20234取樣率(Sampling)取樣頻率越高所能描述的聲波頻率就越高11/23/20235量化精度(Resolution)每個取樣均會分配一定的位元數(bit)來表達聲波的聲波振幅狀態11/23/20236量化誤差(QuantizationError)指當所採用的量化精度過低,造成無法正確地還原出原始音頻信號。11/23/20237聲音的單位一般以分貝(dB)來表示,就是指聲波施加在我們耳膜上的壓力。11/23/20238削波(Clipping)是一種形式的波形失真。當源訊號的波形振幅,超過程式所考慮的取樣峰值時,超過的部分會被削除11/23/20239位元率(Bit-rates)v.s.檔案大小11/23/202310無損壓縮v.s.有損壓縮有損壓縮(LossyCompression)無損壓縮(LosslessCompression)11/23/202311主流音频文件格式WAV波形音频文件(非压缩)MP3文件(有损压缩)WMA文件(有损压缩)RA文件(有损压缩)MID文件(描述文件)11/23/202312音频文件的压缩技术1数字音频的压缩2音频压缩编码的基本方法3MP3音频文件压缩标准4MP4音频文件压缩编码5

TwinVQ

11/23/2023131数字音频的压缩

采用数字音频获取声音文件的方法最突出的问题是信息量大,音频信息文件所需的存储空间的计算公式为:存储容量(字节)=采样频率×采用精度/8×声道数×时间2音频压缩编码的基本方法

音频信号的压缩方法有多种。基本上分为两大类:有损压缩和无损压缩。无损压缩法包括不引入任何数据失真的各种墒编码;有损压缩又可分为波形编码、模型编码和同时利用这两种技术的混合编码方法。11/23/2023142

音频压缩编码的基本方法有损压缩波形编码利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原始信号的波形尽可能匹配。它主要根据人耳的听觉特性进行量化,以达到压缩数据的目的。参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息编码,最后在输出端合成原始信号。混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可以在较低的误码率上得到较高的音质。11/23/202315WAV波形音频文件是微软和IBM共同开发的PC标准声音格式,文件后缀名.wav,是一种通用的音频数据文件通常使用WAV格式用来保存一些没有压缩的音频,也就是经过PCM编码后的音频,因此也称为波形文件,依照声音的波形进行存储,因此要占用较大的存储空间11/23/202316WAV波形音频文件CD唱片包含的就是WAVE格式的波形数据,只是扩展名没写成“.wav”而是“.cda”注意:WAV文件也可以存放压缩音频,但其本身的文件结构使之更加适合于存放原始音频数据并用作进一步的处理11/23/202317WAV文件组成文件头:标明是WAVE文件、文件结构和数据的总字节数数字化参数:如采样频率、声道数、编码算法等实际的波形数据11/23/202318WAV文件特点优点:易于生成和编辑;缺点:在保证一定音质的前提下压缩比不够,不适合在网络上播放11/23/202319WMA(WindowsMediaAudio)微軟針對網路所開發的數位音樂文件格式在只有64kbps的位元率情況下,可以達到接近CD的音質。支援防複製功能,可以限制播放時間和播放次數甚至於播放的機器等等。支持串流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現線上廣播。11/23/202320WMA文件相对于MP3的主要优点是在较低的采样频率下音质要好些缺点是算法相对复杂,且封闭 11/23/202321特点音质要强于MP3格式,更远胜于RA格式,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右.WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如WindowsMediacentersManager7加入防拷贝保护。11/23/202322RA文件RA是RealAudio的缩写,是RealNetwork公司推出的一种流式压缩声音格式,和MP3相比,也是为了解决网络传输带宽资源而设计的96:1,因此在网络上比较流行可以在速率为14.4Kb/s的Modem上网的计算机中流畅的回放但是为了确保在网络上的传输效率,在压缩时声音质量损失较大11/23/202323RA就是RealAudio格式完全針對網路的數位音樂格式可以根據聽眾的頻寬來控制自己的位元率,在保證流暢的前提下盡可能提高音質。支援串流技術,即一邊讀一邊播放,可以很輕鬆的實現線上廣播。

也支援使用特殊通訊協定來隱匿音樂文件的真實網路地址,實現只線上播放而不提供下載的欣賞方式。11/23/202324MID文件MID是通过数字化乐器接口MIDI输入的声音文件的扩展名,这种文件只是像记乐谱一样地记录下演奏的符号,所以体积是所有音频格式中最小的。11/23/202325MID文件结构文件头:描述文件的类型和音轨数等音轨:记录MIDI数据,主要是命令序列,每个命令包括命令号、通道号、音色号和音速等11/23/202326MID文件特点WAV文件记录声音数据,MID文件记录一系列乐谱指令数据量小,占用存储空间极小,适合在网络上传输编辑修改灵活方便,可通过音序器自由的改变MIDI文件的曲调、音色、速度等,甚至可以改换不同的乐器MIDI声音仅适于重现打击乐或一些电子乐器的声音(音源窄)11/23/202327MP3MP3是MPEG1LayerIII的簡稱是由MPEG(MovingPicturesExpertGroup)所制定的影音壓縮─聲音部分。MPEG聲音部分,根據壓縮質量和編碼複雜程度劃分為三層,即Layer-1、Layer2、Layer3,且分別對應MP1、MP2、MP3這三種聲音文件。11/23/202328MP3全名是MPEGAudioLayer-3,简单的说就是一种声音文件的压缩格式。1987年德国的研究机构IIS(InstituteIntegrierte

Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKAEUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法,经由150国际标准组织认证之后,符合ISO-MPEGAudioLayer-3标准,就成为现在的MP3。11/23/202329MP3MPEG音頻編碼的層次越高,編碼器越複雜,壓縮率也越高MP1壓縮率分別為4:1,MP2的壓縮率分別為6:1-8:1,MP3的壓縮率則高達10:1-12:1,一分鐘CD音質的音樂未經壓縮需要10MBMP3壓縮編碼後只需1MB左右。11/23/202330MP3MP3對音頻信號採用的是有損壓縮方式為了降低聲音失真度,MP3採取了「感官編碼技術」─利用人耳聽覺的特性,從聲音中去除人耳聽不到的資訊。人耳因為構造的關係,在接收聲音時均會在頻率與時間上產生遮蔽效果(masking)。11/23/202331遮蔽效果(masking)11/23/202332MP3PRO以MP3為基礎發展而成的音樂檔格式相容原有的mp3以目前一半的Bit-rate去壓縮音樂檔案,而又維持同等的音質使用頻段複制

(SpectralBandReplication,SBR)一種新的音頻編碼增強算法改善低位率情況下音頻和語音編碼的性能可在指定的位率下增加音頻的頻寬或改善編碼效率在低數據速率下實現非常高效的編碼.如果在高數據速率的情況下,SBR將如同虛設.11/23/202333MP3PROmp3PRO將音頻的分成兩個部分mp3部分

分析低頻段(LowFrequencyBand),並將其編碼成通常的mp3格式。PRO部分

分析的則是高頻段(HighFrequencyBand)信息,並將其編碼成mp3數據流的一部分,而這些通常在老的mp3解碼器裡是被忽略的。

新的mp3PRO解碼器會有效地利用這部分數據流,將兩段(高頻段和低頻段)合併起來產生完全的音頻帶,達到增強音質的效果。)11/23/202334MP3文件高压缩比10:1;12:1保持良好的音质:利用人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能的维持原来的声音,几乎达到了CD音质标准MP3也是一种流式音乐文件格式11/23/2023353MP3音频文件压缩标准ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案(perceptualcodingschemes)。按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer1、Layer2、Layer3。所有这三层的编码采用的基本结构是相同的。它们在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论。MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。通过MP3格式压缩后,文件便可压缩为原来的1/10~l/12。11/23/2023363MP3音频文件压缩标准MPEG编码等级压缩比率数字流码率Layer11:4384kbit/sLayer21:6–1:8192-256kbit/sLayer31:10–1:12128-154kbit/s表3.2.2声音品质与压缩比关系表声音质量带宽模式比特率压缩比率电话2.5kHz单声道8kbps*96:1好于短波4.5kHz单声道16kbps48:1好于调幅广播7.5kHz单声道32kbps24:1类似调频广播11kHz立体声56-64kbps26-24:1接近CD15kHz立体声96kbps16:1CD>15kHz立体声112-128kbps14-12:1表3.2.1MPEG的压缩等级与压缩比率11/23/2023374MP4音频文件压缩编码

MP4并不是MPEG-4或者MPEG-1Layer4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。MP4使用的是MPEG-2

AAC技术也就是俗称的a2b或AAC。11/23/2023384MP4音频文件压缩编码特点音质更加完美而压缩比更加大(1:15)。

MPEG-2

AAC(ISO/IEC

13818-7)在采样率为8~96KHz下提供了1~48个声道可选范围的高质量音频编码。AAC与MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美的再现CD音质。11/23/2023394MP4音频文件压缩编码AAC技术主要由以下三个部分组成AT&T的音频压缩技术专利。它可以将AAC压缩比提高到20:1而不损失音质。安全数据库。它可以为你的AAC

Music创建一个特定的密钥,将此密钥存于其数据库中。同时,只有AAC的播放器才能播放含有这种密钥的音乐。协议认证。这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。11/23/2023405TwinVQ

TwinVQ即VQF,是由NipponTelegraphandTelephone(NTT)开发的一种音乐压缩(MusicCompression)技术,经过不少权威评测,认为这是一种绝对优于MP3的技术。在音频压缩率和音质上,VQF比起MP3都有很大的优势。VQF的优点是它对计算机硬件配置要求比MP3低,压缩文件比MP3小,且支持MMX技术,可以运行在Windows95/98/NT或MacOS7.5.1系统之上,也可以广泛应用在网络之中。11/23/2023415TwinVQTwinVQ在压缩率上的优势

VQF采用了与MP3截然不同的音频压缩技术,它的音频压缩率比ISO标准的MPEG音频压缩率高出近一倍,可以达到1:20左右甚至更高。而像Mp3、RA这些广为流行的压缩格式一般只有1:12左右,可以说VQF在音频压缩比率上的优势已经明显超越了Mp3和RA。TwinVQ在音质上的优势当VQF以44Khz-80kbp/s的音频采样率压缩音乐时,它的音质优于44Khz-128kb/s的MP3,当VQF以44Khz-96kbp/s的频率压缩时,它的音质几乎等于44Khz-256kb/s的MP3。TwinVQ在音质上的优势当VQF以44Khz-80kbp/s的音频采样率压缩音乐时,它的音质优于44Khz-128kb/s的MP3,当VQF以44Khz-96kbp/s的频率压缩时,它的音质几乎等于44Khz-256kb/s的MP3。11/23/2023425TwinVQVQF的主要缺点系统占用率大压缩速度慢播放器少11/23/202343Ogg

Vorbis號稱MP3殺手!OGG是一個多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。OGG的信念就是:OPEN!FREE!可以在相對較低的位元率下實現比MP3更好的音質。可支持多聲道11/23/202344特点

Ogg

Vorbis支持VBR(可变比特率)和ABR(平均比特率)两种编码方式,Ogg还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。OGG格式可以对所有声道进行编码,支持多声道模式,而不像MP3只能编码双声道。多声道音乐会带来更多临场感,欣赏电影和交响乐时更有优势,这场革命性的变化是MP3无法支持的。在而且未来人们对音质要求不断提高,Ogg的优势将更加明显。

11/23/202345APEMonkey‘sAudio提供的一種無損壓縮格式。是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比遠低於其他格式,但能夠做到真正無損,在現有不少無損壓縮格式下,APE有著突出性能,令人滿意的壓縮比以及飛快的壓縮速度,成為了交流發燒音樂的唯一選擇。11/23/202346ACC(AdvancedAudioCoding)是杜比實驗室提供的技術。遵循MPEG-2的規格所開發的技術。最大能容納48個音軌,取樣率達96KHz,並且在320Kbps的位元速率能為5.1聲道音樂節目,提供相當於ITU-R廣播的品質。比MP3的音質好,也能節省大約30%的儲存空間與頻寬。11/23/202347杜比研究室(DolbyLaboratories)杜比研究室(DolbyLaboratories)

1965,美國物理學家兼工程師RayDolby在倫敦建立發展噪音減少系統以提高音效品質。11/23/202348DolbySurround杜比環繞音效提供了4個聲道-左、中、右和環繞聲道。常見於VHS錄影帶或是立體聲電視。

11/23/202349DolbyProLogicII杜比定向邏輯Ⅱ擁有更佳的空間感及方向感。是一種用來實現環繞聲的方法,可以使用較少的聲道來模擬環繞聲的效果。

11/23/202350DolbyDigital5.1杜比數位DolbyDigital5.1,也叫AC-3(AudioCode-3)提供5個全頻帶聲道左聲道中聲道右聲道左環繞聲道右環繞聲道表現低音效果的”.1”聲道。11/23/202351DolbyDigitalSurroundEXDolbyDigital5.1在正後方中央部分的定位效果仍嫌不足,會由於人耳對於正前方的聽覺感受較強烈而被忽略了。DolbyDigitalSurroundEX

增加了一個以上的後環繞聲道

(BackSurround)作為補償。11/23/202352多聲道喇叭系統配置表5.1、6.1和7.1多聲道喇叭代表音效系統的喇叭數目。相異點是取決於環繞的數量5.1有2個,6.1有3個而7.1有4個。11/23/202353DTS(DigitalTheaterSystem)數位劇院系統

JurassicPark(株羅紀公園)用過。多用在大螢幕,目前開始使用於家庭劇院將音軌單獨放置在另外的存儲設備中,然後再與影像同步。比DolbyDigital有更好的音質。缺點是比Dolby多佔約三倍的空間以DTS來編碼的DVD只有一種語

言和有限的內容。11/23/202354DTS-ESDTSES標準在第六聲道上有獨立的編碼。11/23/202355THX由電影『星際大戰』導演喬治盧卡司所創製的新標準,仍是DOLBYSURROUNDPRO─LOGIC的系統,而非新的系統,THX是一種認證。強調高輸出功率寬頻率響應低失真雙重低音喇叭等效果。11/23/202356CreativeEAXADVANCEDHDCreatvie(創新未來)可說是音效卡的龍頭老大EAXADVANCEDHD3D環繞音效規格,提供複合環境

可在即時狀態下同時營造多個音效環境;環境濾波

提供高低頻衰減建模,用來設計外部聲學環境;環境變換

允許遊戲開發者控制22個環境參數;環境定位

幫助遊戲開發者實現3D定位;環境反射

允許早期反射和回音的定位,提供細節和真實感。11/23/2023573音频文件的制作11/23/202358播放程式與音樂轉檔程式播放程式foobar2000

/download.html千千靜聽http:///ttpsetup_cht.exe轉檔程式音樂轉檔精靈

http://hola.idv.tw/dBpowerAMPMusicConverter

http:///dmc.htm11/23/2023593.1Windows环境下音量的

调节和设置音量调节程序的界面

11/23/2023603.2Windows的录音机程序录制声音把声卡的MICIN插孔与话筒相连,或者把LINEIN与其他声音输入设备(例如录像机的Audio插孔)相连,启动Windows开始菜单程序中附件中的“录音机”程序,就可以录制声音。步骤1在声卡MIC插孔中插入话筒,打开话筒开关。步骤2在Windows“附件”组中启动“录音机”,打开声音源同时按录音按钮开始录音,此时,声波窗口中出现声音波形。步骤3按“停止按钮”,结束录音。步骤4从文件菜单中选择“另存为”命令,输入文件名后确定。录音时,声波窗口右侧记录了当前录制声音文件的时间长度。

11/23/2023613.2Windows的录音机程序利用录音机程序插入另一个声音文件步骤1首先使用文件菜单命令“打开”一个声音文件。步骤2用“播放”和“停止”按钮或拖动滚动条上的滑块以定位拟插入声音文件的位置。步骤3从“编辑”菜单中选择“插入文件”命令。步骤4在“文件”对话框中输入或直接选定欲插入的另一个声音文件的文件名。步骤5按“确定”按钮,完成插入。11/23/2023623.2Windows的录音机程序混合声音文件利用编辑菜单的“混入文件”命令,可将一个声音文件与另一个声音文件相互混合,产生特殊效果。例如,将一个解说词文件与一个音乐文件相混合,在播放时,则可同时听到解说词和音乐,即在解说词中增加了背景音乐。步骤1首先打开一个声音文件。步骤2用“播放”和“停止”按钮来定位想要混入声音文件的位置。步骤3从“编辑”菜单中选取“混入文件”命令。步骤4在文件对话框中输入想要混入的另一个文件名。步骤5按“确定”按钮,完成混合。11/23/2023633.2Windows的录音机程序删除声音文件中某一部分内容步骤1打开需要删除的声音文件。步骤2用“播放”和“停止”按钮来定位预删除的位置。步骤3从“编辑”菜单中选择“删除当前位置以前的内容”命令,或选“删除当前位置以后的内容”命令。步骤4确认是否删除。11/23/2023643.3音频编辑软件CoolEditPro2000

CoolEdit软件功能

CoolEdit是一个很优秀的音频数据制作、编辑、处理和播放软件。利用CoolEdit可以录制音频文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论