各种音频压缩格式.ppt_第1页
各种音频压缩格式.ppt_第2页
各种音频压缩格式.ppt_第3页
各种音频压缩格式.ppt_第4页
各种音频压缩格式.ppt_第5页
已阅读5页,还剩67页未读 继续免费阅读

各种音频压缩格式.ppt.ppt 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、聲音,软件学院 林凡,2,2020/10/14,数字音频,数字音频:將聲音大小轉換為許多數字,這種將聲音轉換成數字的過程就稱為音訊編碼(digital audio coding)。 基本数字音频編碼(Pulse Code Modulation, PCM) 最直接也最容易的數位音頻編碼,分兩個步驟 取樣:在固定時間取出聲音訊號(如每秒取10個) 量化(Quantize):就是取出每個訊號的大小。,3,2020/10/14,取樣 (Sampling),將聲波波形轉換成一連串的二進制數據來再現原始聲音 使用類比/數位轉換器(analog-to-digital,A/D),4,2020/10/14,取樣

2、率(Sampling),每一秒鐘所取樣的數目(times per second) 單位為HZ(赫茲)。 CD : 44,100 (44.1 kHz). DAT (Digital Audio Tape) : 32, 44.1 and 48 kHz. 其他常見之取樣率: 22.05 and 11.025 kHz.,5,2020/10/14,取樣率(Sampling),取樣頻率越高所能描述的聲波頻率就越高,6,2020/10/14,量化精度(Resolution),每個取樣均會分配一定的位元數(bit)來表達聲波的聲波振幅狀態,7,2020/10/14,量化誤差(Quantization Error

3、),指當所採用的量化精度過低,造成無法正確地還原出原始音頻信號。,8,2020/10/14,聲音的單位,一般以分貝(dB)來表示,就是指聲波施加在我們耳膜上的壓力。,9,2020/10/14,削波 (Clipping),是一種形式的波形失真。 當源訊號的波形振幅,超過程式所考慮的取樣峰值時,超過的部分會被削除,10,2020/10/14,位元率(Bit-rates) v.s. 檔案大小,11,2020/10/14,無損壓縮 v.s. 有損壓縮,有損壓縮(Lossy Compression ) 無損壓縮(Lossless Compression ),12,2020/10/14,主流音频文件格式,

4、WAV波形音频文件(非压缩) MP3文件(有损压缩) WMA文件(有损压缩) RA文件(有损压缩) MID文件(描述文件),13,2020/10/14,音频文件的压缩技术,1 数字音频的压缩 2 音频压缩编码的基本方法 3 MP3音频文件压缩标准 4 MP4音频文件压缩编码 5 TwinVQ,14,2020/10/14,1 数字音频的压缩 采用数字音频获取声音文件的方法最突出的问题是信息量大,音频信息文件所需的存储空间的计算公式为:存储容量(字节)采样频率采用精度/8声道数时间 2 音频压缩编码的基本方法 音频信号的压缩方法有多种。基本上分为两大类:有损压缩和无损压缩。无损压缩法包括不引入任何

5、数据失真的各种墒编码;有损压缩又可分为波形编码、模型编码和同时利用这两种技术的混合编码方法。,15,2020/10/14,2 音频压缩编码的基本方法,有损压缩 波形编码利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原始信号的波形尽可能匹配。它主要根据人耳的听觉特性进行量化,以达到压缩数据的目的。 参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息编码,最后在输出端合成原始信号。 混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可以在较低的误码率上得到较高的音质。,16,2020/10/14,WAV波形音频文件,是

6、微软和IBM共同开发的PC标准声音格式,文件后缀名.wav ,是一种通用的音频数据文件,通常使用WAV格式用来保存一些没有压缩的音频,也就是经过PCM编码后的音频,因此也称为波形文件,依照声音的波形进行存储,因此要占用较大的存储空间,17,2020/10/14,WAV波形音频文件,CD唱片包含的就是WAVE格式的波形数据,只是扩展名没写成“.wav”而是“.cda”,注意:WAV文件也可以存放压缩音频,但其本身的文件结构使之更加适合于存放原始音频数据并用作进一步的处理,18,2020/10/14,WAV文件组成,文件头:标明是WAVE文件、文件结构和数据的总字节数 数字化参数:如采样频率、声道

7、数、编码算法等 实际的波形数据,19,2020/10/14,WAV文件特点,优点:易于生成和编辑;,缺点:在保证一定音质的前提下压缩比不够,不适合在网络上播放,20,2020/10/14,WMA (Windows Media Audio),微軟針對網路所開發的數位音樂文件格式 在只有64kbps的位元率情況下,可以達到接近CD的音質。 支援防複製功能,可以限制播放時間和播放次數甚至於播放的機器等等。 支持串流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現線上廣播。,21,2020/10/14,WMA文件,相对于MP3的主要优点是在较低的采样频率下音质要好些 缺点是算法相对复杂,且封闭,22

8、,2020/10/14,特点,音质要强于MP3格式,更远胜于RA格式,它是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右. WMA的另一个优点是内容提供商可以通过DRM(DigitalcentersManagement)方案如Windows Media centersManager7加入防拷贝保护。,23,2020/10/14,RA文件,RA是Real Audio的缩写,是RealNetwork公司推出的一种流式压缩声音格式,和MP3相比,也是为了解决网络传输带宽资源而设计的,96:1,因此在网络上比较流行 可以在速率为14.4Kb/s的

9、Modem上网的计算机中流畅的回放 但是为了确保在网络上的传输效率,在压缩时声音质量损失较大,24,2020/10/14,RA,就是RealAudio格式 完全針對網路的數位音樂格式 可以根據聽眾的頻寬來控制自己的位元率,在保證流暢的前提下盡可能提高音質。 支援串流技術,即一邊讀一邊播放,可以很輕鬆的實現線上廣播。 也支援使用特殊通訊協定來隱匿音樂文件的真實網路地址,實現只線上播放而不提供下載的欣賞方式。,25,2020/10/14,MID文件,MID是通过数字化乐器接口MIDI输入的声音文件的扩展名,这种文件只是像记乐谱一样地记录下演奏的符号,所以体积是所有音频格式中最小的。,26,2020

10、/10/14,MID文件结构,文件头:描述文件的类型和音轨数等,音轨: 记录MIDI数据,主要是命令序列,每个命令包括命令号、通道号、音色号和音速等,27,2020/10/14,MID文件特点,WAV文件记录声音数据,MID文件记录一系列乐谱指令,数据量小,占用存储空间极小,适合在网络上传输,编辑修改灵活方便,可通过音序器自由的改变MIDI文件的曲调、音色、速度等,甚至可以改换不同的乐器,MIDI声音仅适于重现打击乐或一些电子乐器的声音(音源窄),28,2020/10/14,MP3,MP3是MPEG 1 Layer III的簡稱 是由MPEG(Moving Pictures Expert Gr

11、oup)所制定的影音壓縮聲音部分。 MPEG聲音部分,根據壓縮質量和編碼複雜程度劃分為三層,即Layer-1、Layer2、Layer3,且分別對應MP1、MP2、MP3這三種聲音文件。,29,2020/10/14,MP3,全名是MPEG Audio Layer-3,简单的说就是一种声音文件的压缩格式。1987年德国的研究机构IIS(Institute Integrierte Schaltungen)开始着手一项声音编码及数字音频广播的计划,名称叫做EUREKA EUl47,即MP3的前身。之后,这项计划由IIS与Erlangen大学共同合作,开发出一套非常强大的算法,经由150国际标准组织认

12、证之后,符合ISO-MPEG Audio Layer-3标准,就成为现在的MP3。,30,2020/10/14,MP3,MPEG音頻編碼的層次越高,編碼器越複雜,壓縮率也越高 MP1壓縮率分別為4:1, MP2的壓縮率分別為6:1-8:1, MP3的壓縮率則高達10:1-12:1, 一分鐘CD音質的音樂 未經壓縮需要10MB MP3壓縮編碼後只需1MB左右。,31,2020/10/14,MP3,MP3對音頻信號採用的是有損壓縮方式 為了降低聲音失真度,MP3採取了感官編碼技術利用人耳聽覺的特性,從聲音中去除人耳聽不到的資訊。 人耳因為構造的關係,在接收聲音時均會在頻率與時間上產生遮蔽效果(ma

13、sking)。,32,2020/10/14,遮蔽效果(masking),33,2020/10/14,MP3PRO,以MP3為基礎發展而成的音樂檔格式 相容原有的mp3 以目前一半的Bit-rate去壓縮音樂檔案,而又維持同等的音質 使用頻段複制 (Spectral Band Replication,SBR) 一種新的音頻編碼增強算法 改善低位率情況下音頻和語音編碼的性能 可在指定的位率下增加音頻的頻寬或改善編碼效率 在低數據速率下實現非常高效的編碼.如果在高數據速率的情況下,SBR將如同虛設.,34,2020/10/14,MP3PRO,mp3PRO將音頻的分成兩個部分 mp3部分分析低頻段(L

14、ow Frequency Band),並將其編碼成通常的mp3格式。 PRO部分分析的則是高頻段(High Frequency Band)信息,並將其編碼成mp3數據流的一部分,而這些通常在老的mp3解碼器裡是被忽略的。新的mp3PRO解碼器會有效地利用這部分數據流,將兩段(高頻段和低頻段)合併起來產生完全的音頻帶,達到增強音質的效果。),35,2020/10/14,MP3文件,高压缩比10:1;12:1 保持良好的音质:利用人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能的维持原来的声音,几乎达到了CD音质标准,MP3也是一种流式音乐文件格式,36,2020/10/14,3 MP3音频

15、文件压缩标准,ISO/MPEG音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案 (perceptual coding schemes) 。按照压缩质量(每Bit的声音效果)和编码方案的复杂程度分别是Layer 1、Layer 2、Layer 3。 所有这三层的编码采用的基本结构是相同的。它们在采用传统的频谱分析和编码技术的基础上还应用了子带分析和心理声学模型理论。 MP3的好处在于大幅降低数字声音文件的容量,而不会破坏原来的音质。通过MP3格式压缩后,文件便可压缩为原来的1/10l/12。,37,2020/10/14,3 MP3音频文件压缩标准,表3.2.2 声音品质与压缩比关

16、系表,表3.2.1 MPEG的压缩等级与压缩比率,38,2020/10/14,4 MP4音频文件压缩编码,MP4并不是MPEG-4或者MPEG-1 Layer 4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发,美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。MP4使用的是MPEG-2AAC技术也就是俗称的a2b或AAC。,39,2020/10/14,4 MP4音频文件压缩编码,特点 音质更加完美而压缩比更加大(1:15)。 MPEG-2AAC(ISO/IEC13818-7)在采样率为896KHz下提供了148个声道可选范围的高质量音频编码 。 AAC与

17、MP3相比,增加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪优异等MP3没有的特性,使得在音频压缩后仍能完美的再现CD音质。,40,2020/10/14,4 MP4音频文件压缩编码,AAC技术主要由以下三个部分组成 AT&T的音频压缩技术专利。它可以将AAC压缩比提高到20:1而不损失音质。 安全数据库。它可以为你的AACMusic创建一个特定的密钥,将此密钥存于其数据库中。同时,只有AAC的播放器才能播放含有这种密钥的音乐。 协议认证。这个认证包含了复制许可、允许复制副本数目、歌曲总时间、歌曲可以播放时间以及售卖许可等信息。,41,2020/10/14,5 TwinVQ,Tw

18、inVQ即VQF,是由Nippon Telegraph and Telephone (NTT) 开发的一种音乐压缩(Music Compression)技术,经过不少权威评测,认为这是一种绝对优于MP3的技术。在音频压缩率和音质上,VQF比起MP3都有很大的优势。 VQF的优点是它对计算机硬件配置要求比MP3低,压缩文件比MP3小,且支持MMX技术,可以运行在Windows95/98/NT或MacOS7.5.1系统之上,也可以广泛应用在网络之中。,42,2020/10/14,5 TwinVQ,TwinVQ在压缩率上的优势 VQF采用了与MP3截然不同的音频压缩技术,它的音频压缩率比ISO标准的

19、MPEG音频压缩率高出近一倍,可以达到1:20左右甚至更高。而像Mp3、RA这些广为流行的压缩格式一般只有1:12左右,可以说VQF在音频压缩比率上的优势已经明显超越了Mp3和RA。 TwinVQ在音质上的优势 当VQF以44Khz-80kbp/s的音频采样率压缩音乐时,它的音质优于44Khz-128kb/s的MP3,当VQF以44Khz-96kbp/s的频率压缩时,它的音质几乎等于 44Khz-256kb/s的MP3。 TwinVQ在音质上的优势 当VQF以44Khz-80kbp/s的音频采样率压缩音乐时,它的音质优于44Khz-128kb/s的MP3,当VQF以44Khz-96kbp/s的

20、频率压缩时,它的音质几乎等于 44Khz-256kb/s的MP3。,43,2020/10/14,5 TwinVQ,VQF的主要缺点 系统占用率大 压缩速度慢 播放器少,44,2020/10/14,Ogg Vorbis,號稱MP3殺手! OGG是一個多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。 OGG的信念就是:OPEN!FREE! 可以在相對較低的位元率下實現比MP3更好的音質。 可支持多聲道,45,2020/10/14,特点 Ogg Vorbis支持VBR(可变比特率)和ABR(平均比特率)两种编码方式, Ogg还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。,OG

21、G格式可以对所有声道进行编码,支持多声道模式,而不像MP3只能编码双声道。多声道音乐会带来更多临场感,欣赏电影和交响乐时更有优势,这场革命性的变化是MP3无法支持的。在而且未来人们对音质要求不断提高, Ogg的优势将更加明显。,46,2020/10/14,APE,Monkeys Audio提供的一種無損壓縮格式。 是和MP3一樣可以播放的音頻文件格式。 這種格式的壓縮比遠低於其他格式,但能夠做到真正無損, 在現有不少無損壓縮格式下,APE有著突出性能,令人滿意的壓縮比以及飛快的壓縮速度,成為了交流發燒音樂的唯一選擇。,47,2020/10/14,ACC(Advanced Audio Codin

22、g),是杜比實驗室提供的技術。 遵循MPEG-2的規格所開發的技術。 最大能容納48個音軌,取樣率達96 KHz,並且在320Kbps的位元速率能為5.1聲道音樂節目,提供相當於ITU-R廣播的品質。 比MP3的音質好,也能節省大約30%的儲存空間與頻寬。,48,2020/10/14,杜比研究室(Dolby Laboratories),杜比研究室(Dolby Laboratories) 1965,美國物理學家兼工程師Ray Dolby在倫敦建立 發展噪音減少系統以提高音效品質。,49,2020/10/14,Dolby Surround,杜比環繞音效 提供了4個聲道左、中、右和環繞聲道。 常見於

23、 VHS 錄影帶或是立體聲電視。,50,2020/10/14,Dolby Pro Logic II,杜比定向邏輯 擁有更佳的空間感及方向感。 是一種用來實現環繞聲的方法,可以使用較少的聲道來模擬環繞聲的效果。,51,2020/10/14,Dolby Digital 5.1,杜比數位 Dolby Digital 5.1,也叫AC-3(Audio Code-3) 提供5個全頻帶聲道 左聲道 中聲道 右聲道 左環繞聲道 右環繞聲道 表現低音效果的”.1”聲道。,52,2020/10/14,Dolby Digital Surround EX,Dolby Digital 5.1在正後方中央部分的定位效果

24、仍嫌不足,會由於人耳對於正前方的聽覺感受較強烈而被忽略了。 Dolby Digital Surround EX 增加了一個以上的後環繞聲道(Back Surround)作為補償。,53,2020/10/14,多聲道喇叭系統配置表,5.1、6.1 和7.1多聲道喇叭 代表音效系統的喇叭數目。 相異點是取決於環繞的數量 5.1有2個,6.1有3個而7.1有4個。,54,2020/10/14,DTS (Digital Theater System),數位劇院系統 Jurassic Park(株羅紀公園)用過。 多用在大螢幕,目前開始使用於家庭劇院 將音軌單獨放置在另外的存儲設備中,然後再與影像同步。

25、 比Dolby Digital有更好的音質。 缺點是比Dolby多佔約三倍的空間 以 DTS 來編碼的DVD只有一種語言和有限的內容。,55,2020/10/14,DTS-ES,DTS ES標準在第六聲道上有獨立的編碼。,56,2020/10/14,THX,由電影星際大戰導演喬治盧卡司所創製的新標準, 仍是DOLBY SURROUND PROLOGIC的系統,而非新的系統,THX是一種認證。 強調 高輸出功率 寬頻率響應 低失真 雙重低音喇叭等效果。,57,2020/10/14,Creative EAX ADVANCED HD,Creatvie (創新未來)可說是音效卡的龍頭老大 EAX AD

26、VANCED HD 3D環繞音效規格,提供 複合環境可在即時狀態下同時營造多個音效環境; 環境濾波提供高低頻衰減建模,用來設計外部聲學環境; 環境變換允許遊戲開發者控制 22個環境參數; 環境定位幫助遊戲開發者實現 3D 定位; 環境反射允許早期反射和回音的定位,提供細節和真實感。,58,2020/10/14,3 音频文件的制作,59,2020/10/14,播放程式與音樂轉檔程式,播放程式 foobar2000 千千靜聽 轉檔程式 音樂轉檔精靈http:/hola.idv.tw/ dBpowerAMP Music Converter,60,2020/10/14,3.1 Windows环境下音量

27、的调节和设置,音量调节程序的界面,61,2020/10/14,3.2 Windows的录音机程序,录制声音 把声卡的MIC IN插孔与话筒相连,或者把LINE IN与其他声音输入设备(例如录像机的Audio插孔)相连,启动Windows开始菜单程序中附件中的“录音机”程序,就可以录制声音。 步骤1 在声卡MIC插孔中插入话筒,打开话筒开关。 步骤2 在Windows“附件”组中启动“录音机”,打开声音源同时按录音按钮开始录音,此时,声波窗口中出现声音波形。 步骤3 按“停止按钮”,结束录音。 步骤4 从文件菜单中选择“另存为”命令,输入文件名后确定。录音时,声波窗口右侧记录了当前录制声音文件的

28、时间长度。,62,2020/10/14,3.2 Windows的录音机程序,利用录音机程序插入另一个声音文件 步骤1 首先使用文件菜单命令“打开”一个声音文件。 步骤2 用“播放”和“停止”按钮或拖动滚动条上的滑块以定位拟插入声音文件的位置。 步骤3 从“编辑”菜单中选择“插入文件”命令。 步骤4 在“文件”对话框中输入或直接选定欲插入的另一个声音文件的文件名。 步骤5 按“确定”按钮,完成插入。,63,2020/10/14,3.2 Windows的录音机程序,混合声音文件 利用编辑菜单的“混入文件”命令,可将一个声音文件与另一个声音文件相互混合,产生特殊效果。例如,将一个解说词文件与一个音乐

29、文件相混合,在播放时,则可同时听到解说词和音乐,即在解说词中增加了背景音乐。 步骤1 首先打开一个声音文件。 步骤2 用“播放”和“停止”按钮来定位想要混入声音文件的位置。 步骤3 从“编辑”菜单中选取“混入文件”命令。 步骤4 在文件对话框中输入想要混入的另一个文件名。 步骤5按“确定”按钮,完成混合。,64,2020/10/14,3.2 Windows的录音机程序,删除声音文件中某一部分内容 步骤1 打开需要删除的声音文件。 步骤2 用“播放”和“停止”按钮来定位预删除的位置。 步骤3 从“编辑”菜单中选择“删除当前位置以前的内容”命令,或选“删除当前位置以后的内容”命令。 步骤4 确认是否删除。,65,2020/10/14,3.3 音频编辑软件Cool Edit Pro 2000,Cool Edit 软件功能 Cool Edit 是一个很优秀的音频数据制作、编辑、处理和播放软件。利用Cool Edit可以录制音频文件;轻松地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论