




文档简介
音频知识基础介绍(一)2007-10-18 20:24简单说下,什么是单声道,双声道,立体声。“鱼老师,有些问题请教您,我用话筒录音时,您说一定要把录音轨选择为MONO单声道轨进行录音,可我记得在用AC97录话筒时,是可以直接录下立体场的啊?”“立体声?你用什么话筒在AC97上录成立体声?”“就是一般的耳麦啊,那时候就这些设备嘛。”“你的耳麦是立体声的吗?”“不是啦。”“那就不可能录得成立体声的!你录下的肯定是左右声道全一模一样的波形。对不对?”“是啊,这种左右声道都有的,不就叫立体声吗?”“不!这种叫双声道,左右声道完全一样,听时感觉人声是在中间,这种是双声道,所谓立体声肯定是左右不一样的,因为不一样,才感觉有左右的不同,而产生一种声场的模拟感。”“那就算这种双声道的,不也可以用吗?为何一定要用单声道轨进行录音呢?”“因为这种录下的左右的波形完全相同,在后期混音时,如果加入一些立体声的效果插件,比如立体声混响,会产生相位抵消,人声会变得很怪异,象挤压在中间一样,非常难听。比如这种加一个TC的混响,声音就会变得很糟。”“哦,原来是这样啊。那么,再问个问题,我也常自己录点卡拉OK玩,这种伴奏多是网上下载或是从VCD中抓下来的,全是单声道的文件。我录了人声后,怎么调也觉得人声和伴奏混合不到一起去,用您教的频率调整、加混响等,也得到不好的结果。您还有什么办法吗?”“呵呵,如果说最好的办法,就是:自己重做一个伴奏。”“别啊,老师,我只是自己玩玩,您就当我是一个开小棚给人录卡拉OK的客户吧,不可能您也叫他们自己把所有的伴奏全做MIDI吧?!”“那倒是!好吧,我现在教你的是用效果器来改成假立体声的,效果不一定很好,不过也只有如此了。”就拿卡拉OK的歌曲来说,通常做声道是伴奏音乐,右声道是带歌词的音乐,单声道就是说你在播放歌曲的时候,只选择播放左声道或者右声道,这样的声音称为单声道,如果两个声道同时播放,就是两个喇叭里放出来的音乐是一个有歌词一个没有的,那就可以说是双声道,同样也可以称为立体声。单声道的声音只要多复制一次就可以变成双声道了,再复制一次就是三声道,再复制但是立体声和双声道是两个概念,立体声中的两个声道内容是不同的,比如你戴耳机听音乐,左右戴反了就会感到十分别扭双声道仅仅是比单声道多个喇叭,本质上都是一样的吱哇乱叫单声道就是吱哇乱叫,双声道就是两个喇叭一起吱哇乱叫,立体声就是一个喇叭吱哇乱叫,另一个哇吱乱叫。WhiteLee:就像上面说的,单声道就是一个喇叭,一个声道,双声道是两个喇叭,但两个喇叭播放的都是一样的音乐,感觉没有立体声效果,而立体声,是两个喇叭播放的是不一样的东西,他们是互补的。有立体效果。两个喇叭不一定是立体声,但是立体声一定是至少两个喇叭。采样率,频率,位这几个参数都是音频中常用到的参数。 16 Bit 128 kbit 44100 Hz 贴个文章。采样率:数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(A/D)它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串的样本连接起来,就可以描述一段声波了,把每一秒钟所采样的数目称为采样频率或采率,单位为HZ(赫兹)。采样频率越高所能描述的声波频率就越高。 对于每个采样系统均会分配一定存储位(bit数)来表达声波的声波振幅状态,称之为采样分辩率或采样精度,每增加一个bit,表达声波振幅的状态数就翻一翻,并且增加6db的动态范围态,即6db的动态范围,一个2bit的数码音频系统表达千种状态,即12db的动态范围,以此类推。如果继续增加bit数则采样精度就将以非常快的速度提高,可以计算出16bit能够表达65536种状态,对应,96db 而20bit可以表达1048576种状态,对应120db。24bit可以表达多达16777216种状态。对应144db的动态范围,采样精度越高,声波的还原就越细腻。(注:动态范围是指声音从最弱到最强的变化范围)人耳的听觉范围通常是20HZ20KHZ。根据奈魁斯特(NYQUIST)采样定理,用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形,因此一个数码录音波的休样频率直接关系到它的最高还原频率指标例如,用44.1KHZ的采样频率进行采样,则可还原最高为22.05KHZ的频率-这个值略高于人耳的听觉极限,(注: 可录MD,例R900的取样频率为44.1KHZ并且有取样频率转换器,可将输入的32KHz/44.1KHZ/48KHZ转换为该机的标准取样频率44.1KHZ的还原频率足已记示和真实再现世界上所有人再能辩的声音了,所以CD音频的采样规格定义为16bit。44KHZ, 即使在最理想的环境下用现实生活中几乎不可能制造的高精密电子元器件真实地实现了16bit的录音,仍然会受到滤波和声特定位等问题的困扰,人们还是能察觉出一些微小的失真所以很多专业数码音频系统已经使用18bit甚至24bit 进行录音和回放了。WhiteLee:这个可以简单理解一下,其实很好理解,我们在一般碰到视频转换软件的时候常碰到这些情况,那么怎么理解这些东西呢。看看频率 44100hz,这个是说采样频率,也可以理解成采样点,就是一秒采44100次,我们把这44100点连成一条直线,因为有44100这么多个点,把这1秒的细节全都采集到了,这样声音中间丢失的极少,所以不会有很大的失真。要是一秒就采集2次。一比。呵呵。没法听吧。然后看还有一个16bit,还是24bit,或者8bit等,这个是说采样的精度,你采集点了,44100只是采集的多少,精度是看多少bit,一般是16,也够了,越高精度,还原越准。然后是码率,这个就是压缩你用多少码率,一般mp3的128就能接近cd音质了,而wma用96就行。这个就是你占据的空间了,占据空间最主要的就是编码率决定的,说白了,就是你选择的压缩比,压缩的越小,声音失真越多。反之,声音效果越好。就是这样哈。音频知识全民普及 常见音频格式详解 现在年轻人听音乐大部分都还是停留在mp3阶段,一些前卫的音痴已经开始准备鸟枪换炮了,源于近两年网上渐渐兴起一股无损风和高清风,吹的人心里直痒痒。今儿带领大家领略一些基本的音频知识,对无损音频格式也做些介绍,看完整篇文章您定能有所收获,我本人从中也受益良多。下一篇日志咱们讨论讨论高清视频的标准。(文章乃网上四处搜刮所得,前后参考十几篇文章,之后添加个人学习心得,加工着色、整理、排版,辛苦异常,所以也算本人原创,就不贴参考教程的出处了) 客官慢慢欣赏: 音乐从古至今都作为一种雅俗共赏的艺术风格广为传播,到了IT时代,由于各种历史原因,导致音乐格式众多,那么时下最流行的音频格式是什么呢?mp3当之无愧。首先说明网上众多mp3都是从何而来?事实上,mp3并非是音乐的源头,即大家在录制音乐时一般都不会把自然声音直接录制为mp3,而是录制为其它格式,之后为了在互联网上传播才将其转换为mp3的。那为什么要选mp3而非其他格式呢?原因很简单,mp3能在保证音乐质量的前提下对原始音频文件进行高效率的压缩,使其文件大小降低为原始音频文件的1/10甚至更多,方便我们进行网络传输。那么mp3究竟音质如何,使得它能成为音乐的主流传播方式?128/192/256/320等等各种压缩比率/压缩模式的MP3音质有什么不同?有一些什么基本原理?其它主流的音频格式还有哪些呢?它们都各有什么特点?深吸一口气,且听我一一道来: 先来说说音源,顾名思义,音源就是声音的源头,没有音源,用音响系统还原声音也就 无从谈起。音源有两层含义:一是指记录声音的载体,只有先把声音记录在某种载体上,才谈得上用音响设备把载体上的声音还原出来,这些载体是音响系统中声音的来源,所以叫音源。常见的音源载体有CD(小型激光唱片)、盒式磁带、LP(密纹唱片)等,现在又出现了DVD-1( 音频DVD)、SACD(超级音频CD)等更先进的新型载体;音源的另一层含义,是指播放音源载体的设备。上述CD、盒式磁带、LP 唱片等时源载体记录着声音讯息,但必须通过相应的设备才能把讯息读 出来,进而以电信号的形式传输给音响系统中的其他设备。播放CD片的 设备叫CD机,是目前主流的高性能音源设备之一;录放盒式磁带的设备叫卡座,当然,以前流行的收录机也能录放磁带,收录机可以看成扩展了功能的卡座增加了收音、功放部分,还自带扬声器,不过收录机磁带录放部分的性能通常远不及卡座,所以我们现在只谈卡座。 当然, 由于受到CD的冲击,卡座和磁带的影响力已远不如从前了;播放LP唱片 的设备叫LP唱机。LP唱片和唱机曾经是音响系统中性能最好、保真度最高的音源,但同样因CD的冲击而走向衰落。今天,只有少数高级LP唱机 作为昔日经典继续存活下来,也只有少数对模拟时代满怀留恋的发烧友还在继续使用LP,在绝大多数音响爱好者和普通消费者家里,LP已经消失了。不过,高级LP系统的声音并不一定逊色于当今先进的数码音响, 有些资深发烧友甚至认为,顶级LP的声音质感和音乐味是CD无法企及的 。对LP可以用一句话来概括;夕阳无限好,只是近黄昏。 下面来了解一下模拟音源和数码音源: 时间上连续、而且幅度随时间连续变化的讯号称为模拟讯号(例如声波就是模拟讯号,音响系统中传输的电流、电压讯号也是模拟讯号),记录和处理模拟讯号的音源就是模拟音源,例如磁带/卡座、LP/LP唱机; 时间上不连续、幅度只有0和1两种变化的讯号称为数字讯号,记录和处理数字讯号的音源叫做数码音源,例如CD/CD机、DVD-A/DVD-A播放机 、SACD/SACD播放机等。 模拟音源记录和处理的讯号是声音(准确地说应该是从声音转换而来的电讯号)的本来面目,可以直接用传统的放大器放大,处理起来方便直接;数码音源记录、处理的都是0和1排列组合形成的抽象二进制数据流,非常不直观。 声波是模拟的,不能直接为数码音源使用,必然通过转换设备转为数字讯号,才能记录在数码音源载体上。播放时,数码音源设备读出的数据不能直接由传统的放大器放大,必须先转换为模拟讯号才行。可见,数码音源讯号处理过程要复杂得多。但数码音源优点很突出:信噪比和动态范围远胜模拟音源,讯号经多次复制和多个传输环节后质量不下降,这一点模拟音源无论如何也办不到。 为何数码音源能有这么出色的性能呢?关键在于数字讯号中只有0、1两种状态,无论外界干扰有多强,只要不影响到对0、1这种两种逻辑状态的褒别,最后都可以通过整形电路将干扰去除,100%的复原原始讯号。 而模拟讯号的讯息就直接承载在幅度变化上,如果受到一点外界干扰, 幅度就可能变化,讯息也就失真了,这种讯息的损伤是永久性的,无法再修复。 所以现在我们知道了,要记录声音,就要将原始的声波转换为连续的电讯号,之后我们将其转换为数字讯号(0和1的数字排列),然后刻录到CD盘面上,就可以出售了。当播放CD的时候,数字讯号被CD机读出后转换为电讯号,进入放大器放大(音响设备),又还原为最原始的声音被人耳接收。 模拟信号(电讯号)转成数字信号的过程,就称作采样。就是在采样的过程中出现了一定程度的失真,因为你无法保存连续变化的数据,只能离散地抽取一部分出来转换为二进制数据,抽取的精度和次数以及每次抽取的数据量决定了音乐的品质。 接下来需要说明音乐的音质是由什么决定的。如上所说,答案应该是采样的精度、次数和每次采样的数据量,专业术语称作比特、采样率和比特率。下面详细解释: 比特:又叫量化。影响声音的大小的物理要素是振幅,计算机上的声音必须也要能精确表示乐曲的轻响,所以一定要对声波的振幅有一个精确的描述,“比特”就是这样一个单位,x比特就是指把波形的振幅划为2的x次方个等级,根据模拟信号的轻响把它划分到某个等级中去,就可以用数字来表示了。比特数目越高,越能细致地反映声音的轻响变化。量化精度就是度量时分极的多少,好比一把尺子上刻划分级的多少,显然,分级越多度量结果便越精确。CD的量化精度为16bit(16位二进制数),换算为十进制,分级数等于65536(2的16次方)。 也就是说,以CD的标准,可以分辨出1/65536级的幅度变化。 采样率:又叫频率,单位是赫兹Hz,也就是次数。采样是把连续的模拟量用一个个离散的点来表示。显然,采样点需要足够密集,才能很好地表达原始模拟讯号的特征。每秒钟采样的次数就叫采样率,CD的采样率为44.1KHz,表示每秒钟取样44100次。 比特率:又叫码率,是指每次采样所包含的音频的数据流量,即每次采样的数据需要用多少比特来表示,单位是bps(bits per second)(注意不要把比特和比特率混为一谈,比特代表的是每次采样以多少个等级来细化数据,是精度的表示;比特率则是指每次采样的数据量,只不过单位是比特而已,是数量的表示)。 可以想象采样时的比特数目越多,每秒钟采样的次数越多,每次采样的数据量越大,音乐的质量一定越好。就好比全国人口普查,每次普查精细到村镇,每一个月普查一次,每次都要求详细的数据,一定比每次只精细到县,一年普查一次,每次只给出简单数据来的准确多了。知道了音质是由什么决定的,大家当然希望我们听到的音乐都是最好的音质了,那音质最好的格式是什么呢?答案是WAV,其音质与CD相差无几(CD是我们所能接触到的音质最好的媒介)。那为什么WAV没有广泛传播呢,原因就在于它的文件体积太大,太大则不利于传播(一首wav格式的普通歌曲,大小也在六七十兆,上百兆也很普通)。当然我们可以假设,在今后的几十年里随着网络技术和存储技术的发展,我们的网速可以无限快捷,我们的硬盘容量可以无限扩充,那么我相信其他格式的音乐一定会烟消云散,毫无立足之地,毕竟,谁不想拥有音质最好的音乐呢。 由上可知,比特数目越高,采样率越高,比特率越高,所录制的声音就越接近原始声音。正常情况下,我们接触到的音乐,都是16bit,采样率都是44.1KHz,只是比特率有所不同。为什么会这样呢?为什么只有比特率不同呢?因为CD的规格是16bit/44.1KHz,网络的mp3等音频大多也是从CD上转换过来的,为了保证音质,所以比特数和采样率都不会变化(实际上这两个数值变化后对音质产生的影响太大,所以大家都不去动它)。 比特率为什么就可以不同呢?不同的CD有不同的比特率,而转换成的mp3等音频文件可以降低比特率来获得更小的体积。一般来说市面上销售的正版CD的比特率一般是在800Kbps-1200Kbps之间,也有说是900-1400之间(超过1000Kbps的CD的音质可以说是相当好,日本的CD大部分在1000以上,国内大多在800-900之间)当然转成mp3可以只选择比特率(事实上,99%的情况下大家都是只选择比特率),网络上流行的一首大约4-5MB的mp3的比特率一般128Kbps,比特率越高的音频文件体积越大,音质也越接近原始音质。降低比特率会降低音质,但从低比特率的音频文件转换成高比特率的音频并不会提升音质,只是从低比特率转换到高比特率可能会解决一些CD播放器播放低播放器的爆音问题。 那为什么CD规格定为16bit/44.1KHz有什么根据?为什么不是其他的数字呢? 先说44.1KHz采样率的来由,这是根据著名的“乃奎斯特采样定理”得出的结果。“乃奎斯特采样定理”说:在模拟讯号数字化的过程中,如果保证采样频率大于模拟讯号最高频率2倍,就能100%精确地再还原出原始的模拟讯息。音频的最高频率为20KHz,所以采样率至少应该大于40KHz,为了留一点安全系数,再考虑到工程上的习惯,CD标准许最终选择了44.1KHz这个数值(采用44.1KHz的CD可以还原最高为22.05KHZ的频率这个值略高于人耳的听觉极限,初中课本上有写:人耳的听音范围约为20-20000HZ) 。16bit又怎么来的呢?在量化精度一问的解答中已经说过,量化精度和最终的信噪比有着直接的联系,当初制定标准时,一个主要的出发点就是要获得尽量高的信噪比。飞利浦的工程师倾向于14bit,他们认为14bit已经能获得84dB信噪比,比起模拟音源60dB左右的最高值已经有了质的提高。但崇尚规格至上的索尼工程师认为14bit无论如何也不够 ,坚持16bit的提议,最后索尼的提议获得通过。为什么不用更高的量化精度?比如20bit、24bit?因为更高的量化精度意味着更大的数据量,CD的存储容量已经不够了。现实中20bit、24bit的音乐也有,高于44.1KHz的音乐也是存在的,有的比较好的CD可以实现20甚至24bit,但极少见到。在DVD上也可以实现更高的采样率和比特率,很多DVD的音乐采样率远远超过了CD,但是这些碟子很难买到,而且也只有高档的音响才能体现出高采样率的音频的效果(普通人是无法承受高级音响的价格的,丹麦的一套高级音响可以卖到几十万美金)。其实就算体现出了效果,我们普通人的耳朵也未必能分辨出二者的不同,因为很多人连同一首歌的mp3和wav格式都听不出区别来,又何谈超高采样率的音频的音质到底有多高呢。 By the way,磁带的音质是128Kbps,mp3则最高可以达到320Kbps,CD则在800-1200Kbps之间,我们网上下载的高品质音乐大概能达到900多Kbps,音质已经相当不错了。一般来说一首320K的mp3得有10M左右大小,所以大家不要对百度上一首mp3能达到十几兆而感到惊奇了。 下面我们谈谈音乐的格式, 1、WAV格式 WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。WAV来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。 补充:无损格式,缺点:体积十分大! 2、MP3格式 MP3的全称是Moving Picture Experts Group Audio Layer III。简单的说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。MP3是利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。MP3编码质量分为:固定码率(CBR),平均码率(ABR)和动态码率(VBR)。关于MP3的编码,我们后面也有讨论,尽量让大家一次吃成个胖子,把所有的音频知识一并传授给大家。 补充:最高比特率320K,高频部分一刀切是他的缺点。音质不高! 3、WMA格式 WMA的全称是Windows Media Audio,是微软力推的一种音频格式。WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半。这对只装配32M的机型来说是相当重要的,支持了WMA和RA格式,意味着32M的空间在无形中扩大了2倍。此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版。 补充:128kbps为wma最优压缩比,128kbps wma=192kbps mp3 4、ASF格式 ASF的全称是Advanced Streaming Format,是微软所制订的一种媒体播放格式,适合在网络上播放。而Windows Media On-Demand Producer则是制作ASF档案的免费软件,让即使是初学者也能很轻易的利用现成的WAV或AVI档案制作ASF文件。 补充:少见的格式 5、AAC格式 AAC实际上是高级音频编码的缩写。AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能 来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质。 补充:目前最好的有损格式之一。有多种编码,faac,nero为常见,比特率最高448kbps。硬件支持方面,高级mp3和现在手机普遍支持。 6、Mp3Pro格式 Mp3Pro是Mp3编码格式的升级版本。MP3Pro是由瑞典Coding科技公司开发的,在保持相同的音质下同样可以把声音文件的文件量压缩到原有MP3格式的一半大小。而且可以在基本不改变文件大小的情况下改善原先的MP3音乐音质。它能够在用较低的比特率压缩音频文件的情况下,最大程度地保持压缩前的音质。MP3pro可以实现完全的兼容性。经过mp3Pro压缩的文件,扩展名仍旧是.mp3。可以在老的mp3播放器上播放。老的mp3文件可以在新的mp3pro播放器上进行播放。实现了该公司所谓的“向前向后兼容”。 补充:mp3压缩后的格式,可以这么认为 7、VQF格式 VQF格式是由YAMAHA和NTT共同开发的一种音频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的文件体积比MP3小30%50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。但VQF未公开技术标准,至今未能流行开来。 补充:少见 8、FLAC格式 FLAC即是Free Lossless Audio Codec的缩写,中文可解为无损音频压缩编码。FLAC是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如MP3 及 AAC,它不会破任何原有的音频资讯,所以可以还原音乐光盘音质。现在它已被很多软件及硬件音频产品所支持。简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样。 补充:为无损格式,较ape而言,他体积大点,但是兼容性好,编码速度快,播放器支持更广 9、APE格式 APE是目前流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前的一模一样,没有任何损失。APE的文件大小大概为CD的一半,但是随着宽带的普及,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。 补充:为无损压缩格式,较flac,他体积较小。编码速度偏慢。现在是网络上最流行的无损格式。 10、MID格式 MID是midi的简称,是它的扩展名。MIDI是英语Music Instrument Digital Interface 的缩写,翻译过来就是“数字化乐器接口”,也就是说它的真正涵义是一个供不同设备进行信号传输的接口的名称。我们如今的MIDI音乐制作全都要靠这个接口,在这个接口之间传送的信息也就叫MIDI信息。 MIDI最早是应用在电子合成器一种用键盘演奏的电子乐器上, 由于早期的电子合成器的技术规范不统一,不同的合成器的链接很困难,在1983年8月,YAMAHA、ROLAND、KAWAI等著名的电子乐器制造厂商联合指定了统一的数字化乐器接口规范,这就是MIDI1.0技术规范。此后,各种电子合成器已经电子琴等电子乐器都采用了这个统一的规范,这样,各种电子乐器就可以互相链接起来,传达MIDI信息,形成一个真正的合成音乐演奏系统。 由于多媒体计算机技术的迅速发展,计算机对数字信号的强大的处理能力,使得计算机处理MIDI信息成为顺理成章的事情了,所以,现在不少人把MIDI音乐称之为电脑音乐。事实上,利用多媒体计算机不但可以播放、创作和实时地演奏MIDI音乐。甚至可以把MIDI音乐转变成看的见的乐谱(五线谱或简谱)打印出来,反之,也可以把乐谱变成美妙的音乐。利用MIDI的这个性质,可以用于音乐教学(尤其是识谱),让学生利用计算机学习音乐知识和创作音乐。 11、OGG格式 Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想。 Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这一部分。 Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的。现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。 补充:目前最好的有损格式之一,MP3部分支持,智能手机装软件部分可以支持,最高比特率500kbps。很好的格式,很多人喜欢,网络流行度也很高。 12、M4A格式 M4A是MPEG4音频标准的文件的扩展名。在MPEG4标准中提到,普通的MPEG4文件扩展名是.mp4。自从Apple开始在它的iTunes以及 iPod中使用.m4a以区别MPEG4的视频和音频文件以来,.m4a这个扩展名变得流行了。目前,几乎所有支持MPEG4音频的软件都支持.m4a。最常用的.m4a文件是使用AAC格式的(文件),不过其他的格式,比如Apple Lossless甚至mp3也可以被放在.m4a容器里(TC注:这个container的概念类似于.mkv文件)。可以安全的把只包含音频的.mp4 文件的扩展名改成.m4a,以便让它能在你喜欢的播放器里播放,反之亦然。 13、eAAC+ eaac+格式是新一代应用于手机的最优化的音乐格式。 eaac+的扩展名为M4A。 它可以接近CD的音质,比MP3格式所占存储空间更小。 总结: 音乐爱好者常见的格式有flac ape wav mp3 aac ogg wma 其中压缩比为:aacoggmp3(wma)apeflacwav 同音质) mp3和wma以192kbps为分界线,192kbps以上mp3好,以下wma好。 最高音质:wav=flac=apeaacoggmp3wma (一般网上音乐网下载,非百度搜狗随便下载) wav=flac=ape=wmaaacoggmp3 其中 wma(有无损的,但是少见) 硬件支持方面:MP3播放器 mp3wmawavflacape aac ogg 手机 mp3wmaaac wavflac oggape 性能(就是综合音质体积编码率):aacoggflac apemp3wav wma (个人愚见) wav肯定最好,未经压缩,flac与ape是无损压缩格式,说是无损,其实经过了压缩,肯定会有小小的损失,但可以忽略。aac是有损压缩,被很多朋友误认为是无损格式,应该纠正一下。 wma最节省空间,下来是mp3和ogg。所以综合来讲,如果大家不是追求特别高的品质,用mp3就好了,因为流行度高,所以任何播放器上都能播放,兼容性好,而且网上也有很多高品质的mp3,选择320K的就好了,能满足绝大多数人的需求。若想听高品质音乐,可以试试ogg,如果还想试试CD品质,那推荐你用ape,因为相对于flac,ape虽然文件大了一点点,但是可支持设备更多,播放时占用资源也少,很多人在用。 课程继续,源头是wav,那wav文件我们从何处获得呢?可以通过抓轨将CD上的声音保存为wav格式(抓轨软件很多,随处都可搜得,使用方法早已实现了傻瓜化。教程最后的附录里我附上了EAC的抓轨教程和下载地址,EAC算是目前最完美的抓轨软件了,此软件并不是傻瓜软件,功能、设置方面有一定的专业性,大家可以参考使用。要使用其他软件的读者请移步/default.html搜索“抓轨”二字即可) 好,我们把CD抓轨后存为wav格式(也可以直接抓为flac等格式),之后要转换为mp3(注意:无疑mp3是种很成功的算法,128-320kbps范围内的编码率音乐,其音质mp3会控制的很好。但若要求码率低于128kbps,则最好压缩为wma格式,因为mp3的音质若低于128kbps,则音质会大幅下降,基本不可听,而同等条件下的wma的音质要好很多。所以如果要做码率比较低的音乐(低于128kbps),就压缩为wma,此时wma的音质要比mp3高出很多,如64Kbps时,wma基本与128Kbps的mp3相差无几;在32Kbps时wma依然可听,mp3已经绝对不可听了,切记),mp3是有损压缩格式,那能把声音文件压缩为mp3格式的软件是哪个呢?能压缩mp3的软件不少,甚至千千静听也能完成此项工作,但是毫无疑问,最好用、最专业的还是lame(就好像很多人用千千、酷狗来播放音乐,但却不知foobar才是音频播放的王者),lame的使用其实也很简单,教程最后附上lame下载地址和其使用教程供大家参考。 现在我们就假设大家已经掌握了eac和lame的使用方法,下面开始将抓出来的wav转换为mp3,问题又来了,mp3有三种码率,各有优缺,应该如何取舍呢?CBR(Constant Bitrate)常数比特率:指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,但音质却不会有明显的提高。优点是压缩快,能被大多数软件和设备支持,缺点是占用空间相对大,效果不十分理想,现已逐步被VBR的方式取代。VBR(Variable Bitrate)动态比特率:也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率。这是Xing发展的算法,他们将一首歌的复杂部分用高Bitrate编码,简单部分用低Bitrate编码。主意虽然不错,可惜Xing编码器的VBR算法很差,音质与CBR相去甚远。幸运的是,Lame完美地优化了VBR算法,使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式,是发展趋势,也是大家都推荐的编码模式。使用这个方式时,你可以选择从最差音质/最大压缩比到最好音质最低压缩比之间的种种过渡级数,在MP3文件编码之时,程序会尝试保持所选定的整个文件的品质,将选择适合音乐文件的不同部分的比特率来编码。主要优点是可以让整首歌都能大致达到我们的品质要求,缺点是编码时无法估计压缩出来的文件大小。ABR(Average Bitrate)平均比特率:是VBR的一种插值参数。Lame针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”,它是在指定的平均Bitrate内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量。举例来说,当指定用192kbps ABR对一段wav文件进行编码时,Lame会将该文件的85%用192kbps固定编码,然后对剩余15%进行动态优化:复杂部分用高于192kbps来编码、简单部分用低于192kbps来编码。与192kbps CBR相比,192kbps ABR在文件大小上相差不多,音质却提高不少。ABR编码在速度上是VBR编码的2到3倍,在128-256kbps范围内质量要好于CBR。可以做为VBR和CBR的一种折衷选择。 简单来说,呃,现在使用CBR进行压缩的比较少,大家都比较钟情于VBR,ABR嘛,如上所说,理论上ABR音质要比VBR好,但是相应的文件体积肯定要大,所以还是推荐压缩成VBR。 所以整个过程就是这样,抓轨-存为wma-转为mp3,其中有些参数肯定需要大家设置,这些在我们的音频知识中都有涉及,大家按自己所需选择就是了,下面附上此款教程相关的软件和教程(教程提取自网上,未进行加工,保存为mht格式,大家下载后直接用网页浏览器打开即可)。 教程完毕(本篇文章未介绍ape格式的压缩方法、压缩软件、软件教程以及ape转mp3的方法,这两天我会自行再补一篇关于ape的文章,这些内容都有涉及,谁让ape现在这么火呢)。音频知识及音频格式大全一、名词解释【比特率】这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。比特率与音频压缩的关系简单的说就是比特率越高音质就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。VBR(Variable Bitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;ABR(Average Bitrate)平均比特率 是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。CBR(Constant Bitrate),常数比特率 指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。【采样率】是指在数字录音时,单位时间内对音频信号进行采样的次数.它以赫兹(HZ)或千赫兹(KHZ)为单位.通常来说,采样率越高,单位时间内对声音采样的次数就越多,这样音质就越好.MP3音乐的采样率一般是44.1KHZ,即每秒要对声音进行44100次分析,记录下每次分析之间的差别.采样越高,获得的声音信息也就越完整.如果要对频率范围在20-20000HZ之间的声音信息进行正确采样,声音必须按不低于40000HZ的采样频率进行采样.降低声音文件的采样率,文件的体积会减小,但声音的失真现象也会越明显.因此,采样率涉及到如何协调声音文件的体积与声音的比例关系。几种音频的采样率 采样率质量级别用途48KHZ演播质量数字媒体上的声音或音乐44.1KHZCD质量高保真声音或音乐 32KHZ接近CD质量数字摄像机音频 22.05KHZ FM收音质量短的高质量音乐片断 11KHZ可接受的音乐长音乐片断 5KHZ 可接受的话音简单的声音,电话有损音频格式音质排名在最佳编码器版本、最佳编码参数的情况下:160kbpsOGG或AACMPC170kbpsMPCAAC或Lame mp3二、音乐格式分类音乐格式五花八门,多如牛毛,但不外乎分为两大类:一类为:音乐指令文件(如MIDI),一般由音乐创作软件制作而成,它实质上是一种音乐演奏的命令,不包括具体的声音数据,故文件很小;另一类为:声音文件,是通过录音设备录制的原始声音,其实质上是一种二进制的采样数据,故文件较大。从播放形式上,声音文件还可以分为“音频流”和“非音频流”两种,前者能够一边下载一边收听,比如“.WMA”、“.RA”、“.MOV”等,后者则不能。所谓流媒体技术就是把连续的影像和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不需要翟畸个压缩文件全部下载到自己机器后才可以观看的技术。三、各种音乐格式MIDI乐器数字接口(Musical Instrument Digital Interface)的英文缩写,是数字音乐/电子合成乐器的统一国际标准。MIDI规范由美、曰几家著名电子乐器厂商于1983年共同制定,目的是解决各种电子乐器间存在的兼容性问题。MIDI规范不仅定义了电脑音乐程序、音乐合成器及其它电子音乐设备交换音乐信号的方式,而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,能很容易地模拟钢琴、小提琴等传统乐器的声音。MIDI本身并不能发出声音,它是一个协议,只包含用于产生特定声音的指令,而这些指令则包括调用何种MIDI设备的音色、声音的强弱及持续的时间等。电脑把这些指令交由声卡去合成相应的声音(如依指令发出钢琴声或小提琴声等)。最初,因为不同MIDI设备的乐器音色排列方法不一,所以会造成同一MIDI文件在不同的设备上会出现完全不同的放音效果(比如一个钢琴音色的MIDI文件,在不同设备上播放时会变成小提琴或者小号的音色)。为避免出现这种混乱情况,GM(General MIDI,通用MIDI)标准被提出并得到了Windows操作系统的支持,得到了相当广泛的应用。它规定了前128种常用乐器音色的编排方式,例如1号是钢琴、66号是萨克斯管等等。GM标准还描述了成为GM兼容格式的硬件设备应具有的其它特征,如GM标准音源同时发音数不少于24,MIDI通道为16,第10通道为打击乐声部等等,它实际上是对MIDI规范的补充。 Roland公司提出的GS标准在兼容GM标准的基础上,对其进行了发展,增强了音乐的表现力它提供比GM标准数量更多的打击乐器组和更多的特殊音效。GS标准具有广泛的软硬件适应性,包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等。后来,Yamaha公司又提出了基于GM标准的XG标准。相对于保存真实采样数据的声音文件,MIDI文件显得更加紧凑,其文件的大小要比WAV文件小得多一分钟的WAV文件约要占用10MB的硬盘空间,而一分钟的MIDI却只有区区的3.4KB。现在,MIDI已经成为电脑音乐的代名词。电脑播放MIDI文件时, 有两种方法合成声音: FM合成和波表合成。FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出来产生声音。采用波表合成技术可以产生更逼真的声音。MIDI文件有几个变通的格式,其中CMF文件是随声卡一起使用的音乐文件,与MIDI文件非常相似,只是文件头略有差别;另一种MIDI文件是Windows使用的RIFF文件的一种子格式,称为RMID,扩展名为RMI。WAV由Microsoft公司开发的一种WAV声音文件格式,是如今电脑上最为常见的声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITT Law和其它压缩算法,支持多种音频位数、采样频率和声道,但其缺点是文件体积较大(一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间),所以不适合长时间记录。MPEG(Moving Picture Experts Group,活动图像专家组)代表的是MPEG活动影音压缩标准,MPEG音频文件指的是MPEG标准中的声音部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别与MP1、MP2和MP3这三种声音文件相对应。MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为41和6181,而MP3的压缩率则高达101121,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。因此,目前Internet上的音乐格式以MP3最为常见。MP3为降低声音失真采取了名为“感官编码技术”的编码算法:编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。MP3问世不久,就凭着较高的压缩比(12:1)和较好的音质创造了一个全新的音乐领域。然而,MP3的开放性却最终不可避免地导致了版权之争。在这样的背景下,文件更小、音质更佳,同时还能有效保护版权的MP4就应运而生了。MP4与MP3之间其实并没有必然的联系。首先,MP3是一种音频压缩的国际技术标准,而MP4却是一个商标的名称。其次,它采用的音频压缩技术也迥然不同,MP4采用的是美国电话电报公司(ATT)所研发的、以“知觉编码”为关键技术的a2b音乐压缩技术(http:/www.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司法合伙人合同协议书
- 全屋软装设计合同协议书
- 三人合伙养殖合同协议书
- 2025炎陵县合同范本
- 企业托管服务协议书范本
- 医院疫情患者家属协议书
- app技术外包合同范本
- 合伙开家政创业合同范本
- 合同权利义务转让的协议
- 代理销售家具的合同范本
- 初中全册英语常用3500词分类大全
- 电视摄像与画面编辑第1章课件
- 幕墙预埋件专项施工方案
- HDX8000系列安装配置操作指南
- 白虎汤分析课件
- 山东青年政治学院校徽校标
- 2022版义务教育英语课程标准之学业质量标准与考试评价解读PPT
- (高清正版)JJF(浙)1102-2014生物人工气候箱校准规范
- 完整解读新版《义务教育课程方案》2022年《义务教育课程方案(2022版)》PPT课件
- 《文殊真实名经》
- 幼儿各年龄段发展评估指南
评论
0/150
提交评论