




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
陕西航空职业技术学院2010-2011学年数字视听设备选修课论文MP3音频格式实用宝典作者:刘阿粉陕西航空职业技术学院 电子工程系汽车电子技术0834102摘要:音频信息检索技术是多媒体信息检索技术中的一个重要组成部分,而音频分类技术作为音频检索技术的基础,也越来越被受到关注。基于内容的音频分类是一个涵盖十分广泛的研究领域,这个领域的研究从初始对原始音频流分析向目前感知理解发展,从实际认识向抽象理解发展。 本文设计了一种在压缩域上对音频进行基于内容的分类系统,并对系统的分层结构和系统各个模块的实现方法和原理进行了深入的分析和探讨。另外,本文还对从压缩音频中提取参数的含义做了较透彻的分析。并通过实验结果检验了方法的有效性,在理论和实践两方面验证了方法的正确性和可行性。关键词:音频格式 研究 编码器 相互转换 压缩音频 有效性引言:网络数字音乐的风潮是由MP3所引起的,它是MPEG1Layer3的缩写,据 说是由德国某工作室在研究如何抓取CD音轨时衍生出的计算机文件格式。MP3本是一种压缩与解压缩的计算方式,用来处理高压缩比的声音信息。1 技术原理1.1 音频格式数字化音频格式的出现,是为了满足复制、存储、传输的需求。简单的说,早期的模拟音频格式,存在着复制失真和因为介质磨损而失效的问题。从CD盘的存储开始,数字格式音频文件开始普及,但又产生了一个问题存储体积上的限制,同时CD盘仍然存在磨损的现象,如果保存到硬盘上(相对存储时间更长),在当时存储介质(主要是硬盘)仍然昂贵的情况下,也不是好的解决方法。而互联网的出现,更产生了远距离传输文件的要求,在带宽的制约下,缩小文件体积的需求变得更加强烈,这些都从外部因素上导致了有损压缩数字音频格式产生! 而从内部因素来说,随着电脑运算、编码能力的提高、各种声学心理模式的进步,促进了各种有损压缩数字音频格式的层出不穷。如果光从历史及现在曾经涌现出的编码格式来看,应该会列举出很多,而在MP3机上使用的音频格式,向大家介绍的主要有如下几种MP3(CBR、VBR、ABR)、WMA、ADPCM。1.1.1 MP3(CBR、VBR、ABR) MP3应该算目前使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德国夫朗和费研究院和法国汤姆生公司合作发展成功。刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。早期的MP3编码采用的的是固定编码率的方式(CBR ),笔者们常看到的128KBPS,就是代表它是以128KBPS固定数据速率编码你可以提高这个编码率,最高可以到320KBPS,音质会更好,自然,文件的体积会相应增大。因为MP3的编码方式是开放的,你可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以,很快由Xing公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码,简单部分用低 bitrate 编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的Xing 编码器的 VBR 算法很差,音质与 CBR (固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的VBR算法,使得效果一直在改进。目前公认比较好的首推 LAME,它完美地实现了 VBR 算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。 而在VBR的基础上,LAME更加发展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。1.1.2 WMA WMA是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。不管怎么说,微软想介入的领域,它总能凭着自己的强大实力和在软件上的垄断地位,获得它想要的东西(尽管技术上它并不总是最出色)这场战争应该是微软在数码音频格式领域的另一个IE与Netscape的战争版本。一种格式的流行,乃至成为一种使用数量上的标准,除了技术因素外,还取决于其他的因素。就笔者个人的看法,先入为主的影响是很大的,以MP3来说,正因为目前它在用户规模上是最大的,所以尽管它的压缩比、音质、版权保护方面都存在缺点,但是用户很容易形成一种惯性获得MP3文件越容易,越多用户加入这个行列;反过来促进越多文件采用这种格式存储这就形成了一个正向循环,加上因为更多的播放软件支持MP3、更多的第三方开发更先进的编码算法,这些都推动MP3在自身格式上的进步,又导致用户使用上的更加普及。 所以,短期内笔者个人还是看好MP3格式的发展除了上面提到的非技术因素外,随着存储介质容量和网络带宽的进一步增大,压缩比或许正变得不那么重要了(笔者现在敢大胆的使用高于192KBPS码率压缩自己的CD,遇到经典的,笔者甚至直接使用320KBPS,原因无它,笔者的电脑硬盘是40G,而这个配置还在逐渐落伍);版权保护也是双刃剑,对厂商而言是好事,对用户则是排斥的心理。因此,在本章节的最后,笔者并不做MP3、WMA格式与其他格式的对比,仅以这两个目前在MP3机上使用最频繁的格式来做一番对比。从压缩比角度来说,在低于192KBPS的条件下,WMA可以在同样音质条件下获得比MP3文件更小的体积甚至一半。所以如果你的MP3容量并不大,而且你并不追求音质的更完美(特别当你的用途是听一些英语教材、相声、评书类不要求音质、回放效果的时候),假如你的MP3机支持WMA格式的播放,那么恭喜你你的MP3机容量可以变相的增大一倍。反过来,如果你的MP3容量有够大(目前的主流应该是往128M发展),而且又注重音质感受,那么强烈建议你使用LAME压缩算法平均192KBPS以上码率压缩,你会发现,和你往常使用的128KBPS码率文件相比,会获得不同的感受(当然,还和MP3机的音质处理效果、耳机的选择相关)。 这些是使用中获得的感受。但是更重要的是自己去尝试因为MP3机正越来越往多档次方向发展高、中、低端的MP3日趋细分:质量、功能、价格上都如是,只有配合自己的具体机型,通过实践,才能找到适合自己的格式及编码率。 1.1.3 ADPCM格式这个格式常用在MP3机的录音方面。常看到某款具有录音功能的MP3机在参数介绍上会标注“支持MP3,WMA,ADPCM格式”。它其实也是一种编码格式,但针对的是文件体积的更小自然音质上就没有什么优秀可言了。比如作为采访时的录音,32M的闪存,用这种格式录制,可以存储大约2个小时的录音。从音质和文件大小的统一性来说,应该是目前一个好的解决方案。除了外录(采访、课堂录音)外,还有的MP3机使用这种格式进行对CD、磁带机的直接录制。可想而知,这样的源文件你还是以英语读物、相声类的为主,如果你想要录制音乐类的,劝你还是放弃,这种格式录制出来的效果用来听音乐只能用惨不能睹来形容。2 应用技巧2.1 音频格式的制作 音频格式文件的制作,应该包括两个范围:1是从无损压缩文件(一般是WAV格式,而在这之前的一般是从CD、DVD、其他MPEG-4格式抓取成WAV格式),转换到MP3或WMA格式;2是这两种格式的相互转换以及其他格式文件(主要是RM、ADPCM)转换成这两种格式。而在谈及这些方面的时候,实际就是常用软件的使用通过相应的软件,才能实现目的,侧重于基本原理介绍后的具体常用软件的基本操作。2.1.1 WAV格式的抓取(兼谈CD抓轨的保真)WAV格式作为无损压缩格式,可以说是转换到其他格式的一个基本途径。通过专门的抓轨软件,将音频以WAV格式保存下来。实现这个目的的软件很多,笔者们以流行的EAC为例子来说明。在使用EAC之前,首先还要告诉大家注意几个问题:1.CD的质量。这点很多朋友不注意,以为CD就是最好的音质,其实不同的CD,因为材料、制作工艺、保护程度(磨损),对最终结果都有很大的影响。2.光驱的问题。现在光驱的速度是越来越快了,但反映到抓取音轨上,不见得速度快得就更好,笔者曾经用过不同的光驱,对结果的影响就很大(不光抓取速度,还有最终结果)。所以好的抓轨软件,能让你在这两面通过自己的设定,解决很多问题。(以下以EAC V0.9 beta 4汉化版为例) 打开EAC,出现主界面后,首先点击上方菜单的“EAC”,在跳出的EAC OPTIONS新窗口里选择“Extraction”栏目,在这里有几个选项要注意:1、“用静音填充丢失的偏移采样”:建议选择。这样在出现丢失数据时会以静音补充,防止出现噪音;2、“CRC 计算时不使用空的采样”:上一项选择了这项就不要选择了。3、“音轨间同步”:建议选择。目的是为了在音轨的衔接处进行抖动与同步校正,以避免在前后音轨之间的衔接处出现爆音或停顿。4、“差错恢复品质”:共有高、中、低三个选项。越高的纠错品质越好,当然,速度就相对更慢。放一张CD到你的光驱里,很快CD的曲目内容出现在主界面上。这时你可以根据自己的光驱特点进行驱动器设定了。接下来是上面菜单的第二个选项“驱动器选项”:推荐“安全模式”,以及该项目下的“驱动器具备精确流特性”、“驱动器可缓冲音频数据”。 这些影响抓轨质量的设定完成后,就可以开始抓轨了(强烈推荐把抓轨和压缩分开,这样对有问题的音轨可以直接跳过,以免影响总体进度)。抓轨的操作很简单,设定好存放目录后,点击左边快捷栏里的“WAV”选项,就会将CD的所有音轨自动进行抓取并保存成WAV格式(当然,你也可以选定自己想抓的某个特定音轨抓取)。EAC会在结束后给出抓轨报告,如果没问题的话会显示顺利完成,无差错发生。2.1.2 MP3文件的制作在上面制作的无损格式WAV的基础上,笔者们就可以开始制作MP3和WMA文件了,先来说说MP3文件的制作。这里要用到的是大名鼎鼎的LAME。LAME 是 LAME Ain“t an Mp3 Encoder的简称,应该是目前制作MP3格式最好的编码器之一了。常见的LAME EXE格式是一个DOS下的应用程序,对普通使用者来说,应该说掌握起来有一定难度,因此,网上有很多LAME的外壳程序(可以通过笔者们熟悉的WIN窗口方式调用LAME,更符合一般用户的使用习惯),比较知名的有LAMER、RAZORLAME、WINLAME,这里要介绍上面提到的EAC通过它,你可以很方便的实现从抓轨到压缩。 EAC在调用LAME进行压缩前你首先要做一些设定:打开“EAC”选项的“压缩选项”,在跳出的窗口里选择“外部压缩程序”。里面有笔者们需要设定的几个地方:1、“使用外部程序”:当然要选择了。“参数使用方案”里找到“LAME MP3 Encoder”。然后是“用于压缩的程序所在路径”,通过右边的“浏览”按纽指定LAME的位置。2、“追加的命令行选项”:这项就是关键所在。如果你填上了,下面的“比特率”就会忽略,以这里的命令为准则。3、CBR格式:如果选择CBR格式压缩,则“追加的命令行选项”处不要填,通过“比特率”这个项目选择从96320KBPS的不同压缩率。 这样设定好后,就可以开始压缩了,从WAV格式压缩起,所以选择菜单里的“工具”“压缩WAV格式”,在跳出的浏览器里选择所要压缩的WAV文件(支持多选),完成选择后“确定”,好了,坐下来慢慢休息吧,很快笔者们自己制作的准HI-FI级别MP3就会出现在你预先设定的目录里了。结束语 为了更好的学习数字视听设备,了解关于多媒体技术方向相关压缩视频、音频格式的基本操作方法,掌握此类设计的技巧,mp3的音频格式实用宝典论文,在写作的过程中,学到了很多书本上没有的知识,并将自己所学的理论知识与实际操作相结合,更好的学习和巩固这门课程参考文献1 肖向东;何春会 低码率编码技术的应用和发展 2 胡振;张正华 一种适合低码率无线视频
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025甘肃电投集团紧缺专业人才招聘27人笔试备考试题含答案详解(培优b卷)
- 2024-2025学年医学检验(士)能力提升B卷题库附答案详解(培优B卷)
- 2025年研究报告撰写咨询合同
- 2024年执业药师题库检测试题打印【真题汇编】附答案详解
- 2025教师聘用合同书样本
- 2025地下综合管廊建设承揽施工合同范本下载
- 2025版集体劳动合同范文
- 2024年安全员考试考前冲刺练习及答案详解【夺冠系列】
- 2025年测量工竞赛试题及答案
- 2025年远程医疗的医患关系研究
- 2025至2030中国聚烯烃行业项目调研及市场前景预测评估报告
- 2025四川达州宣汉县国有资产管理服务中心县属国有企业招聘劳动合同职工26人笔试历年参考题库附带答案详解
- 2025年下半年杭州市上城区丁兰街道办事处招聘编外工作人员11人考试参考题库及答案解析
- 2025年合肥市广播电视台(文广集团)招聘12人考试参考题库及答案解析
- 2025年大队委竞选面试题库及答案
- 2025年信用管理专业题库- 信用管理对企业市场风险的控制
- 6.2 用7~9的乘法口诀求商(课件)数学青岛版二年级上册(新教材)
- 物流会计面试试题及答案
- 人物速写眼睛课件
- DB61T 1188-2018 足部修护技术规范
- 普通饮片车间共线生产风险评估报告
评论
0/150
提交评论