版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
声音与计算机“给电影加声音就像给维纳斯雕像涂口红。”——玛丽·皮克福德(20世纪20年代电影女演员)主题概述为什么要使用声音?哪里可以找到声音?什么是声音?采样率样本量声音剪辑为什么要压缩?如何压缩?文件格式什么是MIDI文件?在网络上发布声音哪里可以找到Sound?创造你自己的声音:使用电脑操作系统自带的录音程序(例如录音机)对着连接在电脑上的麦克风讲话——音质不会很好。录音棚配备DAT(数字音频磁带)设备等,可进行数字录音。制作高质量的商业产品。合成器等电子乐器可以用来创建音乐音频文件。将乐器连接到电脑后,就可以将声音以MIDI(乐器数字接口)格式捕获。什么是声音?声音是空气的压力波将声音想象成一系列重复出现的波,称为波形。问题:波形的哪一部分表示声音的音量?问题:波形的哪一部分表示音调或频率?音量——波峰越高,声音越大。音调或频率——波的间距越小,音调越高。什么是声音?声带肌肉振动,带动空气流动,从而产生声音(一系列波)。两个人说话(或者一个人说话加音乐)会产生两组重叠的波。这些重叠的波实际上形成了一个新的波。钟声哦播放音频片段计算机如何表示声音?计算机必须以某种方式表示波形。问题:当计算机需要表示某个事物时,它总是会做哪两件事?样本量化计算机如何表示声音问题:在下面的声波图像中,如果我们每隔5个单位对波形进行一次采样,会发现什么问题?01234567891011121314奈奎斯特极限这条规则规定,对于声波的每个周期,你必须至少采集2个样本。如果采集的样本少于2个,你将得到完全不同的声波:问题:以下哪种声波的音调更高?问题:奈奎斯特极限规则对于采集高音调声音的样本与采集低音调声音的样本有何影响?采样我们必须在每个波次中采集至少2个样本。问:每个波形采集大量样本的优势是什么?问:每次波形采集大量样本的缺点是什么?每秒采样数以赫兹(Hz)为单位。每秒1000个样本的数量以千赫兹(kHz)表示。要达到CD音质,我们需要每秒44,100个采样点,也就是44,100Hz或44.1kHz。采样率采样率每秒音频采样数或每秒波形测量次数。采样率每个点代表一个样本:典型采样率仅语音(电话音质)→8kHzAM收音机质量11.025kHz调频广播质量22kHzCD品质音乐44.1kHz采样率示例其中一帧的采样频率为8000Hz(8KHz),另一帧的采样频率为16000Hz(16KHz)。问题:哪个听起来更好?问:哪个听起来更好?一二量化——(又称样本量)既然我们知道了我们将有多少个样本(可能是22KHz或44.1KHz中的一个),我们该如何表示这两个样本呢?问题:1位声音会是什么样子?(想想1位、8位或24位颜色)010000101010样本量如果用2位采样呢?(这样就只有4个音调(甚至比一个音阶的音符还少,所以只有Doh、Ra、Me、Fa,而没有So、La、Te、Doh。不过要记住,这些位代表的是音调,而不是音符!)1110010001000101110110011101样本量CD使用16位速率(每个样本可以有65,536个可能的值)问:对于给定的样本大小,更高的比特率有什么优势?问:对于这个样本大小,使用更高的比特率有什么缺点?样本量样本量问:你能分辨出哪个质量更好吗?一二三我不能
声波是如何转换成可以存储在我们电脑上的格式的?计算机有一个声卡,它可以对来自麦克风的声波进行采样(设置采样次数并量化)。声卡具有用于录音的模数转换器(ADC)和用于播放音频的数模转换器(DAC)。操作系统(Windows、MacOSX、Linux等)与声卡通信,以实际处理录音和播放操作。测试你的听力声音剪辑现在我们已经把声音文件导入电脑了,接下来我们来编辑这个声音片段。我们可以对它做什么呢?重新排列波形剪切、复制、拖动、修剪波形的各个部分重叠两个或多个音频片段找到你想删除的词语,并将其从波形图中剪掉。调整音量使用放大、淡入、淡出、包络、标准化有时,即使音量设置相同,某些CD中的歌曲播放起来也会比其他CD中的歌曲响亮得多。音量标准化通过扫描音频文件,找到峰值或平均音量,并按比例增加或减少音量,从而校正这种差异,达到所需的音量水平。声音剪辑降噪降低嘶嘶声给定频率范围内的噪声降噪/消除软件会检查音频,找出波形中的异常差异并将其消除。由于软件需要分析音频以生成异常统计信息,因此需要比嘶嘶声消除更长的音频片段。特效添加回声,改变部分音调下采样并降低位深度→即压缩,为什么要压缩?为什么要压缩音频?以下是一段1分钟的无损CD音质音频示例:录制1分钟→60秒60*44,100个样本/秒
2,646,000个样本2,646,000个样本*每个样本16位
42,336,000位42,336,000比特*2(立体声,2声道)
84,672,000比特84,672,000比特/(8比特/字节)
10,884,100大约10MB(兆字节)!!!一张普通的CD大约可以存储737MB(或80分钟的音频)。声音压缩策略
4种基本策略:减少样本数量(采样率)降低位深度(采样大小)减少频道使用合适的编解码器进行压缩降低采样率将采样率从44kHz降至22kHz(这会影响音质)例如:请访问此页面上的音频演示:注意:在其他条件不变的情况下,样本数量减半,文件大小大约也会减半。文件类型(均为8位)文件大小44千赫兹1.3MB22千赫兹424KB11千赫兹120KB减少样本量从16位降到8位(这会影响画质)注意:在其他条件不变的情况下,将位深度减半,文件大小大约也会减半。文件类型(全部为22KHz)文件大小16位740KB8位424KB减少通道数量单声道只有一个声道立体声有两个声道将立体声改为单声道会使文件大小减少一半。选择合适的编解码器编解码器可分为有损编解码器和无损编解码器。注意:几乎所有编解码器都是有损的!使用有损编解码器的文件格式:问:请问有人知道最流行的有损压缩音频文件格式是什么吗?提示:90年代初开始流行可以将CD中的歌曲(CD中的歌曲为44KHz、16位且未压缩)压缩为:只有它实际大小的1/11!基于这样一种想法:当另一种音调出现时,某些音调会变得听不见。在瑞典电视台SVT于2009年制作的一部关于这首歌历史的纪录片中,布兰登堡说道:
“我当时正在完成我的博士论文,然后我在阅读一本高保真音响杂志时发现,他们曾用这首歌来测试扬声器。我想,‘好吧,让我们测试一下这首歌对我的音响系统,尤其是mp3格式的播放效果有什么影响。’结果发现,在其他所有声音听起来都相当不错的比特率下,苏珊娜·维加的嗓音听起来却很糟糕。”[8]布兰登堡将这首歌用于测试,每次改进方案时都会反复聆听,以确保不会对维加嗓音的细腻之处造成不利影响。
卡尔海因茨·勃兰登堡音频压缩编解码器/压缩的文件格式:有一些,但并不常见。常见的未压缩文件格式:.wav(非常常见,44KHz,16位).aiffCDDA(《红皮书》中定义的光盘数字音频,包含音频标准)→CD标准,44KHz,每采样16位,2声道。因此,播放1秒钟的音乐所需的比特率为:
44100*16*2*1=1,411,200比特/秒=1411.2千比特/秒与mp3相比:128Kbps是最常见的,这使得它非常适合互联网!音频压缩注意:.wma和.mp4是有损格式,并且内置了锁定功能,这也是微软和苹果力推它们的原因;-)以前,如果你在Flash动画中添加声音,就不用担心声音无法播放的问题,因为每台电脑都自带FlashPlayer(无需下载插件)。然而,iPad和其他苹果产品无法播放Flash,所以这种说法已经不像以前那么正确了!音频格式文件扩展名优势缺点高级音频压缩.aac音质良好在iTunes上使用YouTube上使用过iPhone、PlayStation、黑莓受保护的副本仅限经批准的设备音频交换格式.aif/.aiff音质极佳无需插件即可支持Mac格式未压缩的大文件MP3.mp3经过压缩,音质依然很好。可通过网络播放需要独立播放器或浏览器插件RealAudio.ra,.rx高压缩非常小的文件可以通过网络直播音质不太好需要播放器或插件海浪.wav音质良好无需插件即可支持未压缩的超大文件WindowsMediaAudio.wma好的
即使经过压缩,音质依然出色。用于音乐下载网站文件可以进行防复制保护需要WindowsMediaPlayer9或更高版本音频文件格式MIDI音效还有另一种完全不同的发声方式(而不是操纵声波)。问:MIDI文件是如何工作的?MIDI音乐MIDI处理的是音乐和合成声音,它不太擅长处理人声或噪音。存储MIDI文件时不会进行采样或量化。MIDI文件包含有关音乐或声音的信息,例如:应该代表哪种乐器?正在演奏的音符纸条被按压的力度有多大?问:各位音乐家,你们还能想到它还需要存储关于音符的哪些信息吗?MIDI文件Cubase和Finale等软件可用于创建和编辑MIDI音乐。问:MIDI软件提供五线谱视图,你认为这意味着什么?问:MIDI文件有哪些优势?问:MIDI文件有哪些缺点?注意:3分钟的MIDI文件大约10KB,3分钟的未压缩波形文件大约15MB。参加MIDI测试!MIDI录音的问题在于它们有时过于完美。听听这两段录音,看看你是否明白我们的意思:一二问:你能分辨出哪个是现场演奏,哪个是MIDI文件吗?音频也可以串流播放!可下载音频流媒体音频优势缺点优势缺点下载完成后,可以反复播放、编辑(无需再次等待下载)。下载时间很长,尤其是下载大文件时。立即播放无法倒带、暂停等。发布文件不需要专门的流媒体服务器存储它会占用电脑磁盘空间仅在游戏运行时占用内存,游戏结束后即被释放。需要专门的服务器才能发布。例如:Limewire上的音频文件例如:CBC广播电台在网络上发布声音可以:页面上会有一个音乐链接,用户点击后才会播放。只有用户点击链接后,网页上才会开始播放音乐。<p>下载
<ahref="dearmom.wav">音频文件</a>
</p>将音乐嵌入网页:
<audiocontrolsloop>
<sourcesrc="dearmom.wav"type=“audio/mpeg”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 骨科患者营养状况评估
- 辽宁省沈阳市铁西区达标名校2026届初三5月月考(物理试题理)试题含解析
- 河南省林州市第七中学2025-2026学年初三4月质量检测试题物理试题含解析
- 河南省2025-2026学年初三押题信息卷物理试题(三)含解析
- 广东省高州市谢鸡镇达标名校2026届初三第一次调研考试数学试题含解析
- 骨科手术前后护理
- 湖北省黄石市阳新一中卓越联盟2026年中考物理试题命题比赛模拟试卷(27)含解析
- 腹泻时小儿的心理护理
- 老年骨质疏松症患者的运动康复
- 智研咨询发布-2026年中国颈椎病用药行业现状、发展环境及投资前景分析报告
- 2025年上海中烟机械技术中心限责任公司招聘高频重点提升(共500题)附带答案详解
- 铁路劳动安全 课件 第三章 防洪抢险
- 《Animate CC 动画制作案例教程(第2版)》中职全套教学课件
- 【MOOC】数据库系统(上):模型与语言-哈尔滨工业大学 中国大学慕课MOOC答案
- 医院品管圈(QCC)活动成果报告书-基于QFD 润心服务改善 ICU 患者及家属就医体验
- 基于PLC的物料分拣系统设计
- JJG 693-2011可燃气体检测报警器
- 《低压配电设备安装与调试》课件 劳动 学习任务 3 落地式配电柜安装与调试
- 研究性课题研究报告高中生
- 国开网电大市场调查形成性考核第三次考核答案
- 关键信息基础设施安全保护要求
评论
0/150
提交评论