第一章 音频处理(周莉)_第1页
第一章 音频处理(周莉)_第2页
第一章 音频处理(周莉)_第3页
第一章 音频处理(周莉)_第4页
第一章 音频处理(周莉)_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

音频处理 音频信号是人类获取外界信息的重要途径之一 也是多媒体素材处 理的基本内容之一 声音信号携带着大量有用的信息 它也可以增 强对其他类型媒体表达的信息的理解 现在的计算机都配备了声卡 能够对声音进行录制 编辑 合成 使用计算机对音频素材进行采 集 编辑处理 使其产生更加丰富 完美的声音效果 再运用到多 媒体作品中 能使多媒体作品具有更强的表现力 1 1 数字音频技术基础知识 1 1 1 声音的基本概念 声音是人类感知自然的重要媒介 人类的听觉和视觉起到认识自然 的重要作用 在多媒体产品中 声音是必不可少的对象 其主要表 现形式是语音 自然声和音乐 通过对声音的运用 使人们更加形 象 直观 容易地认识事物所表现的内容 在多媒体应用系统 多 媒体广告 数字媒体等领域 声音的作用显得尤为重要 音频 Audio 是人们用来传递信息最方便 最熟悉的方式 是多媒 体系统使用最多的信息载体 多媒体技术的发展 使计算机处理音 频信息达到比较成熟的阶段 音频信号可以携带大量精确的信息 音频是通过一定介质 如空气 水等 传播的一种连续波 在物理 学中称为声波 声音的强弱体现在声波压力的大小上 和振幅相关 音调的高低体现在声波的频率上 和周期相关 如图所示 1 振幅 声波的振幅就是通常所说的音量 在声学中用来定量研究空气受到 的压力大小 2 周期 声音信号以规则的时间间隔重复出现 这个时间间隔称为声音信号 的周期 用秒来表示 3 频率 声音信号的频率是指信号每秒变化的次数 用赫兹 Hz 表示 人 们把频率小于 20Hz 的信号称为亚音信号或次声波信号 频率范围为 20Hz 20KHz 的信号称为音频 Audio 信号 人耳可以接收的声音信 号范围 高于 20KHz 的信号称为超音信号 或称为超声波信号 另 外 人所发出的声音信号频率范围大致在 200Hz 到 3400Hz 之间 因 此把这一范围的声音信号称为话音信号 在多媒体技术中 处理的 声音信号主要是音频信号 它包括音乐 语音等 4 带宽 带宽是指频率覆盖的范围 此术语同样应用于计算机网络中 它表 示在一条通信线路上可以传输的载波频率范围 它是网络中十分重 要的因素 因为一条信道的传输能力和它的带宽有直接的联系 对 声音信号的分析表明 声音信号由许多频率不同的信号组成 多种 频率信号称为复合信号 单一频率信号称为分量信号 声音信号的 带宽用来描述组成复合信号的频率范围 如高保真声音的频率范围 为 10Hz 20KHz 它的带宽约为 20KHz 声音有三要素 分别是响度 音调 音色 1 响度 响度又称音量 表示声音能量的强弱程度 大小主要取决于声音接 收处的声波振幅 单位是分贝 dB 人耳感受到的声音强弱 是人 对声音大小的一个主观感觉量 就同一声源来说 波幅传播得愈远 响度愈小 当传播距离一定时 声源振幅愈大 响度愈大 当声音 的频率 声波的波形改变时 人对响度大小的感觉也将发生变化 2 音调 声音的高低称为音调 表示人耳对声音调子高低的主观感受 音调 的高低主要取决于声波频率的高低 单位是赫兹 Hz 频率高则音 调高 频率低则音调低 通常自然界和乐器发出的声波都是复音 波形复杂 所以音调的高低 实际由很多因素所决定 3 音色 音色又称音品 表示声音的品质 音色由声音波形的谐波频谱和包 络决定 声音是由空气分子振动而产生的 是一个随时间变化的连 续信号 做简谐振动的发声体发出的声音是纯音 也称单音 纯音 一般只能由专用设备产生 波形可以近似地看成一种周期函数的图 形 自然界的声音 乐器发出的声音一般是由若干个频率和振幅都 不同的纯音所组成的复音 复音中频率最低的纯音称为基音 它是 决定音调的基本要素 复音中存在的其他频率的纯音是复音中的次 要成分 称为谐音 基音和谐音合成复音 决定了特定的声音音质 和音色 复音中包括基音和泛音 基音的频率最低 由发音体全段 振动产生 泛音由发音体各部分振动产生 每个复音都包括固有音 调的基音以及不同频率和响度的泛音 通过不同的泛音可以区别其 他具有相同基音的复音 形成独特的音色 例如合奏的二胡 月琴 琵琶 虽然产生的基音的音调和响度基本相同 但由于泛音的音调 和响度不同 也就是音色不同 给人们的听觉感受完全不同 1 1 2 常用的数字音频文件格式 数字音频文件格式有很多种 常用的有 WAV MIDI CDA MP3 RM WMA 等 下面分别介绍它们的特点和用 途 1 WAV 格式 WAV 格式是微软公司开发的一种声音文件格式 它符合 RIFF Resource Interchange File Format 文件规范 用于保存 Windows 平台的音频信息 是目前计算机最为流行的声音文件格式 Windows 以及几乎所有的音频编辑软件 多媒体制作软件都支持 WAV 格式 WAV 格式记录实际声音采样数据 可以重现各种声音 标准 格式的 WAV 文件采用 44 1KHz 的采样频率 16 位量化位数 音质接 近 CD 但由于存储时不经过压缩 文件占用的存储空间很大 不适 合长时间记录高质量声音 为了减少 WAV 文件的数据量 通常在进 行声音素材处理时根据不同声音类型选取合适的采样频率和量化位 数 例如解说语音采用 11 025KHz 的采样频率 8 位量化位数 CD 音质音乐采用 44 1KHz 的采样频率 16 位量化位数 2 MIDI 格式 MIDI Musical Instrument Digital Interface 电子音乐数字接口 是一种串行接口标准 允许将音乐合成器 乐器和计算机连接起来 现在的计算机声卡支持 MIDI 合成技术 允许数字合成器与计算机及 其他设备交换数据 声卡将来源于各种音源的声音信号转换为数字 信号并以 MIDI 文件形式存入计算机 MIDI 文件并不记录录制好的 声音 而是记录如何再现声音的一组指令 这些指令包括指定发声 乐器 力度 音量 延迟时间和通信编号等信息 MIDI 文件占用存 储空间小 1 分钟的 MIDI 音乐只需要大约 10KB 的存储空间 可以 满足记录长时间音乐的需要 MIDI 文件重放的效果完全依赖声卡的 档次 但通常缺乏重现自然真实声音的能力 MIDI 文件主要用于原 始乐器作品 游戏音轨 电子贺卡背景音乐 手机铃声等 3 CDA 格式 CDA 格式文件只存放于音乐 CD 中 大多数音频播放软件都支持 CDA 格式 标准 CD 采用 44 1KHz 的采样频率 88Kbps 的速率 16 位量 化位数 CD 的数字化过程是近似无损的 声音基本上忠于原声 具 有很好的音质 CDA 文件并不是真正的包含声音信息 它只是一个 索引信号 所以不论 CD 音乐的长短 在计算机上看到的 CDA 文件都 是 44KB 也不能直接将 CDA 文件复制到硬盘上播放 如果需要使用 CDA 格式的音频素材 需要使用 Advanced CD Ripper Pro 或者 CoolEdit Pro 等音频编辑软件的抓轨功能将 CDA 格式的文件转换成 WAV 或 MP3 格式 4 MP3 格式 MP3 是 MPEG 1 标准组成中的音频编码标准 根据压缩质量和编码处 理的不同分为三层 分别对应 MP1 MP2 MP3 三种声音文件 MP3 音频文件的压缩是一种有损压缩 MP3 音频编码具有 10 1 12 1 的 高压缩比 能基本保持低音频部分不失真 但 MP3 压缩算法牺牲了 声音文件中 12 16kHz 的高音频部分的质量来减小文件所占的存储空 间 相同长度的音乐文件 MP3 文件所占的存储容量一般只有 WAV 文件的 1 10 音质要稍次于 CDA 格式或 WAV 格式的声音文件 随着 Internet 的发展和普及 MP3 凭借其优美的音质和高压缩比而成为 流行的音频格式 5 RA 格式 RA RealAudio 是 Real 公司开发的网络流媒体文件格式 RA 文件使 用流媒体技术 将连续不断的音频分割成一个一个带有顺序标记的 数据包 这些数据包通过网络进行传递 接收的时候由接收方将这 些数据包重新按顺序组织起来播放 如果网络质量太差 有些数据 包收不到或者延缓到达 它们就会被跳过不播放 以保证用户聆听 的内容是基本连续的 RA 文件可以很小并且质量损失不大 有利于 在网络上传输并实时播放 6 WMA 格式 WMA Windows Media Audio 是微软公司力推的数字音乐格式 其最 大的特点是具有版权保护功能并且比 MP3 更强大的压缩能力 WMA 格式的可保护性极强 甚至能限定播放机器 播放时间及播放次数 这对作为版权拥有者的唱片公司来说是一种相当有用的压缩技术 除了版权保护外 WMA 还在压缩比上进行了深化 在较低的采样频 率下也能产生较好的音质 64kbps 的 WMA 在波形还原后的效果要好 于 128kbps 的 MP3 另外 Windows Media 支持网络流媒体技术 所 以 WMA 格式能够在网络上实现实时播放 1 2 数字音频处理 1 2 1 CoolEditPro 功能简介 CoolEditPro 是一个功能强大的音乐编辑软件 可以运行在 Windows95 NT 及后续版本 Windows 操作系统下 能高质量地完成录 音 编辑 合成等多种任务 只要拥有它和一台配备了声卡的电脑 也就等于同时拥有了一台多轨数码录音机 一台音乐编辑机和一台 专业合成器 CoolEditPro 能记录的音源包括 CD 卡座 话筒等多种 并可以对 它们进行降噪 扩音 剪接等处理 还可以给它们添加立体环绕 淡入淡出 3D 回响等奇妙音效 制成的音频文件 除了可以保存为 常见的 wav 格式外 也可以直接压缩为 MP3 或 WMA 文件 放到互联 网上或 E mail 给朋友 大家共同欣赏 当然 如果需要 你还可以 烧录到 CD 上 甚至 借助于 CoolEditPro 对采样频率为 96kHz 分 辨率为 24 位录音的支持 你还以制作更高品质的 DVD 音频文件 CoolEditPro 能够自动保存意外中断的工作 你花很长时间编辑一 首音乐 眼看大功告成 这时突然停电 或因其它原因死机 如果 文件尚未保存 这通常是灭顶之灾 你的心血将付之东流 不过 使用 CoolEditPro 却不然 你可以重新启动 CoolEditPro 重新恢 复到上次的工作状态 甚至包括剪贴板中的内容也不列外 CoolEditPro 不仅适合于专业人员 也适合那些只是偶尔发一回 烧 或者想圆一下早年音乐梦的人 为此 CoolEditPro 提供了 一些 傻瓜 功能 例如 在音效处理方面 行家固然可以熟练地 细调各项设置以求最佳 而新手则可以抛开这些 直接选择一种预 置 Presets 模式 同样能生成令人吃惊的特殊效果 至于 CoolEditPro 的常规编辑功能 如剪切 粘贴 移动等 跟在字处 理器中编辑文本一样简单 而且这里你有六个剪贴板可用 使编辑 工作更加轻松方便 CoolEditPro 对文件的操作是非损伤性的 你 对文件进行的各种编辑 在保存之前 不会对原文件有丝毫改变 因此 如果你是新手 你尽可放开手脚 大胆尝试各种操作 不满 意的话 可以多次取消 Undo 还原重来 1 2 2 CoolEditPro 音频处理实验 实验一 录音 降噪和剪辑处理实验 实验目的 掌握用 CoolEditPro 对声音进行编辑 实验内容 1 录音 CoolEditPro 可以录制多种音源 包括 话筒 录音机 CD 播放机 等 将这些设备连接好 然后将录音电平调到适当位置 就可以准 备录音了 1 启动 CoolEditPro 主界面如图 1 2 单击 File New 在弹出的新波形窗口设置通道 Channels 分辨率 Resolution 和采样频率 SampleRate 我们可选择 CD 音质的设置 Stereo 16 bit 44100Hz 3 单击 OK 返回主界面 如图 单击左下角的红色录音按钮 开始录音 同时用 CD 播放器播放 CD 音源 4 单击停止键停止录音 声音波形如图 2 降噪 已经录制的声音文件 往往会混入一些系统噪声和环境噪声 这时 就有必要降噪 降噪方法大致有采样 滤波 噪音门等几种 效果 最好的应该是采样降噪法 其基本办法是 首先分析噪声源频谱特 性并取样 然后削弱整个声音文件中符合噪声特征的部分 因此 我们在开始正式录制之前 最好先在声音文件中录制几秒钟的空白 片段 这样就可以轻易获得背景噪音的频谱特征了 1 用放大工具调整波形大小 其中为横向缩放 为纵向缩放 用 鼠标选择声音的噪声部分 选中部分变白 样本应尽量采用声音波 形振幅最小 最平直的噪音部分 一般为没有音乐信号的间隔处 这样可以包括最基本的噪音要素 更加利于提高准确性 如图 2 单击 Effects NoiseReduction NoiseReduction 弹出降噪窗口 设置如图 5 单击 GetProfilefromSelection 几 秒钟后在降噪窗口出现噪音样本的轮廓图 如图 6 3 单击 OK 返回主界面 4 双击声音文件的波形将其全部选中 然后再次打开 NoiseReduction 对话框 如果直接使用刚才分析获得的背景噪音 可以单击 OK 这样在录音过程中与样本一致的声音都会被自动删 除 还可以调整 NoiseReductionLevel 的数值设置噪音减少水平 完成设置后 单击 OK 将噪音删除 此时我们会在主界面看到原来 的背景噪音部分已经变成一条直线了 3 剪辑 在录音时因为操作需要或者我们仅需要录制音频信号中的一段 这 时我们需要做剪辑操作以保留我们需的音频部分而去除不需要的空 白部分或者其它 1 用放大工具放缩波形到适当大小 可以准确选择部分波形 用 鼠标选择录音中不要的部分 选中部分变白 2 在选中部分上单击鼠标右键 选择快捷菜单中的剪切或都清除 命令 即可去除空白或多余部分而留下我们所需的音频信号 4 增加混响效果 如果我们录制的音频文件因为录音环境不好 采声效果差 就会听 起来觉得干巴巴的 不像磁带或者 CD 音乐那么 湿润 对此我们在 后期进行调节 可以得到一些补偿 1 单击 Effects DelayEffects Reverb FullReverb 是更复杂 更精细的混响调节选项 弹出混响效果 窗口 如图 8 可以调节参数来达到自己想要的效果 也可以在 Presets 栏中选择 一些系统预设的模拟混响效果 比如 宽广而空旷的礼堂 宽广而 拥挤的礼堂 等等 我们可选择中等的礼堂 但是 混响的添加对于 声音的影响非常大 必须细致地调节 反复地聆听 直到有一个满 意的结果 否则 宁可不要添加效果 2 拖动 TotalReverbLength 滑块调整混响长度 混响长度是信号 反射回来所需的时间 0 400 一般用来模拟小房间的混响效果 400 800 用来模拟中等大小的房间环境 800 以上的数值用来模拟 礼堂 剧院等较大空间的效果 当数值在 3000 以上 可以模拟那种 非常空旷的效果 3 拖动 AttackTime 滑块调整信号电平的增高时间 我们可以设置 为混响长度的 10 一般情况下 当 TotalReverbLength 较大的时 候 设置较大的 AttackTime 但有时为了获得一些特殊的混响效果 也可以反过来设置较小的 AttackTime 4 拖动 HighFrequencyAbsorptionTime 滑块调整高频吸收时间 在现实环境中 声音的高频会更快地被吸收 调整这个参数就可以 模拟出这种现实效果 较短的吸收时间选择 可用来模拟那些布满 家具 桌椅 地毯等易吸音物体的环境 而较长的数值 比如大于 1000ms 的选择 可用来模拟那些空旷的环境 比如体育场 礼堂等 5 拖动 SmoothPerceptionEchoey 滑块调整感知度 这个参数用来 更加精细地调节混响的特性 一般来说 较小的取值带来的混响效 果比较 平整 常用来模仿较小的空间 而较大的取值 比如大于 60 可以带来变化更多的混响效果 常用来模仿比较大的空间 当 Perception 取 100 ReverbLength 取 2000ms 或者更高的时候 可 以模拟出很有趣的峡谷效果 6 拖动 Mixing 滑块调节未添加混响效果的声音信号 dry 和添 加了混响的声音 wet 的比例大小 一般情况下 添加了混响的声 音信号 wet 应该低于原信号 dry 当然这并不绝对 要根据 你想得到的效果来决定 7 单击 Preview 预听效果 如果满意 单击 OK 实验二 制作歌曲伴奏 1 用豪杰超级解霸中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论