音频信息处理要点PPT学习教案_第1页
音频信息处理要点PPT学习教案_第2页
音频信息处理要点PPT学习教案_第3页
音频信息处理要点PPT学习教案_第4页
音频信息处理要点PPT学习教案_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学12.1 2.1 音频处理基础音频处理基础 1. 1. 声波声波 (1 1)声波:)声波:由各种机械振动或气流扰动引起周围的弹性媒质发生波动。由各种机械振动或气流扰动引起周围的弹性媒质发生波动。 (2 2)声源:)声源:产生声波的物体,如人的声带和乐器等。产生声波的物体,如人的声带和乐器等。 (3 3)声音:)声音:人的听觉系统所能感知到的声波。人的听觉系统所能感知到的声波。 音频的频率范围:音频的频率范围:20 Hz 20 Hz 20000 Hz20000 Hz 语音的频率范围:语音的频率范围:300 Hz 300 Hz 3000 Hz3000 Hz 次声波的频率范围:次声波的频率范围

2、: 20 Hz 20 kHz 20 kHz(4 4)声强:)声强:对于一定频率的声音,要能引起听觉,其声强也有一定的对于一定频率的声音,要能引起听觉,其声强也有一定的范围。范围。 下限:是恰能引起人听觉的最小声强,叫做该频率的下限:是恰能引起人听觉的最小声强,叫做该频率的可闻阈可闻阈; 上限:是指人耳能听闻的最大声强,高于上限的声强,人耳感觉上限:是指人耳能听闻的最大声强,高于上限的声强,人耳感觉疼痛,所以叫做该频率的疼痛,所以叫做该频率的疼痛阈疼痛阈。第1页/共33页常见声音的分贝量级分贝数分贝数低于低于2020202040404040606060607070707090909090听觉效果

3、听觉效果能分辨能分辨轻声轻声正常交谈声正常交谈声吵闹吵闹很吵很吵听力受损听力受损第2页/共33页第3页/共33页质量质量频率范围频率范围采样频率采样频率(kHzkHz)采样精度采样精度(bitsbits)声道数声道数数据率(非压缩)数据率(非压缩)(kB/skB/s)电话电话2002003400 Hz3400 Hz8 88 8单道声单道声8 8AMAM1001005500Hz5500Hz11.02511.0258 8单道声单道声11.011.0FMFM202011000Hz11000Hz22.05022.0501616立体声立体声88.288.2CD-DACD-DA5 520000Hz2000

4、0Hz44.144.11616立体声立体声176.4176.4DVDDVD0 096000Hz96000Hz19219224246 6声道声道120012002 2)信噪比()信噪比(SNRSNR):即有用信号与噪音信号的强度之比,单位是分贝。:即有用信号与噪音信号的强度之比,单位是分贝。3) 3) 声音主观质量的度量:声音主观质量的度量:主观度量就是大多数人对声音质量的感觉。主观度量就是大多数人对声音质量的感觉。第4页/共33页00)sin()(nnntnAtf0: 声音的基音,决定了音调的高低声音的基音,决定了音调的高低n0: 声音的泛音,决定了声音的音色声音的泛音,决定了声音的音色An

5、: 声波的振幅,表示声音的强弱声波的振幅,表示声音的强弱第5页/共33页2 2)音频信号的波形表示)音频信号的波形表示3 3)音频信号的频谱表示)音频信号的频谱表示 声音信号的频率分布曲线。复杂的声音是由振幅和频率不同的正弦声波叠声音信号的频率分布曲线。复杂的声音是由振幅和频率不同的正弦声波叠加而成的,这些正弦波的幅值按频率排列的图形就叫做频谱。加而成的,这些正弦波的幅值按频率排列的图形就叫做频谱。 男声的基频较低,低频分量更加丰富,因此听起来会更加低沉、浑厚。男声的基频较低,低频分量更加丰富,因此听起来会更加低沉、浑厚。第6页/共33页2.1.2 2.1.2 音频信号的数字化音频信号的数字化

6、第7页/共33页第8页/共33页第9页/共33页标准标准编码方法编码方法采样频率采样频率采样精度采样精度数据传输率数据传输率G.711G.711PCMPCM8kHz8kHz8 8位位64kb/s64kb/sG.721G.721ADPCMADPCM8kHz8kHz8 8位位32kb/s32kb/sG.723G.723ADPCMADPCM8kHz8kHz8 8位位24kb/s24kb/sG.728G.728LD-CELPLD-CELP8kHz8kHz8 8位位16kb/s16kb/s电话质量的语音压缩标准电话质量的语音压缩标准 MPEG音频:第一个高保真立体声音频压缩的国际标准 MPEG音频压缩标

7、准提供三个独立的压缩层次: 1)Layer 1:编码器简单,输出数据率为384 kb/s,主要用于小型数字盒式磁带。 2)Layer 2:编码器较复杂,输出数据率为256 kb/s192kb/s,主要应用于数字广播声音、数字音乐、CD-I和VCD等。3)Layer 3:编码器复杂,输出数据率为64kb/s,主要用于ISDN上的声音传输。第10页/共33页第11页/共33页数字音频工作站 第12页/共33页(1)语音识别技术)语音识别技术1 1)语音识别的发展)语音识别的发展n5050年代年代:AT&T Bell:AT&T Bell实验室实现了第一个可实验室实现了第一个可识别十个

8、英文数字的语音识别系统识别十个英文数字的语音识别系统AudryAudry系统。系统。n6060年代:提出动态规划(年代:提出动态规划(DPDP)和线性预测)和线性预测分析技术(分析技术(LPLP)。)。n7070年代:提出了动态时间归正技术(年代:提出了动态时间归正技术(DTWDTW),矢量量化(),矢量量化(VQVQ)和隐马尔可夫模型()和隐马尔可夫模型(HMMHMM)理论,实现了特定人孤立语音识别)理论,实现了特定人孤立语音识别系统。系统。n9090年代:开始进入实用阶段年代:开始进入实用阶段。第13页/共33页第14页/共33页单轨编辑界面单轨编辑界面2.2.3 Audition2.2.

9、3 Audition界面及基本操作界面及基本操作 第15页/共33页多轨编辑界面第16页/共33页第17页/共33页2.2.4 2.2.4 音频信号获取音频信号获取 直接读取计算机磁盘上的音频文件; 提取视频信息中的音频信号; 直接录音。Audition允许同时进行多音轨录音,当然需要有相应的硬件支持,比如多个音频输入接口、多个录音源等。 1 1录音前声卡设置录音前声卡设置 “选项 | Windows 录音控制台 ”2 2建立录音文件建立录音文件3 3导入伴奏音乐导入伴奏音乐4 4控制录音电平控制录音电平5 5录制声音录制声音第18页/共33页2.2.5 2.2.5 音频编辑音频编辑n单轨编辑

10、状态:单轨编辑状态:可以进行波形的各种编辑处理和效果的设置,还可以分别对左右声道单独进行编辑处理。n多轨编辑状态多轨编辑状态:适合对多个音频轨道进行编辑、录制和合成处理。最多可以同时处理的轨道数为128个。按钮“R”R”表示录音、表示录音、“S”S”表示独奏、表示独奏、“M”M”表示静音表示静音。 1 1常用编辑常用编辑(1 1)裁剪音频波形)裁剪音频波形n 波形的选择波形的选择n 波形的删除波形的删除n 波形的移动与复制波形的移动与复制n 混合工具混合工具:拖曳左键选中波形,拖曳右键移动波形。n 时间选择工具时间选择工具:拖曳左键选中波形。n 移动移动/复制剪辑工具复制剪辑工具:拖曳左键移动

11、波形,拖曳右键移动或复制。n 刷选工具刷选工具:拖曳左键可以播放选中波形。第19页/共33页(2 2)切分和合并音频)切分和合并音频 在多轨编辑状态下,可以对活动音轨上的波形进行分割,使其变成多个波形片段,定位播放线,执行“剪辑|分割”或右击鼠标点选“分割”。 使两段波形首尾相接,按住Ctrl键将两段波形都选中,执行“剪辑|合并”或右击鼠标点选“合并”即可完成。(3 3)锁定音频波形)锁定音频波形 锁定使音频的绝对时间位置不变。(4 4)编组音频波形)编组音频波形 编组则可以使多个音频片段的相对位置固定,移动时可整体移动。 第20页/共33页2 2包络编辑包络编辑(1 1)音量包络编辑)音量包

12、络编辑 音量包络是指音频波形随时间变化而产生的音量变化,也即是音量变化的走势曲线。通过控制音量包络曲线来改变某音轨上音频信号的音量大小,是一个非常直观和简单有效的方法。(2 2)声相包络编辑)声相包络编辑 声相就是声音在左右声道中所处的位置。声相包络线处于中间时(0点),声音在左右声道中达到平衡的效果,声相包络线位于上半部,声音偏向左声道,声相包络线位于下半部,声音偏向右声道。 第21页/共33页(3 3)音量淡化包络编辑)音量淡化包络编辑 Audition提供了简单快速的音量淡化包络。在音乐制作领域,淡化(fade)指音量的逐渐变化,音量由小到大变化称为淡入(fade in),音量由大到小变

13、化称为淡出(fade out)。3 3时间伸缩时间伸缩用于改变声音播放的速度,且不影响音高。“查看|启用剪辑时间伸展” 时间伸缩第22页/共33页2.2.6 2.2.6 加载效果器加载效果器 加载效果器按照使用方法可分为:n 插入效果器插入效果器:作用的声音范围是一整条音轨;n 波形效果器:波形效果器:作用于音轨中的某一段音频片段;n 总线效果器:总线效果器:加载在总线通道上的效果器,它使所有的音轨加入相同的效果器; 1 1插入效果器插入效果器 多轨编辑下多轨编辑下第23页/共33页2 2波形效果器波形效果器单轨编辑下,允许多个音频片段分别进行效果设置。 第24页/共33页2.2.7 2.2.

14、7 效果器效果器Audition的效果器按照功能分为:n 振幅类效果器振幅类效果器n 滤波类效果器滤波类效果器n 延迟类效果器延迟类效果器n 降噪类效果器降噪类效果器n 波形发生类效果器波形发生类效果器n 声码器声码器 第25页/共33页1 1动态处理效果器动态处理效果器 属于幅度类效果器,用于将某个范围内的声音电平按比例增大或缩小。 第26页/共33页2 2嘶声抑制降噪器嘶声抑制降噪器 降噪类效果器可以精确分析音频信号中的嗡嗡类噪音进行消除,也可以根据实际录音环境进行噪声消除。 嘶声抑制降噪器可以消除音频信号中的高频嘶嘶声。第27页/共33页3 3合奏效果器合奏效果器属于延迟类效果器。对人声

15、进行润色可以使发薄的声音变得厚实丰满。合奏效果器第28页/共33页2.3.1 2.3.1 消除人声消除人声1 1、采用、采用VSTVST插件直接消除插件直接消除 菜单“效果|幅度|通道混音器”,在预设效果中选择“Vocal Cut”2 2、将双声道转换为单声道、将双声道转换为单声道 菜单“编辑|转换采样类型” 选中“单声道” 左混音:100% 右混音:-100% 第29页/共33页2.3.2 2.3.2 穿插录音技术穿插录音技术穿插录音:用于对已经录制好的声音片段进行重新录制。1、首先选定不满意的声音片段2、右击选择“穿插入”,选定部分变为空白,轨道左边的“R”处于按下状态3、点按“录音”按钮,那么声音将自动录制在选定的片段。选择要重新录音的片段,右击选择“穿插入”进入录音状态第30页/共33页2.3.3 2.3.3 声音信号降噪处理声音信号降噪处理噪声样本“效果|恢复|降噪处理” 第31页/共33页2.3.4 2.3.4 配乐诗朗诵制作配乐诗朗诵制作1 1、 导入背景音乐导入背景音乐2 2、 录制诗朗诵录制诗朗诵 3 3、 声音的降噪处理声音的降噪处理4 4、 声音幅度调整声音幅度调整 :使用效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论