多媒体课件——第二章音频.ppt

上传人：门*** IP属地：江西上传时间：2020-02-24 格式：PPT 页数：54 大小：4.49MB 积分：20 举报 版权申诉

免费预览已结束，剩余49页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

联系电话 6503178 主讲教师信息科学系王兵 MultimediaTechnology 第二章音频音频声音是表达思想和情感的一种必不可少的媒体也是多媒体信息中一个重要组成部分声音的种类有很多从人的说话声乐声到风声雨声当它能与文字图像等结合一起传递信息时计算机世界才会变得如此丰富多彩目录数字音频基础 1 MIDI与音乐合成 2 声卡 3 4 音频处理软件CoolEdit 语音识别技术周期两个相邻信号波峰之间的时间间隔振幅波形顶峰或低点与基准线的距离频率每秒钟内波峰的数目或周期数量单位Hz 2 1数字音频基础声音是通过一定介质传播的一种连续波可通过振幅 amplitude 周期 period 与频率 frequency 来表示波形声音一声音的基本概念声波声音按频率分类人类说话声音频率范围 300Hz 3kHz 2 1数字音频基础声音三要素音调与声音的频率有关频率高则声音高频率低则声音低音强又称响度取决于声音的幅度也即振幅决定声音的大小和强弱 2 1数字音频基础音色由混入基音的泛音所决定的每个基音都有其固有频率和不同音强的泛音因此使得每个声音具有特殊的音色效果 2 1数字音频基础自然界的声音大多属于非周期信号包含一定频带的所有频率分量其频谱是连续谱连续谱的成份使声音听起来饱满生动声音的连续谱几种常见的声音频宽声音的方向感声音的传播是以声波形式进行的由于人类的耳朵能够判别出声波到达左右耳的相对时差和声音强度所有能判断出声音的来源方向同时也由于空间使声音来回反射造成了声音的特殊空间效果声音是时基类媒体声音具有过程性是强实时连续的二声音的数字化 2 1数字音频基础 1 声音信号的类型模拟信号把在时间和幅度上都是连续的信号称为模拟信号数字信号时间和幅度都用离散的数字表示的信号模拟信号数字信号 2 声音数字化过程 2 1数字音频基础采样在某个特定时刻对模拟量进行测量每隔一定时间对模拟信号幅值进行测量即在时间上将模拟信号离散化量化用有限个幅度值近似原来连续变化的幅度值把模拟信号的连续幅度变为有限数量的有一定间隔的离散值编码按照一定规律将量化后的值用二进制数字表示然后转化成二值或多值的数字信号流 2 1数字音频基础 2 1数字音频基础 3 声音数字化三要素数据量 bytes s 采样频率 Hz s 量化位数 bit 声道数 8 2 1数字音频基础采样频率采样精度声道数 4 声音数字化计算公式 1 WAV文件WAV是Windows所使用的标准数字音频文件也称波形文件因未经压缩文件数据量很大特点声音层次丰富还原音质好2 MP3文件MP3 MPEGAudiolayer3 是一种按MPEG标准的音频压缩技术制作的音频文件特点高压缩比 1 11 优美音质 2 1数字音频基础三数字音频的文件格式 3 WMA文件WMA的全称是WindowsMediaAudio 它是微软公司推出的与MP3格式齐名的一种新的音频格式特点在压缩比和音质方面都超过了MP34 MIDI文件MIDI 乐器数字接口是一组声音或乐器符号的集合特点数据量很小缺乏重现自然音 2 1数字音频基础 2 2MIDI与音乐合成一 MIDI简介 MIDI是一种乐器和计算机之间通话的语言 MIDI产生声音的方法与声音波形采样输入的方法有很大不同它不是将模拟信号进行数字编码而是把MIDI音乐设备上产生的每个动作记录下来比如我们在电子键盘上演奏 MIDI文件记录的不是实际乐器发出的声音而是记录你弹奏时弹的是第几个键按键按了多长时间等等我们把这些记录的参数叫做指令 MIDI文件就是记录这些指令就是因为这个原因相同时间长度的MIDI音乐文件一般都比常用的波形文件 wav 小得多 MIDI是MusicalInstrumentDigitalInterface 乐器数字接口的缩写是音乐和计算机结合的产物用于在音乐合成器电子乐器计算机之间交换音乐信息的一种标准协议 2 2MIDI与音乐合成二 MIDI音乐制作系统结构 MIDI输入设备通过MIDI接口与计算机相连 MIDI依靠这个接口传递消息来进行彼此通信这样计算机可通过音序器软件来采集MIDl输入设备发出的一系列消息或指令并记录到以 mid为扩展名的MIDI文件中在计算机上音序器可对MIDI文件进行编辑和修改最后将MIDI文件送往音乐合成器由合成器将MIDI文件进行解释并产生波形然后通过声音发生器送往扬声器播放出来 MIDI键盘电子琴虚拟键盘系统的核心设备按照标准MIDI格式记录曲子控制MIDI数据转换为音频输出模拟乐器发声的设备 2 2MIDI与音乐合成三 MIDI合成器合成器是一种电子设备大多情况装在声音卡上合成器把以数字形式表示的声音转换回原来的模拟信号波形再送回喇叭产生声音效果它的核心是合成器芯片利用合成器产生MIDI乐音的主要方法是调频FM FrequencyModulation 合成法和波形表WT WaveTable 合成法调频合成法 FM合成法是20世纪80年代初由美国斯坦福大学的JohnChowning发明的 FM合成法生成乐音的基本原理是用数字信号来表示不同乐音的波形然后把它们组合起来再通过数模转换器 DAC 生成乐音播放简单来说 FM合成法就是通过多个频率的声音混合来模拟乐器声音的方法使用FM合成法来产生各种逼真的乐音是相当困难的有些乐音几乎不能产生目前的声卡一般采用乐音样本合成法即波形表合成法它把真实乐器发出的声音以数字的形式记录存储起来播放时根据命令生成各种音阶的音符产生高质量的声音 2 2MIDI与音乐合成波形表合成法 WAVE和MIDI音乐的比较 2 3声卡一声卡的功能 1 声卡简介声音卡或音频卡 AudioCard 是负责录音播音和声音合成的一种多媒体板卡也是计算机进行所有与声音相关处理的硬件单元典型的产品 Creative创新公司的SoundBlaster 2 声卡的功能录音和播放数字声音文件控制声音的音量对声音文件压缩解压缩语音合成与语音识别声音效果合成 2 3声卡二声卡的组成原理总线接口芯片为声卡的各个部分与系统总线提供握手信号同时它也是命令和数据的缓冲器在声卡与系统总线之间传输命令与数据音乐合成器负责将数字音频波形数据或MIDI消息合成为声音完成声音信号从模拟到数字和从数字到模拟的相互转换可以完成各种信号的记录和播放任务还可以完成许多处理工作如ADPCM音频压缩与解压缩运算改变采样频率解释MIDI指令或符号以及控制和协调直接存储器访问工作可以将不同途径如话筒或线路输入 CD输入的声音信号进行混合此外混音器还为用户提供软件控制音量的功能三声卡的I O接口 2 3声卡线性输入接口 LineIn 可与录音机 CD唱机和音响等相连进行播放或录音话筒输入接口 MicIn 可与话筒相连进行语音的录入线性输出接口 Lineout 可跳过声卡的内置放大器而连接一个有源音箱或外接放大器进行音频的输出扬声器输出接口 SpeakOut 从声卡内置功率放大器连接扬声器进行信号输出游戏棒 MIDI接口 Joystick MIDI 可将游戏杆或MIDI设备如MIDI键盘连接到声卡上 2 3声卡四声卡的技术指标 2 3声卡 3 DSP芯片在一些较高档的声卡上都带有数字信号处理器 DSP 芯片这是一种专门的数据处理器可以通过软件编程来完成音频处理和压缩等任务从而减轻CPU的压力 5 CD ROM接口许多声卡提供了CD ROM接口使得通过音频卡直接播放CD音乐 4 音频压缩声卡应支持几种标准的音频压缩算法 7 输出声道数声道数简言之就是此声卡芯片支持输出的音箱数量一般可以分为单声道双声道 4 1声道 5 1声道甚至7 1声道声卡目前市场上主流的声卡芯片一般都支持2个以上的声道 2 3声卡创新公司的5 1声卡音箱 6 软件支持应具有DOS和Windows环境的驱动程序以及功能强大的音频信息处理实用工具 2 3声卡 4 1音箱主音箱背面低音炮放大卫星音箱与主音箱连接音箱和声卡连接线音箱摆放小知识如何连接4 1音箱 2 4语音识别技术一语音识别的发展历史 1952 Bell实验室研制可识别十个英文数字的语音识别器 Audry系统 60 80 动态规划 DP 线性预测 LP 矢量量化 VQ 隐马尔可夫模型 HMM 人工神经元网络 ANN 特定人孤立词小词汇量语音识别系统 1988 卡内基梅隆大学研制SPHINX系统非特定人大词汇量连续语音 1997 IBM公司开发出汉语ViaVoice语音识别系统 ViaVoice98 地方口音语音识别分为训练和识别两个阶段训练阶段是在机器中建立被识别语音的样板或模式库或者对已存在机器中的样板或模式做特定发音人的适用性修整在识别阶段将被识别的语音特征参量提取出来进行模式匹配相似度最大者即为被识别语音 2 4语音识别技术二语音识别的基本原理预处理部分包括语音信号采样反混叠带通滤波去除个体发音差异和设备环境引起的噪声影响等并涉及语音识别基元的选取和端点检测问题特征提取部分用于提取语音中反映本质特征的声学参数如平均能量平均跨零率共振峰等训练在识别之前进行通过让讲话者多次重复语音从原始语音样本中去除冗余信息保留关键数据再按照一定规则对数据加以聚类形成模式库模式匹配部分是整个语音识别系统的核心它是根据一定的准则以及专家知识计算输入特征与库存模式之间的相似度判断出输入语音的语义信息 2 4语音识别技术三语音识别系统的分类语音识别研究的最终目标是要实现大词汇量非特定人连续语音的识别 2 4语音识别技术四语音识别软件ViaVoice 目前汉字输入的方式主要有四种键盘输入手写输入扫描输入和语音输入键盘输入键盘输入基本上是基于各种输入法主要又分为字形输入法和拼音输入法键盘输入法在输入速度有要求的情况下对于键盘操作指法要求比较高手写输入手写输入是最容易上手的输入方法扫描输入扫描输入对于硬件要求比较高主要是适用于资料的整理语音输入语音输入对输入人员的键盘操作能力指法要求很低几乎可以说你只要会说汉语就可以进行语音输入 ViaVoice语音识别系统可用于声控打字和语音导航只要对着微机讲话不用敲键盘即可打汉字每分钟可输入150个汉字是键盘输入的两倍是普通手写输入的六倍该系统识别率可达95 以上并配备了高性能的麦克风使用便利特别适合于起草文稿撰写文章和准备教案是文职人员作家和教育工作者的良好助手 2 4语音识别技术 2 5音频处理软件CoolEdit CoolEdit是著名的数字音频软件制作公司Syntrillium开发的一款功能十分强大的数字音频处理软件它分为CoolEditPro和CoolEdit2000两个版本前者是全功能的专业版后者是其简化版本节以CoolEditPro2 0中文汉化版为例简要介绍它的功能 CoolEditPro2 0集成了几个相当专业且高效的音频处理工具功能十分强大它可以同时处理多达128路音频信号并且可以对每一路音频信号单独进行编辑处理加入不同的音效特效如压缩扩展回响回声失真延迟放大等它不但能处理多种声音文件的格式还能直接从CD或VCD中摘录声音处理后的声音还可以以各种各样的格式输出 2 5音频处理软件CoolEdit 一 CoolEditPro2 0安装及窗口组成 3 破解 2 汉化 1 安装 2 5音频处理软件CoolEdit 波形单轨编辑窗口 2 5音频处理软件CoolEdit 多轨混音编辑窗口 1 将话筒插入电脑声卡的麦克风插孔开启话筒电源 2 启动CoolEditPro后切换到波形单轨编辑窗口 3 选择菜单文件新建出现新建波形对话框选择适当的采样率声道数采样精度如图所示 4 按下操作区的按钮开始录音 5 单击操作区左上角的按钮就可以停止录音 6 通过单击按钮进行试听 7 保存二单轨音频基本编辑方法 2 5音频处理软件CoolEdit 1 录音 2 5音频处理软件CoolEdit 2 摘录 CoolEditPro可以从CD或VCD中摘录声音现以CD为例步骤如下 1 将CD放入光驱中选择菜单文件从CD中提取音频 2 在音轨下拉文本框中选择要提取的音轨单击确定如图所示 3 通过菜单文件另存为选择需要的类型进行保存 2 5音频处理软件CoolEdit 3 其它操作其他操作如剪切复制粘贴等功能和一般的应用软件很相似如果要选中右声道中的波形则可以将光标移到波形窗口下方边界时光标显示 R 的时候拖动鼠标如图所示同样的如果要选中左声道中的波形则可以将光标移到波形窗口上方边界时光标显示 L 的时候拖动鼠标 1 打开要处理的音频文件 2 选择菜单效果波形振幅渐变 3 在弹出的对话框预置里选择要处理的分贝数带 Cut 的表示降低声音分贝数带 Boost 则相反如图所示三单轨音频效果处理 2 5音频处理软件CoolEdit 1 音量调整 4 单击右下角的预览可以试听若不够理想在进行以上的操作直到满意为止单击确定完成音量调整 2 5音频处理软件CoolEdit 2 淡入淡出淡入淡出功能可使声音从无到有或从有到无即声音的音量渐变 1 打开要处理的音频文件 2 选择菜单效果波形振幅渐变 3 设置淡入淡出参数在对话框的右边提供了一些常用的预设参数如图所示 2 5音频处理软件CoolEdit 3 降噪降噪就是降低或消除设备噪声环境噪声喷音爆音等不应有的杂音录进计算机里的声音一定会存在或多或少的噪声背景噪声是一般个人计算机录音中最大的问题如声卡的杂音计算机的风扇硬盘音箱空调电话等都是噪声源对各种噪声有不同的解决办法常用的有FFT采样降噪使用噪声门调整均衡等方法采样降噪是目前比较科学的一种消除噪声的方式即首先获取一段纯噪声的频率特性然后在搀杂噪声的音乐波形中将符合该频率特性的噪声从声音中去除 1 录音前可以单独录制一段跟正式录音环境一致的纯环境噪声或者是在正式录音前空录几十秒纯环境噪声选择文件新建设置采样率为11 025kHz 量化位数为8bit 声道为单声道然后单击录音按钮开始录制环境噪声 2 5音频处理软件CoolEdit 开始录制环境噪声为采集到足够多的环境噪声可以适当加长录音时间比如10秒录制好的环境噪声文件如图所示 2 5音频处理软件CoolEdit 2 录制完成以后选中刚刚录制的一段纯环境噪声对这段纯环境噪声提取噪声样本选择效果噪音消除降噪器单击噪音采样按钮如图所示 2 5音频处理软件CoolEdit 3 单击保存采样按钮将样本保存以备后用如图所示 2 5音频处理软件CoolEdit 4 新建一个文件开始录音录好以后全选 Ctrl A 选择效果噪音消除降噪器单击加载采样按钮单击确定按钮以后录音文件被降噪处理前后波形如图所示 2 5音频处理软件CoolEdit 4 均衡均衡用于提升或衰减某些频段的音量也用于通过调音台的均衡减少噪声和创造新的音色重击声大约在70Hz 温暖的声音大约在250Hz 浑声音产生自400Hz 800Hz 鼻音一般在1kHz 2kHz 急噪的声音在3kHz 4kHz左右齿擦的声音在5kHz 6kHz 8kHz是噗噗声明亮的声音在10kHz 13kHz 而17kHz到更高的频率是空声音例如为了在过于刺耳的声音中加入一些温暖的成分可以试着在3kHz处降低1dB 2dB 在275Hz处提升0 5dB 音频中常用频率 2 5音频处理软件CoolEdit 1 打开待处理的音频文件 2 选择效果滤波器快速滤波器在弹出的快速滤波器对话框中根据音频处理的要求拖动滑块调整各个频段的增减如图所示 2 5音频处理软件CoolEdit 5 混响混响简单说就是声音余韵音源在空间反射出来的声音适当设置混响效果可以更真实更有现场感地再现音源也可以起到修饰美化的作用 1 打开待处理的音频文件 2 选择效果常用效果器混响在弹出的混响对话框中设置各项参数即可 2 5音频处理软件CoolEdit 6 延迟延迟即增加音源的延续它不同于混响它是原声音的直接反复而非余韵因也不同于合唱合唱是单纯的声音重叠而延迟给人一种

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体课件——第二章音频.ppt

文档简介

温馨提示

最新文档

评论

多媒体课件——第二章 音频.ppt

文档简介

温馨提示

最新文档

评论

相关文档

多媒体课件——第二章音频.ppt