课件类:《多媒体技术及应用》第二章.多媒体音频技术ppt.ppt_第1页
课件类:《多媒体技术及应用》第二章.多媒体音频技术ppt.ppt_第2页
课件类:《多媒体技术及应用》第二章.多媒体音频技术ppt.ppt_第3页
课件类:《多媒体技术及应用》第二章.多媒体音频技术ppt.ppt_第4页
课件类:《多媒体技术及应用》第二章.多媒体音频技术ppt.ppt_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章多媒体音频技术,2-2,一、声音的基本概念声音是通过一定介质传播的连续的波。,声波,2.1数字音频基础,2-3,声音按频率分类:,语音信号频率范围:300Hz-3kHz,2.1数字音频基础,2-4,声音的传播携带了信息,它是人类传播信息的一种主要媒体。声音的三种类型:波形声音:包含了所有声音形式语音:不仅是波形声音,而且还有丰富的语言内涵(抽象提取特征意义理解)音乐:与语音相比,形式更规范。,音乐是符号化的声音。,2.1数字音频基础,2-5,二、声音的数字化1.声音信号的类型模拟信号(自然界、物理)数字信号(计算机)2.声音数字化过程,模拟信号,数字信号,A/DADC,D/ADAC,2.1数字音频基础,2-6,3.声音数字化过程,示意,2.1数字音频基础,2-7,4.声音数字化三要素,2.1数字音频基础,2-8,5.声音数字化的数据量音频数据量采样频率量化位数声道数/8(字节/秒),2.1数字音频基础,2-9,三、音频的文件格式1.WAV文件WAV是Microsoft/IBM共同开发的PC波形文件。因未经压缩,文件数据量很大。特点:声音层次丰富,还原音质好,2.1数字音频基础,2.MP3文件MP3(MPEGAudiolayer3)是一种按MPEG标准的音频压缩技术制作的音频文件。特点:高压缩比(11:1),优美音质,2-10,3.WMA文件WMA(WindowsMediaAudio)是WindowsMedia格式中的一个子集(音频格式)。特点:压缩到MP3一半4.MIDI文件MIDI(乐器数字接口)是由一组声音或乐器符号的集合。特点:数据量很小,缺乏重现自然音,2.1数字音频基础,2-11,2.2数字音频压缩标准,一、音频压缩方法概述,压缩编码技术是指用某种方法使数字化信息的编码率降低的技术,音频信号能压缩的基本依据:声音信号中存在大量的冗余度;人的听觉具有强音能抑制同时存在的弱音现象。,2-12,音频信号压缩编码的分类:无损压缩(熵编码)霍夫曼编码、算术编码、行程编码有损压缩波形编码-PCM、DPCM、ADPCM子带编码、矢量量化参数编码-LPC混合编码-MPLPC、CELP,2.2数字音频压缩标准,2-13,2.2数字音频压缩标准,二、音频压缩技术标准,2-14,2.2数字音频压缩标准,三、音频压缩工具MP3压缩工具:音频编辑软件CoolEdit豪杰超级解霸3000,2-15,2.3声卡与音箱,一、声卡(声音卡、音频卡)1.声卡的主要功能声卡是负责录音、播音和声音合成的一种多媒体板卡。其功能包括:,录制、编辑和回放数字音频文件控制和混合各声源的音量记录和回放时进行压缩和解压缩语音合成技术(朗读文本)具有MIDI接口(乐器数字接口),2-16,2.声卡的组成原理,2.3声卡与音箱,2-17,3.声卡的性能指标采样和量化能力衡量音响器材音质好坏。采样频率:11.025kHz(语音效果)22.05kHz(音乐效果)44.1kHz(高保真效果)量化等级:8位/256级(语音质量)16位/65536级(高保真质量),2.3声卡与音箱,2-18,芯片类型CODEC芯片(依赖CPU,价格便宜)数字信号处理器DSP(不依赖CPU)总线类型ISA总线、PCI总线、USB接口输出声道数2声道(立体声)、2.1/4.1/5.1声道多通道声卡(营造杜比环绕立体声),2.3声卡与音箱,2-19,4.声卡的外部接口,2.3声卡与音箱,2-20,2.3声卡与音箱,2-21,二、音箱1.音箱的工作原理音箱是一种电声转换的发音设备。发音过程:声卡输出模拟信号功率放大器电流经音箱中金属线圈产生磁场与永久磁铁相互作用产生吸引和排斥带动线圈和簿膜振动声波。,2.3声卡与音箱,2-22,2.音箱的分类功放:有源音箱、无源音箱声道:2.0双声道立体声2.1双声道超重低音声道4.1/5.1/7.15.1五声道超重低音声道,2.3声卡与音箱,2-23,3.音箱的性能指标输出功率:额定功能、最大峰值功率。频率范围:指音箱最低有效回放频率和最高有效回放频率之间的范围。信噪比:指音箱回放的有效信号与噪声信号的比值。信噪比较低时,噪声严重。,信噪比70-80dB普通音箱信噪比80-90dB高档音箱信噪比95dB专业音箱,2.3声卡与音箱,2-24,杜比环绕立体声技术,2.3声卡与音箱,2-25,2.4音频处理软件,专业音乐软件,2-26,一、CoolEdit概述CoolEditPro1.1/1.2/2.0/2.1CoolEdit2000(简化版)是集录音、编辑、合成于一体的数字音频处理软件。,2.4音频处理软件,主要功能:编辑:插入、叠加、替换、调制等;音效:回音、延迟、失真、杂音等;分析音讯及频率;与Cakewalk能很好地结合。,2-27,1.CoolEdit的启动和退出开始/所有程序CoolEdit20002.CoolEdit的窗口组成,2.4音频处理软件,2-28,二、音频的基本操作1.声音的录制Options/WindowsMixer音量控制从麦克风中输入File/NewNewWaveform对话框语音:11025Hz、Mono、8-bit音乐:44100Hz、Stereo、16-bit从CD唱机中输入CD唱机(波形输出混音),2.4音频处理软件,2-29,2.音频的编辑选择删除(选区、非选区)复制粘贴混合粘贴,2.4音频处理软件,2-30,3.音频文件管理新建文件打开文件保存文件另存为(其它格式)保存选择区,2.4音频处理软件,2-31,三、调整音量大小1.调整音量Transform/Amplitude/Amplify菜单Amplify对话框ConstantAmplification选项卡2.显示振幅边界线(90%)View/ShowBoundaries3.静音(选择区域)Transform/Silence,2.4音频处理软件,2-32,四、淡入与淡出淡入效果是指音频选区的起始音量很小甚至无声,而最终音量相对效大。淡出效果是指音频选区的起始音量相对较大,而最终音量很小甚至无声。操作步骤:选择音频区域Transform/Amplitude/Amplify选择FadeIn(淡入)、FadeOut(淡出)LinearFades(线性)LogarithmicFades(对数),2.4音频处理软件,2-33,五、消除环境噪音环境噪音是在语音停顿之处有一种振幅变化不大的声音,它贯穿于整个录制声音。消除环境噪音的方法是在语音停顿之处选择一段环境噪音,让CE记录噪音的特征,然后自动消除所有的环境噪音。操作步骤:选取噪音样本Transform/NoiseReduction/NoiseReduction双击波形显示区选取整个波形,2.4音频处理软件,2-34,六、延迟效果1.Delay延迟效果Transform/DelayEffects/Delay菜单Delay对话框参数:Delay:延时(-500500ms)Mixing:声音混合(0100%)Invert:颠倒Presets:预置模拟各种房间效果、空中回声、隧道。,2.4音频处理软件,2-35,2.Echo回声效果Transform/DelayEffects/Echo菜单Echo对话框的参数:Decay:衰减(0100%)Delay:延时(02000ms)InitialEchoVolume:初始回音LockLeft/Right:锁定左右声道EchoBounce:弹簧回声模拟声场效果,如礼堂、峡谷、大厅。,2.4音频处理软件,2-36,3.Flanger空间感效果Transform/DelayEffects/Flanger菜单Flanger对话框的主要参数:,模拟科幻、火星人、水下等声音感觉。,2.4音频处理软件,2-37,七、正弦波发生器正弦波发生器音频信号发生器非正弦法发生器噪音发生器Generate/TonesNewWaveform(16000,Mono,16-bit)GenerateTones(选中Locktothese400,0,0),2.4音频处理软件,2-38,八、声音美学主要解决的问题:如何提高声音的质量,使声音更加纯净、更加逼真。如何润色声音,使其更加悦耳动听。如何加工声音,为某种需要制造特殊效果。,2.4音频处理软件,2-39,1.影响声音美感的因素,2.4音频处理软件,2-40,2.美化声音目的:使声音清晰、悦耳、动听。美化声音的具体手段是:,2.4音频处理软件,2-41,2.5MIDI与音乐合成,一、MIDI技术概述1.什么是MIDIMIDI(MusicalInstrumentDigitalInterface,乐器数字接口)是一种利用合成器产生的音乐技术。采用数字信号处理技术合成的音效:模仿钢琴、小提琴、吉他等音色超越时空的太空音乐,2-42,2.MIDI标准MIDI是各种电子音乐设备之间以及与计算机之间交换信息的国际标准。MIDI硬件规范:硬件接口标准和信号传输机制(I/O通道、连接电缆和插座形式)。MIDI软件规范:音乐信息数字化编码方式(音符、音符长短、音调和音量等)。,2.5MIDI与音乐合成,2-43,二、MIDI合成方式1.调频合成法-FM原理:MIDI合成器接收到MIDI音乐信息后,利用傅立叶级数原理将其分解为若干个不同频率的正弦波,然后生成MIDI音乐信息中指定乐器的各个正弦波分量,最后将这些分量合成起来送至扬声器播放。特点:系统开销小,声音清脆声音音色少,音质较差,2.5MIDI与音乐合成,2-44,2.波形表合成法-WT原理:在MIDI合成器的ROM中预先存放各种实际乐器的声音样本,在进行音乐合成时以查表的方式调用这些样本,使其与MIDI音乐信息的要求完全相配,然后合成器将这些分段合成的样本送至扬声器播放。特点:音乐真实感强,音色自然硬波形表,软波形表。,2.5MIDI与音乐合成,2-45,三、MIDI的工作过程,音序器是MIDI音乐创作的核心控制部件。,2.5MIDI与音乐合成,2-46,四、音乐制作系统1.基本设备音源:声卡(模拟乐器发声的设备)音序器:硬件音序器、软件音序器Cakewalk,LogicAudio输入设备:电子琴(MIDIIn,MIDIOut)MIDI键盘(省去音源)Cakewalk虚拟键盘,2.5MIDI与音乐合成,2-47,2.音乐制作技术提取原音软件:ExactAudioCopyMP3数字CD抓轨把CD音轨转换成WAV格式(无失真)音频处理软件:CoolEdit2000原音伴唱消除:Effect/Amplitude/ChannelMixerVocalCutVCD(卡拉OK):左声道、右声道人声伴音,2.5MIDI与音乐合成,2-48,3.CD唱盘制作NeroBurningROM刻录音乐光盘:放入空白光盘,启动软件新编辑音乐光盘单击新建按钮将要刻录的音乐文件从文件浏览器中拖动到光盘刻录窗口刻录器/刻录编译单击录制按钮,2.5MIDI与音乐合成,2-49,2.6语音识别技术,语音识别:利用计算机自动识别语音的技术。如将语音转换成其所对应的文字,利用语音信号中所包含的特定人的信息进行说话人身份辨认的说话人识别技术。一、语音识别的发展历史1952:Bell实验室研制出可识别10个英文数字的语音识别器(Audry系统)。1988:卡内基梅隆大学研制SPHINX识别系统(非特定人、大词汇量、连续语音)。,2-50,二、语音识别基本原理语音识别本质上是一种模式识别过程,主要包括语音信号预处理、特征提取、特征建模(建立参考模式库)、相似性度量(模式匹配)和后处理等几个功能模块。,2.6语音识别技术,2-51,三、语音识别系统的分类1.根据词汇量大小小词汇量:100词中词汇量:100-1000词大词汇量:1000词以上2.根据对说话人依赖程度特定人:针对某个用户进行识别工作非特定人:针对任何人进行识别工作,2.6语音识别技术,2-52,3.根据对说话人说话方式孤立词识别:每次只含词汇表中的一个词条,如一个词、一个词组或一条命令。连接词识别:每次说词汇表中若干个词

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论