ddobe-Audition音频制作教学教案_第1页
ddobe-Audition音频制作教学教案_第2页
ddobe-Audition音频制作教学教案_第3页
ddobe-Audition音频制作教学教案_第4页
ddobe-Audition音频制作教学教案_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE60PAGE60学院标准教案纸课堂教学题目音频信息处理与数字音频编辑1授课时间地 点教学目标了解声音信号的特点、存储格式及质量的度量方法了解声音的特性。了解声音的分类教学重点声音的三要素、声音的频谱教学难点教学内容方法与手段音频概述音频(Audio)是人们用来传递信息最方便、最熟悉的方式,是多媒体系统使用最多的信息载体。音频是通过一定介质(如空气、水等)传播的一种连续的波,在物理学中称为声波。声音的强弱体现在声波压力的大小上(和振幅相关),音调的高低体现在声波的频率上(和周期相关),如下图。振幅 声波的振幅就是通常所说的音量。在声学中用来定量研究空气受到压力的大小。 周期 以规则的时间

2、间隔重复出现,这个时间间隔称为声音信号的周期,用秒表示。频率 声音信号的频率是指信号每秒钟变化的次数,用赫兹(Hz)表示。人们把频率小于20Hz的信号称为亚音信号;频率范围为20 Hz20k Hz的信号称为音频(Audio)信号;高于20k Hz的信号称为超音频信号,或称超声波信号。 带宽 带宽是指频率覆盖的范围。音频信息处理基础音频信息在多媒体中的应用极为广泛:视频图像配以娓娓动听的音乐和语音 ;静态或动态图像配以解说和背景音乐 ;立体声音乐可增加空间感 ;游戏中的音响效果等。音频处理技术主要包括电声转换、音频信号的存储、重放技术、加工处理技术以及数字化音频信号的编码、压缩、传输、存取、纠错

3、等。 音频文件的分类一、多媒体音频可按用途、来源、文件格式及压缩方法等多种途径进行分类。音频信号可分为两类:语音信号和非语音信号。语音是语言的物质载体,是社会交际工具的符号, 它包含了丰富的语言内涵,是人类进行信息交流所特有的形式。非语音信号主要包括音乐和自然界存在的其他声音形式。非语音信号的特点是不具有复杂的语义和语法信息,信息量低、识别简单。1.规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。因声波是在时间和幅度上都连续变化的量,我们称之为模拟量。2.模拟音频信号的两个重要参数模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强

4、弱。 一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。3. 声音的A/D与D/A转换A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号变为了由“0”和“1”组成的Bit信号。这样做的好处是显而易见的,声音存储质量得到了加强,数字化的声音信息使计算机能够进行识别、处理和压缩 。A/D转换的一个关键步骤是声音的采样和量化,得到数字音频信号,它在时间上是不连续的离散信号

5、。 借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换。4. 声音的三要素1)音调:代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。 在使用音频处理软件对声音的频率进行调整时,也可明显感到音调随之而产生的变化。各种不同的声源具有自己特定的音调,如果改变了某种声源的音调,则声音会发生质的转变,使人们无法辨别声源本来的面目。2)音色:即特色的声音。声音分纯音和复音两种类型。所谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。在复音中,最低频率的声音是“基音”,它是声音的基调。其他频率的声音称为“谐音”,也叫泛音。基

6、音和谐音是构成声音音色的重要因素。各种声源都具有自己独特的音色,例如各种乐器的声音、每个人的声音、各种生物的声音等,人们就是依据音色来辨别声源种类的。3)音强:声音的强度,也被称为声音的响度,常说的“音量”也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的,通过播放设备的音量控制,可改变聆听时的响度。5.声音的频谱声音的频谱有线性频谱和连续频谱之分。线性频谱是具有周期性的单一频率声波;连续频谱是具有非周期性的带有一定频带所有频率分量的声波。纯粹的单一频率的声波只能在专门的设备中创造出来,声音效果单调而乏味。自然界中的声音几乎全部属于

7、非周期性声波,该声波具有广泛的频率分量,听起来声音饱满、音色多样且具有生气。二、按用途分类 音频可分为语音(如解说词)、音乐(如配乐)和声效(如掌声)等。 按声音来源分类数字化声波,即利用声卡等专用设备将语音、音乐等波形信息转换成数字方式,并将编码保存起来,使用时再解码和转换成原来的波形。MIDI合成,即通过电子乐器的弹奏形成数字指令驱动音乐合成器,并借助于合成器产生的数字声音信号还原成相应的音乐或音效。利用声音素材库获取音频文件。三、按文件存储格式分类WAV:微软的标准声音文件格式。 MIDI:乐器数字接口(Musical Instrument Digital Interface)的缩写,实

8、质是一个通过电缆将电子音乐设备连接起来的协议。 RMI:这是另一种MIDI格式,它也分为RIFF MIDI Format 0和RIFF MIDI Format 1两种。 MP3:MP3是目前最热门的音乐文件格式。这是一种间频压缩技术,采用MPEG Layer 3标准对WAV音频文件进行压缩而成 。MP2:采用MPEG Layer 2标准对WAVE音频文件进行压缩后生成的音乐文件。AU 、RA 、VQF 、CD-DA 、CD-XA 等作 业教学反思或反馈记录课堂教学题目音频信息处理与数字音频编辑2授课时间地 点教学目标理解数字化音频的方法,为后期的音频编辑工作奠定好基础。教学重点数字音频的常见格

9、式教学难点模拟音频的数字化过程教学内容方法与手段数字化音频技术音频的数字化 代表声音的模拟信息是个连续的量,不能由计算机直接处理,必须将其数字化方可被计算机接收。影响数字化声音质量的因素主要有三个,即采样频率、采样精度和通道个数 。MIDI乐器数字化接口 MIDI为乐器数字化接口,是为了把电子乐器与计算机相连而制定的一个规范,是数字音乐的国际标准。用来将乐器的音乐转化为数字化音乐存储在计算机中,然后进行编辑播放。模拟音频的数字化过程数字化的声音易于用计算机软件处理,现在几乎所有的专业化声音录制、编辑器都是数字方式。对模拟音频数字化过程涉及到音频的采样、量化和编码。 采样和量化的过程可由A/D转

10、换器实现。A/D转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。采样信息论的奠基者香农(Shannon)指出:在一定条件下,用离散的序列可以完全代表一个连续函数,这是采样定理的基本内容。为实现A/D转换,需要把模拟音频信号波形进行分割,这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。采样频

11、率与声音频率之间有一定的关系,根据奈奎斯特(Nyquist)理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。量化采样只解决了音频波形信号在时间坐标(即横轴)上把一个波形切成若干个等分的数字化问题,但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。我们把对声波波形幅度的数字化表示称之为“量化”。 量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢 我们还是采取二进制的方式,以位(bit)或16位(bit)的方式来划分纵轴

12、。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级,用以记录其幅度大小。编码模拟信号量经过采样和量化以后,形成一系列的离散信号脉冲数字信号。这种脉冲数字信号可以一定的方式进行编码,形成计算机内部运行的数据。所谓编码,就是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。在数据回放时,可以根据所记录的纠错数据判别读出的声音数据是否有错,如在一定范围内有错,可加以纠正。 编码的形式比较多,常用的编码方式是PCM脉冲调制。脉冲编码调制(PCM)是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时域和振幅

13、上都离散的量,然后将其转化为代码形式传输或存储。数字音频的文件格式 在多媒体技术中,存储音频信息的文件格式主要有:WAV文件、VOC文件和MP3文件等。 WAV文件 WAV文件又称波形文件,来源于对声音模拟波形的采样,并以不同的量化位数把这些采样点的值轮换成二进制数,然后存入磁盘,这就产生了波形文件。WAV文件用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。WAV声音文件是使用RIFF(Resource Interchange File Format资源交换文件)的格式描述的,它由文件头和波形音频文件数据块组成。文件头包括标志符、语音特征值、声道特征以及P

14、CM格式类型标志等。WAV数据块是由数据子块标记、数据子块长度和波形音频数据3个数据子块组成。 Wave格式支持多种压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式,但其文件尺寸较大,多用于存储简短的声音片断。未压缩的声音文件的存储量可用下式计算:存储量(KB)=(采样频率KHZ采样位数bit声道数时间秒)/82.VOC文件 VOC文件是Creative公司所使用的标准音频文件格式,多用于保存 Creative Sound Blaster(创新声霸)系列声卡所采集的声音数据,被Windows平台和DOS平台所支持。与WAV格式类似,VOC文件由文件头块和音频数据块组

15、成。文件头包含一个标识、版本号和一个指向数据块起始地址的指针,这个指针帮助数据块定位以便顺利找到第一个数据块。数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件、重复、重复的结束及终止标记等。 3.MPEG音频文件.MP1/.MP2/.MP3 这里的音频文件格式指的是MPEG标准中的音频部分,即MPEG音频层(MPEG Audio Layer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3),分别对应MP1、MP2和MP3这三种声音文件; MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分

16、别为41和6181,而MP3的压缩率则高达101121,也就是说一分钟CD音质的音乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,同时其音质基本保持不失真。4. RealAudio文件.RA/.RM/.RAM RealAudio文件是RealNetworks公司开发的一种新型流式音频(Streaming Audio)文件格式;它包含在RealNetworks所制定的音频、视频压缩规范RealMedia中,主要用于在低速率的广域网上实时传输音频信息;网络连接速率不同,客户端所获得的声音质量也不尽相同:对于28.8kb/s的连接,可以达到广播级的声音质量;如果拥有ISDN或

17、更快的线路连接,则可获得CD音质的声音。5.AIFF文件.AIF/.AIFF AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一种声音文件格式;被Macintosh平台及其应用程序所支持,其他专业音频软件包也同样支持这种格式。声音质量的评价目前有三种方法可以衡量声音的质量。一是用声音信号的带宽来衡量声音的质量,等级由高到低依次是DAT,CD,FM,AM和数字电话。此外,声音质量的度量还有两种基本的方法:一种是客观质量度量,另一种是主观质量度量。评价语音质量时,有时同时采取两种方法评估,有时以主观质量度量为主。 以声音的带

18、宽衡量声音的质量2、声音客观质量的度量声音客观质量的度量主要用信噪比(signal to niose ratio,SNR)来度量。它指音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率,通常以S/N表示。一般用分贝(dB)为单位,信噪比越高表示音频质量越好。信噪比(SNR)用下式计算:SNR 10 log (Vsignal)2 / (Vnoise)220 log (Vsignal / Vnoise)其中,Vsignal表示信号电压,Vnoise表示噪声电压;SNR的单位为分贝(db)。3、声音主观质量的度量 与用SNR客观质量度量相比较,应该可以说人的感觉(如听觉、视觉等)更具有决定意

19、义,感觉上的、主观上的测试应该成为评价声音质量和图像质量不可缺少的部分。而有的学者则认为,在语音和图像信号编码中使用主观质量度量比使用客观质量度量更加恰当,更有意义。可是一般来说,可靠的主观度量值也是比较难获得的,所获得的值也是一个相对值。对声音主观质量度量比较通用的标准是5分制 :优(Excellent)、良(Good) 、中(Fair) 、差(Poor) 、劣(Bad) 。作 业教学反思或反馈记录课堂教学题目音频信息处理与数字音频编辑3授课时间地 点教学目标理解音频信号压缩方法及音频编码标准,为后期的音频编辑工作奠定好基础。教学重点脉冲编码调制、声音压缩标准教学难点脉冲编码调制教学内容方法

20、与手段音频文件的压缩技术音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点: 1.人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到 .2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关 . 声音编码算法就是通过这些特性来去掉更多的冗余数据,来达到压缩数据的目的。一、脉冲编码调制模拟信号数字化一般有三个步骤:第一步是采样,就是每隔一段时间间隔读一次声音的幅度;第二步是量化,就是把采样得到的声音信号幅度转换成数字值。但那时并没有涉及如何进行量化。量化有好几种方法,但可归纳成两类:一类称为均匀量化,另一类称为

21、非均匀量化。采用的量化方法不同,量化后的数据量也就不同。因此,可以说量化也是一种压缩数据的方法;第三步是编码,就是按一定格式记录采样和量化后的数据。非均匀量化对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔增量调制 它是一种预测编码技术,是PCM编码的一种变形。DM是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“0”表示,或者相反。自适应脉冲编码调制是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应

22、,即量化阶的大小每隔几个样本就改变,也可以是非瞬时自适应,即量化阶的大小在较长时间才发生变化。改变量化阶大小的方法有两种:一种称为前向自适应 ,后向自适应 。前者是根据未量化的样本值的均方根值来估算输入信号的电平,以此来确定量化阶的大小,并对其电平进行编码作为边信息(side information)传送到接收端。后者是从量化器刚输出的过去样本中来提取量化阶信息差分脉冲编码调制是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。差分脉冲编码调制的思想是,根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从

23、而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值。自适应差分脉冲编码调制综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。二、CCITT G系列声音压缩标准CCITT和ISO先后提出了一系列有关语音数据编译码

24、标准,下面简要介绍几种音频编码技术标准。1电话质量的音频压缩编码技术标准信号频率规定在300Hz3.4kHz,采用标准的脉冲编码调制(PCM),当采样频率为8kHz,进行8bit量化时,所得数据速率为64kb/s,即一个数字电话。1972年CCITT为电话质量和语音压缩制定了PCM标准G.711,其速率为64Kbs,使用非线性量化技术,主要用于公共电话网中。2调幅广播质量的音频压缩编码技术标准 频率在50Hz一7kHz范围。G.722标准是采用16kHz采样,14bit量化,信号数据速率为224kbits,采用子带编码方法,将输入音频信号经滤波器分成高子带和低子带两个部分,分别进行ADPCM编

25、码,再混合形成输出码流,224kbits可以被压缩成64kbits,最后进行数据插入(最高插入速率达16kbits),因此利用G.722标准可以在窄带综合服务数据网N-ISDN中的一个B信道上传送调幅广播质量的音频信号。 3高保真度立体声音频压缩编码技术标准高保真立体声音频信号频率范围是50Hz20kHz,采用441kHz采样频率,16bit量化进行数字化转换,其数据速率每声道达705kbits。1991年国际标准化组织ISO和CCITT开始联合制定MPEG标准,其中ISOCDlll72-3作为“MPEG音频”标准,成为国际上公认的高保真立体声音频压缩标准。MPEG音频第一和第二层次编码是将输

26、入音频信号进行采样频率为48kHz,44.1kHz,32kHz的采样,经滤波器组将其分为32个子带,同时利用人耳屏蔽效应,根据音频信号的性质计算各频率分量的人耳屏蔽门限,选择各子带的量化参数,获得高的压缩比。MPEG第三层次是在上述处理后再引入辅助子带,非均匀量化和熵编码技术,再进一步提高压缩比。MPEG音频压缩技术的数据速率为每声道32448kbits,适合于CDDA光盘应用。数字音频的压缩 采用数字音频获取声音文件的方法最突出的问题是信息量大,音频信息文件所需的存储空间的计算公式为:存储容量(字节)采样频率采用精度/8声道数时间音频压缩编码的基本方法 音频信号的压缩方法有多种。基本上分为两

27、大类:有损压缩和无损压缩。无损压缩法包括不引入任何数据失真的各种墒编码;有损压缩又可分为波形编码、模型编码和同时利用这两种技术的混合编码方法。有损压缩波形编码利用采样和量化过程来表示音频信号的波形,使编码后的音频信号与原始信号的波形尽可能匹配。它主要根据人耳的听觉特性进行量化,以达到压缩数据的目的。 参数编码把音频信号表示成某种模型的输出,利用特征提取的方法抽取必要的模型参数和激励信号的信息,并对这些信息编码,最后在输出端合成原始信号。 混合编码介于波形编码和参数编码之间,集中了这两种方法的优点,可以在较低的误码率上得到较高的音质。作 业教学反思或反馈记录课堂教学题目音频信息处理与数字音频编辑

28、4授课时间地 点教学目标了解语音识别技术及其应用,为后续相应软件开发奠定好基础。教学重点音频文件的格式转化教学难点教学内容方法与手段音频文件的格式转化与语音识别技术声音文件格式的互换1选择声音文件格式的部分原则 1)Wav文件:不仅所有的Windows的音效处理应用程序都可以播放WAVE文件,而且常见的各种多媒体编辑制作软件的音效播放都能直接使用WAV文件。再者,WAV格式的音质效果也不错 。 2)MP3文件 :如果通过适当的工具来截取CD上的数字音频并保存为CD音质的WAVE文件,然后进行MPEG Layer 3的压缩编码形成MP3文件,再用合适的解码软件对MP3解码。那么可以形成一个节约大

29、量存储空间,保持CD音质的整体解决方案。 3)MIDI文件:是多媒体计算机产生音频(特别是音乐)的另一种主要方式,可以满足需要长时间音乐的场合。4)SWA文件:SWA格式的音乐文件,是Authorware4.0以上版本支持的特殊音乐格式,它的容量类似于流行的MP3,也非常小。在Authorware4.0或4.0以上版本中,自带WAVSWA转换器转换CD音轨下面以CDCopy为例来说明一下如何转换CD音轨。CDCopy是一个常用的抓音轨工具,它对烂盘的纠错性能非常好,还可以把CD音轨转换为WAV、AU、RA、Yamaha VQF、AAC、MP3等多种声音格式,而且CDCopy是一个共享软件。抓取

30、及转换音轨 步骤分以下3步:1选择文件格式2设置文件保存路径 3转换音轨语音识别技术及应用语音识别的发展历史 可以将语音识别近六十年的发展历史划分为4个时期:(1)初始发展期 (2)基础突破期 (3)综合发展期 (4)成熟期语音识别以语音为研究对象,是语音信号处理的一个重要研究方向,是模式识别的一个分支,其目的就是要让机器具有人的听觉功能,在人机语音通讯中“听懂”人类口述的语言。根据不同的需求,语音识别的识别内容可分为狭义的语音识别和说话人语音识别 。语音识别技术的基础一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:其目的是从语音波形中提取出随时间变化的语音特征序列。(2)声学模型

31、与模式匹配(识别算法):声学模型通常将获取的语音特征通过学习算法产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。(3)语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。对小词表语音识别系统,往往不需要语言处理部分。声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活

32、性有较大的影响。必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小。语言模型对中、大词汇量的语音识别系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学描述模型等有关方面。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型。语法结构可以限定不同词之间的相互连接关系,减少了识别系统的搜索空间,这有利于提高系统的识别。语音识别的基本原理预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等,并涉及到语音识别

33、基元的选取和端点检测问题: 特征提取部分用于提取语音中反映本质特征的声学参数,如平均能量、平均跨零率、共振峰等; 训练在识别之前进行,通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留关键数据,再按照一定规则对数据加以聚类,形成模式库;模式匹配部分是整个语音识别系统的核心,它是根据一定的准则(如某种距离测度)以及专家知识(如构词规则、语法规则、语义规则等),计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。3处理的方法:(1) 连续语音流的预处理波形硬件采样率的确定、分帧大小与帧移策略的确定;剔除噪声的带通滤波、高频预加重处理、各种变换策略;波形的自动切分(依赖于识别基元

34、的选择方案)。(2) 特征参数提取 识别语音的过程,实际上是对语音特征参数模式的比较和匹配的过程。语音特征参数的选取对系统识别结果起着重要的作用。因此,必须寻找一个既能充分表达语音特征又能彼此区别的特征参数,这是语音识别中的一个最重要基本问题。语音识别系统常用的特征参数有线性预测系数、倒频谱系数、平均过零率、能量、短时频谱、共振峰频率及带宽等。(3)参数模板存储。在建立识别系统时,首先进行特征参数提取,然后对系统进行训练和聚类。通过训练,系统建立并存储一个该系统需识别字(或音节)的参数模板库。(4)识别判决。识别时,待识语音信号经过与训练时相同的特征参数提取后,与模式模板存储器中的模式进行匹配

35、计算和比较,并根据一定的规则进行识别判决,最后输出识别结果。语音识别系统的类型1按可识别的词汇量多少 2按照语音的输入方式 3按发音者为特定/非特定人4按发音者的声纹 语音识别的应用1在信息处理领域的应用(1)给计算机发送指令 。(2)听写系统 。(3)信息查询。(4)网上交谈。2教育与商务应用(1)语音教学软件。(2)电话查询。(3)电子商务。 3消费电子产品应用作 业教学反思或反馈记录课堂教学题目音频信息处理与数字音频编辑5授课时间地 点教学目标使学生了解音频与数字音频的基础知识,为后期的音频编辑工作奠定好基础。教学重点后期音频编辑的流程教学难点后期音频编辑的流程教学内容方法与手段影视动漫

36、后期音乐编辑一、影视动漫声音的由来游戏音乐的发展 游戏形式,很早就有。但是,现在我们提到动漫和游戏,基本上是指计算机游戏。这种新形式是在20世纪末发展起来的,近来,随着计算机应用的普及,计算机游戏已经成为当今娱乐的主流。动画音乐的发展动画音乐制作的发展比游戏音乐的发展特殊一些,因为有很多大型的电影公司生产和制作动画片,他们在制作上质量非常高。但是,目前比较流行的小型动漫作品,仍然是由简单的制作队伍来完成。因此,动画音乐也具有与游戏相似的发展现状。二、影视动漫声音的分类语言 语言是由口腔发出的声音,是将角色立体化的重要元素。配音演员的素质 录音效果声 效果声是伴随着一些自然界现象而发出的声音,如

37、雷雨声、脚步声、爆炸声等。1、效果声的功能虚拟的现实因素与时空环境塑造录音2、效果声与动漫游戏3、游戏音效的分类音乐动漫作品是一种综合的艺术作品。其中有震撼迫人的火爆场面,有细腻缠绵的对白,然而,由始至终伴随的是扣人心弦、感人肺腑的主题音乐。1、音乐在动漫剧作品或游戏中的作用2、少儿游戏的音乐三、动漫声音的常见格式一般的数字音频格式 1. 波形音频文件WAV2. MPEG音频文件(.mp1/.mp2/.mp3)3、MP3pro4. Ogg Vorbis流媒体音频格式 1. Real Audio音频文件(.RA/.RM/.RMX)2. Windows Media :WMA(*.wma)MIDI音

38、频MIDI (Musical Instrument Digital Interface) 音乐是一种合成音乐。四、后期音频编辑的硬件环境声卡 声卡,也叫音频卡,是多媒体电脑中用来处理声音的接口卡。声卡的接口一般包括:线型输入接口、线型输出端口、话筒输入端口、扬声器输出端口、MIDI及游戏摇杆接口等。耳机和音箱 耳机和音箱都可以称为扬声器,是一种电声换能器件,能够将音频信号变换为声音。麦克风 麦克风,学名为传声器,由Microphone翻译而来,它是将声音信号转换为电信号的能量转换器件。按工作原理,话筒可以分为电动式话筒和电容式话筒。按信号的传递方式分为有线话筒和无线话筒。MIDI键盘MIDI键

39、盘外观上与电子琴很相似,本身不能发声,一般与电脑相连接使用。调音台 调音台又称调音控制台,它将多路输入信号进行放大、混合、分配、音质修饰和音响效果加工。录音室 5、后期音频编辑的常用软件播放软件:千千静听、Winamp、酷我等编辑软件:Adobe Audition、音频编辑大师、GoldWave等格式转换软件:Ease Audio Converter、Super Video to Audio Converter等6、后期音频编辑的流程作 业教学反思或反馈记录课堂教学题目Adobe Audition软件与基本操作1授课时间地 点教学目标了解Audition 简介掌握Audition 的工作界面掌

40、握Audition的界面布局了解收藏夹的使用教学重点Audition 的工作界面Audition的界面布局教学难点Audition 的工作界面教学内容方法与手段初识Audition讨论问题:1、Audition CS6的工作界面分为哪几种分别为 2、收藏夹是否可以将自己创建的内容进行收藏?初识Audition 工作区Audition的工作区与Adobe公司其他视频、图形应用程序一样,由多个窗口构成,所以你不需要学习使用多种不同的用户界面。用户可以选择由哪些窗口构成工作区,也可以在任何时候增加或删除窗口。面板1打开Adobe Audition。在Lesson02文件夹中打开文件start02.w

41、av。2选择“窗口工作区传统”。选择“窗口工作区重置传统”, 即可确保使用的工作区为已存储的版本。3出现对话框显示是否希望重置“传统”作为原始布局,单击“是”按钮4单击波形编辑器面板中的波形,在单击面板时,会出现蓝色线条勾勒出面板的轮廓。5面板的上、下、左、右都有分割线,当光标置于分割线上时会出现分割符号,单击鼠标左键选中并拖动可以调整面板尺寸。例如,选中波形编辑器左侧蓝色线条向左拖拽,即可改变该面板大小。6每个面板在顶部都有一个标签。标签右侧有下拉栏,通常至少包含如下几个选项:关闭面板 浮动面板关闭组中的其他面板面板组设置(其中包含关闭面板组、取消面板组停靠、最大化面板组)“工具”面板默认情

42、况下,工具栏会停靠在菜单栏下方。但同样可以取消停靠工具栏,把它转化成像其他面板那样操作的“工具”面板。要显示或隐藏工具栏,选择“窗口”“工具”。“工具”命令旁的复选标记表示其是否显示。要将工具栏取消停靠在其默认位置,单击左上角即可使之浮动。“收藏夹”面板“收藏夹”用于存储一些常用的、只需要一两次鼠标单击就可以完成的编辑操作。你不仅可以运行这些收藏,还可以创建新的收藏,删除、组织、编辑这些收藏。1选择“窗口工作区重置传统”。2单击“收藏夹”标签,“收藏夹”面板显示出当前的收藏列表。(如果工作区里没有“收藏夹”面板,可以通过选择“窗口收藏夹”或者“收藏夹编辑收藏夹”命令来打开“收藏夹”面板。)自定

43、义工作区除了Audition自带的工作区,你还可以创建自定义工作区1选择“窗口工作区新工作区”。2在“新工作区”对话框中输入名称即可为新工作区命名,单击“确定”按钮。新的工作区就会加入到当前工作区列表中3如果要删除一个工作区,选择“窗口工作区”,选中一个你想删除的工作区之外的工作区。4选择“窗口工作区删除工作区”。作 业教学反思或反馈记录课堂教学题目Adobe Audition软件与基本操作2授课时间地 点教学目标通过讲授Adobe Audition软件的打开与导入文件、保存与输出文件等对软件的基础操作知识有较为全面的掌握,为继续更深入地学习奠定基础。教学重点dobe Audition单轨编辑

44、基础和多轨编辑基础教学难点基本操作教学内容方法与手段Audition软件的基本操作导航导航到文件和项目1启动Audition,选择“文件打开”,导航到Lesson02文件夹,选中文件“start02.wav, 并在对话框中选择“打开”。2选择“文件打开并附加到当前文件”。3导航至Lesson02文件夹,选择music.wav,单击“打开”。4选择的文件被添加到“波形编辑器”中当前波形的末尾5选择“文件打开并附加到新建文件”。编辑器内部导航1导航至Lesson02文件夹,打开文件WaveformWorkspace.aif。2选择“窗口工作区默认”。3选择“窗口工作区默认重置默认”,单击“确定”按

45、钮。4单击波形的三分之一处,按住鼠标左键拖动到波形的三分之二处,选择一段波形。5单击波形的任意位置,即可取消选择。“媒体编辑器”导航1选择“窗口工作区默认”。2选择“窗口工作区重置默认”。然后单击“确定”按钮。3“媒体浏览器”的左栏显示所有连接到计算机的磁盘驱动器。单击任意一个驱动器,右栏中会显示其包含的内容。也可以单击驱动器的折叠展开三角来显示其内容。通过缩放导航缩放导航的工作方式其实很简单:缩小可以看到更多的目标物体,放大可以看到目标物体的更多细节。“缩放”面板中包含9个按钮,这9个按钮在波形编辑器和多轨编辑器中同样存在。用键盘快捷键导航用户可以根据自己的需要对各种命令创建键盘快捷键。选择

46、“编辑键盘快捷键”或按“Alt+K”组合键,然后按照屏幕向导添加或删除快捷键。下列键盘快捷键仅在波形编辑器中适用:下列键盘快捷键仅在多轨编辑器中适用使用标记导航可以在波形编辑器与多轨编辑器中放置标记(也称为提示),标明你希望迅速找到的位置。1导航至Lesson02文件夹,打开文件start02.wav。2选择“窗口工作区默认”。3选择“窗口工作区重置默认”。单击“确定”按钮。4选择“窗口标记”,打开“标记”面板。基本操作 播放 停止 空格键 暂停 Ctrl+Shift+Space 到首帧Ctrl+ 到尾帧Ctrl+ 录制Shift+Space 循环播放Ctrl+L 编组 Ctrl+G 复制 C

47、trl+C 粘贴 Ctrl+V 剪贴 Ctrl+X纵向: 放大Alt+= 缩小Alt+-横向: 放大 = 缩小 -全部缩小Ctrl+放大入点Alt+home放大出点Alt+end缩放选区shift+s 音频右下角,大括号拖动调节长度 右上角,伸缩速率调整 音量、声相线、关键帧,音频上右键,音量线变曲线 标记 M ,吸附功能 复制粘贴剪切 生成静音区 鼠标滚轮使用:Ctrl+滚轮 多轨视图左右放大缩小 滚轮 多轨 :纵向放大缩小波形 和滚动轨道 编辑:视图左右放大缩小作 业书上课后实训内容教学反思或反馈记录课堂教学题目实验项目一、Adobe Audition软件的安装与配置授课时间地 点教学目标

48、教学重点教学难点教学内容方法与手段实验内容:Adobe Audition软件的安装与配置。实验目的和要求:熟悉Adobe Audition软件的安装方法;掌握Adobe Audition软件的基本操作。安装步骤:1. 安装时断开网络,先安装英文版程序,不要选择试用,选择试用将会导致Encore组件无法使用,输入序列号:0-98或者3-985软件安装后先运行一次软件,否则软件不是Extended版。按照破解补丁文件夹内说明文档要求安装破解文件按照汉化补丁文件夹内说明文档要求安装汉化补丁按照书上实训内容完成相关基本操作实验仪器设备:多媒体计算机考核办法和要求:随堂检查学生是否按要求进行操作,针对存

49、在的问题及时进行答疑。作 业教学反思或反馈记录课堂教学题目录音技术授课时间地 点教学目标通过讲授Adobe Audition软件的录音技术,可以方便的录制来自外接设备的声音、话筒的声音和计算机声卡本身的声音。教学重点人声录制、模拟音效、录制声音教学难点模拟音效教学内容方法与手段动漫、影视作品中的音频收集1、获取音频素材的方法 下载音频素材购买音频素材 录音拾取2、录音前的硬件准备 使用话筒录制声音 将话筒与电脑声卡的Micphone输入接口相连接 。使用音频线录制来自外接设备的声音 当您需要录制来自录音机、CD机、DVD机、电子琴等设备的声音时,就需要准备一条声源输入线,又常叫做音频线。录音环

50、境(立体声录音的话筒摆放)AB制XY制MS制吸音与隔音要控制过多的声音反射,可以在墙壁上悬挂吸音板。为了和外界隔开,不让外界的声音进入棚内,录进来纯粹的“干声”,录音室里往往要采取必要的隔音措施。3、录音选项的设置为了避免录入“噗噗”的爆破声,要在话筒与声源之间加上防风装置4、人声录制进行人声录制时,要注意调整电平,由于人声的电平高低是动态变化的,因此可以使用压缩器。压缩器是一种自动控制信号电平的工具,当信号超过你设定的阀值时,压缩器自动拉下电平,拉下多少决定于压缩比。5、模拟音效例如:碎石:制造脚步声。芹菜:怪兽咬嚼和破坏东西的声音。瓜:敲击人头或破裂的可爱声音。带肉的骨头:折断骨头的美妙声

51、音。管子、锤子和斧头:帮助发出上面几种声音。6、音频的录制 “采样频率”,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机每秒钟采集多少个信号样本。 小于22050Hz的采样率保真度过低,通常适用于讲话、听写、玩具等; 22050Hz:游戏和低解析度数字音频的常用选择; 32000Hz:通常用于广播和卫星传输; 44100Hz:与CD所使用的采样率一致,是应用最普遍的音频采样率;48000Hz:视频项目的标准选择;大于48000Hz采样率的应用更加普

52、遍,工作室使用88200Hz或96000Hz采样率以获得可能的音质提升或高保真度。然而在高频率的采样率之间并没有太大的区别,而且会占用更大的存储空间,一个1分钟时长、96kHz文件占用的存储空间是48kHz文件所占空间的两倍。“声道”,Audition在录制音频时可以选择需要的声道数。单声道:麦克风或电吉他的声音录制;立体声:便携式音乐播放器或其他立体声信号源;5.1:用于环绕立体声的录制。 “位深度”即量化精度,它决定数字音频的动态范围。动态范围就是音频系数记录与重放时最大不失真信号与系统本底噪声之比的对数值,单位是分贝。当进行频率采样时,较高的量化精度可以提供更多可能性的振幅值,从而产生更

53、为大的振动范围,更高的信噪比,提高保真度。 8位为低解析度,不用于专业音频,通常用于游戏和消费电子设备; 16位是用于CD和提供工业标准音频质量的解析度; 24位是大多数音响工程师的首选,因为它有更高的可调节范围,但是电平的设定不必过于谨慎,因为可用的动态调节范围更宽。24位文件比16位文件多占用50%的空间,尽管在硬盘及其他形式存储空间有限的前提下,这种选择也是可以接受的; 32(浮点)可获得最高解析度,不过除了存档外,相对于24位文件,这种格式并没有明显优势,又由于很多程序不支持32位浮点文件,且这种格式的文件占用的存储空间大,所以并不常用。在单轨编辑界面下录制声音 (1)将话筒与电脑声卡

54、的Microphone接口相连接,将录音来源设置为Microphone。打开Adobe Audition软件,显示出单轨编辑界面。(2)新建一个文件。(3)此时,单击【Record(录音)】按钮,就可以开始录制了。要尽量大的电平,又要不超过最高限度【录音控制】对话框中上下调整录音项目的滑块。在多轨界面下录制声音(1)切换到多轨界面。(2)单击某音轨的【R】按钮,使其处于准备录音的状态。(3)设置好录音点评后,单击【Record(录音)】按钮,就可以开始录制了。注意:“模板”:用来指定默认模板或者自定义的模板。本节选择默认的模板“24 Track Music Session”,在后续的学习中将介

55、绍怎样自定义模板。“采样率”:确定会话的频率范围。“位深度”:确定会话的振幅范围,包括通过“多轨”“缩混为新文件”命令创建的录制内容和文件。应小心选择位深度,因为在创建会话后便无法更改。“主控”:确定哪些音轨缩混为单声道、立体声或5.1主音轨。“采样率”、“位深度”、“主控”参数都保存在模板中,所以一旦选择一个模板后,这些选项将变灰,即不能再被修改。若想自行编辑这些设置,“模板”应选择“无”。 作 业书上课后实训内容教学反思或反馈记录课堂教学题目实验项目二、音频录制与模拟音效授课时间地 点教学目标教学重点教学难点教学内容方法与手段实验内容:外部音频录制调试话筒录制语音内部音频录制录制效果声模拟

56、电话音效模拟广播音效实验目的和要求:掌握外部音频录制和内部音频录制的方法,掌握声效模拟的方法,熟悉录音流程,掌握录音选项的设置。对软件的基础操作知识有较为全面的掌握,设置语音调试,录制语音,为继续更深入地学习奠定基础。操作步骤:按照书上实训内容完成相关操作实验仪器设备:多媒体计算机考核办法和要求:随堂检查学生是否按要求进行操作,针对存在的问题及时进行答疑。作 业教学反思或反馈记录课堂教学题目简单编辑技术1授课时间地 点教学目标介绍Adobe Audition软件的简单编辑技术,通过实例操作进行实践,拓展的学生的实际应用能力,要求学生可以合作完成相应的作品。教学重点选取波形、裁切波形教学难点选取

57、波形、裁切波形教学内容方法与手段剪切、复制、粘贴、静音和删除音频区域导入音频文件操作步骤如下:1.在菜单栏中,选择“文件打开”,选择Lesson03/范例文件/Complete03文件夹的Complete03.wav文件,单击“打开”。注意:如果需要一次打开多个文件,可按住Shift键选择多个连续文件或按住Ctrl键选择多个不连续文件。2.此时可以看到“波形编辑器”中音频的波形。选择“文件”“另存为”命令,将文件命名为“demo03.wav”,并将其保存在“Start03”文件夹。如果导入多个文件后想打开指定文件,可选择“编辑器”面板的文件选择下拉菜单,可以看到加载的文件列表。选取波形进行编辑

58、操作步骤如下:1.单击“波形”视图下方的“播放”按钮,确定当前波形要编辑的区域(此处将demo03的1.0秒-1.6秒作为编辑区域)。注意:如果当前加载的波形不是需要编辑的波形,则需要单击“编辑器”面板的下拉菜单,选择需要编辑的波形。2.将鼠标放置1.0秒处,然后单击拖至1.6秒处,可发现被选择区域呈现白色背景(可通过拖动选中区域的左右边界进行微调,也可在“波形编辑器”中或者时间轴上进行调整)。3.选中区域后,会自动出现平视显示器(HUD)。单击HUD的音量控制旋钮,向上拖动以增加音量至+5.7dB(也可单击音量控制旋钮,输入数字,精确调整音量)4.单击“播放”,预览修改后的区域。5.若满意当

59、前修改后的电平,可在波形的任意位置单击,取消选择区域。若不满意,可选择“编辑撤销增幅”,或按“Ctrl+Z”组合键再次调整电平。6.可保存此次操作,进行下一操作的学习。剪切选中音频区域操作步骤如下:1.单击“波形”视图下方的“播放”按钮,确定当前波形要编辑的区域(此处将demo03的1.6秒-2.2秒作为编辑区域)。2.选中区域后,单击传输控制按钮组中最右侧的“跳过所选项目”按钮(此时该按钮会变绿),然后单击“播放”按钮,预览剪切后音频区域效果,此时文件将从头播放,然后跳过选中区域继续播放。如果对此次操作满意则继续下步操作,否则,可重新选择要操作的区域。3.选择“编辑剪切”或者按“Ctrl+X

60、”组合键,剪切选中区域,并将剪切内容放置剪切板1复制选中音频区域操作步骤如下:1.按“Ctrl+Z”组合键,撤销上一步剪切操作,以进行复制操作。2.单击“波形”视图下方的“播放”按钮,确定当前波形要编辑的区域(此处将demo03的1.6秒-2.2秒作为编辑区域)。3.若不需要精确地确定编辑区域的开头与结尾进行复制,可直接跳至步骤7。4.若需要精确地确定编辑区域的开头与结尾进行复制,可使用标记。将播放指示器放在编辑区域的开头(约1.6秒处),放大音频波形,按“M”键在1.595秒处放置一个标记。然后缩小波形,定位编辑区域的结尾(约2.2秒),再一次放大波形,在2.195秒处放置一个标记。5.缩小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论