多媒体技术好资源-第04讲数字声音基础

上传人：A*** IP属地：广东上传时间：2022-08-27 格式：PPT 页数：42 大小：599KB 积分：15 举报 版权申诉

已阅读5页，还剩37页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、数字声音根底第 4 章4.1 根本概念声音概念声音频率分布音质与数据量数字音频文件的种类4.2 声音编码方法声音编码分类 LPC MP34.3 音频编辑工具Audition 单音轨方式录音音频编辑与处置多音轨混合多音轨录音4.1根本概念声音定义声音是经过空气传播的一种延续的振动波，具有振幅、周期和频率。声音用电表示时，声音信号在时间和幅度上都是延续的模拟信号，如下图。教学进程4.1.1声音的根本特点声音的质量简称音质。音质与频率范围成正比，频率范围越宽音质越好声音具有延续性和过程性，数据前后相关，数据量大，具有实时性声音的延续时基性声音三要素(1) 音调 (高低)频率

2、(2) 音强 (强弱)音高(3) 音色 (特质)泛音教学进程声音的频谱分为线性频谱和延续频谱。声音频率分布次声波人耳可听域超声波20,000Hz女性语音150Hz 3,000Hz语音200Hz 3,400Hz调幅广播(AM)50Hz 7,000Hz调频广播(FM)20Hz 15,000Hz高级音响3Hz 40,000Hz男性语音30Hz 9,000Hz声源种类频带宽度4.1.2教学进程1人耳对不同频段的声音的敏感程度不同如：对低频敏感一些，3-5K最敏感。2不同频率有不同的听觉阈值。3人的听觉具有掩蔽效应。和环境有关。同样大小声音在嘈杂环境就会听不清。听觉特性4.1.24.1.3数字化

3、声音教学进程数字信号处置器(digital signal processor，DSP) DSP与通用微处置器相比，除了它们的构造不同外，其根本差别是，DSP有才干呼应和处置采样模拟信号得到的数据流，如做乘法和累加求和运算。在数字域而不在模拟域中做信号处置的主要优点是：首先，数字信号计算是一种准确的运算方法，它不受时间和环境变化的影响；其次，表示部件功能的数学运算不是物理上实现的功能部件，而是仅用数学运算去模拟，其中的数学运算也相对容易实现；此外，可以对数字运算部件进展编程，如欲改动算法或改动某些功能，还可对数字部件进展再编程。4.1.3数字化声音模拟信号与数字信号教学进程话音信号是典型的延续

4、信号，不仅在时间上是延续的，而且在幅度上也是延续的。在时间上“延续是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“延续是指幅度的数值有无穷多个。我们把在时间和幅度上都是延续的信号称为模拟信号。在某些特定的时辰对这种模拟信号进展丈量叫做采样(sampling)，由这些特定时辰采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个，因此幅度还是延续的。假设把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。例如，假设输入电压的范围是0.0V0.7V，并假设它的取值只限定在0、0.1、0.2，0.7共8个值。假设采样得到的幅度值是0.123V，它

5、的取值就应算作0.1V，假设采样得到的幅度值是0.26V，它的取值就算作0.3，这种数值就称为离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。4.1.3数字化声音声音采样声音数字化 (模/数转换)声音采样131130 130131把声音(模拟量)按照固定时间间隔，转换成有限个数字表示的离散序列教学进程4.1.3数字化声音声音量化声音数字化 (模/数转换)教学进程延续幅度的离散化经过量化(quantization)来实现，就是把信号的强度划分成一小段一小段，假设幅度的划分是等间隔的，就称为线性量化。4.1.3数字化声音教学进程声音数字化需求回答两个问题每秒钟需求采集多

6、少个声音样本，也就是采样频率(fs)是多少，每个声音样本的位数(bit per sample，bps)应该是多少，也就是量化精度。4.1.3数字化声音教学进程采样频率采样频率的高低是根据奈奎斯特实际(Nyquist theory)和声音信号本身的最高频率决议的。奈奎斯特实际指出，采样频率不应低于声音信号最高频率的两倍，这样就能把以数字表达的声音复原成原来的声音，这叫做无损数字化(lossless digitization)。采样定律用公式表示为 fs 2f 或者 Ts T/2其中f为被采样信号的最高频率。他可以这样来了解奈奎斯特实际：声音信号可以看成由许许多多正弦波组成的，一个振幅为A、频率为

7、f的正弦波至少需求两个采样样本表示，因此，假设一个信号中的最高频率为 ,采样频率最低要选择2 。例如，话音的信号频率约为3.4 kHz，采样频率就选为8 kHz。样本大小是用每个声音样本的位数bit/s(即bps)表示的，它反映度量声音波形幅度的精度。例如，每个声音样本用16位(2字节)表示，测得的声音样本值是在065536的范围里，它的精度就是输入信号的1/65536。样本位数的大小影响到声音的质量，位数越多，声音的质量越高，而需求的存储空间也越多；位数越少，声音的质量越低，需求的存储空间越少。采样精度的另一种表示方法是信号噪声比，简称为信噪比(signal-to-noise ratio，S

8、NR)，并用下式计算：SNR 10log (Vsignal)2 / (Vnoise)220 log (Vsignal / Vnoise)其中，Vsignal表示信号电压，Vnoise表示噪声电压；SNR的单位为分贝(db)例1：假设Vnoise1，采样精度为1位表示Vsignal21，它的信噪比SNR6分贝。假设Vnoise1，采样精度为16位表示Vsignal216，它的信噪比SNR96分贝。4.1.3数字化声音采样精度4.1.3数字化声音声音重放声音模拟化 (数/模转换)声音重放131130把数字化声音转换成模拟量，经过音响单元重放出来教学进程重放频率 (模拟量)与采样频率 (数字

9、量)的关系重放频率采样频率 2例采样频率为44,100Hz的数字音频信号复原成声音后，为22,050Hz教学进程设备和软件(1) 声音适配器 (声卡) 8bit、16bit、 128bit(2) 声卡驱动软件以及各种声音处置软件4.1.3数字化声音采样频率 Hz数据长度 bit数据量分钟11,02580.66 MB22,05081.32 MB44,10082.64 MB11,025161.32 MB22,050162.64 MB44,100165.29 MB音质评价低普通良好中良好优秀音质与数据量4.1.4 数字音频的教学进程质量采样频率(kHz)样本精度(bit/s)单道声/立体声数据

10、率(kB/s)(未紧缩)频率范围*88单道声8 2003 400 HzAM11.0258单道声11.0507 000HzFM22.05016立体声88.2 CD44.116立体声176.42020 000 HzDAT4816立体声192.02020 000 Hz音质与数据量4.1.4 数字音频的2015 000Hz4.1.5.wav WAVE (Waveform Audio)波形音频文件多媒体系统、音乐光盘制造，记录物理波形，数据量大.cda CDA (CD Audio)激光音频文件准确记录声波，数据量大，经过采样，生成wav和mp3音频文件.mid MIDI (Musical Instr

11、ument Digital Interface)乐器接口文件用于合成、游戏，记录音符时值、频率、音色特征，数据量小.mp3 mp3 (MPEG音频紧缩规范)紧缩音频文件必需经过解紧缩，数据量小文件种类及特点数字音频文件的种类教学进程文件的扩展名阐明auSun和NeXT公司的声音文件存储格式(8位m 律编码或者16位线性编码)aif(Audio Interchange)Apple计算机上的声音文件存储格式cmf(Creative Music Format)声霸(SB)卡带的MIDI文件存储格式mctMIDI文件存储格式mff(MIDI Files Format)MIDI文件存储格式mid(

12、MIDI)Windows的MIDI文件存储格式mp2MPEG Layer I , IImp3MPEG Layer IIImod(Module)MIDI文件存储格式rm(RealMedia)RealNetworks公司的流放式声音文件格式ra(RealAudio)RealNetworks公司的流放式声音文件格式rolAdlib声音卡文件存储格式snd(sound)Apple计算机上的声音文件存储格式seqMIDI文件存储格式sngMIDI文件存储格式voc(Creative Voice)声霸卡存储的声音文件存储格式wav(Waveform)*Windows采用的波形声音文件存储格式wrkCake

13、walk Pro软件采用的MIDI文件存储格式用.wav为扩展名的文件格式称为波形文件格式(WAVE File Format)，它在多媒体编程接口和数据规范1.0(Multimedia Programming Interface and Data Specifications 1.0)文档中有详细的描画。该文档是由IBM和微软公司于1991年8月结合开发的，它是一种为交换多媒体资源而开发的资源交换文件格式(Resource Interchange File Format，RIFF)。波形文件格式支持存储各种采样频率和样本精度的声音数据，并支持声音数据的紧缩。 .WAV声音文件4.1.5数字音频

14、文件的种类波形文件有许多不同类型的文件构造块组成，其中最主要的两个文件构造块是Format Chunk(格式块)和Sound Data Chunk(声音数据块)。格式块包含有描画波形的重要参数，例如采样频率和样本精度等，声音数据块那么包含有实践的波形声音数据。RIFF中的其他文件块是可选择的。它的简化构造如下图。 .WAV声音文件4.1.5数字音频文件的种类MIDI是Musical Instrument Digital Interface的首写字母组合词，可译成“电子乐器数字接口。用于在音乐合成器(music synthesizers)、乐器(musical instruments)和计算机之

15、间交换音乐信息的一种规范协议。从20世纪80年代初期开场，MIDI曾经逐渐被音乐家和作曲家广泛接受和运用。MIDI是乐器和计算机运用的规范言语，是一套指令(即命令的商定)，它指示乐器即MIDI设备要做什么，怎样做，如演奏音符、加大音量、生成音响效果等。MIDI不是声音信号，在MIDI电缆上传送的不是声音，而是发给MIDI设备或其它安装让它产生声音或执行某个动作的指令。 MIDI 简介4.1.6电子乐器数字接口(MIDI)系统可以同时播放WAVE文件和MIDI文件来一同播放语音和音乐；不能同时播放两个波形文件，由于播放采样声音时要求准确的同步。MIDI 规范之所以遭到欢迎，主要是它有以下几个优点

16、：生成的文件比较小，由于MIDI文件存储的是命令，而不是声音波形；容易编辑，由于编辑命令比编辑声音波形要容易得多；可以作背景音乐，由于MIDI音乐可以和其它的媒体，如数字电视、图形、动画、话音等一同播放，这样可以加强演示效果。 MIDI 文件的优点4.1.6电子乐器数字接口(MIDI)系统产生MIDI乐音的方法很多，如今用得较多的方法有两种：一种是(frequency modulation，FM)合成法，另一种是乐音样本合成法，也称为波形表(Wavetable)合成法。这两种方法目前主要用来生成音乐。 MIDI 的合成方法4.1.6电子乐器数字接口(MIDI)系统频率调制FM 合成法4.1.

17、6电子乐器数字接口(MIDI)系统20世纪80年代初，美国斯坦福大学(Stanford University)的一名叫John Chowning的研讨生发明了一种产生乐音的新方法，这种方法称为数字式频率调制合成法(digital frequency modulation synthesis)，简称为FM合成器。他把几种乐音的波形用数字来表达，并且用数字计算机而不是用模拟电子器件把它们组合起来，经过数模转换器(digital to analog convertor，DAC)来生成乐音。频率调制FM 合成法的原理4.1.6电子乐器数字接口(MIDI)系统它由5个根本模块组成：数字载波器、调制器、

18、声音包络发生器、数字运算器和模数转换器。声音包络发生器用来调制声音的电平，这个过程也称为幅度调制(amplitude modulation)，并且作为数字式音量控制旋钮，它的4个参数写成ADSR，这条包络线也称为音量升降维持静音包络线(Attack，decay，sustain，release，ADSR)包络线。频率调制FM 合成法的原理4.1.6电子乐器数字接口(MIDI)系统在乐音合成器中，数字载波波形和调制波形有很多种，不同型号的FM合成器所选用的波形也不同。以下图是Yamaha OPL-III数字式FM合成器采用的波形。各种不同乐音的产生是经过组合各种波形和各种波形参数并采用各种不同的

19、方法实现的。用什么样的波形作为数字载波波形、用什么样的波形作为调制波形、用什么样的波形参数去组合才干产生所希望的乐音，这就是FM合成器的算法。乐音样本合成声音的原理4.1.6电子乐器数字接口(MIDI)系统这种方法就是把真实乐器发出的声音以数字的方式记录下来，播放时改动播放速度，从而改动音调周期，生成各种音阶的音符。乐音样本的采集相对比较直观。音乐家在真实乐器上演奏不同的音符，选择44.1 kHz的采样频率、16位的乐音样本，这相当于CD-DA的质量，把不同音符的真实声音记录下来，这就完成了乐音样本的采集。乐音样本通常放在ROM芯片上。乐音样本合成器所需求的输入控制参数比较少，可控的数字音效

20、也不多，大多数采用这种合成方法的声音设备都可以控制声音包络的ADSR参数，产生的声音质量比FM合成方法产生的声音质量要高。合成器或者声音发生器的多音调(polyphony)是一次演奏多个音符(note)的才干。大多数早期的音乐合成器是单音调的，即一次仅演奏一个音符。假设在装配有单音调合成器(monophonic synthesizer)的键盘上同时按下5个键，只能听到一个音符的声音；假设在装配有能支持4个音调的合成器的键盘上同时按下5个键，可产生4个音符的声音。许多现代的声音模块有16，24或者32个音符的复调音。假设一个合成器或者声音发生器可以同时产生2个或者2个以上的不同乐音，就说这个合成

21、器或者声音发生器是多音色(multi-timbral)的。例如，假设一个合成器可以同时演奏5个音调(notes)，就说它是多音调的(polyphonic)；假设一个合成器也可以同时产生钢琴声(piano sound)和低音(bass sound)，就说它是一个多音色(multi-timbral)合成器。合成器的多音调和多音色4.1.6电子乐器数字接口(MIDI)系统一个简单的 MIDI 系统4.1.6电子乐器数字接口(MIDI)系统上图表示的是一个简单的MIDI系统，它由一个MIDI键盘控制器和一个MIDI声音模块组成。许多MIDI键盘乐器在其内部既包含键盘控制器，又包含MIDI声音模块功

22、能。在这些单元中，键盘控制器和声音模块之间曾经有内部链接，这个链接可以经过该设备中的控制功能(local control)对链接翻开(ON)或者封锁(OFF)。4.2.14.2 声音编码方法声音编码分类1波形编码基于音频数据的统计特性目的是使重建语音波形坚持原波形的外形。如脉冲编码调制等2参数编码基于音频的声学参数目的是使重建音频坚持原音频的特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。3混合编码教学进程LPC是经过分析话音波形来产生声道鼓励和转移函数的参数，对声音波形的编码实践就转化为对这些参数的编码，这就使声音的数据量大大减少。在接纳端运用LPC分析得到的参数，经过话音合

23、成器重构话音。合成器实践上是一个离散的随时间变化的时变线性滤波器，它代表人的话音生成系统模型。时变线性滤波器既当作预测器运用，又当作合成器运用。 4.2 声音编码方法4.2.2线性预测编码 (LPC)4.2.2线性预测编码 (LPC)=线性预测器是运用过去的P个样本值来预测现时辰的采样值x(n)，预测值可以用过去P个样本值的线性组合来表示：残差误差(residual error)即线性预测误差为 =4.2 声音编码方法在给定的时间范围里，如，使的平方和即为最小经过求解偏微分方程，可找到系数ai 的值。假设把发音器官等效成滤波器，这些系数值就可以了解成滤波器的系数。这些参数不再是声音波

24、形本身的值，而是发音器官的鼓励参数。 4.2 声音编码方法4.2.2线性预测编码 (LPC)4.2.3GSM编译码器GSM是Global System for Mobile communications的缩写，可译成全球数字挪动通讯系统。GSM算法是1992年柏林技术大学(Technical University Of Berlin)根据GSM协议开发的，这个协议是欧洲最流行的数字蜂窝通讯协议。GSM的输入是帧(frame)数据，一帧(20毫秒)由采样频率为8 kHz的带符号的160个样本组成，每个样本为13位或者16位的线性PCM(linear PCM)码。GSM编码器可把一帧(16016位

25、)的数据紧缩成260位的GSM帧，紧缩后的数据率为1625字节，相当于13 kb/s。由于260位不是8位的整数倍，因此编码器输出的GSM帧为264位的线性PCM码。采样频率为8 kHz、每个样本为16位的未紧缩的话音数据率为128 kb/s，运用GSM紧缩后的数据率为：(264位8000样本/秒)/160样本=13.2 千位/秒GSM的紧缩比：128:13.2 = 9.7，近似于10:1。4.2 声音编码方法4.3 声音处置软件Audition4.3.1单音轨方式录音编辑界面；多轨界面。主要不同？主要步骤：1.文件-新建-选择属性采样率、声道、量化位数2.选项-录音控制台-选择录音源3.点击播放面板的录音按钮录制，完成后点击停顿。4.文件-保管，选择类型Windows PCM、Mp3 Pro4.3

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多媒体技术好资源-第04讲数字声音基础

文档简介

温馨提示

最新文档

评论

多媒体技术好资源-第04讲数字声音基础

文档简介

温馨提示

最新文档

评论

相关文档