第3章数字音频处理技术

上传人：q*** IP属地：湖北上传时间：2022-06-26 格式：PPT 页数：55 大小：728.51KB 积分：28 举报 版权申诉

已阅读5页，还剩50页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第第 3 章章数字音频处理技术数字音频处理技术声音的概述声音的概述数字化音频数字化音频声卡与音箱声卡与音箱 MIDI技术技术数字音频的采集、编辑和转换数字音频的采集、编辑和转换本章要点：本章要点：声音（声音（Sound）是通过一定介质（如空气、水等）传播的连续波，在）是通过一定介质（如空气、水等）传播的连续波，在物理学中称为声波。声音是振动的波，是随时间连续变化的物理量。物理学中称为声波。声音是振动的波，是随时间连续变化的物理量。声波的振幅通常是指音量，它是声波波形的高低幅度，表示声波的振幅通常是指音量，它是声波波形的高低幅度，表示声音信号的强弱程度。声音信号的强弱程度。 (1)

2、声音信号的周期是指两个相邻声波之间的时间长度，即重复声音信号的周期是指两个相邻声波之间的时间长度，即重复出现的时间间隔，以秒（出现的时间间隔，以秒（s）为单位。）为单位。 (2) 声音信号的频率是指每秒钟信号变化的次数，即为周期的倒声音信号的频率是指每秒钟信号变化的次数，即为周期的倒数，以赫兹（数，以赫兹（Hz）为单位。）为单位。 (3) 声音依靠介质（空气、液体、固体）的振动进行传播。声源是一声音依靠介质（空气、液体、固体）的振动进行传播。声源是一个振荡源，它使周围的介质产生振动，并以波的形式进行传播。人个振荡源，它使周围的介质产生振动，并以波的形式进行传播。人耳感觉到这种传播过来的振动，再

3、反映到大脑，就听到了声音。声耳感觉到这种传播过来的振动，再反映到大脑，就听到了声音。声音在不同的介质中传播，其传播的速度和衰减的速率是不一样的，音在不同的介质中传播，其传播的速度和衰减的速率是不一样的，这两个因素导致了声音在不同的介质中传播的距离不同。这两个因素导致了声音在不同的介质中传播的距离不同。不同的声音有不同的频率范围。声音按频率可分为不同的声音有不同的频率范围。声音按频率可分为3种：次声波、种：次声波、可听声波和超声波。人耳只能听到频率在可听声波和超声波。人耳只能听到频率在20Hz20kHz之间的声音，之间的声音，听不到低于听不到低于20Hz和高于和高于20kHz的声音。低于的声音

4、。低于20Hz的为次声波，高于的为次声波，高于20kHz的为超声波。人的发声器官发出的声音频率是的为超声波。人的发声器官发出的声音频率是803400Hz，但，但人说话的声音信号频率通常为人说话的声音信号频率通常为300Hz3kHz，把在这种频率范围内的，把在这种频率范围内的信号称为语音信号。信号称为语音信号。次声波人耳可听域超声波20000Hz 声音以振动的形式从声源向四周传播。从声源直接到达人类声音以振动的形式从声源向四周传播。从声源直接到达人类听觉器官的声音是听觉器官的声音是“直达声直达声”。直达声的方向辨别非常容易。但。直达声的方向辨别非常容易。但是，在现实生活中，森林、海洋、建筑、地

5、貌和景物等存在于我是，在现实生活中，森林、海洋、建筑、地貌和景物等存在于我们周围，声音从声源发出后，经过多次反射才能被人们听到，这们周围，声音从声源发出后，经过多次反射才能被人们听到，这就是就是“反射声反射声”。 (1) 音调即声音的高低，与频率有关。频率越高，音调越高，反之亦音调即声音的高低，与频率有关。频率越高，音调越高，反之亦然。在使用音频处理软件对声音的频率进行调整时，其音调会随之变然。在使用音频处理软件对声音的频率进行调整时，其音调会随之变化。不同的声源有它自己特定的音调，如果改变了声源的音调，那么化。不同的声源有它自己特定的音调，如果改变了声源的音调，那么声音会发生质的转变，使人们

6、无法辨别声源本来的面目。声音会发生质的转变，使人们无法辨别声源本来的面目。 (2) 音强即声音的响亮程度（或音量），与振幅相关，取决于声波信音强即声音的响亮程度（或音量），与振幅相关，取决于声波信号的强弱程度。音强与声波振幅成正比，振幅越大，强度越大，反之号的强弱程度。音强与声波振幅成正比，振幅越大，强度越大，反之亦然。唱盘、亦然。唱盘、CD盘以及其他形式的声音载体中的音强是一定的，通盘以及其他形式的声音载体中的音强是一定的，通过播放设备的音量控制，可以改变聆听时的强度。如果想改变原始声过播放设备的音量控制，可以改变聆听时的强度。如果想改变原始声音的音强，可以在声音数字化以后，使用音频处理软件

7、提高音强。音的音强，可以在声音数字化以后，使用音频处理软件提高音强。 (3) 音色指声音的感觉特性，与波形相关，影响声音感觉特色音色指声音的感觉特性，与波形相关，影响声音感觉特色的因素是复音。所谓的因素是复音。所谓“复音复音”是指具有不同频率和不同振幅的是指具有不同频率和不同振幅的混合声音，自然声中大部分是复音。在复音中，最低频率是混合声音，自然声中大部分是复音。在复音中，最低频率是“基音基音”，它是声音的基调；其他频率的声音称为，它是声音的基调；其他频率的声音称为“谐音（泛谐音（泛音）音）”。从模拟信号过渡到数字信号从模拟信号过渡到数字信号回顾历史，大多数电信号的处理一直是用模拟元部件回

8、顾历史，大多数电信号的处理一直是用模拟元部件(如晶体管、变压如晶体管、变压器、电阻、电容等器、电阻、电容等)对模拟信号进行处理。但是，开发一个具有相当精对模拟信号进行处理。但是，开发一个具有相当精度、且几乎不受环境变化影响的模拟信号处理元部件是相当困难的，度、且几乎不受环境变化影响的模拟信号处理元部件是相当困难的，而且成本也很高。而且成本也很高。如果把模拟信号转变成数字信号，用数字来表示模拟量，对数字信号如果把模拟信号转变成数字信号，用数字来表示模拟量，对数字信号做计算，那么难点就发生了转移。把开发模拟运算部件的问题转变成做计算，那么难点就发生了转移。把开发模拟运算部件的问题转变成开发数字运算

9、部件的问题，这就出现了数字信号处理器开发数字运算部件的问题，这就出现了数字信号处理器(digital signal processor,DSP)。DSP与通用微处理器相比，除了它们的结构不同外，与通用微处理器相比，除了它们的结构不同外，其基本差别是，其基本差别是，DSP有能力响应和处理采样模拟信号得到的数据流，有能力响应和处理采样模拟信号得到的数据流，如做乘法和累加求和运算。如做乘法和累加求和运算。从模拟信号过渡到数字信号从模拟信号过渡到数字信号在数字域而不在模拟域中做信号处理的主要优点是：首先，数字在数字域而不在模拟域中做信号处理的主要优点是：首先，数字信号计算是一种精确的运算方法，它不

10、受时间和环境变化的影响；信号计算是一种精确的运算方法，它不受时间和环境变化的影响；其次，表示部件的数学运算不是物理上实现的功能部件，而是仅其次，表示部件的数学运算不是物理上实现的功能部件，而是仅用数学运算去模拟，其中的数学运算也相对容易实现；此外，可用数学运算去模拟，其中的数学运算也相对容易实现；此外，可以对数字运算不见进行编程，如欲改变算法或改变某些功能，还以对数字运算不见进行编程，如欲改变算法或改变某些功能，还可对数字部件进行再编程。可对数字部件进行再编程。话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是话音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续

11、的。在时间上连续的。在时间上“连续连续”是指在一个指定的时间范围里声音信号的幅值是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上有无穷多个，在幅度上“连续连续”是指幅度的数值有无穷多个。我们把在时是指幅度的数值有无穷多个。我们把在时间和幅度上都是连续的信号称为模拟信号。间和幅度上都是连续的信号称为模拟信号。在某些特定的时刻对这种模拟信号进行测量叫做采样在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling)，由这，由这些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷些特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷多个实数值中的一个，因此幅度还

12、是连续的。如果把信号幅度取值的数多个实数值中的一个，因此幅度还是连续的。如果把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。例如，目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。例如，假设输入电压的范围是假设输入电压的范围是0.0V-0.7V,并假设它的取值只限定在并假设它的取值只限定在0,0.1,0.2,0.7共共8个值。如果采样得到的幅度值是个值。如果采样得到的幅度值是0.123V，它的取值就应算作，它的取值就应算作0.1V，如果采样得到的幅度值是如果采样得到的幅度值是0.26V，它的取值就算作，它的取值就算作0.3，这种数值就称为，这种数值就称为离散

13、数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信离散数值。我们把时间和幅度都用离散的数字表示的信号就称为数字信号。号。采样频率又称取样频率，它是指将模拟声音波形转换为数字音采样频率又称取样频率，它是指将模拟声音波形转换为数字音频时，每秒钟所抽取声波幅度样本的次数。采样频率的高低是根据频时，每秒钟所抽取声波幅度样本的次数。采样频率的高低是根据奈奎斯特理论奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。和声音信号本身的最高频率决定的。奈奎斯特理论指出：采样频率不应低于声音信号最高频率的两倍，奈奎斯特理论指出：采样频率不应低于声音信号最高频率的两倍，这样就能把

14、以数字表达的声音还原为原来的声音，这叫做无损数字这样就能把以数字表达的声音还原为原来的声音，这叫做无损数字化化(lossless digitization)。你可以这样来理解奈奎斯特理论：声音信号。你可以这样来理解奈奎斯特理论：声音信号可以看成由许许多多正玄波组成的，一个振幅为可以看成由许许多多正玄波组成的，一个振幅为A、频率为、频率为f的正炫的正炫波至少需要两个采样样本表示，因此，如果一个信号中的最高频率波至少需要两个采样样本表示，因此，如果一个信号中的最高频率为为f,采样频率最低要选择采样频率最低要选择2f。例如：电话话音的信号频率约为。例如：电话话音的信号频率约为3.4kHz,采样频率就

15、选为采样频率就选为8kHz。量化位数又称取样大小，它是每个采样点能够表示的数据范量化位数又称取样大小，它是每个采样点能够表示的数据范围。量化位数的大小决定了声音的动态范围，即被记录和重放的围。量化位数的大小决定了声音的动态范围，即被记录和重放的声音最高与最低之间的差值。声音最高与最低之间的差值。声道数是指所使用的声音的通道个数，它表明声音一次同声道数是指所使用的声音的通道个数，它表明声音一次同时产生的声波组数。声音的声道数也是技术发展的重要标志，时产生的声波组数。声音的声道数也是技术发展的重要标志，从单声道到环绕立体声，声音的质量越来越好，但是同时增加从单声道到环绕立体声，声音的质量越来越

16、好，但是同时增加了对存储和传输媒体的要求。了对存储和传输媒体的要求。 (1) 单声道是比较原始的声音复制形式，早期的音频卡采用的比单声道是比较原始的声音复制形式，早期的音频卡采用的比较普遍。当通过两个扬声器回放单声道信息的时候，可以明显感较普遍。当通过两个扬声器回放单声道信息的时候，可以明显感觉到声音是从两个音箱中间传递到耳朵里的。觉到声音是从两个音箱中间传递到耳朵里的。 (2) 立体声又称为双声道。单声道缺乏对声音的位置定位，而立立体声又称为双声道。单声道缺乏对声音的位置定位，而立体声技术则彻底改变了这一状况。声音在录制过程中被分配到两体声技术则彻底改变了这一状况。声音在录制过程中被分配到两

17、个独立的声道，从而达到了很好的声音定位效果。个独立的声道，从而达到了很好的声音定位效果。 (3) 准立体声指的是在录制声音的时候采用单声道，而放音有时准立体声指的是在录制声音的时候采用单声道，而放音有时是立体声，有时是单声道。是立体声，有时是单声道。 (4) 准立体声指的是在录制声音的时候采用单声道，而放音有时准立体声指的是在录制声音的时候采用单声道，而放音有时是立体声，有时是单声道。是立体声，有时是单声道。 (5) 5.1声音系统来源于声音系统来源于4.1环绕，不同之处在于它增加了一个中环绕，不同之处在于它增加了一个中置单元。这个中置单元负责传送低于置单元。这个中置单元负责传送低于80 Hz

18、的声音信号，在欣赏的声音信号，在欣赏影片时有利于加强人声，把对话集中在整个声场的中部，以增加影片时有利于加强人声，把对话集中在整个声场的中部，以增加整体效果。整体效果。 (6) 是在是在5.1的基础上又增加了中左和中右两个发音点，以求达到的基础上又增加了中左和中右两个发音点，以求达到更加完美的境界。更加完美的境界。音频数据压缩比的表达式音频数据压缩比的表达式音频数据压缩比音频数据压缩比 = 压缩后的音频数据压缩后的音频数据压缩前的音频数据压缩前的音频数据数据率为每秒位数，它与信息在计算机中的实时传输有直接关系，数据率为每秒位数，它与信息在计算机中的实时传输有直接关系，而其总数据量又与计算

19、机的存储空间有直接关系。用数字音频产生而其总数据量又与计算机的存储空间有直接关系。用数字音频产生的数据一般以的数据一般以WAVE的文件格式存储，以的文件格式存储，以 “.WAV”作为文件扩展名。作为文件扩展名。编码作用：一方面是采用一定的格式来记录数字数据，另一方面是编码作用：一方面是采用一定的格式来记录数字数据，另一方面是采用一定的算法来压缩数字数据以减少存储空间和提高传输效率。采用一定的算法来压缩数字数据以减少存储空间和提高传输效率。压缩比越大，信息丢失越多，信号还原后失真越大。压缩比越大，信息丢失越多，信号还原后失真越大。数据量数据量=采样频率采样频率（量化位数（量化位数/8）声道数声

20、道数声音持续时间声音持续时间对于调频广播级立体声，采样频率为对于调频广播级立体声，采样频率为44.1kHz，量化等级为，量化等级为16位（即位（即2字节）声道形式为双声道，则转换后每秒以千字节为字节）声道形式为双声道，则转换后每秒以千字节为单位的数据量为：单位的数据量为： 44 100（Hz）（16/8）（）（B）2=176 400B/s172kB/s 用用44.1kHz的采样频率对声波进行采样，每个采样点的量化位的采样频率对声波进行采样，每个采样点的量化位数选用数选用16位，则录制位，则录制3分钟的立体声节目，其波形文件所需的分钟的立体声节目，其波形文件所需的存储容量为：存储容量为：44

21、100（Hz）（16/8）（）（B）2360=31 752 000B/s 31 007.8kB/s 30.28MB/s 用用44.1kHz的采样频率对声波进行采样，每个采样点的量化位的采样频率对声波进行采样，每个采样点的量化位数选用数选用16位，则录制位，则录制5分钟的单声道节目，其波形文件所需的分钟的单声道节目，其波形文件所需的存储容量为：存储容量为：44 100（Hz）（16/8）（）（B）1560=26460000B/s 26460kB/s 26.46MB/s数据的采样频率和量化位数是影响数据的两个因素。提高采样频率数据的采样频率和量化位数是影响数据的两个因素。提高采样频率和增加量化位数

22、将使相应的数据量大大增加，给声音信号的存储与和增加量化位数将使相应的数据量大大增加，给声音信号的存储与传输带来困难，这就需要在声音的质量与数据量之间作出恰当的选传输带来困难，这就需要在声音的质量与数据量之间作出恰当的选择。择。数字音频等级数字音频等级采样频率采样频率/kHz量化位量化位数数/bit声道数声道数每分钟的数据量每分钟的数据量/MB（无压缩）（无压缩）等效音质等效音质11.0258单声道单声道0.63语音语音22.0516双声道双声道5.05FM广播广播44.116双声道双声道10.09CD唱盘唱盘常用的采样指标及等效音质常用的采样指标及等效音质信号类型信号类型频率范围频率范围/

23、Hz 采样率采样率/kHz量化位数量化位数/bit 电话话音电话话音200340088宽带音频宽带音频5070001616调频广播调频广播201500037.816高质量音频高质量音频202000044.116 如同存储文本文件一样，存储声音数据也需要有存储格式。在因如同存储文本文件一样，存储声音数据也需要有存储格式。在因特网上和各种机器上运行的声音文件格式很多，但目前比较流行特网上和各种机器上运行的声音文件格式很多，但目前比较流行的有以的有以.wav(waveform),.au(audio),.aiff(audio interchangeable file format)和和.snd(sou

24、nd)为扩展名的文件格式。为扩展名的文件格式。.wav格式主要用在格式主要用在PC上，上，.au主要用在主要用在Unix工作站上，工作站上，.aiff和和snd主要用在苹果机和美国主要用在苹果机和美国视算科技有限公司视算科技有限公司(Silicon Graphics,Inc.,SGI)的工作站上。的工作站上。数字音频数据是以文件的形式保存在计算机里。数字音频的文数字音频数据是以文件的形式保存在计算机里。数字音频的文件格式主要有件格式主要有WAV、MP3、WMA、MIDI、VOC、PCM、RA、CDA等。等。 WAV（Wave）文件，又名波形文件，扩展名为）文件，又名波形文件，扩展名为.WAV

25、这是这是Windows本身存放数字声音的标准格式，几乎所有的音频处理本身存放数字声音的标准格式，几乎所有的音频处理软件都支持软件都支持WAV格式。格式。 MP3（MPEG Audio-3）是现在最流行的声音文件格式，）是现在最流行的声音文件格式，其扩展名为其扩展名为.MP3，它是采用，它是采用MPEG标准音频数据压缩编码中层标准音频数据压缩编码中层技术压缩之后的数字音频文件，技术压缩之后的数字音频文件，MP3格式压缩音乐的典型比格式压缩音乐的典型比例有例有10:1、17:1，甚至，甚至70:l 。微软的微软的Windows Media Audio 7是一种压缩的离散文件或流式文是一种压缩的离

26、散文件或流式文件，其文件扩展名是件，其文件扩展名是.WMA，WMA（Windows Media Audio）相对）相对于于MP3的主要优点是在较低的采样频率下保持良好的音质。的主要优点是在较低的采样频率下保持良好的音质。乐器数字接口乐器数字接口MIDI（Musical Instrument Digital Interface）是由世界上主要电子乐器制造厂商建立的一个通信标准，以规定计是由世界上主要电子乐器制造厂商建立的一个通信标准，以规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。号的方法。 VOC（Crea

27、tive Voice）文件是）文件是Creative公司波形音频文件格式，公司波形音频文件格式，也是声霸卡使用的音频文件格式。每个也是声霸卡使用的音频文件格式。每个VOC文件由文件头块文件由文件头块（Header Block）和音频数据块（）和音频数据块（Data Block）组成。）组成。 RA（Real Audio）是）是Real networks推出的一种音乐压缩格推出的一种音乐压缩格式，其压缩比可以达到式，其压缩比可以达到96:1，其最大特点是可以采用流媒体的，其最大特点是可以采用流媒体的方式实现网上实时播放，即边下载边播放。该文件扩展名方式实现网上实时播放，即边下载边播放。该文件扩展

28、名是是.RA。 CDA（CD Audio）又称为）又称为CD音乐，其扩展名为音乐，其扩展名为.CDA，是，是标准的激光盘文件。它是唱片采用的格式，又叫标准的激光盘文件。它是唱片采用的格式，又叫“红皮书红皮书”格格式，记录的是波形流，该文件的特点是音质好，绝对纯正，但式，记录的是波形流，该文件的特点是音质好，绝对纯正，但缺点是数据量大，无法编辑。缺点是数据量大，无法编辑。 PCM（Pulse Code Modulation）文件是模拟的音频信号经）文件是模拟的音频信号经过模数转换（过模数转换（A/D转换）直接形成的二进制数字序列，该文件没转换）直接形成的二进制数字序列，该文件没有附加的文件头和文

29、件结束标志。有附加的文件头和文件结束标志。最基本的编辑是删除声音文件中不需要的声音片段，一般的最基本的编辑是删除声音文件中不需要的声音片段，一般的方法是确定片段的起点和终点，把它删掉。方法是确定片段的起点和终点，把它删掉。可以将单声道的声音变成双声道的声音。可以将单声道的声音变成双声道的声音。声音从无到有，逐渐增强，直到正常，有逐渐走近的效果。声音从无到有，逐渐增强，直到正常，有逐渐走近的效果。均衡控制指对不同频段的声音音量的调整，可以使声音产生均衡控制指对不同频段的声音音量的调整，可以使声音产生清脆，低沉，柔和等效果。清脆，低沉，柔和等效果。音频信号是依赖时间的连续媒体，因此，音频

30、处理的时序性音频信号是依赖时间的连续媒体，因此，音频处理的时序性要求很高。如果在时间上有要求很高。如果在时间上有25ms的延迟，人就会感到断续。的延迟，人就会感到断续。对语音信号的处理，不仅是信号处理问题，还要抽取语意等对语音信号的处理，不仅是信号处理问题，还要抽取语意等其他信息；可能还会涉及到语言学、社会学、声学等。其他信息；可能还会涉及到语言学、社会学、声学等。音频信号分为两类：语音信号与非语音信号。非语音信号又可分音频信号分为两类：语音信号与非语音信号。非语音信号又可分为音乐和杂音。非语音信号的特点是不具有复杂的语义和语法信为音乐和杂音。非语音信号的特点是不具有复杂的语义和语法信息，

31、信息量低，识别简单。语音是语言的物质外壳。息，信息量低，识别简单。语音是语言的物质外壳。 (1) 相应处理：音频获取，包括比如语音识别与理解。相应处理：音频获取，包括比如语音识别与理解。(2) 相应处理：音频合成，包括音乐合成和语音合成；声音定位，相应处理：音频合成，包括音乐合成和语音合成；声音定位，包括立体声模拟，音频包括立体声模拟，音频/视频同步，其目的是让计算机产生真视频同步，其目的是让计算机产生真实感声音。实感声音。 (3)相应处理：人通过网络，与处于异地的人进行语音通信，需要相应处理：人通过网络，与处于异地的人进行语音通信，需要的音频处理包括：语音采集、音频编码的音频处理包括：语音采

32、集、音频编码/解码、音频传输等。解码、音频传输等。音频编音频编/解码技术是信道利用率的关键。解码技术是信道利用率的关键。 (1) 通过声卡，人们可将外部的声音信号录入计算机，并以文件形通过声卡，人们可将外部的声音信号录入计算机，并以文件形式保存，需要时只需调出相应的声音播放即可。式保存，需要时只需调出相应的声音播放即可。(2) 对声音文件进行多种特技效果的处理，音乐合成功能和性能主对声音文件进行多种特技效果的处理，音乐合成功能和性能主要依赖于合成芯片。要依赖于合成芯片。(3) MIDI接口：外部电子乐器与计算机之间的通信。接口：外部电子乐器与计算机之间的通信。CD-ROM：各种各样的。：各种各

33、样的。游戏棒接口：游戏棒接口：(4)文语转换和语音识别文语转换和语音识别对声音文件进行多种特技效果的处理，音乐合成功能和性能主对声音文件进行多种特技效果的处理，音乐合成功能和性能主要依赖于合成芯片。要依赖于合成芯片。声卡是将话筒或线性输入的声音信号经过声卡是将话筒或线性输入的声音信号经过A/D转换变成数字信转换变成数字信号进行数据处理，然后再经过号进行数据处理，然后再经过 D/A转换成模拟信号，送往混转换成模拟信号，送往混音器中放大，最后输出驱动扬声器发声。音器中放大，最后输出驱动扬声器发声。声卡的核心器件是数字音频处理芯片和音乐合成器，他们决声卡的核心器件是数字音频处理芯片和音乐合成器，

34、他们决定了声卡的性能优劣。定了声卡的性能优劣。声卡的分类主要根据数据采样量化的位数来分，通常分为声卡的分类主要根据数据采样量化的位数来分，通常分为8位、位、16位和位和32位几种类型，位数越高取样频率越高，量化精度越位几种类型，位数越高取样频率越高，量化精度越高，音质就越好。高，音质就越好。 (1) 采样频率一般有采样频率一般有3种标准：种标准：11.025kHz（语音等级）、（语音等级）、22.05kHz（音乐等级）、（音乐等级）、44.1kH。（高保真效果等级）。采样。（高保真效果等级）。采样频率的高低直接影响声卡的频率响应范围。频率的高低直接影响声卡的频率响应范围。量化位数通常有两种

35、标准：量化位数通常有两种标准：8位和位和16位。对于语音信号，位。对于语音信号，8位量化位数基本可以满足要求；但是对于音量幅度变化很大的位量化位数基本可以满足要求；但是对于音量幅度变化很大的交响乐，就需要交响乐，就需要16位量化音频质量。位量化音频质量。(2) 采用什么样的核心器件是决定声卡性能高低的主要因素。采用什么样的核心器件是决定声卡性能高低的主要因素。 (3) 声卡依其与计算机的连接方式不同，分为声卡依其与计算机的连接方式不同，分为ISA总线、总线、PCI总总线和通过线和通过USB电缆连接的外置方式。电缆连接的外置方式。 (4) 声卡所支持的声道数也是声卡技术发展的重要标志之一，声卡所

36、支持的声道数也是声卡技术发展的重要标志之一，它决定了声卡的基本功能。通常有它决定了声卡的基本功能。通常有2声道（即立体声）、声道（即立体声）、2.1声声道、道、4.1声道、声道、5.1声道甚至声道甚至7.1声道等，多通道声卡是营造逼真声道等，多通道声卡是营造逼真音效环境的先决条件。音效环境的先决条件。多媒体电脑将其声音文件通过电脑中的声卡，将数字音频信号转为多媒体电脑将其声音文件通过电脑中的声卡，将数字音频信号转为模拟音频信号再由其输出口输出，这时音频信号电平较弱，一般只模拟音频信号再由其输出口输出，这时音频信号电平较弱，一般只有几百毫伏，还不能推动喇叭正常工作。而推动喇叭正常工作的电有几百

37、毫伏，还不能推动喇叭正常工作。而推动喇叭正常工作的电压一般需要几伏左右的信号电压。这时就需要将声卡输出的小信号压一般需要几伏左右的信号电压。这时就需要将声卡输出的小信号通过放大器（俗称功放）加以放大。放大后的音频信号就可以推动通过放大器（俗称功放）加以放大。放大后的音频信号就可以推动喇叭将音频电信号转换为声音信号了。而现在最新推出的喇叭将音频电信号转换为声音信号了。而现在最新推出的USB多媒多媒体音箱则可以不需要声卡，它通过电脑的体音箱则可以不需要声卡，它通过电脑的USB接口输出端引入数字接口输出端引入数字音频信号，然后音频信号，然后USB多媒体音箱将此信号通过内部专用的多媒体音箱将此信号通过

38、内部专用的USB IC芯片转换为模拟音频信号，从而实现取代声卡的功能。芯片转换为模拟音频信号，从而实现取代声卡的功能。按照材质不用分：塑料音响和木质音响按照材质不用分：塑料音响和木质音响按照功率放大器分：有源音箱和无源音箱按照功率放大器分：有源音箱和无源音箱按照接口：普通声卡接口，数字接口，按照接口：普通声卡接口，数字接口，USB接口，接口， IEEE1394接口接口按照声道数分：多种类型按照声道数分：多种类型 (1) 输出功率是音箱最重要的指标，输出功率分为额定功率和输出功率是音箱最重要的指标，输出功率分为额定功率和最大峰值功率两种。最大峰值功率两种。额定功率额定功率是音箱谐波失真在标准范

39、围内变化时，音箱长是音箱谐波失真在标准范围内变化时，音箱长时间工作输出功率的最大值。时间工作输出功率的最大值。最大峰值功率最大峰值功率是在不损坏音箱的前提下，瞬时功率的最是在不损坏音箱的前提下，瞬时功率的最大值。大值。 (2) 频率范围频率范围是指音箱最低有效回放频率和最高有效回放频率是指音箱最低有效回放频率和最高有效回放频率之间的范围，单位为赫兹。之间的范围，单位为赫兹。频率响应频率响应是指将一个以恒定电压输出的音频信号与音箱系是指将一个以恒定电压输出的音频信号与音箱系统相连接时，音箱产生的声压会随频率的变化而增大或衰减，统相连接时，音箱产生的声压会随频率的变化而增大或衰减，相位也会随频率

40、而发生变化。相位也会随频率而发生变化。声压、相位与频率变化的曲线分别叫做声压、相位与频率变化的曲线分别叫做幅频特性幅频特性和和相频特相频特性性，合称，合称频率特性频率特性。 (3) 信噪比信噪比是指音箱回放的有效信号与噪声信号的比值，单位是指音箱回放的有效信号与噪声信号的比值，单位是分贝（是分贝（dB）。信噪比越高越好。）。信噪比越高越好。 (4) 失真度分为谐波失真、互调失真和瞬态失真失真度分为谐波失真、互调失真和瞬态失真3种。种。谐波失真是指声音回放中由于增加了原信号没有的高谐波失真是指声音回放中由于增加了原信号没有的高次谐波成分而导致的失真；次谐波成分而导致的失真；互调失真影响到的

41、主要是声音的音调方面；互调失真影响到的主要是声音的音调方面；瞬态失真是因为扬声器具有一定的惯性质量，盆体的瞬态失真是因为扬声器具有一定的惯性质量，盆体的振动无法跟上瞬间变化的电信号的振动而导致的原信号与回放振动无法跟上瞬间变化的电信号的振动而导致的原信号与回放音色之间的差异。音色之间的差异。 (5) 灵敏度灵敏度是指产生全功率输出时的输入信号。输入信号越低，是指产生全功率输出时的输入信号。输入信号越低，灵敏度越高，音箱性能就越好。音箱的灵敏度每差灵敏度越高，音箱性能就越好。音箱的灵敏度每差3dB，输出，输出的声压就相差一倍，一般的声压就相差一倍，一般84dB以下为低灵敏度，以下为低灵敏度，8

42、7dB为中灵敏为中灵敏度，度，90dB以上为高灵敏度。以上为高灵敏度。 (6) 阻抗是指扬声器输入信号的电压与电流的比值。阻抗是指扬声器输入信号的电压与电流的比值。音箱的输入阻抗一般分为高阻抗和低阻抗两种：高于音箱的输入阻抗一般分为高阻抗和低阻抗两种：高于16的是高阻抗，低于的是高阻抗，低于8的是低阻抗，音箱的标准阻抗是的是低阻抗，音箱的标准阻抗是8。在功放与输出功率相同的情况下，低阻抗的音箱可以获得较大在功放与输出功率相同的情况下，低阻抗的音箱可以获得较大的输出功率，但阻抗太低又会造成欠阻尼和低音劣化等现象。的输出功率，但阻抗太低又会造成欠阻尼和低音劣化等现象。 MIDI（ Musical

43、 Instrument Digital Interface）是音乐乐器数字接）是音乐乐器数字接口。口。MIDI是一种技术规范，它定义了为把电子乐器连接到计算机所需是一种技术规范，它定义了为把电子乐器连接到计算机所需要的电缆和端口的一种硬件标准，也定义了控制计算机和具有要的电缆和端口的一种硬件标准，也定义了控制计算机和具有MIDI接接口的设备之间进行消息交换的一整套规则，包括电子乐器之间传送数据口的设备之间进行消息交换的一整套规则，包括电子乐器之间传送数据的通信协议。的通信协议。 MIDI（乐器数字接口）是数字音乐的国际标准，任何电子乐器，（乐器数字接口）是数字音乐的国际标准，任何电子乐器，只要

44、有处理只要有处理MIDI指令的微处理器，并有合适的硬件接口，都可以成为指令的微处理器，并有合适的硬件接口，都可以成为一个一个MIDI设备。设备。MIDI的音乐符号化过程实际上就是产生的音乐符号化过程实际上就是产生MIDI协议信协议信息的过程。它没有波形声音那种数字化采样和编码过程，而是将电子乐息的过程。它没有波形声音那种数字化采样和编码过程，而是将电子乐器键盘的弹奏过程记录下来，作为某首乐谱的一种数字描述的器键盘的弹奏过程记录下来，作为某首乐谱的一种数字描述的MIDI消消息。当需要重新产生这首乐谱时，只需要从息。当需要重新产生这首乐谱时，只需要从MIDI文件中读出相应的文件中读出相应的MIDI

45、消息再通过音乐合成器生成音乐声波，经放大后由扬声器播出。消息再通过音乐合成器生成音乐声波，经放大后由扬声器播出。 MIDI有以下常用的术语有以下常用的术语（1）MIDI音乐合成器音乐合成器利用数字信号处理器或其他芯片来产生音乐或声音的电子装利用数字信号处理器或其他芯片来产生音乐或声音的电子装置。置。（2）MIDI消息或指令消息或指令乐谱的一种记录格式，相当于乐谱语言。乐谱的一种记录格式，相当于乐谱语言。（3）MIDI接口接口 MIDI硬件通信协议。硬件通信协议。（4）MIDI通道通道共共16个通道，其中个通道，其中110通道作扩展合成器，通道作扩展合成器，1316用作基本用作基本合成器合

46、成器（5）MIDI文件文件由控制数据和乐谱信息数据构成。由控制数据和乐谱信息数据构成。（6）音序器）音序器是为是为MIDI作曲而设计的计算机程序或电子装置。作曲而设计的计算机程序或电子装置。 1. 存储容量小；存储容量小；2. 具有背景音乐或音响效果的配音功能；具有背景音乐或音响效果的配音功能；3. 便于编辑和修改；便于编辑和修改；4. 可以在可以在MIDI合成器中完全重现原来的演奏。合成器中完全重现原来的演奏。根据根据MIDI的特点，在以下几种情况下比较适合用的特点，在以下几种情况下比较适合用MIDI谱曲：谱曲：（1）需要播放长时间的高质量的音乐。）需要播放长时间的高质量的音乐。（2）需

47、要以音乐作背景音响效果，同时从）需要以音乐作背景音响效果，同时从 CD一一ROM装载装载其他音乐文件。其他音乐文件。（3）需要以音乐作背景音响效果，同时播放波形音频，以）需要以音乐作背景音响效果，同时播放波形音频，以实现语音和音乐的同时输出。实现语音和音乐的同时输出。 MIDI规范规定，每种规范规定，每种MIDI装置通常由一个接收器和一个发送器装置通常由一个接收器和一个发送器组成，如果该装置只作输出端或输入端，则可以省去其中之一。组成，如果该装置只作输出端或输入端，则可以省去其中之一。接收器可以接收接收器可以接收MIDI格式的消息，并执行格式的消息，并执行MIDI命令；命令；发送器可以生成

48、符合发送器可以生成符合MIDI格式的消息并向外发送。格式的消息并向外发送。一个接收器和一个发送器构成一对一个接收器和一个发送器构成一对MIDI消息输入输出组合，它们消息输入输出组合，它们之间用一种通用的异步收发器互相连接，数据传输的比特率为之间用一种通用的异步收发器互相连接，数据传输的比特率为3125bps，每个数据字节（，每个数据字节（8位）前后各有一个起始位和停止位。位）前后各有一个起始位和停止位。 MIDI设备的端口有三种：设备的端口有三种：MIDI In（输入口）、（输入口）、MIDI Out（输出（输出口）和口）和MIDI Thru（传送口）。（传送口）。 MIDI规范规定，规范规

49、定，MIDI键盘共有键盘共有128个键。个键。MIDI消息可以描述每个消息可以描述每个音符对应的键号、按键持续时间、音量和力度等信息。音符对应的键号、按键持续时间、音量和力度等信息。 MIDI接收器有接收器有16个声道（个声道（Channel），它们可以同时向声音合成），它们可以同时向声音合成器传送器传送16路不同的声音。路不同的声音。 MIDI 音乐的产生过程音乐的产生过程 MIDI电子乐器电子乐器 MIDI接口接口音序器音序器音乐合成器音乐合成器 MIDI文件文件扬声器扬声器 MIDI指令指令计算机音频卡计算机音频卡模拟音频信号模拟音频信号声频卡的声频卡的MIDI音乐合成主要有两

50、种方法：音乐合成主要有两种方法： FM 数字式频率调制合成法。数字式频率调制合成法。波形表合成法。波形表合成法。MIDI作曲和核配器系统核心部分是一个被称为序列器的软件。这个软件作曲和核配器系统核心部分是一个被称为序列器的软件。这个软件即可以装到个人电脑里，也可做在一个专门的硬件里。序列器实际上是即可以装到个人电脑里，也可做在一个专门的硬件里。序列器实际上是一个音乐词处理器（一个音乐词处理器（word porcessor），应用它可以记录、播放和编辑），应用它可以记录、播放和编辑各种不同各种不同MIDI乐器演奏出的乐曲。序列器并不真正的记录声音，它只记乐器演奏出的乐曲。序列器并不真正的记录声

51、音，它只记录和播放录和播放MIDI信息，这些信息从信息，这些信息从MIDI乐器来的电脑信息，就像印在纸乐器来的电脑信息，就像印在纸上的乐谱一样，它本身不能直接产生音乐，上的乐谱一样，它本身不能直接产生音乐，MIDI本身也不能产生音乐，本身也不能产生音乐，但是它包含有如何产生音乐所需的所有指令，例如用什么乐器、奏什么但是它包含有如何产生音乐所需的所有指令，例如用什么乐器、奏什么音符、奏得多快，奏得力度多强等。音符、奏得多快，奏得力度多强等。序列器可以是硬件，也可以是软件，它们作用过程完全与专业录音棚里序列器可以是硬件，也可以是软件，它们作用过程完全与专业录音棚里多轨录音机一样，可以把许多独立的

52、声音记录在序列器里，其区别仅仅多轨录音机一样，可以把许多独立的声音记录在序列器里，其区别仅仅是序列器只记录演奏时的是序列器只记录演奏时的MIDI数据，而不记录声音；它可以一轨一轨地数据，而不记录声音；它可以一轨一轨地进行录制，也可以一轨轨地进行修改，当你弹键盘音乐时，序列器记录进行录制，也可以一轨轨地进行修改，当你弹键盘音乐时，序列器记录下从键盘来的下从键盘来的MIDI数据。一旦把所需要的数据存储下来以后，可以播放数据。一旦把所需要的数据存储下来以后，可以播放你刚作好的曲子。如果你觉得这一声部的曲子不错，可以把别的声部加你刚作好的曲子。如果你觉得这一声部的曲子不错，可以把别的声部加上去，新加上

53、去的声部播放时完全与第一道同步。上去，新加上去的声部播放时完全与第一道同步。 MIDI系统是如何工作的系统是如何工作的 MIDI程序的设计目标就是要将所要演奏的音乐或音乐曲目，按其进行的程序的设计目标就是要将所要演奏的音乐或音乐曲目，按其进行的节奏、速度、技术措施等要求，转换成节奏、速度、技术措施等要求，转换成MIDI控制语言，以便在这些控制语言，以便在这些MIDI指令的控制之下，各种音源在适当的时间点上，以指定的音色、时指令的控制之下，各种音源在适当的时间点上，以指定的音色、时值、强度等、演奏出需要的音响。在录音系统中，还要控制记录下这些值、强度等、演奏出需要的音响。在录音系统中，还要控制记录下这些音响。音响。MIDI所适应的范围只是电声乐曲或模拟其他乐器的乐曲。所适应的范围只是电声乐曲或模拟其他乐器的乐曲。 MIDI技术的产生与应用，大大降低了乐曲的创作成本，节省了大量乐队技术的产生与应用，大大降低了乐曲的创作成本，节省了大量乐队演奏员的各项开支，缩短了在录音棚的

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第3章数字音频处理技术

文档简介

温馨提示

最新文档

评论

第3章 数字音频处理技术

文档简介

温馨提示

最新文档

评论

相关文档

第3章数字音频处理技术