第2章 音频处理技术(一)_第1页
第2章 音频处理技术(一)_第2页
第2章 音频处理技术(一)_第3页
第2章 音频处理技术(一)_第4页
第2章 音频处理技术(一)_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第2 2章章 音频处理技术(一)音频处理技术(一) 西安交通大学西安交通大学 计算机教学实验中心计算机教学实验中心 20072007 多媒体技术及应用多媒体技术及应用 教学要求 下一页上一页 第2/77页 问题的提出问题的提出 n什么是声音?什么是声音? n声音有哪些物理特征?声音有哪些物理特征? n音乐音乐1、2、歌曲歌曲1、2、3、MIDI1、2、 3、乐器伴唱乐器伴唱 n当我们看到当我们看到“声音声音”这个字时,联想到这个字时,联想到 的是什么?的是什么? n 下一页上一页 第3/77页 一一.声音的基本特性声音的基本特性 n声音的表现形式有三类声音的表现形式有三类: n语音语音是指具

2、有语言内涵和人类约定的是指具有语言内涵和人类约定的 特殊媒体;特殊媒体; n音乐音乐是规范的符号化了的声音;是规范的符号化了的声音; n音响音响指其他自然声音,如动物的叫声、指其他自然声音,如动物的叫声、 机器的轰鸣声、风雨雷电声等。机器的轰鸣声、风雨雷电声等。 下一页上一页 第4/77页 声音声音 n什么是声音什么是声音? n声波声波 机械振动或气流扰动引起周围弹性媒质发机械振动或气流扰动引起周围弹性媒质发 生波动而产生生波动而产生声波声波。 n声源声源 产生声波的物体为产生声波的物体为声源声源(如人声带、乐器等如人声带、乐器等)。 n声场声场 声波所及的空间范围称为声波所及的空间范围称为声

3、场声场 。 n声音声音 声波传到人耳,经过人类听觉系统的感知就声波传到人耳,经过人类听觉系统的感知就 是是声音声音。 n声音是振动的波,是随时间连续变化的物理量。声音是振动的波,是随时间连续变化的物理量。 声音依靠介质的振动进行传播。声源就是振动源。声音依靠介质的振动进行传播。声源就是振动源。 下一页上一页 第5/77页 声波的表示声波的表示 n声波可以用一条连续的曲线来表示,它在时间声波可以用一条连续的曲线来表示,它在时间 和幅度上都是连续的,称为和幅度上都是连续的,称为模拟音频信号模拟音频信号。 n在任一时刻在任一时刻t ,声波可以分解成一系列正弦波,声波可以分解成一系列正弦波 的线性叠加

4、:的线性叠加: nAn 是是振幅振幅,表示声音的,表示声音的强弱强弱 n是声波的是声波的基频基频,表示声音音调的,表示声音音调的高低高低 nn 是是n次谐波的次谐波的初相位初相位 nn是是的的n次次谐波分量谐波分量,或称为,或称为泛音泛音 下一页上一页 第6/77页 音频信号的特征音频信号的特征 n声音的声音的物理特性物理特性 n频率、声压和声强、动态范围、频谱频率、声压和声强、动态范围、频谱 n声音的声音的心理特性心理特性 n音调、响度、音色、掩蔽效应、方位感、音调、响度、音色、掩蔽效应、方位感、 空间感空间感 n声音的声音的音质音质 n频带宽度、信噪比、数据量频带宽度、信噪比、数据量 下一

5、页上一页 第7/77页 声音的物理特性声音的物理特性 n周期周期/频率频率/带宽带宽 n两个相邻波之间的时间长度为两个相邻波之间的时间长度为周期周期T ,单位为秒;单位为秒; n每秒钟声源振动的次数称为每秒钟声源振动的次数称为频率频率f,单位,单位Hz; f = 1 / T n描述组成复合信号的频率范围,称为描述组成复合信号的频率范围,称为带宽带宽。 t 振幅 周期 下一页上一页 第8/77页 声音频带示意图声音频带示意图 n高于高于20kHz频率的声音人耳听不到。频率的声音人耳听不到。 n人类对声音的感觉是有限的,即只能在一个频带人类对声音的感觉是有限的,即只能在一个频带 范围内有效。范围内

6、有效。 n有的音响产品工作频率上限为有的音响产品工作频率上限为50kHz,调音台的,调音台的 最高工作频率设计到最高工作频率设计到100kHz。 n 下一页上一页 第9/77页 声波的频率范围声波的频率范围 n在自然界中在自然界中, 人耳接收的音域:人耳接收的音域:2020,000Hz 次声波(大象):次声波(大象): 20Hz 超声波(海豚):超声波(海豚):20,000Hz 下一页上一页 第10/77页 声源的频率范围声源的频率范围 n日常生活中的不同声源频率范围日常生活中的不同声源频率范围: 男男 声声: 100 9,000Hz 女女 声声: 150 10,000Hz 电话声电话声: 2

7、00 3,400Hz 收音机收音机AMAM调幅广播声调幅广播声: : 50 7,000Hz 收音机收音机FMFM调频广播声调频广播声: : 20 15,000Hz 专业级音响放大器声专业级音响放大器声: : 10 40,000Hz 下一页上一页 第11/77页 声压和声强声压和声强 n声压声压 P 声波在空气传播造成空气中的气压发生变声波在空气传播造成空气中的气压发生变 化而产生的压强(相当于在无声波下空气中的气化而产生的压强(相当于在无声波下空气中的气 压上叠加一个变化的压强),被称为压上叠加一个变化的压强),被称为声压声压,记作,记作 P。单位有帕斯卡(。单位有帕斯卡(Pa)和微巴()和微

8、巴(bar)。)。 n声强声强 I 描述声音传播所需能量的强度(描述声音传播所需能量的强度(声波是由声波是由 能量来维持传播的。如扬声器纸盆的振动是由电能量来维持传播的。如扬声器纸盆的振动是由电 能转换而来)。单位时间内通过垂直于声波传播能转换而来)。单位时间内通过垂直于声波传播 方向的单位面积内的声波能量为声场中某点的方向的单位面积内的声波能量为声场中某点的声声 强强,记作,记作I,单位为瓦米,单位为瓦米2(Wm2)。)。 n声强与声压最大值的平方成正比。声强与声压最大值的平方成正比。 下一页上一页 第12/77页 n在声学中,量级定义为一个量与同类基准量之比在声学中,量级定义为一个量与同类

9、基准量之比 的以的以10为底对数。单位是为底对数。单位是dB。 n声压级声压级Lp 为:为: Lp = 20lg P/P0 声压基准量为声压基准量为P0 = 2 10-4bar,声压级为,声压级为0 120dB。 n声强级声强级LI 为为: LI = 10lg I/I0 声强的基准量为声强的基准量为I0 = 10-12W/m2 。 声压级声压级&声强级声强级 下一页上一页 第13/77页 阈阈 n阈阈 值是指临界值。值是指临界值。 n可听阈可听阈 引起人耳刚能听到声音时的声压,引起人耳刚能听到声音时的声压, 与年龄有关。中音频时约为与年龄有关。中音频时约为0.0002微巴。微巴。 n痛阈痛阈

10、使人耳膜感到疼痛的声压,超过使人耳膜感到疼痛的声压,超过 200微巴的声压,能使人耳膜产生疼痛。微巴的声压,能使人耳膜产生疼痛。 下一页上一页 第14/77页 分贝分贝(dB) n自然现象自然现象: :扬声器的功率增加一倍发出的声音,扬声器的功率增加一倍发出的声音, 人听到的声音强度并不是增加一倍。人听到的声音强度并不是增加一倍。 n在声学中用在声学中用分贝分贝来表示声压或声强的变化程度来表示声压或声强的变化程度。 n人听觉神经的刺激程度不与刺激量大小成正比,人听觉神经的刺激程度不与刺激量大小成正比, 而是按刺激量以而是按刺激量以1010为底的对数增长为底的对数增长 。 n成对数关系变化。成对

11、数关系变化。 下一页上一页 第15/77页 动态范围动态范围 n指声音最大声压级和最小声压级之间的差值。指声音最大声压级和最小声压级之间的差值。 n每种声源的动态范围依据各自的特性有所不同。每种声源的动态范围依据各自的特性有所不同。 n如女声的动态范围为2550dB, n男声为3050dB, n交响乐队的动态范围大于100dB。 n动态范围不仅用来表示一个声源产生的最大声压动态范围不仅用来表示一个声源产生的最大声压 级与最小声压级之间的差值,录音设备或记录声级与最小声压级之间的差值,录音设备或记录声 音的载体音的载体(磁带、光盘、硬盘磁带、光盘、硬盘)同样可用动态范围同样可用动态范围 表示能够

12、处理信号电平的范围。表示能够处理信号电平的范围。 下一页上一页 第16/77页 动态范围的相对强度动态范围的相对强度 n动态范围可以用信号的相对强度表示:动态范围可以用信号的相对强度表示: 信号的动态范围信号的动态范围 = 20lg(信号最大强度信号最小强度信号最大强度信号最小强度)(dB) n其中信号可以用电压或功率衡量。其中信号可以用电压或功率衡量。 n因为是一种比例关系,故只要采用相同的度量单因为是一种比例关系,故只要采用相同的度量单 位,其结果都是一致的。位,其结果都是一致的。 下一页上一页 第17/77页 频谱频谱 n物体在一定位置的附近作来回往复的运动,称物体在一定位置的附近作来回

13、往复的运动,称 为为简谐振动简谐振动。 n简谐振动会产生一个特定音调的纯音,听起来简谐振动会产生一个特定音调的纯音,听起来 感觉单薄。感觉单薄。 n乐器很少产生单一频率的纯音,而是复音。乐器很少产生单一频率的纯音,而是复音。 n复音的产生基于物体的复杂振动,可以分解为复音的产生基于物体的复杂振动,可以分解为 许多不同振幅和不同频率的简谐振动许多不同振幅和不同频率的简谐振动(即看成即看成 简谐振动的叠加简谐振动的叠加)。 n简谐振动的振幅按频率排列的图形称为简谐振动的振幅按频率排列的图形称为频谱频谱。 频谱可一目了然地看出复杂振动的频率结构。频谱可一目了然地看出复杂振动的频率结构。 下一页上一页

14、 第18/77页 钢琴的复音频谱钢琴的复音频谱 n钢琴(基频为钢琴(基频为253Hz)的复音频谱)的复音频谱 下一页上一页 第19/77页 声音的心理学特性声音的心理学特性 n从声学心理角度分析,声音有三个从声学心理角度分析,声音有三个 要素:要素:音调音调、响度响度和和音色音色。 n它们与声波的频率、声压和频谱结它们与声波的频率、声压和频谱结 构对应。构对应。 下一页上一页 第20/77页 音调音调 n音调代表声音的音调代表声音的高低高低,与频率有关。频率越高,与频率有关。频率越高, 音调越高,反之亦然。音调越高,反之亦然。 n人对声音频率的感觉表现为音调的高低,在音人对声音频率的感觉表现为

15、音调的高低,在音 乐中称为音高。音调与基频的对数(乐中称为音高。音调与基频的对数(20lg) 成线性关系,单位为美(成线性关系,单位为美(mei)。基频越低,)。基频越低, 给人的感觉越低沉。给人的感觉越低沉。基频频率基频频率增加一倍,音乐增加一倍,音乐 上称提高了一个上称提高了一个八度八度。 n在编辑声音时,如果对声音的频率进行调整,在编辑声音时,如果对声音的频率进行调整, 其音调也会随之而变;不同声源有自己特定的其音调也会随之而变;不同声源有自己特定的 音调,若改变了声源的音调,声音会发生质的音调,若改变了声源的音调,声音会发生质的 转变。转变。 下一页上一页 第21/77页 频率与音调的

16、关系频率与音调的关系 下一页上一页 第22/77页 响度响度 n响度响度 也称音强,是人耳对声音强弱的感也称音强,是人耳对声音强弱的感 觉程度。常说的觉程度。常说的“音量音量”也是指响度。也是指响度。 n响度与声波的振幅成正比,振幅越大,响度与声波的振幅成正比,振幅越大, 响度越大。响度越大。 n唱盘、唱盘、CD激光盘等播放出来的声音响激光盘等播放出来的声音响 度是一定的,但通过控制、调整播放设度是一定的,但通过控制、调整播放设 备的音量,可以改变聆听时的响度。备的音量,可以改变聆听时的响度。 下一页上一页 第23/77页 等响度曲线等响度曲线 n人的耳道会对某段频人的耳道会对某段频 率产生共

17、鸣,使灵敏率产生共鸣,使灵敏 度提高。因此人耳听度提高。因此人耳听 到声音的响度与声音到声音的响度与声音 的频率有关。描述响的频率有关。描述响 度、声压以及声源频度、声压以及声源频 率之间的关系曲线称率之间的关系曲线称 为为等响度曲线等响度曲线。 n从曲线看出,当音量从曲线看出,当音量 开到使声压级为开到使声压级为80 dB时,就可做到高、时,就可做到高、 低频声音丰满。低频声音丰满。 下一页上一页 第24/77页 音色音色 n音色音色是声音的特色,又称是声音的特色,又称音品音品。通常说法是:声。通常说法是:声 音的音调和响度以外的音质差异叫做音色。音的音调和响度以外的音质差异叫做音色。 n影

18、响音色主要因素是影响音色主要因素是复音复音。所谓。所谓“复音复音”是指不是指不 同频率和不同振幅的混合声音,自然声中大部分同频率和不同振幅的混合声音,自然声中大部分 是复音。是复音。 n在复音中,最低频率的声音是在复音中,最低频率的声音是“基音基音”(声音的(声音的 基调),其他频率的声音称为基调),其他频率的声音称为“谐音谐音”(也叫泛(也叫泛 音)。基音和谐音是构成声音音色的重要因素。音)。基音和谐音是构成声音音色的重要因素。 n各种声源都具有自己独特的音色,例如每种乐器各种声源都具有自己独特的音色,例如每种乐器 的声音、每个人的声音等,人是根据音色来辨别的声音、每个人的声音等,人是根据音

19、色来辨别 声源种类的。声源种类的。 下一页上一页 第25/77页 音色(续)音色(续) n高次谐波越丰富,音色就越有明亮感和穿高次谐波越丰富,音色就越有明亮感和穿 透力。此外,音色还与诸多其他因素有关,透力。此外,音色还与诸多其他因素有关, 如听音条件等。如听音条件等。 n音色是一个主观量,常用音色是一个主观量,常用柔和柔和、刺耳刺耳、饱饱 满满等词描述。等词描述。 下一页上一页 第26/77页 掩蔽效应掩蔽效应 n称听不到的声音为称听不到的声音为被掩蔽声被掩蔽声,而起掩蔽作用的声,而起掩蔽作用的声 音为音为掩蔽声掩蔽声。 n掩蔽效应的实质是掩蔽声的出现使人耳听觉的等掩蔽效应的实质是掩蔽声的出

20、现使人耳听觉的等 响度曲线的最小可听阈抬高。响度曲线的最小可听阈抬高。 n掩蔽效应的一般规律是掩蔽效应的一般规律是强音压低音强音压低音、低频率声音低频率声音 压高频率压高频率。 n利用掩蔽效应可以用有用信号去掩蔽无用的声信利用掩蔽效应可以用有用信号去掩蔽无用的声信 号,只需要把无用声音的声压级降低到掩蔽阈以号,只需要把无用声音的声压级降低到掩蔽阈以 下即可。下即可。 n在数字音频处理中,还可以利用掩蔽效应去掉人在数字音频处理中,还可以利用掩蔽效应去掉人 耳听不到的那部分信号进行声音数据的压缩。耳听不到的那部分信号进行声音数据的压缩。 下一页上一页 第27/77页 方位感方位感 n人凭借双耳在一

21、定声学环境内能够对声源定位,人凭借双耳在一定声学环境内能够对声源定位, 这种能力来自于声源发出的声波到达双耳间的强这种能力来自于声源发出的声波到达双耳间的强 度差、时间差等因素。度差、时间差等因素。 n声源到达听者耳朵的声音有两个,一个声音直接声源到达听者耳朵的声音有两个,一个声音直接 到达,而另一个由于人头部遮蔽,需绕过头部才到达,而另一个由于人头部遮蔽,需绕过头部才 能到达。称前者为能到达。称前者为直达声直达声,而后者为,而后者为绕射声绕射声。 n若有两个声源,增大其中一个声源的强度,由于若有两个声源,增大其中一个声源的强度,由于 该声音源发出的直达声或绕射声的声压大于另一该声音源发出的直

22、达声或绕射声的声压大于另一 个声源,双耳将会产生声压级差。使听者感受的个声源,双耳将会产生声压级差。使听者感受的 声源(声像)位置向强度较大的声源方向移,使声源(声像)位置向强度较大的声源方向移,使 人感受到声音的人感受到声音的立体感立体感。 下一页上一页 第28/77页 空间感空间感 n一个声源发出的声音同时向各个方向散开,其发一个声源发出的声音同时向各个方向散开,其发 散的角度取决于声源所具有的散的角度取决于声源所具有的指向性指向性,发散的声,发散的声 波有一小部分直接传给听者,而大部分会被空间波有一小部分直接传给听者,而大部分会被空间 表面反射,然后到达听者。由于直接和经反射到表面反射,

23、然后到达听者。由于直接和经反射到 达听者的两个声音途径存在差别(取决于环境)达听者的两个声音途径存在差别(取决于环境) 而带来时间差。当时间差超过一定数量时,听者而带来时间差。当时间差超过一定数量时,听者 会听到先后到达的两个声音,从而产生会听到先后到达的两个声音,从而产生回音回音。经。经 多次反射,造成多次反射,造成余声余声。即使声源已停止发声,但。即使声源已停止发声,但 听者仍能听到声音存在。听者仍能听到声音存在。 n回声与余音的感觉可使听者感受出房间体积大小、回声与余音的感觉可使听者感受出房间体积大小、 房间高低及内表面结构上的差异,这便是房间高低及内表面结构上的差异,这便是空间感空间感

24、。 下一页上一页 第29/77页 音频信号的质量指标音频信号的质量指标 n频带宽度频带宽度 n动态范围动态范围 n信噪比信噪比 n数据量数据量 下一页上一页 第30/77页 (1) 频带宽度频带宽度 n音频信号所包含的谐波分量越丰富,音色音频信号所包含的谐波分量越丰富,音色 越好。在广播通信和数字音响系统中,以越好。在广播通信和数字音响系统中,以 声音信号所包含的谐波分量的频率范围来声音信号所包含的谐波分量的频率范围来 衡量声音的质量,即带宽。衡量声音的质量,即带宽。 不同质量的声音的频带对比示意图不同质量的声音的频带对比示意图 下一页上一页 第31/77页 动态范围动态范围 n动态范围越大,

25、说明音频信号强度的动态范围越大,说明音频信号强度的 相对变化范围越大,音响效果越好。相对变化范围越大,音响效果越好。 n动态范围一般用动态范围一般用dB为单位来计量。为单位来计量。 nFM(调频调频)广播的动态范围约广播的动态范围约60dB, nAM(调幅调幅)广播的动态范围约广播的动态范围约40dB。 nCD-DA的动态范围约的动态范围约100dB, n数字电话约数字电话约50dB。 下一页上一页 第32/77页 信噪比信噪比 n信噪比信噪比SNR(Signal Noise Ratio)是有用信是有用信 号与噪声之比的简称。号与噪声之比的简称。 n信噪比大,在一定程度上能够掩蔽噪声,从信噪比

26、大,在一定程度上能够掩蔽噪声,从 而获得较好的声音效果。而获得较好的声音效果。 n信噪比不仅是声音设备的性能指标,在声音信噪比不仅是声音设备的性能指标,在声音 的录制和播放时,也要注意环境噪声。录制的录制和播放时,也要注意环境噪声。录制 时应尽可能减小环境噪音。输出时应使音量时应尽可能减小环境噪音。输出时应使音量 适当大,以减少环境噪音对听音的影响。适当大,以减少环境噪音对听音的影响。 n一般话筒和音箱的信噪比在一般话筒和音箱的信噪比在75dB以上。声卡以上。声卡 的信噪比在的信噪比在8595dB。 下一页上一页 第33/77页 数据量数据量 n音质与数据采样频率和数据位数有关:音质与数据采样

27、频率和数据位数有关: n采样频率越低,位数越少,音质越差;采样频率越低,位数越少,音质越差; n采样频率越高,位数越多,音质越好。采样频率越高,位数越多,音质越好。 下一页上一页 第34/77页 二、数字音频二、数字音频 n声音的数字化声音的数字化 n数字化就是将连续信号变成离散信数字化就是将连续信号变成离散信 号。号。 n对音频信号,首先在时间上离散,对音频信号,首先在时间上离散, 取有限个时间点,称为取有限个时间点,称为采样采样。 n然后在幅度上离散,取有限个幅度然后在幅度上离散,取有限个幅度 值,称为值,称为量化量化。 n再将得到的数据表示成计算机容易再将得到的数据表示成计算机容易 识别

28、的格式,称为识别的格式,称为编码编码。 下一页上一页 第35/77页 PCM编码编码 nPCM是把模拟信号转换成数字信号的编码方法,是把模拟信号转换成数字信号的编码方法, 它主要包括采样、量化和编码它主要包括采样、量化和编码3个过程。个过程。 n采样采样 按时间间隔测量,把时间连续的模拟信号转换成时按时间间隔测量,把时间连续的模拟信号转换成时 间离散、幅度连续的采样信号。如果采样时间间隔间离散、幅度连续的采样信号。如果采样时间间隔相等,相等, 称为均匀采样称为均匀采样; n量化量化是按是按“四舍五入四舍五入”等方法将采样得到的数值限定在等方法将采样得到的数值限定在 几个有限的数值中,将采样信号

29、转换成时间离散、幅度几个有限的数值中,将采样信号转换成时间离散、幅度 离散的数字信号;离散的数字信号; n编码编码(coding)是将量化后的信号转换成一个二进制码)是将量化后的信号转换成一个二进制码 组输出。例如,量化得到的数据中只会出现两个数值组输出。例如,量化得到的数据中只会出现两个数值51 和和80,则只用一位二进制数表示即可,用,则只用一位二进制数表示即可,用0表示表示51,用,用 1表示表示80。这种编码方法称为自然编码。这种编码方法称为自然编码。 下一页上一页 第36/77页 模拟声音信号的采样和量化过程示意模拟声音信号的采样和量化过程示意 模拟声音信号的波形 采样得到的离散时间

30、信号再量化得到的数字信号 下一页上一页 第37/77页 例例2.1 例例2.1 设一个连续信号的波形可以表示为设一个连续信号的波形可以表示为 : n设采样频率为设采样频率为21Hz,-10,10内的量化内的量化 间隔取为间隔取为1,试计算出该信号,试计算出该信号0到到1秒内的秒内的 量化数据量化数据。 n在在0-1秒内,取秒内,取21个采样点。在个采样点。在1、1/20、 2/20、19/20、1秒时刻采样,将采秒时刻采样,将采 样得到的数值取整,即得到量化数据。样得到的数值取整,即得到量化数据。 下一页上一页 第38/77页 表表2-1 连续波形的数字化连续波形的数字化 序号序号 采样点采样

31、点 采样数据采样数据 量化量化值值 序号序号 采样点采样点 采样数据采样数据 量化值量化值 0 0.00 9.41421 9 11 0.55 -9.37474 -9 1 0.05 -7.66754 -8 12 0.60 4.73547 5 2 0.10 1.30867 1 13 0.65 -2.56445 -3 3 0.15 1.07930 1 14 0.70 0.40759 0 4 0.20 -3.46729 -3 15 0.75 6.34915 6 5 0.25 8.93433 9 16 0.80 -9.36672 -9 9 0.45 -1.63831 -2 20 1.00 4.40090

32、 4 10 0.50 7.89216 8 下一页上一页 第39/77页 举例举例 n对于对于CD-DA,采样频率为,采样频率为44.1kHz,即每,即每 秒取秒取44,100个点。幅度的取值范围是限制个点。幅度的取值范围是限制 在在216=65,536以内,量化间隔为以内,量化间隔为1,即量,即量 化幅度可以取化幅度可以取65,536个不同的值,计算机个不同的值,计算机 中用中用16位的存储空间就可以表示一个量化位的存储空间就可以表示一个量化 后的数值。后的数值。 动态范围为动态范围为20lg(216)96dB 下一页上一页 第40/77页 PCM编码原理编码原理 编码的过程:编码的过程: 采

33、样采样。用一组脉冲采样时钟信号乘以输入的模。用一组脉冲采样时钟信号乘以输入的模 拟音频信号,得到离散时间信号。拟音频信号,得到离散时间信号。 量化量化。对采样后的信号幅值进行量化。量化过。对采样后的信号幅值进行量化。量化过 程由量化器来完成。程由量化器来完成。 编码编码。对经量化器。对经量化器变换变换后的信号再进行编码,后的信号再进行编码, 即把量化的信号电平转换成二进制码组,得到即把量化的信号电平转换成二进制码组,得到 离散的二进制数据序列离散的二进制数据序列x(n)。 数据处理数据处理。计算机对量化后的二进制数据可以。计算机对量化后的二进制数据可以 用文件的形式存储、编辑和处理,并可还原成

34、用文件的形式存储、编辑和处理,并可还原成 原始的模拟信号播放。原始的模拟信号播放。 下一页上一页 第41/77页 PCM编码示意图编码示意图 下一页上一页 第42/77页 均匀量化和非均匀量化均匀量化和非均匀量化 均匀量化均匀量化 采用相等的量化间隔(采用相等的量化间隔(“等分尺等分尺”) 对采样得到的信号作量化,也称为对采样得到的信号作量化,也称为线性量化线性量化。 缺点缺点: : 增加的样本位数不增加的样本位数不 能得到充分的利用。能得到充分的利用。 下一页上一页 第43/77页 非均匀量化非均匀量化 非线性量化非线性量化 思想是大的输入信号采用大的量化思想是大的输入信号采用大的量化 间隔

35、,小的输入信号采用小的量化间隔;间隔,小的输入信号采用小的量化间隔; 这样就可以在满足精度要求的情况下用较少的位这样就可以在满足精度要求的情况下用较少的位 数来表示。声音数据还原时,采用相同的规则。数来表示。声音数据还原时,采用相同的规则。 下一页上一页 第44/77页 非均匀量化算法非均匀量化算法 非均匀量化采用两种算法(定义采非均匀量化采用两种算法(定义采 样输入信号幅度和量化输出数据之样输入信号幅度和量化输出数据之 间的对应关系):间的对应关系): 律律(-Law)压扩压扩 A律律(A-Law)压扩压扩 下一页上一页 第45/77页 律压扩律压扩 n律律(-Law)压扩主要用在北美和日本

36、等地压扩主要用在北美和日本等地 区的数字电话通信中,按下面的公式确定区的数字电话通信中,按下面的公式确定 量化输入和输出的关系。量化输入和输出的关系。 下一页上一页 第46/77页 A律律(A-Law) A律律(A-Law)压扩主要用在欧洲和中国大陆等地压扩主要用在欧洲和中国大陆等地 区的数字电话通信中,按下面的式子确定量化输区的数字电话通信中,按下面的式子确定量化输 入和输出的关系入和输出的关系 。 下一页上一页 第47/77页 举例举例 n对于采样频率为对于采样频率为8kHz,样本精度为,样本精度为13位、位、14位位 或者或者16位的输入信号,使用位的输入信号,使用律压扩编码或者使律压扩

37、编码或者使 用用A律压扩编码,经过律压扩编码,经过PCM编码器之后每个样本编码器之后每个样本 需需8位二进制存储,输出的数据率为位二进制存储,输出的数据率为64 kb/s。 n这个数据就是这个数据就是CCITT推荐的推荐的G.711标准:标准:话音频话音频 率脉冲编码调制率脉冲编码调制。 下一页上一页 第48/77页 数字音频的技术指标数字音频的技术指标 采样频率采样频率 采样精度采样精度 声道数声道数 音频数据传输率音频数据传输率 编码算法与音频数据编码算法与音频数据 压缩比压缩比 下一页上一页 第49/77页 采样频率采样频率 n采样频率是指一秒钟采样的次数。采样频率越高,采样频率是指一秒

38、钟采样的次数。采样频率越高, 单位时间内采集的样本数越多,得到波形越接近单位时间内采集的样本数越多,得到波形越接近 于原始波形,音质就越好。于原始波形,音质就越好。 n根据根据奈奎斯特奈奎斯特(Harry Nyquist)采样理论采样理论:如如 果采样频率高于输入信号最高频率的两倍,重果采样频率高于输入信号最高频率的两倍,重 放时就能从采样信号序列无失真地重构原始信放时就能从采样信号序列无失真地重构原始信 号号。 n例如,电话话音的信号频率约为例如,电话话音的信号频率约为3.4 kHz,若,若 采样频率选为采样频率选为8kHz,就能无失真地重放原始,就能无失真地重放原始 声音。声音。 下一页上

39、一页 第50/77页 采样的采样的3个常用频率个常用频率 n分别为:分别为: n11.025kHzAM(调幅调幅)广播广播 n22.05kHz FM(调频调频)广播广播 n44.1kHz CD高保真音质声音高保真音质声音 n现在声卡的采样频率一般为现在声卡的采样频率一般为48kHz甚至甚至 96kHz。 下一页上一页 第51/77页 采样精度采样精度 采样精度用每个声音样本的位数表示,也叫样本精采样精度用每个声音样本的位数表示,也叫样本精 度或量化位数,反映度量声音波形幅度的精度。度或量化位数,反映度量声音波形幅度的精度。 例如,每个声音样本用例如,每个声音样本用16位表示,则量化样本值在位表

40、示,则量化样本值在0 65535之间,它的精度是输入信号的之间,它的精度是输入信号的1/65536。 采样精度采样精度决定了模拟信号数字化以后的动态范围。决定了模拟信号数字化以后的动态范围。 若以若以8位量化,则其波形的幅值可分为位量化,则其波形的幅值可分为28=256等份,等等份,等 效的动态范围为效的动态范围为20lg(256)=48dB。若以。若以16位采样,位采样, 则可分为则可分为216=65536等份,等效动态范围为等份,等效动态范围为 20lg(65536)=96dB。 采样精度影响到声音的质量采样精度影响到声音的质量 位数越多,声音的质量越高,而需要的存储空间也越多;位数越多,

41、声音的质量越高,而需要的存储空间也越多; 位数越少,声音的质量越低,需要的存储空间越少。位数越少,声音的质量越低,需要的存储空间越少。 下一页上一页 第52/77页 声道数声道数 n单声道单声道(mono)信号一次产生一组声波数据。信号一次产生一组声波数据。 n双声道或立体声双声道或立体声(stereo)一次产生两组声波数一次产生两组声波数 据。据。 n双声道在硬件中占两条线路,一条是左声道,双声道在硬件中占两条线路,一条是左声道, 一条是右声道。一条是右声道。 n立体声不仅音质、音色好,而且能产生逼真的立体声不仅音质、音色好,而且能产生逼真的 空间感。但立体声数字化后所占空间比单声道空间感。

42、但立体声数字化后所占空间比单声道 多一倍。多一倍。 下一页上一页 第53/77页 其他因素其他因素 n除采样频率、采样精度、声道数影响声音质量除采样频率、采样精度、声道数影响声音质量 外,声音录制时环境噪声、声卡内部噪声以及外,声音录制时环境噪声、声卡内部噪声以及 采样数据丢失等都会造成声音质量的下降。采样数据丢失等都会造成声音质量的下降。 n实际收听时,音响(功率放大器、扬声器等)实际收听时,音响(功率放大器、扬声器等) 的质量对音质的表现也起很大作用。的质量对音质的表现也起很大作用。 下一页上一页 第54/77页 音频数据传输率音频数据传输率 n音频信号数字化后,产生大量数据音频信号数字化

43、后,产生大量数据 。 n产生数据的速度或播放声音时需要传输数据的速产生数据的速度或播放声音时需要传输数据的速 度影响声音的播放质量。数据传输率用每秒钟传度影响声音的播放质量。数据传输率用每秒钟传 输的数据位数表示,记为输的数据位数表示,记为bps(bit per second)。)。 n未经压缩的数字音频数据传输率为:未经压缩的数字音频数据传输率为: 数据传输率数据传输率(bits) = 采样频率采样频率(Hz)量化位数量化位数(bit)声道数声道数 下一页上一页 第55/77页 声音质量和数字化指标声音质量和数字化指标 质量质量 采样频率采样频率 (kHz) 样本精度样本精度 (bit) 单

44、道声单道声/ 立体声立体声 数据率数据率(kB/s) (未压缩未压缩) 频率范围频率范围 电话电话 * 88单道声单道声8 2003 400 Hz AM11.0258单道声单道声11.0 507 000Hz FM22.05016立体声立体声88.2 2015 000Hz CD44.116立体声立体声176.4 2020 000 Hz DAT4816立体声立体声192.0 2020 000 Hz 下一页上一页 第56/77页 例例2-2 例例2.22.2 高保真立体声数字音频的量化位数为高保真立体声数字音频的量化位数为1616,试计,试计 算其数据传输率。算其数据传输率。 解:高保真立体声数字音

45、频采样频率为解:高保真立体声数字音频采样频率为44.1kHz44.1kHz,双,双 声道,其数据传输率为声道,其数据传输率为 : 数据传输率数据传输率 = = 44.1(kHz)44.1(kHz)16(bit)16(bit)2(2(声道声道)=1411.2(kbps)=1411.2(kbps) n如果采用如果采用PCMPCM编码,数字音频文件所占用的空间可编码,数字音频文件所占用的空间可 用如下的公式计算:用如下的公式计算: 音频数据量(音频数据量(ByteByte)= = 数据传输率数据传输率持续时间持续时间8(bit/Byte)8(bit/Byte) n其中数据量以字节其中数据量以字节(B

46、yte)(Byte)为单位;数据传输率以每秒比特为单位;数据传输率以每秒比特 (bps)(bps)为单位;持续时间以秒为单位;持续时间以秒(s)(s)为单位。为单位。 下一页上一页 第57/77页 例例2-3 例例2.32.3 计算计算1 1分钟未经压缩的高保真立体声数字声分钟未经压缩的高保真立体声数字声 音文件的大小。音文件的大小。 n解:高保真立体声数字音频采样频率为解:高保真立体声数字音频采样频率为44.1kHz44.1kHz, 1616位量化,双声道,其数据传输率为:位量化,双声道,其数据传输率为: 数据传输率数据传输率 = = 44.1(kHz)44.1(kHz)16(bit)16(

47、bit)2(2(声道声道)=1411.2(kbps)=1411.2(kbps) n1 1分钟这样的声音文件的大小为分钟这样的声音文件的大小为 : 音频数据量音频数据量 = = 1411.2 1411.2(kb/skb/s)6060(s s) /8(bit/Byte)=10584kB/8(bit/Byte)=10584kB n未经压缩的未经压缩的4 4分钟的歌曲文件约分钟的歌曲文件约42M42M数据,数据,128M128M的的 MP3MP3播放器只能存放播放器只能存放3 3首这样的歌曲。首这样的歌曲。 下一页上一页 第58/77页 编码编码算法与音频数据压缩比算法与音频数据压缩比 n未压缩的音频

48、数据量非常大,因此在编码的时未压缩的音频数据量非常大,因此在编码的时 候常采用压缩的方式。候常采用压缩的方式。 n实际上,编码的作用一是记录数字数据,二是实际上,编码的作用一是记录数字数据,二是 采用一定的算法来压缩数据以减少存储空间和采用一定的算法来压缩数据以减少存储空间和 提高传输效率。提高传输效率。 n压缩编码的基本指标之一就是压缩比,一般为压缩编码的基本指标之一就是压缩比,一般为 数据压缩前后的数据量之比:数据压缩前后的数据量之比: 下一页上一页 第59/77页 数据压缩说明数据压缩说明 数字化指标不同反映在采用了不同数据压缩比。数字化指标不同反映在采用了不同数据压缩比。 如果如果PC

49、MPCM编码采用编码采用4bit4bit量化对量化对CDCD音质信号压缩,音质信号压缩, 其压缩比为其压缩比为4:14:1。这种情况下,用来记录幅值。这种情况下,用来记录幅值 的比特位越少,编码后数据量就越小,压缩比的比特位越少,编码后数据量就越小,压缩比 越越大大。但压缩比越。但压缩比越大大,丢掉的信息就会越多,丢掉的信息就会越多, 信号还原后失真就越大。信号还原后失真就越大。( (对有损压缩对有损压缩) ) 压缩算法包括压缩算法包括有损压缩有损压缩和和无损压缩无损压缩: 有损压缩解压后数据不能完全复原,要丢失一有损压缩解压后数据不能完全复原,要丢失一 部分信息。部分信息。 无损压缩不丢失任

50、何信息,能较好地复原原始无损压缩不丢失任何信息,能较好地复原原始 信号。信号。 下一页上一页 第60/77页 数字音频文件格式数字音频文件格式 n数字声音文件格式是数字音数字声音文件格式是数字音 频在磁盘文件中的存放形式,频在磁盘文件中的存放形式, 相同的数据可以有不同的文相同的数据可以有不同的文 件格式,而不同的数据也可件格式,而不同的数据也可 以有相同的文件格式以有相同的文件格式。 WAVE WAVE 格式格式 MP3 MP3 格式格式 RA RA 格式格式 下一页上一页 第61/77页 WAVEWAVE文件格式文件格式 nWAVEWAVE文件是一种通用的音频数据文件,文件扩文件是一种通用

51、的音频数据文件,文件扩 展名为展名为“WAV”WAV”,WindowsWindows系统和一般的音频系统和一般的音频 卡都支持这种格式文件的生成、编辑和播放。卡都支持这种格式文件的生成、编辑和播放。 nWAVEWAVE文件由三部分文件由三部分组成组成:文件头文件头( (标明是标明是WAVEWAVE 文件、文件结构和数据的总字节数文件、文件结构和数据的总字节数) )、数字化数字化 参数参数( (如采样率、声道数、编码算法等如采样率、声道数、编码算法等) ),最后,最后 是是实际波形数据实际波形数据。CDCD激光唱盘中包含的就是激光唱盘中包含的就是 WAVEWAVE格式的波形数据。一般说来,声音质

52、量与格式的波形数据。一般说来,声音质量与 其其WAVEWAVE格式的文件大小成正比。格式的文件大小成正比。 nWAVEWAVE文件的文件的特点特点是易于生成和编辑,但在保证是易于生成和编辑,但在保证 一定音质的前提下压缩比不够,不适合在网络一定音质的前提下压缩比不够,不适合在网络 上播放。上播放。 下一页上一页 第62/77页 MP3文件文件 nMP3MP3文件是采用文件是采用MP3MP3算法压缩生成的数字音频数据文件,以算法压缩生成的数字音频数据文件,以 “.MP3”.MP3”为文件后缀。为文件后缀。 nMP3MP3利用利用MPEGMPEG(Motion Picture Expert Gro

53、upMotion Picture Expert Group,运动图像,运动图像 专家组)制定的专家组)制定的MPEG-1 Audio layer 3MPEG-1 Audio layer 3的压缩标准,将音的压缩标准,将音 频信息用频信息用10:110:1甚至甚至12:112:1压缩率变成容量较小的数据文件。压缩率变成容量较小的数据文件。 nMPEG-1MPEG-1压缩主要用于压缩主要用于VCDVCD数据的压缩,也用来压缩不包含图数据的压缩,也用来压缩不包含图 像的纯音频数据,音频压缩算法包括像的纯音频数据,音频压缩算法包括MPEG Audio Layer1MPEG Audio Layer1、

54、MPEG Audio Layer2MPEG Audio Layer2等,而等,而MPEG Audio Layer3MPEG Audio Layer3有很高的压有很高的压 缩比。缩比。 n虽然虽然MP3MP3是一种利用了人类心理声学特性的有损压缩,人耳是一种利用了人类心理声学特性的有损压缩,人耳 基本不能分辨出失真,音质几乎达到了基本不能分辨出失真,音质几乎达到了CDCD音质标准。按照音质标准。按照 这种算法,这种算法,1010张张CD-DACD-DA的内容可以压缩到的内容可以压缩到l l张张CD-ROMCD-ROM中,而中,而 且视听效果相当好。且视听效果相当好。 下一页上一页 第63/77页

55、 RA文件文件 nReal AudioReal Audio是是Real networksReal networks推出的一种音推出的一种音 乐压缩格式,它的压缩比可达到乐压缩格式,它的压缩比可达到96:196:1,因,因 此在网上比较流行。此在网上比较流行。 n经过压缩的音乐文件可以在通过速率为经过压缩的音乐文件可以在通过速率为 14.4kb/s14.4kb/s的的MODEMMODEM上网的计算机中流畅回放。上网的计算机中流畅回放。 其最大特点是可以采用流媒体的方式实现其最大特点是可以采用流媒体的方式实现 网上实时播放,即边下载边播放。网上实时播放,即边下载边播放。 下一页上一页 第64/77

56、页 三、三、电子合成音乐电子合成音乐 n在多媒体系统中,除了用数字音频的方在多媒体系统中,除了用数字音频的方 式以外,还可以用合成的方式产生音乐式以外,还可以用合成的方式产生音乐。 n音乐合成的方式根据一定的协议标准,音乐合成的方式根据一定的协议标准, 使用音乐符号来记录和解释乐谱,并组使用音乐符号来记录和解释乐谱,并组 合成相应的音乐信号,这就是合成相应的音乐信号,这就是 MIDIMIDI(Musical Instrument Digital (Musical Instrument Digital Interface Interface 乐器数字接口乐器数字接口) )。 下一页上一页 第65

57、/77页 电子合成音乐的有关概念电子合成音乐的有关概念 nMIDIMIDI不是把音乐的波形进行数字化采样和编码,不是把音乐的波形进行数字化采样和编码, 而是将数字式电子乐器的弹奏过程以命令符号而是将数字式电子乐器的弹奏过程以命令符号 的形式记录下来,如按了哪一个键、力度多大、的形式记录下来,如按了哪一个键、力度多大、 时间多长等。时间多长等。 n当需要播放这首乐曲时,根据记录的乐谱指令,当需要播放这首乐曲时,根据记录的乐谱指令, 通过音乐合成器生成音乐声波,经放大后由扬通过音乐合成器生成音乐声波,经放大后由扬 声器播出。声器播出。 n 下一页上一页 第66/77页 电子音乐中的常用术语电子音乐

58、中的常用术语 n电子合成器(电子合成器(musical synthesizer) 是由数字是由数字 信号处理器和其他集成电路芯片构成的电子设备,信号处理器和其他集成电路芯片构成的电子设备, 用来产生并修改正弦波形,然后通过声音产生器用来产生并修改正弦波形,然后通过声音产生器 和扬声器发出特定的声音。和扬声器发出特定的声音。 n复调(复调(polyphony)指合成器同时演奏若干音符指合成器同时演奏若干音符 时发出的声音。如钢琴、吉他等乐器可以同时演时发出的声音。如钢琴、吉他等乐器可以同时演 奏几种音符,而双簧管就不能。复调着重于同时奏几种音符,而双簧管就不能。复调着重于同时 演奏的音符数,如钢

59、琴的和弦音符。演奏的音符数,如钢琴的和弦音符。 n多音色(多音色(timbre)指同时演奏几种不同乐器时发指同时演奏几种不同乐器时发 出的声音。它着重同时演奏的乐器数。例如,具出的声音。它着重同时演奏的乐器数。例如,具 有有6音符复音的音符复音的4种乐器合成器,可以同时演奏种乐器合成器,可以同时演奏4 种不同声音的种不同声音的6个音符,如个音符,如3个钢琴的合弦音符、个钢琴的合弦音符、 1个长笛、个长笛、1个小提琴和个小提琴和1个萨克斯管的音符。个萨克斯管的音符。 下一页上一页 第67/77页 与与MIDI有关的术语有关的术语 (1)MIDI(1)MIDI电子乐器电子乐器 它是能产生特定声音的

60、合成器,如电子键盘、吉他、萨克斯管等;它是能产生特定声音的合成器,如电子键盘、吉他、萨克斯管等; 它们相互间的数据传送符合它们相互间的数据传送符合MIDIMIDI的通信约定。的通信约定。 (2)MIDI(2)MIDI消息消息(message)(message)或指令或指令 MIDIMIDI软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包软件通信协议,实际上是用数字指令描述的音乐乐谱,其中包 含音符、强度、定时及乐器的指派等。含音符、强度、定时及乐器的指派等。 (3)MIDI(3)MIDI接口接口(interface)(interface) MIDIMIDI硬件通信协议,可使电子乐器互连或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论