第2章_音频处理技术_第1页
第2章_音频处理技术_第2页
第2章_音频处理技术_第3页
第2章_音频处理技术_第4页
第2章_音频处理技术_第5页
已阅读5页,还剩120页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、普通高等教育普通高等教育“十一五十一五”国家级规划教材国家级规划教材 多媒体技术及应用多媒体技术及应用 赵英良赵英良 冯博琴冯博琴 崔舒宁崔舒宁 清华大学出版社 2009 1 第第2章章 音频处理技术音频处理技术 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 2 简述简述 音频是多媒体技术中媒体的一种,由于音频是多媒体技术中媒体的一种,由于 音频信号是一种连续变化的模拟信号,而计音频信号是一种连续变化的模拟信号,而计 算机只能处理和记录二进制的数字信号,因算机只能处理和记录二进制的数字信号,因 此,音频信号必须经过一定的变化和处理,此,音频信号必须经过一定的变化和

2、处理, 变成二进制数据后才能送到计算机进行编辑变成二进制数据后才能送到计算机进行编辑 和存储。和存储。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 3 2.1 声音的基本特性声音的基本特性 音频信号所携带的信息大体上可分为语音频信号所携带的信息大体上可分为语 音、音乐和音响三类。音、音乐和音响三类。 u语音是指具有语言内涵和人类约定的特殊媒体;语音是指具有语言内涵和人类约定的特殊媒体; u音乐是规范的符号化了的声音;音乐是规范的符号化了的声音; u而音响指其他自然声音,如动物的叫声、机器的而音响指其他自然声音,如动物的叫声、机器的 轰鸣声、风雨雷电声等轰鸣声、风

3、雨雷电声等 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 4 2.1.1.音频信号的特征音频信号的特征 u机械振动或气流扰动引起周围弹性媒质发生波动,产生声波。产生机械振动或气流扰动引起周围弹性媒质发生波动,产生声波。产生 声波的物体为声波的物体为声源声源(如人的声带、乐器等如人的声带、乐器等),声波所及的空间范围称,声波所及的空间范围称 为为声场声场。声波传到人耳,经过人类听觉系统的感知就是。声波传到人耳,经过人类听觉系统的感知就是声音声音。 u声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的,声波可以用一条连续的曲线来表示,它在时间和幅度上都是连续的

4、, 称为称为模拟音频信号模拟音频信号。 u在任一时刻,声波可以分解成一系列正弦波的线性叠加:在任一时刻,声波可以分解成一系列正弦波的线性叠加: 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 5 1声音的物理特性声音的物理特性 (1)频率频率/周期周期/带宽带宽 u单位时间内声源振动的次数或空气中气压疏密变单位时间内声源振动的次数或空气中气压疏密变 化的次数,称为声源的频率化的次数,称为声源的频率f,单位赫兹,单位赫兹(Hz) u频带宽度或称之为带宽,它描述组成复合信号的频带宽度或称之为带宽,它描述组成复合信号的 频率范围频率范围 制作:西安交通大学制作:西安交通大

5、学 计算机教学实验中心计算机教学实验中心 6 u虽然高于虽然高于20kHz频率的声音人耳听不到,但由于频率的声音人耳听不到,但由于 人的声学心理特性,可感觉到它的存在。因此,人的声学心理特性,可感觉到它的存在。因此, 有的音响产品的工作频率上限为有的音响产品的工作频率上限为50kHz,甚至调,甚至调 音台的最高工作频率设计到音台的最高工作频率设计到100kHz。 u声音信号可被分解和复合,可以从中抽出若干个声音信号可被分解和复合,可以从中抽出若干个 单一的正弦信号,也可以用若干个单一的正弦信单一的正弦信号,也可以用若干个单一的正弦信 号来合成任意波形的复合信号,如合成语音和合号来合成任意波形的

6、复合信号,如合成语音和合 成音乐等成音乐等 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 7 (2)声压和声强声压和声强 u声波在空气媒质中是以空气中的分子振动形成疏密而传声波在空气媒质中是以空气中的分子振动形成疏密而传 播。它造成空气中的气压发生大小变化,相当于在无声播。它造成空气中的气压发生大小变化,相当于在无声 波下空气中的气压上叠加一个变化的压强,叠加上的压波下空气中的气压上叠加一个变化的压强,叠加上的压 强称为声压,记作强称为声压,记作P,单位为帕(单位为帕(Pa)或者为)或者为ubar。 u引起人耳刚能听到声音时的声压称为引起人耳刚能听到声音时的声压称

7、为可听阈值。可听阈值。 u声波是由能量来维持传播的。如扬声器纸盆的振动是由声波是由能量来维持传播的。如扬声器纸盆的振动是由 电能转换而来,因此声波有能量。电能转换而来,因此声波有能量。 u单位时间内通过垂直于声波传播方向的单位面积内的声单位时间内通过垂直于声波传播方向的单位面积内的声 波能量为声场中某点的波能量为声场中某点的声强声强,记作,记作I,单位为瓦米,单位为瓦米2(W m2)。)。 u声强与声压最大值的平方成正比关系。声强与声压最大值的平方成正比关系。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 8 u在无线电技术中常引用分贝在无线电技术中常引用分贝(d

8、B)来表征电压、电来表征电压、电 流、功率或放大器的放大能力。流、功率或放大器的放大能力。 u在声学中引用分贝来表示声压或声强的变化程度在声学中引用分贝来表示声压或声强的变化程度。 因为人的听觉神经的刺激程度不与刺激量大小成因为人的听觉神经的刺激程度不与刺激量大小成 正比,而是按刺激量以正比,而是按刺激量以10为底的对数增长为底的对数增长 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 9 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 10 (3)动态范围动态范围 u声音的动态范围指声音的最大声压级和最小声压级之间声音的动态范围指声音的

9、最大声压级和最小声压级之间 的差值。的差值。 u每种声源的动态范围依据各自的特性有所不同。每种声源的动态范围依据各自的特性有所不同。 w 如女声的动态范围为如女声的动态范围为2550dB, w 男声为男声为3050dB, w 交响乐队的动态范围大于交响乐队的动态范围大于100dB。 u动态范围不仅用来表示一个声源产生的最大声压级与最动态范围不仅用来表示一个声源产生的最大声压级与最 小声压级之间的差值,录音设备或记录声音的载体小声压级之间的差值,录音设备或记录声音的载体(磁带、磁带、 光盘、硬盘光盘、硬盘)同样可用动态范围表示能够处理信号电平的同样可用动态范围表示能够处理信号电平的 范围。范围。

10、 w 如磁带的动态范围为如磁带的动态范围为50dB60dB, w CD光盘光盘96dB, w 磁光盘录放音机磁光盘录放音机105dB。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 11 u动态范围可以用信号的相对强度表示:动态范围可以用信号的相对强度表示: 信号的动态范围信号的动态范围=20lg(信号的最大强度信号的最小信号的最大强度信号的最小 强度强度)(dB) 其中的信号可以用电压或功率衡量。其中的信号可以用电压或功率衡量。 u因为是一种比例关系,故只要采用相同的度量单因为是一种比例关系,故只要采用相同的度量单 位,其结果都是一致的。位,其结果都是一致的。

11、制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 12 (4)频谱频谱 u物体在一定位置的附近作来回往复的运动,称为物体在一定位置的附近作来回往复的运动,称为 简谐振动简谐振动。 u简谐振动会产生一个特定音调的简谐振动会产生一个特定音调的纯音纯音,听起来感,听起来感 觉单薄。觉单薄。 u乐器很少产生单一频率的纯音,而是乐器很少产生单一频率的纯音,而是复音复音。 u复音复音的产生基于物体的复杂振动,可以分解为许的产生基于物体的复杂振动,可以分解为许 多不同振幅和不同频率的简谐振动多不同振幅和不同频率的简谐振动(即看成简谐即看成简谐 振动的叠加振动的叠加)。 u简谐振动的

12、振幅按频率排列的图形称为频谱简谐振动的振幅按频率排列的图形称为频谱。频。频 谱可一目了然地看出复杂振动的频率结构。谱可一目了然地看出复杂振动的频率结构。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 13 钢琴(基频为钢琴(基频为253Hz)的复音频谱)的复音频谱 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 14 2声音的心理学特性声音的心理学特性 从声学心理角度,声音的三个要素是从声学心理角度,声音的三个要素是音音 调调、响度响度和和音色音色。它们与声波的频率、声压。它们与声波的频率、声压 和频谱结构对应。和频谱结构对应。 (1)

13、音调音调 人对声音频率的感觉表现为音调的高低,在人对声音频率的感觉表现为音调的高低,在 音乐中称为音高。音调与基频的对数(音乐中称为音高。音调与基频的对数(20lg) 成线性关系,单位为美(成线性关系,单位为美(mei)。基频越低,给)。基频越低,给 人的感觉越低沉。基频频率增加一倍,音乐上称人的感觉越低沉。基频频率增加一倍,音乐上称 提高了一个八度提高了一个八度 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 15 频率与音调的关系频率与音调的关系 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 16 音阶音阶CDEFGAB 简谱简谱1

14、234567 频率频率 /Hz 261293330349392440494 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 17 (2)响度响度 u响度是人耳对声音强弱的感觉响度是人耳对声音强弱的感觉 程度程度 u虽然响度与衡量声音强弱的声虽然响度与衡量声音强弱的声 压有一定关系,但与声压的大压有一定关系,但与声压的大 小并不完全一致,也就是说声小并不完全一致,也就是说声 压大的感觉不一定响。压大的感觉不一定响。 n 由于人的外耳具有一定的耳道长度,耳道会对某段频率由于人的外耳具有一定的耳道长度,耳道会对某段频率 产生共鸣,使灵敏度提高。因此人耳听到声音的响度与产生

15、共鸣,使灵敏度提高。因此人耳听到声音的响度与 声音的频率有关。描述响度、声压以及声源频率之间的声音的频率有关。描述响度、声压以及声源频率之间的 关系曲线称为等响度曲线(图关系曲线称为等响度曲线(图2-4)。)。 n 从曲线看出,当音量开到使声压级为从曲线看出,当音量开到使声压级为80 dB时,就可做时,就可做 到高低频声音丰满到高低频声音丰满 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 18 (3)音色音色 n音色又称音品。通常说法是:声音的音调和音色又称音品。通常说法是:声音的音调和 响度以外的音质差异叫做音色。响度以外的音质差异叫做音色。 n声音的音色取决于

16、该声音的频谱结构或是频声音的音色取决于该声音的频谱结构或是频 谱包络(声波曲线)。谱包络(声波曲线)。 n高次谐波越丰富高次谐波越丰富,音色就越有明亮感和穿透力。音色就越有明亮感和穿透力。 此外,音色还与诸多其他因素有关,如听音此外,音色还与诸多其他因素有关,如听音 条件等。条件等。 n它是一个主观量,常用柔和、刺耳、饱满等它是一个主观量,常用柔和、刺耳、饱满等 词描述。词描述。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 19 (4)掩蔽效应掩蔽效应 n称听不到的声音为称听不到的声音为被掩蔽声被掩蔽声,而起掩蔽作用的声音,而起掩蔽作用的声音 为为掩蔽声掩蔽声。

17、 n掩蔽效应的实质是掩蔽声的出现使人耳听觉的等响掩蔽效应的实质是掩蔽声的出现使人耳听觉的等响 度曲线的最小可听阈抬高。度曲线的最小可听阈抬高。 n掩蔽效应的一般规律是强音压低音、低频率声音压掩蔽效应的一般规律是强音压低音、低频率声音压 高频率。高频率。 n利用掩蔽效应可以用有用信号去掩蔽无用的声信号,利用掩蔽效应可以用有用信号去掩蔽无用的声信号, 只需要把无用声音的声压级降低到掩蔽阈以下即可。只需要把无用声音的声压级降低到掩蔽阈以下即可。 n在数字音频处理中,还可以利用掩蔽效应去掉人耳在数字音频处理中,还可以利用掩蔽效应去掉人耳 听不到的那部分信号进行声音数据的压缩。听不到的那部分信号进行声音

18、数据的压缩。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 20 (5)方位感方位感 n人凭借双耳在一定声学环境内能够对声源定位,这人凭借双耳在一定声学环境内能够对声源定位,这 种能力来自于声源发出的声波到达双耳间的强度差、种能力来自于声源发出的声波到达双耳间的强度差、 时间差以及耳廓时间差以及耳廓(外耳外耳)的阻挡。的阻挡。 n声源到达听者耳朵的声音有两个,其中一个声音直声源到达听者耳朵的声音有两个,其中一个声音直 接到达,而另一个由于人头部遮蔽,需绕过头部才接到达,而另一个由于人头部遮蔽,需绕过头部才 能到达。称前者为直达声,而后者为绕射声。能到达。称前者为直

19、达声,而后者为绕射声。 n若有两个声源,增大其中一个声源的强度,由于该若有两个声源,增大其中一个声源的强度,由于该 声音源发出的直达声或绕射声的声压大于另一个声声音源发出的直达声或绕射声的声压大于另一个声 源,双耳将会产生声压级差。使听者感受的声源源,双耳将会产生声压级差。使听者感受的声源 (声像)位置向强度较大的声源方向移,使人感受(声像)位置向强度较大的声源方向移,使人感受 到声音的立体感。到声音的立体感。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 21 (6)空间感空间感 n一个声源发出的声音同时向各个方向散开,其发散一个声源发出的声音同时向各个方向散开

20、,其发散 的角度取决于声源所具有的指向性,发散的声波有的角度取决于声源所具有的指向性,发散的声波有 一小部分直接传给听者,而大部分会被空间表面反一小部分直接传给听者,而大部分会被空间表面反 射,然后到达听者。由于直接和经反射到达听者的射,然后到达听者。由于直接和经反射到达听者的 两个声音途径存在差别(取决于环境)而带来时间两个声音途径存在差别(取决于环境)而带来时间 差。当时间差超过一定数量时,听者会听到先后到差。当时间差超过一定数量时,听者会听到先后到 达的两个声音,从而产生达的两个声音,从而产生回音回音。经多次反射,造成。经多次反射,造成 余声余声。即使声源已停止发声,但听者仍能听到声音。

21、即使声源已停止发声,但听者仍能听到声音 存在。存在。 n回声与余音的感觉可使听者感受出房间体积大小、回声与余音的感觉可使听者感受出房间体积大小、 房间高低及内表面结构上的差异,这便是房间高低及内表面结构上的差异,这便是空间感空间感。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 22 2.1.2.音频信号的质量指标音频信号的质量指标 1 频带宽度频带宽度 音频信号所包含的谐波分量越丰富,音色越音频信号所包含的谐波分量越丰富,音色越 好。在广播通信和数字音响系统中,以声音信号好。在广播通信和数字音响系统中,以声音信号 所包含的谐波分量的频率范围来衡量声音的质量,所包

22、含的谐波分量的频率范围来衡量声音的质量, 即带宽。即带宽。 不同质量的声音的频带对比示意图不同质量的声音的频带对比示意图 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 23 2动态范围动态范围 n动态范围越大,说明音频信号强度的相对变动态范围越大,说明音频信号强度的相对变 化范围越大,音响效果越好。化范围越大,音响效果越好。 n动态范围一般用动态范围一般用dB为单位来计量。为单位来计量。 uFM广播的动态范围约广播的动态范围约60dB, uAM广播的动态范围约广播的动态范围约40dB。 uCDDA的动态范围约的动态范围约100dB, u数字电话约数字电话约50dB

23、。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 24 3信噪比信噪比 n信噪比信噪比SNR(Signal Noise Ratio)是有用信号与噪是有用信号与噪 声之比的简称,即有用信号的平均功率与噪声的平声之比的简称,即有用信号的平均功率与噪声的平 均功率之比均功率之比 n信噪比大,在一定程度上能够掩蔽噪声,从而获得信噪比大,在一定程度上能够掩蔽噪声,从而获得 较好的声音效果。较好的声音效果。 n信噪比不仅是声音设备的性能指标,在声音的录制信噪比不仅是声音设备的性能指标,在声音的录制 和播放时,也要注意环境噪声。录制时应尽可能减和播放时,也要注意环境噪声。录制时

24、应尽可能减 小环境噪音。输出时应使音量适当大,以减少环境小环境噪音。输出时应使音量适当大,以减少环境 噪音对听音的影响。噪音对听音的影响。 n一般话筒和音箱的信噪比在一般话筒和音箱的信噪比在75dB以上。声卡的信以上。声卡的信 噪比在噪比在8595dB。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 25 2.2 数字音频数字音频 1.声音的数字化声音的数字化 u数字化就是将连续信号变成离散信号。数字化就是将连续信号变成离散信号。 u对音频信号,首先在时间上离散,取有限个时间对音频信号,首先在时间上离散,取有限个时间 点,称为点,称为采样采样。然后在幅度上离散,取

25、有限个幅。然后在幅度上离散,取有限个幅 度值,称为度值,称为量化量化。再将得到的数据表示成计算机。再将得到的数据表示成计算机 容易识别的格式,称为容易识别的格式,称为编码。编码。 u数字化的基本技术是数字化的基本技术是脉冲编码调制脉冲编码调制(Pulse Code Modulation,PCM),简称脉码调制简称脉码调制。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 26 (1) PCM编码编码 PCM是一种把模拟信号转换成数字信号的最基本的编是一种把模拟信号转换成数字信号的最基本的编 码方法,它主要包括采样、量化和编码码方法,它主要包括采样、量化和编码3个过程

26、。个过程。 u采样采样是每隔一定的时间测量一次声音信号的幅值,把时是每隔一定的时间测量一次声音信号的幅值,把时 间连续的模拟信号转换成时间离散、幅度连续的采样信间连续的模拟信号转换成时间离散、幅度连续的采样信 号。如果采样的时间间隔号。如果采样的时间间隔相等,这种采样称为均匀采样;相等,这种采样称为均匀采样; u量化量化是按是按“四舍五入四舍五入”或其他方法将采样得到的数值限或其他方法将采样得到的数值限 定在几个有限的数值中,将采样信号转换成时间离散、定在几个有限的数值中,将采样信号转换成时间离散、 幅度离散的数字信号;幅度离散的数字信号; u编码编码(coding)是将量化后的信号转换成一个

27、二进制码)是将量化后的信号转换成一个二进制码 组输出。比如,量化得到的数据中只会出现两个数值组输出。比如,量化得到的数据中只会出现两个数值51 和和80,则只用一位二进制的数表示即可,用,则只用一位二进制的数表示即可,用0表示表示51,用,用 1表示表示80。若量化级别为。若量化级别为256(有(有256级量化数据),则级量化数据),则 可用可用8位二进制数表示,这种编码方法称为位二进制数表示,这种编码方法称为自然编码自然编码。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 27 模拟声音信号的采样和量化过程示意模拟声音信号的采样和量化过程示意 (a)模拟声音信号

28、的波形成)模拟声音信号的波形成 (b)采样得到的离散时间信号)采样得到的离散时间信号 (c)再量化得到的数字信号)再量化得到的数字信号 模拟声音信号的数字化模拟声音信号的数字化 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 28 例例2.1 设一个连续信号的波形可以表示为设一个连续信号的波形可以表示为 设采样频率为设采样频率为21Hz,-10,10内的量化间隔取为内的量化间隔取为1, 试计算出该信号试计算出该信号0到到1秒内的量化数据。秒内的量化数据。 u对于对于CDDA,采样频率为,采样频率为44.1kHz,即每秒取,即每秒取44100个个 点。幅度的取值范围是

29、限制在点。幅度的取值范围是限制在216=65 536以内,量化间以内,量化间 隔为隔为1,即量化幅度可以取,即量化幅度可以取65 536个不同的值,计算机中个不同的值,计算机中 用用16位的存储空间就可以表示一个量化后的数值。动态位的存储空间就可以表示一个量化后的数值。动态 范围为范围为201g(216)96dB。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 29 PCM编码原理编码原理 n编码的过程首先用一组脉冲采样时钟信号与输入的编码的过程首先用一组脉冲采样时钟信号与输入的 模拟音频信号相乘,相乘的结果就是离散时间信号,模拟音频信号相乘,相乘的结果就是离散时

30、间信号, 然后对采样后的信号幅值进行量化。然后对采样后的信号幅值进行量化。 n量化过程由量化器来完成。对经量化器量化过程由量化器来完成。对经量化器AD(模(模/ 数)变换后的信号再进行编码,即把量化的信号电数)变换后的信号再进行编码,即把量化的信号电 平转换成二进制码组,就得到了离散的二进制数据平转换成二进制码组,就得到了离散的二进制数据 序列序列x(n), n计算机对量化后的二进制数据可以用文件的形式存计算机对量化后的二进制数据可以用文件的形式存 储、编辑和处理,并可还原成原始的模拟信号播放。储、编辑和处理,并可还原成原始的模拟信号播放。 还原的过程称为解码,它是还原的过程称为解码,它是AD

31、变换的逆过程,变换的逆过程, 即即DA(数数/模模)变换变换 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 30 PCM编码示意图编码示意图 PCM编码示意图编码示意图 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 31 (2)均匀量化和非均匀量化均匀量化和非均匀量化 量化时,如果采用相等的量化间隔对采样得量化时,如果采用相等的量化间隔对采样得 到的信号作量化,那么这种量化称为到的信号作量化,那么这种量化称为均匀量化均匀量化。 均匀量化采用相同的均匀量化采用相同的“等分尺等分尺”来度量采样得到来度量采样得到 的幅度,也称为的幅度,也称

32、为线性量化线性量化. 缺点缺点: 不能充分利用为不能充分利用为 适应幅度大的输适应幅度大的输 入信号,增加的入信号,增加的 样本的位数样本的位数. 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 32 u非线性量化非线性量化的思想是大的输入信号采用大的量化的思想是大的输入信号采用大的量化 间隔,小的输入信号采用小的量化间隔,间隔,小的输入信号采用小的量化间隔, u这样就可以在满足精度要求的情况下用较少的位这样就可以在满足精度要求的情况下用较少的位 数来表示。声音数据还原时,采用相同的规则。数来表示。声音数据还原时,采用相同的规则。 制作:西安交通大学制作:西安交通大

33、学 计算机教学实验中心计算机教学实验中心 33 (3) 律压扩律压扩 律律(-Law)压扩压扩主要用在北美和日本等地区的主要用在北美和日本等地区的 数字电话通信中,按下面的式子确定量化输入和输数字电话通信中,按下面的式子确定量化输入和输 出的关系出的关系 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 34 (4) A律律(A-Law) A律律(A-Law)压扩压扩主要用在欧洲和中国大主要用在欧洲和中国大 陆等地区的数字电话通信中,按下面的式子陆等地区的数字电话通信中,按下面的式子 确定量化输入和输出的关系确定量化输入和输出的关系 制作:西安交通大学制作:西安交通大

34、学 计算机教学实验中心计算机教学实验中心 35 对于采样频率为对于采样频率为8kHz,样本精度为,样本精度为13 位、位、14位或者位或者16位的输入信号,使用位的输入信号,使用律压律压 扩编码或者使用扩编码或者使用A律压扩编码,经过律压扩编码,经过PCM编编 码器之后每个样本需码器之后每个样本需8位二进制存储,输出的位二进制存储,输出的 数据率为数据率为64 kb/s。这个数据就是。这个数据就是CCITT推荐推荐 的的G.711标准:话音频率脉冲编码调制标准:话音频率脉冲编码调制 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 36 2.数字音频的技术指标数字音频

35、的技术指标 (1) 采样频率采样频率 u采样频率采样频率是指一秒钟采样的次数。采样频率越高,是指一秒钟采样的次数。采样频率越高, 单位时间内采集的样本数越多,得到波形越接近单位时间内采集的样本数越多,得到波形越接近 于原始波形,音质就越好。于原始波形,音质就越好。 u根据奈奎斯特根据奈奎斯特(Harry Nyquist)采样理论:采样理论:如果采如果采 样频率高于输入信号最高频率的两倍,重放时就样频率高于输入信号最高频率的两倍,重放时就 能从采样信号序列无失真地重构原始信号能从采样信号序列无失真地重构原始信号。例如,例如, 电话话音的信号频率约为电话话音的信号频率约为3.4 kHz,若采样频率

36、,若采样频率 选为选为8kHz,就能无失真地重放原始声音。,就能无失真地重放原始声音。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 37 n采样的采样的3个常用频率分别为个常用频率分别为 u11.025kHzAM广播广播 u22.05kHz FM广播广播 u44.1kHz CD高保真音质声音高保真音质声音 n现在声卡的采样频率一般为现在声卡的采样频率一般为48kHz甚至甚至 96kHz。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 38 (2)采样精度采样精度 n采样精度采样精度用每个声音样本的位数表示,也叫用每个声音样本的位数表

37、示,也叫样本精样本精 度度或或量化位数量化位数。它反映度量声音波形幅度的精度。它反映度量声音波形幅度的精度。 u例如,每个声音样本用例如,每个声音样本用16位表示,则量化样本值在位表示,则量化样本值在0 65535的整数范围内,它的精度是输入信号的的整数范围内,它的精度是输入信号的1/65536 n采样精度决定了模拟信号数字化以后的动态范围采样精度决定了模拟信号数字化以后的动态范围。 u若以若以8位量化,则其波形的幅值可分为位量化,则其波形的幅值可分为28=256等份,等效等份,等效 的动态范围为的动态范围为20lg(256)=48dB。若以。若以16位采样,则可位采样,则可 分为分为216=

38、65536等份,等效动态范围为等份,等效动态范围为 20lg(65536)=96dB。 n采样精度影响到声音的质量采样精度影响到声音的质量 u位数越多,声音的质量越高,而需要的存储空间也越多;位数越多,声音的质量越高,而需要的存储空间也越多; 位数越少,声音的质量越低,需要的存储空间越少。位数越少,声音的质量越低,需要的存储空间越少。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 39 (3)声道数)声道数 u单声道单声道(mono)信号一次产生一组声波数据。信号一次产生一组声波数据。 u如果一次产生两组声波数据,则称其为如果一次产生两组声波数据,则称其为双声道双

39、声道或或立体声立体声 (stereo)。双声道在硬件中占两条线路,一条是左声道,。双声道在硬件中占两条线路,一条是左声道, 一条是右声道。一条是右声道。 u立体声不仅音质、音色好,而且能产生逼真的空间感。立体声不仅音质、音色好,而且能产生逼真的空间感。 但立体声数字化后所占空间比单声道多一倍。但立体声数字化后所占空间比单声道多一倍。 u除采样频率、采样精度、声道数影响声音质量外,声音除采样频率、采样精度、声道数影响声音质量外,声音 录制时环境噪声、声卡内部噪声以及采样数据丢失等都录制时环境噪声、声卡内部噪声以及采样数据丢失等都 会造成声音质量的下降。实际收听时,音响(功率放大会造成声音质量的下

40、降。实际收听时,音响(功率放大 器、扬声器等)的质量对音质的表现也起很大作用。器、扬声器等)的质量对音质的表现也起很大作用。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 40 (4)音频数据传输率)音频数据传输率 音频信号数字化后,产生大量数据。产生数据音频信号数字化后,产生大量数据。产生数据 的速度或播放声音时需要传输数据的速度影响声音的速度或播放声音时需要传输数据的速度影响声音 的播放质量。数据传输率用每秒钟传输的数据位数的播放质量。数据传输率用每秒钟传输的数据位数 表示,记为表示,记为bps(bit per second)。)。 未经压缩的数字音频数据传输

41、率为未经压缩的数字音频数据传输率为: 数据传输率数据传输率(bits)=采样频率采样频率(Hz)量化位数量化位数(bit) 声道数声道数 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 41 声音质量和数字化指标声音质量和数字化指标 质量质量 采样频率采样频率 (kHz) 样本精度样本精度 (bit) 单道声单道声/ 立体声立体声 数据率数据率(kB/s) (未压缩未压缩) 频率范围频率范围 电话电话*88单道声单道声642003 400 Hz AM11.0258单道声单道声88.2507 000Hz FM22.05016立体声立体声705.62015 000Hz

42、CD44.116立体声立体声1411.22020 000 Hz DAT4816立体声立体声1536.02020 000 Hz 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 42 例例2.22.2 高保真立体声数字音频的量化位数为高保真立体声数字音频的量化位数为1616, 试计算其试计算其数据传输率数据传输率 解:高保真立体声数字音频采样频率为解:高保真立体声数字音频采样频率为44.1kHz44.1kHz, 双声道,其数据传输率为双声道,其数据传输率为 数据传输率数据传输率=44.1(kHz)=44.1(kHz)16(bit)16(bit)2(channel)=14

43、11.2(kbps)2(channel)=1411.2(kbps) 如果采用如果采用PCMPCM编码,数字音频文件所占用编码,数字音频文件所占用 的空间可用如下的公式计算的空间可用如下的公式计算( (数据量数据量) ): 音频数据量(音频数据量(ByteByte)= =数据传输率数据传输率持续时间持续时间8(bit/Byte)8(bit/Byte) 其中数据量以字节其中数据量以字节(Byte)(Byte)为单位;数据传输率以每秒为单位;数据传输率以每秒 比特比特(bps)(bps)为单位;持续时间以秒为单位;持续时间以秒(s)(s)为单位。为单位。 制作:西安交通大学制作:西安交通大学 计算机

44、教学实验中心计算机教学实验中心 43 例例2.32.3 计算计算1 1分钟未经压缩的高保真立体声数分钟未经压缩的高保真立体声数 字声音文件的大小。字声音文件的大小。 解:高保真立体声数字音频采样频率为解:高保真立体声数字音频采样频率为44.1kHz44.1kHz, 1616位量化,双声道,其数据传输率为:位量化,双声道,其数据传输率为: 数据传输率数据传输率=44.1(kHz)=44.1(kHz)16(bit)16(bit)2(channel)=1411.2(kbps)2(channel)=1411.2(kbps) 1 1分钟这样的声音文件的大小为分钟这样的声音文件的大小为 音频数据量音频数据

45、量=1411.2=1411.2(kb/skb/s)6060(s s)/8(bit/Byte)=10458kB/8(bit/Byte)=10458kB 未经压缩的未经压缩的4 4分钟的歌曲文件约分钟的歌曲文件约42M42M数据,数据, 128M128M的的MP3MP3播放器只能存放播放器只能存放3 3首这样的歌曲。首这样的歌曲。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 44 (5)编码)编码算法与音频数据压缩比算法与音频数据压缩比 未压缩的音频数据量非常大,因此在编码未压缩的音频数据量非常大,因此在编码 的时候常常要采用压缩的方式。的时候常常要采用压缩的方式。

46、 u编码的作用编码的作用 记录数字数据记录数字数据 采用一定的算法来压缩数据以减少存储空间和提高传采用一定的算法来压缩数据以减少存储空间和提高传 输效率。输效率。 u压缩编码的基本指标之一就是压缩比,一般为压缩编码的基本指标之一就是压缩比,一般为 数据压缩前后的数据量之比数据压缩前后的数据量之比 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 45 n采用不同的数字化指标实际上也是进行了不采用不同的数字化指标实际上也是进行了不 同比例的数据压缩。同比例的数据压缩。 如果如果PCMPCM编码采用编码采用4bit4bit量化对量化对CDCD音质信号压音质信号压 缩,其压

47、缩比为缩,其压缩比为4:14:1。这种情况下,用来记录幅。这种情况下,用来记录幅 值的比特位值的比特位越少越少,编码后数据量就,编码后数据量就越小越小,压缩比,压缩比 越越大大。但压缩比。但压缩比越越大大,丢掉的信息就会,丢掉的信息就会越多越多,信,信 号还原后失真就越大。号还原后失真就越大。( (有损压缩有损压缩) ) 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 46 n压缩算法包括有损压缩和无损压缩;压缩算法包括有损压缩和无损压缩; u有损压缩有损压缩解压后数据不能完全复原,要丢失一部解压后数据不能完全复原,要丢失一部 分信息。分信息。 u无损压缩无损压缩不

48、丢失任何信息,能较好地复原原始信不丢失任何信息,能较好地复原原始信 号号 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 47 3.3.数字音频文件格式数字音频文件格式 数字声音文件格式是数字音频在磁盘文件中的数字声音文件格式是数字音频在磁盘文件中的 存放形式,相同的数据可以有不同的文件格式,而存放形式,相同的数据可以有不同的文件格式,而 不同的数据也可以有相同的文件格式不同的数据也可以有相同的文件格式. (1) WAVEWAVE文件格式文件格式 wWAVEWAVE文件是一种通用的音频数据文件,文件扩展名为文件是一种通用的音频数据文件,文件扩展名为 “WAV”WAV

49、”,WindowsWindows系统和一般的音频卡都支持这种系统和一般的音频卡都支持这种 格式文件的生成、编辑和播放。格式文件的生成、编辑和播放。 wWAVEWAVE文件由三部分文件由三部分组成组成:文件头文件头、数字化参数数字化参数和和实际实际 波形数据波形数据。 wWAVEWAVE文件的文件的特点特点是易于生成和编辑,但在保证一定音是易于生成和编辑,但在保证一定音 质的前提下压缩比不够,不适合在网络上播放质的前提下压缩比不够,不适合在网络上播放 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 48 (2) MPEGMPEG文件文件 uMP3MP3文件是采用文件是

50、采用MP3MP3算法压缩生成的数字音频数据文件,算法压缩生成的数字音频数据文件, 以以“.MP3”.MP3”为文件后缀。为文件后缀。 uMP3MP3利用利用MPEGMPEG(Moving Picture Expert GroupMoving Picture Expert Group,运动图,运动图 像专家组)制定的像专家组)制定的MPEG-1 Audio layer 3MPEG-1 Audio layer 3的压缩标准,的压缩标准, 将音频信息用将音频信息用10:110:1甚至甚至12:112:1的压缩率,变成容量较小的的压缩率,变成容量较小的 数据文件。数据文件。 uMPEG1MPEG1压缩

51、主要用于压缩主要用于VCDVCD数据的压缩,也用来压缩不包数据的压缩,也用来压缩不包 含图像的纯音频数据,音频压缩算法包括含图像的纯音频数据,音频压缩算法包括MPEG Audio MPEG Audio Layer1Layer1、MPEG Audio Layer2MPEG Audio Layer2等,而等,而MPEG Audio Layer3MPEG Audio Layer3 有很高的压缩比。有很高的压缩比。 u虽然虽然MP3MP3是一种利用了人类心理声学特性的有损压缩,人是一种利用了人类心理声学特性的有损压缩,人 耳基本不能分辨出失真,音质几乎达到了耳基本不能分辨出失真,音质几乎达到了CDCD

52、音质标准。音质标准。 按照这种算法,按照这种算法,1010张张CDDACDDA的内容可以压缩到的内容可以压缩到l l张张CDCD ROMROM中,而且视听效果相当好。中,而且视听效果相当好。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 49 (3) RealAudioRealAudio文件文件 Real Audio Real Audio是是Real networksReal networks推出的一种推出的一种 音乐压缩格式音乐压缩格式, ,它的压缩比可达到它的压缩比可达到96:196:1,因此,因此 在网上比较流行。经过压缩的音乐文件可以在网上比较流行。经过压

53、缩的音乐文件可以 在通过速率为在通过速率为14.4kb14.4kbs s的的MODEMMODEM上网的计算上网的计算 机中流畅回放。其最大特点是可以采用流媒机中流畅回放。其最大特点是可以采用流媒 体的方式实现网上实时播放,即边下载边播体的方式实现网上实时播放,即边下载边播 放。放。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 50 (4)WMA文件文件 nWMA(Windows Media Audio)格式是格式是 Microsoft公司开发的网上流行音频文件格式。公司开发的网上流行音频文件格式。 其压缩比可以达到其压缩比可以达到18:1。 nWMA文件特点文件

54、特点 兼顾高保真度和网上传输的要求。兼顾高保真度和网上传输的要求。 内容提供商可以通过数字版权管理方案加入防复内容提供商可以通过数字版权管理方案加入防复 制保护,限制播放时间、播放次数和播放机器等,制保护,限制播放时间、播放次数和播放机器等, 有利防止盗版。有利防止盗版。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 51 2.32.3电子合成音乐电子合成音乐 n在多媒体系统中,除了用数字音频的方式以在多媒体系统中,除了用数字音频的方式以 外,还可以用合成的方式产生音乐外,还可以用合成的方式产生音乐. n音乐合成的方式根据一定的协议标准,使用音乐合成的方式根据一定

55、的协议标准,使用 音乐符号来记录和解释乐谱,并组合成相应音乐符号来记录和解释乐谱,并组合成相应 的音乐信号,这就是的音乐信号,这就是MIDI(Musical MIDI(Musical Instrument Digital Interface Instrument Digital Interface 乐器数字接乐器数字接 口口) )。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 52 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 53 1.1.基本术语基本术语 MIDI MIDI不是把音乐的波形进行数字化采样不是把音乐的波形进行数字化

56、采样 和编码,而是将数字式电子乐器的弹奏过程和编码,而是将数字式电子乐器的弹奏过程 以命令符号的形式记录下来,如按了哪一个以命令符号的形式记录下来,如按了哪一个 键、力度多大、时间多长等。当需要播放这键、力度多大、时间多长等。当需要播放这 首乐曲时,根据记录的乐谱指令,通过音乐首乐曲时,根据记录的乐谱指令,通过音乐 合成器生成音乐声波,经放大后由扬声器播合成器生成音乐声波,经放大后由扬声器播 出。出。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 54 (1)(1)音乐合成器(音乐合成器(Musical SynthesizerMusical Synthesizer

57、) u音乐会成器是利用音乐会成器是利用DSPDSP或其它集成电路芯片来产生音乐或其它集成电路芯片来产生音乐 或声音的电子装置。典型的合成器由微处理器、键盘、或声音的电子装置。典型的合成器由微处理器、键盘、 控制面板、存储器等组成。控制面板、存储器等组成。 (2)MIDI(2)MIDI电子乐器电子乐器 u它是能产生特定声音的合成器,如电子键盘、它是能产生特定声音的合成器,如电子键盘、 吉他、萨克斯管等;它们相互间的数据传送符吉他、萨克斯管等;它们相互间的数据传送符 合合MIDIMIDI的通信约定。的通信约定。 (3)MIDI(3)MIDI消息消息(message)(message)或指令或指令

58、uMIDIMIDI软件通信协议,实际上是用数字指令描述软件通信协议,实际上是用数字指令描述 的音乐乐谱,其中包含音符、强度、定时及乐的音乐乐谱,其中包含音符、强度、定时及乐 器的指派等。器的指派等。 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 55 (4)MIDI(4)MIDI接口接口(interface)(interface) uMIDIMIDI硬件通信协议,可使电子乐器互连或与计算硬件通信协议,可使电子乐器互连或与计算 机硬件端口相连,可发送和接收机硬件端口相连,可发送和接收MIDIMIDI消息。消息。 (5)MIDI(5)MIDI通道通道(channel)

59、(channel) uMIDIMIDI标准提供了标准提供了1616个通道,每种通道对应一种逻个通道,每种通道对应一种逻 辑的合成器,即对应一种乐器的合成。辑的合成器,即对应一种乐器的合成。 (6)(6)音序器音序器(sequencer)(sequencer) u它指可用来记录、编辑和播放它指可用来记录、编辑和播放MIDIMIDI文件的计算机文件的计算机 程序程序 制作:西安交通大学制作:西安交通大学 计算机教学实验中心计算机教学实验中心 56 2.MIDI2.MIDI的制作原理的制作原理 n电脑合成音乐需要使用电脑合成音乐需要使用MIDIMIDI语言。语言。MIDIMIDI语言利用字语言利用字

60、 节传送来告知相应的设备能够做什么和不能做什么。节传送来告知相应的设备能够做什么和不能做什么。 MIDIMIDI字节通知乐器、声卡和其他字节通知乐器、声卡和其他MIDIMIDI设备什么时候设备什么时候 开始和什么时候结束演奏音符开始和什么时候结束演奏音符 . nMIDIMIDI自身并不产生和传送声音,只是传送产生声音自身并不产生和传送声音,只是传送产生声音 的控制符号的控制符号. . n使用使用MIDIMIDI语言的设备(语言的设备(MIDIMIDI设备)可以互联。典型设备)可以互联。典型 设备是合成器或者设备是合成器或者MIDIMIDI控制键盘,也可以是外挂式控制键盘,也可以是外挂式 音响效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论