第1章 数字音频基础_第1页
第1章 数字音频基础_第2页
第1章 数字音频基础_第3页
第1章 数字音频基础_第4页
第1章 数字音频基础_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章数字音频基础1.1数字音频基础

1.1.1音频的概念以及特征1.1.2音频数字化1.2音频的处理设备

1.2.1模拟音频处理设备1.2.2数字音频处理设备1.3数字音频的获取1.3.1使用录音笔录音1.3.2在计算机录音工作室中录音1.3.3从Internet上搜索和下载1.4数字音频的格式以及转换1.4.1常见的数字音频格式1.4.2不同音频格式间的转换1.4.3音频格式转换应用实例1.5数字音频编辑软件2023/10/1812.1.1音频的概念及特性物理学上,声音被看成一种波动的能量,即声波。同时在物理学上,一般用声音的三个基本特性来描述声音,即频率、振幅和波形。生理学上,声音是指声波作用于听觉器官所引起的一种主观感觉。如响度、音调、音色和音长等。1.1数字音频基础2023/10/1822023/10/1831.1.1音频的概念及特性在物理学上声音的三个基本特性:频率、振幅和波形,对应到人耳的主观感觉就是音调、响度和音色。所谓频率即发声物体在振动时,单位时间内的振动的次数,单位为赫兹(HZ)。振幅是指发声物体在振动时偏离中心位置的幅度,代表发声物体振动时动势能的大小。振幅是由物体振动时所产生的声音的能量或声波压力的大小所决定的。声能或声压愈大,引起人耳主观感觉到的响度也愈大。音色是指声音的纯度,它由声波的波形形状所决定。即使某种声音它们的振动和频率都一样,也就是说它们的音调高低,声音强弱都相同,但它们的波形不一样,所以听起来就会有明显的区别。2023/10/1841.1.1音频的概念及特性2023/10/1851.1.1音频的概念及特性声音的分类按照人耳可听到的频率范围,声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20~20000赫兹间。声音高于20000赫兹为超声波,低于20赫兹为次声波。按照声音的来源以及作用来看,可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑,感叹等;乐音也可成为音乐,是指人类通过相关乐器演奏出来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;响音是指除语言和音乐之外电影中所有声音的统称,如动作音响、自然音响、背景音响、机械音响、特殊音响。2023/10/1862023/10/1872023/10/1881.1.2音频数字化模拟音频信号。一般,模拟信号在时间或者空间维度上可以无限制的细分下去。模拟信号最大的特点就是它是一种连续的不间断的信号。对音频模拟信号进行处理时,一般采用模拟的技术手段。电器元件是将连续的原始信号的变化形式原封不动的传递给下一单元,这就是模拟的处理方式。2023/10/1891.1.2数字音频数字音频是指用一连串二进制数据来保存的声音信号。2023/10/18101.1.2音频的数字化过程数字化的音频信号两种途径:第一种途径就是将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频;第二种途径就是在数字化设备中创作出数字音频,比如电子作曲。音频数字化一般经过三个阶段“采样——量化——编码”。2023/10/18111.1.2音频的数字化过程音频数字化过程的具体步骤包括:第一步,将麦克风转化过来的模拟电信号以某一频率进行离散化的样本采集,这个过程就叫采样;第二步,将采集到的样本电压或电流值进行等级量化处理,这个过程就是量化;第三步将等级值变换成对应的二进制表示值(0和1),并进行存储,这个过程就是“编码”。通过这三个环节,连续的模拟音频信号即可转换成离散的数字信号——二进制的0和1。2023/10/18121.1.2音频的数字化过程数字化过程两个指标:一是量化深度,也可称之为量化分辨率,是指单位电压值和电流值之间的可分等级数;二是采样频率,即采样点之间的时间间隔。两者与音质还原的关系是:采样频率越高,量化深度越大,声音质量越好。2023/10/18131.1.2音频的数字化过程横坐标是时间轴(采样频率),纵坐标是幅度值(量化分辨率),曲线代表的是模拟信号对应的波动曲线,带颜色的方格是采样量化后的所得结果。采样量化

2023/10/18141.1.2音频的数字化过程由图中可以得知,当频率越小(时间间隔越短),量化深度(量化分辨率)越大,二者的轮廓越吻合,这也说明数字化的信号能更好的保持模拟音频信号的形状,有利于保持原始声音的真实情况。2023/10/18151.1.2音频的数字化过程在数字音频的衡量指标中,采样频率的单位是HZ,量化深度一般用比特(Bit)来度量。例如:某一音频的数字化指标是44.1kHZ,8个比特位。那么这里的44.1kHZ比较容易理解,但8比特位并不是说把某一单位的电压(电流)值成8份,而是分成28=256份;同理16位是把纵坐标分成216=65536份。通常情况下,在音频数字化的过程中,设置的采集频率可已选择三种:32kHz、44kHz、48kHz。特别是在CD制作过程中,一般的采样频率是44.1kHz,那么为什么会设置这三个档次呢?2023/10/18161.1.2音频的数字化过程如图,上半部分表示原始音频的波形;下半部分表示录制后的波形;红色的点表示采样点。采样频率对波形的影响

2023/10/18171.1.2音频的数字化过程上下波形之所以不吻合,是因为采样点不够多,或是采样频率不够高。这种情况关于合理的采样频率这一问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产生低频失真,则采样频率至少是录制的最高频率的两倍(上图中,采样频率只是录制频率的4/3倍)。这个频率通常称作Nyquist极限。,称之为低频失真。2023/10/18181.2.1模拟音频处理设备1.2音频的处理设备在对声音进行处理的过程中,除了对声音进行记录之外,还需要对声音进行一些其它方面的调整。如对声音进行音调的调节、多声音混合、高中低音的调整,还有诸如原始声波信号的拾取等等问题。这就会涉及到一些其它的音频处理设备。话筒(Microphone麦克风)音箱(speaker,扬声器)模拟调音台2023/10/1819(1)话筒(Microphone麦克风)话筒的主要功能就是进行声音能量的收集。当出现磁性记录技术之后,话筒的功能就开始发生变化,除了完成声音的收集外,还要完成声能向电能的转化(声音信号转化成电流信号),但是其还原声音的功能已逐渐消失。2023/10/1820(2)音箱(speaker,扬声器)音箱的主要功能就是还原声音,将音频电流信号变换成声音信号,可以说是留声机中大喇叭另一功能的转化。2023/10/1821(3)模拟调音台调音台在现代电台广播、舞台扩音、音响节目制作中是一种经常使用的设备,它具有多路输入,每路的声音信号可以单独被处理,还可以进行各种声音的混合,且混合比例可调;拥有多种输出。调音台在诸多系统中起着核心作用,它既能创作立体声、美化声音,又可抑制噪声、控制音量,是声音艺术处理必不可少的一种设备。2023/10/18221.1.1音频的概念及特性声音的分类按照人耳可听到的频率范围,声音可分为超声、次声和正常声。人耳可感受声音频率的范围介于20~20000赫兹间。声音高于20000赫兹为超声波,低于20赫兹为次声波。按照声音的来源以及作用来看,可分为人声、乐音和响音。人声包括人物的独白、对白、旁白、歌声、啼笑,感叹等;乐音也可成为音乐,是指人类通过相关乐器演奏出来的声音,如影视作品中的背景声音,一般起着渲染气氛的作用;响音是指除语言和音乐之外电影中所有声音的统称,如动作音响、自然音响、背景音响、机械音响、特殊音响。2023/10/1823调音台

2023/10/18241.2.2数字音频处理设备数字音频处理设备可以分为两类:一类是专用数字音频设备,另一类是非专为处理音频而设计的多媒体计算机。(1)数字调音台:前面介绍过模拟的调音台,可以知道调音台的作用有两个:其一是将每一路进行优化和调节;其二,对多路声音进行混合输出。(2)数字录音机:如图所示是数字录音机。数字录音机是对模拟录音方式进行了升级,采用数字记录方式来存储音频信号。一般可用硬盘记录方式或者光盘记录方式。2023/10/1825数字录音机2023/10/1826(3)数字音频工作站:数字音频工作站是一台能够完成从录音、编辑、混合、压缩,一直到最后刻出母盘的全部音频节目制作过程的设备。拥有这样一台设备就相当于有了调音台、多轨录音机、编辑机、效果器等这些录音棚的价值不菲的全部家当。它最大的特点就是集成度高,免去录音连线的烦恼,且便于携带。2023/10/1827数字音频工作站2023/10/1828在进行数字音频处理时,除了用到上述几种专用的硬件设备外,还会用到一些其它配套设备,如麦克风、音箱等等。其实,不管是专用设备,还是多媒体计算机,在处理数字音频时,其关键的硬件技术内核包括:1)模数转换器:模数转换器(AnalogtoDigitalConverter,ADC)是一个硬件芯片,一般用在带录音功能的音频处理设备之中,其作用就是将模拟的音频电压(流)信号转成数字脉冲电压(PCM)信号。任何ADC都包括上面提到的三个基本功能:采样、量化和编码,用来完成从模拟的音频信号向数字音频信号的采集过程。2023/10/18292)数模转换器:数模转换器(DigitaltoAnalogConverter,DAC)也是一个硬件芯片,一般用在数字音频的重放设备中,用来将数字音频信号还原成模拟的音频信号。可以把DAC想像成16个小电阻,各个电阻值是以二的倍数增大。当DAC接受到来自计算机中的二进制PCM信号,遇到0时相对应的电阻就开启,遇到1相对应的电阻不作用,这样每一批16Bits数字信号都可以转换为相对应的电压大小。如图中所示,还原后的电流信号看起来就像阶梯一样,当然会跟原来平滑的信号有些差异,但是人的耳朵没有那么灵敏,只要采样的频率和量化深度足够的话,一般不会察觉到差异。2023/10/1830采样量化2023/10/18311.3数字音频的获取1.3.1使用录音笔录音1.3.2在计算机录音工作室中录音

1.3.3从Internet上搜索和下载2023/10/18321.4数字音频的格式以及转换其实,不同的编码方式就对应计算机中不同的文件格式,反映在计算机中就是文件的后缀名不同。对于数字音频的常见格式有以下几种:(1)WAV格式:WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。(2)MIDI格式:MIDI是MusicalInstrumentDigitalInterface的缩写,又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。它定义了计算机音乐程序、数字合成器及其它电子设备交换音乐信号的方式,规定了不同厂家的电子乐器与计算机连

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论