




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第4章 声音编辑及软件应用基础,本章重点:,音频的相关知识 数字音频文件的格式及特点 数字音频的采集量化 数字音频的压缩与编码 Adobe Audition应用软件的使用 MIDI音乐制作 GoldWave音频处理软件的使用,声音在本质上是一种机械振动,它通过空气传播到人耳,刺激神经后使大脑产生一种感觉。在一些专业场合,声音通常被称为声波或音频。,4.1 声音概述,声音在物理学上称之为声波,是通过一定介质(如空气、水等)传播的一种连续振动的波,也称为声波。,通常把频率范围为20Hz20kHz的信号称为音频信号。低于20Hz的信号为亚音信号或者称为次音信号;高于20kHz的信号称为超音频信号,或
2、称为超声波信号。,常见声源及其频率范围:,声音的特征:,声音有3个重要参数即振幅、周期和频率。振幅是波的高低幅度,表示声音的强弱;周期指两个相邻波之间的时间长度;频率指每秒振动的次数,以Hz为单位。 声音的三要素是音调、音色、强度,它们分别与声波的频率、波形、振幅等相关,4.1.2 声音的分类 1.波形声音 也成效果音,包括所有的声音形式,指自然界发出的声音,如:风声、雨声、雷声、狗叫声等。 2.语音 人说话的声音不仅仅是一种波形声音,而且通过语气、语速、语调比文本更加丰富的信息,是一种特殊的媒体。 3.音乐 与语音相比,形式更为规范一些,是一种符号化的声音。,4.1.3 数字音频文件格式,数
3、字音频数据是以文件的形式保存在计算机中的。数字音频的文件格式主要又CD、WAVE、MP3、WMA、MIDI等。 CD文件:*.cda格式,采用44.1kHz的采样频率,速率为88kbps。具有16位量化位数,CD音轨近似无损,声音基本上终于忠于原声。 WAV文件:微软公司开发的一种声音文件格式,也称波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。,4.1.3 数字音频文件格式,MP3音频文件:全称为MPEG-1 audio layer3,其压缩率为12:1。优势是在高压缩比的情况下,还能拥有优美的音质。它利用知觉音频编码技术,即利用了人耳的特性,消减音乐中人耳的特
4、性,消减音乐中人耳听不到的成分,同时尽可能地维持原来的声音质量。 WMA文件:Windows Media Audio,通过减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的。WMA的一个优点是压缩率高,一般都在18:1.其次,WMA的内容提供商可以加入防复制保护。,4.1.3 数字音频文件格式,MIDI:Musical Instrument Digital Interface,允许数字合成器和其他设备交换数据。MIDI文件格式由MIDI继承而来。MIDI文件并不是一段录制好的声音,而是记录声音的信息,每个音符记录为一个数字,然后是告诉声卡如何再现音乐的一组指令。1分钟MIDI音乐文件的
5、大小只有510KB。 RA:Real network推出的一种音乐压缩格式;它的压缩比可达到96 :1 ,因此在网上比较流行。经过压缩的音乐文件可以通过速率为14.4kb/s的MODEM上网的计算机中流畅回放。,常见音频格式的小结,WAV wav Windows才有的 波形音频文件存储格式 ra, rma Real Networks公司的流逝音频文件格式 Snd Apple计算机上的音频文件存储格式 Seq,sng MIDI文件存储格式 Voc 声霸卡存储的音频文件存储格式 Wrk Cakewald Pro软件采用的MID格式 Rol Adlib声卡存储格式,mod MIDI文件存储格式 Mp
6、2 MPEG Layer I II MP3 MPEG Layer I II mct MIDI文件存储格式 MID Windows的MIDI文件存储格式 aiff Apple计算机上的音频文件存储格式 au Sun和Next公司的音频文件存储格式。,4.2 音频技术,声音信号是时间和幅度上都连续的模拟信号。而计算机只认识“0”和“1”,或者说计算机只能处理一个个数据,尽管数据量可能是巨大的。所以,计算机处理声音的第一步是将声音数字化,将模拟信号变为数字信号。,4.2.1音频的数字化,把模拟声音(音频)信号转换位数字化声音(音频)的过程称为声音(音频)的数字化,或称为模/数(A/D)变换。,1.
7、采样,在音频数字化过程中,采样指的是以固定的时间间隔T对模拟信号(音频信号)进行取值。固定的时间间隔T称为采样周期,1/T称为采样频率(fs)。采样后得到的是一个离散时间信号。采样时间间隔T越短,也就是采样频率越高,声音数据在后期播放时保真度越好。 采样频率与声音频率之间有一定的关系,根据奈奎斯特(Nyquist)理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。,2. 量化,采样后的音频信号需要经过量化,使信号幅度转变为有限的离散数值。这种由有限个数值组成的信号就称为离散幅度信号。 例如,假设输入电压的范围是0V7V,并假设它的取值只限定在0,1,2
8、,7共8个值。如果采样得到的幅度值是1.2V,则它的取值就应是1V,如果采样得到的幅度值是2.6V,则它的取值就应是3V等。 这种数值就称为离散数值,即量化值。量化之后得到的是时间离散、幅度离散的数字信号。,采样只解决了音频波形信号在时间坐标(即横轴)上把一个波形切成若干个等分的数字化问题,但是还需要用某种数字化的方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。我们把对声波波形幅度的数字化表示称之为“量化”。 量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢? 我们还是采取二进制的
9、方式,以位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级,用以记录其幅度大小。,2. 量化,以下图所示的原始模拟波形为例进行采样和量化。假设采样频率为1000次/秒,即每1/1000秒A/D转换器采样一次,其幅度被划分成0到9共10个量化等级,并将其采样的幅度值取最接近0 9之间的一个数来表示,如下图所示。图中每个正方形表示一次采样。,3. 编码,编码,即是将量化值表示成为二进制数的形式,以便于计算机存储和处理。最简单的编码方案是用二进制的补码表示,也称为脉冲编码调制PCM。PCM编码的文件有wav、mp3、au、swa。 计
10、算机可以对数字化之后的音频信号进行存储、编辑和处理,并可以还原成原始的波形进行播放,这个还原的过程称为解码,它是模/数(A/D)变换的逆过程,及数/模(D/A)变换。,4.2.2 数字音频音质与数据量,采样频率和采样数据位数是数字化声音的两个最基本要求,直接影响数字化音频的质量和数据量。一般而言,采样频率越高声音失真越小,但用于存储音频的数据量也越大。数据位数越高音质越好,数据量越大。 通常有3中采样频率:44.1kHz(取样44 100次每秒,用于CD品质的音乐)、22.05kHz(适用于语音和中等品质的音乐)、11.025kHz(低品质),采样位数精度分别为8位字长(256阶)量化(低品质
11、)和16位字长(65 535阶)量化(高品质)。,4.2.2 数字音频音质与数据量,反映音频数字化质量的另一个因素是通道(或声道)个数。一次采样一个声音波形,称为“单声道”;一次采样两个声音波形,称为“双声道”(即人们常说的立体声)。立体声更能反映人的听觉感受。但数据量比单声道多一倍,这样需要的存储空间是单声道的两倍。对声音的采样可以使用不同的采样频率、采样量化级数和声道,但实际上为了节省存储空间,经常要在数字化音频数据量的的大小与声音回放质量之间进行权衡。,声音信息数字化后的数据量计算公式为: 数据量=采样频率*量化位数*声道数*声音持续时间/8 数据量的单位:B/s(字节/秒),音质与数字
12、音频参数的关系,4.2.3 音频信号的压缩编码基础 音频信号编码的主要目的是通过信源编码的方式冗余语音传输占的信道资源,提高通信资源的利用率,同时又保证较好地重建语音的质量。 压缩可分为有损压缩和无损压缩。无损压缩主要有霍夫曼压缩和行程压缩;有损压缩主要有三类:波形编码、参数编码和混合编码。,各种常见编码标准及应用场景,4.2.4 音频压缩编码标准,音频信号是多媒体信息的重要组成部分。音频信号分为电话质量的语言、调幅广播质量的音频信号和高保真立体声信号。针对不同的质量标准,制定了相应的压缩标准。,1. 电话质量的音频压缩编码技术标准,由于数字音频压缩技术具有广阔的应用范围和良好的市场前景,因而
13、音频压缩技术的标准化工作显得十分重要。CCITT(现ITU-T)在语音信号压缩的标准化方面做了大量的工作,制定了G.771、G.721、G.728等标准,并逐渐受到业界的认同,其他语音相关标准有:H.221、H.222、H.223、H.233、H.231、H.242、H.245、H.261、H.263等。,2. 调幅广播质量的音频压缩编码技术 标准,调幅广播质量音频信号的频率范围为50Hz 7kHz。CCITT在1988年制定了、G.722标准。此 标准采用16kHz采样频率,14bit量化,信号数据 传输速率为224kbps,并采用子带编码方法,将 输入音频信号经滤波器分成高子带和低子带两个
14、 部分,分别进行ADPCM编码,再混合形成输出 码。,3. 高保真度立体声音频压缩编码技术 标准,高保真立体声音频信号频率范围为50Hz20kHz,采用44.1kHz采样频率,16bit量化,进行数字化转换,其数据传输速率每声道达705kbps。 一般语音信号的动态范围和频响比较小,采用8kHz采样频率,每样值用8bit表示,现在的语音压缩技术可把码率从原来的64kbps压缩到4kbps左右。但多媒体通信中的声音要比语音复杂的多,它的动态范围可达100db,频响范围可达20Hz20kHz。因此,声音数字化后的信息量非常达。为了更有效地利用宝贵的信道资源,必须对声音进行数字压缩编码。,目前世界上
15、第一个高保真立体声音频压缩标准为MPEG音频压缩算法。虽然MPEG音频标准是MPEG标准的一部分,但它也完全可以独立使用。表4-2中列出了ISO和ITU先后建议的用于电话质量的语音压缩标准。,4.2.5 声音处理软件简介,声音处理软件按照功能划分,主要包括声音数字化软件、声音编辑处理软件、声音压缩软件。 声音数字化软件主要有Easy CD-DA Extractor、Exact Audio Copy和Real Jukebox。 声音编辑处理软件主要有GoldWave和Adobe Audition 声音压缩软件主要有AVI MPEG WMV RM to MP3 Converter,4.3 数字音频
16、获取,声音文件的获取是为音频的编辑进行素材积累阶段。声音的获取途径很多,可以采用以下方式进行获取。 4.3.1 数字音频的获取方法 声音采集可以分为两类:一类外部采集,另一类内部采集。 外部采集:利用播放器设备或话筒从外部采集声音素材。 内部采集:从CD唱盘获得、从网上和素材库获取,4.3.2 利用录音机采集声音文件的应用实例 1.接入麦克风 2.开始程序附件 娱乐录音机 3.设置采用参数 文件属性立即转换,4.防止输入源的声音强度过大,造成音频失真。 双击任务栏的“音量”按钮,设置“麦克风”的音量滑块调小即可。若无“麦克风”选项,只需在菜单“选项”“属性”,把“麦克风”选项勾上即可。,4.4
17、 音频编辑处理系统GoldWave 4.4.1 GoldWave的工作界面,图4-1 GoldWave的工作界面,1.控制器 “窗口-水平放置/垂直放置/传统风格控制器”命令来设定控制器的位置。“工具控制器”命令合并控制器与工具栏。,控制器,控制器属性设置控制器中按钮的作用 选项-控制器属性,2.GoldWave用户界面 用户界面主要有三个部分:,上部,中部,下部,功能键和快捷命令,波形区域,左声道,右声道,文件属性,1标题栏 用于显示该应用程序的名称及正在编辑的声音对象的名称等。 2菜单栏 包括文件(File)、编辑(Edit)、效果(Effect)、查看(View)、工具(Tool)、选项
18、(Options)、窗口(Window)和帮助(Help)8个选项。用户可以单击这些菜单选项,从弹出的下拉菜单中选择相应的子命令,即可执行相应的任务。,3标准工具栏,图4-2 标准工具栏,4效果工具栏,图4-3 效果工具栏,5播放控制栏,图4-4 播放控制栏,光标到 结尾,停止 录音 控制器属性 播放器计算器 音量图,在选区内录音,暂停,显示控制器窗口,选择音频文件区域(高亮区域),方法有三种:1.在波形显示区域直接单击,选择一个区域即可;2.在区域开始和结尾处右击,打开弹出菜单“设置开始/结束标志”;3.鼠标左键设置开始位置,右键菜单设置结束位置。,编辑区域,4.录制数字音频 a. “文件-新建”命令,设置声音的声道、采样速率、时长等参数。 b.确定输入设备(如麦克风)与计算机连接。 C.单击录制图标即可录音。,5.简单的音频编辑 剪切、删除、复制、波形图的放大和缩小、混音制作等操作。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 油气勘探与开发地质资料立卷归档规则
- 企业培训曝光教程课件
- 油库仪表自动化控制系统
- 英语五年级上册《A camping trip》教案
- 矿业开采权转让与采石场合作合同
- 餐饮企业劳动合同管理及争议解决策略
- 路灯损坏措施方案
- 公司银行还款方案
- 跨境电商企业跨境资金链管理服务合同
- 厨房人员统筹方案
- 2025至2030中国工业设计行业现状动态与未来前景展望报告
- 矿山融资居间合同协议
- 数智化背景下“知识图谱CDIO”混合式教学模式研究
- 天猫养车加盟合同协议
- 2025年乡村全科助理医师助理医师资格证考试必刷题库(500题)
- GB/T 45448-2025再生变形高温合金原料
- 景区抽成合同协议
- 网络安全知识手册
- 铁路公司质量管理制度
- 物业公司接管公寓楼项目工作时间倒推计划表(T日为入驻日)
- DB1304T 500-2025民用水表、电能表、燃气表计量纠纷处理规范
评论
0/150
提交评论