第二章 音频信号的获取与处理.ppt_第1页
第二章 音频信号的获取与处理.ppt_第2页
第二章 音频信号的获取与处理.ppt_第3页
第二章 音频信号的获取与处理.ppt_第4页
第二章 音频信号的获取与处理.ppt_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.1多媒体音频基础知识,2.2音频编辑软件CoolEdit的使用,第2章音频信号的获取和处理,2.1.1音频信号的数字化2.1.2数字音频文件格式,2.1多媒体音频基础知识, 最初的音频是用电信号记录并存储与传输的模拟信号,计算机处理的是数字音频,数字音频有独特的取得和处理方式。 振幅:信号的强弱,即音量大小的周期:反复出现的时间间隔频率:信号在1秒内变化的次数F=1/T(HZ ),重要的指标、声波、1,声音的基础知识音是经由一定介质(例如空气、水等)传播的连续波,是连续型(时间和宽度)的定时介质。 声音的主要传播介质是空气,固体、液体也能传播声音。 (日本地震声波)声音的本质是空气振动,通过空气振动引起耳膜的振动,能够被人的耳朵感知到,但并非所有的空气振动都能够被人的耳朵感知到。 2.1.1声音信号的数字化、人耳感受到的空气振动的频率范围约为20Hz20kHz,即人耳能够识别声音。 人说话声音的频率范围: 300Hz-3kHz,声音信号是指频率范围与人说话的信号的频率范围一致的信号,但实际上人的发音器官发出的声音的频率范围约为803400HZ。 此外,2.1.1声音信号的数字化、声音信号的频率是声音信号在1秒内变化的次数,用Hz表示。 不同的声音是不同的振动方式,具有不同的振动频率。 人的耳朵能够区别风声、雨声和人的声音,能够区别各种语言的声音,它们是来自声源体的不同的信息波。 声音信号是典型的连续信号,不仅在时间上连续,在振幅上也连续(指示振幅的数值是无穷多)。 时间和振幅都连续的信号称为模拟信号。 2.1.1语音信号的数字化、非语音是指语音信号范围外的人耳可识别的语音信号,主要包括乐音和噪声,非语音信号的特征不具有复杂的含义和语法信息,信息量较低,识别简单。 二次声波是人耳所感觉不到的声波,能够长距离传播,具有很强的透过性,更是伤害人的精神系统的声波。 二次声波看不见,却听不见,无处不在。 地震、火山喷发、暴风雨、波浪冲击、枪炮发射、热核爆炸等会产生二次声波,科学家可以用仪器“听”。 2.1.1声音信号数字化,1883年8月,南苏门答腊岛和爪哇岛之间的克拉卡托火山喷发,产生的二次声波绕地球三圈,全长10万公里以上,用108小时,1961年苏联在北极圈内的新地岛进行核试验而产生的二次声波绕地球五圈。 1948年初,荷兰货船通过马六甲海峡时,暴风雨过后,全船船员在意外死亡的匈牙利锅炉洞口,3名游客一齐倒下,停止呼吸应该好好利用下一声波和超声波。 2.1.1声音信号的数字化、2.1.1声音信号的数字化、再现波形、自然界的声音、乐器发出的声音一般是由几个频率和振幅不同的纯音构成的再现声音。 复音中频率最低的纯音称为音调,是决定音调的基本要素。 复音中存在的其他频率是复音中的次要成分,被称为谐音或倍音。 基音和谐音合成复音,决定了特定声音的音质和音色。 男性和女性声音的主要区别在于,声音高度不同,男性声音低,女性声音高。 这是因为男性声带长,宽,厚,振动时频率低,发音低。 女性声带短、薄、窄,振动时频率高,发音高。 2.1.1声音信号的数字化,声音3要素: (1)音调:表示声音的高度,由声音信号的频率决定,音乐中音高,频率高则音高,频率低则音低。(2)音强:也称为音量、音量,决定声音能量的强弱程度,根据声音信号的幅度决定,通常用音量表现音强,是分贝(dB )单位。 人能感知的声音的宽度在0120(dB )的范围内。 在同一声源中,人对声音的感觉强度与声源的方向和距离有关。 (3)音色:又称音品,表示声音的品质,由混入声谱和音调的倍音决定。 2.1.1声音信号数字化,例题: 1、以下对声音现象的说法,不正确的是() a,用一根棉线和两个纸杯可以做“土电话”,固体可以传达声音,在音乐会上,人们用音量区分哪个乐器发出的声音c,播放的声音,传播得很远也可以减弱噪音,说明可以种植道路的树木,净化空气2,在与以下对话对应的物理意义的联系中,错误的是() a,震耳朵-响度大的b,震耳朵-音色好的c, 沙沙沙作响沙沙作响声低d,掌声雷鸣-响度大,2.1.1声音信号数字化,2,模拟声音和数字声音模拟声音是连续的电信号,但计算机只能处理以0和1的形式表现的离散信号量。 在计算机上存储、传输、回放和处理音频信号之前,必须将音频的模拟/数字转换,即模拟音频信号数字化以形成数字音频。 另外,将2.1.1声音信号数字化、2.1.1声音信号数字化、音频数字化、量化时间与振幅离散的数字信号称为数字音频信号。 (1)采样(Sampling ) :在某个特定时刻测量模拟信号称为采样。 采样的时间间隔称为采样周期,采样分为均匀采样和不均匀采样,每秒采样的次数称为采样频率。 此外,由于2.1.1声音信号的数字化、(2)量化:采样获得的离散时间信号的幅度值依然是连续的,因此有必要对这些幅度值进行量化。 将振幅区间分割为n个区间,1个区间与1个振幅值对应,利用相同的振幅值表示进入第I个区间的所有振幅值。 这个过程称为量化。 将量化宽度间隔均等的称为线性量化,将不均等的称为非线性量化。 2.1.1语音信号的数字化;(3)编码是指以一定形式记录通过采样和量化获得的离散数据,并向有效数据中添加用于纠错、同步和控制的数据。 音频信号的编码通常采用波形编码方法,它直接对波形进行采样、量化、编码和算法简单,易于实现,并且能在语音恢复时保持原始特征,因此得到广泛应用。 常用的语音编码形式是PCM编码方法、DPCM编码、ADPCM压缩编码等。 2.1.1声音信号的数字化,2.1.1声音信号的数字化,奈奎斯特采样定理:采样频率应小于或等于声音信号的最高频率的两倍,以用于恢复原始声音。 应注意,fs是采样频率,Ts是采样周期,f是采样信号的最高频率,并且t是采样信号的最小周期。 取样频率的高低取决于奈奎斯特理论和音频信号本身的最高频率。 例如,电话声音的信号的最高频率大约为3.4kHz,并且采样频率通常选择为8kHz。 此外,fs2f或tst/2,2.1.1声音信号的数字化,量化样本的比特数由对计算机性能和音质的要求决定,一般是8比特量化、16比特量化和32比特量化,即,分别以1字节、2字节和4字节存储1个样本点的幅度值量化比特的数目越高,所需的存储空间越大,但是在这种情况下,语音的细节的缺失越少,语音质量越好。 声音数字化的三要素、2.1.1声音信号的数字化、声音数字化计算公式的数据量=采样频率量化比特的数目通道的数目/8(字节/秒)时间、2.1.2数字声音的获取方法、以及多媒体应用中经常采用声音素材。取得数字音频主要有以下方法: (1)使用声卡收集模拟设备的声音信息,并将其作为文件保存在计算机中。 (2)使用声卡录制声音信息,以文件形式存储到计算机中。 (3)使用声卡和MIDI机器在电脑上制作乐曲。 (4)从网上下载或购买音频盘。 (5)从CD或VCD中截取音频数据。 (6)从视频中获取音频数据。 2.1.3数字音频文件格式,1.WAV格式音频文件2.VOC格式音频文件3.MP3格式音频文件4.RA格式音频文件5.MIDI格式音频文件6.WMA格式音频文件,2.1.3数字音频1.WAV格式音频文件WAV是最早的数字音频格式,即波形音频文件,由微软和IBM共同开发。 优点:与多种音频的量化位数、采样频率和通道相对应,音质好,是标准数字音频。 采用44.1kHz的采样频率、16比特量化比特数的WAV文件的音质与CD几乎没有变化。 缺点:数据量大。 2.VOC格式音频文件是CreativeLab开发的音频文件,是SoundBlaster (声卡)使用的音频文件格式,在Windows平台上受支持。 每个VOC文件都由文件头块和音频数据块组成。 文件标题包含标识块开头的id、版本号和指针。 数据块分为多种类型的子块,包括语音数据、静音、标记、ASCII文件、结束标记和扩展块。 3.MP3格式的音频文件MP3的全名是MPEG-1AudioLayer3,是近年来很受欢迎的音乐文件,1992年编入MPEG标准。 MP-3音频文件的压缩是可逆压缩,基本上可以保持不失真的低音频部分,但是MP-3压缩算法以声音文件的12KHz到16KHz的高音频部分的质量为代价减少文件的存储空间。 优点:音质好,文件数据量少。 4.RA格式的音频文件RA文件是由RealNetwork公司开发的流式音频文件,主要应用于通过网络进行音频传输,因此网络连接率不同,客户端获得的语音质量也不同。 2.1.3数字音频文件格式,2.1.3数字音频文件格式,5.MIDI格式音频文件MIDI也称为乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。 MIDI文件存储有指定发声乐器、输入、音量、延迟时间、通信号等的命令,当声卡接收到这些命令时,根据该命令来合成声音,再现的效果完全取决于声卡的等级。 30分钟的MIDI音乐只有200KB。 MIDI音乐网:常用的音频编辑处理软件、CoolEdit(2003年收购Adobe公司) goodwaveobeaudition 3.0 cs5 cs6waveeditsoundforge、 2.2使用音频编辑软件cool edit2.2.1cooleditpro2. 1概述2.2.2CoolEditPro2.1基本操作2.2.3使用cool edit pro2. 1进行音频编辑的综合示例,cool edit pro是美国syn trills CoolEdit的主要功能是录制和收集音频文件,包括声音、低音、静音以及提供各种效果,如剪切、粘贴、合并和叠加声音,包括放大、降噪、放大、回声、延迟、失真和音调。 可转换多种音频文件格式,以实现自动静音检测和删除、自动节拍检索等功能,从而生成电话信号等声音。 2.2.1CoolEditPro2.1的介绍,1 .声音的录音方式如下: (1)使用本机记录器开始录音-程序-附件-娱乐-录音机(将属性变更为录音,挂起麦克风);(2)使用录音软件录音的是录音和设备要素: (1)声卡(2)扬声器(3)麦克风,2.2.2CoolEdit的基本操作,注意:一般麦克风的录音是单声道的,立体声的话,必须带两个麦克风,严格的立体声定位录音。 必须把卡车分开录音。 如果您需要双声道,可以复制单声道并将其粘贴到另一个声道,但这不仅仅是双声道而且不是立体声。立体声的定义是两个声道同时发音,发出的声音因为空间、音像、水平不同所以称为立体声。 两个声道同时发音,但两个声道发出相同的声音,所以不能只称为两个声道,也不能称为立体声。 2.2.2CoolEdit的基本操作、2 .音频数据的编辑3种音频粘贴方式: (1)普通粘贴(2)粘贴到新文件中(3)混合粘贴注:在多轨道上按鼠标右键,可以自由拖动波形的声音。 2.2.2coolcoedit的基本操作,注:重点理解“效果”的编辑主要操作是: (1)设定声音的渐隐和渐隐(2)提高音量和单调(3)添加混音和低音效果(4)消除人声,制作简单伴奏(5)制作反响(6)抑制噪音, 2.2.2coolcoedit的基本操作,1.CoolEdit接口2.2.3CoolEdit软件的介绍和系列操作,CoolEdit包括波形编辑状态和多轨道编辑状态两种编辑状态,如图2-4和图2-5所示波形编辑状态主要用于语音编辑,多轨道编辑状态主要用于语音合成。 如图2-4所示,CoolEditPro2.1波形编辑状态被分为标题栏、菜单栏、工具栏、资源管理区域、波形显示区域、操作区域、状态栏显示区域等六个部分。 2.2.3CoolEdit软件介绍和系列操作,2.2.3CoolEdit软件介绍和系列操作,2.2.3CoolEdit软件介绍和系列操作, 2.CoolEdit功能表CoolEdit2.1波形编辑视窗的介面有10个层级功能表: File (档案)、Edit (编辑)、View (检视)、Effects (效果)、Generate (产生)、Analyze (分析)、Favorites (分析) Options (可选)、窗口、帮助、30多个快捷方式、2.2.3CoolEdit软件介绍和操作、文件菜单、2.2.3CoolEdit软件介绍和系列操作、编辑菜单、剪贴板将、选择的领域的开头和末尾自动调节为无声的状态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论