版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.1多媒体音频信息处理2.1.1声音信号的形式任何声音都是物体振动产生的现象,物体受到敲打或激发就能产生振动,发声体的振动在介质中的传播称为声波。当声波达到人的耳膜时,会感觉到这种压力的变化,或者感觉到振动,这就是声音。在日常生活中,音频(Audio)信号可分为两类:语音信号和非语音信号。在物理上,声音可用一条连续的曲线来表示。这条连续的曲线无论多复杂,都可分解成一系列正弦波的线性叠加。因声波是在时间和幅度上都连续变化的量,称为模拟量。第1页/共39页
图2-1用声音录制软件记录的英文单词”Hello”语音 的实际波形体之间的关系第2页/共39页2.1.2模拟音频信号的物理特征模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强弱。2-2声波的频率、周期与振幅第3页/共39页1.频率一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。人们在日常说话时的语音信号:频率范围300~3000Hz亚音(subsonic):频率小于20Hz的信号音频(Audio):频率范围为20~20kHz的信号超音频(ultrasonic):高于20kHz的信号
第4页/共39页2.周期
周期是指信号在两个峰点或谷底之间的相对时间。周期和频率之间的关系是互为倒数。如果每隔—定时间波形就重复相同的形状,那么就称这个时间为周期。
3.幅度
信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。声音的强度水平(声响或者音量)用dB来测量。dB的测量值等于在对数标尺上选定的参考声强与实际感受的声强的比值。分贝数=10log(P1/P0)第5页/共39页2.1.3
与声音有关的几个术语1.听觉、感知2.音高3.音色4.语音5.响度
第6页/共39页6.声音的质量声音的质量与它所占用的频带宽度有关,频带越宽,信号强度的相对变化范围就越大大,音响效果也就越好。按照带宽可将声音质量分为4级图2-3四级声音质量的频率范围第7页/共39页2.1.4
模拟音频的数字化过程数字化的声音易于用计算机软件处理,对模拟音频数字化过程涉及音频的采样、量化和编码第8页/共39页
采样和量化的过程可由数模(A/D)转换器转换器实现。A/D转换器以固定的频率去采样,即每个周期测量和量化信号一次。经采样和量化后声音信号经编码后就成为数字音频信号,可以将其以文件形式保存在计算机的存储介质中,这样的文件一般称为数字声波文件。
1.采样
为实现A/D转换,需要把模拟音频信号波形进行分割,以转变成数字信号,这种方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在模拟声音的波形上取一个幅度值,把时间上的连续信号,变成时间上的离散信号。该时间间隔称为采样周期,其倒数为采样频率。采样频率是指计算机每秒钟采集多少个声音样本。
采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。第9页/共39页2.量化对声波波形幅度的数字化表示称之为“量化”量化的过程是先将采样后的信号按整个声波的幅度划分成有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相同的量化值。如何分割采样信号的幅度呢?
采取二进制的方式,以8位(bit)或16位的方式来划分纵轴。也就是说在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化等级(quantizationlevels),用以记录其幅度大小。在相同的采样频率之下,量化位数愈高,声音的质量越好。同理,在相同量化位数的情况下,采样频率越高,声音效果也就越好。第10页/共39页3.编码图2-6音频信号处理过程
音频编码的信息是声音波形,所以又称波形编码。这种方法要求重构的声音信号的各个样本尽可能地接近于原始声音的采样值,复原的声音质量较高。常用的波形编码技术有脉冲编码调制(PulseCodeModulation,PCM)、自适应差分脉冲编码调制(AdaptiveDifferentialPulseCodeModulation,ADPCM)和自适应变换编码(AdaptiveTransformCoding,ATC)等。第11页/共39页脉冲编码调制PCMPCM是把模拟信号变换为数字信号的一种调制方式,既把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。PCM的主要优点是:抗干扰能力强;失真小;传输特性稳定,尤其是远距离信号再生中继时噪声不累积,而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。第12页/共39页2.1.5
声卡声卡(也称为声效卡)在多媒体计算机中是不可缺少的重要部件,直接决定了对声音数据的处理能力与质量。现在的声卡已不仅仅作为发声之用,还兼备了声音的采集、编辑、语音识别、网络电话等种种功用第13页/共39页1.声卡的工作原理
图2-7声卡工作原理框图主芯片-数字信号处理器
承担着对声音信息处理、特殊音效过滤与处理、语音识别、实时音频压缩、MIDI合成等重要的任务。 声卡主芯片是一块具有强大运算能力的数字信号处理器(DSP),是声卡的核心部件。DSP是一种可编程芯片,通过软件安装新的指令后就能够升级。主芯片能将来自ADC(数字/模拟转换器)的信号加以处理,改变成所需要的形式。DSP芯片对输入的数字声音用PCM、DPCM或ADPCM方式进行编码和压缩,并形成WAV格式文件送入计算机磁盘存储。声音输出时,将磁盘中的WAV文件送入DSP芯片,经解码后变成数字声音信号送至D/A转换部分。
混音芯片-CODEC
主要承担对原始声音信号的采样、编码和混音处理;混音的声源可以是MIDI信号、CD音频、线性输入、话筒等,可以选择输入一个声源或将几个不同声源进行混合录音。在对音源处理时,可编程设定采样频率和量化位数。音乐合成器
标准多媒体PC可以通过声卡的内部合成器(Synthesizer)或主机MIDI端口的外部合成器播放MIDI文件。频率调制合成器(FM合成器)波表(Wavetable合成器)。总线接口和控制器
总线接口和控制器由数据总线双向驱动器、总线接口控制逻辑、总线中断逻辑和DMA控制逻辑组成。目前声卡的总线接口一般采用PCI接口,并可设定基本I/O地址、中断向量IRQ和DMA通道三个参数。第14页/共39页2.声卡的输入/输出接口声卡的输/入输出接口均为3.5mm规格插口(MIDI/Joystick除外)
图2-8声卡通过接口与外部音频设备的连接第15页/共39页
2.1.6数字音频的文件格式
目前较常用的声音文件格式
图2-9数字音频的常用文件格式第16页/共39页1.WAV格式(.wav)
WAV格式是微软公司专门为Windows设计的最为古老而流行的波形声音文件存储格式,基本上是按照声波的实际振动的波形进行存储,是未经压缩的格式,所需存储空间较大。2.CD-DA格式(.cda)
CD-DA是由Philips和Sony公司结盟于1979年联合开发的,常见的CD唱片是数字音频录制的,将音频数字信号直接写在盘片上,重现时用激光读出这些信息,再通过D/A(数/模)转换成模拟音频。第17页/共39页3.MPEG音频文件——MP3
这里的音频文件格式指的是MPEG标准中的音频部分,即MPEG音频层(MPEGAudioLayer)。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEGAudioLayer1/2/3),分别对应MP1、MP2和MP3这三种声音文件;MPEG音频编码具有很高的压缩率,MP3的压缩率可达10∶1~12∶1,同时其音质基本保持不失真。第18页/共39页5.VOC文件(.voc)
VOC文件是Creative公司所使用的标准音频文件格式,也是声霸卡(SoundBlaster)所使用的音频文件格式,多用于保存CreativeSoundBlaster(创新声霸)系列声卡所采集的声音数据.6.其他格式第19页/共39页2.1.7常用音频处理软件介绍
1.CoolEditPro2.SoundForge3.Cakewalk
第20页/共39页2.2CakewalkSONAR8的安装、配置与界面功能介绍2.2.1SONAR8软件的获取2.2.2SONAR8软件的安装2.2.3SONAR8的初始设置第21页/共39页2.2.4SONAR8软件的操作主界面图2-25Sonar8软件的操作主界面第22页/共39页1.标题栏2.主菜单3.主界面工具栏4.音轨窗5.状态栏第23页/共39页2.2.5音轨窗1.音轨窗布局图2-34SONAR8的音轨窗第24页/共39页2.音轨窗的工具栏图2-35音轨窗工具条的主要按钮(1)插入新音轨(InsertNewTracks)(2)选择工具(SelectTool)(3)自由编辑工具(FreeEditTool)(4)包络线工具(Envelope)(5)包络线绘制工具(EnvelopeDrawtool)(6)网格对齐工具(SnapToGrid)(7)启用/禁用自动交叠淡变(AutomaticCrossfades)(8)显示/隐藏电平(Show/HideAllMeters)(9)分割工具(SplitTool)(10)静音工具(MuteTool)(11)缩放工具(ZoomTool)(12)试听工具(ScrubTool)(13)显示/隐藏查看器(Show/HideInspector)(14)显示/隐藏导航器(Show/HideNavigator)(15)显示/隐藏视频((Show/HideVideo)第25页/共39页3.音轨参数面板图2-36音轨参数面板第26页/共39页2.3CakewalkSONAR音频处理基本实验实验2-1:CakewalkSONAR的基本操作1.实验目的通过本实验掌握Cakewalk的基本操作。2.实验内容SONAR的文件操作、播放控制、静音与独奏、设置标记、循环播放乐曲等。第27页/共39页3.实验步骤(1)打开文件第28页/共39页(1)打开文件(2)设置播放控制工具Transport(3)播放乐曲(4)静音和独奏(5)当前时间第29页/共39页(6)设置音轨标记(7)循环播放音乐图2-46“LoopToolbar”工具栏第30页/共39页实验2-2CakewalkSONAR音轨的基本编辑操作1.实验目的掌握CakewalkSONAR音轨的基本操作。2.实验内容使用SONAR导入音频文件、音轨的复制、粘贴与删除、音轨的合并与自动淡入淡出等。第31页/共39页3.实验步骤(1)打开文件(2)音轨的复制、粘贴与删除(3)音轨的移动第32页/共39页(4)设定淡入淡出效果第33页/共39页(5)音轨的合并第34页/共39页实验2-3:在乐曲中运用素材风格
风格素材(GrooveClip)是指预先制作好的已知节奏速度与音高的音频文件,每个风格素材恰好在一个完整小节的时间长度内的鼓或贝司等伴奏乐器所做的采样录音。1.实验目的掌握CakewalkSONAR在乐曲中运用风格素材的操作。2.实验内容利用Tutorial.cwb工程文件添加风格素材。第35页/共39
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金属船体制造工常识测试考核试卷含答案
- 福建师范大学协和学院《项目管理与工程经济决策》2025-2026学年期末试卷
- 数控拉床工安全实践竞赛考核试卷含答案
- 行李计划员岗前可持续发展考核试卷含答案
- 植物科学与技术专业实习心得体会
- 稀土烟气回收工安全意识强化考核试卷含答案
- 抽纱挑编工安全专项强化考核试卷含答案
- 工作成果与未来挑战-互联网项目实施的故事
- 第13课《卖油翁》课件 -统编版语文七年级下册
- 初一春季学期历史预测卷及答案
- 2025浙能集团甘肃有限公司新能源项目(第二批)招聘17人笔试历年难易错考点试卷带答案解析
- 2026年消防设施操作员(中级监控)真题及答案
- 2026年阿拉善职业技术学院单招职业技能考试题库附参考答案详解(夺分金卷)
- 2026年大连职业技术学院单招职业技能考试题库及答案详解(名师系列)
- 职业技能等级鉴定电子设备装接工(高级)理论知识考试真题及答案
- 国轩高科测评试题
- 2025年山东省日照市中考物理真题卷含答案解析
- 2026 年离婚协议书制式模板民政局制式
- 投标管理制度及流程规范
- GB/T 33047.1-2025塑料聚合物热重法(TG)第1部分:通则
- 2026春统编版小学道德与法治五年级下册(全册)课时练习及答案(附教材目录)
评论
0/150
提交评论