音频信号处理技术.ppt_第1页
音频信号处理技术.ppt_第2页
音频信号处理技术.ppt_第3页
音频信号处理技术.ppt_第4页
音频信号处理技术.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

音频信号处理技术.ppt.ppt 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上午7时9分,1,4.2音频信号处理技术,课程内容:11版第4章4.2,上午7时9分,2,音频信号处理技术,1.音频的数字化与MIDI合成音乐2.音频媒体的管理3.音频处理技术(GoldWave)4.语音合成与识别技术,上午7时9分,3,多媒体计算机中产生声音的方式外部声音源录制和重放:Wave音频(波形音乐)MIDI电子音频,4.2.1音频的数字化与MIDI合成音乐,上午7时9分,4,波形音频的数字化,Windows中最基本的波形声音格式:扩展名是.WAV的文件,上午7时9分,5,波形音频的数字化,一、波形音频特征(三个参数),采样频率量化位数声道数,上午7时9分,6,采样频率:每秒从模拟声波中采集声音样本的个数。频率越高,采集的样本数越多,声音质量越好,占用存储空间越大。人耳感受范围:020kHz一般采用:11.025kHz、22.05kHz、44.1kHz,波形音频三个参数,对原始声波采样,采样后得到的数据,上午7时9分,7,量化位数:将采样数据按大小存储的过程。一般有8、16、32位等,量化位数越大,声音的幅度分辨率越高,还原时声音的品质越好,声音数据占用的存储空间越大,波形音频三个参数,上午7时9分,8,声道数:数字音频声音质量的另一个因素。一般有单声道、双声道、多声道存储量计算:采样频率量化位数声道数时间8(字节)举例:采样频率44.1kHz,16位量化,双声道,一分钟的音频所需要的存储量为:44.1100016260/8=10584000(字节),波形音频三个参数,上午7时9分,9,Wave音频文件,标准数字音频,扩展名是.WAV多数声卡能以16位、44.1kHz采样率录制和播放主要缺点:产生的文件太大,不适合长时间记录压缩方法:从PCM(均匀量化)到ADPCM(自适应差分量化),上午7时9分,10,Wave音频文件的制作工具,录音机:Wave文件录制、播放和进行一些简单处理的基本工具AdobeAuditionUleadAudioEditorGoldWave,上午7时9分,11,MIDI合成音乐,MIDI(MusicalInstrumentDigitalInterface)MIDI是乐器数字接口的缩写,文件扩展名是.MIDMIDI文件的内容是能使合成音乐芯片演奏乐曲的代码多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,上午7时9分,12,MIDI合成音乐,产生:合成器:,FM合成器波表合成器,上午7时9分,13,合成器,利用DSP或其他芯片产生音乐或声音的电子装置FM合成器采用频率调制的原理产生声音FM合成器能发出128种乐器的声音波表合成器对真实乐器声采样,制波表保存,由DSP查表调用处理DSP(digitalsignalprocessor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是接收模拟信号,转换为0或1的数字信号,再对数字信号进行修改、删除、强化,并在其他系统芯片中把数字数据解译回模拟数据。声音效果与真实的乐器声几乎无差别声卡带有波形表ROM的接口或本身带有波形表ROMROM的容量越大,可存储的乐器音就越多,上午7时9分,14,MIDI音乐产生原理,MIDI标准:规定了电子乐器与计算机连接的电缆、硬件标准和通信协议乐谱的数字描述(MIDI指令信息)由音符序列、定时和多达16个通道的演奏音符定义组成演奏音符定义由键号、通道号、音长、音量和力度组成建立MIDI文件:设备演奏时输入或软件编辑产生MIDI文件特点:是一系列指令不是波形,文件小MIDI设备端口:MIDIIn、MIDIOut、MIDIThru媒体播放器可直接播放,上午7时9分,15,4.2.2音频媒体管理,WindowsMediaPlayer媒体文件的导入媒体文件的管理,音频媒体管理,上午7时9分,16,菜单栏,功能选项卡,播放列表,窗口切换按钮,地址栏,工具栏,导航窗格,详细信息窗格,播放控制区,上午7时9分,17,音频的格式,1.WAV格式:Windows标准波形文件,多数音频编辑软件支持,文件较大。2.MP3格式:高压缩比,文件较小,音质接近CD。3.MIDI文件:存储指令,文件短小,播放效果因软硬件而异。,上午7时9分,18,音频的格式,4.CD格式:音质最好的数字音频格式,CDA文件只含索引信息。5.RealAudio格式:适用网上在线音乐欣赏,可随带宽不同改变音质。6.WMA格式:音质强于MP3,内置版权保护技术,支持音频流技术。,媒体的播放、转换与分享,媒体文件的播放WindowsMediaPlayer可以播放影音媒体文件、影音CD、DVD、图片。声音格式的转换将CD音乐文件转换为WMA、MP3或WAVCD翻录音乐,上午7时9分,19,4.2.3音频处理技术,音频处理:录音编辑添加音效格式转换GoldWave:数字音乐编辑器,上午7时9分,20,GoldWave界面,上午7时9分,21,使用GoldWave录音,录制从麦克风输入的声音录制计算机中其他播放器通过声卡播放的声音,上午7时9分,22,声音的编辑,剪裁波形删除波形复制、粘贴波形混音,上午7时9分,23,声音的特效处理,调整音量调整播放时间和播放速度添加回声音乐淡入淡出效果消除音乐中的静音段,上午7时9分,24,利用GoldWave转换音频格式,单个文件转换文件/另存为“保存声音为”对话框中选择保存类型批量转换文件格式文件/批处理“批处理”对话框添加文件选中“转换文件格式为”复选框选择“另存类型”,上午7时9分,25,上午7时9分,26,4.2.4语音合成与识别,语音合成技术赋计算机“讲话”能力用语音输出结果语音识别技术使计算机具有“听懂”语音的能力用语音替代键盘输入,上午7时9分,27,语音合成与识别,一、语音合成技术方法:语音合成方法、参数合成方法目标:可懂、清晰、自然、具有表现力应用:文语转换(TTS)二、语音识别技术ViaVoice中文连续语音识别系统输入速度:150汉字/分识别率:95%发展方向:自然话语识别与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论