音频信号处理技术.ppt_第1页
音频信号处理技术.ppt_第2页
音频信号处理技术.ppt_第3页
音频信号处理技术.ppt_第4页
音频信号处理技术.ppt_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

上午8时45分,1,4.2 音频信号处理技术,课程内容: 11版第4章 4.2,上午8时45分,2,音频信号处理技术,1 . 音频的数字化与MIDI合成音乐 2 . 音频媒体的管理 3 . 音频处理技术(GoldWave) 4 . 语音合成与识别技术,上午8时45分,3,多媒体计算机中产生声音的方式 外部声音源录制和重放:Wave音频(波形音乐) MIDI电子音频,4.2.1 音频的数字化与MIDI合成音乐,上午8时45分,4,波形音频的数字化,Windows中最基本的波形声音格式:扩展名是.WAV 的文件,上午8时45分,5,波形音频的数字化,一、波形音频特征(三个参数),采样频率 量化位数 声道数,上午8时45分,6,采样频率:每秒从模拟声波中采集声音样本的个数。 频率越高,采集的样本数越多,声音质量越好,占用存储空间越大。 人耳感受范围:020kHz 一般采用:11.025kHz、22.05kHz、44.1kHz,波形音频三个参数,对原始声波采样,采样后得到的数据,上午8时45分,7,量化位数:将采样数据按大小存储的过程。 一般有8、16、32位等,量化位数越大,声音的幅度分辨率越高,还原时声音的品质越好,声音数据占用的存储空间越大,波形音频三个参数,上午8时45分,8,声道数:数字音频声音质量的另一个因素。 一般有单声道 、双声道、多声道 存储量计算: 采样频率量化位数声道数时间8 (字节) 举例: 采样频率44.1kHz,16位量化,双声道,一分钟的音频所需要的存储量为: 44.1100016260/8=10584000(字节),波形音频三个参数,上午8时45分,9,Wave音频文件,标准数字音频,扩展名是.WAV 多数声卡能以16位、44.1kHz采样率录制和播放 主要缺点:产生的文件太大,不适合长时间记录 压缩方法:从PCM(均匀量化)到ADPCM(自适应差分量化),上午8时45分,10,Wave音频文件的制作工具,录音机:Wave文件录制、播放和进行一些简单处理的基本工具 Adobe Audition Ulead Audio Editor GoldWave,上午8时45分,11,MIDI合成音乐,MIDI (Musical Instrument Digital Interface) MIDI是乐器数字接口的缩写,文件扩展名是 .MID MIDI文件的内容是能使合成音乐芯片演奏乐曲的代码 多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,上午8时45分,12,MIDI合成音乐,产生: 合成器:,FM合成器 波表合成器,上午8时45分,13,合成器,利用DSP或其他芯片产生音乐或声音的电子装置 FM合成器 采用频率调制的原理产生声音 FM合成器能发出128种乐器的声音 波表合成器 对真实乐器声采样,制波表保存,由DSP查表调用处理 DSP(digital signal processor)是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是接收模拟信号,转换为0或1的数字信号,再对数字信号进行修改、删除、强化,并在其他系统芯片中把数字数据解译回模拟数据。 声音效果与真实的乐器声几乎无差别 声卡带有波形表ROM的接口 或 本身带有波形表ROM ROM的容量越大,可存储的乐器音就越多,上午8时45分,14,MIDI音乐产生原理,MIDI标准:规定了电子乐器与计算机连接的电缆、硬件标准和通信协议 乐谱的数字描述(MIDI指令信息) 由音符序列、定时和多达16个通道的演奏音符定义组成 演奏音符定义由键号、通道号、音长、音量和力度组成 建立MIDI文件:设备演奏时输入或软件编辑产生 MIDI文件特点:是一系列指令不是波形,文件小 MIDI设备端口 :MIDI In、MIDI Out、MIDI Thru 媒体播放器可直接播放,上午8时45分,15,4.2.2 音频媒体管理,Windows Media Player 媒体文件的导入 媒体文件的管理,音频媒体管理,上午8时45分,16,菜单栏,功能选项卡,播放列表,窗口切换按钮,地址栏,工具栏,导航窗格,详细信息窗格,播放控制区,上午8时45分,17,音频的格式,1. WAV格式:Windows标准波形文件,多数音频编辑软件支持,文件较大。 2. MP3格式:高压缩比,文件较小,音质接近CD。 3. MIDI文件:存储指令,文件短小,播放效果因软硬件而异。,上午8时45分,18,音频的格式,4. CD格式:音质最好的数字音频格式,CDA文件只含索引信息。 5. RealAudio格式:适用网上在线音乐欣赏,可随带宽不同改变音质。 6. WMA格式:音质强于MP3,内置版权保护技术,支持音频流技术。,媒体的播放、转换与分享,媒体文件的播放 Windows Media Player可以播放影音媒体文件、影音CD、DVD、图片。 声音格式的转换 将CD音乐文件转换为WMA、MP3或WAV CD翻录音乐,上午8时45分,19,4.2.3 音频处理技术,音频处理: 录音 编辑 添加音效 格式转换 GoldWave:数字音乐编辑器,上午8时45分,20,GoldWave界面,上午8时45分,21,使用GoldWave录音,录制从麦克风输入的声音 录制计算机中其他播放器通过声卡播放的声音,上午8时45分,22,声音的编辑,剪裁波形 删除波形 复制、粘贴波形 混音,上午8时45分,23,声音的特效处理,调整音量 调整播放时间和播放速度 添加回声 音乐淡入淡出效果 消除音乐中的静音段,上午8时45分,24,利用GoldWave转换音频格式,单个文件转换 文件/另存为 “保存声音为”对话框中选择保存类型 批量转换文件格式 文件/批处理 “批处理”对话框添加文件 选中“转换文件格式为”复选框 选择“另存类型”,上午8时45分,25,上午8时45分,26,4.2.4 语音合成与识别,语音合成技术 赋计算机“讲话”能力 用语音输出结果 语音识别技术 使计算机具有“听懂”语音的能力 用语音替代键盘输入,上午8时45分,27,语音合成与识别,一、语音合成技术 方法:语音合成方法、参数合成方法 目标:可懂、清晰、自然、具有表现力 应用:文语转换(TTS) 二、语音识别技术 ViaVoice中文连续语音识别系统 输入速度:150汉字/分 识别率:95% 发展方向: 自然话语识别与理解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论