第5讲—第二章 数字音频处理技术(2).ppt_第1页
第5讲—第二章 数字音频处理技术(2).ppt_第2页
第5讲—第二章 数字音频处理技术(2).ppt_第3页
第5讲—第二章 数字音频处理技术(2).ppt_第4页
第5讲—第二章 数字音频处理技术(2).ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,第五讲,思考题,第二章 数字音频处理技术,(对应书中第九章),2,数字音频处理技术,基本概念 声音概念 声音频率分布 音质与数据量 数字音频文件的种类 音频数字化 声音的采样量化 采样过程简介 MIDI 音频 MIDI文件与WAV文件 MIDI音频数字化 MIDI 音频处理,主要内容, 计算机音乐 处理声音 转换采样频率 GoldWave软件 设定编辑区域 简单编辑 使用剪贴板 合成声音 增加效果 调整固有音量,3,数字音频处理技术,教学要求,1. 了解声音的基本特点; 2. 了解声音采样、量化与编码的处理过程; 3掌握数字音频中采样频率、量化精度和声道的概念; 4. 掌握数字音频文件的存储

2、; 5. 掌握数字音频文件数据量的计算方法; 6. 掌握Gold Wave的基本使用方法,能够利用其采集、编辑和合成数字音频; 7. 了解MIDI的有关概念以及计算机音乐合成基本思想; 8. 掌握WAVE文件与MIDI文件的区别。,4,MIDI 音频,MIDI定义,将乐器演奏时的音高、音长和力度等指令信息通过MIDI控制器输入计算机,以文件的形式存储。回放时经过合成器把指令信息转换成声音信号,再由混音器生成声波。,5,MIDI文件与WAV文件比较,MIDI指令,MID数据是一套指令,它指示乐器即MIDI设备做了什么,怎么做的,如演奏音符、加大音量、生成音响效果等。,6,MIDI有关概念,演奏控

3、制器,演奏控制器是一种输入和记录实时乐曲演奏信息的设备,例如:钢琴模拟键盘、电子琴、电子吉它、电子手风琴等。,7,MIDI有关概念,通道,通道是一种音乐信息的传输路线。每个通道可以传输一种乐器的音符信息。,单个物理MIDI通道(MIDI channel)分成16个逻辑通道,每个逻辑通道可指定一种乐器,如图所示。在MIDI信息(MIDI messages)中,用4个二进制位来表示这16个逻辑通道。音乐键盘可设置在这16个通道之中的任何一个,而MIDI声源或者声音模块可被设置在指定的MIDI通道上接收。,8,MIDI有关概念,MIDI数据流是单向异步的数据位流(bit stream),其速率为31

4、.25 kbps,每个字节为10位(1位开始位,8位数据位和1位停止位)。,9,数字音乐合成技术,10,用PC机构造的MIDI系统,在这个系统中,PC机使用内置的MIDI接口卡,用来把MIDI数据发送到外部的多音色MIDI合成器模块。像多媒体演示程序、教育软件或者游戏等应用软件,它们把信息通过PC总线发送到MIDI接口卡。MIDI接口卡把信息转换成MIDI消息(MIDI messages),然后送到多音色声音模块同时播放出许多不同的乐音,例如钢琴声、低音和鼓声。,11,MIDI音乐的合成处理过程,多媒体个人计算机MPC(Multimedia PC)规范就要求PC声卡上必须有这样的声音模块,称为

5、合成器(synthesizer)。,音源,演奏控制器,合成器,混频器,录制,编辑,转换,播放,12,计算机音乐,计算机音乐是由音序器创作、修改和编辑乐谱,经过合成器把数字乐谱变换成模拟声音波形,再经过混频器混合后送到音箱播放出音乐。 计算机音乐系统组成的三要素为: 演奏控制器、音源和MIDI接口,13,计算机音乐,计算机创作音乐,可以利用计算机,通过波形组合或声音取样来构造各种发音乐器,它可以将各种声音加以组合、混响来创造新的音乐。如用VB程序实现的打鼓音序器程序。,14,计算机音乐,计算机作曲,可以利用计算机,通过波形组合或声音取样来构造各种音符发音,通过软件编辑曲谱,试听各种音乐效果,来创

6、造新的乐曲。如用最简单的作曲软件Muse。,第五讲,思考题,第三章 数据压缩技术,(对应书中第六章),16,数据压缩技术,基本概念 信息熵概念 数据压缩必要性 数据压缩条件 数据冗余 数据压缩算法性能指标 数据压缩算法分类 统计编码 行程长度压缩 霍夫曼编码 算术编码 词典编码,主要内容, 预测编码 变换编码 JPEG 编码 JPEG三个标准 JPEG编码和解码模型 离散余弦变换 量化 DC和AC系数的编码 熵编码 MPEG 编码,17,数据压缩技术,教学要求,了解常见的多媒体数据压缩编码的原理 了解动态图象压缩编码标准MPEG 理解行程长度编码、预测编码和变换编码原理 掌握信息熵的概念 掌握

7、信息冗余的基本概念和分类 掌握多媒体数据压缩码的必要性、可能性及分类 掌握哈夫曼编码的原理和算法 掌握JPEG压缩编码的原理和算法,18,信息熵, 熵(Entropy)的概念 熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。某个事件的信息量用Ii=log2 Pi 表示 ,其中Pi为第i个事件的概率,0Pi1。, 信源X的熵的定义 按照香农(Shannon)的理论,信源X的熵定义为,其含义:信源X发出任意一个随机变量的平均信息量。,19,信息熵的计算示例,例: 有一幅40个象素组成的灰度图像,灰度共有5级,分别用符号A、B、C、D和E表示,40个象

8、素中出现灰度A的象素数有15个,出现灰度B的象素数有7个,出现灰度C的象素数有7个等等,如表所示。如果用3个位表示5个等级的灰度值,也就是每个象素用3位表示,编码这幅图像总共需要120位。, 信息熵 H(S) = (15/40) log2 (40/15) + (7/40) log2 (40/7) + (7/40) log2 (40/7) + (6/40) log2 (40/6) + (5/40) log2 (40/5) =2.196 这就是说每个符号用2.196位表示,40个象素需用87.84位。,20,多媒体信息的数据量,21,数据压缩条件, 数据存在冗余 (重复数据、可忽略数据), 数据传

9、输与存储空间的限制 (压缩传输或存储解压缩),44.1kHz/Stereo 1.3MB,22.0kHz / Nomo 0.3MB,Stop,重复数据 可忽略数据,22,数据冗余,冗余基本概念, 冗余信息所具有的各种性质中多余的无用空间, 冗余度多余的无用空间的程度,音频数据8kHz采样8bit60秒 = 3840KBit (合480KB/分钟),23,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,声音频率 文字组句 色彩渐变 主观意识 : :,多媒体信息中存在大量的冗余,数据压缩就存在了可能性,并且同时也表明了压缩的必要性。,24,数据压缩算法性能指标, 压缩比 压缩比指前后的文件数据量之比值。如JPEG标准对图象的压缩比可以达到50:1。自然压缩比越大越好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论