




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 数字声音及MIDI,信息:数、文、形、音、图 音频:麦克风、扬声器 多媒体计算机: 声音的输入、存储、处理、输出 声音:消息、意向、情感,2.1 声音与听觉,声音:通过空气传播的一种连续的波,又称声波。 声音的度量:频率与幅度(声波压力的大小) 频率用音高表示,幅度用声强表示 与看得见的水波类似,波形声音,波形声音,实际上包含了所有的声音形式。任何声音信号,包括麦克风、磁带录音、无线电和电视广播、光盘等各种声源所产生的声音,都要首先对其进行模数转换,然后再恢复出来。,语音(speech),人的声音不仅是一种波形,而且还有内在的语言、语音学的内涵,可以利用特殊的方法进行抽取,通常将语音也作为一种媒体。,音乐,音乐是符号化了的声音。这种符号就是乐曲,乐谱是转化为符号媒体的声音。电子乐器数字接口(musical instrument digital interface, MIDI )是十分规范的一种形式。,带宽与听觉 Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound,18k,感知声音的幅度:用dyne(达因)/平方厘米表示,常转换成0120dB(decibel),但对不同的频率,同样的声强,感觉不同。 声音信号: 有许多不同频率的信号组成,又称复合信号。 带宽:组成复合信号的频率范围。 纯音:单一频率的声音。,声音是由空气中分子的振动而产生的。自 然界的声音是一个随时间而变化的连续信号,可近似地看成是一种周期性的函数。通常用模拟的连续波形描述声波的形状,单一频率的声波可用一条正弦波表示,如下图所示。,基线是测量模拟信号的基准点。 声波的振幅表示声音信号的强弱程度。 声波的频率反映出声音的音调,声音细尖表示频率高,声音粗低表示频率低。 振幅和频率不变的声音信号,称为单音。单音一般只能由专用电子设备产生。 在日常生活中,我们听到的自然界的声音一般都属于复音,其声音信号由不同的振幅与频率合成而得到。,模拟声音信号:可分解成一系列正弦波的线性叠加。 最低频的音波称为基音,频率为基频 其余的为泛音,频率是基频的整数倍。,声音三要素:音高、音色、音强 音高:由基频决定,基频取对数后与人的音高感觉成线性关系。 音色:有混入基音中的泛音决定。 音强:幅度,听觉与声音信号强度不成线性关系,因而用20log幅度(分贝)表示,(1). 采样和量化,(c) 采样信号的量化,(a) 模拟音频信号,(b) 音频信号的采样,数字化音频的过程如下图所示。,2.2 声音信号数字化,从模拟信号到数字信号 模拟信号:在时间与幅度上都连续,连续 记为x(t). 离散信号:按一定的时间间隔T,得到的x(nT). T为抽样周期,1/T抽样频率 量化:把抽样序列x(nT)量化成一个有限个幅度之的集合x(nT).,对模拟音频信号进行采样量化编码后,得到数字音频。数字音频的质量取决于 采样频率 量化位数 声道数,采样频率,采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通常采用三种:11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.1KHz。,量化位数,量化位数也称“量化精度”,是描述每个采样点样值的二进制位数。 例如,8位量化位数表示每个采样值可以用28即256个不同的量化值之一来表示,而16位量化位数表示每个采样值可以用216即65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位。,声道数,声音通道的个数称为声道数,是指一次采样所记录产生的声音波形个数。 记录声音时,如果每次生成一个声波数据,称为单声道;每次生成两个声波数据,称为双声道(立体声)。随着声道数的增加,所占用的存储容量也成倍增加。,2. 声音数字化: Sampling, Quantization, Coding 采样频率与量化精度 3.采样频率 奈奎斯特(Nyquist)定理(1928年提出原理,仙侬(Shannon)形成定理并应用,1933年卡切尼科夫用公式表述): 采样频率2f 这里f为被采样信号的最高频率。,4. 量化精度 量化: 取样值(-,+)有限个数(量化值近似) 若量化值有J个,若用二进制表示,需要R=log2(J) 位 量化误差:用有限的离散值表示无限多的连续值,必然存在误差. 该误差又称为量化噪声(与一般的噪声不同)。 采样精度可以用信噪比表示: R为编码位数,5. 音频数据率 未经压缩的数字音频数据率(bit/s) 采样频率(Hz)量化位数 (bit)声道数 音频数据存储量(Byte) 数据率(bit/s)持续时间(s) / 8 例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率11.025(KHz)8(bit) 88.2 (Kbit/s) 音频数据量11.025(KHz)8(bit) 60(s)/8 0.66 (MByte),存储量=采样频率量化位数/8声道数时间,声音的质量与数据率,根据声音的频带,把声音的质量分为5个等级,2.3 声音文件的存储格式,声音文件的格式: PC机:.wav Apple: .aiff, .snd Unix: .au 2. 波形文件格式:1991年IBM与微软开发(以 .wav为扩展名) Fig 2.3 3. 常见声音文件的扩展名 表2-2,声音文件,在多媒体技术中,存储声音信息的常用文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件和RMI文件等。,(1) WAV文件,WAV是Microsoft公司的音频文件格式。利用Microsoft Sound System软件Sound Finder可以将AIF、SND和VOD文件转换到WAV格式。 WAV文件来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。WAV文件是由采样数据组成的,所以它需要的存储容量很大。,(2) VOC文件,VOC文件是Creative公司波形音频文件格式,也是声卡使用的音频文件格式。每个VOC文件由文件头块(header block)和音频数据块(data block)组成。文件头包含一个标识、版本号和一个指向数据块起始的指针。数据块分成各种类型的子块,如声音数据、静音、标记、ASCII码文件、重复的结束,以及终止标记、扩展块等。,(3) MIDI文件,MIDI(musical instrument digital interface)是一种技术规范,从它的英文全名可以看出,它用于音乐。,其他音频文件,最重要的是PCM格式,它是模拟的音频信号经数模转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声卡提供的软件中,可以利用VOCHDR程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert工具也可以将PCM音频文件转换成Microsoft的WAV格式。 AIF是Apple计算机的音频文件格式。WindowsConvert工具可以把AIF格式的文件转换成Microsoft的WAV格式的文件。,2.4 声音工具,声音工具:录、放、存储、编辑 Windows自带:sound recorder 播放和录音设备:SoundMAX Digital Audio 声卡:附带wave studio 网上:cool edit, goldwave Windows Media Player 播放和组织计算机和 Internet 上的数字媒体文件。这就好象把收音机、视频播放机、CD 播放机和信息数据库等都装入了一个应用程序中 Windows Media Player 播放器支持的文件类型.doc,2.5 声音质量的度量,1.声音信号的带宽 2.客观质量度量 signal-to-noise ratio,SNR 3.主观质量度量:人的感觉 MOS:mean opinion score,声音质量 MOS标准,2.5 声音质量的度量,作业 使用“录音机”软件把10秒钟的CD音乐录制成CD音质(44.1kz、16位、双声道、PCM)的.wav文件)。 把录制的文件分别转换为“22.05kz、16位、单声道、PCM”, “11.025kz、8位、单声道、PCM”以及“44.1kz、4位、单声道、ADPCM” 比较以上四种格式的声音文件的数据量和声音音质,2.6 电子乐器数字接口MIDI,MIDI(Musical Instruments Digital Interface) Musical synthesizers、musical instruments、计算机之间交换音乐信息的一种标准协议。 MIDI是一套指令,指示MIDI设备做什么,如何做。 MIDI不是声音信号,而是发送给Midi 设备的,产生声音或执行动作的指令。 MIDI乐音的产生方法 频率调制合成, FM 波形表合成 wave table synthesis,3.频率调制FM合成(frequency modulation): 把几种乐音的波形用数字表达,存于计算机中并通过数模转换器来生成乐音。专利售给Yamaha公司。乐音由一组参数控制。 4.波形表合成 把乐器的真实声音记录下来,生成各种音符 在乐器上演奏音符,采样 存于ROM中 合成。图2-9,5.MIDI系统: MPC:MIDI 接口与声音模块组合在卡上。SoundMAX Wavetable synthesizer(MIDI音乐播放器) Windows Media Player 播放 MIDI音乐 制作软件Midisoft Studio 6,MIDI文件,记录MIDI信息的标准格式文件称MIDI文件,其中包含音符、定时和多达16个通道的乐器定义以及键号、通道号、持续时间、音量和击键力度等各个音符的有关信息。定义和产生乐曲的MIDI信息和数据组存放于MIDI文件中,每个MIDI文件最多可存放16个音乐通道的信息。 音序器是一种为MIDI作曲而设计的软件或设备,可用来记录、播放及编辑MIDI事件,大多数音序器可输入输出MIDI文件。当演奏MIDI文件时,音序器将MIDI信息从文件中取出并送至合成器中。,MIDI作品,MIDI作者可以购买现成的产品,也可以自己制作。当然,开发自己的MIDI作品,除了必须拥有计算机方面的知识与设备之外,还需要具备专业音乐知识和专用工具。,数字化声音和MIDI的比较,与MIDI数据相比,数字化的声音是声音的实际表示。它代表了声音的瞬时幅度。因为它与设备无关,每次播放时它都发出相同的声音。从这一点看,它的一致性好,但代价较高,因其数据文件要求较大的存储空间。 MIDI数据是与设备有关的,即MIDI音乐文件所产生的声音与用来播放的特定的MIDI设备有关。,(3) 在不需要改变音调或降低音质的情况下,可以通过改变其速度来改变MIDI文件的长度。MIDI数据是完全可编辑的,我们可以用多种方法来处理它的每一个细节,而在处理数字化声音时,这些方法却完全用不上。 (4) 为了创建数字化声音所要求的准备与编程工作,不需要掌握许多音乐理论知识,MIDI则要求比较多。 (5) 在应用软件和系统支持方面数字化声音都有更多的选择,不管对Macintosh还是Windows平台均如此。,MIDI数据优点,(1) 文件紧凑,所占空间小,MIDI文件的大小与回放质量完全无关。通常,MIDI文件比CD质量的数字化声音文件小200到1000倍,它不占用较多的内存、外存空间和CPU资源。 (2) 在某些情况下,如果所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 硕士外语测试模拟题汇编与试题及答案
- 2025年中学教师资格《综合素质》教学反思与总结重点试题及答案
- 2025年医保知识考试题库及答案(医保目录解读与医疗保险法规执行效果试题)
- 2025年医保知识竞赛题库及答案:医保患者权益保障要点解析与案例分析
- 医疗机构危机管理与应急救援伦理观
- 区块链技术助力打造安全可靠的食品供应链
- 医疗行业中的多级供应链优化策略
- 核电辐射安全知识
- 区块链技术驱动的供应链透明度提升策略
- 护士职业发展试题及答案
- 新技术、新工艺、对提高工程质量、缩短工期、降低造价的可行性
- 金属矿床地下开采复习题及答案
- GB 5009.34-2022食品安全国家标准食品中二氧化硫的测定
- 教学课件《断裂力学》
- 慢阻肺的管理课件
- 电工基本知识培训资料课件
- 北师大版《相遇问题》公开课课件
- 邻补角、对顶角、同位角、内错角、同旁内角经典习题-一对一专用
- HP系列培训手册
- 毕业论文-原油电脱水方法与机理的研究
- 陕西省2022年普通高中学业水平考试(真题)
评论
0/150
提交评论