



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体技术基础作业引言随着多媒体信息处理技术的发展,计算机数据处理能力的增强,音频处理技术受到重视,语音文件的应用也越来越广泛。而语音文件的存储格式又是多种多样的,为了充分利用各种语音工具的特点,以及在开发软件中使用语音技术,就需要了解它们的格式,从而进行语音格式的相互转换,对语音数据进行处理和播放。在多媒体计算机中,存储声音信息的文件格式主要有WAV文件、VOC文件、MIDI文件、AIF文件、SNO文件及RMI文件等。本文对WAV文件和MIDI文件进行了分析。1 WAV文件WAV文件是微软公司(Microsoft)开发的一种声音文件格式,也是多媒体计算机获得声音最直接、最方便的方式。WAV文件是Windows所使用的标准数字音频文件,文件的拓展名是.WAV,记录了对实际声音进行采样的数据。该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几。WAV文件符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Window平台及其应用程序所广泛支持。1.1 WAV文件的文件头 表1-1 WAV文件的文件头偏移地址字节数类型内容00H 03H4字符资源交换文件标志04H07H4长整数从下个地址开始到文件尾的总字节数08H0BH4字符WAV文件标志0CH0FH4字符波形格式标志10H13H4整数过滤字节,一般为00000010H14H15H2整数格式种类,值为1,表示数据PCM律编码的数据16H17H2整数通道数,单声道为1,双声音为218H1BH4长整数采样频率1CH1FH4长整数波形数据传输速率/每秒平均字节数20H21H2整数数据的调整数/按字节计算22H23H2整数样本数据位数1.2 WAV文件的数据WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAV文件是由样本组织而成的。在单声道WAV文件中,声道0代表左声道,声道1代表右声道。再多声道WAV文件中,样本是交替出现的。WAV文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式。WAV文件在压缩后的文件体积过大,相对其他音频格式而言是一个缺点,其文件大小的计算方方式为:WAV文件每秒的存储量(字节)=取样频率(Hz)X量化位数(位)X声道数/8每一分钟WAV格式的音频文件的大小为10MB,其大小不随音量大小及清晰度的变化而变化。1.3 WAV文件的特点WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。WAV格式的另外一个潜在缺陷是在32位WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。常见的WAV文件使用PCM无压缩编码,这使WAV文件的质量极高,体积也出奇大,对于PCM WAV,恐怕也只有无损压缩的音频才能和其有相同的质量,平时我们见的什么MP3,WMA(不含 wmalossless)和WAV的质量都是差很远的。这点可以通过频谱看出,即使320kbps的MP3和WAV一比,也要自卑了。2 MIDI文件MIDI文件是存放MIDI信息的标准文件格式。MIDI音频是多媒体计算机产生声音的另一种方式,可以满足长时间音乐的需要。由于MIDI文件记录的不是声音本省,因此它比较节省时间。与WAV文件相比,MIDI文件小得多,它并不对音乐进行采样,而是将每个音符记录为一个数字,MIDI标准规定了各种音调的混合及发音,通过输出装置就可以将这些数字重新合成为音乐。2.1 MIDI文件的文件头表2-1 MIDI文件结构类型长度数据4个字节4个字节4个字节类型是的是“MThd”或“MTrk”,长度指的是出去类型和长度两部分外,其他数据占的字节数,数据描述部分是主体,我们现在来一起分析它的结构:在每个MIDI文件的开头都有如下内容,它们的十六进制代码为:“4d 54 86 64 00 00 00 06 ff ff nn nn dd dd”前四个是ASCII字符“MThd”是用来鉴别是否是MIDI文件,而随后的四个字节是指明文件头描述部分的字节数,它总是6,所以一定是“00 00 00 06”,以下是剩余部分的含义:ff ff指定MIDI的格式00 00单音轨 00 01多音轨,且同步。这是最常见的 00 02多音轨,但不同步nn nn指定轨道数实际音轨数加上一个全局的音轨dd dd指定基本时间格式类型类型1:定义一个四分音符的tick数,tick是MIDI中的最小时间单位 类型2:定义每秒中SMTPE帧的数量及每个SMTPE帧的tick2.2 MIDI文件的特点MIDI文件的优点在于:文件小,易编辑,且节省存储空间,便于储存和携带。MIDI文件不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几K或几十K,只有声音文件的千分之一左右。MIDI格式的主要限制是它缺乏重现自然声音的能力,因此不能用在需要语音的场合(这是要与WAV文件合用)。此外,MIDI只能记录标准所规定的有限种乐器的组合,而切回放质量受声卡上芯片的严重限制,难以产生真实的音乐演奏效果。近年国外流行的声卡普遍采用波表法进行音乐合成,使MIDI音乐的质量大大提高(效果接近CD音质),但波表卡仍较昂贵,在我国还未普及。结论通过对WAV文件及MIDI文件的分析与比较,我对这两种文件格式有了更深入的了解。WAV文件的应用最为广泛,音质也最好,但是压缩后体积过大,需要的存储容量比较大,不适合长时间记录。MIDI 格式记录下的不是声音本身,而是一些描述乐曲演奏过程的指令,通过合成器解释播放,它所占的空间相对WAV非常小,大约只有 1/200-1/1000,MIDI 也更加易于修改和处理,因而比较适合于电脑音乐创作。随着计算机网络的高速发展,世纪的社会信息化已使社会的经济与发展依赖于信息,多媒体是集文字、图形、图像、声音和影视动画于一体的,具有交互特性的传媒展示综合技术。它是在原有的计算机运算能力的基础上,扩充了数字信号处理器、大容量光盘、触摸屏和其它的外围设备作为系统的基本配置,以多种形式表达、存储和处理信息,充分调动人们耳闻、口述、目睹、手触等多种感觉器官与计算机交互作用,交流信息,使人与计算机的交流更加方便、更加友好。参考文献1 张力,赵文靖
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-安徽-安徽图书资料员二级(技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-安徽-安徽保育员三级(高级工)历年参考题库含答案解析
- 3-Hydroxy-2-6-dimethyl-5-methylene-heptanoyl-CoA-3-Hydroxy-2-6-dimethyl-5-methylene-heptanoyl-coenzyme-A-生命科学试剂-MCE
- 1-Aminopropan-2-ol-d6-Monoisopropanolamine-d-sub-6-sub-生命科学试剂-MCE
- 电热厂招聘面试题库:机械工程师岗位的深度探讨
- 机务工招聘面试试题与解析
- 新兴行业求职面试题库:金融、电商、市场营销等
- 高级民航飞行员面试题及答案
- 高职教育面试模拟考试
- 求职者必读:面试题公布时间及答案解析与求职策略分享
- (2025年标准)正规劳动协议书
- 2025年乡村方面的面试题及答案
- 2025年【茶艺师(高级)】模拟试题及答案
- 精神检查-课件
- 2025年“保密知识测试”考试题库及答案
- 2025年“才聚齐鲁成就未来”山东黄金集团井下技能工人招笔试高频考点题库考试试题【含答案】
- 2025至2030中国公务员培训行业调研及市场前景预测评估报告
- 墙体绘画施工合同(2025版)
- 神州数码在线测评题答案
- 科室随访系统-功能清单-DC20180129
- 硕士研究生与导师关系的研究综述
评论
0/150
提交评论