




已阅读5页,还剩66页未读, 继续免费阅读
(计算机应用技术专业论文)数字化音频资料版权管理系统设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 数字资源建设是目前国内高校数字图书馆建设中的重点,而自建特色资源则 是图书馆数字资源建设中的一项重要内容。目前,在适用于图书馆图书、学位论 文等纸介质数字加工处理方面已有方正a p a b i 等数字图书馆系统,提供了扫描、 识别、标引描述、发布、借阅和版权保护全方位的功能,但在音视频资源数字化 加工平台和版权保护方面还缺乏类似的系统。 本文针对天津大学图书馆在昕音阅览室音频资料数字化过程中遇到的问题, 对数字音频、音频元数据和数字版权管理等相关标准和技术进行研究,在此基础 上,进行了音频资料数字化加工发布软件的设计和实现,并利用微软删跚流媒 体数字版权管理技术对上网发布的数字音频资料进行了数字版权保护,初步解决 了图书馆音频资料数字化过程中遇到的问题。 虽然本文的工作是针对音频资源进行的,由于音视频资源固有的相似性,本 文所开发的软件可以很方便的扩展到对视频资源加工处理。同时,在软件的设计 和开发中,遵循了c a l i s 制定的相关标准,因此,本文所作的工作对于中国高校 数字图书馆的音视频资源建设具有普遍适用性,具有一定的推广价值。 关键词:音频数字化数字版权管理1 | m i i mw m e n c o d e r t h ec o n s t r u c t i o no fd i g i t a lr e s o u r c e si st h em a i nw o r ki nt h ec o n s t r u c t i o no f u n i v e r s i t yd i g i t a ll i b r a r ya n dt h es e l f - b u i l d e dr e s o n r c e sa r ea l s os o m ei m p o r t a n tp a r t s o fd i g i t a lr g $ o u l s n o w , t h e r ea l es o m ed i g i t a ll i b r a r yc o n s t r u c t i n gp l a t f o r m s ,s u c h 鹊f o u n d e ra p a b ia n de t e h a v eb e e nd e v e l o p e di n t od e a l i n gw i t hp a p e rm e d i a r e s o u l l 弛sd i g i t i z a t i o n t h e s ep l a t f o r m sp r o v i d ea l lt h ef u n c t i o n ss u c h 觞b o o ks c a n 、 o c r 、s u b j e c t si n d e x 、d e s c r i p t i o n s 、e - p u b l a t i o n 、e - c y c l e l a t i o na n dd i g i t a lr i g h t s m a n a g e m e n t s ,b u tt h e r ei sn oa n yp l a t f o r mf o rd e a l i n gw i t ha u d i oa n dv i d e or e s o u r c e s d i g i t i z a t i o na n dd i g i t a lr i g h t sm a n a g e m e n t t os o l v et h ep r o b l e m so ft h ea u d i or e s o u r c ed i g i t i z a t i o no ft i a n j i nu n i v e r s i t y l i b r a r y , w ed e s i g n e dt h ea u d i od i g i t i z a t i o np l a t f o r mb a s e do nm i c r o s o f tw i n d o w s m e d i at e c h n o l o g i e sa n dt h er e s e a r c h e so fs o m es t a n d a r d sa b o u td i g i t a la u d i o 、a u d i o m e t a d a t a ,d i g i t a lr i g h t sm a n a g e m e n t ,a n db yu s i n gm i c r o s o f tw m r mt e c h n o l o g yw e p r o t e c tt h ed i g i t a la u d i or e s o u r o g $ i ns e v e r a lp l t t e m s a l t h o u g ha l lo ft h er e s e a r e h si nt h i sp a p e ra r eb a s e do na u d i ol e s o u r c 七$ ,t h e a u d i od i g i t i z a t i o np l a t f o r ms o f t w a r ec a l lb ee a s yd e v e l o p e dt od e a lw i t hv i d e o r e s o u r c e sb e c a u s ev i d e oc a l lb eh a n d l e di nas i m i l a rw a y t h es o f t w a r ea l s of o l l o w s t h es t a n d a r d so fc a l i s ,s ot h er e s e a r e h so ft h i sp a p e ra r ea p p l i c a b l ef o rt h ea u d i o r e s o n r c 2 sc o n s t r u c t i o no f u n i v e r s i t yd i g i t a ll i b r a r y k e yw o r d s :a u d i o d i g i t i z a t i o n ,d i g i t a lr i g h t sm a n a g e m e n t ,w m r m , w m e n c o d e r 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得墨盗盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:1 魄 签字日期: 。z 年月加日 学位论文版权使用授权书 本学位论文作者完全了解叁星盘茎有关保留,使用学位论文的规定。 特授权盘鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:橛 导师签名:锄礞 签字日期:c 跏年f 月如日 签字目期;扣。三年石月文。日 第一章绪论 1 1 论文研究背景 1 1 1c a l i s 与c a d l i s 第一章绪论 c a l i s ( c h i n aa c a d e m i cl i b r a r y i n f o r m a t i o ns y s t e m ,中国高等教育文 献保障系统) 是经国务院批准的我国高等教育“2 1 1 工程”、“九五”、“十五” 总体规划中三个公共服务体系之一。c a l i s 的宗旨是,在教育部的领导下,把国 家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源 整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实 现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高 等教育服务。 c a d l i s ( c h i n aa c a d e m i cd i g i t a ll i b r a r yi n f o r m a t i o ns y s t e m ,中国高 等教育数字图书馆) 是c a l i s “十五”期间的主要建设任务,是高等教育数字资 源与服务的分布式共享与保障的基础设施,它以系统化、数字化的学术信息资源 为基础,由多个分布式、大规模、可互操作的异构的多媒体数字图书馆群组成, 向高校读者提供高效、一站式、全方位的综合文献内容服务、教学与科研辅助支 持服务以及其他配套服务。 c a l i s 管理中心在c a d l i s 项目建设过程中十分重视相关标准规范的制定,提 出了一系列数字图书馆核心标准规范的分析报告“1 ,包括数字资源加工标准规范 分析报告、数字资源唯一标识符现状发展分析及解析机制研究、古文献、地方志、 家谱、期刊论文、会议论文、学位论文、网络资源、电子图书资源、音频资源等 多种专门数字对象的元数据分析报告,并初步建立了数字图书馆标准规范的开放 建设与交流机制。 制定和遵循这些标准规范对于保证c a d l i s 建设过程中所建立的资源和服务 的可使用性、互操作性和可持续性具有重要的现实意义。可使用性,指所建立的 资源或服务能够在广泛的网络环境和复杂的技术条件下被用户方便地使用。互操 作性,指所建立的资源或服务能够在更大系统范围上、能与其它资源或服务方便、 有效的交换、转换、整合,从而为用户提供逻辑上集成的服务。可持续性,指所 建立的资源或服务能够在变化的技术与运行机制下长期保存和使用,能够被集成 入未来的资源与服务环境。 第一章绪论 1 1 2 天津大学数字图书馆建设 所谓数字图书馆,就是拥有多种媒体、内容丰富的数字化信息资源,是一种 能为读者方便、快捷地提供信息的服务机制,数字图书馆是一个完整的系统,它 由分布的、大规模和有组织的数据库和知识库组成,用户可以通过统一的检索界 面,对系统内的数据库和知识库进行一致性的访问,并获取自己所需的最终信息 资料。 天津大学图书馆和国内其他高校图书馆一样,从上个世纪9 0 年代中期开始 进行数字化图书馆建设,首先完成了馆藏书目数据的回溯建库和图书馆自动化管 理系统的引进,全面实现了图书、期刊等图书资料的采、编、流、阅的自动化管 理;完成了综合布线、高速网络、服务器、海量存储、应用系统等i t 基础设施 建设;引进了维普、万方、c n k i 、i e e e 、e l 、e l s e v i e r 、j o h nw i l e y 、s p r i n g e r 等中外文电子期刊、学术学位论文全文文摘数据库,初步建立了覆盖各学科的 电子资源;引进清华同方t p i 数字图书馆建设与管理平台,并开始利用此软件平 台建设具有天津大学学科特色的自建特色数据库,对包括论文、图书、图片、报 纸、网络信息等多种文献类型进行数字化加工、数据库建设和w e b 发布等工作。 目前已建设了高等教育信息专题数据库、名优摩托车车型展示库、中国建筑参考 图集、中国历代建筑画作品数据库、中国宗教建筑图片库、纳米技术信息库、天 津大学博硕士论文数据库、中国古建筑图片数据库、教学参考书、摩托车与内燃 机技术剪报信息数据库等十余个自建特色数据库,其中环境科学与工程学科信息 数据库、中国建筑文化特色数据库、摩托车信息特色资源数据库三个特色数据库 纳入了c a l i s “十五”建设子项目全国高校专题特色数据库建设。下一步图 书馆将加大对音视频资料、教学课件等多媒体资源的开发与利用,更好的服务于 高校教学科研工作的开展,为推动天津乃至我国的国民经济建设提供智力支持。 1 1 3 图书馆音频资料数字化现状与问题 音频资料是主要以人的听觉器官来感知的信息资源。按信息存储载体来分, 有一般的录音载体资源( 即以唱片、录音带、c d 等为存储载体的音频资料) 和 数字化的网络资源。按信息内容来分,有以语言为主的语言类资源和以音乐为主 的音乐类资源。在本文中音频资料主要指的是天津大学图书馆昕音阅览室收藏的 以语言教学为目的的各类外语学习资料,这些音频资料大多数以盒式录音带为载 体,也有一部分为c d 。目前天津大学图书馆听音室收藏有英、日、法、德、俄 等各类语言磁带2 2 5 0 余种、6 6 0 0 多盒。 天津大学图书馆听音阅览室室面向读者开展听音服务和磁带复制服务。听音 第一章绪论 阅览室内配有5 0 余套听音设备供广大读者在此使用,这种阅览方式限定了读者 只能本室阅览,平均每日仍有两百多读者来此使用各种音频资料,同时还有大量 的读者自带空白磁带来此翻录音频资料。但这种服务模式本身固有的一些问题导 致现有的服务越来越难以适应学校和图书馆的发展与读者的需求。一方面,大量 的音频资源频繁借还,损坏比较严重,同时一些深受读者欢迎的资料由于所收藏 资料数量的限制不能多人同时阅览,使用效率相对降低。另一方面,图书馆收藏 的音频资料在以每年7 0 0 多盒的速度增加,不仅要占用大量存储空间,而且由于 磁带受外界湿度温度影响很大导致维护图书馆所收藏音频资料难度越来越大。同 时有很多读者希望图书馆能够提供可直接拷贝到m p 3 播放器中使用的听音资料。 因此天津大学图书馆开始对音频资料数字化建设工作进行探索研究,以期能够解 决在图书馆音频资料建设和读者服务方面遇到的问题。 目前,主要进行的工作是将盒式磁带的模拟信号转换成可在计算机上播放的 数字信号。对音频资料进行数字化对于图书馆来说是个新课题,有一些新的问题 需要解决:一是模拟信号转换为数字信号采取何种编码的问题,也就是大家常说 的采用何种格式、如何对模拟信号进行采集编码的问题;二是以什么为单位对数 字化后的内容进行著录描述,应该著录描述哪些项目;三是经过著录的数字化内 容的使用问题,如何保障数字内容版权人的权益,使得图书馆不会陷入到版权纠 纷之中去。 1 2 本文的主要工作 本文是一篇应用研究论文,针对图书馆在音频资料数字化过程中遇到的问 题,在对相关标准和技术进行研究的基础上,完成了音频资料数字化与数字版权 管理软件的设计和实现,初步解决了图书馆音频资料数字化过程中遇到的问题。 具体来说,作者做了以下工作: 1 、音频资料数字化相关标准的研究 要完成盒式磁带的模拟音频信号到数字音频文件的数字化加工过程,涉及到 模拟音频信号的取样、量化和编码,采样频率、量化指标与编码压缩技术、文件 保存格式的选择,以及对保存的数字音频文件描述著录标准( 元数据) 的选择、 描述著录项目的确定。 2 、数字版权管理技术 音频资源经过数字化加工以后,只有通过网络发布出来,让广大读者使用, 才能达到我们进行数字化资源建设的目的。同时,我们还必须采用适当的技术来 保障音频资源内容提供者、出版者的权益,避免陷入版权纠纷,这个技术就是数 第一章绪论 字版权管理技术。文中对数字版权管理技术进行了简要介绍,不介绍比较了 m i c r o s o f t 和r e a l n e t w o r k s 这两家公司用于音视频资料版权管理的删r m 技术和 h e l i xd r m 技术。 3 、微软w i n d o w sm e d i a 媒体编码与版权管理技术研究 w i n d o w sm e d i a 系列技术是微软公司在音视频流媒体制作、分发、播放、版 权管理方面提供的整体解决方案。目前的版本号为9 。w i n d o w sm e d i a9 系列主 要包含媒体服务( w i n d o w s m e d i a s e r v i c e s9 ) 、音视频编码( w i n d o w s m e d i a a u d i o a n dv i d e o9 ) 、播放器( w i n d o w sm e d i ap l a y e r9 ) 、编码器( w i n d o w sm e d i a e n c o d e r9 ) 、w i n d o w s 媒体数字版权管理( w i n d o w sm e d i ad i g i t a lr i g h t s m a n a g e m e n t9 ) 和系列软件开发套件( w i n d o w sm e d i a9s e r i e ss d k ) 组成。本 文后继开发就是基于w i n d o w sm e d i ae n c o d e r9s d k 和w i n d o w sm e d i ar i g h t s m a n a g e m e n t9s d k ,这两部分是本课题研究的重点内容。 4 、软件结构设计与具体实现 在对相关技术和标准研究的基础上,本文完成了数字化音频资料版权管理系 统的功能设计、数据库设计,利用微软w i n d o w sm e d i a 系列s d k 完成了关键模块 和关键技术的实现,解决了图书馆在音频资料数字化加工过程中遇到的问题。 第二章音频资料数字化加工与资源描述 第二章音频资料数字化加工与资源描述 要完成盒式磁带的模拟音频信号到数字音频文件的数字化加工过程,涉及到 模拟音频信号的取样、量化和编码,采样频率、量化指标与编码压缩技术、文件 保存格式的选择,以及对保存的数字音频文件描述著录标准( 元数据) 的选择、 描述著录项目的确定。 2 1 音频数字化加工技术 2 1 1 音频数字化概述 根据声波的特征,可把音频信息分类为规则音频和不规则声音。规则音频是 一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波,声波有三个 重要参数:频率、幅度和相位。而规则音频又可以分为语音、音乐和音效。本文 的研究对象就是语音信号。 由于音频信号是一种连续变化的模拟信号,而计算机只能处理和记录二进制 的数字信号,因此,由自然音源而得的音频信号必须经过一定的变化和处理,变 成二进制数据后才能送到计算机进行再编辑和存贮,这就是音频数字化。对音频 信号进行数字化处理有必不可少的3 个步骤:采样、量化和编码。当把模拟音频 信号转化为数字音频信号时,需要每隔一个时间间隔在模拟信号波形上取一个幅 度值,称之为采样,采样的时间间隔称为采样周期。在数字音频中,把采样得到 的表示声波强弱的模拟电压用数字表示。模拟电压的幅值即便在某一电平范围 内,仍然可以有无穷多个,而用数字表示音频幅度时,只能把无穷多个电压幅度 用有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称为量化。 经过量化,模拟音频信号转换为一组离散的数值,这一组数值到底代表的是何内 容,需要按照一定的规则组织起来,这就是编码。 下面是几个关于数字音频的基本特征参数口l : 采样率( 取样频率) :简单地说就是通过波形采样的方法记录1 秒钟长度的 声音,需要多少个数据。4 4 k t t z 采样率的声音就是要花费4 4 0 0 0 个数据来描述1 秒钟的声音波形。原则上采样率越高,声音的质量越好。 量化级( 采样位数) :是表示每个采样点用多少位二进制数字来表示,间接 反映了可表示波形纵向的层次,量化位数为8 ,相当于可表现出2 5 6 种层次,如 第二章音频资料数字化加工与资源描述 量化位数为1 6 ,相当于可表现出6 5 5 3 6 个层次。简单地说就是描述声音波形的 数据是多少位的二进制数据,通常用b i t 做单位,如1 6 b i t 、2 4 b i t 。1 6 b i t 量化 级记录声音的数据是用1 6 位的二进制数,比如标准c d 音乐的质量就是1 6 b i t 、 4 4 1 l 【 i z 采样。 声道数:包括单声道、立体声、四声道环绕、5 1 声道等。声道数量越多, 数据量也越大,一般声音质量也越好。 压缩率:通常指音乐文件压缩前和压缩后大小的比值,用来简单描述数字声 音的压缩效率。 比特率:是另一种数字音乐压缩效率的参考性指标,表示记录音频数据每秒 钟所需要的平均比特值( 比特是电脑中最小的数据单位,指一个o 或者1 的数) , 通常我们使用k b p s 作为单位。常用的接近c d 音质的m p 3 数字音乐的比特率大约 是1 1 2 k b p s 1 2 8 k b p s 。 取样频率越高,采样位数越多,声道数越多,压缩率越低,得到的数字化声 音质量越高,相应的信息量也越大。 根据声音的频带,通常把声音的质量分为5 个等级:电话、调幅a m 广播、 调频f m 、光盘c d 、数字录音带d a t 。它们使用的采样频率、样本精度、通道数 和比特率均不同。 对于我们要数字化的音频资料录音带来说,录音内容主要是外语语声,声音 质量与调频f m 广播的清晰度差不多,因此没有必要选择太高的采样频率和样本 精度。 2 1 2 数字音频文件格式 音频资源的文件格式用来提供计算机平台之间的应用和交换的兼容性,其中 除了音频数据外有些还包括控制数据,如很多文件格式在文件头部描述了文件的 取样速率、比特率、信道的数量和压缩的类型等信息。目前流行的音频文件格式 有w a v 、m p 3 、r e a lm e d i a 、w i n d o w sm e d i a 等格式。 2 1 2 1w a v 格式 , w a y 是m i c r o s o f t 开发的一种波形声音文件,符合r i f f ( r e s o u r c e s i n t e r c h a n g ef i l ef o r m a t ,资源互换文件格式) 文件规范,是事实上的通用音 频格式,几乎所有的音频处理软件和编辑软件都支持w a y 格式。w a v 格式般对 音频数据并不进行压缩处理,所以要占用很大的存储空间( 1 分钟的c d 音质w a v 文件需要1 0 m 字节) ,不适于在网络上传播。 第二章音频资料数字化加工与资源描述 2 1 2 2m p 3 格式 m p 3 ( m p e ga u d i ol a y e r - 3 ) 是第一个实用的有损音频压缩编码。在m p 3 出 现之前,一般的音频编码即使用有损压缩方式也只能达到4 :1 的压缩比。而m p 3 利用知觉音频编码技术可以实现1 2 :1 的压缩比例,同时又能保持相当不错的音 质,这使得m p 3 迅速地流行起来。后来又出现了v b r ( v a r i a n tb i t r a t e ,可变 比特率) 方式编码的肝3 ,这种编码方式可以根据编码的内容动态地选择合适的 比特率,在保证音质的同时又照顾了文件的大小。m p 3 具有压缩程度高( 1 分钟 c d 音质音乐一般需要l m 字节) 、音质好的特点,是目前最为流行的一种音乐文 件。但是现在m p 3 已经逐渐失去性能上的优势,许多新一代的编码技术都已经能 在相同的比特率下提供比m p 3 优越得多的音质。 2 1 2 3r e a lm e d i a 格式 r e a lm e d i a 格式是r e a ln e t w o r k s 公司开发的用于网络上实时数字音频流技 术的文件格式,其特点是可以在非常低的带宽下( 低达2 8 8 k b p s ) 向用户提供 足够好的音质。由于它的面向目标是实时的网上传播,所以在高保真方面是远远 不如m p 3 ,但在只需要低保真的网络传播方面却无人能及。后来r e a ln e t w o r k s 通过与s o n y 公司合作,利用s o n y 的a t r a c ( a d a p t i v et r a n s f o r ma c o u s t i c c o d i n g ,自适应转换声学编码) 技术实现高比特率的高保真压缩。由于r e a lm e d i a 的用途是在线聆听,并不适于编辑,所以相应的处理软件并不多。使用r e a l n e t w o r k s 自己的r e a lm e d i ae d it o r 软件可以直接对r e a lm e d i a 格式音频进行 剪辑操作。要播放r e a lm e d i a 音频,需要使用r e a lp l a y e r 软件。 2 1 2 4w i n d o w sm e d i a 格式 w i n d o w sm e d i a 音频格式是微软公司针对r e a l 公司的r e a lm e d i a 而开发的 新一代网上流式数字音频压缩技术,它本质上跟r e a lm e d i a 是相同的。w i n d o w s m e d i a 音频是目前唯一一个能提供全部种类音频压缩技术( 无失真、有失真、语 音) 的解决方案,同时兼顾了保真度和网络传输需求,所以具有一定的先进性。 目前w i n d o w sm e d i a 还是处于推广期,播放器和编码器可以免费下载,服务器端 捆绑在w i n d o w s 服务器版中,不另外收费。由于微软的影响力,这种音频格式现 在正获得越来越多的支持,并且有越来越多的网上音乐商店开始使用w i n d o w s m e d i a 格式来发布音乐。 当然,在网络上还有其他一些音频的文件格式,但由于各种原因,那些格式 的流行程度和应用范围目前是有限的。 第二章音频资料数字化加工与资源描述 2 1 3 流媒体技术和流式音频文件格式 2 1 3 i 流媒体技术 流媒体指在网络中使用流式传输技术的连续时基媒体,如:音频、视频或多 媒体文件“1 。流式传输技术相对于传统下载方式的优点在于采用这种方式时,用 户不必等到整个文件全部下载完毕,而只需经过几秒或几十秒的启动延时即可进 行播放和观看。此时多媒体文件的剩余部分将在后台从服务器内继续下载。流媒 体技术还包括对于流媒体类型的识别。这主要是通过m i m e ( m u l t i p u r p o s e i n t e r n e tm a i le x t e n s i o n s ,多用途i n t e r n e t 自g 件扩展) 完成的。m i m e 不仅用于 电子邮件,还能用来标记在i n t e r n e t 上传输的任何文件类型。通过它,w e b 服务 器和w e b 浏览器才可以识别流媒体并进行相应的处理。浏览器通过m i m e 来识别流 媒体的类型,并调用相应的程序或p l u g i n 来处理。 2 1 3 2 流式音频文件格式 目前市场上主流的流媒体技术有三种,分别是r e a ln e t w o r k s 公司的 r e a l m e d i a 、m i c r o s o f t 的w i n d o w sm e d i a 和a p p l e 公司的q u i c k t i m e 。这三家的 技术都有自己的专利算法、专利文件格式甚至专利传输控制协议这三个关键要素 在里面。 r e a lm e d i a :是r e a l n e t w o r k s 公司开发的一种新型流式音视频文件格式, 它包括:r e a l a u d i o 、r e a l v i d e o 和r e a l f l a s h 。r e a l a u d i o 只需要很小的带宽就 可以传输接近c d 音质的音频数据,其标称c d 音质所需的带宽为6 4 k b p s 。支持 r t s p 协议和s m i l 。具有一定的交互能力。r e a l n e t w o r k s 免费提供了基本功能的 编码器,高级功能的版本则需要购买。r e a lm e d i a 服务器则是收费的,并且并 发流数越多费用越高。r e a l n e t w o r k s 开发了h e l i xd r m 支持数字版权管理。 r e a l m e d i a 发展的时间比较长,因此具有很多先进的设计,例如,s c a l a b l ev i d e o t e c h n o l o g y 可伸缩视频技术可以根据用户电脑速度和连接质量而自动调整媒体 的播放质量。t w o - p a s se n c o d i n g 两次编码技术可通过对媒体内容进行预扫描, 再根据扫描的结果来编码从而提高编码质量。特别是s u r e s t r e a m 自适应流技术, 可通过一个编码流自动提供适合不同带宽用户的流播放。 w i n d o w sm e d i a 的流媒体格式:a s f ( a d v a n c e ds t r e a m i n gf o r m a t ) 是w i n d o w s m e d i a 的流媒体格式,这种格式是微软公司开发出来的,采用的编码方式是 m i c r o s o f tm p e g - 4v 3 、m i c r o s o f tm p e c - - 4v 2 、m i c r o s o f tm p e g - 4v 1 编码,这 也是遵循m p e g 一4 标准的编码方式。2 0 0 3 年微软发布了w i n d o w ss e r v e r2 0 0 3 系 列服务器产品,其集成的w i n d o w sm e d i a9 技术与上一版本相比有了质的飞跃, 第二章音频资料数字化加工与资源描述 可以说各项指标赶上甚至超过了r e a l n e t w o r k s 的r e a lm e d i a 技术:支持r t s p 协议和s m i l ,具有一定的交互能力;支持w m r m 数字版权管理;提供免费的编码 器和开发包;w i n d o w sm e d i a 服务器捆绑在w i n d o w s 服务器中免费提供,支持多 点广播、可分配用户带宽;具体特色的协议翻转功能可以利用h t t p 协议透过防 火墙实现媒体文件的流式传输。随着w i n d o w sm e d i a 技术的更加成熟,已经有越 来越多的大型在线音乐网站开始使用w i n d o w sm e d i a 技术来提供服务。 q u i c k t i m e :苹果公司的q u i c k t i m e 能支持实时播放的格式为m o v ,可以在苹 果公司的m a co s 上使用,也可以在w i n d o w s 平台上使用。q u i c k t i m es t r e a m i n g s e r v e r 是免费的,支持r t s p 协议和s m i l ,具有非常好的交互能力,但是 q u i c k t i m e 编码工具价格昂贵,没有自己的d r m 技术,需要由第三方供应商提供 d r m 技术。 2 1 4 数字音频格式分析 从前文的介绍来看,音频文件种类繁多,我们可以对这些格式进行适当的分 类以利于我们分析。 按应用的范围来划分,应用最广泛的格式包括m p 3 格式、r e a l m e d i a ( 此类 格式有以下几个形式:r a 、r m 、r a m 等,主要应用于网络广播类流媒体) 、w i n d o w s m e d i a ( 包括a s f 、a s x 、w m a 、w a x ) 这三种格式。其他格式,如o u i c k t i m e 、w a v 格式、杜比a c - 3 、m i d i 、v q f 、o g gv o r b i s 、m p 3 p r o 、m p 4 、m p e g - 2a a c 格式等 相对使用较少。对于我们的选择来说,还是应该从广泛使用的三种格式中选择一 种,这也是c a l i s 推荐的三种格式。 按播放使用方式来划分,主要分为下载格式和流媒体格式。c a li s 推荐的三 种格式中,m p 3 格式是下载格式,需要先下载后播放。w i n d o w sm e d i a 和r e a l m e d i a 都足既可以下载后播放又可以以流媒体格式播放。相比之下,服务器在流式传输 模式下,可以提供更高的并发连接数,具有更好的服务性能,是我们应该优先考 虑选择的。 按压缩情况划分,w a v 格式未加以压缩,其它格式均是压缩格式。 从上述分析来看,我们应该从r e a lm e d i a 和w i n d o w sm e d i a 中选择一种, 从开发和使用成本来考虑,我们选择w i n d o w sm e d i a 。这样的选择也兼顾到了读 者希望能将下载的音频资料拷贝到m p 3 播放器中使用的需求,因为市场上销售的 m p 3 播放器几乎1 0 0 的支持w m a 格式的音频文件,而能够支持r e a lm e d i a 格式 的m p 3 播放器则很罕见。 第二章音频资料数字化加工与资源描述 2 2 数字音频资源描述规范( 音频元数据标准) 当我们完成相当数量的音频资料数字化后,需要一个适当的数据库以跟踪描 述这些数字音频资源。在这个数据库中为每个数字音频文件包含一个单独的记 录,并且每一个记录包含关于这个数字音频文件的信息( 这些信息就是音频元数 据) 。 2 2 5 元数据概述 元数据通常被称为“关于数据的数据”。但是,这个定义过于概念化,不够 严密。因此,一些组织给出了关于元数据的更详细的定义。 i e e e ( t h ei n s t i t u t eo fe l e c t r i c a la n de l e c t r o n i c se n g i n e e r s ,电气 和电子工程师委员会) 的m s s & t c ( m a s ss t o r a g es y s t e m sa n dt e c h n o l o g y c o m m i t t e e ,海量存储系统和技术委员会) 在1 9 9 3 年8 月召开的元数据研讨会上, 提出了一个元数据的比较系统的定义:“元数据是关于存储的信息实体、存储的 管理以及存储和实体的使用信息。信息实体包括语义或信息内容、存储的结构映 射、要素的类型和编码、实体之间的关系、格式、结构和类型、相关的数据、导 出派生信息;存储的管理包括定位、访问时间和访问方法;存储和实体的使用 包括限制、用法和历史记录。” 可见,元数据本质上也是一种数据,它是对数据本身的补充说明,它主要用 来描述任何i n t e r n e t 数据和资源,促进i n t e r n e t 信息资源的组织和发现。具体 用途包括以下方面: ( 1 ) 描述i n t e r n e t 数据内容,例如作者、标题、摘要等信息; ( 2 ) 使i n t e r n e t 数据便于搜索; ( 3 ) 允许用户决定某些数据是否为他们所需要的数据; ( 4 ) 防止特定用户( 如小孩) 存取某些数据,例如暴力、色情等信息; ( 5 ) 让用户可以重新得到或者使用数据的另份拷贝,例如指出数据的存 储地址; ( 6 ) 知道怎样“读懂”数据,例如说明数据的格式、编码方式、解密方法 等; ( 7 ) 帮助决定利用什么样的数据实例( 如果提供多种格式) ; ( 8 ) 给出影响数据使用的一些信息,例如数据使用的法律条件、数据使用 的范围、数据使用的时限等等; ( 9 ) 给出数据的历史过程,例如数据的最初来源、以后的演变历程; ( 1 0 ) 给出数据的联系信息,例如给出数据拥有者的e m a i l : 第二章音频资料数字化加工与资源描述 ( 1 1 ) 给出与其它资源的关系,例如给出版本数据的连接、使用本数据所需 的其它数据和程序; ( 1 2 ) 对数据管理的控制等等; ( 1 3 ) 对某些缺少文本的数据( 如图像和声音) 进行文字说明。 2 2 6 常用元数据标准5 l 元数据在i n t e r n e t 领域里起到举足轻重的作用,如果各资源信息提供者都 按照某种元数据标准组织、管理其数据,将有效地解决查找网络资源这一问题, 真正实现i n t e r n e t 信息资源共享。因此,许多国际标准化组织都致力于制定相 关领域的元数据规范。目前,针对不同的对象和应用,出现了很多的元数据标准。 下面,简要介绍一下对于图书馆资源建设影响较大的一些元数据规范。 2 2 6 1m a r c m a r c ( m a c h i n e r e a d a b l ec a t a l o g u e ,机读目录) 广泛用于图书馆书目记录 数据,是目前在图书馆描述、存储、交换、处理以及检索信息的集成。m a r c 格 式遵循i s 0 2 7 0 9 规定,记录的总体结构有以下特点:可变格式可变长字段的记录 格式;采用目次方式;每天m a r c 记录分为3 个区( 头标区、目次区、数据区) 。 为了适应网络资源描述的需要,m a r c 在原有的基础上增加5 3 8 字段( 系统需求 和存取注释) 、5 1 6 字段( 计算机文件类型或数据注释) 、2 5 6 字段( 计算机文 件特征) 以及8 5 6 字段( 电子地址和存取) 。为了促进m a r c 在网络环境中得到 进一步的应用,美国国会图书馆正在研究制定m a r c 在x m l 环境下的应用方法。 2 2 6 2d u b l i nc o m d u b l i nc o r e 是d u b l i nc o r ee l e m e n ts e t ( 都柏林核心元素集) 的简称,它 是o c l c ( o n l i n ec o m p u t e rl i b r a r yc e n t e r ) 等组织于1 9 9 5 年制定的一种 i n t e r n e t 网络资源描述规范,由1 5 个元数据标记元素组成。d c 简练、易于理解、 可扩展并能与其他元数据形式进行衔接,能较好的解决网络资源的发现、控制和 管理问题,迅速成为良好的网络资源描述元数据集。c a l i s 制定的音频资料元数 据标准就是依据o u b li nc o r e 制定的。后面我们对其进行详细介绍。 2 2 6 3r d f r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架) 是w 3 c 主持开发 的,一个能对结构化元数据进行编码、交换及再利用的体系框架。它本身只有很 少的语义定义元素,但通过对通常意义上的语义、语法和结构的支持,可使不同 第二章音频资料数字化加工与资源描述 的用户和团体在这一框架下定义他们自己的元数据元素,从而提供了各种不同的 元数据体系之间的互操作性。r d f 采用x m l 作为交换和处理元数据的通用语法结 构体系,提供了一种强有力的可转换的句法模式。 r d f 利用了x m l 严谨的结构,避免了语义上的二义性,从而为元数据的编码、 交换及机器自动处理提供了一个良好的容器。r d f 通过一个简单而又功能强大的 数据模式,支持在各个不同元数据语言之间的模块化的互操作能力。 符合r d f 规范的元数据可以有许多应用,例如: ( 1 ) 应用于资源发现系统,以提高搜索引擎的性能; ( 2 ) 应用于站点目录,以揭示某个站点的内容以及与此内容相关的站点、页 面以及数字图书馆; ( 3 ) 被智能软件代理应用,以促进知识的共享与互换; ( 4 ) 对内容进行定级评价,以保护儿童或者使自己的私有权力不被侵犯; ( 5 ) 串引一系列w e b 页面,使这些页面能够成为合乎逻辑的一篇文章; ( 6 ) 描述w e b 页面的知识产权等。r d f 和数字签名将成为创建“w e b 信任”的 关键技术,应用于电子商务、网际合作等领域。 2 2 7 都柏林核心( d u b l i nc o r e ) 嘲 d u b l i nc o r e 元数据标准,由于其简单、灵活、可扩展等特点,得到广泛的 认可与应用。下面详细介绍o u b li nc o r e 元数据标准。 d u b l i nc o r e 元数据标准包含1 5 个基本元素,依据内容和范围可分为三组, 见表2 一l : 表2 - 1d u b li nc o r e 元数据基本元素 资源内容描述类知识产权描述类外部属性描述类 t i t i e c r e a t o r ( a u t h o r ) d a t e s u b j e c t p u b l i s h e rr e s o u r c et y p e d e s c r i p t i o n c o n t r i b u t o r s f o r m a t s o u r c e r 曲t s r e s o u r c ei d e n t i f i e r l a n g u a g e r e l a t i o n ( t oo t h e rr e s o u r c e s ) c o v e r a g e ( s p a t i a lt e m p o r a l ) 以下详细解释各个元素: 1 、标题t i t l e 标识符:t i t l e 定义:赋予资源的名称 第二章音频资料数字化加工与资源描述 注释:通常指资源对象正式发布的名称。 2 、创建者c r e a t o r 标识符:c r e a t o r 定义:创建资源内容的主要责任者。 注释:创建者可以是个人、组织或服务,例如文章作者等。通常用创建者的 名字来标识这一实体。 3 、主题及关键词s u b j e c t 标识符:s u b j e c t 定义:有关资源内容的主题描述。 注释:主题及关键词通常是描述资源内容的关键词、短语或分类号。建议最 好采用受控词表或规范的分类体系。 4 、描述d e s c r i p t i o n 标识符:d e s c r i p t i o n 定义:对资源内容的描述。 注释:描述元素可以包括但不限于以下内容:摘要、目录、以图形来表示内 容的引用或者与内容有关的则由文本描述。 5 、出版者p u b li s h e r 标识符:p u b l i s h e r 定义:使资源成为可以取得和利用状态的责任者。 注释:出版者可以是个人、组织或服务,例如出版社等。通常用出版者的名 字来标识这一实体。 6 、其他责任者c o n t r i b u t o r 标识符:c o n t r i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年口腔科常见器械使用与消毒考试答案及解析
- 2025年外科手术规范操作流程考核答案及解析
- 2025年全科医学家庭医生服务水平评估试卷答案及解析
- 2025年麻醉科术前术中术后管理考试答案及解析
- 2025年急救学常见急症处理技能模拟考试答案及解析
- 2025年整形美容外科美容整形手术术前术后护理试题答案及解析
- 2025山西医科大学第二医院南院(第三批)招聘合同制人员464人笔试模拟试题及答案解析
- 2025年老年医学多病共存处理考核答案及解析
- 2025年口腔医学器械使用技能考察答案及解析
- 2026年国网内蒙古东部电力有限公司提前批校园招聘笔试模拟试题及答案解析
- 浙教版七年级下册科学-优化训练-第二章单元测试卷
- 民办学校未来发展策划与实施方案
- 临床课题申报书范例范文
- 山体.施工合同样本
- 肺结核课件培训
- 2025年上海市大数据中心工作人员公开招聘考试参考题库及答案解析
- 2025年广东省东莞市公安辅警招聘知识考试题(含答案)
- 个体诊所管理暂行办法
- 志愿服务条例知识培训课件
- 破圈与共生:2025中国社交媒体全球化发展报告
- 2025年社保理赔考试题目及答案
评论
0/150
提交评论