




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
我国元数据标准的研究和利用元数据标准(Metadata Standards)描述某类资源的具体对象时所有规则的集合。不同类型的资源可能有不同的元数据标准,一般包括完整描述一个具体对象所需的数据项集合、各数据项语义定义、著录规则和计算机应用时的语法规定。1.元数据的基本意义 Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具; 元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 2.元数据应用环境Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。 (2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 Metadata在不同领域的应用 根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections;文献资料:MARC(with 856 Field),Dublic Core;人文科学:TEI Header;社会科学数据集:ICPSR SGML Codebook;博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core;政府信息:GILS;地理空间信息:FGDC/CSDGM;数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images;档案库与资源集合:EAD;技术报告:RFC 1807;连续图像:MPEG-7;Metadata格式的应用程度不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准; 在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经成为政府信息描述标准,并在世界若干国家得到相当程度的应用,与此类似的还有地理空间信息处理的FGDC/CSDGM; 但在某些领域,由于技术的迅速发展变化,仍然存在多个方案竞争,典型的是数字图像的Metadata,现在提出的许多标准都处于实验和完善的阶段。 Metadata格式“标准化”程度问题 Metadata开发应用经验表明,很难有一个统一的Metadata格式来满足所有领域的数据描述需要;即使在同一个领域,也可能为了不同目的而需要不同的但可相互转换的Metadata格式。 同时,统一的集中计划式的Metadata格式标准也不适合Internet环境,不利于充分利用市场机制和各方面力量。 但在同一领域,应争取“标准化”,在不同领域,应妥善解决不同格式的互操作问题。 3.元数据互操作性问题 由于不同的领域(甚至同一领域)往往存在多个元数据格式,当在用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就存在元数据的互操作性问题(Interoperability): 多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。 4.元数据格式映射 利用特定转换程序对不同元数据元格式进行转换,称为元数据映射(Metadata Mapping/Crosswalking)。 目前已有大量的转换程序存在,供若干流行元数据格式之间的转化,例如:Dublin Core与USMARC; Dublin Core与EAD Dublin Core与GILS;GILS与MARC TEI Header与MARC FGDC与MARC 也可利用一种中介格式对同一格式框架下的多种元数据格式进行转换,例如UNIverse项目利用GRS格式进行各种MARC格式和其它记录格式的转换。格式映射转换准确、转换效率较高。不过,这种方法在面对多种元数据格式并存的开放式环境中的应用效率明显受到限制。 5.标准描述框架 。解决元数据互操作性的另一种思路是建立一个标准的资源描述框架,用这个框架来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式 实际上,XML和RDF从不同角度起着类似的作用。 XML通过其标准的DTD定义方式,允许所有能够解读XML语句的系统辨识用XML_DTD定义的Metadata格式,从而解决对不同格式的释读问题。 RDF定义了由Resources、Properties和Statements等三种对象组成的基本模型,其中Resources和Properties关系类似于E-R模型,而Statements则对该关系进行具体描述。 RDF通过这个抽象的数据模型为定义和使用元数据建立一个框架,元数据元素可看成其描述的资源的属性。 进一步地,RDF定义了标准Schema,规定了声明资源类型、声明相关属性及其语义的机制,以及定义属性与其它资源间关系的方法。另外,RDF还规定了利用XML Namespace方法调用已有定义规范的机制, 6.数字对象方式 建立包含元数据及其转换机制的数字对象可能从另一个角度解决元数据互操作性问题。 Cornell/FEDORA项目提出由内核(Structural Kernel)和功能传播层(Disseminator Layer)组成的复合数字对象。 内核里,可以容纳以比特流形式存在的文献内容、描述该文献的元数据、以及对这个文献及元数据进行存取控制的有关数据。 功能传播层,主功能传播器(PrimitiveDisseminator)支持有关解构内核数据类型和对内核数据读取的服务功能,还可有内容类型传播器(Content-Type Disseminators),它们可内嵌元数据格式转换机制。 例如,在一个数字对象的内核中存有MARC格式的元数据,在功能传播层装载有请求Dublin Core格式及其转换服务的内容类型传播器。当数字对象使用者要求读取以Dublin Core表示的元数据时,相应的内容类型传播器将通过网络请求存储有Dublin Core及其转换服务程序的数字对象,然后将被请求数字对象中的MARC形式元数据转换为Dublin Core形式,在输出给用户。 在2000年6月举行的“知识管理与元数据研讨会”(上海图书馆举办)上,通过与会交流获知,在我国大陆已经开始了元数据的研究项目。目前,主要有国家图书馆的有关法律、旅游、古籍元数据的研究项目,北京大学图书馆的拓片元数据研究项目,清华大学的建筑元数据研究项目。目前,均处于研究和产品开发阶段。上海图书馆的数字图书馆项目实施中选择了元数据方案,1997年上海图书馆启动了第一个数字化项目-善本古籍的数字化,此后又陆续开始了六个数字化项目,分别是上海图典、上海文典、中国报刊、民国图书、点曲台和科技百花园,将极具特色的馆藏和地方文献开发出发,到1999年底,总容量已经达到200GB。总体来说,上海图书馆对将元数据作为其数字化图书馆项目已经有了比较具体的实践性研究。元数据标准在网络多媒体教学素材库设计中的应用我国远程教育技术标准委员会参照IEEE的LOM模型进行了本土化工作,制定了现代远程教育资源建设技术规范(以下简称技术规范),提出了教育资源元数据的描述框架。技术规范是一个较为宽泛的标准,它从三个角度进行规定:一是从资源的技术开发角度,提出一些最低的技术要求;二是从使用用户角度,为方便的使用这些素材,需要对素材标注那些属性,并从可操作性的角度,规范了属性的数据类型及编写类型。这部分参考了IEEE的LOM模型,从制作素材的简便性,使用素材的方便性角度上选取了一些最为普通的元素;三是从管理者的角度,提出了管理这些素材的管理系统以及远程教育工程的教学支持平台所具备的一些基本功能。在参照国家技术规范和LOM的基础上,我们采用核心集,可选集、特定扩展集和任意扩展集对素材库内的资源进行描述。1.定义入库编码规则为了保证素材库内的编码的唯一性,稳定性和可扩充性,按照国家教育委员会1997年颁布的普通高等学校本科专业目录的编码为基础,对素材进行分类。实现如下逻辑树结构:教师分类国家分类教务处分类具体素材树根树根:编码为0,标识为树型结构的源。 国家分类:直接隶属于树根的第二层编码,采用国家分类编码。教务处分类:隶属于国家编码的第三层编码,教务处编码规定某位教师的某门课程编码。教师分类:为第四层编码,教师分类规定了各章节的编码,教师分类编码构架出基本的课结构。具体素材:为第五层编码,是最底层的用户分类.素材的编码=上一层编码|素材名。本项目采用国家标准编码(6位)+教务处编码(6位)+用户自定义编码(位数不定)来定义素材的编码,可以对素材进行分类管理并可以根据某些特定情况进行素材分类的扩展。前6位的学科(专业)编码采用国家标准编码,这样既符合技术规范的规定,有利于素材的共享又避免了素材库内的编码冲突。为了防止专业内不同课程的编码冲突,中间6位采用学校教务处统一制定的课程编码。最后几位由教师自定义,长度由教师自定,教师可以根据教材之间内容和结构的差异,来组织本学科的素材,从而增加了素材库的灵活性。包含国家和教务处分类的目录树是由素材库管理员依据国家编码和教务处编码在系统中建立的,教师只有权对自己所授课程进行分类编码。教师在对课程的章节进行编码时,不需要关心上一级编码的具体内容,只需点击系统自动建立的目录结构树,选中上一层目录,填写本层目录的具体信息,新建的目录编码即可由系统自动生成。教师上传素材的方法与建立新目录类似,所不同的是系统生成素材的编码是由上层目录编码+素材名所构成,上层目录编码和素材名中间用|隔开。在生成编码的全过程中,生成编码的方法和编码具体内容对教师来说是完全透明的,这样设计极大的方便了教师进行操作。例如:农学学科植物生产类园艺专业“园艺概论”课程的第二章第一节第一小节的编码为090102030229020101,第一小节的素材编码为第一小节编码+“|”+素材名。其中090102为第一层编码,是国家标准编码。030229为第二层编码,是教务处制定的课程编码,020101为教师根据教材章节结构定义的编码。如下图所示: 农学(09)植物生产类(0901)园艺(090102)园艺概论(030229)第二章园艺植物的生物学原理(02)第一节 园艺植物的营养生长(01)小节一 种子和幼苗(01)玫瑰幼苗图片(01)水产类(0907)农学 (090101) 根据如上所述设计出可扩展的分类目录结构表(Level表)字段名字段代号数据类型备注IDCIDInt系统自动标号,主键本级目录编码LcodeChar目录中文名称NcatalogueChar显示名称上级目录编码SupLcodeChar父目录编码当前目录是否为最底层目录IFBottomChar素材只能加在最底层目录目录创建人标识UserNameChar用户注册名目录介绍IntroductionChar2.规范化素材描述根据技术规范,素材可以分为五大类:图形/图像素材,文本素材,动画素材,视频素材,音频素材。技术规范为每类素材规定了需要标注的属性。这些属性中既包含可与LOM中的元素相对应的属性,也包含LOM模型规定以外的关于各类素材特有的技术属性。 (1)素材资源的核心集是由LOM中的必须元素构成的。核心集是教育资源元数据实现互操作的基础,是网络教育资源最基本的描述信息。利用这些基本信息,可以方便的对资源进行分类、查询和定位。在素材库建设中,我们采用的核心集是根据LOM规范并参考技术规范的基础上制定的。这些核心元素为:LOM的元素相应素材属性通用/标题素材ID通用/描述素材介绍通用/关键字素材关键词通用/语言素材语言生存期/贡献者/实体 当生存期/贡献者/角色=“作者素材编著者生存期/贡献者/实体 当生存期/贡献者/角色=“发行者”素材发布者注册名生存期/贡献者/日期素材编写时间(年) 素材编写时间(月)技术/格式数据格式分类/分类单元/条目 当分类/目的=“学科”学科(专业)(2)LOM中的可选数据元素构成了可选集,它是对核心集的扩展。本文采用的可选集中的元素是技术规范中所规定的素材应标注的属性。适用于所有类型素材的LOM中的可选元素为:LOM的元素相应素材属性教育/环境适用对象关系/资源 当关系/类型=IsBasedOn.来源技术/大小数据量不同类别素材特有的LOM可选元素(以音频素材为例)为:LOM的元素相应音频素材属性技术/持续时间播放时间分类/分类单元/条目 当分类/目的=“教学目标”情感类型(3)由于每类素材都有其特有的技术属性,例如音频素材的声道数。为了解决这个问题技术规范中对特定资源的扩展数据元素组成了学习资源的特定扩展集,它在LOM标准的基础上进行相应扩展,解决了某些特定的资源需要特定的元数据来描述的问题,增强了灵活性和描述能力。(4)在素材库建设的过程中,综合考虑到用户使用和系统管理的需求后,本文又在技术规范的基础上作了相应的扩展,为素材添加了一些特定的描述信息,这些描述信息构成了素材的任意扩展集。例如,在素材的属性中我们添加了素材被访问次数这项属性,通过访问次数教师可以清楚的了解到素材使用的情况,对素材的内容进行相应的调整。通过归类各类素材的属性集合,发现所有素材有相当一部分特性是相同的,依据数据库设计原理,设计了记录素材共性的数据表与记录各类素材个性特征的数据表。3.3 规范素材格式为了满足存储和网络传输的要求,根据技术规范与实际应用情况对教师提交素材的格式要加以规定。对上传的不符合规定的素材,要编写相应的程序进行转化。上传素材采用当前大量使用的音频、视频格式,如音频采用WAV、MP3、MIDI;视频采用RM、MPG格式。3.标准标记语言在素材库管理平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 糖料作物仓储环境对品质影响研究-洞察及研究
- 赵继宗诗歌对文学理论的影响-洞察及研究
- 血管内皮细胞因子在红细胞增殖调控中的作用-洞察及研究
- 深海热液喷口区的潜在生物制药资源-洞察及研究
- 低代码框架技术局限-洞察及研究
- 四川省达州市崇德实验学校2026届数学八年级第一学期期末学业质量监测试题含解析
- 2026届浙江省杭州市富阳区城区联考数学九上期末学业质量监测模拟试题含解析
- 西安市重点中学2026届数学九年级第一学期期末达标检测试题含解析
- 四川省什邡市城南学校2026届九年级数学第一学期期末复习检测模拟试题含解析
- 浙江省宁波市七中学教育集团2026届数学七年级第一学期期末质量跟踪监视模拟试题含解析
- 2025广西南宁上林县公安局面向社会招聘警务辅助人员50人笔试备考试题及答案解析
- 火锅店引流截流回流方案
- 2025年档案员考试试题及答案
- 2025-2026学年七年级英语上学期第一次月考 (福建专用) 2025-2026学年七年级英语上学期第一次月考 (福建专用)原卷
- 国自然培训课件
- 2025安徽普通专升本《大学语文》统考试题及答案
- 2024网络主播新职业发展报告-快手
- 2025年4月自考03450公共部门人力资源管理试题
- 辽宁省沈阳市第一二六中学教育集团2024-2025学年八年级上学期10月月考地理试题
- 2025届威海市重点中学高三下学期一模考试物理试题含解析
- 河北省定州市多校2024-2025学年七年级上学期第一次月考地理试题
评论
0/150
提交评论