已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 6 基于 XML 的三个常用元数据描述工具的评价与比较 【内容提要】随着 Internet 和 WWW 的飞速发展, XML 凭借其自身的特点,为网络信息的管理、搜索以及 Web上各种应用的链接提供了极大的便利,从而得到了广泛应用。 XML 的一个重要特点就是允许用户定义自己的标签,从而实现对信息的存储和管理。 XML 中较常用的标签定义工具有 DTD 和XML Schema,而 RDF 是一个专用的元数据描述框架。本文结合一个 MARC 元数据描述的实例,对这三个工具进行了比较细致的分析和对比,并对未 1 引言 XML 是继 HTML 之后的又一种 WEB标记语言,它为用户提供了灵活的标记扩展机制,使得不同内容的资源能以格式良好的自定义的标记元素来表现。元数据是描述信息资源或数据等对象的数据,主要用来识别、评价、追踪资源,以及方便对资源的管理、发现、查找和交换。随着计算机网络的发展,特别是 Internet 的普及,网络环境下信息的描述和处理成为一个重要的问题,相应地网络环境下的元数据问题也成为一个研究的热点。 DTD 和 XML Schema 是 XML 中常用的进行标记扩展的工具, RDF 是专用的元数据描述工具,网络环境下的元数据描述通常 就是借助这几个工具,利用2 / 6 XML 的标记可扩展性来完成。在这三个工具中, DTD 随着最早被提出,伴随着 XML应用的普及和人们对 DTD认识的加深,又进一步提出了 RDF和更有发展潜力的 XML Schema。 2 DTD DTD 作为规范的重要组成部分,它使用 EBNF( Extended Backus Naur Form)语法完成 XML文档结构的定义,即 XML文档中标记的定义。一个 XML 文档只能对应一个 DTD,一个 DTD 由一系列标记定义组成,包括元素定义( element declaration )、 属 性 定 义( attribate declaration ) 、 实 体 定 义( entity declaration ) 、 注 释 定 义( notation declaration),是目前支持和应用最广泛的一种标记扩展工具。例如,一个用于描述 MARC元数据的 XML文档的 DTD可以定义如下: ! DOCTYPE mare ! ELEMENT marc ( record) * ! ATTLIST mare TYPE ( CN US UN11) # REQUIRED ! ELEMENT record ( datafield) * ! ATTLIST record type CDATA # REQURED info CDATA # REQUIRED 3 / 6 ! ELEMENT, datafield ( subdatafield) * ! ATTLIST datafield tag CDATA # REQUIRED ind1 CDATA # IMPLIED ind2 CDATA # IMPLIED ! ELEMENT subdatafield ( # PCDATA) ! ATTLIST subfield code CDATA # REQUIRED 上例中各个标记和属性的作用如下: MARC:用于标记内容的开始和结束,属性 type用于标记 MARC类型,如 CNMARC, USMARC, UNIMARC。 RECORD:用于标记 MARC 记录的 24byte 定长头标区,属性有 type和 info。 DATAFIELD: MARC 记录数据字段区的数据字段标记,对应 MARC记录中每个字段的内容,属性 tag、 ind1和 ind2分别代表字段标识、第一和第二指示符。 SUBDATAFIELD: MARC记录数据字段区中数据字段的子字段标记,属性 code为子字段标识。 通过该例,我们可以看到 DTD较好地完成了 XML的标4 / 6 记扩展(即元数据描述)的任务,目前在 Internet 上已有大量使用 DTD描述的元数据存在。但是 DTD提出较早,人们在使用过程中也发现它有很多的不足之处。其主要特点如下: 难以理解和书写。由于采用的是不同于 XML 的名为EBNF 的语法,因为需要先了解 EBNF,这对于人们的阅读和书写都带来了困难。 难以使用程序进行元数据的自动处理。由于使用EBNF语法,这给 DTD 的自动处理也带来了麻烦。通常情况下,我们需要对 DTD 进行验证,这时使用 DOM 就不可能对使用EBNF语法书写的 DTD进行分析,而必须使用专门的分析程序进行分析验证。 DTD 不支持数据类型。 DTD 只支持包括文档类型在内的少数几种数据类型,这意味着在实际使用过程中经常需要进行类型的转换才能达到预想的效果。 DTD不支持 Namespaces。由于必须把所有的元数据放在一个 DTD文件中,如果需要对已有的 DTD进行扩充则只能在原文件的基础上进行重写,这对于元数据的维护和扩充都十分不方便。 总之, DTD 在简单的文档结构定义方面是较出色的,如果考虑到 XML,是源自同样使用 DTD的 SGML的话,理解在中选择了 DTD就不难了。但如果我们考虑到 XML的用途现在5 / 6 已不仅局限于文档处理,那么 DTD 的这些缺点就变得日趋严重。因此 W3C( World Wide Web Consortium)在看到了 DTD的诸多问题 之后,提出了一系列用来代替 DTD 的建议( Recommendation,即正式标准),包括 RDF、 XML-Data、DCD、 XML Schema 等,其 中以 RDF 和 XML Schema 的影响较大 . 3 RDF RDF是 W3C在 1999年 2月颁布的一个关于元数据的建议,它主要解决如何采用 XML标准语法无二义性地描述资源对象的问题,使得所描述资源的元数据信息成为机器可理解的信息。 RDF 不仅可以象 DTD 一样允许设计者定义对象,并可以加入属性以对对象进行描述和定义,还可以 作出有关对象的复杂的陈述,例如申明资源之间的关系等。 RDF 的基本对象类型有:资源( Resources)、属性( Properties)、陈述( Statements)。每一个资源都有属性,每个资源通过唯一资源标识符 URI 来标识,它的属性由属性类型来作标识,每一个属性类型都有对应的属性值。属性类型表示出这些属性值与资源之间的关系。在 RDF中,属性值要么是一些被认为具有原子性的事物(如字符中或数字符),要么是其他的资源,而这些资源本身又拥有自身的属性。所有指向同一资源的陈述的集合就是描述。以前面所描述的 MARC 元数 据为6 / 6 例,使用 RDF可以定义如下: ? xml version=? rdf: RDF xmlns: rdf= httP: /1999/02/22 rdf syntax ns# xmlns: rdfs= http: /=/TR/1999/ PR rdfschema 19990303# xmlns
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国牧草项目投资可行性研究报告
- 宠物用品皮件制品行业深度研究报告
- 恒星钟行业深度研究报告
- 中国维沙欣项目投资可行性研究报告
- 中国高压电站类瓷绝缘子项目投资可行性研究报告
- 2026年压碎器项目可行性研究报告
- 润肤乳塑料瓶行业深度研究报告
- 软木赛行业深度研究报告
- 双法兰钢弯头行业深度研究报告
- 2026年中国防水材料批发行业市场前景预测及投资价值评估分析报告
- 《针灸治疗》课件-第六节 剧痛证-泌尿系绞痛
- GB/T 3683-2023橡胶软管及软管组合件油基或水基流体适用的钢丝编织增强液压型规范
- 保健食品广告审查表
- 冀教版五年级数学上册《综合与实践》教学设计
- 健身房会计账务处理
- 中南大学湘雅二医院神经外科重点专科申报书内容
- 党建知识题库附答案
- 2023版浙江评审卫生高级专业技术资格医学卫生刊物名录
- GB/T 3733.1-1983卡套式端直通管接头
- GB/T 34630.5-2017搅拌摩擦焊铝及铝合金第5部分:质量与检验要求
- 【最新部编版】二年级上语文《日月潭》完整版课件
评论
0/150
提交评论