




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 8 关于制定中文元数据标准的思考 【内容提要】作者认为,中文元数据标准应以 DC 为基本框架,并完全遵循和保留 DC 的结构、特点及扩展方式等,坚决防止 CNMARC 化倾向;中文元数据标准应形成一个完整的体系,对所涉及的相关的中文标准、规则、方案等,按照通用性、易用性等原则进行修改和制定;这一标准体系应成为全球各类中文信息资源著录和检索的标准。 【摘 要 题】信息资源建设与管理 元数据是“关于数据的数据”或“关于数据的结构化数据”,现在常说的元数据,是特指在标记语言 (SGML、 HTML、XML)环境下,对 网络信息资源进行描述的解决方案,主要是用于网络信息资源的发现、存储、管理和检索利用。在当前网络信息呈异常迅猛发展之势,大量的多样性的数字化资源,使得信息的利用和查找十分困难。为了解决这一问题,在国外已有了很多的元数据研究项目和成果,建立和运行了一些描述网络信息资源的元数据模式。元数据的应用,为网络信息资源的有序组织、适度控制和高效检索利用,提供了便利的条件。近年来,中文网络信息资源也在迅速增长,尽快研究和制定中文核心元数据标准,已是非常迫切的了。在制定中文元数据标准时,既要考虑到中文元数据处理的特殊性和中文 资源的应用特点,更要从全球的信息大环境出发,2 / 8 分析、研究和借鉴国际上先进的、通用的元数据标准,在尽量保持与国际标准接轨的基础上,制定符合中文资源应用需要的扩展与应用规范。 1 中文元数据标准应以 DC 为基本框架 在国际上众多的元数据方案中,Dublin Core Element Set(都柏林核心元素集,简称 DC),以其结构简单、语意互通和可扩展等特性,事实上已成为国际范围内通用的网络信息资源描述的元数据标准。 DC 经过几次国际会议的研讨和修订,已逐步完善和成熟。所以,制定中文元数据标准应以 DC 元数据为基本框架。国内在四五年前就已开始了对 DC 的探讨和研究,但至今尚未完全形成依托中文环境的 DC 元数据标准。当前应进一步加紧深入地对其进行研究和规范,形成中文元数据的一个标准核心集,以适应中文网络信息资源的发展。中文元数据标准应完全按照 DC 元数据集来建立,在具体作法上要注意以下一些问题。 (1)完全按照 DC元数据的框架结构来制定中文元数据标准。由于网络信息资源在时空上的广泛性和开放性,与传统的文献著录的相对封闭性有着很大的不同,因此,中文元数据标准的制定,应强调与国际接轨,保持完整的一致性。也就 是说要完全遵循 DC 元数据的框架结构来构建中文元数据标准,而不应该提出“以 DC 为主,参考其它元数据标准”3 / 8 来搞中文元数据标准。我们应汲取 CNMARC 的教训,避免把中文元数据标准搞成“ CNDC”。中文元数据标准应该只是对DC 元数据进行本地化和中文化的处理,对它的内涵、外延等用中文予以标准地诠释,方便使用中文的著录者和检索者理解与利用,仅对于著录和检索中文信息资源的一些特殊性和应用特点等有限的方面进行规范的规定和定义。 (2)中文元数据标准的制定,应完全保留 DC 元数据的基本特点。一般地讲,内在性、可扩展性、独 立句法结构、可选择性、可重复性和可修饰性是 DC 的 6 大特点,在实践中集中地表现为 DC 元数据的简易性、通用性、兼容性以及灵活的可扩展性,这些特性是 DC 能够成为一个国际上通行的元数据标准的原因,也是建议中文元数据标准应完全按 DC来制定的理由。因此,在制定中文元数据标准时,要完全保留 DC 的基本特点,不应有任何的更改。在国内有些使用 DC元数据时,将某些元素规定为“不可重复”或“必备”等等,这种做法是不可取的。 (3)应以国际通行的 DC修饰限定词作为中文元数据的规范和扩展的依据,而不应采用其它形式。 DC 修饰词提供 了对元数据的扩展描述,可以缩小元素的含义范围,使其更具有专指性,或是对元素进行规范性说明。目前, DC 已正式确定了三类修饰:模式体系、语言种类和类型。如为了表达不同的日期,在使用“ Data(日期)”这一元素时,可以增添4 / 8 “ Created(创建)”、“ Valid(有效)”、“ Issued(发行)”、“ Modified(修改)”等修饰词。在中文元数据标准中,不应把这些元素的修饰词解释为子元素。元素与加了修饰词的元素没有主次之分,修饰词并不改变元素本身的定义。元数据标准中,不应出现子元素的提法。元素的修饰限定和规范,是元数据元素的内在特性,是元素的不同表现形式,绝不能把元素和加了修饰词的元素看作是元素与子元素的关系,应坚决防止中文元数据标准的 MARC 化倾向(在 MARC 中就有的字段、子字段之分)。元素与加了修饰词的元素或多个附加了修饰词的元素同时出现,是元数据的元素可重复性的体现。 2 中文元数据标准应形成一个完整的体系 中文元数据标准是整个网络 上中文信息资源及中文电子出版物等的著录和检索的工具,其应用范围是很广泛的。因此,制定中文元数据标准的同时,还应对所涉及的相关的标准、规则和条例等进行研究、修改和制定,并逐步完善其推广应用机制,使中文元数据标准逐步形成一个完整的体系,更好地服务于日益发展的中文网络信息资源的开发和应用。与中文元数据标准相配套使用的一系列标准、规则和条例等的制定、修订,要本着易用性、通用性、国际性和规范化、标准化、自动化的原则进行。这方面的工作主要的有以下一些: 5 / 8 (1)修订和完善各类中文信息的代码体系,并尽量与国际通用的代 码一致起来。制定有关中文的“资源类型表”、“格式类型表”、“关联值列表”等,以规范中文信息资源的著录和检索利用。 (2)制定有关中文关键词选词截词等规则,以适应中文信息资源的自动化著录和检索。制定中文网页及电子出版物、数据库等的制作规范和条例。 (3)编制一个简单易用,能够适应数字化信息著录和检索的“中文信息资源树形分类表”。目前图书馆界广泛应用的中图法,其分类体系和类目设置均无法适应网络时代信息分类的要求。 (4)建立一个像 OCLC 的 CORC 项目那样的中文元数据在线编目系统,免费提供 中文网页或电子出版物的元数据自动生成。还应建立 CNMARC 与中文元数据的映射表,提供CNMARC 数据向中文元数据格式的转换等服务。 (5)仿照印刷文献的在版编目 (CIP)规定,制定中文网页和电子出版物的在版元数据著录规定,以行政手段强制要求所有正式注册的中文网页及电子出版物等,必须具备元数据著录项目,实现中文网络信息资源的作者著录,使中文元数据能够较快地在大范围内推广,方便中文资源的高效利用。 3 中文元数据标准应是全球各类中文信息资源6 / 8 著录和检索的标准 网络信息资源发展迅速、包罗万象, 且具有广泛性、开放性和分布式的特征,任何一种元数据都难以满足所有的需要。因此,元数据的标准框架应是一种可扩展的核心集,以应付各种需要。 DC 就是这样一种元数据集,以 DC 为基本框架构建的中文元数据标准也应是一种可扩展的核心元数据集。中文元数据标准除了要完整地保持国 际通用的扩展外,还应制定一些适应中文资源应用所需的扩展,并对这类特殊的扩展进行规范和控制。所有的元素或扩展的元素修饰限定词的著录标识,仍以 DC 规定的规范的英文名称来标识,不应用中文来标识。 中文核心元数据是各类中文数字化信 息的描述、管理、保存和利用的标准,它必须是能够应用于各种领域的数字化资源,如数字图书馆、电子政府、网络商务、各类数据库、电子出版物等等方面,也应是用于整个 Internet 网络中文信息的统一标准,能够实现异构资源间的互操作,在更广的范围内实现中文信息资源的共建共享。因此,中文元数据标准的研究制定,绝不能仅仅局限在图书馆界人员,而应在更大的范围内,采取开放式的研讨方式。我们都知道, DC元数据是由图书馆、计算机、网络等方面的专家和学者共同研讨的产物,我们也应借鉴这一经验,而且参与者的学科范7 / 8 围和专业领域要更扩大一些 ,这样制定出的中文元数据标准,才能广泛地应用于各学科领域,成为中文信息资源描述的基础的跨领域的元数据集。 中文元数据标准应是全球所有中文资源著录和检索的标准,应得到海内外从事中文信息资源建设的专家学者的广泛支持和参与,采取联合、协作、共建共享的方式,加强合作,避免重复开发。使制定出的中文元数据标准具有更为广泛的适用性和权威性,并形成一个国际通用的中文元数据标准体系,推动全世界的中文数字化信息资源的建设和发展。 收稿日期: xx-06-09 【参考文献】 1 王新 .都柏林核心集综述 .情报理论 与实践,2000,(5) 2 赵慧勤 .网络信息资源组织 Dublin Core元数据 .情报科学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现在分词的试题及答案
- 2026届黑龙江省哈尔滨光华中学化学九年级第一学期期末统考模拟试题含解析
- 深圳八下物理月考试题及答案
- 2025年社工招聘考试题型及答案
- 肾风病考试试题及答案
- 中考数学模考试题及答案
- 四川省达州铁中2026届化学九年级第一学期期中检测模拟试题含解析
- 供电服务类考试题及答案
- 安全工器具考试题及答案
- 2026届四川省营山县联考英语九上期末监测试题含解析
- 子宫肌瘤的治疗与护理
- 传统文化公司管理制度
- 小学生钻石画社团课件
- 隐私计算在档案中的应用-洞察及研究
- 关注老年人心理健康守护幸福 从心开始课件
- 《生成式人工智能(AIGC)通识教程(微课版)》课件 【第09-10讲】生成式人工智能基础与应用
- 扬州扬州市宝应县公安局招聘30名警务辅助人员笔试历年参考题库附带答案详解
- 科技论文写作 第2版 课件 第1-5章 科技论文写作概述-英文科技论文的写作
- 部分退款协议书
- 旅行社地接合同协议书
- 曲臂高空作业车施工方案
评论
0/150
提交评论