图书馆传统业务管理系统的数据备份探讨.doc_第1页
图书馆传统业务管理系统的数据备份探讨.doc_第2页
图书馆传统业务管理系统的数据备份探讨.doc_第3页
图书馆传统业务管理系统的数据备份探讨.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

提高特色库建库软件支持元数据规范能力的方法郑振容(集美大学图书馆 福建厦门 361021)【摘要】本文以CALIS专题特色库的元数据规范为例,分析了现有专题特色库建库软件在支持、消化元数据规范方面存在的问题、原因及危害,并建议采取合理设计元素结构、规范著录内容、细化元数据著录模板、鼠标选取受控词或编码、支持元素重复著录、检验元素必备性和唯一性、提供在线帮助等措施,可以增强建库软件支持元数据规范的能力,提高元数据的质量,增强特色库的服务功能。【关键词】特色库;元数据;规范;建设系统【分类号】G250.74 【文献标识码】BApproaches to Enhance the Capacity of Input Module Supporting Metadata Standard in Characteristic DatabasesZheng Zhen-rong(Library of Jimei University, Xiamen 361021, China)【Abstract】 The paper discusses some problems in input module supporting metadata standard in current characteristic databases, and correspondingly proposes six approaches to enhance the input modules capacity to support metadata standard, which may improve the quality of metadata, and thus strengthen the service functions of characteristic databases.【Key words】characteristic database; metadata; standard; input module1 引言在特色库建设中,严格执行相应元数据规范,能够保证所建的元数据“在功能、数据结构、格式、语义语法等方面的一致性和整体性”1,能够“实现更大范围内的数字图书馆之间的互操作和数据共享”1。因此用元数据规范来指导和检验特色库建设各个阶段的工作,有利于从全局角度规划本地特色库的建设细节,有利于提高元数据的质量,有利于增强特色库的服务功能,有利于减少各个环节出现问题。这就要求将元数据规范及其设计意图嵌入到建库工作的各个阶段,承担这项工作的最好角色是特色库建库软件。从建库人员的角度,特色库建库软件与元数据相关的模块主要有:元数据定义模块、著录模块、元数据导入/导出模块。元数据导入/导出模块实现的功能比较简单:将常用格式存储的元数据正确导入特色库,或将特色库的元数据正确导出成常用格式的数据。要求功能正常、界面友好、操作简单、格式通用。本文不讨论这一模块。一种资源类型的元数据规范,包括该资源类型的“元数据规范”及其“著录规范”。“著录规范”的规定更具体详细。功能需求越具体详细明确,越有利于设计系统,用户也越容易验证软件的功能是否满足要求。所以本文更重视考察特色库建库软件支持著录规范的能力。2 特色库建库软件在支持元数据规范方面存在的问题大多数特色库建库软件都可以定义资源模板,但这些模板常常只规定了一个专题包括哪些元素以及各元素的简单数据类型。特色库建库软件设计者为了简化设计,常常用一张简单的二维表存储这些元素;著录模块只提供在这张二维表的相关位置简单输入对应元素内容的功能;后台对录入内容不作任何处理直接保存。对于元数据规范所规定的编码和受控词录入与规范化、元素出现频次控制、著录内容格式化等要求,系统几乎没有考虑。因此,为了使著录内容看起来符合规范,著录者只能按照元数据规范或显示格式来构造元素的著录内容。这时,元数据规范变两件事:建库方的系统管理员简单定义库结构,以及著录者构造元素内容。资源建设方承担维护元数据规范的大部分责任,而建库软件几乎成了维护元数据规范的局外者。这种建库系统只是在定义字段方面灵活了些,其它方面与普通网站建设系统几乎没有差别。这种消极支持元数据规范的建库软件存在以下问题:过渡简化数据间的逻辑关系;对建库人员要求高,建库工作容易出错,效率低;著录内容因时而异,因人而异;系统难以完全正确解析构造内容的结构。其所建数据难以满足系统设计人员和特色库建库者对发布功能极大化的期待,难以支撑较高的服务需求。3 提高特色库建库软件支持元数据规范的能力要提高特色库建库软件支持元数据规范的能力,就是要求特色库建库软件主动承担维护元数据规范的主要责任。这就要求特色库建库软件设计者认真考虑:如何定义各元素,才能既准确、完整地表达该规范所规定的各个元素,又便于数据库建设和服务扩展;如何控制元数据规范所规定的著录内容的取值范围、格式、出现频次。3.1 合理设计元素结构系统如何定义元数据元素,基本体现了整个系统落实元数据规范的思路。一个元数据规范所规定的元素,有些元素比较简单,只要一个字段就可揭示这个元素的全部信息;有些元素比较复杂,可能包括几个层面的信息。比如CDLS-S05-034网络资源著录规则1中的“创建者”元素,包括了四个层次的信息:l 创建者、责任方式;l 创建者可能还包括:所属机构、联络方式、译名、别名等信息;l 联络方式可能还包括:电话、Email、地址等信息。l 机构可能还包括:机构名称、机构地址等信息。并且“创建者”元素又可能重复。对于如此复杂的逻辑结构,有三种设计方法:(1)方法一:定义一个足够长的字符串字段,保存一个描述对象的所有“创建者”的全部信息,在对应著录界面设计成一个字符串编辑框;或者定义两个字符串:一个保存“创建者”及其“责任方式”,另一个保存“机构”,在对应著录界面设计成两个字符串编辑框。著录者自行决定编辑框的著录内容及其结构。这种法可能省去了联络方式、译名、别名等信息,简化了逻辑关系,系统实现起来比较简单,是大多数建库系统的做法。但如果要使这种方法所建元数据完全符合CDLS-S05-034网络资源著录规则1的要求且系统能正确解析其结构,对建库者的建库经验、构造水平、对系统熟悉程度、清楚把握未来应用需求等要求比较高。这种方法难以保证数据总是符合规范。(2)方法二:按数据库范式要求,定义几个表集中存储特色库中创建者(和其他责任者)这几个层次的信息,主表仅保存对应记录的链接,特色库建库软件设计合理的切换界面,实现著录功能。这种方法在软件设计阶段比较复杂,但能准确表达数据的逻辑关系,也容易实现元素重复著录。著录者几乎感觉不到元数据规范的存在。(3)方法三:著录界面类似方法二,将著录结果构转换成一个XML文本,系统用方法一的模式存储处理后的XML字符串。这种方法用XML表达模型中复杂的逻辑结构,也容易实现元素重复著录,对著录者要求低。这种方法与方法二相比,系统结构变简单了;与方法一相比,能准确、完整地表达逻辑结构,但要额外编程处理保存、更新、显示、排序和检索等操作。这种方法比较少用,但值得尝试。 以上三种方法中,方法一主要由建库者承担维护元数据规范的责任;方法二和方法三主要由建库系统承担维护元数据规范的责任。后两种方法所设计的系统,支持CDLS-S05-033网络资源元数据规范1的能力比较强。3.2 规范著录内容特色库建库软件应能正确接受对应元数据规范所规定的各种数据,并能自动规范著录内容。规范处理的目的是:为排序、检索、显示提供规范数据。比如CDLS-S05-034网络资源著录规则1中要求日期格式应符合W3CDTF规范2,使用“YYYY-MM-DD”的格式著录。元数据规范允许出现以下这些情况:“1998”(未知月日)、或“19?-07-01”(只知年份大概)、或“-07-01”(不知年份),系统应能接受这些数据,不能跳出错误提示。当录入“YYYY/MM/DD”(以“/”为年月日分隔符)或“YYYYMMDD”(年月日之间没有分隔符)或“YYYY-M-DD”(月份是1位数)时能自动转为规范数据:“YYYY-MM-DD”。如果著录软件仅仅将对应字段简单处理成关系数据库的日期型,则录入“1998”、“19?-07-01”或“-07-01”时数据库系统就会报错,无法接受;如果没有规范化 “19980701”、“1998-7-1”和“1998/07/01”这三个日期数据,按字符排序时可能会排错位置,检索时也可能被漏检。在检索日期数据时,也要对输入的条件进行规范化,才能正确匹配。3.3 增加更小级别的著录模板建库软件除了拥有不同文献类型的元数据模板外,还应该有题名、责任者、主题等主要元素的著录模板。元素级的著录模板是针对某类元素可能出现的情况,合理设计各种情况的数据结构、著录界面、著录内容或格式的处理函数、各种情况的切换界面。相应地,定义元数据的模板时,每定义一个元素,就要指定该元素所适用的元素模板。比如,在CDLS-S05-030电子图书著录规则1 中“题名”元素可能包括三种情况:l 题名:简单题名,没有其他附加内容;l 题名、主要题名的说明文字:要求著录为“题名:主要题名的说明文字”;l 总题名、分题名、分部序号:要求著录为“总题名.分部序号,分部题名”。如果在著录界面有三种类型的题名著录模板(简单题名、有说明题名、总分题名)让著录员选择,比如著录者选了“总分题名”模板,这时可能除了涉及三个著录块(总题名、分题名、分部序号)的编辑框外,还涉及“序号”的格式(如序号用哪一数字字符、位数、不足位数填充什么字符、序号要不要加括号等前后缀)、合并连接符(如不同块的分隔字符、字符全/半角转换)、最后生成的结果串保存到哪个字段。有了这种题名模板,题名的著录内容就会比原来规范、一致,有利于系统理解元素的语义。也可定义更细的模板,如日期型著录模板、人物著录模板、单位著录模板、编码/受控词著录模板等等。3.4 用鼠标选“受控词”或“编码”对于录入“受控词”或“编码”的地方,当词汇量较小且结构简单时,应可用“下拉列表(TComboBox)”供著录员选择。当词汇量大或结构复杂时,应可用“树视图(TreeView)”供著录员选择;如果已录入部分编码,也可提供以此“部分编码”为根结点的子树供著录员选择。当“受控词”或“编码”允许重复时,可用“多选框(TcheckBox)”选取。在权限允许的条件下,应能方便地切换到“编码”和“树视图”的编辑界面维护代码。当直接输入“受控词”或“编码”时,系统应能检查其取值的合法性和格式的规范性。如果不能用“下拉列表”或“树视图”选择,著录人员只能凭记忆、或查找对应“受控词表”或“编码表”,再键盘打入。这种办法虽能达到目的,但不能保证每次的记忆都完成正确,且键盘输入环节可能出错,效率也会低很多。3.5 支持元素可重复著录在元数据规范中,很多元素允许重复。比如CDLS-S05-034网络资源著录规则1中“创建者”可能重复,一个创建者所对应的“机构”、“联系方式”也可能重复,不同创建者可能对应同一个机构、同一个“责任方式”。如果系统不支持“重复著录”,著录人员只能简单地用分号来分隔并列的数据值。这种模式可能无法完整准确表达元素语义,或看起来累赘。而且仅考虑显示格式而不顾内部处理方法和后继服务要求,也不利于进一步提升服务质量。支持“重复著录”的系统,常常会兼顾数据的显示格式、后续处理的方便性。这正是支持“重复著录”系统的价值所在。比如某资源的创建者是“张三 李四著;王五 赵六译”,这是显示格式。不支持重复著录“创建者”元素的系统中,有以下几种著录方法:l 按著录规范应著录成“张三著;李四著;王五译;赵六译”。这时,如果在显示时没做处理,看起显得累赘、别扭。l 有些特色库,著录时不加责任方式,著录成“张三;李四;王五;赵六”。显然无法正确完整表达原意,不符合规范要求。l 如果著录成“张三;李四著;王五;赵六译”,这更像是显示格式。也没有完整表达原意。基于以上著录方法著录的数据,难以支撑以下三种应用(或实现起来比较复杂):l 按不同“创建者”聚类显示、统计汇总;l 相同创建者的资源相互链接;l 不同责任方式赋以不同的排序权重,排序检索结果。在实现相关应用时,系统要区分哪些“创建者”有加责任方法,哪些“创建者”没加责任方法,先要分解创建者和责任方式,这两者之间无任何约定分隔符,不能保证分解过程总是正确。数据的不一致性容易造成混乱,也容易出错,实现起来更复杂了。因此“系统允许元素可重复”虽然设计时复杂了些,但后续处理、服务扩展会简单规范很多。也更容易减小内容的“粒度”,系统也更容易“理解”著录内容的结构。3.6 增加元素的必备性和唯一性的检验比如在CDLS-S05-034网络资源著录规则1中,名称、标识符、主题和关键词是必备字段。著录员编辑一条记录,如果未输入其中的某些必备元素而要从编辑界面退出时,系统应能作“缺项提示”、“禁止退出”、“设置不完备性标志”、“不予保存”等一项或多项处理。如果“标识符”或“名称”要求在规定范围内不重复,特色库建库软件在保存该记录前应作唯一性检查并提示。3.7 系统能自动生成或提取部分数据 如记录编辑员、记录创建/修改时间、文件大小、文件格式、音视频时长或编码、图像分辨率等数据让系统自动提取或生成,著录效率会提高很多,数据也规范一致了。3.8 提供方便的元数据规范帮助信息在著录各个元素时,如果需要帮助就能方便地调出本元素的定义、元素修饰词的著录内容、编码体系修饰词及其用法、规范档、必备性、可重复性、著录范例、本库的具体约定等内容。方便提供帮助信息有助于著录员及时、准确理解元素标准和本库具体约定,有利于提高元数据质量。4 总结优秀的特色库建库软件应该主动落实元数据规范的设计意图,控制好元数据规范的细节规定,元数据规范与系统已融为一体,著录者几乎感觉不到规范的存在。而不负责任的特色库建库软件,将规范的所有细节扔给著录者,要特色库建设者考虑规范的所有细节。提高特色库建库软件支持元数据规范的能力,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论