中文图书编目数据的质量分析与优化策略.docx_第1页
中文图书编目数据的质量分析与优化策略.docx_第2页
中文图书编目数据的质量分析与优化策略.docx_第3页
中文图书编目数据的质量分析与优化策略.docx_第4页
中文图书编目数据的质量分析与优化策略.docx_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文图书编目数据的质量分析与优化策略 (南通大学 图书馆,江苏 南通 226001) 摘 要:针对 书目数据的标准化、规范化控制以及编 后数据的校对和维护工作,分析了编目数据中常见的 问题, 就联机编目环境下实施中文图书编目数据质量控制,对于 中文书目数据库建设中的数 据优化起着重要的作用。 关键词:中文图书编目;编目数据;数据质量 中图分类号:G257.2 文献标识码:A 文章编号: 10076921(XX)22012902 随着计算机网络和图书馆自动化的发展, 高校图书馆 中文图书编目数据由原来的编目员根 据 文献做原始编目 而转变为大多数从各类外部数据源中获取, 这不仅大大降 低了重复、繁重 的 编目工作强度, 同时为规范编目数据, 真正实现馆际互借和书目资源共享打下了基础。所 谓 利 用外部数据源, 就是指工作人员在编制文献书目数据时, 利用套录本馆外的书目数据源 , 进行修改、转换,使其 成为本馆的书目数据。利用外部书目数据, 可以大大减少 低效率的 重 复劳动, 节约人力、物力, 降低编目成本; 利用标准的、规范的外部数据, 可以使书目 数据 得到统 一, 提高编目工作的质量和效率, 促进编目工作标准化。 为编目资源共享, 也为 编目走向专业化、社会化奠定基 础。 在图书馆的中文图书文献管理工作中,图书编目是最 基础,也是最重要的一项工作。文献编 目的质量直接关系 到馆藏书目数据库的质量,影响读者的检索效果,影响对 图书的揭示程度 ,资源项共建共享的实现等。如何提高图 书文献编目质量便成了图书文献管理中的一个重要 的基础 课题。近年来,从规范控制,提高其标准化、规范化程度, 改善图书文献编目质 量入手,做了一些工作。本文就中文 图书编目工作中容易出现的问题、编目标 准化及改善图书 编目质量谈一点想法。 1 编目数据常见问题分析 1.1 相关字段的未准确对应 在图书 MARC 数据中,字段与字段之间存在相对应的关 系: 例:100 字段中图书出版日期与 210 字段中$d 子字段 的出版日期存在对应关系。 例:105 字段中的代码:如果选取了其中的代码如: a.b.c.等,就必须在 215 字段作相对应的 说明,如果在 105 字段中有书目和索引的代码,那么必须增加相对 应的 320 字段,使字段与字段之间相互对应。 1.2 著录不规范 在图书著录过程中,对图书 MARC 格式的理解不够准确: 例:作品语种 101 字段的指示符和语种代码往往被忽 略,特别是译著,或含中英文的著作: 第 1 指示符中 0、1、2 标识不清,不能完全理解其表达的意思,子字段有 的使用也不够准确。 例:200 字段并列题名:在题名页的并列题名著录在 200 字段 $d 子字段,同时再做一个 510 字段作检索点。出 现在题名页以外的其他语种的题名,只著录在 510 字段, 但必须添加一个 3 12 字段说明 510 字段内容的来源。 例:200 字段对同一责任方式的责任者有 3 个或 3 个 以上时:只有 3 个时著录 3 个并列责任者 ,超过 3 个时 只著录第一个,其后用“等”。但有的数据只著录 第一责任者后就加 “等”, 这样著录限制了责任者的数 量,会削弱机读目录检索文献的检全率和检准率。 例:225 字段的指示符:225 字段的第 1 指示符通常为 2,但是,当 225 字段著录的丛编说明数 据与人与 4XX 字 段中的检索点形式不同时(比如 225 字段中有标引号,而 4XX 字段中必须把标引 号去掉),那么,第 1 指示符就应该 用 0。 1.3 重复著录 在著录过程中,如果只求速度,忽略查重功能,就有 可能重复著录。重复著录的危害是无故 增 加了数据库的 数据量,增大了负荷,占用了书目记录号,无论对数据库 数据还是对工作人员 的工作效率都是很大的影响;如不及 时发现,等到完成了相对应的编目数据图书就可能出现 一 书多记录。造成馆藏数据不准确,数据库混乱。图书入库 后,还会给读者检索利用带来困 难。 2 书目数据的标准化与规范化 2.1 数据录入规范化、标准化 现在各图书馆的书目数据库都多少存在一些不标准、 不规范的书目数据,造成图书馆馆 藏数目数据质量问题有 多方面的原因:有的是集成系统升级时数据导入时出错, 致使书目数 据的某些字段内容不详;有的是回溯建库时简 单著录导致的;有的是套录、下载数据时出现 的错误等等。 所以标准化、规范化是文献编目的生命线,关系到馆藏机 读目录的质量和读者 信息服务水平。因此,南通大学图书 馆分类编目人员认真讨论,制定了适合本馆的中文图 书 分类编目 著录工作细则,并要求文献分类编目人员必须 熟练掌握图书著录细则,严格按照中国图 书馆分类法、 中国分类主题词表以及本馆制定的细则,对图书进行 分类、编目,逐字 段认真录入书目数据单元,决不能带有 任何随意性。做到既规范又标准。 2.2 标引标准化 随着时代的快速发展,越来越多的新学科、边缘学科、 交叉学科的产生,对编目人员的 分类编目工作的要求越来 越高。标引是文献加工中的重要环节,通过标引,文献工 作者赋予 文献以检索标识,指明其内容特征的主题类属, 而后用以配合书目信息编制出各种目录和索 引,或存储于 计算机内,以实现文献的检索。图书数据的标引工作,是 连接数据库存储与检 索的桥梁,所以要对标引工作实现标 准化控制。本馆在中文图书的分类中采用中国图书馆 图 书分类法4 版,主题标引通常采用汉语主题词表。但 由于控制词表本身的表达力与 一致性存在缺陷、不同标引 者的标引深度不同及标引者对概念的理解和对标引规则掌 握的尺 度的差异等因素,需要通过各方的努力,尽量提高 标引工作的质量。 3 优化编目数据质量的措施 3.1 正确利用外部套录数据,通过对外部数据的加工 和修改,使之转换为本馆数据库的数 据记录 3.1.1 图书馆在招标中选择图书供应商时,不仅要求 对方能提供较优惠的价格,更应该要 求 对方能提供完备 的服务。在招标内容中增加图书供应商需达到的书目信息 数据提供能力,明 确图书供应商为图书馆提供图书供应及 相关服务内容和所需达到的质量标准。 3.1.2 编目时首先要注意查重查复。先查本馆数据库, 若是重书,应进行合并,这样才能 保证 同种书没有重复 数据,使复本书的索书号跟以前保持一致,避免出现同书 异号的现象,也能 防止不同版本的同种书给出不同的种次 号。 3.1.3 套录时要注意修改数据中的错漏点,外来数据 不可能全对,即使是权威机构制作的 也不 例外。所以套 录时每一个字段都要逐一检查,看到明显的错漏点都要予 以改正,疏漏的地方 予以补充。同时还应检查主题标引是 否恰当和充分,分类是否合理。 3.2 加强校对和数据维护 加强审核和校对工作是为了保证图书编目质量,减少 图书著录误差的最有效的措施。 当编目工作完成后,校对工作同样重要。审核人员应 让既有丰富的分编实践工作经验,又熟 练掌握机读目录格 式的责任心较强的人员担任。通过仔细认真的较对,将错 误率降到最低点 。还要建立数据库维护制度,数据中出现 的问题要定期进行总结,包括数据的修改、替换、 更新、 合并、删除等。 3.3 加强编目数据质量的信息反馈 编目人员应有计划、有目的地与流通部门管理人员、 读者就工作、借阅中发现的编目数据的 质量问题进行交流, 及时得到编目错误、及时修改、增减编目数据,对已有数 据进行动态维 护。可以制定编目数据质量信息反馈制度, 流通部门随时记录日常工作中发现的问题,编目 人员定时 收集、整理、修改、总结。只有通过对编目数据质量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论