图书馆馆藏数据库影响业务统计准确性的问题分析.docx_第1页
图书馆馆藏数据库影响业务统计准确性的问题分析.docx_第2页
图书馆馆藏数据库影响业务统计准确性的问题分析.docx_第3页
图书馆馆藏数据库影响业务统计准确性的问题分析.docx_第4页
图书馆馆藏数据库影响业务统计准确性的问题分析.docx_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图书馆馆藏数据库影响业务统计准确性的 问题分析 (河北师范大学图书馆,河北 石家庄 050016) 摘 要:文章结合作者工作实践,提出了图书馆统计工 作过程中遇到的问题及解决方法,并从馆藏数据库建设和 软件规范两方面提出了自己的见解。 关键词:图书馆;业务统计;馆藏数据库 中图分类号:G250 文献标识码:A 文章编号:1007 6921(XX)11011801 高校图书馆统计是指对高校图书馆工作过程中的各种 数据进行统计分析的过程。图书馆统计工作是一项传统的 业务工作,是指运用统计学原理,根据具体数字来反映图 书馆各项工作的实际情况,通过对图书馆工作中的各种现 象、状态、趋势等进行量的描述与分析研究,为工作决策 提供坚实可靠的数据支持,随着社会的发展和信息时代的 到来,各项改革不断深入,图书馆传统的管理体制受到强 烈的冲击,以标准化、规范化、科学化的方式和手段管理 图书馆的思想日渐浓厚,图书馆各项统计工作的作用日趋 显著,目前,统计工作已被越来越多的图书馆管理者所认 识和重视。 河北师范大学图书馆是实行图书馆业务自动化较早的 图书馆之一,早在 1995 年我们就开始了图书馆自动化系统 软件的考察购买工作,起步早就会有很多问题当时并不明 确,在若干年的使用过程中才得以不断地发现和改善。由 于资产清查、评估、流通分析等工作的需要,我们经常需 要对图书馆的整体馆藏数据进行册数、资金及其流通情况 等进行统计,下面就笔者在图书馆技术部做业务系统统计 工作的体会介绍给各位同仁,以讨论问题、解决问题。 1 统计工作过程中出现的问题 笔者认为统计准确度的基础就是我们的自建数据库是 否准确规范,是否能比较真实地反映我们的馆藏情况,统 计只是一个计算工具,而数据却是真正的内容,这是毋庸 置疑的。所以在统计中发现问题后,通过进一步分析,找 到了数据失真的几个重要原因。 1.1 图书馆册数统计失真问题 数据方面,我们由于丹诚系统的要求,比较早地学习 并按照 CN-MARC 格式著录我们的中文图书,编目的工作人 员也在不断地学习和探讨 MARC 著录格式,但对馆藏的自定 义字段没有引起足够的重视、没有给予规范著录。如复本 数字段,我馆原来一直使用 DATATRANS-1000 系统,我们定 义了 905 的$f 子字段录入复本数,但是由于时间紧、任务 重、为了尽快保证流通开馆、加快进度,没有严格按规则 著录,致使有的数据有复本数,有的没有复本数,没有坚 持数据库信息要求的一致性和延续性。近 50 万条的数据记 录,逐个去处理是不现实的,导致了统计时应用复本数字 段的统计方法不能使用。 1.2 图书馆资金统计失真问题 因为 MARC 格式在 010 字段的$d 子字段有价格著录信息, 如果都是单本图书著录,不会有问题,但是如果是成套图 书按一条 MARC 记录著录,而复本典藏信息没有要求做单册 价格的话,问题就相当严重了,因为计算机不能分辨你在 010 标注的价格是单价还是套价,做统计时就会出现把套价 当成单价重复计算的结果,尤其是过刊典藏,我馆曾有一 种外刊 Proceedings of the National Academy of Sciences of the United States of America,按年价著 录的,典藏了 105 册期刊合订本,统计出来居然达到了 1253061.00,出现了一千多万的天价。所以导致了图书资 金统计的问题。 1.3 按单位进行读者借还统计杂乱问题 读者数据库的单位等信息没有统一规范,导致了一个 单位有若干个名称,给我们的统计工作也带来了许多不必 要的麻烦,本来能轻轻松松得出的结论,由于单位的混乱, 还要手工去给予合并处理等操作。如:数学系、数信学院、 数学与信息科学学院等几个名称都是数信学院的单位名称, 当然这也是学校更改学院名称的原因,但我们的读者数据 却只注重新数据的更新,而没有去关注旧数据的转换工作。 2 解决统计问题的对策 2.1 对于册数统计的问题 我们可以想办法饶开复本数字段,不再去找记录中的 905$f 子字段,而是通过去不断查找复本信息的财产号字段, 即 906$h 子字段,看著录数据中有几个复本信息的财产号 (906$h),进行自动累加,发现一个复本信息的 906$h,就 自动加一。从而得到相对准确的馆藏图书册数。 2.2 对于资金统计的问题 可以对数据库进行修正,发现有成套书集中到一条记 录做的数据,则进行手工分价格的操作,如丹诚 DT1000 中 可在 906 的$d 子字段分别录入每个复本的单册价格,使得 统计时能够按单册价格统计,从而得出正确的结果。可以 通过修改统计的配置文件的算法如: # 数据及其来源: #书目库: 010$d(价格)690$a/694$a(分类号)906$h(登 录号) #906$d(价格例外)906$B(批次号) 可以增加对 906$d 价格例外的判断和计算; IF 发现有单册价格的著录,则 取当前单册价格; ELSE 去从 010$d 字段取价格,进行计算。 这样,就能比较好地解决出现的问题,且数据修改量 也不大。 2.3 对于读者数据 应设置专门人员定期给予整理,保持读者数据信息的 规范性和一致性,不能只保证借阅证号不重,不影响流通 就万事 OK 了,还应不断规范单位、系别等参考信息,在进 行新读者数据录入的同时,进一步规范已有的读者数据信 息,从而使我们的统计报表更规范,能更方便、快捷、科 学地分析我们的统计结果,给我们的业务分析提供坚实、 可靠的数据基础。 3 基于出现的问题所提出的建议 3.1 对于馆藏书目数据和读者数据库必须要有明确的 著录规范和要求 以前总是强调 MARC 部分的规范性,并不断地加以学习 和探讨,怕影响数据交换和数据共享,而忽视了馆内使用 的自定义字段的规范性,读者数据也是不影响流通就行了, 没有充分认识到其重要性。殊不知正是这些信息字段是统 计我们馆藏资源的重要依据。所以这是一个图书馆人必须 走出的误区,否则图书馆的数据只是能实现简单借还,而 其他与统计相关的业务功能是无法得以充分利用的,从很 大程度上限制了图书馆自动化系统的应用。所以馆内使用 字段和读者参考数据信息也必须严肃对待,仔细斟酌,并 应该能够坚持如一,保持数据规范的延续性。 3.2 对图书馆软件的要求,必须能够强行控制某些必 备字段,没有规范的必备 字段应该不允许数据存盘 以前我们所使用的丹诚软 件,虽然编目模块非常灵活好用,极大地提高了我们编目 的工作量,却也存在缺憾,不能强制规范必备字段,久而 久之,给我们的馆藏数据库积累了一定的问题。现在我们 已经更换了新的图书馆业务管理系统汇文系统,该系 统对 MARC 规范方面有了很大改进,也对必备字段等给予了 严格的限制。希望随着软件的不断发展和完善,对数据给 予进一步的规范,毕竟人为地去规范数据的过程会有疏漏, 计算机控制就会准确得多,并且希望软件能判断如价钱等 字段信息的合理性,一本书的价格由于手误等操作超出合 理范围时,给予提示,要求工作人员给予确认。这样,这 个业务系统软件才是一个严谨、科学的软件,有了这样的 应用软件,也才能保证我们图书馆的各项业务得以顺利的 开展。 图书馆统计工作是图书

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论