谈电子图书采购查重工作的质量控制_第1页
谈电子图书采购查重工作的质量控制_第2页
谈电子图书采购查重工作的质量控制_第3页
谈电子图书采购查重工作的质量控制_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谈电子图书采购查重工作的质量控制

1数据库查重技术购买电子图书的成本包括决定购买电子图书的详细确认文件。即利用有关计算机工具对馆藏总书目进行检查,若图书与某一馆藏记录的题名、责任者、出版项、ISNB等著录信息(字段)完全相同,则为重复。通过查重来核对以前是否入藏或预订过这种电子图书,以避免重订误订,并在该电子图书缺少或需要补充时,能够确定订购。传统的手工查重工作费时费力,效率很低。本文介绍利用数据库处理的方法进行电子图书批查重,在手段上较之以往的手工查重方式更为方便、灵活,在查重字段数量选择上,可以更大限度地满足采访人员的查重需要,从而提高电子图书采购工作的质量和效率。同时,由于电子图书不同于纸本图书的特点,可根据纸本图书的流通率大小来进行电子图书的补订查重,同一订单中的图书查重也是查重工作的重要内容。2图书购买经费的控制电子图书采购查重工作的质量直接影响到图书馆馆藏文献建设的质量和电子图书购买经费的控制。图书馆电子图书采购批查重有两种需求,一种需求是检查跟图书馆馆藏不重复的电子图书,得到非重复的书单。另一种需求是检查跟图书馆纸本馆藏同名的电子图书,得到跟纸本图书重复的电子图书。2.1图书采购查重购买跟馆藏图书不同名电子图书,有利于优化本馆文献收藏结构,增加图书馆馆藏数量。得到和图书馆馆藏不重复的订单。图书采购查重就是利用各种检索途径调查、了解本馆新书的预订、文献的收藏情况,以便有的放矢地购买和增补图书,有计划、按比例地进行文献资源建设。查重是采购图书必不可少的前期工作。没有查重工作为前提,不了解某种图书在本馆的收藏等情况,就容易盲目购书,造成图书经费浪费,文献资源建设无序。2.2电子图书的批查在纸本图书的流通过程中,常常会出现一些借阅量特别大的热门图书,由于纸本图书的馆藏复本数限制,这类图书远远不能满足诸多读者的同时借阅。此时,电子图书不受复本数限制的优点就显露出来了。图书馆一般有哪些纸本图书流通率大适合于采购相应的电子图书呢?一是最新出版新书,读者一般都喜欢看新书,新书能够较快地被阅读、吸收和利用,这样可以弥补图书馆由于经费匮乏而导致纸质图书采购不足的缺陷;二是那些经典名著、畅销书、著名学者的著作等一直是具有很高流通借阅率的图书;三是公共课教学参考书、英语等级考试图书、部分考研参考书、计算机等级考试类图书等,由于考试的特殊性,此类图书也供不应求。针对以上要求的电子图书的批查重,就是将这些流通率大的图书输出到表单,再通过对书商订单进行批查重。得到的是和图书馆提供的书单部分重复的书单。2.3同一订单的重量通过数据库方法批查重可以去掉同一订单自身中重复的数据。3电子图书采购和批准方法针对上文对电子图书采购批查重类型的分析,笔者提出了解决两种类型批查重的方法。3.1电子图书间不同。云图书馆的馆藏图书包括两种,一是电子图书,二是纸本图书。每个图书馆查重也分两种情况:一是仅查电子图书之间不重复;二是要求电子图书和纸本图书之间不存在重复。3.1.1表“图书馆”的转换笔者调查过很多图书馆,这种针对电子图书的采购查重都比较简单,一般都是把图书馆馆藏导出来让电子图书供应商去查重,这样做存在两个问题:一是查重的准确度和过程得不到控制;二是如果同时采购几家电子图书的时候,由于供应商之间会存在重复的图书,如果不去重的话,就会导致重复购买。在这个情况下,根据笔者的经验,由电子图书供应商提供电子图书目录给图书馆,让图书馆自己查重,这样做很准确,也可以避免漏查的问题。下面详细介绍一下批查重的内容。首先将本馆的和供应商的电子图书目录分别转换成ACCESS格式,存储在同一个库中。在ACCESS数据库中,本馆的总电子图书目录表命名为“图书馆”,供应商的表按查重顺序分别命名为“书商1”、“书商2”等依次类推。第一步,选中窗体左边“查询”,然后点击“新建”,如图1,这样创建的查询可以在一个表中查找那些在另一个表中没有相关记录的记录(行),我们的目的就是在“书商1”表中查找在“图书馆”表中没有相关的记录(行),从而得到我们需要的图书馆没有的电子图书记录表。第二步,所建查询将列出下面所选表中的记录,并且那些记录将在下一步所选的表中没有相关记录。这里选择“书商1”。第三步,请确定在哪张表或查询包含相关记录,这里选择“图书馆”。第四步,请确定在两张表中都有的信息。这里选择我们作为查重的字段,比如ISBN,题名,作者,如果想做到精确查重,三个字段都选上,如果只做简单查重,那么选ISBN就可以。第五步,请选择查询结果中所需要的字段。这里一般把表“书商1”所有的字段都选择,因为在输出的查询中,电子图书供应商要根据这个表来为图书馆配置图书,那么他们是需要这些字段,才能做好匹配工作的。第六步,选中“查看结果”,点击“完成”后就得到查询的结果。第七步,将查询结果“导出”为.dbf格式存储,命名为“书商1采购书目”。如果只是做一个书商的查重,那么到这一步就完了,如果还要继续进行第二家电子图书商的采购,那么首先要将我们上面采购完的表“书商1采购书目”做为新增图书馆馆藏导入表“图书馆”合并,再重复进行上面的操作。这样操作的话,就不会出现重复采购的问题。3.1.2功能菜单,输出文件第一步,利用软件提供的功能将书商提供的电子图书定单转换成MARC格式。很多的书商交送的书目数据都是定长格式,而且多数为Excel格式。在这个模块里可以方便的将Excel转换成Marc文件,从而方便的进行查重。在转换之前一定要注意将Excel文件的第二行设置成为marc字段,如表1其它的字段可以分别命名为900a,900b,依次到900w,因为这个字段在这里意义不大,主要是方便转换时候的字段保留,在输出不重复订单时,这些字段还会被还原成原来的名字。最后把含“题名”的第一行删除。接下来,打开软件的功能菜单,如图2,选中Excel与Marc互转,在“Excel文件”那里,“浏览”选择需要转换的Excel表,再选择“另存”的文件名,“开始”进行转换得到.iso的文件。第二步,选择LIBINQUIRE功能菜单“利用书商完整Marc”,输入需要的“查重字段”,如200a,010a,010d,215d。可以选择几个字段匹配即认为是重复记录,这样就能完全达到筛除重复的图书。还可以选择“只选分类”,比如我如果只买经济类和计算机类,那我就写上F,T。“输出字段”这里就写书商提供的电子图书订单的所有字段,因为书商一般要根据这个订单上的字段来配送电子图书。缺少一个字段,可能都配送不了电子图书,这一点是我们应该注意的。“输出文件”选择存放查重后的订单的位置和名字。点击“开始”,即可完成此次查重工作,得到电子图书的订购单。3.2电子图书的安装需要采购的电子图书有一个特点:它们的纸本图书流通率大,读者借阅的多,供不应求。采购电子图书可以大大缓解图书馆与读者之间供需紧张的矛盾和节约图书馆采购经费。首先,要从图书馆自动化管理系统中按照流通率的高低将这一部分图书输出,图书馆可以根据本馆的财力要求,按月流通次数的多少,比如按月流通20次为最低购买标准,或者按月流通次数排名取前多少种,比如取流通率前10000名的图书。将输出的流通率大的图书转换成Access格式,取名“读者喜欢看的书”,将书商的电子图书目录也转换成Access格式,取名“电子图书”,两个表存储在同一个库中。然后,在Access中,“新建”一个查询,选择“设计视图”,分别选择“读者喜欢看的书”和“电子图书”,点击“添加”,按照本馆的要求,选择拖动“书名”、“ISBN”和“作者”分别进行连接,如图4。然后再运行,就得到一个两个表中按照条件重复的查询,再导出为Excel表,即为读者喜欢看的电子图书目录。当然,可能有的书商提供的目录中不包含这类流通率大的图书,可以从其它书商提供的订单中进行匹配。另外,如果图书馆同时从几个书商那里购买电子图书,那么书商之间的数据很难避免重复,那么必须把重复的数据挑选出来,从订单中剔除,这样做可以提高工作效率。在完成电子图书安装使用之后,图书馆进行电子图书的验收,那么就要使用此方法来检验书商安装的是不是图书馆订购的图书。即把订单和到货单进行对比,查询结果图书应该是100%匹配,这样可以防止书商有意在书单中搭配没有采购的电子图书或少采购电子图书。3.3利用表的作用进行去重的处理此外,在笔者的实际工作中,发现有的电子图书供应商为了增加可以出售的电子图书的数量有意混淆视线,将一些记录进行个别字段如ISBN的修改后,增加到选书的目录中提供给图书馆,或者有的书商干脆就是各个字段重复的图书。因为是针对别的表进行批查重,而没有查自己,实际上批查重是查不出这些重复记录的。当图书卖到你图书馆之后,负责采购的工作人员一般也很难检查出来,当然读者在阅读的时候会检查出来,不过很少碰到跟图书馆员反映的。所以必须在采购的时候进行去重处理。针对这个情况,笔者的方法就是把书商提供的目录放在一个EXCEL表中,进行批查重,删除相同的数据。第一步,新增加一列假设为B列,ISBN为C列,将B列标题行命名为“重复”,然后在B3插入一个公式:=IF(C3=C2,“重复”,);第二步,这个单元格的公式用鼠标扩展这个表的末尾,如果ISBN有重复的,就在B列单元格式返回一个值“重复”;第三步,把这个表复制到另一个新表,右键选择“选择性粘贴”,在弹出的对话框中选择“数值”,再将新表按B列进行排序,将含有“重复”的项删除就得到没有重复键值的表。也可以根据需要对题名,作者等进行去重。当然也可以使用ACCESS来实现这个目的。首先复制包含重复记录的表的结构,生成包含重复记录的所有字段的主键;然后创建并运行从原始表到新表的追加查询。由于主键字段不能包含重复记录,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论