中小型图书馆特色数据库建设的思考_第1页
中小型图书馆特色数据库建设的思考_第2页
中小型图书馆特色数据库建设的思考_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中小型图书馆特色数据库建设的思考

中国的大学特色数据库建设始于20世纪90年代。教育部2002年修订的《普通高等学校图书馆规程》第三章第十一条指出:“高等学校图书馆应根据学校教学、科学研究的需要,根据馆藏特色及地区或系统文献保障体系和建设的分工,开展特色数字资源建设和网路虚拟资源建设,整合实体资源与虚拟资源,形成网上统一的馆藏体系”。因此不少图书馆根据本地区或学校的专业特色建成了为本地区或学校教学科研服务的特色数据库,给读者提供更深层的服务。但笔者通过浏览一些特色数据库建设现状的调查文章中获悉,目前还有不少图书馆没有自建数据库。比如:隆茜等人对985高校图书馆的调查结果发现有部分985高校图书馆没有自建设数据库;刘圆圆等人对陕西省的39所本科高校图书馆进行调查显示,有13所没有建立特色数据库,约占全部的33%;陈京莲等人对江西省的73所院校进行调查显示,其中仅有32.88%的高校建有自己的数据库,近67%的图书馆没有自建数据库;王平对109所国家示范性高职院校图书馆进行调查发现只有18所图书馆的网站上建有特色数据库,只占国家示范性高职院校图书馆的16.5%。从以上调查数据可看出,大型图书馆一般都建有自己的特色数据库,而中小型图书馆未建特色数据库的情况较多。究其原因是:大型馆不但资金多,技术人才也多,这些图书馆的技术力量相对雄厚,完全有能力、有实力开发出具有本校特色的数据库。普通中小型图书馆因为资金、设备、技术及人员力量相对薄弱而无法开发出自己的特色数据库。那么中小型图书馆如何在资金欠缺、技术力量相对薄弱的情况下也能建成本馆的特色数据库呢?下面以庐陵文化数据库建设为例,详细阐述了利用一些常用软件,来提高数据库建设效率、降低建库成本的实践经验,期望对其它图书馆在建设特色数据库的过程中有所帮助。1特色数据库建设中的应用程序1.1数据采集及数据库的利用特色数据库建设中的数据来源,除了将自有资源数字化外,更主要的就是通过网络资源检索获取。在数据采集过程中,为了达到收全相关数据的目的,数据采集通常会通过不同的数据库、不同的检索途径等进行检索,有的甚至会通过“全文入口”进行深层次的信息挖掘,因此数据采集及数据校对的工作量非常大,而数据的质量又直接影响到数据库建设的质量。在经费有限的情况下,我们充分利用一些常用软件的功能,来协助数据采集、数据质量控制等工作,以确保数据库建设的质量,提高工作效率。1.1.1数据库网站限制在采集庐陵文化数据库有关数据中,有的检索词获取到的结果相当多,中国知网的个性化功能非常强,采集人员可根据自己的需要、使用习惯等订制所获取到的结果,但有些数据库网站却限制颇多,如果一条条的复制粘贴检索记录,费时又费力。EXCEL具有导入外部数据的功能,既能导入一般的文字资料也能导入WEB中的数据,因此我们借助EXCEL的这个功能来帮助下载检索到的结果,给庐陵文化数据库建设的数据采集工作提供了非常大的便利。1.1.2对引导数据进行清除通过不同的数据库、不同的检索策略、不同的检索途径特别是“全文入口”进行检索操作时,不但会获取到大量格式不同,内容重复的数据记录,而且存在不少与我们研究无关的数据记录。WORD、EXCEL中的查找功能可帮助快速查找出内容相同的条目进行剔除,这种方法虽然比传统手工剔除冗余数据来的方便,但比起EXCEL的排序功能,却略显不足。所以笔者利用EXCEL的排序功能,对各个字段进行不同的排序,对采集到的庐陵文化数据中的重复、漏字或错字的数据,进行删除和修改。对于要浏览全文后才能确定去留的数据记录,笔者利用了CAJ浏览器的查找定位功能帮助快速过滤掉不符合要求的数据。比如:在中国期刊全文数据库中,当在“全文”入口中输入“欧阳修”进行搜索后,检索出2000余条记录,在需要浏览全文才能确定某记录是否符合要求时,笔者就在CAJ浏览器中输入“欧阳修”进行查找,通过它的查找定位,很容易就能确定该记录是否与本研究有关,省去不少浏览的时间,提高了工作效率。1.1.3储存工具忘带采集到的数据资料,经常需从一台电脑传送到另一台电脑,特别是使用公共场所的电脑操作时,必须及时将它转移。在转移的过程中时常会碰到储存工具忘带或电脑提示储存工具容量有限等情况,为了减少储存工具染上病毒的机率,在网络正常的情况下,多数人通过EMAIL进行资料的传输转存。尽管如今很多网站中的EMAIL容量超大,但受电脑配置、网速等条件的限制,使用一般的方法发送附件为几百兆的邮件,成功率几乎为零。笔者通常利用实时聊天工具QQ来帮助解决以上难题。1.2辅助管理文件庐陵文化数据库建设在经过一年多的数据采集后,硬盘或储存工具中的文件越积越多,要快速从中找出一个特定的文件非常费时,因此我们利用了WORD及EXCEL的超链接功能协助管理这庞大的文件资料。即在WORD、EXCEL中建立相应文件的有关题录信息,并设置好快捷链接键(链接点可以是本地硬盘、网址等)。这样我们只需点击这个链接就可直接打开该文件进行相应的操作。2注意事项2.1引进数据的处理在数据采集过程中,如果你还是习惯将检索结果保存成WORD形式,那么它们固有的结构不要随意改变它,这有利于下一步数据的处理。比如:中国知网中检索出的数据通过存盘操作后,可获取到创建数据库所需要的所有字段内容的索引形式,如果要人工去按字段内容逐一复制、粘贴到EXCEL数据库表中相应字段之下的话,非常费时、费力。我们可以利用WORD中的查找替换功能,将获取到的数据处理成容易被EXCEL导入的文件格式。2.2文件的格式转换当需要把文档中的数据资料记录导入到EXCEL数据表中时,该文件必须转成纯文本文件格式,即记事本格式,这样EXCEL才能通过指定的字段分隔符,顺利的将文本中的各条数据记录读到EXCEL数据库表中相应的字段下。2.3在清除图书资料问题时,对相关的检索结果具有错误在导入《读秀数据库》中的图书文献数据时,有时导出的数据与实际检索的数据不符。如笔者在利用EXCEL导入读秀中有关欧阳修、周必大、孔平仲等人的图书资料题录信息时发现,其导入的结果与实际检索结果有出入。所以在利用EXCEL下载该数据库中的数据记录时,要对比所导入的数据与原始数据是否一致。2.4web搜索数据在导入Web搜索引擎中的数据时,搜索结果页面不能是新弹出的网页窗口,否则无法将检索结果导入到EXCEL中。2.5文件传达当利用QQ传送的是一个大于10M甚至几百兆的文件时,这时帮你接收文件的QQ必须在线。3通过程序构造自动下载目前,数据采集主要有3种方法:(1)直接从数据库商处获取数据库数据;(2)在数据库商的网站上通过检索得到检索结果;(3)通过程序构造自动下载。其中,第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论