下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、我国数据库整合的现状及其发展Status quo and Development on Database Integratation in China陈利涛(中国科学院国家科学图书馆兰州分馆,甘肃 兰州 730000) 摘 要 本文论述了我国数据库整合的现状、存在的问题,指出了数据库整合今后应该加强的五个方面。 关键词 数据库 信息资源 资源整合1我国数据库整合的现状:根据近年来对资源整合的研究和实践,资源整合应该包含两个层面的含义,第一层面是源整合,第二层面则是数据的整合。所谓源整合是针对数据库人口,按各种分类原则进行标引,提供给用户统一的数据库检索人口;数据整合则是深人到数据结构,通过统一
2、的检索机制实现异种库的检索。在实践中,这两个层面会发生交叉和重合。源整合是当前数字图书馆资源整合的主要模式,而且比较成熟,从实践的情况来看,可以分为导航整合和平台整合。从理论上讲数据整合需要对数据进行组织和管理,因而可以超越源整合的局限性,提供数据挖掘的可能。但由于数据库厂商的迅速增加,信息服务方式的不断改进和变化,数据整合也就有本地和网络的两种不同模式。国内目前在导航和平台方面的整合做得比较好,大多数的信息服务单位都在主页上做了导航栏目。平台整合方面也出现了成熟的产品,如清华同方的异构统一检索平台USP、TRS资源整合门户(TRSIIP(2.0)、URS 一站式检索系统和汇文一站式检索系统。
3、这些系统的共同特点是通过中间技术,构建了一个统一的检索平台。它们可以帮助用户同时在多个数据库中进行检索,并同时得到多个数据库的结果,避免了需要逐个登录数据库、输入检索条件的麻烦,使用户能够方便地访问异构数据库和实现跨库检索。数据整合方面国内要逊色的多,可以说是处于起步阶段。本地数据整合做的比较好,如万方数字资源系统、CNKI数字图书馆等都实现了自己本地数据库的整合检索。网络数据整合由于生产厂商和指导思想的无序状态,导致了整合过程困难重重,尤其是和国外相比我们更加落后。目前在国内高校应用广泛的Web of Knowledge,就是对于网络数据标准接口模型的很好诊释。我们知道ISI体系突出的特点是
4、以Web of Science为核心,不仅建立起包括期刊、会议录、专利在内的多种类型文献之间的相互引证、相关参考的关系,而且还实现了对拥有使用权限的全文文献以及事实数据的链接。而且比ISI更有潜力的是来自以色列的学术资源整合体系SFX也显示出了它的强大生命力,该系统已经实现了对ISI, CSA, OVID, UMI, EBSCO, Elsevier, High-Wire等著名数据库厂商的整合。SFX不仅能完成从二次文献到全文的链接,还能实现从文摘到文摘、全文到全文的链接,也就是所有数字资源的融合。2我国数据库整合过程中存在的问题目前在国内信息服务市场上,形形色色的数据库很多,但利用率高、影响范
5、围广、市场份额大的基于互联网的中文学术期刊数据库有四个:即:中国期刊网专题全文数据库、中文科技期刊全文数据库、万方数字资源系统中的数字化期刊和人大资料全文检索系统。但由于我国数据库开发的各自为政,数据库建设存在着收录信息不完全、标引不规范、检索界面不够友好和浏览器的不通用等缺点,因而造成数据库整合时存在着许多问题,总结起来主要有:缺乏统一、协调的管理思想,造成了信息资源整合中的重复建设。目前,无论是数据商之间,还是图书馆之间,都缺乏统一、协调的管理思想,各搞一套,造成了信息资源整合中的重复建设。而且相关数据库的重复现象也比较严重。以数字资源的导航系统为例,目前高校图书馆都在建设自己的数字资源导
6、航系统,而高校图书馆大多数是CALIS的成员。例如中国期刊网专题全文数据库收录6100多种期刊,维普科技期刊收录期刊总数约有10000多种,却有相当多的期刊与前者相同;万方数字化期刊全文原则上只收录核心期刊,但几乎被中国期刊网专题全文数据库包含。缺乏规范、统一的著录和分类标准,造成各整合系统间难以兼容。不同的数据商开发的数据库在数据结构、字段上都不相同,并且拥有各自的检索系统,因而在检索方式、检索式构造规则、检索算符、检索字段等上都存在着差异。这对实现同一检索平台下的分布式检索造成了困难。数字资源导航存在着先天不足,必然成为数字资源整合过程中的过渡阶段。数字资源导航在建设之初,就存在着先天不足
7、。它的导航系统仅定位在数字资源的形式层,而不能提供内容层面上的服务。一方面,读者不能按主题、作者查询文献,如当读者不了解所查询的主题在哪本期刊时,仍不得不对可能包含此主题的数据库进行逐次查找。另一方面,有的数据商、出版商并没有提供充分的URL信息,因而数字资源的导航系统仍只能进入到所在数据库的界面。因此,不难发现基于数字资源导航的整合,仅实现了按形式整合的功能,这种整合必然成为向内容整合的过渡阶段。缺乏对多媒体资源和网络信息资源的整合,也缺乏主动服务的机制。现阶段,数据商和图书馆进行的数字资源整合,主要是对已经公开出版发行和自建的文献信息进行整合,这些资源绝大部分仍是文本信息,音频和视频信息缺
8、乏。对少数含有图片、音频和视频的信息,也没有提供相应的检索途径。同时,在信息的服务上,大多数仍采用被动服务,缺少主动的信息发布服务,用户无法通过预先设定的信息需求,随时获得最新的信息。3我国数据库整合今后的发展经过多年的努力,我们虽然在信息资源建设方面取得了可喜的成绩,但相对我国众多的人口来说,信息资源还是显得匮乏。为了让有限的信息资源更好的为我国经济建设服务,必须做好资源的整合工作。为此我们必须在以下五个方面加大努力:在数字资源整合的建设上,要协调发展,大力合作,避免重复建设。在整个建设过程中,必须总体规划,长远布局,做好信息资源的管理、加工和服务层面的整合,树立大信息观,从信息发布的源头开
9、始整合。:图书馆应尽可能地选择同一检索平台,并尽可能地利用数据商整合的平台和数据资源,同时应采用规范的标准框架体系。在整合数字资源的组织上,要实现各种数字资源要素的结构性优化和相关数据库内的数据对象重复信息的去除。在数字资源类型的整合上,可以借鉴ISI的成功经验,实现从目录、文摘、全文、引文等的无缝链接;在数字资源的载体上,要实现从文本资料到图片、音频资料、视频资料及网络信息资源的查找。在数字资源整合的基础上,要推出集成化的主动信息服务。这点TRS资源整合门户做得比较好,它有专门用户个性化功能模块,其中包括自定义的检索服务、主动的信息发布服务、智能化的检索代理服务等。数字资源系统的开发过程中要
10、注意与国际标准接轨,与其他系统的兼容;注重对资源配置知识库的建立和积累,减少用户使用系统的难度;在开发跨库检索的同时,也要注重建立文献的链接机制;选择合理的整合链接技术和架构,提高系统响应性能;加强个性化定制和服务功能,这是跨库检索和资源整合在实际中的落脚点。加强各数据库间的知识关联度,实现一体化综合整合。一体化综合整合是指在OPAC资源整合系统和数字图书馆资源整合系统之间建立多维关联,以形成更为优化的图书馆资源整合系统,为用户提供统一友好的检索界面。INNOPAC公司推出的MAP(Millennium Access Plus)就是这样一个集成的资源整合系统,它可实现不同WEB学术信息资源的动
11、态链接。而我们现在使用的大多数据库都以一种零散孤立的状态存在着,即使若干个库捆绑在一起,也仅仅局限于使用同一界面的层次上,体现不出文献内在的联系。而人类的知识是一个相互联系的有机整体。一个高级的信息资源系统应该能够反映知识间的相互联系。ISI凭借其独特的引文机制和WWW的链接特性,不仅建立起了多种类型文献之间的相互引证、相互参考的关系,而且还实现了对拥有使用权限的全文文献以及事实数据的链接。为了更好的促进科学研究与技术创新之间的相互促进与转化,我们必须在整合数据库统一检索界面的同时,加强各数据库之间的关联度的揭示,构建动态的相互关联的学术资源整合门户,使得科学研究人员在进行基础研究的同时,能够
12、掌握各自领域的最新研究动态,从而为科学研究提供全方位的资源保障。加强基于知识体系的资源整合。知识体系的资源整合方式是基于数字图书馆应用系统的一种资源整合方式。这是当前数字资源整合的一种新模式。它的主要优势有:能够整合多种媒体多种渠道的信息;能够实现不同类型、不同级次资源间的链接;能够保持知识体系的整体性和关联性。这种方式也可以说是加强知识之间关联度的一种具体方法。如中国人民大学图书馆利用中国文津信息技术研究中心开发的数字图书馆应用系统,系统整合经济学学科研究领域的核心知识和相关知识,建立了“中国人民大学经济学学科资源整合系统”。 总之,信息资源整合工作是一项复杂的工作,我们必须在实践中不断探索
13、,坚持“有所为有所不为”的原则,因为在实际中将所有资源整合在一个平台上进行跨库检索是不可能的。我们必须了解最终用户的需求,明确本馆的资源状况和目标,把握系统的功能以及可伸缩性和可扩展性.做好各个数据库之间的关联度的揭示,这样不仅可以给用户提供丰富的、有价值的资源内容和方便灵活的检索手段,而且还可以按学科、课题给他们提供个性化的定制和主动推送服务,从而缩短信息传递与反馈的速度,减少信息处理的费用,降低信息与信息服务的成本,提高资源的使用效率,发挥信息资源的整体效益和规模效益。 参考文献 1 黄美君, 姜爱蓉. 合适的链接 最佳的服务SFX与CrossRef/DOI交互作用探讨J. 图书情报工作,2006,(3):91-94。 2 刘宇,邹东伟,熊拥军. 数字图书馆信息服务平台建设J. 高校图书馆工作,2006,(4):31-34。 3 陆思东. 浅谈网络环境下的信息资源整合J. 科技情报开发与经济,2006,(15):16-18。 4 黄晓斌, 夏明春. 数字资源整合研究的现状及发展方向J. 情报理论与实践,2005,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年浙教版小学信息技术六年级下册(期末)综合测试卷及答案
- 企业晚会安保实施方案
- 端午节产品促销活动方案
- 眩晕护理中的呼吸管理
- 给药治疗的药物应用
- 洗面护理的教学方法
- 山西大学附中2025-2026学年第二学期高三5月模块诊断(第十六次)语文+答案
- 消渴的中医病因病机与护理
- 2026年买回建地合同(1篇)
- 新冠疫情下的护理团队协作模式
- 公共关系与人际交往能力智慧树知到期末考试答案章节答案2024年同济大学
- 幼儿园《认识医生和护士》课件
- 肿瘤标志物的检测与临床意义
- 2024年湖南省融资担保集团有限公司招聘笔试参考题库含答案解析
- 散文内容要点概括(一):特定信息概括、主旨情感概括【要点精讲+拓展提升】 高考语文一轮复习之散文阅读精讲课件
- 重卡结构爆炸图-中英文对照教学课件
- GB/T 4798.3-2023环境条件分类环境参数组分类及其严酷程度分级第3部分:有气候防护场所固定使用
- SH/T 0642-1997液体石油和石油化工产品自燃点测定法
- GB/T 3799-2021汽车发动机大修竣工出厂技术条件
- GB/T 14699.1-2005饲料采样
- GB/T 13824-2015旋转与往复式机器的机械振动对振动烈度测量仪的要求
评论
0/150
提交评论