




已阅读5页,还剩61页未读, 继续免费阅读
(图书馆学专业论文)论数字图书馆虚拟馆藏的建设.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 数字图书馆虚拟馆藏是一个信息资源环境,这个环境的建设指 的就是图书馆的工作人员将网络信息资源进行科学的搜集、组织、 整理,再将其中有价值的信息资源提供给广大图书馆用户使用的这 样一个过程。在我国现阶段,进行数字图书馆虚拟馆藏建设相关问 题的研究与探讨具有很强的理论意义与现实意义。 在本文中,首先介绍什么是数字图书馆的虚拟馆藏与现实馆藏 以及它们相互之间的关系,阐明了虚拟馆藏的构成、特点,着重探 讨在网络环境下,数字图书馆虚拟馆藏的组织方式,其中包括指引 库的建设、专业信息服务网站的开发和网络检索工具的利用等。在 分别介绍了国内外虚拟馆藏资源建设的现状的前提下,指出我国虚 拟馆藏资源建设的差距并进一步对我国数字图书馆虚拟馆藏资源的 建设提出了一些建设性的建议。最后对数字图书馆虚拟馆藏建设所 涉及到的相关问题,如联合开发问题、知识产权问题、信息安全问 题、人员问题等等进行了全面、系统的探讨。 关键词:数字图书馆 网络信息资源 虚拟馆藏数据库 网络信息服务 a b s t r a c t t h ev i r t u a l s t o r a g e o f d i g i t a ll i b r a r y i sa ne n v i r o n m e n to f i n f o r m a t i o nr e s o u r c e s t h ec o n s t r u c t i o no ft h ee n v i r o n m e n tr e f e r st o t h ep r o c e s st h a tt h el i b r a r ys t a f fc o l l e c t ,o r g a n i z ea n dp r o c e s st h ec y b e r i n f o r m a t i o nr e s o u r c e si nas c i e n t i f i cw a y , a n dt h e np r o v i d et h el i b r a r y u s e r sw i t ht h o s ev a l u a b l ei n f o r m a t i o na m o n gt h e m t h em a i np u r p o s eo ft h ee s s a yi st oe x p l o r et h ec o n s t r u c t i o no ft h e v i r t u a ls t o r a g eo f d i g i t a ll i b r a r y ,t h e s e c o n dc h a p t e rc o v e r st h e o r g a n i z a t i o no fv i r t u a ls t o r a g eo fd i g i t a ll i b r a r y t h et h i r dc h a p t e r i n t r o d u c e st h ee x i s t i n gs i t u a t i o no ft h ec o n s t r u c t i o no ft h ev i r t u a ls t o r a g e o f d i g i t a ll i b r a r yi no u rc o u n t r ya n df o r e i g nc o u n t r i e s ,a n dac o m p a r i s o n s t u d yi sm a d e t op i n p o i n tt h ed i s p a r i t i e s t h ef o u r t hc h a p t e re x p l o r e st h e r e l a t e dp r o b l e m si nt h ec o n s t r u c t i o no ft h ev i r t u a ls t o r a g eo ft h ed i g i t a l l i b r a r y , i n c l u d i n gt h ei s s u e so f j o i n td e v e l o p m e n t ,i n t e l l e c t u a lp r o p e r t y , i n f o r m a t i o ns e c u r i t y , e t c k e yw o r d s :d i g i t a ll i b r a r y v i r t u a ls t o r a g ed a t ab a s e n e t w o r ki n f o r m a t i o nr e s o u r c e s n e t w o r ki n f o r m a t i o ns e r v i c e s 引言 数字图书馆虚拟馆藏具体说来,就是一个馆藏资源环境,在这 个环境中,图书馆的读者( 用户) 可以借助数字图书馆提供的现代 通讯设备检索利用馆外的信息资源。虚拟馆藏涵盖的范围很广,既 包括数字图书馆自身开发的放在互联网上供用户检索利用的数字资 源,又包括通过图书馆提供的现代通讯设备在互联网上可以检索到 的一切网络信息资源。虚拟馆藏的建设指的就是虚拟馆藏资源环境 的建设,具体说来就是图书馆的工作人员对互联网上各种信息资源 进行搜集、整理并提供给广大图书馆用户使用的这样一个过程。在 我国现阶段,加快数字图书馆虚拟馆藏的建设具有很大的现实意义: 首先,数字图书馆虚拟馆藏的建设可以通过选择、搜集整理国际互 联网上的免费资源为我国图书馆的馆藏资源提供有效的补充;其次, 自主的中文虚拟馆藏资源的开发建设将极大的改善互联网上中文信 息匮乏的现状;第三,它所提供的虚拟馆藏环境可以为单个的中、 小图书馆营造出一个良好的虚拟馆藏资源环境,有效地弥补这些图 书馆馆藏不足的现状。 在本文中,笔者首先介绍了什么是数字图书馆虚拟馆藏,以及 虚拟馆藏的构成、特点,着重探讨了在网络环境下,数字图书馆虚 拟馆藏的组织方式。在分别介绍了国内外虚拟馆藏资源建设的现状 的前提下,指出我国虚拟馆藏资源建设的差距并进一步对我国数字 图书馆虚拟馆藏资源的建设提出了一些建设性的建议。最后对数字 图书馆虚拟馆藏建设所涉及到的相关问题,如联合开发问题、知识 产权问题、信息安全问题等等进行了全面、系统的探讨。 本文的基本框架如下: 第一章是介绍什么是数字图书馆的虚拟馆藏。其中第一节简要介 绍什么是数字图书馆。第二节则分别介绍什么是数字图书馆的虚拟 馆藏、现实馆藏以及它们相互之间的关系。第三节阐述数字图书馆 虚拟馆藏的构成。第四节介绍虚拟馆藏的特点。 第二章探讨数字图书馆虚拟馆藏的组织方式。分别从指引库的 建设、专业信息服务网站的建设和网络检索工具的利用三个方面进 行探讨。 第三章是在分别介绍国内外数字图书馆虚拟馆藏资源建设的现 状的基础上进行对比分析,指出我国与m ; t - 的差距并阐述国外虚拟 馆藏资源建设的经验对我国的借鉴意义。其中,第一节介绍国外数 字图书馆虚拟馆藏资源建设的现状,第二节介绍我国的现状,第三 节指出我国的差距及国外数字图书馆虚拟馆藏建设的经验对我国的 借鉴意义。 第四章对数字图书馆虚拟馆藏建设的相关问题进行探讨。其中 第一节分析虚拟馆藏的联合开发问题,第二节分析虚拟馆藏涉及到 的知识产权问题,第三节分析信息资源安全问题,第四节介绍涉及 到的人员问题。 第一章 数字图书馆虚拟馆藏的构成与特点 第一节数字图书馆概说 数字图书馆是一项崭新的事物,它的提出,并不是源自于图书 馆自身,而是信息化社会不断发展所造成。图书馆数字化的外部直 接动因有两个,一是信息载体的数字化,二是信息传播的网络化。 有史以来,图书馆第一次可以借助计算机和网络的力量突破时空的 藩篱而将服务提供给任何的读者。数字图书馆的出现给图书馆事业 的发展带来新的契机,尽管目前图书馆界对于它的认识还很不一致, 但数字化对图书馆的影响是无可回避的事实,时间跨入二十一世纪, 图书馆的数字化是一个必然趋势,必将成为2 1 世纪图书馆事业发展 的主旋律。 什么是数字图书馆? 国际图书馆界至今仍是各说纷纭,莫衷一 是。国内外的图书馆学专家对于数字图书馆这个概念虽然有不同的 认识与剖析,但我们注意到,这些认识都体现出数字图书馆这个新 兴事物的以下几方面的特点:一、数字图书馆是一个多媒体的数字 信息资源库,海量的信息、数据以文本、图形、声音等形式存储于 磁介质( 硬盘、磁带机) 、光介质( c d - r o m ) 及磁光介质( m 0 ) 上, 供人们随时调用、查阅;二、在虚拟的网络空间中存在的数字图书 馆在地理上是分布式存在的,通过计算机网络实现远距离访问与跨 库查询。作为一个图书馆群体的概念,可以说,数字图书馆是由一 个地域或国家的众多图书馆、信息资源单位组成的联合体;三、数 字图书馆内的信息组织必须按照标准格式进行,也就是说,数据库 中的一切信息资源都是有序的,标准化的进行组织和管理的;四、 数字图书馆是在计算机网络上运行并以网络为访问媒介的,通过宽 带高速网络实现对图书馆中数据的大量存取;五、数字图书馆的开 发与建立可以说是当代四种先进技术计算机、通讯和网络技术、 高密度存储技术以及多媒体技术有机结合的产物,并且还引进 了大量数据库技术及概念,如数据仓库,数据挖掘技术,数据推进 技术等:六、数字图书馆为读者提供了方便、快捷、全面的服务。 数字图书馆不是简单的数字馆藏,它不等于将图书馆的馆藏的 数字化,以及网上资源的电子版,数字图书馆严格说来是数字文档, 是物质上的数字典藏,实质上的数字服务。数字图书馆是向用户群 体提供便于查找和利用的、庞大的、经过组织的信息、知识存储文 档的系统。数字图书馆从真正意义上说更是一个环境,它将收藏、 服务和人融合起来,以支持数据、信息乃至知识的全部流程,包括 从创造、传播、使用到保存的全过程。 第二节数字图书馆的虚拟馆藏与现实馆藏 图书馆的馆藏,是传统图书馆赖以存在的基本物质前提,馆藏 量的多少往往标志着一个图书馆的规模与实力,它们常常是被用来 衡量一个图书馆的规模、实力的主要标准,一个图书馆所收藏的文 献资料的多少成为其实力与利用价值的象征。图书馆的大部份日常 工作都是围绕着馆藏的收集、加工、保存与利用来进行,但是在数 字时代,这种情况出现了变化。 图书馆馆藏从传统层面上来说,主要指的是图书馆所收藏的各 种文献资料,这些文献资料往往是现实生活中有形的载体,以纸质 印刷型的图书、期刊为主,对于馆藏的建设,传统图书馆主要以“自 己采集、自己加工、自己占有、自己积累、自己利用”为形式,以 直接购入为文献采集方式,形成独立而又封闭的馆藏模式。在这种 状况下,馆藏发展的指导思想是收集用户当前所需和将来可能需要 的全部资料并在本馆加以存贮。在馆藏质量的评价方面,强调书刊 采访的质量、所评价的对象是文献本身,如馆藏的质量、结构、重 点等。因为处于印刷型文献占主导地位的信息环境中,传统图书馆 所采购的书刊往往是经过出版商过滤( 根据出版政策和自身利益) 之后的正式出版物,即第二手资料。 2 0 世纪9 0 年代以来,随着计算机、远程通讯技术的发展和互联 网的迅速扩展,用户通过网络利用多媒体信息的需求越来越高。图 书馆作为传统的信息流通和中转机构,一直是社会信息网络的一个 重要节点。互联网是一个开放的系统,电脑网络的日益普及,使得 它所提供的信息量正在以惊人的速度增长。图书馆的工作人员将网 络上的这些信息资源进行科学的组织,再将其中有价值的信息资料 提供给读者,从而形成了一种图书馆的新型资源。这样,具体到某 一个数字图书馆来说,它的馆藏就由两大部份构成:一是现实馆藏, 另一部份是虚拟馆藏。 现实馆藏,也就是图书馆自身采集收藏整理的资源,通常指本 馆可以利用的为读者服务的所有馆藏,包括传统的文献资源、馆藏 书目信息数据库( 读者数据库、流通信息库等) 和电子出版物( 如 图书馆购买的光盘的数据库) 以及图书馆与他馆合作建设或自主开 发的数字信息资源等等。现实馆藏的所有权归各个馆,可以自由支 配,是获取信息资源最直接最经常的保障性资源,当前及未来的很 长一段时间,它仍然是图书馆藏书建设中起主导作用的一部份资源。 虚拟馆藏。数字图书馆代表的是一种新的基础设施和知识环境, 数字图书馆虚拟馆藏具体说来,就是一个馆藏资源环境,在这个虚 拟的馆藏环境中,图书馆的用户可以通过本馆计算机系统与通信设 备在互联网上共享馆外信息资源,通过联网获得本不属于图书馆自 身拥有的信息资源。由于图书馆可以通过网络连接检索到其它图书 馆的馆藏资源并提供给用户,无形中这部份资源也变成了图书馆馆 藏的一部份。我们就把这一部份资源称之为该图书馆的虚拟馆藏。 与此同时,该图书馆自身的馆藏也可以通过联网为其它图书馆的用 户检索利用,成为其它图书馆的虚拟馆藏。所以,数字图书馆的虚 拟馆藏的建设与利用是一种真正意义上的共建共享。 现实馆藏和虚拟馆藏是一个整体,共同构成了数字图书馆的馆 藏资源。现实馆藏与虚拟馆藏又是一种相互补充的关系,自有馆藏 既是本馆的现实馆藏,又是其它馆的虚拟馆藏。本馆对现实馆藏具 有更新、修改、利用和支配的权利,是获取信息最直接最经常的保 障性资源;对虚拟馆藏有共享权,一般没有更新、修改和支配的权 利。 网络环境下的现代图书馆所拥有的信息资源有以下几个特点: 从载体形式上看,馆藏文献信息资料的种类更加丰富多样:从馆藏 文献的构成比例看,数字化的电子文献在馆藏中所占比例逐步增加: 从文献资料的分布看,不仅有本地馆藏文献信息资料,而且有异地 信息资料;从馆藏文献的利用率来看,电子文献的利用率呈上升趋 势,而传统印刷型文献的利用率相对来说,呈下降趋势;从馆藏文 献的信息服务功能看,电子文献相对于传统印刷型的服务功能更加 丰富多样,服务效率更高。 现代图书馆的信息资源数量之巨大、种类之繁多、分布与传播 之广泛以及存取和利用方式的多样性、信息传递的速度等都远远超 过了传统的,或是非网络化信息资源管理方式和技术手段所能涵盖 的范围。馆藏文献的载体和存在形式发生了变化。纸质文献、缩微 文献、声像文献、电子文献及虚拟馆藏并存互补,电子文献在图书 馆的馆藏中的地位与作用日趋重要,图书馆的价值不再主要以其所 拥有的馆藏规模来衡量,而是以它为用户提供所需的所有各种形式 的信息能力来衡量。数字图书馆的馆藏评价不仅以本馆拥有的实际 馆藏为标准,而且应以图书馆在整个信息环境中为用户提供的选择 性信息的存取信息能力为评价对象,注重在网上存取信息的质量, 对于数字图书馆而言,检索质量比收藏质量更加重要。从馆藏信息 来源这个角度来说,在数字图书馆时代,用户可以采集到科研人员 的通讯、讨论等第一手资料,比如采集通过网络上的电子论坛、电 子公告随时发布的最新消息,将这些有价值的信息提供给用户,而 不需要出版商的介入,这样的情况下,图书馆采集电子化的灰色文 献的可能性大大增加了。数字图书馆的文献采集方式可以采取多种 形式,如入网、租用、复制等,而且许多是免费的。 总而言之,数字图书馆是以计算机可处理的数字形式存储信息。 资源数字化不仅摆脱了传统馆藏受馆舍不足的限制,并且其信息的 收藏范围从广度和深度上远远超出传统图书馆。就其广度而言,不 仅本馆的馆藏,全球网络上的经过筛选整理的任何信息资源都可集 中于一个数字图书馆中;就其深度而言,不再局限于信息整体,更 注意信息内容的深度。 第三节数字图书馆虚拟馆藏的构成 数字图书馆的虚拟馆藏从外部形态上来说,是以数字化的形式 把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸 质载体上,并通过网络通讯或终端等方式再现的信息资源,它包括 网上数据库、光盘、电子图书、电子报刊、多媒体等类型。在现实 情况下,数字图书馆的虚拟馆藏可以理解成为“通过该数字图书馆 的计算机网络可以检索、共享的其它服务器上的各种信息资源的总 和”。 一、虚拟馆藏的构成: ( 一) 网上数据库 数据库是按一定规范组织的数据集合,其特点是一次输入多次 使用,便于计算机处理、数据传输和信息技术的多方面的加工利用, 冗余性小、利用率高、独立性强、共享性好,提供方便、快速和有 效,不容易被侵权复制,保密性好,使用价值大等。 网上数据库主要包括联机检索数据库和光盘数据库。联机数据 库兴起于2 0 世纪6 0 年代,到8 0 年代达到顶峰,其实质是数据库与 通信的结合,即用户使用终端设备远距离地从联机检索中心迅速准 确的获取信息,联机检索数据库数量众多,数据质量可靠,信息附 加值高,查准率、安全性都比较好,但它同时也存在着费用昂贵, 1 检索指令复杂,受到终端所在地点的限制等缺陷。进入2 0 世纪9 0 年代,信息高速公路的建设、互联网的高速发展,网上出现的丰富 的信息资源和多种多样的简便快捷的检索工具使联机检索曾一度跌 入低谷,但联机检索数据库通过与互联网的结合,为自身寻找到了 新的发展空间。 光盘数据库兴起于2 0 世纪7 0 年代,它将信息存储在光盘上供 用户检索,光盘数据库以其大容量、低成本、低费用等优势得到了 快速的发展。光盘数据库与网络的结合为用户提供了更为方便全面 的服务。 ( 二) 网上电子出版物 网上电子出版物是指在网络环境中编辑、出版、发行的出版物 以及印刷型出版物的网络版,包括网上图书、网上报纸、网上期刊 等等。现有的网络技术为网上出版物的发展提供了一个很好的环境, 网上图书日益增多,其中网上参考工具书更是独树一帜,百科全书、 辞典、手册、名录等这些网络版的参考工具书使用起来方便快捷。 因为期刊的出版要求周期短、内容新、发行快,因而网上期刊在数 量上超过网上图书,目前互联网上有上万种电子期刊向网络用户提 供服务,其中许多都是免费提供。另外,网上报纸近几年也在迅速 发展之中。电子出版物的优点是存储密度大,容量大,携带和运输 方便,使用寿命长,能长期或永久保存,便于信息的及时传播和快 速检索。 ( 三) 网上( 联机) 馆藏目录数据库 据了解,外国及台、港、澳的全文数据库在互联网中所占份额 尚不足三分之一,数字图书馆都以书目、索引作为自己的重点。以 我国书目、索引基础较差、数量少、质量不高的现状来看,以书目、 索引数据库为重点一来可以提高检索效益二来又可以促进馆际书刊 互借,易于开展合作,这些都为馆藏的共建共享奠定了良好的基础。 目前已有六千多个数字图书馆的馆藏机读目录数据库通过互联网对 外开放,这样,无论用户身在何处,都可以通过目标图书馆的u r l 查询目标图书馆的馆藏,克服了时间、空间的限制,这也是网络环 境下的现代图书馆优于传统图书馆之所在。 ( 四) 馆际之间共享的数据库 馆际之间共享的数据库有两种类型,一种是由若干个图书馆联 合开发的数据库,在这几个图书馆之间实现馆际共享,另一种是由 某一或是若干个图书馆自主研制开发的并放在互联网上以免费或是 收费方式提供馆际共享的数据库资源。 ( 五) 网上动态信息 网上动态信息纷繁复杂,从信息内容来看,几乎无所不包,既 有政府机构发布的官方消息、政策法规、通告、会议讯息、也有学 术机构的论文集、会议摘要、研究成果,还有经济、金融信息、商 业广告、产品信息、知识性教育性信息,新闻机构的网上新闻等等, 数字图书馆的用户通过搜索引擎等现代网络检索技术可以检索利用 这些网上动态信息,互联网上的动态信息是数字图书馆虚拟馆藏的 重要组成部份。 ( 六) 其它类型的信息 除了以上介绍的几种信息资源,数字图书馆虚拟馆藏还包括多 媒体信息产品等其它类型的信息。多媒体信息产品的特点是将视与 听,图、文、数字融为一体,逼真、生动和形式活泼,而且还具有 交互性,十分诱人。 二、数据库资源是数字图书馆虚拟馆藏资源的核心 数据库方式是对大量的规范化数据进行管理的技术,它可以大 大提高信息管理的效率,因为数据库的最小存取单位是字段,所以 可根据用户需求灵活的改变查询结果集的大小,从而大大降低了网 络数据传输的负载。数据库是数字图书馆虚拟馆藏资源中最重要的 一部份资源,作为一种发展最早、影响最广的电子信息源,数据库 在脱离了单机或专门的检索终端之后,与计算机网络相结合,借助 互联网络提供给广大用户使用,这就形成了网上数据库。 网上数据库是数据库技术与网络技术的结合,相互取长补短, 9 网络为数据库的运用提供了新的媒体,数据库又为网络输入了高品 质、高水准的信息内容。一方面降低了检索费用,改变了传统的联 机检索服务费用高的问题,同时又大大的提高了数据库的利用率。 因此,数据库方式是当前普遍使用的网络信息资源的组织方式,特 别是在大数据量的环境下,其优点尤其突出。 网上数据库是联机检索业顺应时代发展潮流的重大举措,主要 包括联机检索数据库和光盘数据库两种,都是由专业人士进行组织 和管理,它们通过增加服务项目和服务内容、优化用户界面等方式 改进服务。这类数据库的人工加工深度大于互联网上其它信息,数 据多,信息质量高,可靠性与安全性都大大高于网络上的其它信息 资源。数据库作为高质量的学术、商业、政府和新闻信息的重要来 源,以其可靠的质量,成为数字图书馆虚拟馆藏的重要的、不可替 代的组成部份。 数据库检索是科技人员获取专业领域信息的重要途径,我国从 7 0 年代开始从事数据库的理论与实践研究,二十年来取得了巨大的 成绩,但也存在着很多的不足,在当前网络环境下,加快数据库产 业的发展具有非常重要的意义。 第四节数字图书馆虚拟馆藏的特点 一、数字图书馆虚拟馆藏的特点 既然我们把数字图书馆的虚拟馆藏理解为“通过该数字图书馆 的计算机网络可以检索、共享的其它服务器上的各种信息资源的总 和”。因此,数字图书馆的虚拟馆藏在具有通常意义上网络信息资源 的特点的同时也有它自身的一些特点: ( 一) 获取的间接性 从地理位置来讲,现实馆藏是本单位和本地馆藏,虚拟馆藏是 外单位或外地馆藏。本馆读者或用户对现实馆藏的使用具有直接性, 对虚拟馆藏的使用一般要有某种协议或申请手续才能借阅等,因而 具有间接性。 ( 二) 数量巨大,增长迅速 从1 9 9 5 年到1 9 9 7 年的两年时间里,l y c o sc r a w l e r 数据库中存 有2 0 0 万个万维网页,1 9 9 5 年8 月,l y c o sc r a w l e r 需要对5 0 7 万 个万维网页进行搜索,到了1 9 9 7 年2 月,l y c o s 不得不对4 亿个万 维网网页进行跟踪。w w w 自1 9 9 1 年诞生以来,它已经发展成拥有几 千万个用户和约4 0 0 万个站点,3 亿页面的巨大分布式信息空间,而 且这个数字仍在以每四到六个月翻一番的速度增加。据估计,互联 网上每天发布1 4 万件总量约4 5 0 m b 的新的信息,全网提供的信息总 量约为2 0 t b 口3 。随着全球互联网用户的不断增加,这个数字还在不 断的迅猛增长。 ( 三) 全球分布式的结构,内容丰富,数据类型多 地理上的分散,组织上松散,信息的产生与分布缺乏组织和控 制,作为多媒体、多语种信息混合体,互联网是当今世界最大的信 息存贮与传播媒介,也是一个巨大的信息资源库,其内容包罗万象, 覆盖了不同学科,不同领域,不同地域,不同语言的信息资源。 ( 四) 形式多样 数字图书馆的虚拟馆藏主要是由以下几种形式构成:有反映全 世界无数个图书馆馆藏目录的资源,电子书刊网上报刊、网上动态 信息、参考工具书,各种类型的网上数据库,电子公告,电子邮件 等。从形式上看,包括文本、图像、声音、软件、数据库等,其中 许多信息资源类型都是新生事物,其中有些信息资源通过计算机网 络取得了集成化的效果并拓展了时空范围。 ( 五) 传播速度快,以数字信息为主,跨地域的数据传递 虚拟馆藏的建设与使用,存取与检索都统一采用各种软、硬件 设备,通过计算机来进行,虚拟馆藏的传送、传播和利用则主要通 过网络实现。用户界面要求高。用户通过互联网可以在数秒之内检 索到自己所需要的信息资源,浏览自己网上的相关信息,完全克服 了传统图书馆馆藏传递的时间、空间障碍。 ( 六) 信息密度大,成本低廉 馆藏的载体不是纸张而是磁、光、电介质、如磁盘、光盘、集 成电路卡等。任何信息都用两个数字即0 和1 表示,这样便可将文 字、数据、图形、图像、声音、动画融为一体,实现多媒体、多载 体的统一,从而有利于使多媒体信息一体化和彼此间的相互转化。 一张c 卜r o m 光盘可存储6 5 0 m b ,相当于每册3 0 万字的图书1 0 0 0 册。与传统的印刷型文献的出版相比,编辑出版的时间短,成本低 而且精确度更高。 ( 七) 开放,动态 这一特点主要是针对网上动态信息而言,网上的动态信息资源 数量持续快速增长,变化频繁,价值不一,信息连接与信息内容处 于经常性的变动之中,随机变化大。据统计,网上电子文件的平均 寿命只有4 5 天,网页的平均寿命也只有短短的7 5 天。网上电子文 献一旦消失就再也找不到丝毫痕迹。 二、 加快数字图书馆虚拟馆藏建设的重要性 1 9 9 8 年,李岚清副总理在听取国家图书馆关于建设中国数字图 书馆工程的意见时就指出:“建设数字图书馆的主要目的,是有效利 用和共享图书馆信息资源,有巨大的社会效益。”数字图书馆虚拟 馆藏是一个环境,这个环境的建设包括两个方面,一个是虚拟馆藏 的基础设施建设,其中包括各种硬件、软件和现代化通讯设备的设 施建设,它们是虚拟馆藏环境得以存在的前提与基础,另一个是虚 拟馆藏的馆藏信息资源的建设,它指的是对互联网上各种信息资源 的搜集、整理并提供给广大图书馆用户使用的这样一个过程。 ( 一) 虚拟馆藏环境可以为我国图书馆的馆藏资源提供有效的 补充。 无庸置疑,互联网是世界上最大的信息资源中心,使用 i n t e r n e t ,几乎可以找到你所需要的任何信息。网络信息资源丰富 多样,主要包括网上数据库、网上出版物、网上( 联机) 馆藏目录 1 2 数据库、网上动态消息、多媒体信息等。对于经费投入较少的我国 图书馆来说,选择、搜集国际互联网上的免费资源来补充我们的馆 藏,显得尤为重要。 ( 二) 自主的中文虚拟馆藏资源的开发建设将极大的改善互联 网上中文信息匮乏的现状。 起源于美国的互联网,其中的英文信息资源占据了9 0 ,法语信 息资源占5 ,处于第三位的西班牙语约占2 ,而中文作为世界上使 用人口最多的语言,它在互联网上所占的信息资源甚至不足1 口。 虚拟馆藏是一个环境,这个环境不是单个的图书馆依靠自身的力量 可以独立完成的,它需要大量的人力、物力以及巨额资金的投入, 群策群力进行数字图书馆虚拟馆藏资源的联合建设。中国数字图书 馆的建设核心是中文信息资源库群,它的建成并投入使用将极大改 变目前互联网上中文信息匮乏的状况。 ( 三) 虚拟馆藏的环境建设将有效的改善和弥补我国中、小型 图书馆馆藏资源的相对不足。 数字图书馆以其四通八达的网络支持,最大限度的突破时间、 空间的限制,它改变了文化信息的存储、加工、管理、使用的传统 模式,借助网络环境实现了图书馆馆藏资源的有效利用与共享。它 提供的虚拟馆藏资源可以为单个的图书馆营造出一个良好的虚拟馆 藏资源的环境,拓展了这些图书馆的文献信息资源空间,这对于那 些缺乏资金进行馆藏建设的中、小图书馆来说,是一个解决馆藏不 足的有效途径。 ( 四) 虚拟馆藏的建设将图书馆的信息服务提高到一个新的层 次。 虚拟馆藏是基于网络环境的信息服务,它与传统的文献信息服 务模式有着本质的区别。它是依据用户( 读者) 需求及科研需要,通 过对网上信息资源的挖掘,并经过精心的筛选、评估与整合,建立 起来的一个虚拟的信息资源库。它大大地拓展了文献信息资源的空 间,提高了文献信息资源的利用率,加深了信息服务的层次。 第二章数字图书馆虚拟馆藏的组织方式探讨 数字图书馆就是运行在高速宽带网络上的分布式超大规模的、 可跨库检索的海量数字化信息资源库群【4 】。计算机网络化、数字化管 理和服务是未来图书馆的发展方向,计算机网络系统为图书馆开通 了一条“新希望之路”,图书馆的馆藏信息资源因此得到了极大的丰 富和完善,它为图书馆展现了一个前所未有的这样一个虚拟馆藏空 间环境,图书馆网络化扩展了图书馆的信息提供能力,读者通过计 算机网络可以方便、快捷地检索和利用馆外的信息资源特别是国际 互联网上的信息资源。与此同时,我们必须注意到的是,即使是在 信息高速公路发源地美国,绝大多数的互联网用户也无法做到 准确、快捷地在互联网上找到i i 己所需要的信息资源。没有目录的 互联网上的信息资源就像是一堆没有目录的书【5 1 ,人们很难以确定如 何去寻找i i i 己所需要的信息资源,因此,网上的信息资源的有序化 就成为了一个急待解决的重要问题。网络检索工具应景而生,它们 相当于对网上的一次信息进行有序化组织的检索工具,但是网络检 索工具的出现并不能全面改善网络信息的无序,因为它无法排斥网 络上大量冗余和不稳定信息的存在,人们在检索学术性信息时,往 往从专门学科入手,而网络检索工具覆盖信息太宽泛,专指度差, 检索效果往往不理想。在这种情况下,图书馆工作人员将自己在组 织文献信息及书目控制方面的知识与经验从印刷世纪转移到联机网 络环境,积极参与网络建设、管理网络信息资源就成为一种大势所 趋。图书馆运用技术加工,对网络信息资源经过严格筛选、精心组 织而成为系统化文献及计算机化数据库文献,对本馆来说,是拓展 了馆藏资源,而对整个宏观网络信息资源环境而言是提高了网络信 息的有序化程度,可以极大的方便图书馆的读者( 用户) 乃至整个 互联网用户的利用。网络上信息资源的纷繁复杂、日新月益,给组 织管理和有效的查询带来了相当的难度,因而,我们必须不断分析、 了解网络环境下信息资源的特点,并对其组织管理技术加以科学地 研究与探讨,才能有效地提高图书馆的信息资源建设质量,从而提 高和完善图书馆的信息服务水平。 第一节指引库的建设 我们在自主开发或购进数据库的同时,还应该注意到,互联网 作为当今世界最大、覆盖面最广的信息资源库,我们应该充分对现 存互联网信息资源加以开发利用。 指引库,又被称为“导航库”、“虚拟文库”,专业指引库类似于 网上专业搜索引擎。指引库的建设是突破传统信息资源建设的一项 关键技术,也是对网上信息服务模式的一种探索。指引库在网络中 处于核心地位,它是指在其所建立的数据库中,从物理上讲,并不 存储各种实际的信息资源,但通过对其访问,可以检索到有关数据 库的实际资源,指引用户到特定的地址获取所需信息,把互联网上 与某一或某些主题有关的节点进行集中,按照方便用户检索的原则, 以用户熟悉的语言进行组织,向用户提供这些资源的分布情况,指 引用户查找m 1 ,它可以弥补互联网本身检索工具的不足,从被动使用 到主动创造,更适应用户的需求。它对互联网上已存的信息资源给 出链接指针,供读者随时选择利用,由于它不需要藏书也不需要购 建自己的数据库,只是整理、组织网上的信息资源,投入少、见效 快,易建易行,尤其适用于一些藏书基础较差的图书馆。 一、指引库的组成与内容 指引库主要由反映该专业国内外信息资源的u r l 、原始信息和方 便信息组织和用户查询的支持技术这三个部份组成,它们均需要研 究相应的技术支持。 5 指引库类似于我们所建立的专题数据库。它们的本质区别在于 其内容的不同。指引库中存放的是有关主题或用户所需信息的数据 库或服务器的地址等信息。图书馆根据用户的需求情况,将文献信 息量大、价值高的网站收集汇编起来,建立科学的分类体系和链接, 并对u r l 的主要内容做出简介和评价,读者在其引导下通过u r l 的 绝对地址,由读者进一步查询,从而获取文献信息。形象地说,互 联网络是信息的海洋,指引库是航海图。为提高互联网上检索信息 的效率( 检准率和检全率的合理组合) ,需要网上导航,需要有关 的网站、网页甚至网上私人信息的检索及目录服务,y a h o o 、 a 1 t a g i s t a 和s o h o o ( w w w s o h o o c o m c n ) 等所从事的工作可谓网上导 航。图书馆的网海导航需要建立一套科学的分类体系,在这个框架 下来选择相关的u r l 加以组织。 二、指引库主要包括的工作 ( 一) 在对本馆用户的需求进行了充分调查调研之后,根据本 馆的实际需要,确定要建设的指引库的学科主题范围。 ( 二) 研究在互联网上这些学科主题信息资源的分布情况、信 息含量以及相关度等。 ( 三) 制定信息跟踪、采集、分析、评诂和套录、分类及建库 等采用的技术方案及工作细则。 ( 四) 研究开发相应的用户查寻软件。 ( 五) 指引库的定期更新与维护。 三、指引库信息资源的搜集 对网上的信息资源的查重、过滤、取舍等等这一系列的工作, 需要图书馆员具备娴熟的专业知识,去粗取精,迅速判断出信息的 权威性、准确性、价值性,这是信息内容能否得到质量保证并获得 用户青睐的决定因素。 筛选出来的u r l 还要根据各类主题按照一定的逻辑规则重新排 列,排序成新的主题索引,并对每个网址加注信息内容的简要介绍 和评论。为方便不懂英文的用户,对一些英文摘引可以进行适当的 编译,目的是发挥导向和顾问的作用,帮助用户迅速了解所需信息 内容的核心与要点,提高信息服务的深度。这项工作突破了以往主 题索引只含有文献标题的浅层次服务,增加了由图书馆员编、撰、 译的点评内容,这无疑对图书馆员的工作提出了更高的要求。 四、指引库信息资源的组织方法 对指引库信息资源的组织方法目前采用的主要有两种方案: ( 一) 软件方案利用搜索引擎( s e a r c he n g i n e ) 。通过检 索软件,按用户提交的查询问题、动态生成h t m l 格式的查寻结果。 就像a l t av i s t a 这类词语查询搜索引擎,在输入关键词检索后就能 获得大量相关网址信息,还可以像m a m m a 这类元搜索引擎,通过输 入关键词就可以获得做出相关度排序后显示的结果,元搜索引擎的 最大优势就是可以提供高质量的信息内容,对网址的过滤筛选能起 到很好的参考把关作用。由于各种搜索引擎各具特色,各有所长, 在实际应用时,可以根据实际情况混合使用。通过统计分析各个相 关链接在搜索引擎中的引用情况以及该u r l 在搜索引擎中的相关度 排序结果,初步剔除重复无用信息,强化有效信息。 ( 二) 数据方案主题树浏览方式,它将信息资源的索引按 照主题分级加以组织,用户可以通过浏览的方式逐级浏览,找到所 需的信息。按照这种方式组织信息,需要对信息进行分类、标引、 设计主题树结构等。这种方式工作量大,但检索式由人工按类逐级 进行,检索效果较好,查准率较高。如“中文网络神探”搜狐( s o h 0 0 ) 的信息组织方式就是采用先进的人工分类技术和友好的全中文界 面,运用符合中国语言习惯的科学分类方法,将1 8 部类,近五万条 链接做成层层相连的树权结构,网页直观地提供给用户,用户只需 进入相关的分类目录或键入一两个关键词,便可方便、快捷的找到 自己所需要的内容。 五、指引库的更新及维护 动态性是网络信息资源的一个重要特征,指引库作为其传递系 统也必须适应这一特性,必须定期地跟踪网络站点的变化,增加新 站点,修改变更失效站点的链接,并注明最后的一次修改或更新时 间,以便指引用户方便及时地查找最新信息。指引库的不断及时的 更新是保持其生命力之关键,一方面,维护者要定期查看用户反馈 意见,适时删除过时信息及无效链接,不断增添新内容,另一方面 还可以依靠自动跟踪技术来实现,补充新出现的节点地址,删去已 经消失的地址,修改已经发生改变的节点地址。目前使用的方案主 要有两种:一是参照搜索引擎中的网络机器人建立自动跟踪程序, 定期在互联网上漫游,通过页与页的连接顺序查找新的地址,替代 在指引库中的旧的已改变的地址;另一种是利用搜索引擎的检索结 果,更新指引库。模拟搜索客户程序提出检索请求,将查询出来的 结果与指引库中的进行比较,修改已经发生改变的节点地址。 六、要加强指引库的安全防护 指引库的安全防护主要通过两种途径来实现:一是设置防火墙, 二是提高工作人员的安全防范意识,定期进行检查,定期修改用户 口令,适时的备份数据。 第二节专业信息服务网站的建立 由于互联网在建立发展的过程中,一直是处于一种开放的状 态,没有统一的规范和管理,虽然信息资源的数量巨大,范围广泛, 却是良莠混杂、无序分散,用户要在这信息的海洋中寻找到自己需 要的信息确实不是一件简单的事。即使目前存在着大量的网络检索 工具,用户界面也日益友好,可以让不具备专门知识的普通用户迅 速查找到信息,但是,我们应该注意到的是,这些网络检索工具的 开发都是面向无特定用户群体的,它可以提供满足各方面用户需要 1 8 的综合性搜索,但搜索出来的信息在检全率和检准率方面都要大打 折扣,往往满足不了一些特定用户在某一方面的综合性信息需求。 在这种状态下,图书馆馆员应该充分发挥其信息组织整序的特长, 根据本馆用户对某一方面的专业信息的需求,将网上相关的专业信 息资源按专题、学科进行分析、判断、筛选、评介、编辑、整序, 为用户提供方便、快捷的检索与查找途径。 数字图书馆专业信息服务网站就正是这样一个有效的途径,它 是将经过选择的、系统的、符合专业学科体系的信息提供给用户以 满足他们对某一领域或某一方面信息需求的网站。其目标在于节省 用户的检索时间、节约用户的检索通信费用和提高用户的查准率, 它从某种意义上来说,是一种信息重组。 目前,数字图书馆的专业信息服务网站有三种主要的模式:第 一种是以馆藏文献为基础的文献检索、报道与传递的网站;第二种 是以网络化资源为基础的专业信息检索和专业信息门户网站;第三 种是以信息交流为导向的专业信息园区。在这一节里,我们以第二 种模式为基础,介绍下专业信息服务网站的建立方法。 一、 系统硬软件的选择 硬件平台和操作系统的选择可以从预期的客户规模、站点内容 以及可提供的服务、经费等方面进行统筹考虑。目前可以供选择的 操作系统包括w i n d o w sn t 平台、u n i x 和l i n u x ,可供选择的数据库 产品包括o r a c l e 、i n f o r m i x 、s y b a s e 、s q ls e r v e r 等,制作w e b 页 面的工具包括m i c r o s o f tf r o n t p a g e 、n e t s c a p e 编辑器、a d o b e p a g e m i l l 3 5 、d r e a m w a v e r 3 o 等等,从技术上看,这些软件都各有优 势,图书馆可以根据自己的实际情况、应用的方面来选择不同的产 品。 二、 专业信息服务网站的站点设计 专业信息服务网站的设计原则就是“以用户为中心”,目标在于 在最少的时间内,最集中的为用户提供所需要的专业信息资源。从 用户方便的角度出发,在设计页面时,要提供给用户多种帮助信息, 如站点结构、导航条、检索帮助等,在设计检索功能时,要提供尽 可能多的检索途径,包括全文检索、联库检索、渐进检索、策略式 检索等等。同时还要提供一些交互式工具,如站内检索、网上书店、 在线注册、留言板、技术论坛等为网上用户提供一个集信息交流、 信息反馈为一体的综合的、动态的虚拟环境,帮助用户更好的使用 专业信息服务网站。 数 据 库 维 护 专业信息服务网站系统 系统i | e m a i l i 数据 维护1 l 服务l 收集 安 全 维 护 手 工 收 集 自 动 搜 集 到矧吲w e b 甲陋 i 服务i 厂 l 库全 站内il 网 信息il 站 检索ii 论 一i 坛 图l 专业信息服务网站系统功能结构图 三、网站信息资源的收集 资源搜集是建设专业信息服务网站的关键一步,专业信息来源 充足、质量高是建设整个专业信息服务网站的基础。专业信息服务 网站是网络环境下参考咨询工作的主要工作对象,其内容具体包括, 对专业u r l 的收集组织链接,对专业电子期干u 、图书的收集组织, 对网上专业信息的收集组织,对网上专业的二次文献( 索引、文摘) 的收集组织,对课题的网上跟踪、收集组织提供等。 专业信息服务网站的目标是提供准确、有效的信息,所以搜集 信息时要求是“精”而不是“广”。在一定专业学科范围内,选取有 学术价值、有一定深度、能反映本学科前沿发展水平和发展动态的 网上学术资源作为搜集对象,根据不同领域专业信息的特点及成长 周期、时效性的不同,就要选择不同的信息搜集方式。另外,对利 用作为虚拟馆藏的网络资源,必须是经过选择的、质量较高的、较 稳定的网络资源,要依据一定的评价标准进行选择,这些标准包括: 信息的准确性、信息发布者的权威性、提供信息的广度和深度、主 页中的链接是否可靠、有效等等。印刷型文献的数字化、网络期刊、 联机数据库、图书馆馆藏目录等,都是比较稳定、准确可靠、方便 存取的信息资源。 目前,对网络信息资源常用的搜集方式有以下两种:1 、手工搜 集。对于数量巨大,纷繁复杂的网络信息资源,手工搜集看似大海 捞针,但在自动搜集走向智能化之前,手工搜集仍然是必不可少的 一个环节。事实上,目录型检索工具,如y a h o o 的信息归类主要还 是依靠人工。少数公司,如美国联机计算机图书馆中心的o c l c 的n e t f i r s t 也完全是依靠专业人员来分编和标引网络信息。2 、自动搜集。 自动搜集就是指被称为“机器人”( r o b o r t ) 、“蜘蛛”( s p i d e r ) 等 的计算机程序定期或不定期拷贝所访问的互联网主机( 绝大多数是 万维网的服务器) 的部份或是全部内容,然后由提供检索服务的公 司或单位对之标引和组织。专业信息服务网站要根据本学科的特点 编制适合于本学科专业信息收集的自动搜集软件,具备自动搜集功 能是一个优秀的专业信息服务网站必须具备的基本条件,否则就难 以对互联网上的日益增长的信息进行追踪。 四、信息加工手段及其方法 网站栏目信息内容主要从国内外报刊、新闻媒体、网上信息资 源、主题及相关机构、其它图书馆采集,具体的流程如下:首先网 站信息维护人员对信息源进行扫描或是主动预约信息,将其中认为 有价值的信息保存下来,提交给信息审核人员进行审核,审核通过 后即可进行信息处理,信息处理过程包括:翻译、录入、校对、加 工成h t m l 格式,提交给w e b 管理员,再由管理员将信息上网发布, 栏目信息的加工过程流程图如图2 所示。 ,1 图2 栏目信息加工流程图 数据库的信息主要是从国内外科技期刊、专著、商业数据库、 网上资源及其它图书馆获得,具体流程如下:首先网站信息维护人 员对信息源进行检索、预约信息,将与各数据库有关的信息保存下 来,提交给信息审核人员进行审核,审核通过后进行信息处理,包 括标引、录入、转库、校对等,将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苗木长期供货协议书范本
- 独栋写字楼出租合同协议
- 精装修房屋转让合同范本
- 签认购协议先看买卖合同
- 清洁工雇佣劳动合同范本
- 物流仓储项目转让协议书
- 美术兴趣班招生合同范本
- 门面房买卖合同转让协议
- 离职证明跟终止合同协议
- 海宁市临时用工合同范本
- 2025年新高考1卷(新课标Ⅰ卷)英语试卷
- 2024-2034年中国油桐种植行业市场调查研究及投资战略咨询报告
- 2024-2030年中国叔丁基过氧化氢行业市场发展现状及投资策略咨询报告
- 六君子汤的现代中药制剂研究
- 三年级下册面积单位换算练习100道及答案
- 管理思维培训
- 中国古代安全文化发展及其启示
- 教师信息技术能力提升培训课件
- 2023劳动合同法全文劳动合同法正规版
- 2022年宜宾机场集团有限公司招聘考试真题
- 金属与石材幕墙工程技术规范-JGJ133-2013含条文说
评论
0/150
提交评论