基于信息生命周期理论的图书馆数字化信息资源服务体系研究_第1页
基于信息生命周期理论的图书馆数字化信息资源服务体系研究_第2页
基于信息生命周期理论的图书馆数字化信息资源服务体系研究_第3页
基于信息生命周期理论的图书馆数字化信息资源服务体系研究_第4页
基于信息生命周期理论的图书馆数字化信息资源服务体系研究_第5页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于信息生命周期理论的图书馆数字化信息资源服务体系研究

随着网络信息产业的快速发展,数字资源的数量正在指数级。作为一个信息服务中心,图书馆尽量收集和存储必要的数字信息资源,以满足大多数读者对信息服务的需求。如何科学处理资料量庞大、种类多元、更迭迅速的信息资源的存储、管理与提供应用的问题,已成为当前图书馆业务中面临的新难点之一。本文将借助信息生命周期管理理论,提出图书馆的存储管理架构,建立分级的数字资源存储与服务体系,以不同的信息服务等级和服务方式实施图书馆的信息资源管理与服务工作,缓解图书馆由于信息资源存储与服务能力不足所引起的“信息过载”现象。1降低资源价值信息资源在其存在的生命周期的不同阶段具有不同的价值,需要采用与之匹配的管理策略和方法。在信息的生命周期中,资源在刚建立的数月内使用频率最高,为组织带来的效益和收入也最高,随着时间的推移,使用频率逐渐降低,资源的价值也随之下降。信息生命周期管理(InformationLife-cycleManagement,简称ILM)是一种信息管理模型,它根据信息资源所处不同生命阶段时的效用差异采取不同的存储与服务策略,力争在信息生命周期的每个阶段都能以最低的成本获得最大的效益。ESG(EnterpriseStrategyGroup,企业战略集团)研究显示,在信息生命周期中,信息资源的价值一直都在变化,大部分信息资源在一定时期后就会进入使用频率极低的状态,随着时间的更迭,90%以上的信息价值会逐步衰竭甚至面临淘汰。一般情况下,资料使用频率与资源生命周期之间呈现一定的相关关系(见图1)。2信息资源的演进过程ILM的核心是针对不同数据的不同生命阶段,采用不同的存储策略和存储介质。为了解决日益剧增的数字资源管理与服务问题,数据存储界提出了ILM的概念,希望通过对信息的价值判断,将最重要的信息、最常被存取的信息资源存储在最昂贵、反应速度最快的存储设备上;次重要的信息资源则存储在稍便宜的硬盘上;使用频次较低的信息资源可以存储在磁带等更便宜的存储媒介上,以符合信息价值与存储成本平衡的原则,并通过有效管理降低不必要的设备扩充投资,提高现有存储设备的使用效能。参考业内学者对信息生命周期的研究总结和实验分析,综合存储界对信息演化特性的分析,可将信息的生命周期划分为资料建立、资料存储、资料撷取、资料归档与资料剔除5个阶段,并根据此5个阶段建立ILM的整体构架(见图2)。在ILM的整体构架中,信息资源的形成和演进过程依序为:资料建立——资料存储——资料撷取——资料归档——资料剔除,其中在资料归档过程中,需要剔除无用资料,以保证归档资料的质量。在ILM5个阶段的演进过程中,资料需求环节为资料建立提供了方向性指导;资料分类环节为标准化处理资料存储提供了基础和依据;检索规划环节为处理资料撷取提供了框架指引;价值评估环节则为实施科学的资料定期归档提供了保障,在以上4项信息资源的处理环节过程中,实现了最终的ILM闭路循环。ILM的5个阶段的内容详细描述为:(1)资料建立阶段此阶段组织会自主收集加工或者直接购买信息服务商的多种信息资源,以满足组织发展的各项需求。由于属于信息源头的建立阶段,其作用直接影响到信息资源体系后续的各个阶段。(2)资料存储阶段该阶段需主要解决资料量庞大、种类多元、更迭迅速的海量信息资源的存储、管理与提供应用的问题;根据信息的需求等级和价值分配不同性能的存储介质,建立分级的数字资源存储与服务体系,即为该阶段的核心内容。(3)资料撷取阶段ILM的主要目标是确保信息资源可以最大限度地发挥其信息服务的价值。根据信息的需求层次,用户存在3种资料撷取途径:线上、近线和离线。这3种资料撷取途径需要不同类型的存储介质和服务系统完成资料撷取服务。(4)资料归档阶段资料归档是信息资源存储策略的重要组成部分,由于部分信息资源进入其生命周期的末期后,资料撷取的频率和速度要求均不是很高,因而价格低、容量大的存储介质和系统成为资料存储的最佳选择。(5)资料剔除阶段许多信息资源在一段时间后就没有了再继续存储的价值,因此组织必须要制定相关的政策,对没有保留或存储必要的信息资源进行销毁或回收,这就需要组织建立明确的信息资源销毁规则,不能轻率地进行销毁。ILM整体构架为实施科学的信息管理与服务提供了基本导向。在ILM研究中,许多信息服务商提供了多种类型的信息生命周期整体解决方案,但在具体行业应用方面,大量信息资源分级、分类存储的实现依然存在较大技术局限和问题。在图书馆信息资源服务体系中,高效能的网络存储设备长期存储大量使用频率低的数字资源已经成为一种严重的资源浪费现象,同理,高价值的信息资源如果被存储在普通的设备中提供服务也是其管理的失败,理想的状态是达到价值和成本之间的平衡。基于此,笔者以湖北文理学院图书馆数字化信息资源的管理规划为样本,结合实际工作讨论、分析基于ILM的图书馆信息资源管理模式。3湖北省文理学院图书馆信息资源管理的建立3.1我馆网上数字信息资源使用现状湖北文理学院图书馆(以下简称我馆)目前馆藏数量182万余册(件),办证人数约1.2万,每月借阅册数约1.5万册(件),数字资源日访问量(在线浏览与下载量)1.5~4万人次。我馆拥有丰富的数字文献资源且更新迅速,年数字资源新增量为20~30TB,其中自主加工数字资源量为200~500GB,在线存储服务能力为100TB,普通存储空间表1湖北文理学院图书馆不同年度数字信息资源为400TB。我馆数字资源类型主要包括:数字图书、随书光盘点播系统、数字影音资源、数字典藏、重点学科服务专题资源、地方特色数据库等,其中期刊数据采用网上包库形式提供服务,不占用本地存储空间。为了统计分析我馆网上数字信息资源的访问现状,笔者借助图书馆系统对下载或浏览日志文件的数量进行统计分析得到我馆各类资源的使用状况。统计结果显示:我馆网上数字信息资源的下载或浏览量主要集中在2008年以后入库的信息资源,2005年前入库的信息资源只有极低的访问频率,甚至有相当比例的资源在2005年后一直处于“无人问津”的状态。我馆在2003—2012年对不同年度网上数字信息资源受访比例进行了统计(见表1和图3)。由表1数据和图3曲线显示的我馆网上数字资源受访统计可知,我馆网上数字资源受访比率随着年度的更迭,其受访比率会出现急剧下滑,这说明最新入库的网上资源较受访问者青睐。2005年以前入库资源的受访比率明显较低,尤其是数字图书、随书光盘和数字影音等资源,其受访比率均不足5%,这充分说明信息生命周期理论在我馆网上数字资源中也同样适用。2005年以前的数据资源中,30%的资源内容在最近5年内没有访问记录,即在最近5年内没有读者再使用过该资源项;在所有数据资源中,低使用频率的信息资源量远远超过高使用频率的信息资源量,日益更新的网络资源已成为读者访问的主体内容,而早期的大部分资源已逐步淡出读者视线。因此,管理者应该制定科学的信息资源管理体系,合理处理访问量极低的陈旧数字馆藏,集中高性能网络存储设备存储新数据资源,为提供高质量的网络检索与信息服务奠定基础。3.2图书馆移动服务及存储模式为了更好地解决新数据资源的网络存储与提供优质、高效的信息服务中存在的问题,我馆决定根据数字资源的访问频率,借助ILM理论科学地规划我馆的存储管理架构,建立分级的数字资源存储与服务体系,以不同的服务等级和服务方式为读者提供服务,力求最大限度地实现图书馆存储设备的效能与信息资源的效用,取得最大化的服务效益。根据ILM的5个阶段,结合图书馆信息服务的要求和信息更迭的过程,笔者参考何俊、杨明(2007)的研究成果,构建出基于ILM的图书馆信息资源管理模式(见图4)。根据图书馆信息资源管理运作过程可知,图书馆实施信息资源管理主要需要完成以下工作:(1)建立图书馆信息服务等级评价标准,制定图书馆数字资源综合服务流程。在图书馆实施基于ILM的信息资源服务模式前,首先需要成立图书馆信息资源价值分析小组,完成图书馆资料总量、资料类型、资料年增长率、资料下载使用率、资料使用者的偏好和类型的综合调研分析。然后根据图书馆的信息服务能力和未来规划,制定科学的图书馆信息服务等级,确定图书馆馆藏数字资源的服务方式。例如,(1)公网即时,指可在图书馆资源信息授权的IP范围内,即时获取使用频率较高、价值较高的各类文献资源;(2)延时传递,一般为使用频率较低或没有被授权公共使用的资源按读者定制服务需求,采取一对一传递的方式提供使用;(3)馆内即时,如在线视频等资源仅限制在图书馆内在线点播使用;(4)归档查询,部分使用率极低或较为久远且已经采取归档处理的信息资源仅提供网络目录检索,详细的全文内容需要进入图书馆获取;(5)馆际待查,部分信息资源由于过于陈旧(没有入库或已经剔除)或过于新近(新出版信息资源,还未进入图书馆馆藏),可采用馆际服务的手段,协助读者完成信息资源获取。以上多种信息资源服务形式的应用,可较好地解决读者多元化的信息服务要求。(2)整合图书馆现有的服务系统与存储介质,建立分级存储的综合信息服务体系。一般存储架构设计主要分为直连式存储(DirectAttachedStorage,简称DAS)、网络附加存储(NetworkAttachedStorage,简称NAS)与存储区域网络(StorageAreaNetwork,简称SAN)等3种存储形式。建立数字资源生命周期存储管理系统,需要先完成存储硬件的整合分类,提升存储设备的利用率。图书馆为解决目前以及未来可能面临的存储设备系统的使用效率问题,依据国际存储网络产业协会(StorageNetworkingIndustryAssociation,简称SNIA)的整体架构规范,参考图书馆数字资源的特性和服务要求,将图书馆存储设备分为在线(On-line)、近线(Near-line)及离线(Off-line)等3种存储等级。重构的图书馆存储设备架构与各类服务系统的整体构架如图5所示。在图书馆分级存储架构的体系中,将第一层(Tier1)配置为高性能的FiberChannel(光纤通道)存储设备;第二层(Tier2)配置SAS(SerialAttachedSCSI,串行连接SCSI)、SATA(SerialAdvancedTechnologyAttachment,串行高级技术附件,一种串行硬件驱动器接口)等高性能硬盘;第三层(Tier3)使用低成本的SATA、ISCSI(InternetSmallComputerSystemInterface,Internet小型计算机系统接口)或磁带等存储介质,必要时还可以多分几个层次来构架存储介质。在分级构架存储集群的基础上,合理规划图书馆Web主机群及电子图书室等系统主机群、归档管理系统、备份主机系统等图书馆服务器形成网络体系,完成基于生命周期存储管理的图书馆数字资源存储与管理系统的相关架构。其中,分级存储是建立数字资源生命周期存储管理系统的硬件核心,其存储规范原则上将以时间和使用频率作为分类基础,同时注意信息资源的可用性,即是否能随时取得信息资源,为使用者提供最佳服务。(3)建立综合的信息资源整合与迁移的管理体系。根据信息所处不同生命阶段的价值差异,将应用价值较高的信息资源存储于性能较高的存储介质中,将价值相对较低的信息资源存储于性能普通的存储介质中,以最低的成本获得最大的应用价值。笔者推荐使用赛门铁克公司推出的SymantecEnterpriseVault解决方案。此归档软件能够自动统计信息资源受访频率,智能识别重复数据,并把重复数据按照逻辑存储模式进行处理,保持数据的唯一性,从而将存储空间和成本节约60%以上,同时也可以自动地将比较陈旧、不经常被访问的信息从昂贵的存储介质中转移到成本较低的存储介质中,完成数据的集中自动归档,以避免信息资源数量的无限扩大,提高图书馆信息系统的综合服务能力,增强图书馆各类馆藏数据的安全性。4基于ilm的图书馆信息资源管理方法本文借助分级存储的管理思想,根据信息资源在不同生命周期阶段所体现的不同的信息价值,选取不同类别的存储介质,为实现信息更迭过程中存储介质服务效用的最大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论