(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf_第1页
(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf_第2页
(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf_第3页
(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf_第4页
(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(计算机应用技术专业论文)高校图书馆信息资源整合系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高校图书馆信息资源整合系统的研究与实现 摘要 高校图书馆拥有日益丰富的文献资源,包括印刷型书刊和大量的电子书和数 据库等文献资源。但是这些资源检索平台、检索方法各异,给读者带来了使用上 的困难,造成资源利用率低等问题。迫切需要一个图书馆信息资源整合系统:读 者通过一个检索平台入口,可以同时检索到印刷型文献信息和电子文献信息。 “图书馆要为读者提供最好的服务”一直是图书馆界追求的目标。如何整合 现有馆藏信息资源,并与不断增加的信息资源无缝整合,从而为读者提供统一的 检索平台,提供个性化的服务,成为数字图书馆建设中的一个重要研究课题。 f 本文针对图书馆信息资源整合的现状,介绍了一种自行开发设计的资源整合 系统。以中国海洋大学图书馆为例,整合了馆藏纸质书刊资源( i l a s 系统) 、 方正电子图书( 3 - 正a p a b i 数字资源平台) 和超星电子图书( 超星数字图书馆平 台) 的资源。主要解决了两个方面的问题:一是采用实体法和虚拟法结合的体系 结构,基于a s p 和s q l s e r v e r 数据库实现图书馆信息资源整合系统,将孤立、分 散的信息资源整合在一个检索平台上;二是进一步对图书馆信息资源整合系统中 读者查询的结果进行合理排序,基于图书借阅历史信息提出了一种图书客观评价 方法,提高了读者的查询效率和查准率。 最后,对图书馆信息资源整合系统进行了总结和展望,并指出了研究工作中 存在的不足和下一步研究的目标。 关键词:高校图书馆;资源整合系统;数据挖掘;知识发现;排序算法 a ni n t e g r a t i o ns y s t e mo f d i g i t a lr e s o u r c e s i nu n i v e r s i t y l i b r a r y a b s t r a c t r e c e n t l y ,t h el i t e r a t u r er e s o u r c e si nu n i v e r s it yi n c r e a s er a p i d l y t h e s er e s o u r c e si n c l u d ep r i n t e dm a t e r i a l sa n dd i g i t a lo n e s a l s o ,t h ef a c t t h a tt h e r ea l w a y se x is td if f e r e n tm a n a g e m e n t s y s t e m sf o rd if f e r e n t r e s o u r c e sc a u s e sg r e a ti n c o n v e n i e n c et ot h er e a d e r s t h e r e f o r e ,i ti s n e c e s s a r yt od e v e l o pau n i f i e ds e a r c h i n gs y s t e mt h r o u g hw h i c ht h er e a d e r s c a ne a s i l yg e ti n f o r m a t i o nf r o ma l lt h er e s o u r c e so ft h el i b r a r y “t h el i b r a r ym u s tp r o v i d et h eb e s ts e r v i c e sf o rr e a d e r s i sag o a l o ft h el i b r a r yw o r l d h o wt oi n t e g r a t el i t e r a t u r er e s o u r c e sw h i c h i n c r e a s i n gc o n t i n u e s l yi nli b r a r ya n dp r o v i d eau n i f i e ds e a r c h i n gs y s t e m f o rr e d e r sb e c o m ea ni m p o r t a n ts u b j e c tr e s e a r c hi nt h ec o n s t r u c t i o no f u n i v e r s i t yd i g i t a lli b r a r y i nt h i sp a p e r ,au n i f i e ds e a r c h i n gs y s t e mw h i c hc o v e r st h e i n f o r m a t i o no fp r i n t e dm a t e r i a l si ni l a ss y s t e ma n dt h ed i g i t a lr e s o u r c e s o fa p a b ia n ds u p e r s t a ri si n t r o d u c e d a i m i n ga tt h ep r e s e n ts i t u a t i o ni n t h e1 i b r a r yo fo u c ,t w op r o b l e m sa r e m a i n l yt a k e ni n t oa c c o u n t :( 1 ) w e i n t r o d u c et h es y s t e ma r c h it e c t u r et oi n t e g r a t et h et h r e es y s t e m s 。s i n c e i l a sd o e sn o tp r o v i d ea n yi n t e r f a c ef o rd e v e l o p e r st oa c c e s si t sd a t a b a s e , w ep r o v i d ea ni m m i g r a t i o nm e t h o dt ot r a n s f e rt h ed a t ao fi l a st oo u rs y s t e m a n das e a r c h i n gi n t e r f a c ef o rt h ed a t a f o ra p a b ia n ds u p e r s t a r ,o nt h e c o n t r a r y ,w eu s e dt h es e a r c h i n gi n t e r f a c ep r o v i d eb yt h es y s t e mt od e v e l o p au n i f i e ds e a r c h i n gp o r t a l :( 2 ) w ep r o p o s ea no r d e r i n gm e t h o dw h i c h e s t i m a t e st h ev a l u a b l i t yo fe a c hp r i n t e dm a t e r i a la c c o r d i n gt oi t s b o r r o w i n gh i s t o r y w ea l s oc o m p a r et h en u m b e ro fb o o k sw h i c ha r er e t u r n e d o n eo rt w od a y sa f t e rb e in gb o r r o w e d ,w h e no u rs y s t e misu s e da n dn o tu s e d t h er e s u l ts h o w st h a tt h en u m b e rd e c r e a s e sal o ta f t e ro u rs y s t e mi su s e d s o ,o u rs y s t e mi m p r o v e st h eq u a l i t yo fs e r v i c ea n dg i v e sg r e a tc o n v e n i e n c e t or e a d e r s f i n a l l y ,c o n c l u d e st h i sp a p e rb yg i v i n gs o m ef u t u r ew o r k s k e y w o r d s :u n i v e r s i t yl i b r a r y , i n t e g r a t i o ns y s m m , d i g i t a lr e s o u r c e s ,d a t a m i n i n g , s o r t m ga l g o r i t h m i i l 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含未获得 ! 逵! 垫塑查基焦噩薹鳖型壹塑的:奎拦亘窒2 或其他教育机构的学位或证书使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 学位论文作者签名:苟、药签字日期:砷年上月擘i t 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘j 允许论文被查阅和借阅。本人 授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解密后 适用本授权书) 学位论文作者签名:彰、萄 导师签字: 跑垅天 签字日期:洒7 年2 月护日 签字日期翮) 1 年f 2 胄1 5 日 学位论文作者毕业后去向:中国海洋大学 工作单位:中国海洋大学图书馆 通讯地址:中国海洋大学图书馆 电话: 邮编:2 6 6 1 0 0 高校图书馆信息资源整合系统的研究与实现 第一章绪论 随着计算机技术、网络技术、信息技术等的迅猛发展,图书馆的馆藏开始出 现重大变化,2 0 世纪9 0 年代末期后,呈现从以印刷型资源为主发展成为印刷型 资源和数字资源并存的局面,到目前,数字资源在图书馆资源中所占比例越来越 高。据调查,目前国内引进的教育、学术数据库有1 9 2 种之多【1 】。加上国内数 据库、自建数据库等,国内各高校图书馆基本上都有几十个甚至一两百个数据库 资源,这些数字资源和印刷型馆藏资源互为补充,成为图书馆的重要馆藏资源。 面对众多的数字资源,读者却常常感到不知所措,不知道怎样才能找到自己 需要的信息资源。他们期望能够通过统一的界面,方便快捷的检索到图书馆所有 的资源,希望图书馆提供一步到位式的服务( o n e s t o p s e r v i c e s ) 。 同时,“图书馆要为读者提供最好的服务一直是图书馆界追求的目标。如 何整合现有数字资源,并与不断增长的数字资源无缝整合,从而为读者提供统一 的检索平台,提供个性化的服务,成为数字图书馆建设中的一个重要研究课题。 1 1 背景 教育部在2 0 0 2 年颁布的普通高等学校图书馆规程( 修订) 中规定,高校 图书馆是学校的文献信息中心,要“建设包括馆藏实体资源和网络虚拟资源在内 的文献信息资源,对资源进行科学加工整序和管理维护 ,明确指出了高校图书 馆馆藏建设的方向。 实体资源指馆藏中未数字化的以纸为介质的文献信息、单机版电子文献及馆 藏中已数字化的文献信息等;虚拟资源实质就是网络数据库或网络信息。图书馆 实体馆藏与虚拟馆藏是相互依存又相互区别的信息资源,两者构成了馆藏信息资 源的总和,并将长期并存 2 。也就是说图书馆完整的馆藏含义已成为“物理实 体加虚拟馆藏 。但由于虚拟资源建设相对于实体馆藏来说时间很短,很多高校 都是在2 0 0 0 年前后才开始引进中外文数据库,而且数据库平台各异,使用方法 也各不相同,并且实体馆藏资源和虚拟资源相对独立 3 4 ,造成以下信息资源 使用问题: 高校图书馆信息资源整合系统的研究与实现 ( 1 ) 读者对图书馆的信息资源不了解,熟悉印刷型资源的读者只用印刷型 资源,( 如只使用纸本书,不知道还有电子书) ;对电子资源有所了解的读者很 少用印刷型资源,没有把实体资源和虚拟资源结合起来,形成一个图书馆资源包 括实体资源和虚拟资源的“大馆藏的概念; ( 2 ) 随着计算机技术、网络技术、信息技术等的迅猛发展,各高校图书馆 开始大量引进数字资源,这给读者带来了丰富的信息资源,但同时,读者面对不 断增加的数字资源,反而会感到迷惑,不知道自己需要的信息在哪个数据库里, 也不知道如何选择自己需要的数据库,更不可能了解和熟悉图书馆的所有信息资 源 5 ; ( 3 ) 由于数字资源建设的不同步以及采用技术的不同,各种数字资源都有 自己的数据结构、组织方式、查询方式以及显示界面。读者为了查阅资料,不得 不分别进入不同的查询系统,熟悉每个数据资源的检索方式和显示格式,这对不 是专门从事检索的读者来说是难以做到的,不但浪费了读者大量的时间和精力, 而且检索效率低下 5 6 。 由于以上原因,对图书馆的各种信息资源进行整合不仅必要而且非常迫切, 并成为目前图书馆建设中一个重要的课题。 1 2 图书馆信息资源整合的目的和意义 图书馆信息资源整合是指遵循一定的原则、规范、标准,把图书馆范围内的 资源无论是馆藏书目资源、网上虚拟资源还是光盘数据资源,或者自建数据库等 多种载体、多种形式、多种类型、分散异构的信息资源有机的结合在一起,实现 图书馆所有资源采、分、编、典、流工作的融合,并且使读者能够在统一的数据 存取模式下通过统一的读者界面完成对不同数据库和网络资源的检索利用的资 源集合体【7 】。 通过信息资源整合,可以得到以下良好的效果【8 】: ( 1 ) 有利于读者全面了解馆藏图书文献,提高资源的利用率。 图书馆将多种形式的文献资源整合在一起,读者在一个界面下即可通过字 高校图书馆信息资源整合系统的研究与实现 顺、分类等列表直观地了解馆藏资源的整体面貌、针对性地浏览文献信息,又可 根据关键词、题名以及学科分类等检索点对多个数据库进行检索来查询图书文献 信息,这样即节省了读者的检索时间又提高了文献的查全率和查准率;形成一个 知识一体化的知识服务网络,发挥文献资源的最佳效益。 ( 2 ) 信息资源整合有利于促进未来图书馆信息服务平台的建设 图书馆在信息社会中所起的核心作用是信息的加工及服务提供,图书馆管理 活动应规划于所提供的服务框架之下。有效地开发信息资源是图书馆进行信息服 务的基础和平台。图书馆的信息资源整合管理需要运用科学的手段和方法,充分 挖掘信息集合中的信息内涵,整合并准确地揭示信息资源,全面地满足社会的信 息需求。 ( 3 ) 指导馆藏建设 有效地组织文献资源,图书馆采访人员可能根据学科分类的图书文献列表全 面了解馆藏资源状况,及时调整采购策略,避免不必要的重复购置和浪费宝贵的 资金,尤其是对传统的印刷型刊物和电子图书数据库的取舍决策,具有重要的指 导意义。 ( 4 ) 信息资源整合有利于满足读者多元化的信息需求 现有各类信息资源由于其自身的局限性或者使用界面不统一等问题而无法 充分满足读者的不同需要,提供的信息的价值性不强,容易造成读者对信息的理 解困难,读者对信息的利用难度加大。信息资源整合将弥补这些缺陷,其服务适 合多元化多层次的读者,通过广泛的信息收集,深入的整合分析,以各种形式向 读者提供增值性的有效信息,以满足各类读者多元化的信息需求。 ( 5 ) 信息资源整合有利于对信息资源进行有效的评价,提高竞争优势。图 书馆馆员经过对信息资源的整合,可以有效地对各类信息资源进行评价,指导读 者更为准确地利用这些信息资源。 ( 6 ) 信息资源整合有利于促进信息资源的有序化 目前各高校图书馆收藏的数字化资料尤其是从网上下载的资料多数没有进 高校图书馆信息资源整合系统的研究与实现 行著录、分类等有序化工作,许多无用的信息资源也充斥其中,需要有分类、编 目专业知识和经验的图书馆馆员或信息管理人员对其进行分类加工处理,与馆藏 资源进行整合,提高这些信息资料的有序化程度,方便读者利用。 1 3 国内外图书馆信息资源整合的发展现状 国外图书馆信息资源整合起步较早,欧美发达国家在2 0 世纪9 0 年代开始对 信息资源进行整合【9 ,1 0 】。主要集中在o p a c ( o n l i n ep u b l i c a c c e s sc a t a l o g u e ,即 联机公共查询目录,在o p a c 上可以检索图书馆的书目信息) 、网络数据库、自 建数据库、电子图书等资源的导航及整合检索等方1 面 1 1 1 。一些知名的系统随之 出现,如网络电子资源无缝链接整合软件系统m e t a l i b & s f x 可以实现跨库检索 和引文链接,适用于分布式环境下数字资源集成管理的e n c o m p a s s 等等。针对 w e b 资源的元搜索引擎也是数字资源整合的一种形式。值得一提的是,面对数字 资源整合的呼声越来越高涨,各种利于异构资源整合的标准及协议也不断出现。 例如用于书目信息的共享和互操作的z 3 9 5 0 、用于情景相关的服务整合的 o p e n u r l 、基于元数据收割的o a i p m h 、w 曲内容联合格式r s s 、分布式异构 资源的检索系列协议( s t a r t s 、s d l i p 和s d a r t s ) 等等 1 2 ,1 3 。 国内图书馆信息资源整合最近几年才刚刚开始,并逐渐受到重视。目前图书 馆对馆藏资源进行整合方法主要以建立独立信息资源整合平台为主。国内一些公 司已经开发了一些信息资源整合平台,如清华c n k i 公司的整合系统,t r s 的数 字图书馆资源整合门户,c a l i s ( 中国高等教育文献保障系统) 统一检索平台等。 国内著名高校和科研院所也已经开始设计和开发统一检索系统,有些已经投入使 用。综观我国高校图书馆数字资源整合,整合方式主要有基于o p a c 系统的整合、 电子资源导航和检索平台整合三大类型。【8 ,1 4 】 ( 1 ) 基于o p a c 系统整合的资源类型 基于o p a c 系统整合是以书目数据为核心,向印刷型图书、印刷型期刊、报 纸、学位论文、电子图书、光盘、电子期刊、网络资源等扩展的一个整体的、立 体化、网络化、全方位的资源体系。它分为横向资源整合和纵向资源整合。 基于o p a c 系统的横向资源整合,即通过7 3 9 5 0 协议汇合不同平台上的异 高校图书馆信息资源整合系统的研究与实现 构o p a c 数据库的横向集成,整合后读者只要通过一个书目系统界面就可以检索 相关图书馆的o p a c ,如上海图书馆所采用的“w c b p a c 检索系统 ,可在统一检 索界面上通过著者、标题、主题、关键词、标准书号等途径,检索上海交通大学 图书馆、华东师范大学图书馆、复旦大学图书馆、上海图书馆的o p a c 书目信息, 而不需要在各个图书馆的o p a c 界面间来回切换,节省读者的利用时间,而且对 各馆的收藏情况有了一个基本的了解。此外,c a l i s 联机公共书目查询系统、 国家图书馆联机公共目录查询系统等,都是这种基于o p a c 系统的横向资源整 合。 基于o p a c 系统的纵向资源整合,即系统向多种资源形式的延伸,最终达到 在统一的o p a c 系统界面不仅能检索到馆藏书目信息,还能检索到电子期刊、电 子图书、学位论文等多种数据库资源、光盘等多媒体资源以及相关的网站信息等。 【1 4 】。在图书馆集成管理软件成熟、现代化技术条件好的图书馆已经逐渐采用了 这种资源整合模式,目前主要有二种方式:一是对电子图书等文献在o p a c 中单 独编目,生成新的m a r c 记录,而不与同种纸质文献对接,如西安交通大学图 书馆;二是对电子图书等文献在o p a c 中原纸质文献m a r c 记录的基础上,通 过增加8 5 6 等字段方式进行整合,对没有纸质文献m a r c 记录的,则采用生成 新的m a r c 记录方式,如徐州师范大学图书馆。这种基于o p a c 的电子资源纵 向资源整合,电子资源存放的地址( 含服务器i p 、资源存放路径等) 不能随意发生 变更,否则原来所做的电子资源链接将全部无效,后期的维护工作成本相对较高 1 5 ,1 6 】。 ( 2 )电子资源整体导航的资源类型 电子资源导航整合是相对成熟的整合方式,根据整合的资源类型多少,可以 分为整体导航和部分导航。整体导航将各种数字化资源作为导航对象,为读者提 供统一的检索界面或链接,如国家科学数字图书馆( c s d l ) 、清华大学图书馆等 就在其主页上实现了资源导航功能。部分导航只是对其中的一种电子资源进行导 航,目前,国内图书馆主要是对电子期刊,尤其是西文电子期刊导航。下图是中 国海洋大学图书馆的西文电子期刊导航系统,将我校已购买的主要西文数据库中 的全文电子期刊进行整合,为读者提供西文全文电子期刊导航服务。读者可以按 刊名顺序或学科分类进行期刊浏览,也可以在平台上进行期刊统一检索。 高校图书馆信息资源整合系统的研究与实现 请i 躔【下精峰叠居 t 膏警件 - 量t 经t ! ! 一一黧譬曩- 。 一一。 i ! i ! j 口e 呈目 蛐字母t 一,68 q le b ! e t 蔓mq gb ! 1 4 1 曼l ! e 霪戮雌虹删蚴蛀蚴虹删趾鲢垃雌盟娃娃龇丝& 盥岱龇皿啦唑 胜;t 雠 茂妇旺置建蝴i 牲庄l 丝出叫;! 皇揪然穗 衅木w 嗍 墼型业兰盘堂l l 鱼螋坚州硝怿斯他t 圭 韭监盥幽蕾嚣誊= # 誊晦丰他 鲍堕熟鲢业型! 螋d e b s c o 叠删嗣 日i - 枷s c i 眦毫蚓涅篁鲢直上芑瞳却幔益矗 图1 1 中国海洋大学西文电子期刊导航 ( 3 ) 统一检索平台 跨库检索技术的利用也是目前许多图书馆普遍采用的整合方式,很多高校图 书馆都对购买的电子期刊、电子图书、学位论文等数据库进行了这种方式的整合, 如c a l i s 统一检索平台。c a l i s 统一检索平台采用了新型的基于元数据的检索 技术,能够对分布在本地和异地的各种异构资源提供统一的检索界面和检索语 言。系统可检索的资源类型包括原文、图片、引文、文摘、馆藏、相关文献等。 c a l i s 统一检索系统还实现了与c a l i s 其他各种应用系统( 如资源调度、统一 读者管理、馆际互借等) 的无缝集成,可以使读者更方便地访问国内外文献资源。 这种方式通过统一检索平台将所有资源有序组织起来,提供读者一站式的、跨库 统一检索服务。此外,清华大学采用的清华同方的c n k i 网络资源共享平台也 属于这种整合方式。 目前的跨库技术还都有它本身的局限性,在实现异构数据检索时,牺牲了原 数据库的许多特性和结果,仅仅是为不熟悉数据库使用的读者提供一种较为方便 的入口,如果需要检索到精准的信息,还是得到各个数据库资源中分别进行检索。 检索平台整合是我国高校图书馆数字化资源整合的新方式,发展历史较短, 高校图书馆信息资源整合系统的研究与实现 目前大部分系统处于试用阶段,各馆整合的资源数量和类型相差悬殊,有的进行 了简单的大类划分,有的仅是将整合的数据进行了罗列。表l 显示了国内2 0 所 高校整合方式概况。 表1 整合方式概况调查表 1 4 】 基于o p a c 的整合电子资源导航 检索平 序号高校名称 横向纵向 整体导航中文期刊西文期刊台整合 1 清华大学 t0 2 北京大学 3 浙江大学 -_ 4 复旦大学- 0 5 华中科技大学、|- - 6 南京大学 - 、l 7 武汉大学 j0 8 吉林大学 9 上海交通大学 0j0 1 0 四川大学 x x 1 1 中山大学 -x 1 2 西安交通大学 t_- 1 3 山东大学 1 4 中国科技大学 x 1 5 中南大学 x 1 6 中国协和医科大学 xx 1 7 南开大学 _ 1 8 东南大学 - 1 9 同济大学 2 0 北京师范大学 注:“4 ”整合标记,“”未整合标记,“”不详 由表1 可以看出,各高校图书馆信息资源整合程度参差不齐。仅有清华大学 图书馆采取了上述全部方式进行资源整合导航,占调查总数的5 ,吉林大学图 书馆、四川大学图书馆、中国协和医科大学图书馆没有采取上述任何一种整合方 式揭示重组数字资源,占调查总数的1 5 。调查中8 0 的高校图书馆进行了单 种或多种方式的数字资源整合。这说明,我国大部分高校图书馆有信息资源整合 意识并进行了有益的实践探索1 1 7 。 但我国高校图书馆信息资源整合系统的功能还有待完善。检索字段少、检索 限定少、检索排序方式单一,致使检索功能相对薄弱。对读者反馈信息收集意识 差,收集方式单一,不支持读者信息定制、个性化检索界面的设置,系统统计功 高校图书馆信息资源整合系统的研究与实现 能差,等等方面都有待于改善1 1 4 ,1 8 ,1 9 。 1 4 信息资源整合的模式 依据信息资源的存储与检索方式,可以将信息资源整合大体分为实体法与虚 拟法这两种模式 2 0 ,2 1 1 。 采用实体法建立整合系统,实际上就是对现有的数字信息资源重新组织、深 度加工、二次开发和创造新知识的过程。它需要建立一个新的存储仓库,将收集 到的各种资源装入其中,不同结构的信息资源被组织为相同的数据格式,用统一 的检索平台检索所有的信息资源。实体法分广义和狭义两种。狭义的实体法信息 资源整合主要是指对各类信息源进行数据抽取、分类标引、建立索引等一系列信 息有序化的过程和活动;广义的实体法信息资源整合是指以知识单元为对象对各 种数据进行整理、加工、分析、挖掘、控制、表达等一系列组织过程及其方法。 实体法整合系统的优点是能够实现对传统文献资源的数字化处理,将数字化 处理后的传统文献信息资源和原有数字信息资源整合,然后对数据优化选择,查 重与去重,分类标引,统一规划,减少了原有数字信息资源占用的存储空间,使 得机构内数字信息资源的数量和质量都得以提升。由于这种方法将所有的信息资 源整合于同一系统内,资源维护方便,检索时系统反应迅速,从而提高了数字信 息资源的共享和利用率。它的缺点是资源整合受条件限制,不能将所有的数字资 源都进行实体整合。 采用虚拟法建立整合系统是在不改变现有信息系统的数据组织结构和检索 方法的条件下,实现对异构的多数据源统一的访问。即用户只需要登录一次,输 入一次检索要求,就可以在供选择的资源中进行统一检索,结果以统一的形式反 馈。虚拟法整合系统本身不建立资源库,而是以代理的角色接受读者的请求,通 过中间件技术把查询请求转换成相应信息系统的查询语言和检索方法,分别发出 检索请求,然后将各个系统返回的命中结果经过清洗、去重、归并等处理后在同 一界面上呈现给读者。 虚拟法整合系统的优点是不需要重新处理原有的数字资源,数据提供商只需 提供能够对其数据进行访问的接r ! 。但是逭种整合方法需要将读者的检索请求转 高校图书馆信息资源整合系统的研究与实现 换为各个系统的检索语言和检索方式,然后再实时地对从各个系统返回的检索结 果进行处理之后呈现给读者,这势必造成检索反应速度的降低。而且,原有的一 些信息系统由于不具有开放性设计,因此无法提供对其数据进行访问的接口。 基于实体方法与基于虚拟方法的信息资源整合方法都具有各自的优点和缺 点。数字资源经过实体方法的整合后,便于进行数据的统一存储或迁移,便于进 行数据挖掘、分析和决策等。而在虚拟方法整合中,通过开放链接技术,在不同 信息资源之间建立元数据级的链接,方便了读者【2 0 】。 1 5 选题依据 中国海洋大学图书馆馆藏图书包括印刷型纸质图书、方正电子图书和超星电 子图书、其中纸质图书有1 7 2 8 万册,在图书馆自动化集成系统i l a s 平台上检 索,方正电子图书8 万多册,在方正a p a b i 数字平台上查询,超星电子图书4 7 万余册,在超星数字图书馆平台上进行检索。读者如果要查询图书信息,需要分 别通过这三个不同的检索系统进行查询,费时费力且检索效率低。因此,迫切需 要一个信息资源整合系统。 此外,读者在图书查询中还存在另外一个问题:i l a s 系统中检索结果是按 照书目记录号输出的,没有进行排序。如下图,最先入库的图书排在最前面,而 新出版的新书则排在后面。由于图书量的猛增,输出结果往往达到几十页甚至几 百页,而i l a s 系统没有提供到任意页或最后一页功能,读者只能一页页翻。显 然,这样的结果输出是不合理的。 高校图书馆信息资源整合系统的研究与实现 彩爱- 赶。谳,翰1 m 啪曲l k 蔓t 伊 竺i 竺。l 苎翌l ! 鬣魁霞;i 盏越i i 誊也鎏釜 f 密q 朋上信怠查均 海氏溺移馆秘 叠毛费证膏出衢瑷更珥竹岳,眯耳 许抽荫丘 一f c 计置巩蓐七1 1 1 h i 怒:埔眦”“蘑牡 :1 0 l 弭 并瞎僵n 幔阐 峨l 汁i 【札 j k i :辑掌出藤址,1 9 t 1 ) 1 2 膏 * t t ) i f :芮 量谭 曛删椭 l 十t 札薯:田置茸i e 曩:子t 出_ i 牡- l 时 研曩蓐m 值怠 碡 f t 瓢:曲直甩和程序谴 & h螺:辑m 鼢1 0m1 3 舯m 滓挤m 蔚 什 【i 4 1 1 1 1 l 话年蓐 上奄:上附芟出麓社,l 蛳8蝴釉m 龋 l # 戤:口”明秘5 4 口r h螺: m 肫- 1 觚g i 计札撞蔓掳矗辑t k 啊l 埔c :置搜焯出苴牡- 瑚l硝 弹维僵 i ,_ l n dc o 髓手t 撇把曩:掌菇出月i 吐,l 州t,m津倒- 矗 j 计篁机辅i h 设计与雠孔旺h畸1 1 哪。嘱1 r :碓稍鬟工业戈掌出版祉i 曩1 1 8 a m 4 i 翳尊涨嚣篮嚣 镕t 豫 篙铲:”1 业戈掌蟠扎 i 重淄i # 薯 幸 牺b 皤4 j 齿害g l t 奠帆a 奇十妁it 蜘击l e 摹i lw o 条辱上- 1 1 1t 一肆巾盟坶鼻 i q mj 。爷,o j 碱晤 图1 - - 2i l a s 检索结果页面 本论文据此选题,希望能针对这种状况,研发完成一个图书馆信息资源整合 系统。该系统完成了两个功能: ( 1 ) 将三个系统的信息资源整合在一个检索平台上,读者通过一个检索入 口,可同时检索到印刷型书刊信息和方正、超星电子书的信息,对印刷型书刊可 以看到馆藏信息和书目详细信息,对电子书可以链接到全文。一方面可以免除读 者选择不同信息资源入口的迷惑和检索信息时的麻烦,另一方面也有利于不熟悉 馆藏的读者获取全面的信息资源,提高文献的利用率。 ( 2 ) 将检索结果优化,更好的为读者服务。针对i l a s 系统中检索结果没 有进行排序的问题,本论文充分利用i l a s i i 系统中的读者借阅历史信息,在读 者的借阅日志信息中进行数据挖掘和知识发现,给出对图书的一个评价,并据此 对读者的查询结果进行排序,使读者能找到“好”的图书,提高读者查询效率和 查准率。 1 6 本文的主要工作 高校图书馆信息资源整合系统的研究与实现 1 6 1 论文的研究内容 本文针对图书馆信息资源整合的现状,采用实体法和虚拟法结合的体系结 构,以中国海洋大学图书馆为例,将i l a s i i 系统纸质图书与方正电子书信息等 进行电子信息资源开发和整合,基于a s p 和s q l s e r v e r 数据库实现图书馆信 息资源整合系统,并将数据挖掘技术应用于整合系统中,提出了一种基于图书借 阅历史信息的评价机制,对读者查询的结果进行排序,使整合系统更好的满足图 书馆各项业务及读者的信息服务需求。本文的创新性和新颖性主要有以下两点: ( 1 ) 采用实体法和虚拟法结合的体系结构,将纸质图书信息与方正电子书 信息等进行电子信息资源开发和整合,并以中国海洋大学图书馆为例,基于a s p 和s q l s 职v e r 数据库实现图书馆信息资源整合系统,这种方法很好的解决了 i l a s i i 系统使用的数据库系统接口不公开,无法基于其进行数据挖掘的问题, 同时兼顾了方正电子书等其它资源的数据更新,为应用了i l a s 系统的图书馆提 出了一种资源整合的新思路。 ( 2 ) 将数据挖掘和知识发现技术应用于图书馆信息资源整合系统中,提出 了一种基于图书借阅历史信息的客观评价方法,对图书馆信息资源整合系统中读 者查询的结果进行排序。该排序算法提高了读者书目检索的查准率,也为采编部 门提供了图书采购的依据。 1 6 2 论文组织 论文将围绕“高校图书馆信息资源整合系统的研究与实现”这一主题进行撰 写,主要分为五章: 第一章绪论 介绍了高校图书馆信息资源整合系统研究的背景、意义等,包括以下内容: 1 1 选题背景 1 2 信息资源整合的含义 1 3 图书馆信息资源整合的目的和意义 1 4 国内外信息资源整合的发展现状 高校图书馆信息资源整合系统的研究与实现 1 5 选题依据 第二章信息资源整合系统总体设计 此部分将介绍实体法和虚拟法结合的体系结构,基于a s p 和s q l s e r v e r 数据库实现图书馆信息资源整合系统的总体设计。包括以下内容: 2 1 馆藏信息资源简介 2 2 图书馆信息资源整合的基本原则 2 3 整合方式概况调查分析 2 4 信息资源整合系统设计 第三章图书馆信息资源整合系统 针对数字图书馆信息资源整合的现状,采用实体法和虚拟方法结合的体系结 构,基于a s p 和s q l s e r v e r 数据库实现了图书馆资源整合系统,将i l a s i i 系 统纸质图书信息与方正电子书信息等进行电子信息资源开发和整合。此部分将详 细阐述资源整合系统的实现思路,包括以下内容: 3 1 信息资源整合方法概述 3 2 信息资源整合系统设计 3 3 信息资源整合系统实现 3 4 信息资源整合系统的实现结果 第四章数据挖掘技术在检索结果排序上的应用 对资源整合系统输出结果进行优化。针对纸质图书检索结果没有排序,读者 借阅时比较盲目的现状,提出了一种基于读者借阅信息的科技图书检索结果客观 排序算法,基于s q l s e r v e r 数据库实现了图书检索结果排序。实验表明,排 序算法对读者的查准率有较大改善。本章包括以下内容: 4 1 数据挖掘技术概述 4 2 信息检索排序方面的相关研究 4 3 基于借阅信息的图书检索客观排序算法思想 4 4 排序算法应用实例 第五章总结与展望 高校图书馆信息资源整合系统的研究与实现 第二章信息资源整合系统总体设计 信息资源整合系统作为信息资源整合问题的综合解决方案,成为了世界图书 馆界及系统开发商讨论与研究的热点话题。近几年国内外也相继有一些产品问 世,如国外的m e t a l i b & s f x 、m a p ,国内的数字图书馆资源整合门户t r s i i p 、清 华大学的清华同方异构统一检索平台( u s p ) 等等。但信息资源整合系统作为一 个新生事物,其理论与技术仍不成熟,还处于不断发展与改进的过程中。 我们针对图书馆信息资源整合的现状,提出了一种自行开发设计的信息资源 整合系统,并以中国海洋大学图书馆为例,将i l a s i i 系统纸质图书信息与方正 电子书信息等进行电子信息资源开发和整合,采用实体法和虚拟方法结合的体系 结构,基于a s p 和s q l s e r v e r 数据库实现图书馆信息资源整合系统,并将数据挖 掘技术应用于系统中,提出了一种基于图书借阅历史信息的评价机制,对读者查 询的结果进行排序,满足了图书馆各项业务及读者的信息服务需求。 2 1 馆藏信息资源简介 中国海洋大学图书馆由分布于三个校区的三个分馆组成,截止到2 0 0 7 年7 月,馆藏印刷型文献总量已达到1 7 2 8 万册,同时购买了方正电子图书、超星电 子图书,共计5 6 万册,以及中外文数据库等电子资源,这些电子资源和印刷型 资源互为补充,共同构成了海大图书馆的馆藏。 但由于电子资源是近几年才开始大量引进的,读者面对迅速增加的各种数据 库,反映却并不乐观。我们可以想一下:以一位读者想找一本图书为例,如果他 比较熟悉印刷型资源,他会去在o p a c 中检索,由于图书量日益增加,反馈回来 的查询结果也很多,他可能看了前5 页,就没有耐心看下去了,于是从中选了一 本比较接近需求的图书借阅,这样他可能从两方面错过了找到更符合需求的结 果:一是i l a s ( 下面具体介绍) o p a c 界面输出的查询结果是按照图书的书目记 录号排序的,也就是先入库的图书排在前面,这样可能他需要的图书排在后几页 输出结果中而不被发现;二是在馆藏的电子资源( 如方正和超星电子书) 中可能 高校图书馆信息资源整合系统的研究与实现 有满足他的需求的图书,但这两个电子书数据库各自有自己的查询系统和浏览 器,他需要分别通过这两个管理系统的入口进行查询,由于不熟悉这两个系统或 觉得麻烦而没有去查询。同样,对于熟悉电子资源的读者来说,也面临着类似的 问题,由于印刷型馆藏和电子馆藏的相对独立,读者对这两种资源的使用也是分 开的,同时,电子资源各异的检索方法也给读者带来了检索难度。如果能把图书 馆的馆藏资源整合到一起,让读者通过一个检索界面就可以查到所有的资源,包 括印刷型资源和电子资源,这必然会提高资源的利用率,提高读者的查全率;如 果能把最满足需求的资源排在检索结果的最前面,必然会提高读者的查准率。 2 1 1i l a s 系统 2 1 1 1i l a s 系统简介 海大图书馆1 9 9 9 年引进了深圳图书馆开发的图书馆自动化管理系统i l a s , 目前已升级为i l a s i i 。i l a s 是文化部于1 9 8 8 年作为国家重点科技项目下达、 由深圳图书馆承担并组织开发出来的一套能适应国内外不同层次、多种规模、各 种类型图书馆使用的图书馆自动化集成系统。由于开发早,适应国内图书馆的馆 情,i l a s 目前已成为国内用户数最多、推广面最广、实用性最强、联网性能最 佳的图书馆自动化集成系统,在高校图书馆拥有众多的用户。 l 瓣sl l翠滩瑁螭目彀 黼麟獬徽一黜撇理 一;7 , ,m ;流通售珲 i 势i “;f i ? # 。口,。壤矗并发 i n t e g r a t e dl 鲫_ - 尊f y j j i 黟 a u t o m a t i o ns y s t e m 簟惹i 甏戮燃鬻瀚溺滋瀚磁篷溺酸霞藿婺豳 图2 1i l a s 界面 - 1 4 - 高校图书馆信息资源整合系统的研究与实现 i l a si i2 0 是基于客户机服务器( c s 模式) 的图书馆自动化集成系统。其主 体功能均在客户端实现。i l a s i l 2 0 还提供了基于w w w 的“网上图书馆( i l a s w e b ) ,将公共查询、读者个性化服务、网上业务有机地结合起来。i l a s 2 0 提供的z 3 9 5 0 服务可以帮助用户访问任何一个提供z 3 9 5 0 服务的系统的书目数 据,也可对网上用户开放自己的数据库。终端检索程序可以将安全的终端检索模 式应用到i l a s1 1 2 0 的体系上来。此外,i l a s1 1 2 0 充分发挥l d b m s 的特性, 在检索、统计等方面采用特殊模式,由服务器承担主要工作,以提高系统效率。 网上流通系统则是i l a si i2 0 典型的b s 模式系统。 2 1 1 2l l a s 系统的o p a c 功能 o p a c ( o n l i n cp u b l i ca c c e s sc a t a l o g ) 是指用户通过网络直接连接到图书馆 进行书目数据及馆藏情况的检索,是目前z 3 9 5 0 最主要的应用领域。i n t c r n c t 的 迅速普及使得op a c 的使用日益广泛。在i l as 系统中,基于z 3 9 5 0 所实现的 o p a c 主要有以下功能: 2 2 】 ( 1 ) 馆藏文献检索其中包括馆藏文献信息的查询、馆藏分布情况及文献在馆 情况的查询,提供文献的网上预约功能。对于尚未入藏的文献,则向用户提供该 文献是否正处于编目状态或本馆是否已订购该文献等信息。若所查文献为期刊, 则同时提供该文献的过刊入藏情况、现刊到馆情况及新刊订购情况,还可提供每 期刊物的目次信息。 ( 2 ) 读者借阅信息查询:读者基本信息及其借阅信息的查询,提供网上续借。 ( 3 ) 期刊目次检索:期刊目次信息的查询,同时列出目次所在的期刊信息以 及该期刊的在馆情况。 ( 4 ) 信息库检索:提供各种类型的自建信息库的检索,包括多媒体数据库的 检索。 ( 5 ) 新书介绍:提供新书到馆信息并通过网络向读者及时进行通报。 ( 6 ) 网上报订:提供图书及期刊的网上报订功能。 ( 7 ) 联合目录及联合馆藏的检索:提供某一地区的联合书目目录及馆藏信息 1 5 高校图书馆信息资源整合系统的研究与实现 的检索。 2 1 2 方正电子书 北大方正电子有限公司于2 0 0 1 年9 月推出以数字版权保护( d 砌技术为核 心的方正a p a b i 数字图书系统整体解决方案,为数字图书馆的建设解决了图书资 源数字化技术、数字版权保护及e b o o k 安全分发和数量统计等解决方案。 目前全国有包括北京大学、中科院、济南图书馆和北京八中在内的7 0 多家 高校图书馆、中科院图书馆、公共图书馆、中小学图书馆北大方正电子有限公司 合作,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论