


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3 9 卷第7 期 20O7 年7 月 哈尔滨工业大学学报 J O U R N A LO FH A R B I NI N S T I T U T EO FT E C H N O L O G Y V 0 1 3 9N o 7 J u l 2 0 0 7 基于X I L 的图书馆网络信息资源整合研究 唐振宇1 ”,陈凤岩1 ”,冯玉强1 ( 1 哈尔滨T 业大学管理学院,哈尔滨1 5 0 0 0 1 E 一眦i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 哈尔滨工业大学罔书馆,哈尔滨1 5 0 0 0 1 ) 摘要:为提高图书馆大量的数字信息资源的整体使用效率,实现信息资源的共享,提出了基于X M L 的图 书馆网络信息资源的整合模型,设计并构建了哈工大图书馆馆藏文献信息资源和本地其他信息资源整合的 原型系统,采用J S P + x M L 开发跨库检索系统,对不同来源、不同类型的文献信息资源进行整合,为用户提供 统一的检索平台和检索方法,使检索过程方便快捷,检索结果更趋理想 关键词:资源整合;x M L ;图书馆 中图分类号:G 2 5 0 7 3文献标识码:A文章编号:0 3 6 7 6 2 3 4 ( 2 0 0 7 ) 0 7 1 1 3 5 一0 3 R 姻嘲暇mo fH b I 哪壤炯吣i I l 缅I n 磁岫1 1 e 舳咖c I 陷i 1 1 晚罂咖k l s e d 眦X 几 T A N G Z h e n y u1 一,C H E NF e n g y a n l ”,F E N GY u q i a n 9 1 ( 1 S c h o o lo fM a n a g e m e n t ,H 如i n I n s t i t u t eo fT e c h n o l 9 9 y ,H a r b i n 1 5 0 0 0 l ,C h i n a ,E m a i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 | l h en 岫0 ;i fH a r b i nI n s t i t u t e0 f1 b h 赫I o g y ,H 曲i I l 1 5 0 0 0 1 ,C h i n a ) A b s 咖c t :I n o r d e rt oi m p r 0 V et h eo V e r a e 毋c i e n c y0 fu s i l l gl i b r a r yd 遮i t a li n f o n n a t i o nr e s o u r c e sa n da c h i e V e t h e 曲赫甥o f i n 南狮a t i 嘲r e s I 吣托e 8 岛e 嗽e e n t h el i b 嫩i e s 。AX M L 6 a d o n l i B r 哆n e t w o r k i n f o H I l a t i o nr e s o u r c e i n t e 铲a t i o nm o d e l w a s p u t f o r w a r d T h e l i b r a r y c o l l e c t i o no f d o c u m e n t a t i o na n di n f o 硼a t i o nr e s o u r c e s a n do t h e r l o c a li n f 0 珊a t i o nr e s o u r c e s i n t e g m t i n gs y s t e mp m t o t y p e o fH I ,I ( H a r b i nI n s t i t u t e o f7 r e c h n o l o g y ) h a s b e e n d e s i g n e d a n d b u i l t U s i n g t h eJ S P + X M L t e c h n i q u e ,a c I D s s d a t a b a s e i n q u i r i n gs y s t e m w a s d e v e l o p e d t o i n t e 铲a t e d i f k r e n t t y p e s o fd o c u m e n ti n f o 邢a t i o n r e s o u r c e ,w h i c h o f 托r e d t h eu s e r sau n m e dd a t a b a s e i n q u i r i n g p l a d o 瑚a n d m e t h o d sw i t h c o n V e n i e n tr e t r i e v a l p m c e s s ,m o r es a t i s 每i n gs e a r c h i n g r e s u l t s K e y w o r d s :r e s o u r c e s i n t e g r a t i o n ;X M L ;l i b r a r y 近年来,高校图书馆通过集团采购、自主购 买、自建数据库等多种形式,引进和建设了一批高 质量的数据库,使得图书馆的电子图书、电子期 刊、网络数据库等数字化信息资源显著增加,为读 者提供了更多的信息来源和获取信息的途径图 书馆大量的数字信息资源往往由不同的数据商提 供,软硬件系统、运行环境各不相同,数据库的检 索界面存在差异性和复杂性不同的数据库使用 不同的检索软件,每个数据库支持的检索算符和 使用的检索语言也不尽相同当用户在检索某 收稿日期:2 0 0 5 一1 2 一0 5 基金项目:黑龙江省科技攻关计划项目( 2 0 0 5 R 9 1 0 0 ) 作者简介:唐振宇( 1 9 6 3 一) ,女,博士研究牛,副研究馆员; 冯玉强( 1 9 6 l 一) ,女,教授,博士生导师 个课题时,为提高查全率,用户不但需要了解在图 书馆提供的众多数据库中哪些数据库涵盖的学科 内容与自己的检索课题有关,而且还需要逐一登 陆所有相关数据库分别进行检索而在检索时,还 要掌握不同数据库的检索方法,以便正确地检索; 最后,各个数据库的检索结果又具有不同的全文 数据格式( 如c a j 、p d f 、p 咄等) ,需要安装各自相 应的阅读器,才能阅读全文使检索效率低下,增 加了用户检索的难度,浪费了用户大量的时间和 精力,给使用者带来诸多不便因此,图书馆迫切 需要对其拥有的数字信息资源进行统一的组织和 处理,即在引进、自建数据库的同时,对这些信息 资源进行整合,让使用者可以通过一个检索人口 检索到几乎所有的信息资源,从而提高信息资源 整体使用效率,有利于实现信息资源的共享 哈尔滨工业大学学报第3 9 卷 1整合模式分析 信息资源的整合是指由计算机网络及相关技 术构成的系统,实现信息资源的集中管理及跨平 台、跨数据库检索国内图书馆的信息资源整合模 式主要有两种:对数据源的整合及对不同信息资 源检索接口的整合嵋J 1 1 数据源的整合 数据源的整合是对不同数据资源信息库进行 整合整合方法是建立一个数据存贮仓库,将参与 整合的各种数据源的数据装入其中,把不同数据 结构的内容转换为相同的数据格式,用单一的检 索引擎检索所有的资源这是一种最彻底、最完全 意义上的整合,完全脱离了各种异构系统原有的 服务平台通过对不同数据源的集成,构建新的数 据仓库,用户通过数据仓库提供的统一的检索入 口进行查询bJ 在这种模式下,数据重复存储,整 合后的系统需要维护一个与数据源中的数据一致 的副本因为查询不再访问源数据,所以响应一般 较快,但维护代价较高 1 2 检索接口的整合 检索接口的整合是指在统一的用户查询接口 与信息反馈的形式下,共享多个数据库资源的索引 和检索技术,它以代理的角色接受用户的请求,通 过转换程序把查询请求转换成相应数据库的查询 语言和检索方法,分别对各个数据库发出检索请 求,再将来自各个数据库的命中结果集成在一个界 面中显示给用户对源数据的访问方法有两种”J : 1 ) 利用数据库接口访问源数据 这种方法是借助于数据库开发商所提供的数 据接口,直接访问本地的数据源通过各数据库管 理系统的现有查询执行引擎和语言,将数据从各 数据源中提取出来,不需要设计和实现专用的查 询语言和执行引擎,应用开发工作量小这种方法 通常建立在通用数据库平台和开放系统之上,由 于很多数据厂商不愿意开放其数据库权限,公开 其数据访问接口,使这种方法受到限制 2 ) 通过应用程序访问源数据 这种方法应用的查询首先被重构、分解成面 向各个数据源的查询,然后由查询引擎调用包装 器实时抓取各个数据源站点的页面,抽取其中的 数据元素,再由执行引擎将返回的数据集成、转化 为统一的结构化形式后返回给用户这种方法的 优点是不需要数据厂商的数据开放,具有良好的 现实操作性而且查询的结果能保证始终是最薪 的,适用于数据源自治程度高、变化频繁的情况 但这种方法需要设计和实现特定的查询执行引擎 和查询语言,需要复杂的查询生成器 无论哪种方式访问源数据,当数据从数据源 中抽取出来以后,都需要对数据进行整合,形成统 一的数据中间模式由于数据在提供应用之前经 过了处理,使返回给用户的数据更加规范化x M L ( e X t e n s i b l eM a r k u p L a n g u a g e ) 具有自定义性及其 可扩展性等优势,便于表达各种类型的数据,数据 的呈现与处理可分离操作,可实现数据跨平台传 输、交换和共享,以应用的中间数据形式,解决数 据的统一接口问题 2 图书馆信息资源整合原型系统设计 2 1 系统模型设计 本系统设计的目标:整合哈工大图书馆的馆 藏书目数据资源和本地的其他信息资源,建立一 个异构数据库信息共享平台,构建统一的检索系 统和用户界面,实现用户单一的检索表达,在一个 涵盖各种不同信息资源的集合中得到响应,从而 实现多个异构信息资源库的统一检索采用J s P + X M L 开发这个跨库检索系统,开发模型如图1 所示 应用服务器数据源 图1 系统开发模型 本系统用J s P 与s e n ,l e t 联合实现动态内容服 务,吸取了两种技术各自的突出优点,用J s P 生成 表示层的任务,让S e r v l e t 完成深层次的处理任 务,J a v a B e a n 完成数据的提取功能在扩展系统 时,只需修改业务逻辑和控制部分( J a v a B e a n 和 S e r v l e t ) 即可,无需修改显示的J S P 系统,很容易 对些新购买的数据库进行整合 2 2 系统体系结构设计 在B s 模式的基础上结合x M L 和J s P 的特 点和工作原理,将本系统分为4 层体系结构:第l 层是表示层,接受用户的信息请求并返回请求结 果;第2 层是W e b 服务层,实现信息的发布、交互 和处理的功能;第3 层是应用服务层,用于数据的 处理及与数据库的交互,获取各个异构数据源的 接口数据,并整合成统一的中间数据格式x M L ; 第4 层是数据服务层“ j 基于x M L 的多层系统体 系结构如图2 所示 第7 期唐振宇,等:基于x M L 的图书馆网络信息资源整合研究 表示层 w “服务层 用服务层 数据服务层 图2 系统体系结构 客户端通过浏览器向w e b 服务器发出请求 后,由S e n ,l e t 负责接收,然后S e r v l e t 根据用户的 动作调用相应的J s P 页面与J a v a B e a n ,而与数据 库交互工作由J a v a B e a n 负责,J S P 页面生成动态 x M L 反馈给客户,在客户端用x S L 处理器对检索 结果进行处理J 2 3 程序设计 本系统通过统一的检索平台,实现对3 个异 构数据库的同时检索,生成集成的检索结果系统 体系结构见图2 系统检索的数据源分别是馆藏 书目数据库( x M L 格式) 和关系型数据库( s Y B A S E 和O R A C L E ) 限于篇幅,X M L 格式以及关 系型数据库的数据结构未列出系统运行环境是 w i n d o w s 2 0 0 0 ,J 2 S D K ,T 0 m c a t 系统实现方法是先 把馆藏书目数据( 原M A R C 格式) 经过后台程序 处理转换成x M L 格式p ,通过查询程序S e a r c h j s p 同时检索上述3 种数据库,并将检索结果通过 J a v a B e a n 集成为一个统一的x M L 数据,再用x s L 对x M L 数据进行处理 J a v a B e a n 程序部分代码如下: p a c k a g ec o m o 五e n t q u e r y ; i m p o no 唱w 3 c d o m 水; i m p o r to 昭a p a c h e x e r c e s d o m 术; i m p o r to 唱a p a c h e x e r c e s d o m 术; i m p o r to 曙a p a c h e x m l s e “a l i z e 水; i m p o r tj a V a u t i l 米; p u b l i c c l a s sC o n t m l s e a r c h L o a d M a r c X m ll o a d M a r c X m l = n e wL o a d M a r c X m l ( ) ; S e a r c h X m l R e c o r ds e a r c h X m l R e c o r d = n e w S e a r c h X m l R e c o r d ( ) ; p r i v a t e S t I - i n g6 l e N a m e = ”; p u b l i cC o n t r o l S e a r c h ( ) I p u b l i c D o c u m e n tm a k e S e a r c h (H a s h t a b l e s e a r c h T a b l e ) V e c t o re x i s t R e c o r d = n e w V e c t o r ( ) ; e x i s t R e c o r d = d o S e a r e h i n g ( s e a I h T a b l e ) ; S y s t e m o u t p r i n t l n ( ”e x i s t R e ( :( 1 r d :”+ e x i s t R e c o r d s i z e ( ) ) ; i f ( e x i s t R e c o r d s i z e ( ) = = 0 ) r e t u m q u e r y e d N o E x i s t R e c o r d ( ) ; e l s e r e t u m q u e r y e d E x i s t R e e o r d ( e x i s t R e c o r d ) ; 该系统的各个组成部分具有自身的自治性, 在实现数据共享的同时,每个数据库系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手机店营销活动策划方案
- 嘉兴摩擦传动方案咨询
- 电子陶瓷薄膜成型工入职考核试卷及答案
- 包头管道施工方案设计
- 建筑企业品牌方案设计平台
- 校园五一安全教育讲稿
- 风险管理咨询入行方案
- 砌块墙钢筋加固施工方案
- 上海线上活动策划方案
- 企业咨询品牌策划方案
- 九一八警钟长鸣强国有我+课件-2025-2026学年高一上学期爱国主义主题班会教育+-
- 勇气与成长写物作文10篇范文
- 反洗钱可疑交易识别课件
- 人教部编版小学三年级语文上册课后习题参考答案
- 光伏运维安全培训总结课件
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
- 体育原理课件
- 电弧跟踪介绍
- 豆制品创新集聚产业园生产、加工、销售建设项目建议书写作模板-定制
- 厦门大学实习报告模板
- 九月九日忆山东兄弟
评论
0/150
提交评论