(教育技术学专业论文)基于web+services的图书联合检索系统.pdf_第1页
(教育技术学专业论文)基于web+services的图书联合检索系统.pdf_第2页
(教育技术学专业论文)基于web+services的图书联合检索系统.pdf_第3页
(教育技术学专业论文)基于web+services的图书联合检索系统.pdf_第4页
(教育技术学专业论文)基于web+services的图书联合检索系统.pdf_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文分析了目前各图书馆的图书管理系统,并指出现有管理系统受所用数据 库体系结构差异的限制,形成了“信息孤岛”现象,致使跨馆数据库的集成出现 了困难。 介绍了w e bs e r v i c e s 具有松耦合、跨平台、易扩展等设计优势,提出应用w e b s e r v i c e s 技术解决异构数据库联合检索的方案,并根据此方案为连云港职业技术学 院图书馆构造了基于m a r e 数据和关系型数据的w e bs e r v i c e s 接口,设计了一个基 于w e bs e r v i c e s 的图书联合检索系统,实现了“联合检索、统一界面、统一结果” 的目标,以较低成本解决了异构图书管理系统共存但不共享的问题。 关键词:w e bs e r v i c e s ,m a r c ,a s p n e t ,联合检索,异构 基于w e bs e r v i c e s 的图书联合检索系统 a b s t r a c t t h i sa r t i c l ea n a l y z e st h ee x i s t i n gl i b r a r yb 0 0 km a n a g i n gs y s t e m s a n dp o i n t so u t t h e “i n f o r m a t i o ni s l a n d s ”p h e n o m e n o nc a u s e db yt h e h e t e r o g e n e i t yo fd a t a b a s e a r c h i t e c t u r e se m p l o y e da td i f f e r e n tl i b r a r i e s t h ed a t a b a s ea r c h i t e c t u r eh e t e r o g e n e i t y m a k e s t h e 自m n s u b r a r yd a t a b a s ei n t e g r a t i o ni m p o s s i b l e i nt h i sp a p e r , w ep r o p o s et ou s ew e bs e r v i c e st or e a l i z et h e j o i n tr e t r i e v a la c r o s s h e t e r o g e n e o u sd a t a b a s e s t h ew e bs e r v i c e so f f e r sal o o s el i n k i n gt r a n s - p l a t f o r mt h a t c a nb ee a s i l ye x p a n d e d w ei m p l e m e n t e daw e bs e r v i c c s - b a s e aj o i n tb o o k sr e t r i e v a l s y s t e mf o rt h el i b r a r yo fl i a ny u ng a n gt e c h n i c a lc o l l e g e t h ew e bs e r v i c e si n t e r f a c e i sb a s e do nm a r ca n dr e l a t i o n a ld a t a b a s e i ti se a s yt ou s ea n da l l o w st h ej o i n tr e t r i e v a l a c r o s sh e t e r o g e n e o u sb o o km a n a g i n gs y s t e m s t h ep r o p o s e ds y s t e mi sc o s t - e f f e c t i v e a n dr e a l i z e st h eg o a lo f j o n tr e t r i e v a l ,u n i f i e di n t e r f a c e ,a n du n i f i e dr e s u l t k e y w o r d s :w e bs e r v i c e s , m a r c ,j o i n tr e t r i e v a l ,h e t e r o g e n e o u s 基于w e bs e r v i c e s 的图书联合检索系统 果。 学位论文独创性声明 本人郑重声明: 1 、坚持以。求实、创新”的科学精神从事研究工作 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究成 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构已 经发表或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示了 谢意。 作者签名:迸 作者签名:丝堕: 日 期:邋:f 【丛 学位论文使用授权声明 本人完全了解南京师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电子 版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论文 进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进行 检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在解 密后适用本规定。 作者签名:丑? 硅作者签名:丘坦翌 日 期:2 盈f 名 基于w e bs e r v i c e s 的图书联合检索系统 1 1 图书检索发展现状 第一章图书联合检索 在传统图书馆中,图书管理人员为方便人们快速查找所需图书资料,一般提供 了书名检索、作者检索、分类号检索等多种方式,随着计算机管理技术的发展,各 图书馆纷纷建立了自己的计算机图书管理系统,又为人们提供了新式的计算机检索 手段,一般经常用到的有:题名检索、作者检索、i s b n 号检索、出版社检索、分 类号检索、条码号检索以及以上各神手段的组合检索,这些检索方式为人们迅速查 找到自己所需图书资料提供了一种快捷、方便、准确的手段。 联合检索即是在现有图书管理系统的基础上对多个图书馆的馆藏书目信息进行 联合检索处理,使人们在检索书目信息时如同检索一个图书馆的数据库,这样可以 将各个分散的图书资源进行整合处理。这是在2 0 世纪9 0 年代以来,在计算机、网 络和通信技术的迅猛发展并广泛运用的基础上,为了满足处理大量信息资源的要求, 提高信息资源的组织、加工、传递、有序发布、用户检索以及获取所需信息资源的 效率,人们将各图书馆分散的信息资源进行整合,希望实现一个联合工作的一体化 图书馆,例如为使各馆的图书资源能够得以共享,希望实现对多个分布在不同地区 的图书馆同时进行检索,实现输入一次,返回多馆信息的要求,这样相比以前的各 馆各自为政的局面,提高了检索范围和检索效率,现在部分图书馆已经在这方面取 得了一些进展。 随着网络技术的发展和图书管理工作网络化的需要,各图书管理系统已经纷纷 由“各自为政”的独立化管理向网络化管理转化,目前各系统单独对外提供访问时 基本没有太大的问题,一般用户都能通过i n t e r n e t 或i n t r a n e t 实现对各系统的独立访 问,但是在目前计算机图书管理系统向数字图书馆过渡过程中,出现了许多图书馆 联合检索的需求,出现了所谓的“联合检索”问题,如我校( 连云港职业技术学院) 存在两套图书管理系统,老系统已经存储了十多万册书籍的信息,后来重新启用了 另一套图书管理系统,新的图书管理系统在数据库的结构上与原系统数据不兼容, 无法实现数据的兼容,致使两套管理系统不能联合使用,这个问题严重影响了我校 图书的正常流通,给图书管理工作造成极大的不便,类似问题还出现在许多学校不 同校区的图书联合检索、不同高校之间图书信息联合检索等,由于各图书馆所使用 的数据库在格式上和表达方式上有着很多的异构,使得彼此不能互相合并、不能实 现资源共享和无缝的连接、不能互相兼容,各图书馆成了信息海洋中的一个个的“信 息孤岛”,不同图书管理系统不能进行联合工作,这种“孤岛”现象成为了图书检索 基于w e bs e r v i c e s 的图书联合检索系统 的一大难题,迫切需要解决。 1 2 研究课题的提出 为了让图书信息资源通过w e b 发挥最大的作用,异构数据源集成已成为必然的 需要,异构数据源集成的目的之一是提供一个统的检索手段和检索界面,支持对 w e b 上异构的数据源的查询,实现数据无缝集成的关键和困难是如何以一种统一的 数据模式描述各数据源中的数据,屏蔽它们的平台、数据结构等异构性。但现在的 w e b 集成人员面对的是一个异构的分布式环境( 其中开发语言不同、部署平台不同、 通讯协议也可能不同,对外交换的数据格式更可能有巨大的差异) ,业务流程难以清 晰地分离,系统之问存在重叠和不一致之处,系统之间有不同的安全系统和密码, 软件接口没有提供通用的信息格式,系统可能在不同的时区运行并且在地理上是分 散的,还有系统的可伸缩性、可恢复性和意外事故处理受到影响等。另一方面,作 为为用户、合作伙伴和部门内部提供信息服务的平台,集成的数据系统还必须具有 高可用性、安全性、可靠性和可伸缩性。这些要求再加上复杂多变的用户需求,使 得数据集成系统的开发越来越困难。目前,如何把这些松散的应用系统方便地、低 代价地连接在一起,从而实现大范围跨实体的应用系统级别的互联,同时满足复杂 多变的用户需求是摆在开发人员面前的一个大问题。而如何去面对语言差异、平台 差异、协议差异、数据结构的差异所带来的复杂系统集成的挑战,则是解决这个问 题的关键。 在这种背景下,本文通过对不同体系的图书管理系统的分析和处理,指出现有管 理系统之间存在的问题,应用w e bs e r v i c e s 技术探讨解决异构数据库之间联合检索 问题,给出一套书目联合检索方案,并在连云港职业技术学院两套异构图书管理系 统的基础上,设计一个基于w e bs e r v i c e s 的图书联合检索系统,该系统可以向用户 提供对异构数据库的联合书目检索功能,实现“联合检索、统一界面、统一结果” 的目标,为解决异构图书管理系统之间“数据孤岛”问题的提供一种新思路。 1 3 研究内容介绍 系统主要包括了两部分内容,一是建立各数据库系统的w e bs e r v i c e s 接口,二 n e t 平台上多数据库集中查询的实现。相应地本文对以下两方面内容进行了研 究: 1 3 1 建立各数据库系统的w e bs e r v i c e s 接口技术 在本文中首先探讨了w e bs e r v i c e s 技术具有的跨平台、跨语言、屏蔽异构环境 2 基于w e bs e r v i c e s 的图书联合检索系统 优势,阐述了利用w e bs e r v i c e s 技术解决异构图书管理系统的技术可能性和优势所 在;其次分析了现在许多图书管理系统中使用的m a r c 记录知识,对m a r c 存储 格式所具有的优势和目前在网络环境下所存在的问题做了比较详细的分析和介绍; 接着在微软最新的a s p n e t 2 0 中平台上利用v i s u a lw e bd e v e l o p e r2 0 0 5e x p r e s s e d i t i o n 做为开发工具,在分析m a r c 字段特点的基础上,实现了图书管理系统中 基于m a r c 的w e bs e r v i c e s 接1 2 i 和基于关系型数据的w e bs e r v i c e s 接口,并在此基 础上给出了自己的书目联合检索方案。 另外,为了提高系统的多数据库集中查询效率,本文研究并提出了一种二次查 询的优化方法,基于该方法可以在不降低查询精度的情况下避免一些无效的数据库 访问操作,从而能够比较有效地提高系统的查询效率。 1 - 3 2 多数据库查询结果集汇集 在本文中研究了多数据库集成技术,在对多数据库系统体系结构及多数据库信 息集成的相关方法的同时,结合本文的背景和需求,对实现多数据库集中查询的一 些关键技术作了相应研究,包括全局数据库的生成、数据库模式转换、数据汇集方 法等。 本文的研究成果体现在设计了一个基于w e bs e r v i c e s 的多数据库的图书联合检 索系统,并在n e t 框架平台下进行了实现,该系统具有以下特点: 图书联合检索系统采用w e bs e r v i c e s 技术,在进行数据集成的同时,使系统具有 松散耦合性和高度可扩展性,使系统具有更大的弹性,从而更容易地满足实际扩 展的需求。 系统将相关的数据查询功能封装成w e bs e r v i c e s 的形式,大大降低了客户端应用 程序的复杂性。 系统同时提供了基于浏览器的查询功能,便于人类用户进行查询。 系统采用了二次的优化方法,提高了系统的查询效率。 最后在n e t 平台下调用这两个w e bs e r v i c e s 接口,实现了n e t 平台上基于 w e bs e r v i c e s 的图书联合检索系统模型。由于本文研究和解决的问题具有一定的普 遍性,因此,系统的设计和实现方法对于解决大量类似的实际问题具有一定的参考 意义。 1 4 研究意义 基于w e bs e r v i c e s 的图书联合检索系统 通过建立基于w e bs e r v i c e s 的图书联合检索系统,实现对现有图书资源的低成 本整合,这个联合检索系统的实现,不仅解决连云港职业技术学院图书管理中现有 两套管理系统并存但彼此不能互访的问题,而且对今后实现更多图书管理系统互联 互访乃至与其它领域的系统整合与资源共享都有较大的帮助。 1 5 本文的结构 本文共分为六章,第一章图书联合检索部分,介绍了研究问题相关的背景,w e b s e r v i c e s 技术的作用,及本文的主要研究内容和研究目的,实际意义。第二章研究 基础,介绍了本论文的研究基础,即:n e t 技术、w e bs e r v i c e s 技术、a s p n e t 、 m a r c 格式的构成、特点等。第三章系统的分析与设计。第四章关键技术研究。第 五章系统的实现。第六章结束语。 4 基于w e bs e r v i c e s 的图书联合检索系统 2 1w e bs e r v i c e s 第二章相关基础技术介绍 2 1 1 乳bs e r v i c e s 的工作原理与流程 随着互联网应用的发展,近几年出现的w e bs e r v i c e s 技术使互联网发生了巨大 的变化,w e bs e r v i c e s 提供在可缩放的、松耦合的和非特定平台的环境下交换信息 的能力,交换信息使用诸如 r r t p x m l ,s o a p 和w s d l 之类的标准协议。它的目的 是融合互联网的各种信息服务为一个整体,从而更有效地处理信息。 w e bs e r v i c e s 的定义:w e bs e r v i c e s 是松散耦合的、可复用的软件模块。从语义 上看,它封装了离散的功能,在i n t c m e t 上发布后,能够通过标准的i n t c r n c t 协议在 程序中访问,在典型情况下,w e bs e r v i c e s 体现为一些包装在i n t e r a c t 通信协议之中、 可以在i n t e r a c t 之中组装和运行的软件部件。网络上的其他应用程序可以访问并使 用它们,集成为更大的应用程序。 w e bs e r v i c e s 为异构资源互访提供了对话接口,w e bs e r v i c e s 服务体系结构( 如 图2 i ) : 浏览器端 绑定 服务器端 图2 1w e bs e r v i c e 体系结构 服务提供者:服务的所有者,定义w e bs c r v i c e s 的服务描述,并把它发布到服务注册 中心。 服务请求者:服务请求者角色可以由浏览器来担当,由人或无用户界面的程序来 控制它。 服务注册中心:服务提供者在此发布服务描述,服务请求者在此得到服务描述。 这三个角色是根据逻辑关系划分的,在实际应用中,角色之间很可能有交叉: 一个w e bs e r v i c e s 既可以是w e bs e r v i c e s 提供者,也可以是w e bs e r v i c e s 请求者, 或者两者兼而有之。这三个角色通过3 个基本操作:发布、查找、绑定来相互作用。 服务提供者向服务注册中心发布服务。服务请求者通过服务注册中心查找所申请的 服务,并绑定到这些服务上。 5 基于w e bs e r v i c e s 的图书联合检索系统 w e bs e r v i c e s 架构中的三种基本的操作为:服务说明的发布,查找服务说明和根 据服务说明绑定或调用服务。这些操作可能会执行一次或多次。 发布( p u b l i s h ) :为了能够访问服务,必须首先发布服务说明,服务请求者才能够 找到该服务。 查找( f m d ) ,服务请求者可以直接从服务提供者得到服务说明,也可以向服务注 册中收查询服务说明的位置。查找操作可以出现在服务请求者生命周期的两个不同 阶段:设计时刻和运行时刻,前者获得服务的接口说明用于程序的开发,后者获得服 务的绑定说明用于服务的调用。 绑定( b i n d ) :在绑定操作中,服务的请求者在运行时刻使用服务说明中的绑定信 息定位、连接和调用服务,启动与服务的交互,调用服务的方法。 为了对w e bs e r v i c e s 有更好的理解,下面将对这个定义做一些更加详细的解释: w e bs e r v i c e s 是可复用的软件模块。w e bs e r v i c e s 是对软件开发中面向对象设 计的发展和舞华。基于组件的模型允许开发者复用其他人创建的代码模块,组 成或扩展它们,形成新的软件。 这些软件模块是松散耦合的。传统的应用软件设计模式要求各个单元之间紧密 连接,这种连接形成的复杂性要求开发者必须对连接的两端元素有完全的了解 和控制能力,并且一端的执行机制发生变化,那么另一端便会崩溃。相反,松 散藕合的系统,只需要很简单的协调,并允许更加自由的配置,任何应用都可 以调用对应的接口连接到系统中来,方式灵活,简单快速,真正实现了“即插 即用”。 从语义上看,w e bs e r v i c e s 封装了离散的功能。一个w 曲s e r v i c e s 就是一个自 包含的“小程序”,完成单个的任务。w e bs e r v i c e s 的模块使用其他软件可以理 解的方式描述输入和输出,其他软件知道它能做什么,如何调用它的功能以及 会返回什么样的结果。 w e bs e r v i c e s 可以在程序中访问。不同于w e b 网站或桌面级程序,w e bs e r v i c e s 不是为直接与人类交互设计的,它们不需要有图象化的用户界面,w e bs e r v i c e s 在代码级工作,它们被其他软件调用,并与其他软件交换数据。不过w e b s e r v i c e s 最终的目的还是形成一个能够与用户交互的应用软件。 w e bs e r v i c e s 是在i n t e r n c t 上发布的。w e bs e r v i c e s 使用现有的并广泛使用的传 输协议,比如h 兀甲,使用与传输w e b 内容相同的、并广泛使用的协议,不需 6 基于w e bs e r v i c e s 的图书联合检索系统 调整现有的i n t e m e t 架构,w e bs e r v i c e s 就可以通过防火墙进行通信。 w e bs e r v i c e s 的目标是消除语言差异、平台差异、协议差异、数据结构的差异, 成为不同组件模型和异构系统之间的胶水集成技术。因此,它的开发和使用就应该 独立于w e b 上各种各样的操作系统、编程模型和语言。将来所有的系统或设备都会 面向i n t e m e t ,也就是说所有的系统或设备都具有普遍的通信功能,能够让任何系统 或设备接入i n t e m e t ,以保证i n t e r a c t 上的其他系统或设备能够访问它们。 在图书馆之间的网络中应用w e bs e r v i c e s 技术又有如下优点: 计算机技术的发展趋势。w e bs e r v i c e s 技术在异构平台的企业级系统集成( e a d 中 获得了广泛的应用,当前及今后一段时间内的两大主流应用平台s u no n es t u d i o 和w m d o w s n e t 均将基于网络的应用构建在w e bs e r v i c e s 基础上。 符合信息技术的发展趋势。w e bs e r v i c e s 协议栈的顶层协议族中,s o a p 、 w s d l ( w e bs e r v i c e s 描述语言) 、u d d i ( 统一描述、发现和集成) 均是架构在x m l 之上的,而x m l 已经成为信息交换的通用标准和数据描述的元语言,是主流的信 息描述技术。 网络架构灵活和低成本。w e bs e r v i c e s 是基于i n t e m c t i n w a n e t 的,符合网络发展 趋势。虽然图书馆之间还可以建立v p n ( 虚拟专用网) 或专线网络。但是,这类网 络构建成本较高、存在着硬件设备维护等问题。 2 1 2w e bs e r v i c e s 的特点 1 完好的封装性 w e bs e r v i c e s 既然是一种部署在w e b 上的对象,自然具备对象的良好封装性。 对于使用者而言,它能够而且只能看到该对象提供的功能列表。 2 松散耦合 如果两个系统进行通信时互相传递的消息是自描述且基于文本的,而且两个系 统只需要理解这种消息既可实现通信,那这两个系统可以认为是松散耦合的。相反, 那些强耦合的系统之间要进行通信,通信的一方必须对另一方有足够的了解,这不 但在实现时增加了麻烦,也不便于以后的扩展。这一特征也是源于对象组件技术, 当一个w e bs e r v i c e s 的实现发生变更时,调用者不会感到这一点。对于调用者来说, 只要w e bs e r v i c e s 的调用界面不变,w e bs e r v i c e s 实现的任何变更对他们米说都是 透明的,甚至是当w e bs e r v i c e s 的实现平台从j 2 e e 迁移到n e t 或者足相反的迁移 流程,用户都可以对此一无所知。 7 基于w e bs e r v i c e s 的图书联合检索系统 3 使用标准协议规范 作为w e bs e r v i c e s ,其所有公共的协约完全需要使用开放的标准协议进行描述、 传输和交换。这些标准协议具有完全免费的规范,可由任意组织进行实现。一般而 言,绝大多数规范将最终以w 3 c 或o a s i s 作为最终版本的发布方和维护方。 4 高度可集成能力 由于w e bs e r v i c e s 采取简单的、易理解的标准w e b 协议作为组件界面描述和协 同描述规范,完全屏蔽了不同软件平台的差异,无论是c o r b a d c o m 还是e j b 都以通过这一种标准的协议进行互操作,实现了在当前环境下最高的可集成性。 由于w e bs e r v i c e s 具有完好的封装性、松散藕合、使用标准协议规范和高度】 集成能力等特点,以及w e bs e r v i c e s 所具有的互操作性、开放性,使得w e bs e r v i c e s 成为新一代软件体系结构和软件开发模式,并为软件重用、实现跨平台、跨网络的 分布式应用的提供了一种新的解决方案 2 2 图书管理系统中的m a r c 在传统图书馆的数据存储中,图书编目的数据都是以m a r c 形式存在的。 m a r c ( m a c h i n er e a d a b l ec a t a l o g i n gf o r m a t ) 简称m a r c 格式,也称机器可读目录, 是计算机编目的产品,它是以代码形式和特定格式结构记录在计算机存贮载体上,能 够被计算机识别并编辑输出书目信息的目录形式,诞生于上世纪6 0 年代末,是美国 国会图书馆随着计算机联网数据库的发展而开创的“机读编目格式”。m a r c 格 式是由国际标准化组织制定的文献信息交换用磁带格式的一种特定的执行文件, m a r c 格式规定了书目数据记录的结构,它规定用于交换信息而编制的书目记录, 机读目录格式是为加速文献信息网络建设,实现国内各图书采购单位以及国内与国 外书目信息的交换与共享而制定的,以标准的计算机可读形式用于交换书日信息的 机读格式,它简化和促进了图书流通领域的大批量交易,同时也简化了交易手续, 是图书流通领域规范化、规模化的必然发展趋势。 下面以一种书的书目m a r c 为例,详细介绍m a r c 格式,先看存储形式: 0 11 0 3 n a m2 2 0 0 3 1 3 4 5 0 0 0 0 1 0 0 11 0 0 0 0 0 0 0 5 0 0 1 7 0 0 0 11 0 1 0 0 0 3 7 0 0 0 2 8 0 1 0 0 0 2 4 0 0 0 6 5 1 0 0 0 0 4 1 0 0 0 8 9 1 0 1 0 0 1 3 0 0 1 3 0 1 0 2 0 0 1 5 0 0 1 4 3 1 0 5 0 0 1 8 0 0 1 5 8 1 0 6 0 0 0 6 0 0 1 7 6 2 0 0 0 1 0 8 0 0 1 8 2 2 1 0 0 0 3 1 0 0 2 9 0 2 1 5 0 0 2 9 0 0 3 2 1 3 1 4 0 0 2 9 0 0 3 5 0 3 1 4 0 0 2 7 0 0 3 7 9 4 5 4 0 0 9 6 0 0 4 0 6 6 0 6 0 0 2 6 0 0 5 0 2 6 1 0 0 0 2 5 0 0 5 2 8 6 9 0 0 0 1 5 0 0 5 5 3 7 0 1 0 0 5 3 0 0 5 6 8 7 0 1 0 0 3 9 0 0 6 2 1 7 1 2 0 0 5 5 0 0 6 6 0 8 0 1 0 0 2 2 0 0 7 1 5 8 0 1 0 0 2 6 0 0 7 3 7 9 0 5 0 0 2 6 0 3 基于w e bs e r v i c e s 的图书联合检索系统 0 7 6 3 0 0 0 0 2 1 2 1 9 2 - 2 0 0 2 0 7 0 3 0 8 5 9 0 0 0 一a 7 1 1 1 0 96 9 2 - 4 d c n y 5 8 0 0 ( 含光盘) a 7 - 9 8 0 0 0 7 - 3 4 - 4 b 光盘一a 2 0 0 2 0 5 2 4 d 2 0 0 2e m k y0 c h i y 0 1 2 1e n - 1a e h i c e n g - a c n - b l l 0 0 0 0 一艄z 0 0 0 y y - a r - 1a 中文o f f i c e x p 专家a z h o n g w e n o 伍c c x p z h u a n j i a f ( 美) s t e p h e nln e l s o n , j u l i ak e l l y g 智慧东方工作室译- a 北京c 机械工业出版社一 d 2 0 0 2 a 5 3 2 页c 图d 2 4 c m e 光盘l 片a 责任者规范汉译姓:尼尔森a 责任者规范汉 译姓:凯莉1 1 2 0 0 1 ao f f i c e ) 口:t h ec o m p l e t er e f e r e n c e l 7 0 11 a n e l s o n , b s t e p h e nl 1 7 0 11 a k e l l y , b j u l i a - 0a 软件包a n m j i a ab a o - 0a o f f i c ex p a o f f i c ex p - a t p 3 1 7 1 v 4 1 a 尼尔森,a n ie l s c n , b s l g ( n e l s o n , s t e p h e nl ) - l a 凯莉a k a il i , b j g ( k e l l y , j u l i a ) - 0 2 a 智 慧东方工作室a z h ih u id o n gf a n gg o n gz l l os h i 4 译一o a c n b 小7 c 2 0 0 2 0 5 2 7 2 a c n - b j u s t l i b e 2 0 0 2 0 7 0 1 棚s t l i b d t p 3 17 1 n 2 8 m a r c 格式是i s o2 7 0 9 及g b2 9 0 1 的一个特定形式。它是对每一个用于交换 的书目记录规则必须遵循的标准记录结构。其标准构成为: 记录头标:由2 4 个字符构成。 地址目次区:区内含有一个或多个目次款目,每一款目由三位数字的字段标识号 ( 简称字段号) 以及字段长度和字段起始字符位置( 从第一个数据字段算起) 等部分构 成。 数据字段区( 变长字段) :由若干定长和变长字段构成,每个字段之间由字段分隔 符隔开。 记录结构如图所示: 其中数据字段区内容如下表所示 变长字段中的数据又由字段指示符和子字段组成。m a r c 格式旨在以数据交换 为目的而设计的载体格式,而不对各个系统的内部格式、内容或数据结构作出规定。 只为各个系统间交换数据时所用的格式和内容提供依据。在任何一种转换处理中, 其最后结果应符合本格式的规定。 采用该格式交换数据的机构将会发现,如果其系统内部格式的字段标识符、字 段和子字段的定义,与格式的相应部分保持一致,将会减少数据转换中的复杂性, 对此该格式是非常有用的。 9 基于w e bs e r v i c e s 的图书联合检索系统 2 2 1 记录头标( r e c o r dl a b e l ) 按i s o2 7 0 9 规定,每个记录头部都要有一个2 4 位字符的记录头标。它含有i s o 2 7 0 9 定义的关于记录结构的数据和为i s o2 7 0 9 的特定形式而定义的几项数据元素。 这些数据元素有:记录类型、目录级别、在层级中的位置、记录完整程度以及是完全 采用或部分采用i s b d 规则。头标中的数据元素主要是为了满足记录处理的需要, 只是间接标识书目实体本身。 2 2 2 地址目次区( d i r e c t o r y ) m a r c 格式规定,在记录头标之后为地址目次区。目次区的每个款目包含三部 分:三位数字表示的字段号,四位数字表示的数据字段长度和五位数字表示的字段起 始字符位置。除此之外,不允许有其它字符。 地址目次区的第二部分给出了该字段的字符个数,即字段长度。字段长度括该 字段全部字符的总和,包括指示符、子字段标识、正文或代码数据以及字结束( 分 隔) 符。在字段长度之后,是字段起始字符位置,即该字段第一个字处于数据字段区 中的位置。第一个数据字段的第一个字符的位置为0 ( 零) 。它在整个记录中的位置, 由头标第1 2 1 6 位的数字标明。 字段号长度为3 个字符,“字段长度”由四位数字表示,“起始字符位置”使用 五个数字位,共1 2 个字符。记录中每个数据字段都对应一个1 2 位字符的次款目, 全部款且构成目次区。在地址目次区之后用字段分隔符结束。目次区中各款目是按 字段号的第一个数字符号排序的。 2 2 3 数据字段区( 变长字段区v a r i a b l ef i e l d s ) 在地址目次区之后为变长数据字段区。除0 0 1 和0 0 5 字段由数据和一个字分隔 符组成外,其余每个字段均由两个指示符后接若干子字段组成。每个子字又以一个 子字段标识符开始,后接变长数据。每个字段都以一个字段分隔符结尾每个记录都 以一个记录分隔符结尾。 只要将记录头标、地址目次和数据字段的内容组配在一起就形成一条完整机读 目录记录。 上面给的m a r c 记录的格式缅分为: 头标区2 4 位:0 0 00 11 0 3 n a m2 2 0 0 31 34 5 0 0 地址目次区为: 1 0 基于w e bs e r v i c e s 的图书联合检索系统 0 0 1 0 0 1 1 0 0 0 0 0 0 0 5 0 0 1 7 0 0 0 1 1 0 1 0 0 0 3 7 0 0 0 2 8 0 1 0 0 0 2 4 0 0 0 6 5 1 0 0 0 0 4 1 0 0 0 8 9 1 0 1 0 0 1 3 0 0 1 3 0 1 0 2 0 0 1 5 0 0 1 4 3 1 0 5 0 0 1 8 0 0 1 5 8 1 0 6 0 0 0 6 0 0 1 7 6 2 0 0 0 1 0 8 0 0 1 8 2 2 1 0 0 0 3 1 0 0 2 9 0 2 1 5 0 0 2 9 0 0 3 2 l 3 1 4 0 0 2 9 0 0 3 5 0 3 1 4 0 0 2 7 0 0 3 7 9 4 5 4 0 0 9 6 0 0 4 0 6 6 0 6 0 0 2 6 0 0 5 0 2 6 1 0 0 0 2 5 0 0 5 2 8 6 9 0 0 0 1 5 0 0 5 5 3 7 0 1 0 0 5 3 0 0 5 6 8 7 0 l 0 0 3 9 0 0 6 2 1 7 1 2 0 0 5 5 0 0 6 6 0 8 0 1 0 0 2 2 0 0 7 1 5 8 0 l 0 0 2 6 0 0 7 3 7 9 0 5 0 0 2 6 0 0 7 6 3 数据区:0 0 0 0 2 1 2 1 9 2 - 2 0 0 2 0 7 0 3 0 8 5 9 0 0 0 一a 7 - 1 1 1 - 0 96 9 2 - 4 d c n y 5 8 0 0 ( 含光 盘1 a 7 9 8 0 0 0 7 3 4 - 4 b 光盘一a 2 0 0 2 0 5 2 4 d 2 0 0 2e n v y0 c h i y 0 1 2 1e a - ia e h i e e n g - a c n - b l l 0 0 0 0 缸z0 0 0 y y - a r - ia 中文o f f i e ax p 专家a z h o n gw e n of f i c cx pz h u a n j i a f ( 美) s t e p h e nln e l s o n , j u l i ak e l t y g 智慧东方工作室译一a 北京c 机械工业出版社 d 2 0 0 2 a 5 3 2 页c 图d 2 4 e m e 光盘l 片a 责任者规范汉译姓:尼尔森a 责任者规范汉 译姓:凯莉- 1 1 2 0 0 1 ao f f i c ex p :t h ec o m p l e t er e f e r e n e e l 7 0 11 a n e l s o n , b s t e p h e nl - 1 7 0 1l a k e l l y , b j u l i a - 0a 软件包a r u a n j i a nb a o - 0a o f f i c ex p a o f f i e ex p - a t p 3 1 7 1 v 4 一l a 尼尔森,a | l ie rs e n ,b s l g ( n e l s o n , s t e p h e nl ) - l a 凯莉,触a il i , b j g ( k e l l y , j u l i a ) 0 2 a 智 慧东方工作室a z l f ih u id o i l gf a n gg o n gz u os h i 4 译- o a o 曲) q 小c 2 0 0 2 0 5 2 7 - 2 a c n - b j u s l l 。i b c 2 0 0 2 0 7 0 1 删s t l i b d t p 3 1 7 i n 2 8 分别从目次区和数据区取出相应字段,显示如下: 0 0 10 0 0 0 2 1 2 1 9 2 0 0 52 0 0 2 0 7 0 3 0 8 5 9 0 0 0 0 1 0 i a7 - 1 11 - 0 9 6 9 2 - 4l dc n y 5 8 0 0 ( 含光盘) 0 1 0 一i a 7 - 9 8 0 0 0 7 3 4 - 4l b 光盘 1 0 0 一l a 2 0 0 2 0 5 2 4 d 2 0 0 2e m k y o c h i y 0 1 2 1e a 1 0 11 一i a c h i l ce n g 1 0 2 一i a c n i b1 1 0 0 0 0 1 0 5 一l a a z 0 0 0 y y 1 0 6 一i a r 2 0 01 一i a 中文o f f i c ex p 专家i az h o n gw e n o 伍c ex pz h u a nj i al f ( 美) s t e p h e nl n e l s o n , j u l i ak e l l yi g 智慧东方工作室译 2 l o i a 北京i c 机械工业出版社i d2 0 0 2 2 1 5 一i a 5 3 2 页i c 图 d 2 4 c m i e 光盘l 片 1 l 基于w e bs e r v i c e s 的图书联合检索系统 3 1 4 一i a 责任者规范汉译姓:尼尔森 3 1 4 i a 责任者规范汉译姓:凯莉 4 5 4 - 11 12 0 0 1 | ao f f i c ex p :t h ec o m p l e t er e f e r e n c ei l7 0 11i an e l s o n , i bs t e p h e nl 1 1 7 0 1li a k e l l y , l bj u l i a 6 0 6o - l a 软件包l ar u a n j i a nb a o 6 1 0 0 _ i a o f f i c e x p i a o f f i c e x p 6 9 0 一l a t p 3 1 7 1l v 4 7 0 1 _ 1i a 尼尔森,| a n ie rs e n , l bs l i g ( n e l s o n , s t e p h e nl ) 7 0 1j i a 凯莉,i a k a il i ,i bj i g ( k e l l y , j u l i a ) 7 1 20 2l a 智慧东方工作室 a z t f ih u id o n gf a n gg o n gz u os i f tj 4 译 8 0 1 _ oi a c ni b x m u c2 0 0 2 0 5 2 7 8 0 1 - 2l ac ni bj u s t l i bi c2 0 0 2 0 7 0 1 9 0 5 一| a j u s t l i b i d t p 3 1 7 1 n 2 8 由于m a r c 记录的制作只有图书馆专业人员才能胜任,对于一般未经过培训的 人员是很难读懂的,并且m a r c 的制作成本相对昂贵。在i n t e r a c t 还未普及和数字 图书馆建设未开展的时候,m a r c 格式在数据交换方面确实起了很大的作用,但在 当今的网络时代,尤其是在数字图书馆建设中,如果还一味的采用m a r c 格式进行 数据交换显然是行不通的,这是因为现行的网络环境是以h t m l 为基础构建的, h t m l 描述了如何显示w e b 页面中的数据,而x m l 描述数据本身,也就是说,h t m l 只能描述形式而不能揭示其内容,在h t m l 语法框架内要想充分表达m a r c 格式 所描述的书目数据事实上是不可能的,由此可见,正是m a r c 格式割裂了图书馆与 i n t e m e t 网络之间的联系,使得许多图书馆在处理馆藏资源时要采用目前使用的双重 系统:一是采用h t m l 技术( 如h t m l 文件、p d f 格式文件等) 在w e b 上发布馆藏 资源信息,二是仍要继续沿用m a r c 格式处理馆藏文献,并将其添加到书目数据库 中。这样不仅增加了图书馆提供服务的成本而且也限制了图书馆数十年来积累的丰 富的m a r c 格式书目数据的利用程度。即使数字图书馆建设成功,解决了传统图书 馆馆藏文献和资料的数字化加工和发布问题,但如果格式转换问题得不到解决,大 量的用m a r c 格式著录的书目数据仍有被闲置甚至成为一堆死数据的可能性。 针对目前图书馆的窘境,现在采用两种途径解决这一问题:一是基于h t m l 进 基于w e bs e r v i c e s 的图书联合检索系统 行改良,建立能描述书目数据和其他信息本质和内容的元数据格式和规范,并将之 纳入h t m l 技术体系中,如都柏林核心集( d u b l i nc o r e ) ,这种方法是目前国内数字 图书馆建设走在前列的图书馆通常采用的方法;- - 是采用早已出现的能对信息和数 据本质和内容进行详细描述的s g m l 。但由于s g m l 只能应用于特定领域或特定用 途,不能象h t m l 那样得到普及和应用,因此不能采用s g m l ,而采用x m l ,这 使得图书馆得以参与w e b 信息的大流通。但这两种方法都不是一蹴而就的,面对现 在急需要进行资源共享的各图书馆,有点远水解不了近渴,本文采用的方法是根据 目前实际情况、在转换到都柏林核心或x m l 之前的种过渡方案,即借助w e b s e r v i c e s 来实现馆际之间的图书信息传递,这样在对现有资源不需要太大变动的前 提下对图书馆馆藏信息资源进行发掘处理,为在未来w e b 信息空间发挥更加重要的 作用提供了一种过渡时期的低成本解决方案。 2 3 n e t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论