(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf_第1页
(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf_第2页
(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf_第3页
(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf_第4页
(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(交通信息工程及控制专业论文)基于Web+Service的联机编目系统设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第l 页 摘要 联桃编目,就是通过溺络共享,实现一次、一处书目数据输入,多次、 多处共享的编日工作方式。当前存在的联机编目方式主要建以编目数据服 务中心对于分散用户的一对多关系,中心良书目数据库为基础,以m a r c 格 式作为数据标准,通过z 3 9 5 0 专用传输检索协议,对远程用户提供m a r c 数据查询和下载,不足之处在于:一是数据集中式服务所带来的缺陷;二 是对z 3 9 。5 0 的技术捆绑,实现起来通用性不强,技术复杂;三是不能穿越 防火墙。 论文的所做的工作是:首先,对当前联机编目系统实现的过程、技术、 特点、数据编码及数据传输遴行分韦厅和研究,根据原有联机编目系统的应 用需求,从联机编耳的数据使用者、提供者和实现中间联系方法的三个方 面,提出基于w e bs e r v i c e 技术的联机编目系统方案。其次,在具体实现 中,对编目的格式标准“m a r c ”进行解橱,并实现m a r c 与x m l 数据格式的 转换;设计书目数据服务u d d i 中心,m a r c “数据提供者”服务端和“数据 使用者”客户端;实现编目人员对u d d i 的注册、查询和对“数据提供者” 的w e b 数据连接:实现“数据提供者”对u d d i 中心的注册和信息发布。最 后,系统应用以s q ls e r v e r 为数据库基础,以m sv i s u a lb a s i c n e 为开 发平台,实现系统程序设计。 本文章节内容安排为:第一章,对当前联机编目的现状进行研究分析, 并明确解决方向;第二章,结合原来的联机编目系统对新的系统的组成结 构、功能和流程进行详细分析;第三章,对系统所应用的数据标准和技术 条件作简单介绍,为论文作理论支持;第四章,根据需求分析对系统作具 体设计;第五章,根据设计要求利用开发平台做程序实现。 关键词:联机编目、m a r c 、w e bs e r v i c e 、x m l 、z 3 9 5 0 西南交通大学硕士研究生学位论文第1l 页 a b s tr a c t o n l i n ec a t a l o g u i n gi st h ew o r k i n go fc a t a l o g u i n gw h i c hc a nc a r r yo u t i n p u t i n gb i b l i o t h e c ad a t ao n c ea tas i n g l ep l a c ea n dr e a l i z es h a r i n gb i b l i o t h e c a d a t am a n yt i m e sa td i f f e r e n tp l a c e s n o w a d a y s ,t h ee x i s t e n to n l i n ec a t a l o g u i n g s a r em a i n l yo n e t o - m o r er e l a t i o n s h i p ,w h i c hi sb e t w e e nc a t a l o g u i n gd a t as e r v i c e c e n t e ra n dd i s t r i b u t e du s e r s t h es e r v i c ec e n t e ri sb a s e do nc a t a l o g u ed a t a b a s e a n du s e sm a r ca st h ed a t as t a n d a r d i tp r o v i d e sr e m o t er i s e r sw i t hm a r cd a t a q u e r ya n dd o w n l o a d i n gw i t ht h ez 3 9 5 0a p p r o p r i a t i v et r a m i s s i o n s e a r c h e s p r o t o c a l i th a s t h r e e s h o r t a g e s :f i r s t l y , i t h a st h e d e f i c i e n c y w h i c hd a t a c e n t r a l i z e ds e r v i c e sb r i n g ;s e c o n d l y , w i t ht h eb i n d i n go fz 3 9 5 0 ,i th a sp o o r c u r r e n c ya n dc o m p l e xt e c h n o l o g y ;t h i r d l y , i tc a nn o tg e tt h r o u 曲t h ef i r e w a l l f i r s to fa l l ,a n a l y s i n ga n ds t u d y i n gt h ee x i s t e n to n l i n ec a t a l o g u i n gs y s t e m r e a l i z a t i o n , t e c h n o l o g y , t r a i t s ,d a t ac o d i n ga n dd a t at r a m i s s i o n ,a n dg r o u n d i n go n t h ep r i m a r yo n l i n ec a t a l o g u i n gs y s t e ma p p l i c a t i o nd e m a n d ,t h et h e s i sb r i n g s f o r w a r dac a t a l o g u es c h e m eb a s e do nw e bs e r v i c et e c h n o l o g y n e x t ,t h es y s t e m p a r s e st h ec a t a l o g u ef o r m a ts t a n d a r dm a r ca n dr e a l i s e st h et r a n s f o r mb e t w e e n m a r ca n dx m l ;i td e s i g n sc a t a l o g u ed a t as e r v i c eu d d ic e r t r e ,m a r c ”d a t a p r o v i d e r s “s e r v i c ea n d ”d a t au s e r s ”c l i e n t ;i ta l s or e a l i z e st h er e g i s t e rc a t a l o g u e u s e r st ou d d i q u e r ya n d ”d a t ap r o v i d e r s ”w e bd a t ac o n n e c t i o n ;i tr e a l i z e st h e r e g i s t e r 。d a t ap r o v i d e r s ”t ou d d ic e n t e ra n di n f o r m a t i o nr e l e a s e l a s t l y , t h e s y s t e mu s e ss q ls e r v e ra sd a t a b a s e a n di s p r o g r a m m e d w i t hm sv i s u a l b a s i c n e ta st h ed e v e l o p m e n tp l a t f o r m t h es t r u c t u r eo ft h i st h e s i sa sf o l l o w s :i nt h ec h a p t e rl , i tp u t sf o r w a r dt h e e x i s t e n t i a lp r o b l e m sa c c o r d i n gt ot h ep r e s e n tc o n d i t i o no ft h eu n i o nc a t a l o g , a n d s u g g e s t st h em e a n so fi m p r o v e m e n t ;i nt h ec h a p t e ri i ,a c c o r d i n gt op r e - u n i o n c a t a l o gp r o g r a m a n d a n a l y z i n gn e wi n t e r n e tp r o g r a m s t r u c t u r e i t t a r g e t s f u n c t i o nd c f i n i t i o na n dp r o f e s s i o n a lp r o c e d u r e s :1 1 1t h ec h a p t mi i i i tm a k e sa b r i e fi n t r o d u c t i o no ft h em a r ca n dw e bs e r v i c ea st h et h e s i st h e o r yb a s i c ;i n t h ec h a p t e ri v i tm a k e sad e t a i l e dd e s i g no ft h eu n i o nc a t a l o g0 1 1t h eb a s eo ft h e w e bs c r v i c c ,i n c l u d i n gt h ep r o f e s s i o n a lp r o c e d u r e s ,p r o g r a ms t r t l c t ur e ,m o u l d 西南交通大学硕士研究生学位论文第1ll 页 f u n c t i o nd e f i n i t i o n ,e t c ;i nt h ec h a p t e rv ,i td e s i g n st h eu n i o nc a t a l o gf o l l o w i n g t h ep r o c e d u r e so ft h es o f t w a r ee n g i n e e r i n ga n dr e a l i z e st h eu n i o nc a t a l o g f u n c t i o nt e s t k e yw o r d s :o n l i n ec a t a l o g u i n g 、m a r c 、w e bs e r v i c e 、x m l 、z 3 9 5 0 西南交通大学硕士研究生学位论文第1 页 第1 章绪论 1 1研究背景 1 1 1 图书馆信息管理现况 现代图书馆行业的信息化主要可以分为三种情况:图书馆的业务自动化 管理、图书馆的数字化和联合图书馆的数字化。图书馆业务自动化管理是图 书馆行业信息化建设中比较基础的部分,所管理的内容主要是馆藏资源管理 和面向读者借还的流通服务;图书馆的数字化,是指将本馆资源,比如古籍、 拓片、书画、音像资料等以电子文档、图片、数字音频、视频等媒体格式通 过计算机存储以网络方式面向读者服务;联合图书馆数字化建设则是指图书 馆间的信息化协同作业,通过网络条件和相互认证,共享数字资源,互通有 无。 目前,国内图书馆大多实现了计算机自动化业务管理,作为图书馆主要 业务,即是对馆藏书籍的管理。一般来说,要实现自动化管理,首先要做的 就是将本馆馆藏书籍回溯建立数据库,将书目信息按一定方式组织和存贮, 为整个自动管理准备数据基础。然后按照图书馆业务类型分工,分为书刊采 购、编目、借还流通等业务子系统。其中,编目系统要做的是录入书目数据, 而对于书目数据本身而言,实际上全国各图书馆大多有相同藏书,亦即有相 同的书目数据,在当前畅通的互联网情况下,完全可以通过网络共享,将异 地、异馆书目数据联系起来,减少重复劳动,一处、一次书目数据录入,实 现网内各馆共享的联机编目方式。 就全国而言,包括高校图书馆和公共图书馆有数千个,对书目数据的网 络应用因此就显得非常必要了,现在全国很多地方建立了文献资源协作网络 体系,比如,“c a t a s ( 中国高等教育文献保障体系) ”,“全国医学文献信息中 心”、“地方版文献联合采编协作网c r l n e t ”等。通过网络协同作业的业务类 型主要包括:联合采购、联机编目、馆际互借、联机公共查询等。 1 1 2 国内联机编目现状 当前联机编目的现状,从业务网络结构上说,主要是以书目数据的中心 集中式管理,对会员提供数据下载服务,实际上是一个星形结构的数据集中 服务系统。书目中心负责组织、录入、校验标准书目数据,形成相对集中的 标准数掘库,各成员馆在登录此中心后,根据自己编目需求,输入“书名”、 “著暂名”、“摘要”等关键词查询所需书目信息,在查得信息后下载本条目 数据剑本地系统,增加本地馆藏字息后存贮在本地书目数据库,为本馆管理 西南交通大学硕士研究生学位论文第2 页 系统所用 联机合作编目的现有软硬件条件、数据标准和技术支持情况如下: l 、计算机硬件及网络条件: 现在国内图书馆大多装备有小型机、超小型机或p c 服务器,存储设备 容量从几十g b 到几十t b ,网络条件有全国性公众网络和国家教育科研网络。 2 、数据格式标准问题: 数据规范化生产是保证书目数据质量的主要手段,特别是联机编目的规 范化、标准化尤为重要。1 9 9 0 年,北京图书馆开始向全国发行中国机读 目录格式,1 9 9 5 年中国机读目录( c n m a r c ) 瞰l 正式成为行业标准。 目前,开展联机编目所应遵守的各种标准有: 著录标准:中国文献编目规则、国际标准书目著录( i s b d ) 机读目录格式:c n 姒r c ;l c m a r c 主题标引规则:北京图书馆主题标引规则l i b r a r yo fc o n g r e s ss u b j e c t h e a d i n g s ( l c s h ) 分类法:中国图书馆分类法( 第四版) 规范:名称规范,题名规范和主题规范 数据传送标准i s 0 2 7 0 9 3 、数据库及软件实现: 自9 0 年代以来,各省和地区的图书馆都先后建成自己的书目数据库。 据不完全统计,我国现在建成规模不等的数据库约2 0 0 0 多个从理论上说, 只要有书目数据库,就有联机编目的数据提供条件。目前在对于图书馆信息 化管理中,软件种类达上百个之多,但是主流应用的图书馆管理系统的大约 十个左右,而且大都支持联机编目。在联机编目的实现中,基本是以“客户 服务”模式,以联机编目数据中心为依靠,通过专用的网络应用协议 z 3 9 5 0 t 5 3 j 实现联机编目。 当前,我国主要有四大联机编目中心,分别是:国家图书馆联合编耳中 心;c a l i s 联机合作编且中心;中国科学院国家科学数字图书馆( c s d l ) 联 合编目服务系统;地方版文献联合采编协作网( c r l n e t ) 。 1 1 3 存在问题 对于当前书目数据联机编目的现状,简单总结,其特点是: i 、数据中心集中数据存贮和管理,为用户提供数据服务; 2 、数据格式以c n m a r c 为标准,统一不同图书馆间的数据规范。 3 、通过z 3 9 5 0 协议进行数据传输,客户端和服务端需要分别拥有支持 7 _ 3 9 5 0 协议的数据接口。 目前国内有很多软件处理系统,但其基本点都是基于对中心书目数掘 西南交通大学硕士研究生学位论文第3 页 l l a r c 的。服务客户”方式,对于具体的编目端工作,每次下载数据都是单 点数据连接,选择下载,这对于当前比较成熟的网络应用环境,对于开放互 联业务的新网络数据业务要求,都稍显狭隘和封闭,而在处理书目数据m a r c 的过程中,也存在一些问题。综合相关因素,联机编目当前存在的问题或不 足之处在于; 1 、集中式数据服务的缺点,表现为: 数据中心对软、硬件要求较高,结构复杂、并且需要组织专门的 专业人员负责中心数据库的建设和维护,人工成本高; 数据量有限,因为对于全国而言,需求数据量是海量的,对于不 同用户千差万别的数据需求,一个中心显然难以满足; 数据中心数据流量大、业务处理繁忙,各终端用户对数据中心的 依赖程度较大,一旦中心出现故障停止服务,所有终端将无法得到所需 数据 数据接口方式不够灵活,当数据服务中心数据格式或结构发生改 变的时候,终端就要针对中心的改变做相应改变 2 、书目数据的m a r c 格式,对于网络数据传输的要求过于专业化,完 全捆绑z 3 9 5 0 的网络应用协议,使得数据从服务端到客户端必须依靠拥有 7 _ 3 9 5 0 接口的数据服务端和客户端应用程序,并且z 3 9 5 0 所应用的数据端 口2 1 0 在防火墙限制情况下,将不能数据通信对于当前的网络数据应用条 件,z 3 9 5 0 专用协议的必要性确实不大。 3 、书目数据中心自身的信息相对独立,如果不是专门性指定连接,用 户无法查找和发现数据中心站点,而且即使在用户已连接的情况下,如果本 中心没有相应数据,也不能提供其他数据资源定位连接 1 2 研究内容 针对前面提出的传统联机编目的三方面弱点,本课题的目标是应用w e b s e r v i c e 技术,重新设计联机编目系统。 主要完成任务如下: 1 、建立数据源信息服务中心u d d i ,组织和存贮各分散数据源信息,用 于信息统一资源定位服务,包括统一检索入口等,而不是实际存贮 m a r c 数据的物理数据集中服务中心,将原来联机的编目的“客户端 n 务端”模式改为“客户端信息中心服务端”模式使得客户端 对服务端不再是唯一依赖,当它从某服务端得不到需求数据的时候, 可以通过数据源信息中心请求其他的数据源。 2 、数据信息编码问题上,将原柬的m a r c 数据转换为x m l 数据。目的是 用于程序中间流程数据的网络传输。 3 、在数据传输问题上,将原束z 3 9 5 0l 办议改为利用常用的s o a p h t t p 西南交通大学硕士研究生学位论文第4 页 协议传输。从而克服了防火墙对网络传输的障碍。 4 、以s o ls e r v e r 数据数据库为基础,在v i s u a lb a s i c n e t 环境下设 计基于w e bs e r v i c e 的书目数据服务端和编目客户端程序,通过客 户端对u d d i 的查询,返回服务端信息并实现与之绑定,最后实现客 户端对服务端数据查询、下载,完成联机编日 1 3研究意义 通过对图书馆信息管理情况和对联机编目具体业务的现状分析,找到当 前联机编目技术处理方式的弱点,通过引用w e bs e r v i c e 技术方法,对原业 务系统做更优化的设计其现实意义在于: 1 、解决原图书馆信息管理建设中对于联机编日子系统存在的问题; 2 、通过从集中式数据服务到分布式数据服务,彻底改变了原系统结构; 3 、通过对联机编目系统的改进,为图书馆其它网络服务,包括联机公 共查询、网络采购、馆际互借等等提供了数据条件和技术参考。 西南交通大学硕士研究生学位论文第5 页 第2 章需求分析 2 1 系统网络结构及组成 在分析基于w e bs e r v i c e 下的联机编目之前,先对原来编目系统的网络 结构作简要分析通常情况下,图书馆内部管理系统的网络结构是以图书馆 服务器为中心的星形网络结构,对于内部业务自动化,全面依托服务器管理, 但是,为实现联机编目,内部用户需要应用远程数据,这时用户端将通过互 联网联接远程数据中心( 集中大量书目数据的服务提供者) ,即编目用户端 与数据中心通过z 3 9 5 0 协议实现网络联接和数据服务,网络结构如图2 1 所示。 图2 1 基于z 3 9 5 0 的联机编耳网络结构图 在传统的联机编目系统中,实现联机编目服务的时候,各图书馆编目远 程连接终端都是以“数据中心”为中心,请求、下载数据的集中式数据服务, 但实际上,在各馆的管理系统中,都有自己的管理平台和数据库条件,对于 数据标准的国家行业规定,又都是一致的,各馆因为自身特色或舰模的不同, 数据也因此备异从而具有可相互利用的互补优势,所以,各馆之f u j 可以通过 互联网实现联机数掘服务。但对于浩如烟海的互联网,怎么找到需要连接的 西南交通大学硕士研究生学位论文第6 页 其它图书馆数据呢? 通过w e bs e r v i c e 系统改造,在网络中设置u d d i 信息 中心,为连接提供查询中介,网络结构图示如图2 2 所示 图2 2 基于w e bs e r v i c e 联机编目网络结构图 参考图2 2 ,对比原系统网络结构,系统在三个地方作改动。 1 、原来数据中心的服务机构,新建立u d d i 信息中心( 图中a 所示) 服 务,目的是提供远程数据源的查询信息,同时也为各图书馆提供自己的信息 登记和发布。 2 、对原来各图书馆管理系统的服务端( 图中b 所示) 进行改造,原来 是主要以内部客户端为服务对象改为面向互联网络中所有图书馆编目客户 端的w e b 服务。 3 、对于原来的客户端( 图中c 所示) ,其实现功能不变,但这里要针对 新的数据接口设计,通过系统改进,编目终端将会获得更多的数据源选择和 连接服务,同时,网络上的所有图书馆,通过u d d i 中心的信息关联,可以 互通有无,彼此互联,籍由此实现由集中式向分布式服务的转变。 通过上面对系统网络的结构分析,可以看到,在基于w e bs e r v i c e 的联 机编目系统中,系统实际卜山_ 个部分组成,即图示2 3 中的a 、b 、c 三部 分: 西南交通大学硕士研究生学位论文第7 页 圈2 3 系统组成结构图 a :u d d i 中心:存储和管理图书馆书目数据服务的注册信息,接受服务 端的注册和信息发布,同时面向客户端的连接和查找请求,返回服务端的信 息,让客户端直接与服务端绑定网络连接。 b :服务端:作为本馆业务管理的同时,更通过将服务端的数据以w e b 服务方式向所有客户端( 包括不同馆之间) 提供数据服务,b 端向a 随时更 新自身信息。 c :客户端:编目客户端,通过在u d d i 中心查找到书目数据服务端,再 与服务端进行连接后,查找和下载具体书目数据,添加本馆信息后存储在本 系统平台上的数据库。 作为联机编目系统,a b 、c 三个方面相互联系和作用,且b 和c 往往 同时存在于一个图书馆中,只是a 为w e b 服务中介,其位置相对独立,c 作 为客户端,是系统中实现编目的终端,相对复杂的是服务端b 的情况,在整 个网络系统中,其实体可以是图书馆、出版社、书目数据服务商等。 2 2 系统功能分析 系统的总体目标是实现书目数据的共享,在共享数据的网络结构中( 图 2 2 ) ,可以看到,对于不同馆之f s j 的相巨联系的工作情况,各个图书馆自己 的用户终端除了对本馆服务器的局域网连接,还可以通过广域网连其它图书 馆服务端,如果以一个图书馆为单f f ,则其只包含用户端和服务端,而对于 联机编目系统来说,则包含大量的服务瑞和用户端,根据应用的全局分析, 西南交通大学硕士研究生学位论文第8 页 系统包括三个部分:数据使用者( 用户端) ;数据提供者( 服务端) ;w e b 服 务中介( u d d i 中心) 2 2 1 数据使用者 在联机编目系统中,数据的使用者主要是编目人员和书目数据查询用 户,对于通过网络索取数据,其需求特点是: 1 、数据质量高。获得描述详细而准确、信息完整的书目数据( 1 i a r c ) ; 2 、数据来源多。数据来源不限于一个“数据中心”,有更多的数据源支 持; 3 、易操作。对数据源使用中,隐藏过程,最好是一次查询,得到所有 结果,并且用户界面友好,简洁。 4 、成本低。通过自身数据资源参加共享网络,互相利用,降低引用成 本; 其中,对于编目人员的具体工作来说,所要做的工作是对数据服务端的 数据查询、选择、下载、套录、然后加载馆藏信息进入本地数据库管理系统 的一个过程。 2 2 2 数据提供者 当前大多数图书馆都实现了自动化业务管理,都拥有规模不等的书目数 据库,但因为各馆在专业化方向上的不同,馆藏书刊资源也就各具特色,数 据类型和数据量大小也不同,因此,在实现联机编目、数据共享的过程中, 都可以作为联机编目的数据提供者,从“联机编目系统”来讲,也就是数据 服务端。 作为联机编目服务端,应当具备的条件是: l 、有一定数量,具有符合国家文献著录标准的l l a r c 数据; 2 、有在网络上发布m a r c 数据的软件支持; 3 、具有承受一定网络业务量的计算机硬件设备; 4 、专业的对于数据和程序服务的管理人员; 在具有上述条件的基础上,建立联机编目系统的数据服务端,根据系统 的需求,数据服务端应当具备以下功能: 1 、数据管理功能:包括数据库的管理,数据的输入、数据校验、数据 连接、数据输出等; 2 、用户管理:包括对馆内用户和馆外用户的登记、注册、功能分类、 权限分配等; 3 、其它功能:包括对服务端系统的配置,数据安全和网络安全管理, 还有如何将服务信息通过v e b 服务中介向客户端发布连接信息等问题。 西南交通大学硕士研究生学位论文第9 页 员。 数据服务端的操作人员主要包括两种:系统管理人员和数据库管理人 图2 4 服务端组成示倒 服务端组成,包括d b m s 、应用服务器、w e b 服务器三个部分。概要地对 服务端功能定义,服务端的目的就是以适当的数据传输方式、数据接口为用 户提供数据源连接。 其中d b m s 是数据库管理系统,对应联机编目及图书馆信息管理的业务 需求,参照实体关系模型建立数据表、视图、存储过程。对于联机编目的应 用数据,是机读书目格式数据( 姒r c ) ,在不同的管理系统中,d b m s 的设计 不尽相同,但m a r c 数据的格式是相同的,这也是为什么在本设计方案里要 保留对m a r c 标准的遵守的原因。 应用服务器,在w e b 服务结构中处于逻辑层,其功能对下是连接d b m s 的基础数据,并对数据按照外部业务需求进行组合、转换、存贮等操作,实 际上相当于一个数据缓冲或外部连接代理。比如,在实现联机编目的过程中, 此部分就要完成m a r c 数据格式的转换问题。 w e b 服务器,实现w e bs e r v i c e 的联机编目来说,是很重要的一环,在 做系统设计时,服务端主要做两个工作: 一是同比原来系统的实现联机编目的功能,比如提供用户对具体书目数 西南交通大学硕士研究生学位论文第1 0 页 据条目的检索和下载,用户登录权限和管理等,通过程序定义,最终以x m l 格式解析后做w e b 发布; 另一方面是将此数据服务站点的信息提交u d d i 中心注册,发布本站点 基本信息,以便于用户查找数据源与程序连接绑定。 2 2 3 实现使用者与提供者的联系 在传统的联机编目过程中,数据的提供者一般是由机关团体组织、行业 协会或专业公司承建的书目数据服务中心,数据中心的数据对外发布主要是 通过行业、协会统一要求,对外商业广告,会议宣传等方式。在实现基于w e b s e r v i c e 的联机编目系统中,如何建立服务端到用户端的联系呢,w e b s e r v i c e 系统提供了联系的中问者一“o d d i 中心”。 在系统中,u d d i 中心不仅是w e bs e r v i c e 的一部分,其本身也是一个 s e r v i c e 。 一方面为提供书目数据的服务站点提供注册登记,也即是数据的服务端 在u d d i 中心发布自己的数据服务信息; 另一方面为书目数据的使用者对提供书目数据提供者信息的查询。二 作为联系书目数据使用者和数据提供者的纽带,u d d i 注册中心的功能包 括: 。 l 、注册用户管理:主要是对于服务信息发布者的申请、审查、确定, 然后是该用户的类别划分和确定操作权限等: 2 、服务端描述信息管理:包括服务端的站点名称、特点描述、地址等 信息以u d d i 规范确定数据结构和建立相应的数据关系。 3 、以w e bs e r v i c e 方式对外发布姒r c 数据提供者信息。 当建立了u d d i 书目信息注册服务中心后,联机编目的使用者就可以通 过首先访问该w e b 站点,查找数据提供者信息,就如访问“百度”、“谷歌” 等搜索网站一样,找到自己想要连接的数据提供者站点,然后再与该站点建 立绑定关系的直接连接。 u d d i 中心的数据信息主要包括: 服务端信息:m a r c 资源库节点的描述信息,包括资源库节点的名称、描 述信息、联络信息以及数据的分类特点和服务识别信息。 服务描述:即对各联机编目中央库操作的w e bs e r v i c e 接口的描述信息, 包括服务名称、服务描述以及服务细节分类信息等。 服务绑定信息:链接服务和提供服务实现程序代码的信息,如实现服务 的接入点、w s d l 文档的地址等。 西南交通大学硕士研究生学位论文第11 页 2 3 业务流程 在分析业务流程的时候,先以c a l i s 联机编目的原系统为例,利用c a l i s 数据进行编目时,首先通过c a l i s 提供的z 3 9 5 0 客户端软件,检索所需的 c a l i s 编目数据,并下载到本馆的书目数据工作库,经过检索、修改、转换、 添加馆藏( 复本信息) ,使其成为本馆的书目数据。具体步骤如下: ( 1 ) 下载z 3 9 5 0 客户端软件; ( 2 ) 连接c a l i s 编目数据库; ( 3 ) 通过i s b n 号、题名、作者、i s s n 号、主题、和丛书题名等单条件 或组合条件检索; ( 4 ) 如果能命中记录,则下载; ( 5 ) 把提交记录导出,读入m a r c 格式文件; ( 6 ) 把该记录m a r c 文本导入到本馆书目中央数据工作库; ( 7 ) 从编目工作数据库中调出; ( 8 ) 严格修改、校对编目数据,添加馆藏信息字段; ( 9 ) 在编目工作库中进行单册个别典藏; ( 1 0 ) 检查登录号、条码号、典藏地、单价; ( 1 1 ) 将完整无误的编目数据转入本馆馆藏数据库; ( 1 2 ) 编目数据、图书进入本馆流通系统。 类比在c a l i s 系统的联机编目,应该说对于实现功能的系统客户端和服 务端,用户检索和最后的数据内容下载,在新的基于w e bs e r v i c e 的联机编 目系统也是一致的,但是,因为实现技术方法不一样,所以,在具体操作的 时候,过程是不同的,结合图2 2 对于w e bs e r v i c e 下的联机编目网络结构 描述,这里以联机步骤和编目流程分别来进行描述。 联机步骤: 编目用户登录m a r cu d d i 注册中心。 输入适合自己数据特点的实体信息或服务信息在u d d iw e b 站点上查 找数据提供者信息。 编目终端应用程序绑定所查得的数据提供者的u r l 。 运行终端程序,连接上远程数据。 如图2 5 所示: 西南交通大学硕士研究生学位论文第2 页 l 登录i j i ) d i f 羁一 l 查找数据源 l ,吵尸w 。 返回数据提供者信息 躐琵 编蒸菱焉提供者 9 联机数据操作i 绑定、连接服务 图2 5 联机步骤示意图 编目流程: 编目过程,是指书目数据编辑录入计算机的过程,但事实上在编目录入 工作中,每一个书目数据都将编辑至少几百个文字,并且用语和表达要科学 和准确,这对编目人员的素质要求确实比较高,劳动量也比较大,所以,编 目的通常步骤是套录数据,即查找本地馆藏数据或远程书目数据( 对于全国 而言,大型图书馆或专门y a r c 数据服务商,一般来说,都有可利用书目数, 据) ,然后修改个别字段后存贮本地系统,即完成编目,准确而省时省事。 实现套录编目的过程如图2 6 所示: 西南交通大学硕士研究生学位论文第1 3 页 编封i :作流甲,圈 图2 6 编目工作流程图 “m a r c 中央库”,它实际上是一个数据备编库,并不代表一个馆的实际 馆藏,作用是提供后备编目数据。 “馆藏库”,指的是本馆实际拥有资源的馆藏数据,每条记录都有对应 的实物。 以编录一条新书数据为例:比如新进一书,名为d o m 操作手册,则首 先查找本馆以前有否此书,如有,则调出馆藏库数据,则直接在其9 0 5 字段 加入馆藏号重新存入馆藏即可,如果没有,则查找m a r c 中央库,如果有数 据,则调用数据,添加馆藏号后存入馆藏库,如果没有,则连接远程数据资 西南交通大学硕士研究生学位论文第1 4 页 源,查询远程书目数据库,如果有,则下载后添加馆藏号,存入本地馆藏库, 如果这也没有,则可以另找远程数据源查找或自己新编辑数据,存入馆藏库, 由此即完成编目工作。 西南交通大学硕士研究生学位论文第1 5 页 第3 章数据标准和技术基础 3 1 编目数据标准 3 1 1 数据标准格式m a r c 的作用 1 、什么是l l a r c 姒r c 就是机读目录,即m a c h i n e r e a d a b l ec a t a l o g u e ,也称机器可读 目录,是计算机编目的产品。它是以代码形式和特定格式结构记录在计算机 存储载体上,能够被计算机识别并编辑输出书目信息的目录形式。随着时代 的发展,姒r c 格式对于各种纸质文献和网络资源都有着很好地表达,一条 m a r c 记录,表示着一个信息资源的完整目次内容,如:题名、著者名、摘要, 主题词、链接等多达2 0 0 个要素。 2 、为什么选择姒r c 作为编目数据标准 m a r c 格式包含书目信息完整,数据结构严谨,字段长度灵活可变,自 2 0 世纪6 0 年代以来,在图书情报界应用历史悠久,并成为成熟的元数据格 式,是传统编目的数据标准,随着互联网资源的渐多, l a r c 还顺应时代发展, 及时添加了7 5 3 ,8 5 6 等字段的描述,而且,1 9 8 6 年后中国机读目录格式 ( c n m a r c ) 成了国内图书情报界应用的统一规定,所以,m a r c 数据标准对于 图书馆编目来说是必然选择,对于本文而言,虽然在数据服务实现技术上采 用了w e bs e r v i c e 技术,但对于基础数据层的操作,仍将遵行m a r c 数据规 范进行,这样,将方便与全国原编目系统统一标准,实现机读目录数据共享。 3 1 2m a r c 的编码组成及结构 m a r c 提供了一种单一而简洁的记录结构,允许对信息进行不同复杂度的 灵活著录,每条书目记录由3 个主要部分组成:头标区( l e a d e r ) 、目次区 ( d i r e c t o r y ) 和可变长字段( v a r i a b l ef i e l d ) 。下面依据c n m a r c 对m a r c 的 格式作具体叙述,c n m a r c 格式是i s 0 2 7 0 9 及g b 2 9 0 1 的一个特定形式,它对 每一个用于交换的书目记录规定了必须遵循的标准记录结果。 m a r c 元数据文本示例如下: 0 0 9 4 7 n 硼o2 2 0 0 2 6 54 5 0 0 1 0 0 1 3 0 0 0 0 0 0 0 5 0 0 1 7 0 0 0 1 3 0 1 0 0 0 2 8 0 0 0 3 0 1 0 0 0 0 4 1 0 0 0 5 8 l o l o 0 0 8 0 0 0 9 9 1 0 2 0 0 1 5 0 0 1 0 7 1 0 5 0 0 1 8 0 0 1 2 2 1 0 6 0 0 0 6 0 0 1 4 0 2 0 0 0 1 4 9 0 0 1 4 6 2 1 0 0 0 3 1 0 0 2 9 5 2 1 5 0 0 1 6 0 0 3 2 6 3 0 0 0 0 3 3 0 0 3 4 2 3 3 0 0 1 1 3 0 0 3 7 5 6 0 6 0 0 3 1 0 0 4 8 8 6 9 0 0 0 1 5 0 0 5 1 9 6 9 0 0 0 1 9 0 0 5 3 4 7 1 1 0 0 6 3 0 0 5 5 3 8 0 1 0 0 2 9 0 0 6 1 6 9 0 5 0 0 2 0 0 0 6 4 5 9 0 5 0 0 1 6 0 0 6 6 50 1 2 0 0 4 7 6 9 2 2 12 0 0 4 1 2 0 8 1 4 4 1 4 8 o $ $ a 7 - 1 1 5 - 1 1 7 7 2 - 1 $ d c n y 4 0 0 0 5 $ a 2 0 0 4 1 2 0 8 d 2 0 0 4 e m 西南交通大学硕士研究生学位论文第1 6 页 y o c h i y 0 1 2 1e a _ o $ a c h i $ s a c nb 1 1 0 0 0 0 5s a y z 0 0 0 y y $ s a r $ 1 $ a 国际电子商务网站设计教程$ 6 u oj id i a nz is h a n gw uw a n gz h a ns h ej i j i a oc h e n g $ f 中国电子商务协会编著$ f z h o n gg u od i a nz is h a n gw ux i eh u i b i a nz h u _ $ a 北京$ c 人民邮电出版社$ d 2 0 0 4 5 $ a 3 3 6 页$ d 2 4 c m $ s a 国际电 子商务培训认证专用教材$ $ a 本书全面介绍电子商务网站、网页设计与制 作的基础知识,讲解编辑网页、图形图像处理、矢量动画制作等类软件的使 用。$ o $ a 电子商务$ x 网站$ x 建设$ j 教材$ $ a f 7 1 3 3 6 5 v 4 中国电子商务协会_$atp393 4 0 92 5 v 4 5 0 2 5 a $ a z h o n g6 u oo i a nz is h a n gw u x i eh u i _ 4 编著$ o $ a c n s b m a r c s t u d i o $ c 2 0 0 4 1 2 0 8 $ $ a z t z l $ d f 7 1 3 3 6 5 f $ $ d t p 3 9 3 4 0 9 2 姒r c 记录结构【撕1 如表3 1 所示: 表3 1 记录结构 l l记录头标地址目次数据字段记录分隔符 i 记录头标:由2 4 个字符构成。按i s 0 2 7 0 9 规定,每个记录头部要有一 个2 4 位字符的记录头标。它含有i s 0 2 7 0 9 定义的关于记录结构的数据和为 i s o2 7 0 9 的特定形式而定义的几项数据元素。这些数据元素有:记录类型、 目录级别、在层级中的位置、记录完整程度以及是完全采用或部分采用i s b d 规则。头标中的数据元素主要是为了满足记录处理的需要,只是间接标识书 目实体本身。 地址目次区:区内含有一个或多个目次款目,每一款目由三位数字的字 段标识符( 简称字段号) 以及字段长度和字段起始字符位置( 从第一个数据 字段算起) 等部分构成。格式规定,在记录头标之后为地址目次区。目次区 的每个款目包含三部分:三位数字表示的字段标识符,四位数字表示的数据 字段长度和五位数字表示的字段起始字符位置。除此之外,不允许有其它字 符。 地址目次区结构如下表3 2 所示: 表3 2 目次区结构 i i 字段标识符字段长度起始符位置 l( 3 位)( 4 位)( 5 位) 字段分隔符 i 地址且次区的第二部分给出了该字段的字符个数,即字段长度。字段长 度包括该字段全部字符的总和,包括指示符、子字段标识、行文或代码数据 以及字段结束( 分隔) 符。在字段长度之后,是字段起始字符位置,即该字段 西南交通大学硕士研究生学位论文第17 页 第一个字符处于数据字段区中的位置第一个数据字段的第一个字符的位置 为。它在整个记录中的位置,由头标第1 2 - 1 6 位的数字标明。字段号长度为 3 个字符,“字段长度”由4 位数字表示,。起始字符位置”则使用5 个数字 位,共1 2 个字符。记录中每个数据字段都对应一个1 2 位字符的目次款目, 全部款目构成目次区在地址目次区之后用字段分隔符i s 2 ( i o s6 4 6 的 1 1 4 ) 结束目次区中各款目是按字段标识符的第一个数字符号排序的。 数据字段区( 变长) ;由若干定长和变长字段构成,每个字段之间由字 段分隔符隔开。变长数据字段区位于地址目次区之后。它所含的数据有如下 两种形式;数据( 控制) 字段( 0 结构如表3 3 所示: 表3 3 定长字段结构 i l数据字段分隔符 i 变长字段( 0 1 0 至9 9 9 结构) 如表3 4 所示: 表3 4 变长字段结构 i 字段分隔符l i 指示符1指示符2 s a数据 i 除嵌套字段中含有字段标识符外,所有数据字段均不载入字段标识符。 字段标识符仅出现在地址目次区中。每个字段( 0 0 _ 字段除外) 均由两个指示 符以及随其后的任意数目的子字段组成。每个子字段的开头为一个子字段标 识符,即一位子字段分隔符( i s 0 6 4 6 的i s i ) 和一位标识该子字段的子字段 代码。子字段标识符之后是代码数据或任意长度的正文数据。字段中最后一 个子字段的结尾为字段分隔符,也称字段结束符( i s 0 6 4 6 的i s 2 ) 。 记录分隔符:在m a r c 中由“”代替i s 0 6 4 6 中的分隔符i s 2 ,以表示书 目记录中的记录分隔符。在完整的书目记录实例中置于记录末尾。 3 1 3m a r c 的特点 m a r c 数据的特点可以从四个方面描述: l 、在信息描述

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论