




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
开放链接技术研究 摘要 本文依托数字图书馆的建设背景,针对数字资源建设中的内容l :目关性 特点,重点研究了当前数字图书馆界的热点问题之一丌放链接技术。 本文首先从o p e n u r l 标准出发,研究分析了开放链接的基本概念及其工作流 程,通过与传统的常规链接的深入比较,提出了以图书馆为中心的构架模型, 并对开放系统互连以及易用性等问题给出了相应的解决方案。在本文最后, 还结合实际工作提出了一个开放链接技术平台的实现框架,具有较好的参考 价值。 关键词: 数字图书馆、数字资源、- ( o p e n u r l ) 、 来源资源、目标资源 茎墼堡鳖垫查塑茎 a b s t r a c t b a s e do nt h ed e v e l o p m e n to fd i g i t a ll i b r a r y ( d l ) ,i ti si m p o r t a n tt op a ym o r e a t t e n t i o nt ot h er e l e t i v i t yb e t w e e nv a r i o u sd i g i t a l r e s o u r c e s i nt h i s p a p e r ,i m t i y i n gt od os o m e 化s e a r c h o nt h eh o tn e ws t a n d a r da b o u to p e n u r l ,i n c l u d i n gt h e c o n c e p ta n db a s e w o r k f l o wo fo p e n u r l ,t h ea p p l i c a t i o nm o d e li nd l ,t h e c o o p r a t i o n w i t ho t h e ro p e ns y s t e ms u c ha sd o i ( d i g i t a lo b j e c ti d e n t i f i e r ) h a n d l es y s y t e m ,e t c f u r t h e rm o r e ,ar e f e r e n c a b l ef r a m eo f h o wt oi m p l e m e n tt h e o p e n u r l s c h e m ai sa l s og i v e n t h e k e y w o r d s :d i g i t a ll i b r a r y , d i g i t a lr e s o u r c e ,o p e n u r l ,r e s o u r c e ,t a r g e t 一2 开放链接技术研究 引言 进入上世纪9 0 年代,数字图书馆就在世界各国轰轰烈烈地开展起来, 以美国为首,目前发达国家已经从研究试验阶段转入实用工程建设阶段:我 国从1 9 9 7 年7 月国家计委批准建立“中国试验型数字图书馆”项目开始,也 已近6 年,公立、高教、科研、党校、军队五大系统也陆续启动了相应的研 发项目。 作为中国科学院知识创新工程的重要部分,2 0 0 1 年国家科学数字图书 馆( c h i n e s es c i e n c ed i g i t a ll i b r a r y , 简称c s d l ) 项目正式启动。本人有幸参 加其中两个子项目的研究与建设,其中之一即“开放链接技术平台的研究与 建设”。在工作实践中,感到开放链接的思想和o p e n u r l 标准,为有效解决 数字图书馆建设中遇到的“内容相关的数字资源系统之间的链接整合问题” 提供了捷径。 本文依托数字图书馆的建设背景,针对数字资源建设中的内容相关性 问题,重点研究了当前数字图书馆界的热点研究方向开放链接技术。本 文首先从分析o p e n u r l 标准( 草案) 出发,总结分析了开放链接的基本概念 及其工作流程,通过与传统的常规链接的全面分析和比较,提出了以图书馆 为中心的构架模型,并对开放系统互连以及易用性等问题提出了相应的解决 方案。在本文最后,给出了一个开放链接技术平台的实现框架,具有一定的 实战参考价值。 开放链接技术平台在数字图书馆的应用。预计将受到业界的普遍欢迎。 实际上,在文博等其他行业也同样存在着广泛的需求,但实际的推广延伸, 还有待进一步完善标准制订等基础性的研究工作。 开放链接技术研究 1 数字图书馆需要开放链接 数字图书馆的发展正在经历着三个发展阶段:从基于数字资源 ( r e s o u r c e b a s e dd i g i t a ll i b r a r y ) ,到基于集成服务( s e r v i c e b a s e dd i g i t a l l i b r a r y ) ,以至于基于用户活动( w o r k - b a s e dd i g i t a ll i b r a r y ) 。这表明数字 图书馆基于资源且不再仅仅基于资源,其目标更着力于支持用户利用信息提 炼知识。 因此,无论何种模式的数字图书馆,都需要解决内容相关的数字资源系 统之间的链接整合问题。很久以来,业界一直致力于研究一种理想的方式, 并为此付出了很多努力,而开放链接技术的出现,恰好给出了一个轻巧的解 决方案,因此一经提出就得到广泛支持,这说明数字图书馆需要开放链接。 1 1 数字图书馆及其发展 1 1 1 数字图书馆的由来 数字革命和因特网的发展,使社会信息化进程不断加速,以因特网为 主干的国际计算机信息互联网迅速延伸到全世界每一个角落,正在形成全球 性的、高效率的信息资源传输和共享体系,彻底改变了人类知识信息生产、 分配和利用的格局,深刻影响着社会生活的各个方面。 巨量信息涌入因特网的同时,却使得信息的有效检索和利用变得困难, 这主要是由于因特网上的信息资源很大程度上处于无政府状态,影响了信息 利用的效率。于是,数字图书馆的研究和应用应运而生,并且如火如荼地在 全世界开展起来。目前,数字图书馆( d i g i t a ll i b r a r y ) 已成为己成为评价一 个国家信息基础设施的重要标志。 1 1 2 数字图书馆的现状 鉴于数字图书馆的重要性,当前世界发达国家无不以国家政策主导数字 图书馆建设,以公共资金启动数字图书馆建设。1 9 9 4 年9 月,美国国家科学 6 开放链接技术研究 基金会正式公布了一项为期4 年、投入2 4 4 0 万美元的”数字图书馆启动计划“。 1 9 9 5 年3 月,法国也开始在新建的法国国家图书馆将该馆收藏的1 0 0 万册图 书数字化。1 9 9 6 年8 月,德国联邦内阁会议正式通过德国1 9 9 6 2 0 0 0 年信 息技术发展计划,中心内容是建立全球电子图书馆和开展电子出版业服务。 此外,1 9 9 5 年5 月2 9 日,法日英加德意7 国的国家图书馆在法国成立了g 7 全球数字图书馆集团,以后又扩展为g 8 集团,该项目的目标是从现存的数 字化项目中组织一个大型的人类知识的虚拟馆藏,通过网络为广大公众服务。 可以说,发达国家数字图书馆的建设,已经展示出人类文化史上的又一次空 前的“媒介转移”。 数字图书馆作为国民经济和社会信息化的重要领域,已经引起了许多发 达国家的高度重视。美国、英国、法国、加拿大、日本等国竞相实施本国的 数字图书馆研发计划,呈现出激烈竞争态势。 应对上述挑战,我国政府近年来也将数字图书馆纳入国家发展战略。自 1 9 9 5 年,中国开始跟踪数字图书馆以来,已经经历了预研、实验、小规模建 设的阶段。现在数字图书馆建设到了规模化建设的初期,我国将建设多个数 字图书馆中心,和大量的资源集藏地的数字图书馆,将教育、科研、知识的 传播作为数字图书馆优先覆盖的领域。 中国科学院国家科学数字图书馆( c s d l ) 瞄准国际图书馆的网络化、数 字化的发展趋势,按照中国科学院知识创新工程和国家创新体系建设的需求, 于2 0 0 1 年正式启动总体工程建设。c s d l 的建设目标是在2 0 0 5 年前后,基本 建成面向社会的国家科学数字图书馆,依托c s t n e t 网络,构筑科学研究和国 家创新体系建设的科研文献信息支撑系统,形成具有支撑科技创新、服务经 济建设和持续发展能力的网络化、数字化文献信息平台,与国内外主要大型 图书馆和信息机构互连,发展成为向国内外开放的国家主要信息基础设施之 一 1 1 3 数字图书馆的概念 究竟什么是数字图书馆呢? 目前为止,众说纷纭,业界仍然没有一个准 确的定义。 7 - 开放链接技术研究 从覆盖范围来看,有广义数字图书馆和狭义数字图书馆之说。广义上, 可以把数字图书馆描述为:“没有时空限制的超大规模知识中心”【1 4 】;狭义上, 通常将数字图书馆做某种限定,依据可能是地域、领域、特定机构等等。而 广义数字图书馆的形成和发展,又依赖于狭义数字图书馆为基础。 数字图书馆的根本目标是通过一系列服务机制有效支持用户利用信息来 学习和创造知识【i 】。当信息资源、信息服务和用户( 信息活动) 都聚合在同 一数字空间时,就有可能从新的技术基础出发,从用户信息利用全过程及其 复杂信息活动的角度来重新审视信息服务系统的功能与结构,构建全面和直 接支持用户信息活动的信息服务机制。 因此,数字图书馆将不再仅仅是一个基于资源的服务系统,而是一种以 用户为中心来聚合资源、服务、信息利用活动的动态机制。数字图书馆的目 标和功能都着力于支持用户利用信息、提炼知识和解决问题,通过资源与工 具的链接、集成和嵌入来动态构建符合用户需要的服务机制。这就要求这些 数字资源和服务机制实现标准化、开放性和互操作,支持数字资源系统的开 放性定义、描述、解析、链接、构建、嵌入和集成,支持对信息内容、功能 模块和使用机制的可伸缩和分布式管理控制。 1 2 数字资源的建设 数字资源的建设和利用是数字图书馆的基础。 有学者将现阶段有代表性的数字图书馆模式归纳为三种【4 】: 1 ) 特种馆藏型模式 以自有的特色馆藏或珍藏为揭示重点,将古籍、善本、特色收藏等各种 资源,区别不同载体形式( 纸质、图片、声音、音乐、影视) ,经数字化形成 特色数字资源库供网络共享。实例之一是美国国会图书馆的“美利坚记忆”。 2 ) 服务主导型模式 此种模式的数字图书馆,数字资源一般来自三个方面: 第一。图书馆本身的数字化特种馆藏; 第二,商用的网上联机电子出版物或数据库,包括本地资源镜象库。 第三,网上开放的有利用价值的数字资源。 8 开放链接技术研究 他们经过接合后,统一向读者提供服务。实例之一是美国加利福尼亚州 的数字图书馆( c d l ) 。 3 ) 文献型模式 一些文献服务公司、出版社、代理商等建立一种供商用文献型的数字图 书馆,提供全文的期刊、杂志、电子图书等。实例之一是提供1 2 0 0 多种全文 杂志的衙兰e l s e v i e r 。 尽管模式不同,所展示的数字资源内容以及运作、服务机制各异,但它 们的基础都离不开资源的数字化建设和网络化利用。 1 3 数字资源的内容相关性 我们注意到不同的数字资源系统之间存在着基于知识和内容的复杂关联 关系。 大多数较有参考价值和权威性的数字资源一般以数据库的形式存在,比 如i s i 的w e bo f s c i e n c e ,e i 的工程索引,e b s c o 的c c 以及著名的p u b m e d 、 s c i e n c e 等等。 一般地,这些数字资源库可以按照不同的标准进行划分: 1 )按照数字资源存在的区域划分为: i 内部网数字资源库 i i 因特网数字资源库 2 )按照数字资源本身的内容划分为: i 文摘数据库 i i 全文数据库 试引文数据库 i v 联合目录数据库 v 0 p a c 等 3 )按照数字资源的建设者划分为: i ,机构自建的特色资源库 i i 商用数字资源库等 一9 一 开放链接技术研究 这些数字资源数据库由于建设者不同,导致平台异构,使用方法、覆盖 范围也不尽相同,但它们之间却存在着天然的联系。 以期刊为例,可能某种期刊同时被不同的数字资源库收录。这些数字资 源库或迅速展示目录( c u r r e n tc o n t e n t s ) ,或记录文摘信息,或制作权威学术 标引,或提供全文服务等等,以不同形式描述同一文献。不仅如此,文 献之间还可能存在着引用和被引用的关系,还可能存在着不同程度的相关关 系( 有主题相关或共引相关等不同的相关标准) 。 总之,数字资源系统的数字对象之间存在着千丝万缕的基于内容和知识 的相互关联。这种数字资源之间的内容关联,反映在基于w e b 的应用上,就 是各种形式的链接关系,所谓参考链接、引文链接、相关连接、服务链接、 逻辑链接等等。 1 4 问题的提出 那么,数字图书馆的建设者们如何能够解决内容相关的数字资源系统之 间的链接整合问题,保证用户在异构且相关的数字资源中自由有序地穿行, 到最适合的位置获取他有权获取的数字资源( 被称作是“a p p r o p r i a t ec o p y p r o b l e m ”) ,而不至于迷失方向,或者为低效率的重复工作而懊恼呢? 这就是开放链接技术期望解决的问题。 通过开放链接技术,就可以将数字资源的内容进行无缝链接,并对所 链接对象进行本地化控制,支持用户对多种信息内容的集成利用。 正如美国国家信息标准组织标准委员会( n i s o ) 所说:“a to p e n l y i n f o r m a t i c s ,w er e c o g n i z et h a ti n t e g r a t i n gn e w l i n k i n gs e r v i c e si sac o m p l e x a n dd i f f i c u l tt a s kf o rl i b r a r i a n s u s e r sn e e dc o n s i s t e n ti n t e r f a c e sa n ds h o u l d b es h i e l d e df r o mt h ec o m p l e x i t i e so fa u t h e n t i c a t i o na n dc o n t r 0 1 d i s p a r a t e s y s t e m sn e e dp a t c h i n gt o g e t h e r a n di nt h ee n d t h i n g sh a v e t ow o r k t h a t s w h y w e 。r eh e r et oh e l p ” 1 0 开放链接技术研究 2 开放链接技术 2 1 开放链接研发现状 开放链接( o p e n u r l ) 是美国国家信息标准组织( n i s o ) 2 0 0 1 年提 出草案建议的一个正在讨论确定的标准。它得到了世界范围的广泛响应和支 持( 如w e bo fs c i e n c e 、p r o q u e s t 等) ,国外的一些科研机构和公司( 如: i s i w e bo fs c i e n c e 0 c l c f i r s ts e a m h ) 对o p e n u r l 技术已进行了深入的 研究和开发,使开放链接技术正在成为一项趋于成熟的技术,数家公司也已 经推出了相应的开放链接解析服务器产品。 国内数字图书馆界对开放链接技术的研究应用还处于认识起步阶段,目 前大多数研究资源链接的相关课题,还是较多地关注于具体的数字资源系统 之间的链接,而对开放链接标准和技术缺乏足够的了解和认识,仅c s d l ( 国 家科学数字图书馆) 和c a l i s ( 中国高等教育保障系统) 等少数团体正在研 究并逐步建设或规划建设。因此,国内在开放链接相关产品方面还是一个空 白。 2 2 开放链接基本概念 n i s o 对开放链接( o p e n u r l ) 的描述b o 是:“t h ep r o p o s e do p e n u r l s t a n d a r di sas y n t a xt oc r e a t ew e b t r a n s d o r t a b l ep a c k a g e so fm e t a d a t a a n d o ri d e n t i f i e r sa b o u ta ni n f o r m a t i o no b j e c t s u c hp a c k a g ea r ea tt h e c o r eo fc o n t x t - s e n s i t i v eo r o p e n l i n k t e c h n o l o g y b ys t a n d i n g t h i s s y n t a x ,t h eo p e n u r lw i l l e n a b l e m a n y o t h e ri n n o v a t i v e u s e f s p e c i f i c s e r v i c e s ”。 可见,开放链接标准本身关注的是o p e n u r l 语法。它在普通的u r l 上面 附加了信息,即一个信息对象( i n f o r m a t i o no b j e c t ) 的元数据( m a t a d a t a ) 或( 和) 标识符。o p o n u r l 对信息的结构和语法做了详细规范( 参见附录一: o p e n u r l 语法) 。 开放链接技术以o p e n u r l 为核心,使得各种数字资源系统之间可以实现 开放链接技术研究 开放式的、基于上下文的相互链接。这样,各个数字资源系统不再是彼此孤 立和自我封闭的,而是形成了一个有机的整体。 开放链接与传统的常规u r l 链接的一个重要不同在于,传统的常规链接 提供的是精确地指向某一种数字资源系统( 可能是其中的一个确定的数字对 象) 的链接,是“一步到位”式的。而开放链接则不然,它不规定用户“你 到哪儿去”,而是告诉用户“你是从这儿出发的,现在你可以有多种选择去哪 儿。”,这就是所谓的“u s e r s p e c i f i cs e r v i c e s ” 1 2 开放链接技术研究 2 3 o p e n u r l 语法 不o o p e n u r l 的具体语法可参见附录一( o p e n u r l 语法,其结构如下图所 图2 1 :o p e n u r l 语法结构图 o p e n u r l 语法的主体包括两部分:基础u r l ( b a s e - u r l ) 和查询( q u e r y ) 。 基础u r l ( b a s e u r l ) 是一个u r l 地址,指向o p e n u r l 解析服务器。 开放链接技术研究 o p e n u r l 解析服务器负责o p e n u r l 的解析和重定向( 后续章节会重点讨论) 。 查询( q u e r y ) 部分描述了查询的发起者以及数字对象本身,由来源描 述区( o r i g i n d e s c r i p t i o n ) 和对象描述区( o b j e c td e s c r i p t i o n ) 两部分组 成。来源描述区用s i d 值对标识出查询发起数据库及其供应商;对象描述区 通过元数据或唯一标识符( 包括全局唯一标识符或本地唯一标识符) 指明了数 字对象( 有的文献中也称作“信息对象( i n f o r m a t i o no b j e c t ) ”或“元数据 对象( m e t a d a t ao b j e c t ) ”) 。 示试一:h t t p :| 删c s d l a c c n r e s o l v e r o p e n m e n u ? g e n r e = a r t i c l e & i s s n21 2 3 4 5 6 7 8 & v o l u m e 21 2 & i s s u e 23 s p a g e2l & e p a g e = 8 & d a t e = 1 9 9 8 & a u l a s t = s m i t h a u f i r s t = p a u l 这是一个使用元数据表示的o p e n u r l 示例。表明该数字对象是一篇文章,其母体文献的i s s n 号为1 2 3 4 5 6 7 8 ,刊 登在第1 2 卷第3 期的第1 页到第8 页,作者是p a u l s m i t h ,1 9 9 8 年发表。 示例二:h t t p :w w w c s d l a t c n r e s o l v e t ,o p e n m e n u ? s i d = c s d l :& g e n r e2b o o k & t i t l e2i n f o r m a t i o nl a d s c a p ef o ral e a r n i n gs o c i e t y :n e t w o r k a n dt h ef u t u r eo ft l l el i b r a r i e s & i s b n = 1 8 5 6 0 4 31 0 x & d a t e = 1 9 9 8 0 5 a u l a s t = c r i d d l e & a u f i r s t = s a l l y 这个示例的数字对象是一本书,其is b n 号为 1 8 5 6 0 4 3 1 0 x ,作者是s a l l y c r i d d l e ,1 9 9 8 年5 月发表。 事实上,虽然描述对象元数据的方法有三种,其中最重要的是元数据表 示方式,因为最直接。标识符的方法是经过n i s o 扩展加上去的,即使使用 标识符,也必须转化为元数据,才能提供扩展服务。 2 4 开放链接工作流程 开放链接的工作流程始于来源资源,终于目标资源。 所谓“来源资源( r e s o u r c e ) ”和“目标资源( t a r g e t ) ”是开放链接中 的两个重要概念。 如果用a ,b ,c 表示数字资源系统,用自a 到b 的有向线段表示从系 统a 到系统b 的链接,那么若干数字资源系统之间的链接关系可以表示为一 个有向图,如下图所示。 1 4 开放链接技术研究 图2 2 :数字资源系统关系图 其中,任意一条有向线段的末端是来源资源( r e s o u r c e ) ,前端则是目标 资源( t a r g e t ) 。当然,来源资源也可以是目标资源( 如d ) 。 我们将开放链接工作流程的讨论限定在一个来源资源和一个目标资源之 间,使问题得到了简化,下图展示了从一个来源资源到一个目标资源的完整 链接过程。 图2 3 :o p e n u r l 工作流程图 其步骤如下: 1 ) 来源资源提供商为不同的实体插入o p e n u r l “h o o k ”,等待终 端用户( r e q u e s t e r ,请求者) 点击。 2 ) 请求者点击o p e n u r l 链接( h o o k ) ,发送o p e n u r l 请求访问解析 一1 s 开放链接技术研究 3 ) 4 ) 5 ) 6 ) 服务器。 o p e n u r l 请求传输数字对象的元数据或相关信息给解析服务器。 解析服务器根据一系列业务规则( 由解析服务器管理者制订和 维护) ,返回对这个o p e n u r l 的回答。 解析服务器返回一组服务给请求者。 请求者通过一个或多个服务访问目标资源。 可见,丌放链接动态特性的关键在于,将来源资源中的链接用标准开放 的方式描述符合o p e n u r l 。语法规则,因而引入了开放链接解析服务器, 通过解析标准的o p e n u r l 请求,以扩展服务的形式,间接定位到目标资源的 适当拷贝。 1 6 开放链接技术研究 3 开放链接的应用模式 目前的o p e n u r l 标准,脱胎于学术性的文献情报领域,典型的应用是 数字图书馆。通过与传统链接的全面分析比较,我们建议开放链接技术平台 应以图书馆( 或类似机构) 为中心,先从可控的自有资源入手,再考虑扩展 性及其实施( 如与唯一标识符解析系统的互连等) 。 以图书馆为中心的应用模式,简单、可操作性强,易于实旅。 3 1 开放链接与常规链接的比较 开放链接与常规链接相比有哪些不同? 对这个问题的全面理解,有助于 正确指导我们的应用。 假设r 是一种来源资源,t 是一种目标资源。典型的情况是r 是种文 摘索引类数据库( a b s t r a c ta n di n d e x i n g ,简称a i ) ,t 是一种全文类 ( f u l l t e x t ) 数据库。目前我们遇到的一般情况是,用户无法从r 中检索到 的数字对象d o ,直接链接到t 中对应的数字对象d o r 除非r 的提供商( 或代 理商) 在d o 。处显式地加入一个指向d o ,的u r l 链接。如下图所示。 图3 1 :常规链接示意图 1 7 开放链接技术研究 常规链接的基本特征是把链接直接写成固定的u r l ,用户点击的结果是 直接指向目标。如上图中所示的丛! q ! z ! j 2 1 :! i 2 :q 韭i ! 业堕! ! 碰 业! ! ! 丛= 匹坠鱼塑! 螋! :! ! ! 鱼i ! ! ! ! 二! ! 鱼! q 望3 2 。 用户使用这种常规 链接虽然很方便快捷,但是r 的提供者为了维护这种链接,通常要付出很大 的代价,他们必须跟踪每一个数字对象对应的目标资源中的数字对象的变化, 否则就会产生死链( d e a d1 i n k ) ,而且不易觉察。况且,目标资源的数目是很 多的并且越来越多,维护工作量可想而知。 o p e n u r l 的思想是把一对一的映射关系切断,通过o p e n u r l 解析服务器 这个“h u b ”,变成了一对多的非固定的映射关系。如下图所示。 图3 2 :开放链接示意图 图中注释处标注的是前面提到过的o p e n u r l 示例二。可见,开放链接并 不是直接指向目标资源的链接,而是经过中间的“h u b ”开放链接解析服 务器。由解析服务器根据图书馆制定的业务规则,提供用户多种候选的可能, 并且以一种服务的方式提供,即所谓的“开放链接解析服务器扩展服务菜单”。 用户根据不同的需要,将链接重定向到相应的指向目标资源的链接,而这个 1 8 开放链接技术研究 目标链接是由开放链接解析服务器的管理者( 通常是图书馆的系统管理员) 统一按照某种规则负责支持和维护的,终端用户不必关心。 所以,图书馆的机构用户和终端用户都是开放链接的直接受益者。 机构用户可以将业务规则纳入开放链接解析服务器,自己决定数字资源的 整合范围和方式。 对于终端用户的好处,是他们不必关心如何学习太多形态各异的复杂而专 业的操作,只要从某一个数字资源的入口进来,根据内容本身的关联,就可 以自在地在各种相关联的数字资源中邀游,不必苦于“入库无门”或有苦于 穿梭于太多的门。不仅如此,可以使用开放链接的用户拥有更大的选择范围 和自主性。 综上所述,我们可以总结得出开放链接和常规链接的全面比较结果, 如下表所示。 比较项目开放链接常规链接 1 链接性质动态,非固定静态,固定 2 上下文相关性上下文相关上下文无关 3 链接过程有中转直接,快速 4 链接提供者 开放链接解析服务器管理者来源资源提供商代理商 5 链接维护特性易维护难以维护 6 适当版本问题可以解决不可以解决 7 可扩展性良好不好 8 标准性标准规范非标准 3 本地可控性 可控制 不可控制 表3 1 :开放链接与常规链接的比较 如果说常规链接是一种“平面的链接”,那么开放链接则是“立体的” 这种关系可以用下图表示。 1 9 开放链接技术研究 数字资源平面 图3 3 :开放链接与常规链接的比较 3 2 图书馆为中心的架构 从以上的分析比较中,我们认识到,开放链接解析服务器的管理者选 择图书馆( 或类似情报机构) 是很好的。之所以这样做,不仅是图书馆对开 放链接的强烈需求使然,而且因为图书馆拥有先天的条件。 当前图书馆面临的普遍情况是; _图书馆随着文献资源数字化建设的投入加大,可为用户提供的数字 文献资源的种类和数量快速增长。 _ 图书馆拥有的数字资源虽然来自不同的提供者( 购买、自建或第三 方) ,平台各异,但在内容上却存在着复杂的交叉关系网。 一一般数据库提供商提供的数字资源不具有开放性,彼此孤立。 _ 用户强烈希望整合各种相关数字资源,统一服务。 一 图书馆是数字资源提供商和终端用户联系的桥梁。 图书馆可以随时得到服务情况的改善报告、用户问题报告的第一手 资料。 - 开放链接要求的投入条件少,应用效果好,对于专业学术领域尤其 一2 0 一 开放链接技术研究 如此。 总之,图书馆面临的实际情况非常需要用开放链按技术解决过去难以解 决的问题;而且,开放链接解析服务器本身具有独立性,它不依赖于其它外 界的限定条件( 不像d o i 系统) ,非常适合架设于图书馆。同时,架设在图 书馆,并没有以牺牲开放性、可扩展性为代价,相反却做好了随时扩展的准 备。下图反映了以图书馆为中心的架构模型。 图3 4 ;以图书馆为中心的架构模型 3 3与d o i 系统的互操作 在开放链接思想提出之前,已经有数字对象唯一标识符解析系统( d i g i t a l o b j e c ti d e n t i f i e rh a n d l es y s t e m ) 等其它系统的存在。 从整体上看,开放资源平台之间的整合、互操作有着非常重要的意义和 价值。这不仅可以弥补数字对象唯一标识符解析系统的不足,同时使得 o p e n u r l 系统的前景更加广阔,是开放性、可伸缩性和可扩展性的集中体现。 o p e n u r l 语法中,已经明确将d o i 标识符纳入四种支持的全局标识符之一。 2 1 开放链接技术研究 3 3 1 数字对象唯一标识符及其解析系统 数字对象唯一标识符即d o i ( d i g i t a lo b j e c ti d e n t i f i e r ) ,是分配给数字 对象的唯一标识符,通常只能被数字对象的出版商注册,其目的在于唯一标 识一个数字对象,人们不需要知道该数字对象的具体位置就可以访问到该对 象。如,不必使用文献元数据,只使用d o i 就可以在网络上唯定位一篇文 献。但目前拥有d o l 的电子文献所占比例并不大。 d o i 有前缀和后缀两部分,中间用斜线“,”隔开。d o i 标识符中的前缀 或后缀在长度上没有限制,从理论上讲,可以用无穷的号码或数字来表示。 所有d o i 标识都是以“1 0 ”开始的。1 0 1 0 0 0 1 2 3 4 5 6 就是一个合法的d o i 标识符。 图3 5 :d o i 的结构 d o i 语法是一个n i s o 标准,它不能替代传统的书目著录,但它们尤其 对于那些以卷、册、页的形式在线发布的文献,提供了很有意义的附加值。 在c r o s s r e f 应用中,一个带有d o i 的科学文献是这样发布的: k o r n a c k ,d r a k i c p ( 2 0 0 1 ) c e l lp r o l i f e r a t i o nw i t h o u tn e u r o g e n e s i s i na d u l tp r i m a t en e o c o r l e x s c i e n c e 2 9 4 ( 5 5 4 9 ) 2 1 2 7 2 1 3 0 ,d o i :1 0 1 1 2 6 , s c i e n c e 10 6 5 4 6 7 d o i 是由数字对象唯一标识符解析系统负责解析的。基于d o i 的链接请 求被发送到d o i 代理服务器后,由d o i 代理服务器送给d o i 解析服务器进行 解析,如下图所示。 2 2 开放链接技术研究 图3 6 :d o i 的解析过程图 例如:一个d o i 请求h t t p :d x d o i o r g l o 1 0 7 4 j b c m 0 0 4 5 4 5 2 0 0 发送 到d o i 代理服务器,d o i 代理服务器( 在c r o s s r e f d o in a m e s p a c e 中代 理服务器含有所有链接目标) 接收这个请求,并将这个d o l :1 0 1 0 7 4 ,j b c m 0 0 4 5 4 5 2 0 0 传递到d o i 解析服务器,解析服务器将d o i 解释成一个u r l 地址h t t p :w w w j b c o r g c g i c o n t e n t a b s t r a c t 2 7 5 4 4 3 4 8 2 6 返回给用户。这 要求出版商事先在d o i 解析服务器中注册,否则无法使d o i 与出版商的u r l 之间建立这种协作关系。一般地,出版商注册的u r l 地址,是一个索引页( a s p l a s hp a g e ) ,通过这索引页再链接到出版商本地资源库的d o i 标识符对象 的一份全文文献内容。 3 3 2 0 p e n u r l 与d o i 系统的互操作 我们从d o i 解析系统的操作模式可以看出除了先链接到索引页再通过 索引页链接到全文的链接外,它并没有提供其它类型的服务,单纯的d o i 解析 是较封闭的而且无法上下文相关。那么,通过增强代理服务器的功能,使得 2 3 开放链接技术研究 d o i 与o p e n u r l 可以互操作,则比较理想。下图表示了互操作的过程。 图3 7 :d o i 系统与0 p e n l j r l 系统的互操作示意图 比如,一个来自合法用户的d o i 请求1 0 1 0 7 4 j b c m 0 0 4 5 4 5 2 0 0 传递到 d o i 代理服务器,d o i 代理服务器接受这个请求并加以处理,向o p e n u r l 解析服务器发送一个o p e n u r l 请求h t t p :,v 眦c s d l a c c n ,r e s o l v e r , o p e n m e n u ? i d = d o i :1 0 1 0 7 4 ,j b c m 0 0 4 5 4 5 2 0 0 ,( 这个o p e n u r l 中以d 0 l 1 0 1 0 7 4 ,i b c m 0 0 4 5 4 5 2 0 0 作为参数) ,o p e n u r l 解析服务器通过d o i 对 c r o s s r e f 数据库进行元数据的查询,给用户返回一个适当的扩展服务。 这样就将d o i 解析系统和o p e n u r l 解析系统有机地结合在了一起。 2 4 开放链接技术研究 4 开放链接技术平台的一个实现框架 本章对如何在数字图书馆的应用中以o p e n u r l 标准为核心,建设开 放链接技术平台,提出了一个参考框架。 前面提到,o p e n u r l 标准关注的是语法本身,在具体应用中进行总体 框架设计时,还需要对行业特点、资源特点、图书馆的现实条件、最终用户 需求等各方面的情况进行综合分析和权衡。开放链接解析服务器虽然是该平 台的核心,但整个开放链接技术平台的顺利运行,需要相关各方的有机协调 和支持。除软件平台本身的设计建设者以外,来源资源、目标资源提供商、 图书馆管理者等均有不同程度的参与。同时,最终的应用效果与终端用户使 用界面( u i ) 关系很大,需要充分关注易用性问题。 4 1 总体架构 开放链接技术平台总体架构从实现区域上大致可划分为四个部分:图书 馆端的引导( 1 ) 、来源资源端支持( 2 ) 、开放链按解析服务器( 3 ) 和目标资 源端支持( 4 ) 。四者之间的关系可以图示如下。 图4 1 : 开放链接技术平台总体框架示意图 2 5 开放链接技术研究 图书馆端的引导模块,用来引导用户进入各种来源资源系统。来源资源 系统中应有效嵌入o p e n u r l ”h o o k ”,以便产生合法的o p e n u r l 链接。开 放链接解析服务器负责解析o p e n u r l ,并根据预定义的图书馆业务规则,提 供指向目标资源系统的扩展服务。目标资源系统负责链接响应,返回对应的 所请求的数字对象页面。 下图以实际常用的若干种数据库为例,说明了各数字资源系统是如何协 调在开放链接的框架之下的。图中存在来源资源系统同时也是目标资源系统 的情况。 p 9 d d :8i 竺竺j p e 岫。 来源资源 来源资源 来源资源 o p e n u r q 开放链接解析 i服务器 f : 二二习 如u r l i s 竺c i e n 竺c e j i 目标资源 , | 二! 一p ff s c i e n c e ( s c i ) f j 、, l i n k - t ou r 目标资源 叫e l s e v i e r 酗j 电 j子期刊库 、,一 u r l 目标资源 图4 2 :o p e n u r l 技术平台框架下的资源互连 4 2 图书馆端引导 图书馆作为组织机构,负责引导合法的终端用户进入支持开放链接的各 来源资源系统。 集成来源资源的机构,在确定了开放链接解析服务器b a s e u r l 之后,就 可以在其检索菜单界面嵌入对数字资源端c o o k i e p u s h e r 程序的调用。具体 做法可以结合图书馆的信息资源入口方式灵活掌握,或改造图书馆发布系统 2 6 开放链接技术研究 的相应菜单项,或增加特殊的h t m l 页面。 假如图书馆的开放链接解析服务器位于h t t p :i i 、 ,、州c s d l a c c a , r e s o l v e r ,o p e n m e n u ,原指向来源资源的u r l 是b 娅:丛坳型:i d 垃:盟 四二b l ! 鱼丛:g l ,该来源资源的c o o k i e p u s h e r 位置是:b 垫巳;丛幽6 喇:i d 垃: g 鱼堕g i = b j d 巳g b q q k i 鱼:垒g l ,男b 么,i 虱书匍;可将b 丛q ;丛塑d 些:l n 鱼:壁q 幽 c , q i - b i n s t a r t c q i 改为h a p :i iw w w i n f o c o m ,c g i b i n ,p u s h c o o k i e c g i7 b a s e u r l = h t t p :i i w w w c s d l a c c a ,r e s o l v e r ,o p e n m e n u r e d i r e c t = h t t p :w w w i n f o c o m ,c g i b i n ,s t a r t c g i 即可。 4 3 来源资源端支持 不支持开放链接的来源资源端,可以与数字资源提供商协商,通过改造, 使其发布的数字资源中可以嵌入有效的o p e n u r lh o o k ,并提供相应的功能扩 展。这部分工作包括c o o k i e p u s h e r ( c o o k i e 生成推送) 、o p e n u r l 生成和 0 p e n u r lh o o k 的植入。 cookie删(cookiepusher) c o o k i e p u s h e r 程序位于来源资源端,它的主要功能是:从引导模块获取必 要参数,如: 1 ) 开放链接解析服务器的b a s e u r l 。( 其图标的位置和名称可以采用 约定的方式) ; 2 ) 指示来源资源入1 3 ( t a r g e t u r l ) 的重定向参数( r e d i r e c t ) : 然后生成包含上述参数数据的用户端c o o k i e ,并推送用户端c o o k i e 至访问来源 资源的用户端。 o p e n u r l 生成 来源资源根据惯例并参考来源资源本身的特殊性,分析确定可以指向开 放链接服务器的对象数据类型,为每一种数据对象类型,确定设计符合 o p e n u r l 标准的数据描述格式,并尽可能地使用元数据方式。将元数据或标识 符按照o p e n u r l 语法规范生成标准的o p e n u r l 的q u e r y 部分。 q u e r y 部分的构成可能有三种方式,也可能同时有不同的方式描述了 一2 7 开放链接技术研究 同一个数字对象: 1 )元数据方式 可供使用的属性包括:。g e n r e l 。a u l a s t 。l a u f i r s t i 。a u i n i t f a u i n i t l i a u i n i t m l c o d e n ll i s s n l e i s s n i1 i s b n li t i t l e l 。s t i t l e i1 a t i t l e li v o l u m e i 。p a r t l i s s u e l s p a g e i e p a g e i p a g e s 。i1 a r t n u m l s i c i i 。b i d i s s n i 。q u a r t e
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025昆明市盘龙区汇承中学招聘教师(12人)考前自测高频考点模拟试题及答案详解(网校专用)
- 2025德曼节能科技(山东)有限公司招聘10人考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025湖南师范大学科创港校区规划建设指挥部劳务派遣人员招聘5人考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025广西河池市巴马瑶族自治县消防救援大队招录3人模拟试卷有答案详解
- 2025合肥市口腔医院招聘工作人员81人考前自测高频考点模拟试题附答案详解
- 2025年西北(西安)电能成套设备有限公司招聘(4人)模拟试卷及参考答案详解
- 2025贵州民族大学参加第十三届贵州人才博览会引才60人考前自测高频考点模拟试题(含答案详解)
- 2025河南郑州高新区双桥社区卫生服务中心招聘3人模拟试卷及答案详解一套
- 河北省【中职专业高考】2025年中职高考对口升学(理论考试)真题卷【轻工纺织大类】模拟练习
- 食品加工生产合同书5篇
- 高压氧的健康宣教
- 2025至2030中国硅单晶生长炉行业项目调研及市场前景预测评估报告
- 子宫肌瘤麻醉管理
- 成人床旁心电监护护理规程
- 食用菌种植项目可行性研究报告立项申请报告范文
- 2025版技术服务合同协议
- 焦炉机械伤害事故及其预防
- GB 5768.1-2025道路交通标志和标线第1部分:总则
- 江西红色文化考试试题及答案
- 苏州市施工图无障碍设计专篇参考样式(试行)2025
- 哮喘的诊疗和规范化治疗
评论
0/150
提交评论