(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf_第1页
(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf_第2页
(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf_第3页
(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf_第4页
(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf_第5页
已阅读5页,还剩99页未读 继续免费阅读

(计算机应用技术专业论文)高校数字图书馆总体方案的设计与研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

塑墨 。 摘要 数字图书馆是当前科学研究的一个热点,自从1 9 9 2 年美国科学家 提出数字图书馆的概念,各国先后开展了对数字图书馆的研究,并且 建立了一定规模的数字图书馆;数字图书馆将是未来的主要信息中 心,人类知识的主要载体;具有资源数字化、网络化存取、分布式管 理等特点。 数字图书馆对于教育科研的巨大意义,也吸引了很多高校投入到 数字图书馆的研究和建设之中;高校以其自身的特点,在建设数字图 书馆时,既遵循数字图书馆的般概念和基本技术,同时有自己的服 务特点和技术特点。本文结合数字图书馆和高校的基本特点,从功能 上和技术上研究高校数字图书馆的体系结构。提出高校数字图书馆的 总体框架,分别阐述高校数字图书馆的资源建设方案、应用服务体系 和硬件体系( 主要指网络、存储) 的设计。 数字资源是数字图书馆的物质基础,在数字图书馆的建设中处于 核心地位,高校数字图书馆的数字资源建设,主要靠外购资源,同时 也在加强对自己所有的资源的加工,组建自己的特色资源库,本文论 述了高校创建特色资源库的一般流程,讨论了资源创建的一般标准, 提出了一套适合于高校数字图书馆的元数据方案和对象数据的管理 备份方案。 数字图书馆的建立,将有力支撑学校的教学与科研;为了给用户 提供多样的服务,这需要开发出符合实际需要的应用软件;结合高校 数字图书馆的特点,本文探讨了高校数字图书馆的应用服务框架,并 从总体上设计了应用服务框架的基本功能。 网络是数字图书馆的运行载体,海量的信息需要t b 级的存储容 量,本文结合高校的网络特点,综合考虑网络的并发访问量和传输量, 以及资源的存储量,提出了一种适应性可扩展的网络拓扑结构和具有 良好扩充性的存储方案。 总之,本论文从总体上设计了高校数字图书馆系统的资源、应用 服务、硬件的体系方案。并对其中的关键问题进行了探讨和研究。 关键词:数字图书馆,数字资源建设,应用服务框架,网络和存储体 系 a b s t r a c t a b s t r a c t i n19 9 2 ,s o m ea m e r i c a ns c i e n t i s t sp r o p o s e da c o n c e p t i o no fd i g i t a l l i b r a r y ( d l ) s i n c et h e n ,m a n yc o u n t r i e sh a v es u c c e s s i v e l yl a u n c h e di r i t e t h es t u d yo nd i g i t a l l i b r a r y p r e s e n t l y , d i g i t a ll i b r a r yh a sa t t r a c t e dm a n y a t t e n t i o n sf r o ms c i e n t i f i c r e s e a r c h e r s ,m a n yo r g a n i z a t i o n sh a v es e tu d s o m ed i g i t a ll i b r a r i e so fc e r t a i n s c a l e ;d i g i t a ll i b r a r y w i l lb et h em a i n i n f o l i n a t i o nc e n t e ra n dt h em a i nc a r d e ro fh a m a n k n o w l e d g e ;i th a ss u c h c h a r a c t e r i s t i c sa sr e s o u r c ed i g i t i z a t i o n , n e t w o r k a c c e s s i n g ,d i s t r i b u t e d m a n a g e m e n t r e a l i f i n gt h eg r e a ts i g n i f i c a n c eo fd i g i t a ll i b r a r yf o re d u c a t i o na n d s c i e n t i f i cr e s e a r c h m a n yu n i v e r s i t i e sl a u n c h e di n t ot h er e s e a r c ha n d c o n s t r u c t i o no f d i g i t a ll i b r a r y g e n e r a l l y , i nt h ep r o c e s so fb u i l d i n gd i g i t a l l i b r a r y , u n i v e r s i t i e sw i t ht h e i ro w nr e q u i r e m e n t sw o u l df o l l o wt h eb a s i c c o n c e p t i o n sa n dt e c h n o l o g i e so fd i g i t a ll i b r a r y , a n d 也e ym a yh a v et h e i r o w ns e r v i c ea n dt e c h n 0 1 0 9 yc h a r a c t e r i s t i c sa sw e l l b a s e do nt h e c h a r a c t e r i s t i c so fu n i v e r s i t i e sa n dd i g i t a ll i b r a r y , t h et h e s i ss t u d i e st h e a r c h i t e c t u r e o fd i g i t a ll i b r a r yo fu n i v e r s i t i e si nf u n c t i o n a la n dt e c h n i e a l p e r s p e c t i v e s t h et h e s i sp r o p o s e sa no v e r a l lf r a m e w o r ko fd i g i t a ll i h 舭y o fu n i v e r s i t i e s ,a n di l l u s t r a t e st h e d e s i g n s o ft h e d i g i t a l r e s o u r c e c o n s t r u c t i o np l a n ,t h ea r c h i t e c t u r eo fa p p l i c a t i o ns e r v i c ea n dh a r d w a r e a r c h i t e c t u r e d i g i t a lr e s o u r c e sa r et h em a t e r i a lb a i l so fd i g i t a ll i b r a r y t h e yp l a ya c e n t r a lr o l ei nt h ec o n s t r u c t i o no fd i g i t a l l i b r a r y d i g i t a l r e s o u r c e c o n s t r u c t i o n m a i n l yd e p e n d s o nr e s o u r c e s p u r c h a s e d f r o mr e s o u r c e p r o v i d e r s ,w h i l eu n i v e r s f f i e sc a n e s t a b l i s hc h a r a c t e r i s t i cr e s o u r c eb a s e sb y p r o c e s s i n g t h e i ro w ni s o i l r c e s t h i st h e s i se l a b o r a t e st h e g e n e r a l p r o c e d u r eo fe s t a b l i s h i n gt h ec h a r a c t e r i s t i cr e s o u r c e sb a s e s ,d i s c u s s e st h e g e n e r a l s t a n d a r do fr e s o u r c e p r o c e s s i n g ,a n dp u t s f o r w a r das e to f m e t a d a t as c h e m e sa n das e to f p l a n so f o b j e c tm a n a g e m e n ta n db a c k u p t h eb u i l d i n go fd i g i t a l l i b r a r y w o u l ds u p p o r tt h e t e a c h i n ga n d s c i e n t i f i cr e s e a r c ho fu n i v e r s i t i e se f f e c t i v e l y t op r o v i d ed i f f e r e n tk i n d so f a b s t r a c t s e r v i c ef o ru s e r s ,a p p l i c a t i o n ss h o u l db ed e v e l o p e da n di m p l e m e n t e do n d i # t u ll i b r a r y c o m b i n i n g t h e r e q u i r e m e n t s o ft h e d i g i t a ll i b r a r y o f u n i v e r s i t i e s ,t h e t h e s i ss t u d i e st h e g e n e r a l f r a m e w o r ko f a p p l i c a t i o n s e r v i c e ,a n dd e s i g n st h eb a s i cf u n c t i o no f t h ef r a m e w o r ko nt h ew h o l e n e 咖r ki st h e o p e r a t i n g c a r r i e ro f d i g i t a ll i b r a r y v o l u m i n o u s i n f o r m a t i o nn e e d s s t o r a g ec a p a c i t y o ft b g r a d e b a s e d 0 1 1t h e c h a r a c t e r i s t i c so ft h en e t w o r ko fu n i v e r s i t i e s ,c o n s i d e r i n gt h e s t o r a g e c a p a c i t ya n d t h ec o n c u r r e n ta m o u n to f a c c e s sa n dt r a n s m i s s i o n t h r o u g ht h e n e t ,t h et h e s i sp r o p o s e sa ne x t e n d a b l ea n da d a p t a b l et o p o l o g i c a ls t r u c t u r e o f t h en e t w o r k o f d i g i t a ll i b r a r y , a n dd e s i g n sas c a l a b l es t o r a g es c h e m e i nc o n c l u s i o n ,t h et h e s i sp r o p o s e st h ed e f i g n so fs u c hp r o j e c t sa s d i g i t a l r e s o u r c ec o n s t r u c t i o n ,f r a m e w o r ko f a p p l i c a t i o ns e r v i c ea n dn e t w o r ka n ds t o r a g ea r c h i t e c t u r eo v e r a l l a n ds o m ek e y p r o m e m so fd i g i t a l l i b r a r ya l ed i s c u s s e da n d r e s e a r c h e di nt h et h e s i s k e y w o r d s :d i g i t a ll i b r a r y ( d l ) ,d i g i t a lr e s o u r c ec o n s t r u c t i o n , f r a m e w o r k o f a p p l i c a t i o ns e r v i c e ,n e t w o r k a n d s m r a g e a r c h i t e c t u r e 独创性声明 本人声明,所呈交的学位论文是我个人在导师指导 下进行的研究工作及取得的研究成果。尽本人所知,除 了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得北 京交通大学或其他教学机构的学位或证书而使用过的 材料。与我一起工作的同志对本研究所做的任何贡献已 在论文中作了明确的说明并表示了谢意。 本人签名: 日期:年一月一日 关于论文使用授权的说明 本人完全了解北京交通大学有关保留、使用学位论 文的规定,即:学校有权保留送交论文的复印件,允许 论文被查阅和借阅;学校可以公布论文的全部或部分内 容,可以采用影印、缩印或其他复制手段保存论文。论 文中所有创新和成果归北京交通大学计算机与信息技 术学院所有。未经许可,任何单位和个人不得拷贝。版 权所有,违者必究。 本人签名: e t 期:年一月一曰 1 1 课题研究背景 第一章绪论 数字图书馆是没有时空限制的、便于使用的、超大规模的知识中 心,作为知识经济的重要载体,数字图书馆是国家信息基础设施重要 组成部分,目前己成为评价一个国家信息基础水平的重要标志和本世 纪各国文化科技竞争的焦点之一。 数字图书馆自从9 0 年代以来,曾作为美国克林顿政府倡导的信息 高速公路计划的重要部分;其中影响比较大的包括下面两个项目: 美国国会图书馆是美国最早进行数字图书馆尝试的图书馆之一, 其“美国的记忆”( a m e r i c a nm e m o r y ) 影响深远。“美国的记忆”最 早是一个于1 9 9 0 年一1 9 9 5 年间实施的试验性计划,该计划的目标是 确定数字式馆藏的读者对象,建立数字图书馆的一整套技术过程,讨 论有关知识资产的论题,进行分发演示,并最终确定国会图书馆数字 化的方针与规范,由于该计划的成功,后来它就演变成为国会图书馆 的国家数字图书馆计划。美国国会图书馆数字图书馆的项目特点是着 眼于如何进行数字馆藏的建立。对历史文散的数字化中产生的问题与 技术规范进行了较为深入的研究,国会图书馆数字化工作中的最大贡 献是在资源建设方面,这也是与其图书馆的特点与特长息息相关。 美国“数字图书馆首倡计划”由美国科学基金会0 q s f ) 、美国国 防部高级研究计划署( d a r p a ) 、美国宇航局( n a s a ) 发起资助的包含6 北京交通大学硕士学位论文 个项目的数字图书馆计划,于1 9 9 4 到1 9 9 8 财年施行,平均每个项目 的资助金额为4 百万美元。这个计划的任务是共同研究和发展一个用 于创立、操作、利用与评价一个大跨度的不断发展的数字图书馆的试 验平台,该数字图书馆的内容主要为有关地球与空间技术的科学资 料。该计划的重点是偏重于进行一些试验研究,偏重于如何来测试与 评价利用因特网技术面对广泛的用户群体( 包括在大学校园中的学 生,本地高中以及公共图书馆用户) 提供服务的一个系统模型。目前 “数字图书馆首倡计划”进入了第二阶段,新增加了几家赞助机构, 这一计划的内容更为宽泛,但主要重点仍是侧重于应用研究与测试平 台的建立。 除了美国之外,其他西方国家及许多发展中国家分别制定了自己 的信息社会发展计划,以求在未来知识经济的竞争中立于不败之地。 在我国数字图书馆从1 9 9 8 年开始升温,在国家科技部的支持和协 调下,国家8 6 3 计划智能计算机系统主题专家组设立了数字图书馆重 点项目“中国数字图书馆示范工程”,这是一个由国内许多单位 联手参与的大文化工程。该工程于1 9 9 9 年启动,首都图书馆成为“中 国数字图书馆工程首家示范单位”。国家计委批准立项“全国党校系 统数字图书馆建设计划”,总投资达1 9 亿元。2 0 0 1 年5 月2 3 日, 国家重点科技项目“中国试验型数字式图书馆”通过专家技术鉴定。 目前,中国数字图书馆已经进入初步实用阶段,我国的数字图书馆研 究、建设已经初具规模。 同时,各个高校也投入了数字图书馆的研究,北京大学、东北师 范大学等院校相继成立数字图书馆研究所,在全国范围内掀起了数字 2 结论 指导高校数字图书馆建设和制定标准。 也有很多社会企业投入到数字图书馆工程中,并且开发出比较成 熟有效的数字图书馆方案和产品,影响比较大的有:超星公司的中文 数字图书馆,书生公司的基于全息数字化技术的方案和方正a p a b i 数 字图书馆等。 1 2 课题项目背景 高校信息化对于提高高校教学水平、丰富高校教学手段、提高师 资水平等各个教学环节都具有重要的意义。在校园信息环境中,与教 学直接相关的教学文档、图书资料、期列杂志和影音资源 句成校园信 息资源的重要组成部分,实践和研究表明,数字图书馆正是容纳这些 信息资源的最好的信息环境。 以计算枫私信怠类专业为主的薪兴高等学校石家庄某商校,在 校园信息化建设中,进行数字图书馆建设。提出如下目标: 具有千兆高速网络作为资源传输与工作环境 具有高速和大规模( t b 级) 存储环境 具有自主资源和丰富的外购资源 功能完善、易于维护 易于访问,服务完善 与国际国内标准接轨 我们人工智能与知识工程研究所承担此项目建设,在广泛调研国 内外数字图书馆的建设情况基础上,结合高校数字图书馆的实际特 点,采用最新的技术,完成了此项目的研究设计与建设实施工作,对 北京交通大学硕士学位论文 t b 级大规模数据管理技术( 存储、访问、管理、备份) ,网络技术, 检索技术,多媒体技术,元数据管理技术等关键技术进行了一定的研 究。 本项目对于高校数字图书馆的建设,具有定的代表性。在此项 目中本人参与项目总体设计工作,并且负责完成资源、软件系统的设 计开发工作。 1 3 本文的研究内容与组织安排 对于数字图书馆建设,本文以实际项目为背景,对高校数字图书 馆系统的总体结构进行了洋细研究;论述了高校数字图书馆的基本体 系:数字资源建设体系、应用服务体系和硬件环境体系,并且给出了 他们的具体设计;概括性地说明了高校数字图书馆建设的基本内容和 技术。 本文共分七章,安排如下: 第一章绪论。介绍了本课题的研究背景及国内外研究现状,阐述 了作为本课题项目背景的项目情况,说明了本论文的研究内容与组织 安排。 第二章数字图书馆的基本概念和技术。本章首先介绍了数字图书 馆的概念和特点;然后介绍了数字图书馆的基本技术和面临的挑战: 阐述了数字图书馆的基本体系结构:最后对高校数字图书馆建设的现 状和特点也进行了比较具体的调研。 第三章高校数字图书馆系统的总体设计。本章是全论文的纲领性 章节,依据高校数字图书馆的功能任务,分别从资源角度和业务角度 4 绪论 章节,依据高校数字图书馆的功能任务,分别从资源角度和业务角度 给出了高校数字图书馆的总体设计方案,并且扼要的论述了总体设计 的三大组成体系:数字资源的建设与管理体系,功能全面的应用服务 体系和硬件环境体系( 主要包括海量的存储系统和高性能的网络平 台) 。 第四章数字资源建设体系的研究与设计。本章是本论文的重点章 节,主要从资源的角度论述了高校数字图书馆的建设,首先从建设方 案角度说明了数字资源的建设,然后详细的研究了数字资源的元数据 和组织方式,并且给出了一个元数据设计方案,然后设计了数字资源 的创建和发布流程,最后给出了数字资源检索系统和调度系统的解决 方案。 第五章功能全面豹应用服务体系设计。本章从图书馆提供服务的 角度出发,论述了各种服务的特点和意义,给出了服务项目的设计, 主要包括:数字图书馆的门户网站、虚拟参考咨询系统、电子阅览室 管理软件等服务,最后详细探讨了数字图书馆安全运行的数据备份方 案。 第六章硬件环境体系的设计。本章从高校数字图书馆的实际需求 出发,设计了数字图书馆的网络拓扑结构,包括总体的网络设计和图 书馆实体内部的网络设计;探讨了当前流行的几种存储方案( s a n , n a s ,d a s ) ,并且各自给出了这些方案的设计。其中s a n 是当前最 流行的方案,也是未来的发展趋势。 第七章结束语。对全文进行了总结,并提出了课题下一步的研究 方向和目标。 北京交通大学硕士学位论文 第二章数字图书馆的基本概念与技术 2 1 数字图书馆的概念 2 1 1 数字图书馆的缘起 数字图书馆的研究开发,是伴随国际互联网的发展和普及而兴起 的,大致发端于九十年代初;巨量的信息涌入互联网,使其信息极为 丰富,也使信息的查询和检索十分困难,尤其是对于上网漫游的新手 更是如此,这主要是由于互联网上的信息资源很大程度上处于无政府 的混乱状态,大大影响了信息利用的效率,这一重大的弊端,清楚地 表明了在互联网这种全球信息服务网络中,急需一个管理信息资源的 新模式,所有上网的资源必须按照这个模式统一管理,这种模式要能 够有组织的管理信息资源,提高检索效率,有效实现资源共享;这就 是提出数字图书馆的主要背景;数字图书馆起初并不是由图书情报界 的人士首倡,但是由于图书馆是社会信息资源无可替代的集散地,最 终必然地应用到了图书馆领域。 2 1 2 数字图书馆概念 目前,数字图书馆正处于发展之中,国内外对数字图书馆还没有 一个明确完整的定义。但一般认为,数字图书馆是全球信息高速公路 上信息资源的基本组织形式,这一形式满足了分布式面向对象的信息 查询需要,是下一代互联网上信息资源的管理模式。这个定义中可能 6 数字图书馆的基本概念与技术 有两个概念需要解释,“分布式”和“面向对象”。简而言之,前者指 跨图书馆( 跨地域) 和跨物理形态的查询,后者指不仅要查到线索( 在 哪个图书馆) ,还要直接获得要查的东西( 对象) 。这个定义类似于说 目前的图书馆“是社会信息资源的一种主要组织形式,满足了人们借 阅书刊等基本信息需要。” 在数字图书馆概念出现之前,人们从电子图书馆、网上图书馆和 虚拟图书馆等不同侧面讨论了图书馆的未来发展。这些概念有必要和 数字图书馆概念区分开来: ( 1 ) 电子图书馆:侧重对收藏特色的概括,收藏品基本为电子读物, 阅读手段一般通过电脑等。不一定提供网上信息或上网服务。 ( 2 ) 网上图书馆:将一定量的信息在阏上组织起来,供“读者”查 阅和检索。这种网上图书馆不一定需要对应的图书馆社会实体,它也 可以视为数字图书馆的初级形态。 ( 3 ) 虚拟图书馆:网上图书馆的别称,侧重其无实体的特征。 表2 - i 数字图书馆与传统图书馆的比较 l 专统图书名致字图书饲 书刊采购数字化资源创建 典藏存储( 多媒体数据库) 编目标引并生成索引 借阅流通检索软件 流通管理权限管理 这些图书馆的建设难度、使用的方便程度都远远不如数字图书馆, 但他们是数字图书馆的基础。是建设数字图书馆的必不可少的前期准 北京交通大学硕士学位论文 备工作,表2 - 1 示例数字图书馆与传统图书馆的区别。 2 2 数字图书馆的特点 ( 1 ) 信息实体虚拟化与资源数字化 在网络环境下,各类知识信息都可以方便地转化为数字形式在全 球范围内传播,每一个用户都可以十分方便地使用世界上任何一个图 书馆的资源。这种图书馆已成为一个“信息空间”。 大量的数字化资源是数字图书馆的“物质”基础,万千世界统一 于数字图书馆中的0 和1 ,数字图书馆中的信息绝大部分是数字化的, 而且绝大部分的资源是多媒体资源;书籍、期刊、录音录像带、乃至 古籍善本、稀世字画甚至x 光片,都消失了原本的物理形态,利用现 代信息技术和网络通信技术,经过压缩等处理转变为数字信息,他们 只要有相同的属性,就能被同时获取。 ( 2 ) 网络化存取与资源的共享性 高速的数字通信网络是数字图书馆的存在基础,数字图书馆依附 于网络而存在,其对内的业务组织和对外的服务都是以网络为载体, 得益于网络也受制于网络,数字图书馆内部本身由局域网构成,一般 是高速主干联接数台服务器及工作站,外部通过数台广域网服务器面 向浩瀚的i n t e r n e t 。 网络化的存取,也带来了资源共享的跨时空;“馆藏”资源已不再 是“私有”,而是面向世界,为不同的人们提供不同的服务,任何人 受到的服务都是“虚拟馆”的服务,数字图书馆从以馆为中心转化为 以读者为中心。 8 数字图书馆的基本概念与技术 ( 3 ) 分布式管理与系统的开放性 分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图 书馆遵循统一的访问协议之后,数字图书馆可以实现“联邦检索”, 全球数字图书馆将像现在的i n t e r _ n e t 联接网站一样,把全球的数字 化资源联为一体,联接成为一个巨大的图书馆。分布式管理之所以是 数字图书馆的基本要素,在于它强调标准协议的重要性,只有全球共 同遵循t c p i p 协议,才有i n t e r n e t 的今天,数字图书馆技术还没 有这样一个公认的标准协议,因此技术标准的选择和参与制订,对每 一个数字图书馆先驱者来说都是至关重要的。 数字图书馆在共同遵守的协议之下,可以对外开放,馆间协同工 作,为用户提供“虚拟馆”的服务,数字图书馆的读者可以在任何时 间和任何地点从网上得到各种服务,充分体现数字图书馆的开放性。 ( 4 ) 系统的方便友好与知识性 在数字图书馆里读者得到服务是多方面的、多层次、多形式、友 好的、简单的、方便的,检索命中率高,不仅可以得到纸介质文献, 也可以得到电子文献,还可以结合声、像、文字多种媒体,使读者如 同身临其境; 此外,数字图书馆不仅提供这些文献和多媒体材料等原始资源, 还将提供更深层次的信息服务;通过信息分析和重组形成符合用户需 求的知识或帮助用户找到解决方案,并对提供的知识产品的质量进行 评价。 北京交通大学硕士学位论文 2 3 数字图书馆的关键技术与面临的挑战 数字图书馆是一个宽带多媒体网络和海量信息管理系统,它所面 对的存储对象和技术领域远远超出了目前传统图书馆的范围。存储对 象包括数字化的图书、音像、新闻、美术、照片、雕塑、电影、软件、 电子出版物、互联网内容、卫星数据、气象数据、地理数据、政府文 件等各种各样的人文与科学数据,因而牵涉到大量的管理问题。 数字图书馆涉及的技术领域很宽广,需要大量的技术突破作为支 撑,例如基于内容的多媒体检索技术和智能化、个性化和自动化服务 技术,这样数字图书馆的真正潜力才能发挥出来。建设数字图书馆我 们至少需要解决以下十个问题,或者也可以说是面临的挑战: ( 1 ) 海量信息资源建设问题 如何快速、有效、有序、合法地把包括历史资料在内的各种媒体 资源数字化后放入数字图书馆,是涉及到技术、管理和法律等诸多方 面的难题。其中,中文图书的自动录入将是最繁重的一个任务。 ( 2 ) 存储与压缩问题 根据加州大学伯克利分校p e t e rl y m a n 和h a l a l l 的报告,全球 每年生产的信息量平均每个人2 5 0 兆,这些信息的绝大多数以多媒体 形态存在,印刷文档只占总量的o 0 0 3 。因此,如何有效地压缩、保 存和方便使用这些海量数据,使得系统的成本不至于过高而且系统响 应很快,是数字图书馆系统设计最需要技巧的环节之。 ( 3 ) 分类、索引和检索问题 为了规范化和易于后续开发,数字图书馆一开始就需要定义能够 1 0 数字圈书馆的基本概念与技术 覆盖包括电子图书在内的多种媒体类型的元数据规范,以及基于此规 范的内容索引方法和分类方法。为了支持海量数字化资源的自动分类 和检索,需要研究基于内容的多媒体处理技术。 ( 4 ) 安全性问题 安全性包括版权保护和系统安全性的保护。版权保护,是数字图 书馆能够健康发展的前提。 ( 5 ) , f f j 户界面问题 智能化用户界面设计的技术核心是为用户使用数字资源库提供方 便的支持,是数字图书馆系统与用户交流的窗口。如何充分利用图形、 语音及其融合技术,设计一个具有人性化、智能化的友好、直观、方 便的接口,让中国用户得心应手,不仅需要技术突破,还需要大量实 践的检验。 ( 6 ) 信息表现问题 数字图书馆中的许多非文本数据都可以直觉化、可视化,可以用 图像、图形、语音等直接表现出来。但是如何对知识或信息的表现最 有效,目前还没有很好的答案。 ( 7 ) 多语言问题 数字图书馆中的图书可能是用英语、汉语等多种语言书写的,为 了让更多的入能够方便的阅读各种语言的图书资料,数字图书馆需要 提供机器翻译能力。 ( 8 ) 工具与平台问题 工具包括图书录入工具、音像制品录入和编辑工具、浏览工具、 开发工具等,平台包括软件平台、数据库平台等。目前已经有一些商 北京交通大学硕士学位论文 品化的软件平台,但是如何针对数字图书馆的需求设计专用工具与软 件平台,是一个亟待解决的技术挑战。 ( 9 ) 标准与规范问题 数字图书馆领域目前国内没有相应的电子图书标准、多媒体信息 表达标准、元数据标准、服务与互操作标准。 其中,能否采用先进的资源数字化和检索等实用技术、能否有效 保护数字资源不被盗版、是否采用统一的兼容性强的标准来避免重复 建设,是决定数字图书馆建设成败的关键。 2 4 高校数字图书馆建设的现状和特点 在国家、社会数字图书馆研究与建设蓬勃发展的同时,高校作为 教育和科研的主力,高等院校作为知识型机构的代表,走在了前列。 有关数据显示,全国1 0 0 0 多所普通高等院校中,目前已有近三分之 二开始涉足该领域。 对于高校,数字图书馆的建设,更具有战略意义,数字图书馆优 势势不可挡,高校图书馆的数字化进程,经历了电子图书馆,网上图 书馆,数字图书馆三个阶段;在ca li s 领导下,高校组成了高校 数字图书馆联盟。 2 4 i 高校图书馆的建设现状 在信息化的大潮中,高校的信息化、网络化走在了时代的前列, 现在几乎所有的高校,和互联网建立了互连,拥有一定的机房;大部 分的高校建立了校园网,实现了部分的无纸化办公,拥有自己的站点。 数字图书馆的基本概念与技术 在校园信息化进程的推动下,高校图书馆的自动化、数字化程度 得到了极大的提高,图书馆内部,不但存在传统的图书馆的业务部门: 图书采编部门、流通部门,典藏部门、行政部门;也基本上建立了多 媒体l 弼览室,网络阅览室;图书馆的图书流通等业务基本上摆脱了卡 片式管理,实现了办公自动化。部分高校图书馆购进了一定量的电子 资源,这些电子资源是分散存在、运行的,读者通过特定专有的入口 来查询、阅读这些资源:这项服务在网络阅览室或者通过校园网提供: 有些重点高校,购买了一定规模的数字资源库,加工创建了自己的特 色资源库,并且对这些数字资源库进行了一定的集成和组织,组建成 图书馆数字中心或者学校的数字信息港。 高校图书馆在自动化、数字化的进程中,也普遍存在下列问题: 建设资金不足、自己特色资源的缺乏、技术人员特别是计算机技术方 面的人才缺乏。 2 4 2 高校数字图书馆的建设现状 1 9 9 6 年在北京召开的第6 2 届国际图联( i f l a ) 大会,数字图书馆成 为该会议的一个讨论专题。i b m 公司和清华大学闺书馆联手展示“i b m 数字图书馆方案”。随后北京大学、东北师范大学等院校相继成立数 字图书馆研究所,在全国范围内掀起了数字图书馆建设和研究的高 潮。 上海交通大学图书馆经过“数字图书馆雏形”( 1 9 9 6 1 9 9 8 ) 和“数 字图书馆试验基地”( 1 9 9 9 今) 的建设,在数字图书馆的体系结构、 技术和服务上做了一些研究和探索,建成了论文库,音乐数字图书馆 北京交通大学硕士学位论文 等。 北京交通大学,全国首家引进“学术资源门户”一m e t a “b s f x 系统,能够实现图书馆多类型资源的管理,实现多个异构数据库的统 一检索,对内容敏感链接服务的资源导航。 2 4 3 高校数字图书馆的优势 ( 1 ) 信息储存空间小、不易损坏 数字图书馆是把信息以数字化形式加以储存,一般储存在电脑光 盘或硬盘里,与过去的纸制资料相比占地很小。而且,以往图书馆管 理中的一大难题就是,资料多次查阅后就会磨损,一些原始的比较珍 贵的资料,一般读者很难看到。数字图书馆就避免了这一问题。1 0 0 万册书,仅仅需要l o 块1 4 6 g 大小的硬盘就足够了。 ( 2 ) 信息查阅检索方便 数字图书馆都配备有电脑查阅系统,读者通过检索一些关键词, 就可以获取大量的相关信息。而以往图书资料的查阅,都需要经过找 书库、按检索号、寻找图书等多道工序,繁琐而不便。 ( 3 ) 远程迅速传递信息 图书馆的建设是有限的。传统型图书馆位置固定。读者往往要花 费大量的时间在去图书馆的路上。数字图书馆则可以利用互联网迅速 传递信息,读者只要登陆网站,轻点鼠标,即使和图书馆所在地相隔 千山万水,也可以在几秒钟内看至4 自己想要查阅的信息,这种便捷是 以往的图书馆所不能比拟的。 ( 4 ) 同一信息可多人同时使用 1 4 数字图书馆的基本概念与技术 众所周知,一本书次只可以借给一个人使用。在数字图书馆则 可以突破这一限制,一本“书”通过服务器可以同时借给多个人查阅, 大大提高了信息的使用效率。 ( 5 ) 节省费用:购买了电子图书,可以少购买纸介质图书,当前市 面上一本电子图书,一般直需要3 5 元,比起纸介质书,价格要低 的多;从而节省购书费用,现在占用空间小,对电子图书的管理费用 也远远小于对纸介质的图书管理费用。 2 4 4 高校数字图书馆的特点 广义的数字图书馆是一个存有海量信息的信息中心,内容类别多 种多样:然而高校数字图书馆,作为整个数字图书馆系统的一个节点, 与教学和科研有着密切的关系,有其自身的特点,主要有以下特点: 主要面向学校师生,为教学和科研服务; 运行环境主要为校园内部网,提供局域网范围内的服务: 一般属于公益类型的数字图书馆,阅读下载没有收费要求; 数字资源的类型主要包括:电子图书、期刊、报纸、会议论 文、影音资源、光盘资源与特色馆藏资源: 多样化的数字资源来源渠道,主要包括如下渠道: ( 1 ) 自主资源 包括图书馆馆藏资源、学校各个部门的有参考价值的信息资源、 教师和学生的需要存档的资源,它更直接服务于学校的教学等各项工 作,由图书馆人员借助相关软件进行加工处理。 ( 2 ) 外购资源 北京交通大学硕士学位论文 是数字图书馆扩大馆藏的主要方式,包括常见的电子图书、期刊 库以及其他各种专业信息库,需要一定的投入,而且有后期的资源更 新投入。 ( 3 ) 网络资源 i n t e r n e t 上的网站聚集了无数的数字化、多媒体的信息资源。图 书馆作为收集、整理、传播和交流信息的机构,可以对网络信息进行 收集和整理,使之成为本馆资源的有机组成部分。 高校数字图书馆服务范围分为馆内网、校园网、校外网,提供音 视频服务,一般流量很大,会给网络很大的负载压力,一般只提供馆 内服务,数字图书馆的建立还不能取代现在传统的图书馆,一般作为 传统图书馆的一项崭新的价值巨大的服务,并将最终取代传统的图书 馆而成为高校的信息主体。 2 5 本章小节 本章首先介绍了数字图书馆的概念和特点;然后介绍了数字图书 馆的基本技术和面临的挑战;阐述了数字图书馆的基本体系结构;最 后对高校数字图书馆建设的现状和特点进行了比较具体的调研。 1 6 高校数字图书馆系统的总体设计 第三章高校数字图书馆系统的总体设计 3 1 数字图书馆系统的主流体系模式 经过了十几年对数字图书馆各种主要技术的研究和相关技术的发 展,为建立现实的数字图书馆打下重要的技术基础,现己建成或正在 建设的一批数字图书馆,主要有三种类型: 特种馆藏型模式:将本馆的珍藏( 包括声像善本、古籍和珍藏) 或特种馆藏( 包括图片、声像、影视等各种载体) 的资料进行数字化, 提供网上共享。例如以美国国会图书馆的“美利坚记忆”为代表 的一些国家、地方图书馆等。 服务主导型模式:这种服务模式的资源一般由三部分组成: a 图书馆本身的数字化特种馆藏;b 商用的网上联机电子出版物 或数据库( 包括在本馆的资源镜像库) ;c 因特网上有用的文献信息 资源。它们用统一的界面向读者提供服务。例如目前国外有些大 学的数字图书馆模式,又如美国加利福尼亚州的数字图书馆 ( c d l ) ,伊利偌伊斯州的i d a l j i ,即伊州的数字学术图书馆等。 商用文献型模式:一些文献服务公司、出版社、代理商等建 立的一种商用文献型的数字图书馆,提供全文的期刊、杂志、电子 图书馆( 也包括音乐和影视资料) 等,一般既有索引数据库、又有全 文的对象数据库。例如中国的超星数字图书馆提供电子图书,荷兰 的e l s e v i e r 公司提供1 2 0 0 多种全文杂志,美国科罗拉 多州的n e t l i b r a r y 也提供几万种电子图书供读者使用。 北京交通大学颂士学位论文 服务主导型数字图书馆的体系结构,它以三种主要数字化资源为 基础( 即图书馆本身的数字化特种馆藏;商用的网上联机电子出版物或 数据库;因特网上有用的文献信息资源) ,以一个统一的信息访问平台 和一个为读者服务的网上参考咨询台( v i r t u a lr e f e r e n c ed e s k ) 为两翼, 实现对读者的有效服务。这两个平台对一个实用的数字图书馆是不可 缺少的。两个平台在系统结构上有些是相互渗透的。 根据高校数字图书馆的特点,高校数字图书馆的功能主要是以图 书馆的各种类型数字资源为中心,以为读者提供方便、快捷的信息服 务机制为目的,实现数字资源的加工建设、数字资源的存储和管理、 数字资源的访闯和服务。高校数字图书馆的建设采用服务主导型的数 字图书馆体系结构。 3 2 总体方案的设计 根据高校数字图书馆的建设目标与任务,数字图书馆设计方案应 包括集数据加工标引、建库、发布和检索服务为一体的信息资源( 元 数据或全文数据) 库建设方案;集用户管理和个性化服务为一体的资 源服务系统;实现异构、分布式、跨平台、多样化资源统一检索和参 考链接服务的资源整合门户;参考咨询服务系统:以及高校论文库建 设、教参库建设等应用系统。简而言之,该数字图书馆设计方案充分 考虑了以下几方面问题: 包括自建库、图书馆自动化系统、网络数据库、光盘数据库 在内的分布、异构和多样化的数字信息资源的整合; 包括资源种类、分类、关键词、检索历史等在内的个性化信 高校数字图书馆系统的总体设计 息服务; 与主流的数字化加工系统的无缝集成; 开放的体系结构,遵循信息描述、组织和资源互操作的国际 标准; 从资源的角度看,高校数字图书馆系统的总体方案如图3 1 。 图3 1 数字图书馆总体方案图l 蓝色区域:表示数字资源的原材料来源; 红色区域:表示数字资源的加工流程; 绿色区域:表示以数字资源为使用对象的数字图书馆应用体系; 蓝色和红色区域相对于图书馆内部管理人员,绿色区域面向的是 用户。 北京交通大学硕十学位论文 从业务功能的角度看,数字图书馆系统的总体方案如图3 2 。 图3 2 数字图书馆总体方案图2 下面章节将根据总体方案图展开详细论述。 3 3 数字资源的建设与管理体系 如图3 1 蓝色和红色部分,以及绿色部分的资源整合系统以下部 分,都属于数字图书馆的资源建设与管理体系,可以看出资源系统在 数字图书馆系统中的核心地位。 3 3 1 数字图书馆将具有的资源 ( 1 ) 自主资源 这些资源与学院的教学研究密切相关,将直接服务于学校的教学 目的。自主资源主要包括教师教案,学生作业,毕业论文,特色资源 高校数字图书馆系统的总体设计 等。 ( 2 ) 外购电子图书 这部分资源将是数字图书馆的主要资源,可从数字资源商购买。 ( 3 ) 期刊、报纸与论文 这一部分也将是数字图书馆的重要资源。 ( 4 ) 影音资源 这一部分主要是为了丰富教师和学生的课余生活,集中提供一些 电影、歌曲等娱乐内容,这些资源将主要在声像室中提供。 ( 5 ) 光盘资源 ( 6 ) 特色馆藏资源 主要搜集一些具有学校自身特色的资源。 3 3 2 资源整合系统 由于不同的数据库厂商提供了不同的用户界面、检索阅读软件和 管理平台;而且它们的检索平台互相不能兼容,元数据库不对外公开: 因此,为了找到某相关的主题,不得不对不同的数据库进行多次检 索,而且无法解决文摘、全文、引文、m a r c 数据等相关信息的参考 链接。我们当前和资源提供商合作开发了统一检索平台即资源整合系 统;将整个数字图书馆作为一个统一的虚拟整体,提供统一检索的功 能,即用一个统一的检索界面,对分布在多个数据源中的数据进行不 分来源的检索。资源提供商提供其资源库检索接口,我们开发统一检 索界面,为用户服务:用户只需输入自己的检索请求,由资源整合系 统接受请求,生成检索字符串,传递给各个资源库提供的检索接口, 北京交通大学硕士学位论文 每个资源库的检索平台进行检索处理,并把处理结果返回资源接合系 统,资源整合系统把各个资源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论