数字图书馆技术_第1页
数字图书馆技术_第2页
数字图书馆技术_第3页
数字图书馆技术_第4页
数字图书馆技术_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图书馆技术,数字图书馆技术,数字图书馆原理及应用李培主编,综合文献服务平台(一),门户,结算,认证,统一检索平台,电子文献全文,文摘索引库,馆藏书目,资源调度,联邦检索,跨库检索,文献传递,CCC,PQDD,论文,联合目录,特色,综合文献服务平台统(二),统一检索平台,电子文献全文,文摘索引库,馆藏书目,资源调度系统,本馆元数据联合仓库,某图书馆门户,元数据联合仓库,本馆资源调度系统,文献传递,数据源适配器,电子文献全文,文摘索引库,馆藏书目,某图书馆门户,跨库检索,联邦检索,数字图书馆整体解决方案,主要内容,一、数字图书馆理论基础二、数字图书馆的发展三、数字图书馆的体系结构四、数字图书馆的服务五、数字图书馆关键技术,第一部分数字图书馆基础,1、数字图书馆的定义、特征2、数字图书馆的理论模型形象模型、抽象模型3、数字图书馆的理论结构数字资源、网络服务、支持技术4、数字图书馆与图书馆自动化的关系,一、数字图书馆的定义,数字图书馆(DigitalLibrary)的概念,最早可以上溯到1975年R.W.Christian在电子图书馆:书目数据库:1975-76一书中提出的电子图书馆(ElectronicLibrary),现在一般认为电子图书馆是数字图书馆的早期提法,1992年前大多使用“电子图书馆”,1992-1994年间这两个概念并行使用,1994年后多用“数字图书馆”。,要素列举式的数字图书馆定义研究图书馆协会1995年10月,数字图书馆不是一个单一的实体;数字图书馆需要链接许多信息资源的技术;多个数字图书馆及信息机构之间的链接对最终用户透明;全球范围存取数字图书馆与信息服务是一个目标;数字图书馆的收藏不仅限于文献的数字替代品,它们还扩展到不能以印刷形式代替和传播的数字化人造物。,数字图书馆是一个拥有专业人员等相关资源的组织,该组织对数字资源进行挑选、组织、提供智能化存取、解译、传播、保持其完整性和永存性等工作,从而使得这些数字资源能够快速且经济地被特定的用户或群体所利用。,美国数字图书馆联盟1998年,将数字图书馆规定为一种具有特定功能的组织机构,同时强调了数字资源是数字图书馆的核心。,数字图书馆是具有服务功能的整理过的信息收藏,其中信息以数字化格式存储并可通过网络存取。该定义的关键在于信息是整理过的。,美国著名数字图书馆专家WilliamArms,将数字图书馆界定为一种信息收藏,兼顾了数字资源和网络服务,并强调了数字图书馆的信息管理,简洁性和综合性较好。,所谓数字图书馆,就是对有价值的图像、文本、语音、影视、软件和科学数据等多媒体信息进行收集、组织和规范再加工,通过网络提供高速横向跨库连接的多媒体信息存取服务,促进社会各类信息高效、经济地传递,从而极大地方便人们的学习、交流和生活;,数字图书馆与传统图书馆有着不可分割的联系。传统图书馆是数千年“前数字化时代”人类社会知识文化的结晶,数字图书馆虽然可以把传统图书馆中各种载体的文献信息内容数字化,但却不能替代文献载体本身,也不能提供传统图书馆特有的阅览环境等;数字图书馆不仅要选择性地对已有的文献资源进行数字化,而且要处理新生的数字信息资源并开辟利用图书馆的新渠道、新方式和新技术。没有必要摆脱传统图书馆去另建新的数字图书馆,传统图书馆是数字图书馆的基础,数字图书馆是传统图书馆的发展,二者相互结合,构成复合图书馆(HybridLibrary)。,二、数字图书馆特征,抓住数字图书馆的特征也就掌握了数字图书馆的本质,进而可能获得更加全面和准确的数字图书馆定义。数字资源、网络服务和特色技术是数字图书馆最主要的三大特征。,数字资源,指图书馆中所有数字形式的信息资源,包括经过数字化转换的文献或本来就是以数字形式出版的信息。这些数字资源是数字图书馆的“物质”基础,也是数字图书馆有别于传统图书馆的一大特征。,数字资源类型包括期刊、图书、工具书、视频资料、声频资料等;文件格式包括从位图形式的页面到经SGML编码的特殊文本文件,甚至CD-ROM中的信息或本地局域网中的资源等等。能同时处理多媒体化的数字资源是数字图书馆在技术上的一个典型特征。,数字图书馆的目的是直接提供读者所需的最终信息,而不只是二次文献,但数字图书馆也需要书目数据、索引文摘等二次文献,二次文献也是数字图书馆的数字资源的一种类型。,网络服务,高速数字通信网络是数字图书馆存在的基础数字图书馆的对内业务组织和对外服务都是通过网络进行,网络是数字图书馆的生命线数字图书馆只有通过网络才能提供服务,这也是数字图书馆不同于传统图书馆的一大特征没有网络,就没有数字图书馆;网络中断,数字图书馆的服务也会随之中止保证网络通畅是数字图书馆运行的关键,特色技术,分布式资源与运行管理技术;海量信息存储与组织技术;多媒体信息标引与检索技术等,基于数字图书馆特征的数字图书馆定义,“数字图书馆是同时具备数字资源、网络服务和特色技术三大特征的图书馆”。也就是说,拥有数字资源、实行网络服务和具备特色技术的图书馆,就是数字图书馆。,电子图书馆:收藏品多为光盘、磁盘等有形载体,一般通过单一计算机阅读或存取,不强调提供网上信息或网络服务。网上图书馆:将一定量的信息通过网页组织起来,供用户查阅和检索。可以没有对应的图书馆实体,内容可以作为数字图书馆的组成部分。虚拟图书馆:是网上图书馆的集合。在网上才能存在,不拥有实体性的数字资源,一般采用通用网络技术就能构造而不必采用特色技术。可作为数字图书馆的延伸。,将传统的图书馆服务搬到网上去并不就是数字图书馆,而将馆藏资源进行大规模数字化后也不一定是数字图书馆。数字图书馆就是要用特色技术将数字资源组织起来并提供网络服务,数字资源、网络服务和特色技术三大特征缺一不可。在传统图书馆基础上可以发展出数字图书馆,数字图书馆往往具有传统实体图书馆作为后盾,但数字图书馆并不是要取代传统图书馆。,三、数字图书馆的理论模型,从数字资源、网络服务和特色技术三大特征出发,提出数字图书馆的形象模型和抽象模型,作为数字图书馆的理论模型。,数字图书馆的形象模型,资源是数字图书馆赖以存在的基础,技术是数字图书馆得以成立的条件,服务是数字图书馆努力追求的目标,这是一个以资源为核心、技术为支撑、服务为目的的数字图书馆理论形象模型,,第一、资源主导学派:强调数字资源最重要,认为资源在数字图书馆中居于核心地位,主张建立资源主导型数字图书馆。第二、服务主导学派:强调网络服务最重要,认为服务在数字图书馆中居于核心地位,倡导建立服务主导型数字图书馆。第三、技术主导学派:强调特色技术最重要,认为技术在数字图书馆中居于核心地位,认为在数字图书馆建设中应以技术主导,导致技术主导型数字图书馆。,基于形象模型的三大学派,正确的认识应是资源-技术-服务的综合集成和一体化没有资源,数字图书馆就失去存在基础;没有服务,数字图书馆就失去存在价值;没有技术,数字图书馆难以运行。资源、技术与服务相辅相存,构成数字图书馆的“三位一体”。,抽象模型,对资源-技术-服务一体化数字图书馆系统的简单精练抽象处理:数字图书馆的硬件边界由技术“范围”而成,数字图书馆的结构抽象化为技术,资源则抽象化为数字图书馆系统的输入,而服务抽象化为数字图书馆的输出。,技术结构T,服务S,资源R,数字图书馆的数学模型,技术系统S(信道),资源(信源),服务(信宿),I,J,B,I是信息供应量、J是信息获取量、B是反馈信息集、S是技术系统结构,资源、技术和服务分别对应一般信息系统的信源、信道和信宿。,J可看作是初始信息量I经过S变换后产生出的有效信息量,整个模型类似于一个数学变换体系,需要寻求的数学关系相当于F(J,B)=fG(I,S)函数F表征服务(信宿)特性,函数G表征资源和技术系统(信源和信道)特性,二者之间的函数关系就是数字图书馆的一种数学模型。其中S是决定系统性能的核心参量,而B则代表了用户主动和交互参数。,数字图书馆的理论结构,数字资源、网络服务和特色技术是数字图书馆的主要特征和理论核心,则数字图书馆的理论框架可由数字资源、网络服务和支持技术构成。,数字资源,数字图书馆中的数字资源有两大来源:一、印刷资源的数字化对于版权已过期的图书、文献、资料,可以采用扫描、光学字符识别等处理技术进行数字化,形成数字资源的基础部分,这类资源以经典著作和古代文献为主。二、原生数字资源现在原生数字信息资源已经越来越多,尤其是学位论文、技术报告、会议录等。出版业已经实现数字技术处理,图书、期刊的出版都是先有数字化版本,再生成印刷本,作为信息资源主体的传统图书、期刊正在被数字图书、数字期刊所覆盖,原生数字资源正逐步成为数字资源的主体。,网络服务,数字图书馆的网络服务模式可以分成被动服务和主动服务两类被动服务:是数字图书馆网络服务的基础方式,特点是不考虑用户的个别要求,具体实现形式一般是采用无交互Web网站模式。系统处于主动地位,用户处于被动地位,信息从资源到用户单向流动。,改善被动服务的改善被动服务的技术方法是通过纯粹Email或Web表单方式提供用户附加信息资源或解答用户提问,这是最简单的被动服务改良模式,但可以为用户提供了便捷、经济的通讯渠道。,主动服务:是数字图书馆网络服务的高级方式,特点是考虑用户的个别要求,具体实现形式一般是通过交互式Web网站形式。交互式Web网站形式具体可分为双向交互问答模式和个性化信息推送模式,其中MyLibrary技术正在成为主流。,双向交互问答模式数字图书馆根据用户的请求组织资源,服务形式根据用户需求变化,系统和用户处于同等地位,信息在系统和用户之间双向交流。该模式在技术上可以通过Chat形式实现。个性化信息推送模式用户根据自己的需求和爱好自行设计数字图书馆界面并定制数字图书馆资源,用户处于主动地位,数字图书馆系统居于从属地位,数字图书馆只是在技术上按照用户的个性化需求定制并主动推送信息。,从单向信息传递模式到个性化信息推送模式一方面体现了技术的进步;另一方面也越来越多地将控制权和主动权交给用户;用户技术水平和应用水平越高,使用效果就越好;同时,资源管理方也应重视对数字资源的整合和对操作方法的优化,使数字图书馆的网络服务具有保障。,支持技术,数字图书馆涉及的技术包括通用信息技术和专用创新技术即特色技术。通用信息技术建设数字图书馆所需的通用信息技术主要是计算机技术、网络技术和信息安全技术。特色技术涉及数字信息处理与加工技术、海量信息存储与组织技术、分布式资源与运行管理技术、多媒体信息标引与检索技术、信息挖掘技术、个性化信息定制与发布技术、信息可视化与读者界面技术、信息安全技术、数字权益管理技术等。,四、数字图书馆与图书馆自动化的关系,图书馆自动化系统发展的三阶段说;图书馆自动化是数字图书馆的基础之一,图书馆自动化是建设数字图书馆的必经阶段。图书馆自动化是在传统图书馆理论框架下应用计算机技术来改善图书馆服务与管理,而数字图书馆却是在理论与技术上超越传统图书馆的新发展,意义和影响将更加深远。,第二部分数字图书馆的发展,一、数字图书馆的出现和演变1、数字图书馆的产生背景2、数字图书馆的产生和演变过程二、数字图书馆的发展趋势与方向3、数字图书馆的发展趋势4、数字图书馆建设的方向5、网格技术的发展对数字图书馆的影响,1、数字图书馆的产生背景,图书馆的发展和演变的内部环境的驱动力和社会环境的推动力。内部环境:是指社会对图书馆的需求产生的驱动力,促使其改变传统图书馆的服务环境,实现图书馆的数字化和自动化;社会环境:包括社会经济结构、信息技术结构、文化结构的变动,进而推动图书馆的发展和演化。,数字图书馆产生与发展主要源于两种力量的推动一是图书馆自身资源共享的内在要求;二是计算机互联网络的发展对数字信息进行有序化、结构化组织的要求。A、数字图书馆产生的内在因素B、数字图书馆产生的外在因素C、数字图书馆发展的社会背景,数字图书馆产生的内在因素一是印刷型文献的保存问题;二是文献信息的利用问题。,数字图书馆产生的外在因素,一是文献信息资源的巨增种类、数量、内容二是信息高速公路的建设和因特网的发展20世纪70年代,图书馆逐步利用计算机进行日常管理。80年代末图书馆自动化系统逐步得到了应用,分布式管理意味着通过因特网可以把全球的数字化资源联为一体三是数字化技术的发展信息存储技术数据库技术信息传输与通讯技术,数字图书馆发展的社会背景,1数字图书馆是社会信息化发展的必然产物2数字图书馆是评价一个国家信息基础水平的重要标志3数字图书馆是21世纪全球文化竞争的焦点之一4数字图书馆建设有利于带动相关行业的发展,体现了数字化社会对信息共享和信息开放的根本要求;数字图书馆建设使人类社会信息资源的共享达到一定的高度,为文化传播打开新的大门。,2、数字图书馆的产生和演变过程,A、早期的数字化技术和概念探索阶段B、图书馆自动化管理系统的研究C、数字图书馆研究计划的启动D、数字图书馆的建设与利用,数字图书馆的形成过程主要包括以下几方面:第一、文献资源数字化第二、数字资源的集成第三、数字资源的共享,早期的数字化技术和概念探索阶段,1945年的数字图书馆的构想,构思并描述了所设想的一种Memex装备机械化的个人文档与图书馆;1965年到1973年麻工学院建立Intrex数据库,将文章储存在缩微胶片上利用联机储存目录和索引进行检索;1969年Sandia实验室开发出有关科技文献的全文储存和检索系统;1969年正式发行机读目录,这是图书馆进入自动化的标志;,1975年,R.W.Christian出版了“ElectronicLibraryBibliographicDatabases:19751976”一书,首次提到了“ElectronicLibrary”这个名词;1978年美国著名图书馆学家兰卡斯特论述了电子图书馆的前景,1984年K.E.Dowlin首次对电子图书馆这一概念给出明确定义;1988年美国国家科学基金会的伍尔夫(W.Wulf)撰写的国际合作白皮书提出数字化图书馆的概念。,80年代末90年代初对数字图书馆的设想更加具体化,“电子图书馆”、“虚拟图书馆”、“无墙图书馆”等概念纷纷提出来。电子图书馆是数字图书馆的早期提法,它反映了所应用技术的特点;虚拟图书馆则强调了网上数字化资源,而未突出图书馆的数字化特点;无墙图书馆突出了利用范围和效果;数字图书馆较准确地反映了问题的本质,揭示了信息存取形式的基本特征及有关内涵,图书馆自动化管理系统的研究,80年代末,美国一些大学和知名公司开始研制开发大型的图书馆自动化管理系统。IBM电脑公司合作开发出图书馆管理系统;1988年底,美国国家科学基金会就发起了“水星计划”;1989年,卡内基.梅隆大学开始进行电子图书馆研究,作为图书馆自动化的一部分,其项目目标是建立一个电子传输全文系统;康泰尔大学、化学文摘社、OCLC等机构也在着手建立“化学联机检索实验(CORE)”。,数字图书馆研究计划的启动,1994年,美国国家科学基金会联合其它单位正式实施“数字图书馆创始”计划,这个计划的主要目标是“使收集、存储和组织数字化信息的技术手段得到较大提高,并使数字化信息通过网络被查询、检索和处理,且有一个统一的用户友好界面”。,数字图书馆的建设与利用,20世纪末以来,世界各国的数字图书馆建设有了较大的发展,许多已经投入实际的应用。在这一时期研究的重点也不再单纯地局限于技术,而是把研究范围扩展到更宽广的领域,制定信息共享格式与国际标准,数字图书馆网站的可靠性和稳定性,经济因素和商品化等,进行综合性研究。,3、数字图书馆的发展趋势,A、从基于数字化资源向基于集成服务和用户信息活动的范式发展B、数字信息存储的全息化C、多种资源的高度集成,易用性更强D、数字化技术进一步完善E、标准化建设取得较大进展F、社会化和国际化趋势,从基于数字化资源向基于集成服务和用户信息活动的范式发展,第一代数字图书馆主要在特定文献资源数字化的基础上建立数字信息资源系统;第二代数字图书馆致力于支持分布的数字信息系统间的互操作,支持这些系统间无缝交换和共享信息资源与服务,由此构造集成信息服务机制,形成基于集成信息服务的数字图书馆;第三代数字图书馆将围绕用户信息活动和用户信息系统来组织、集成、嵌入数字信息资源和信息服务,从而更直接、深入、有效地支持用户检索、处理、利用信息来解决问题的全过程。,数字化技术进一步完善,数字图书馆需要的技术:网络通信、多媒体信息处理、信息的压缩与解压缩、分布式信息处理、信息安全、数据仓库、基于内容的智能检索、超大规模数据计算、用户界面等多种技术。目前亟待解决的关键技术包括:软件重用技术、多语言处理技术、自动识别技术、因特网人工智能技术。数字图书馆的一个基本特征是传输网络化。,4、数字图书馆建设的方向,A、加强数字图书馆建设的战略管理B、加强特色化数字资源建设C、加强数字图书馆建设的合作与协调D、加强数字图书馆的可用性评价E、加强数字图书馆的知识管理F、加强数字图书馆的标准化管理G、加强数字图书馆用户的研究与关系管理,A、加强数字图书馆建设的战略管理,政府出面,统一规划、组织和协调,从战略管理的高度处理好数字图书馆建设中的一些宏观关系问题,加强整体规划和可行性分析。,B、加强特色化数字资源建设,从全局出发,合理建设和使用文献信息资源,不要盲目求新、求全、求高水平,应该加强资源共享,不要重复建库和重复引进造成浪费,要立足本馆、面向全球、形成特色。,C、加强数字图书馆建设的合作与协调通力合作和沟通,立足于一盘棋,打破各自为政、条块分割、重复建设的局面,以网络为依托进行整体化建设。D、加强数字图书馆的可用性评价可用性指的是系统必须具备一定的功能特征从使用上来说,可用性是指用户在一定的环境里完成一定的任务时,系统的性能或作用能否得到有效的体现。数字图书馆的可用性可以分为界面可用性和组织可用性两种,概括为:易学、易记、能有效地满足用户的信息需求、容错、愉悦、服务差异化,E、加强数字图书馆的知识管理,是通过对数字图书馆所拥有的包括信息及知识各种要素在内的所有智力资本进行组织、开发和运营,实现知识创新、知识扩散和知识增值的过程。其主要内容包括:(1)知识创新,(2)知识组织(3)知识开发(4)知识扩散和知识应用,(F)加强数字图书馆的标准化管理,建设数字图书馆主要涉及两方面标准:首先是直接涉及文献信息工作本身的技术标准,包括通用标准、出版专业通用标准和相关标准、图书情报专业通用标准和相关标准、档案专业通用标准和相关标准等;其次是有关计算机、通信和数据库建设的标准。,用户关系管理是通过有关的管理技术和方法对用户进行系统化研究,识别有价值的用户,对用户进行沟通和教育培训等工作,从而改进服务,提高用户的满意度。数字图书馆用户的基本特征是类型比较多、范围广、需求变化大,目前又以团体用户为主,集体统一购买某方面资源的使用权。,(g)加强数字图书馆用户的研究与关系管理,数字图书馆的用户关系管理特点数字图书馆用户关系管理的核心思想是将用户关系作为一种重要的资源,深入对用户的需求进行分析,通过完善服务来满足用户的需求;它将注意力集中于用户发展,以便使潜在用户变成现实客户、现实用户变成忠诚用户;通过满足用户的需求,与用户建立长期稳定的关系,从而不断拓展产品或服务的范围。,数字图书馆的用户关系管理目的在于发现、了解、预测和管理现有或潜在的用户。,(1)数字图书馆用户的需求分析;(2)数字图书馆用户的数据管理和挖掘;(3)数字图书馆用户的分类研究;(4)数字图书馆用户的心理行为研究;(5)数字图书馆的用户教育;(6)数字图书馆用户的服务效果评价;(7)数字图书馆服务方式的改进;(8)数字图书馆用户的人文关怀。,数字图书馆用户研究和关系管理的主要内容,5、网格技术的发展对数字图书馆的影响,A、网格技术的特点及其意义B、网格技术在数字图书馆建设中的应用C、网格对数字图书馆的挑战,A、网格技术的特点及其意义,网格(Grid)是近年来兴起的一种前沿信息技术,是互联网信息技术发展的新趋势。思想来源于电力网格;目的是将计算能力和信息资源象电力网一样通过网络形式方便地传送到用户中;是高性能计算机、数据资源、因特网三种技术的有机组合和发展,它把分布在各地的各种计算机连接起来,进行资源共享。,网格是一个一致、开放、标准的计算环境的信息基础设施,支持聚合地理上广泛分布的高性能计算资源、大容量数据和信息存储资源、软件和应用系统、高速测试和获取系统、以及人力等各种资源的合作问题求解系统的构造。,B、网格技术在数字图书馆建设中的应用,数字图书馆是综合运用多方面高新技术支持的数字信息资源系统,将分散于不同载体、不同地域的数字化信息资源以网络化方式互相联结起来,实现资源共享。数字图书馆通过数字技术进行信息资源的组织和管理,能够储存海量信息,用户可以通过互联网络高效方便地进行查询检索。数字图书馆具有信息资源数字化、信息组织非线性化、结构复杂化、信息传递网络化、服务方式多样化等特点。,网格是高性能计算机、数据源、因特网三种技术的有机组合,它具有高性能、一体化、知识生产、资源共享、异地协同工作、支持开放标准、功能动态变化等优点,为数字图书馆建设提供了有利的条件。,(1)网格为数字图书馆构造统一的平台(2)网格有利于数字图书馆的信息集成(3)网格有利于实现数字图书馆的资源共享(4)网格有利于数字图书馆的海量数据处理(5)网格有利于数字图书馆进行知识管理,C、网格对数字图书馆的挑战,应用移植是网格技术走向应用的最大障碍。网格技术要求用户将原有的系统应用标准化,并平移到新的系统之中。实际上很多现有的数字图书馆应用系统如果被推向网格环境,将面临重新编写应用代码的问题。,数字图书馆建设的指导思想,首先,在资源建设方面要特色化;其次,要增强数字图书馆系统的相互可操作性,以便更好通过网格系统共享资源;再次,进一步完善数字图书馆协同服务,系统模式要走向集成的、多层次的分布模式,实现各类服务组件集成化;第四、不断丰富服务中的交互模型,通过提供各种交互模型使数字图书馆服务能够不断地适应发展变化的要求,更加具有针对性和个性化。,第三部分、数字图书馆的体系结构,1、数字图书馆的信息体系结构2、数字图书馆的技术体系结构3、数字图书馆体系结构比较研究4、数字图书馆系统的结构模型,数字图书馆核心技术:研究数字化信息的有效组织结构,解决各个信息仓储的互操作性,形成数字图书馆基础体系结构以有效地操作大规模的、分布的数字化信息。研究内容:实现在网络环境下跨仓储的、统一高效的访问和检索工具,以及提供一套高效的信息生成、组织和提取技术。最终目标:优化因特网的信息存储结构,提供一致的检索接口,使整个网络成为一个虚拟的、单一的、有组织的、有结构的信息集合,实现跨资源库的无缝信息检索。,体系结构主要解决的问题:数字对象的信息组织结构和分布式信息仓储的组织结构。数字对象:决定着信息组织、处理和利用方式。资源库组织结构的核心:在于建立一个统一的、互操作的、可伸缩的组织框架,将分布互联的信息仓储集成为一个整体,在此基础上提供高质量的信息服务,如屏蔽各仓储的差异、提供统一的服务接口、语义化检索、智能代理等。,对于用户而言,体系结构隐蔽在用户界面以下,良好的体系结构应提供一个透明层,用户甚至感觉不到体系结构的存在。对于数字图书馆实施者而言,体系结构决定数字图书馆中信息的组织方式、系统的软硬件构成、数据操作方法等问题。,一、数字图书馆的信息体系结构,1、信息体系结构基础(1)数字信息的概念、特征;(2)信息体系结构的设计要求、基础。2、数字图书馆的信息体系结构(1)数字图书馆核心服务的主要特征;(2)数字对象系统;(3)仓储服务系统;(4)名录服务系统;(5)索引服务系统;(6)用户接口网关。,数字图书馆的信息体系结构是指在数字图书馆中组织信息的结构;研究如何有效、灵活地在数字图书馆中表现丰富多样的数字化收藏信息;使计算机软件理解数字信息的结构、执行用户所期望的交互式的通用解决方案。,(1)数字信息的概念,数字化信息:各种二进制序列文献信息;数字图书馆的信息是由经过数字技术处理的数据元素组成的,这些元素包括数字对象(digitalobjects)、元数据(metadata)和句柄(handle,也称调度码)。数字对象集(setofdigitalobjects):在数字图书馆中,为了表现数字信息的复杂性,同类的数字对象可组合在一起。所有数字对象符合基本形式,而同类数字对象在基本形式之外还具有其他一些共同结构,这是因为每个数字对象集的结构取决于它所表示的信息内容,而不是数据元素的存储形式。,(2)数字信息的特征,数字图书馆的体系结构中,信息都是以数字信息为基本单位进行存储的,数字信息是按数字对象的形式存储的。相关性:是指与其它数字化资料之间存在的部分/整体、系列等的关联关系。数字格式:目前数字格式大多使用的是可扩展置标语言XML格式。数字对象的变化:数字对象是容易改变的,当现有资料被转换成数字形式时,同一记录可能被转换了好几次。权限与许可权:数字对象的每一个元素都有与之相关的不同版权和许可权。,(3)信息体系结构设计要求,目的:能够合理、规范地组织其丰富的信息资源(一般应按类型组织资源库中的信息),提高信息资源的网络化共享程度,以最大限度地满足用户的信息需求。,给用户及其应用程序以相当的灵活性;藏品结构应易于直接管理、跨库连接及快速查询;能反映经济、社会和法律等构件在信息基础中的发展,特别是应能识别信息是否有价值,可否类化和条件化,可否传递到无国界的非安全网络上等。,(4)信息体系结构基础,数字图书馆信息体系结构基于数据类型、结构元数据和元对象三个概念;数据类型:数据的每一个项目都有一个相关的数据类型,用来描述数据的技术性质,如数据的存储格式或处理方法;结构元数据:是描述数字信息的类型、标题、著者、版本、相关关系及其它特性的元数据,结构性元数据不可再分。,一部诗歌集中的诗歌可以一首一首地用不同的数字对象来描述,一个数字对象对应一首诗;用于描述诗歌集的元对象:是一个将所有诗歌列表的数字对象集;元对象:是为数字对象集提供基准或参照的一种对象。最简单的形式便是数字对象的一个句柄列表或调度码清单。,结构元数据和元对象在描述各类信息需要遵循的规范和协议,所有数据均需给定一个显式明确的数据类型所有元数据均应显式明确编码每个具有知识产权的单独项均应赋予句柄标识或调度码元对象用于聚集数字对象,特别是项目的所有版本和相关的所有结构元数据句柄或调度码用于识别元对象中的列表项,2、数字图书馆的信息体系结构,将分散在异地的数字化信息统一起来,构成一个虚拟的而且具有优化结构的相关有机实体(见图),为数字图书馆的应用提供统一的资源访问,并且能方便地对资源进行管理。,其主要构件:数字对象、句柄(或调度码)和仓储。数字对象存储在仓储中,用句柄来标识,数字对象具有分布式的体系结构。数字图书馆的信息体系结构具有开放性,它将数字图书馆的整个功能划分为一组定义明确的服务,每一种服务都通过一种定义明确的协议来访问。这种结构为数字图书馆提供了其必须具备的基本功能,即一组核心服务,是有效管理的数字对象集(内容)和服务集(功能)的统一。服务集是与存储、发现、检索和保存数字对象相关的服务功能,实现服务集的子系统有:仓储服务系统、名录服务系统、索引服务系统和用户接口网关。,(1)数字图书馆核心服务的主要特征,数字图书馆体系结构中的内容是以数字对象形式存储的;数字对象是用全局唯一的持久名字句柄标识的;句柄用命名服务器注册,用名录服务器解析出句柄标识的数字对象的位置。数字对象的存储和访问是由仓储服务系统来实现。索引服务提供发现数字对象的机制,使用户易于从馆藏中寻找和发现所需的对象。用户接口网关提供以人为中心的数字图书馆的功能入口。,(2)数字对象系统,A、数字对象B、数字对象集,数字对象概念:是数字图书馆体系结构中存储信息的基本逻辑单位和实体,是以一定结构的数字形式来表达信息内容的一种方法,是网络环境下的数字资料。数字对象的组成:元数据、数字资料、句柄或调度码。,元数据:或称属性、关键元数据,关于数字资料的数据,是存储在数字对象中的信息,包含一些识别对象的条件、条款和调度码;功能:管理网络环境下的数字对象,如数字对象的存储、复制和传输等权限的管理。元数据类型:描述性元数据,用于发现和标识一个对象;结构性元数据,为用户显示和导航一个对象,包括该对象的内部组织信息;管理性元数据,描述该对象的管理信息,如创建日期、文件的格式、访问权限、知识产权问题等。,数字资料:是数字图书馆的原型资料,最终用户需要获取的信息内容,即二进制字符串集合。一个数字对象所存储的数字资料可能是经XML置标后的文本,或者是一本电子图书,也可能包括传统图书馆的资料,诸如一些计算机程序或动态的图象。,句柄或调度码:是数字对象和其它因特网资源在全局范围内的永久的唯一标志符,是URN的一种形式。URN(UniformResourceNames)统一资源名称也叫永久名称,其名称应该全球唯一和持久的,且独立于具体的存储位置。句柄可按名称识别对象库中的数字对象或因特网上的资源。句柄的作用:引用由URL列表所定义对象的一个或多个拷贝;提供EMAIL地址。句柄实际上是使用具有唯一性的字符串给数字对象提供一个具有唯一性的名称。句柄组成:类型、命名权威代码(或前缀、项目标识符或后缀。,数字对象集:是同类数字对象的组合,可用来表示一组有关联的对象。如不同版本的程序、不同格式的文本或不同演奏的音乐作品。数字对象集包括组合对象和元对象两种;组合对象的内容包含一组对象;元对象的内容包含一组对象的句柄。,(3)仓储服务系统,仓储也叫数据仓库或资源库,适于保存含有价值信息的材料专门类别的仓库,主要是分布式信息仓储,基本存储单元是数字对象,整个系统就是为了存储、访问、管理数字对象而设计的。仓储服务系统通常是由关系型数据库来管理;应用程序通过资源库提供的库访问协议RAP(repositoryaccessprotocol)来访问资源库,实现存储、访问、复制、移动和删除数字对象等操作。RAP定义了外界访问仓储的最基本的接口。,仓储服务系统采用层次结构,整个体系分为三层:接口层:提供用户接口网关和仓储服务系统的接口,并且提供仓储服务系统与名录服务系统的接口。对象抽象层:是中间管理层,它提供数字对象中与内容无关的服务,为数字对象与其相对应的存储位置之间提供映射及提供常规运行所需的系统服务。对象存储层:仓储中的信息永久保存在对象存储层。,也叫命名系统,是针对长期标识符即数字对象名字的分配、管理及解析的综合系统。包括开放的句柄协议、名字空间和句柄协议的具体实现。名录服务系统具有唯一性、持久性、可扩展性、多实例、国际字符支持、分布式的服务和管理以及安全有效的解析等特点。,(4)名录服务系统,(5)索引服务系统,提供通过查询使用户能够很容易地从馆藏中寻找和发现所需数字对象的机制。系统的资源发现功能由索引服务器和索引管理器两部分合作完成;索引管理器:选择执行查询的索引服务器;索引服务器:收集关于数字对象的信息、执行查询;索引管理器:合并来自索引服务器的结果。,(6)用户接口网关,提供以用户为中心的数字图书馆功能接入点。负责向用户提供查询界面,接受用户的检索请求;将用户的检索请求进行语义规范和语法转换;选择合适的馆藏服务进行搜索和访问;对返回的命中结果根据相关性、资源类型、数据格式等进行过滤、排序或做其他显示处理;一般可支持IE等浏览器。,二、数字图书馆的技术体系结构,1、网络基础设施2、基础应用平台3、数字资源采集加工系统4、异构资源整合系统5、数字资源的管理与存储系统6、资源调度系统7、资源发布和用户检索系统8、联合编目和馆际互借系统9、版权保护与安全认证系统10、电子商务系统,1、网络基础设施,网络应用模式网络操作系统平台和网络组建方案网络管理系统网络技术的选择网络安全,3、数字资源采集加工系统,处理对象:经过文献数字化加工或者资源整合处理过的资源;主要功能:完成对已经数字化的图书、期刊、古籍、静止图象、音频、视频、网上资源以及其他的数字化资源等数字化信息及知识的组织、加工与处理,实现对数字化信息资源的深层加工,支持以标准化和规模化的生产方式进行资源加工,同时对加工的数字化资源要能够多次使用,适应今后的扩展需要。数字资源的加工格式必须标准化;系统要求基于XML的资源,同时支持中文元数据规范,具备与数字版权保护、电子商务、调度等系统的接口,包括全文抽词建立索引、网上抓取、压缩、自动文摘生成、自动处理大量的图片、自动分类和摘要、对于多媒体信息特征的抽取等功能。,4、异构资源整合系统,整合各文献单位拥有的数字资源和历史资源到数字图书馆中;实现与其他系统互操作或交换,形成一个全面的数字资源库是数字图书馆资源建设的基础;不仅全面整合某一部门原有的分布在不同异构平台的高质量数字资源,还整合分布在若干不同部门多个系统中的各种类型的数字资源库;可以同时从数字资源的封装及异构系统间的协议两个途径实现;,在完成核心公共模块的前提下,先整合核心元数据,然后扩展到元数据集、数字对象;先整合系统的内部资源,然后整合其他系统的资源;先整合具有一定规则的数据库资源,然后整合不规则的其他数字资源。,7、资源发布和用户检索系统,将加工成形的数字资源发送到资源管理存储系统的元数据库和数字对象库中;通过用户界面与检索系统向用户提供数字资源的查询服务;系统涉及网络协议、媒体特性、易用性、信息导航和语言转换等多方面技术;用户检索和服务系统由应用界面系统、元数据搜索系统和数字资源存取系统三部分组成。,8、联合编目和馆际互借系统,数字图书馆环境下的馆际互借系统,要从以传统介质为主的传递方式过渡到兼顾印刷性文献和数字资源两方面的方式。,9、版权保护与安全认证系统,通过加密技术和数字水印技术来进行有效的版权保护,同时通过安全认证技术来确保数字图书馆系统中数字对象的安全。认证是用来识别个人、网络上的机器或机构;数字图书馆系统需要三类认证:用户认证、计算机认证、图书馆资料的认证;,用户认证,数字图书馆向用户提供“用户ID”和口令,主要目的是提供访问控制和不可抵赖的作用;用户认证方法按其层次不同可以根据用户持有的证件、用户密码、用户持有的生物特征(如指纹、声音、虹膜等)三种因素提供认证;,计算机认证:处理重要信息或机密信息等的系统需要知道哪些计算机与之相连,可通过因特网的IP地址进行认证,但IP地址容易被盗用,这种认证不大安全;,图书馆资料的认证:用户需要确信接收到的是一条可信版本的信息,而不是被无意或有意修改以后的信息,可通过为数字信息附加数字签名(DigitalSignature)的技术来实现,数字签名能够保证数字信息从签名计算开始起就没有被修改过。,三、数字图书馆体系结构比较研究,1、基于三层客户机/服务器模式的数字图书馆结构2、分布式数字图书馆体系结构3、基于代理协作的数字图书馆体系结构4、数字图书馆体系结构的评价标准,1、基于三层C/S模式的数字图书馆结构,三层体系结构指的是组成一个应用构件的三个逻辑层面;三层体系结构中,系统的主要工作是由服务器来承担,WEB应用服务器和数据库服务器。WEB应用服务器负责WEB页面的管理、组织、传递和数据库查询请求的提出,而数据库服务器则负责接受WEB服务器的查询请求并提出运算处理结果。,三角形体系结构采用了C/S模型,服务器由图书馆服务器和对象服务器组合承担。数据层的数据直接返回客户端,无需中间的传递过程,用户只能访问图书馆服务器,保证了数据的安全性,同时减少了数据复制和传输的次数,提高了系统性能。,2、分布式数字图书馆体系结构,分布式数字图书馆可分为:基于分布式数字对象的分布式数字图书馆;基于外部协调的分布式数字图书馆两种类型。基于分布式数字对象的分布式数字图书馆分布式数字图书馆体系结构由数据库资源的描述、用户接口、调度系统、查询系统和对象库五部分组成,或者说是由数字对象、资源库、索引服务器、收集服务器、代理服务器、用户界面、句柄服务器等七部分组成。,3、基于代理协作的数字图书馆体系结构,代理(Agent)是具有知识和能力,为实现某种目标而持续运行的实体。代理具有自主性、社会性、交互性、进化性、可通信性等基本特征。代理协作是由多个代理组成的,这些代理具有一致的通信接口,通过代理本身的求解活动和相互之间的交互活动即协商组成协作小组共同完成任务,从而实现系统整体和每个代理的功能或目的。,基于代理协作的数字图书馆体系结构的最大特点:模块性和灵活性;整个数字图书馆主要由各式各样的代理组成;代理具有高度的自主性,通过相互之间的协作完成复杂的任务;可以增加新的代理或撤消已有的代理,满足数字图书馆内容和功能不断变化扩展的需求。,4、数字图书馆体系结构的评价标准,开放性互操作性扩展性可伸缩性,四、数字图书馆系统的结构模型,这个面向对象的、分布式的网络结构模式是由用户界面、预处理系统(调度系统)、查询系统、图书馆服务器和对象库五个部分组成的数字图书馆系统,第四部分数字图书馆的服务,一、数字图书馆服务的特点二、数字图书馆的虚拟参考服务三、数字图书馆的主动推送服务四、数字图书馆的定题服务五、数字图书馆的个性化信息服务六、数字图书馆用户培训,1、数字图书馆服务的特点2、数字图书馆服务的内容,一、数字图书馆服务的特点,1、数字图书馆服务的特点,数字图书馆建设的最终目标是为用户提供数字化服务。数字图书馆提供的服务不仅包括传统图书馆服务在数字环境中的实现;还提供包括信息库、教育环境、参考服务、个性化服务等在内的服务平台。与传统图书馆相比,数字图书馆有其自身的特点,同时数字图书馆服务由于高技术的支撑,在服务对象、服务内容、服务方式手段等多方面都具有了新的特点。,如在线阅读与下载、电子文献传递、离线阅读与打印、以及以网站服务形式提供的服务,如浏览、查询、最新信息报道服务等;,服务对象社会化、服务内容数字化和多样化、服务项目深化、服务手段网络化、服务方式多样化和主动化、服务资源共享化、服务流程一体化、服务的产业化。,2、数字图书馆服务的内容,数字技术提供了根本改变图书馆的用户对象、开放时间,以及所提供的服务类型的可能性,数字图书馆比传统图书馆既扩大了服务的内容又可增强服务功能。(1)检索服务(2)参考咨询服务(3)信息筛选和选择型传播服务(4)用户教育和培训,形式包括:提供多层次的咨询服务接口,对用户的网络信息检索过程进行现场智能化引导,针对用户的信息需求进行智能化推送服务,设立交互式咨询台,直接解答用户输入的疑难问题。,二、数字图书馆的虚拟参考服务,1、虚拟参考服务的概念2、数字图书馆虚拟参考服务的模式,1、虚拟参考服务的概念,(1)虚拟参考服务的概念(2)虚拟参考服务的实质(3)虚拟参考服务的步骤(4)虚拟参考服务的特征,虚拟咨询服务:或称数字参考服务、网络参考咨询服务,指在数字图书馆环境下,图书馆运用各种信息技术和设备,由虚拟咨询馆员以馆藏数字化资源和网络虚拟资源为基础,面对虚拟用户以电子的方式(e-mail、chat、webform等)提出各种咨询问题进行实时咨询服务的过程,是一种在线咨询方式;与传统参考咨询服务相比,有效超越时空的限制,以“不见面的面对面”方式,使咨询人员和服务对象无论在何处,只要能登录咨询站点就可以进行交互式交谈,这对所有的上网者都是平等一致的。网络资源的共享性又使咨询解答后的问题可以为更多的读者提供参考。服务内容也主要针对使用方法、应用环境各不相同的数据库、检索工具等网络资源。,专家系统结构图:专家系统由两大部分组成:开发环境、咨询环境四大主要部件:知识库、推理机、用户接口、动态库,知识获取,人机接口,解释机构,推理机,专家,用户,知识库,文档,动态库,数据库,分布式联合虚拟参考咨询平台,区域咨询网络,区域咨询网络,区域咨询网络,全国咨询网络,总咨询台,咨询台,调度系统,分布式联合虚拟参考咨询平台(续),区域咨询网络,VRS特征首先,VRS中用户的提问和专家的回答采用了当今主流的网络信息交流工具;其次,VRS是以多主题领域的信息专家直接响应用户的各种提问,是一种人工协调的提问回答服务(questionandanswerservices)。专家对用户提问的回答可以是直接、事实性、知识性的最终答案,也可以是印刷版、数字化的源信息的指示线索,或者是两者的有机结合。,必须具备的基本条件计算机网络环境数字化参考咨询服务系统数字化参考咨询源资深的参考馆员。,虚拟参考服务的工作机制第一步,问题接收第二步,提问解析和分派第三步,专家生成答案第四步,答案发送第五步,跟踪,2、数字图书馆虚拟参考服务的模式,(1)静态的网上咨询服务(2)基于电子邮件的虚拟参考咨询服务(大致有两种形式)(3)基于实时交互技术的虚拟参考咨询(4)网络合作化的数字参考咨询服务,内容包括借阅须知、书目查询、查找资料、网上新书通报、图书馆布局、常用资源介绍、学科导航、读者服务与读者指南、常见问题解答(FrequentlyAskedQuestion,简称FAQ)数据库等。,最简单的形式通过链接直接进入,读者根据自己的需要书写信件内容发送即可,参考咨询部门收到提问后,通过各种途径,将取得的直接结果信息或者是获取这些信息的途径与方法仍然通过E-mail传递给读者。另外一种服务形式是幕后的参考咨询馆员可以呈现在读者的眼前,读者可根据需求有针对性地选择咨询专家,读者填写提问表单提交或发送,问题通过E-mail传递给相应的参考咨询馆员,不久读者就能得到满意的答复。,采用的应用技术主要是网络聊天室、网络共享白板、网络会议和网络呼叫中心,三、数字图书馆的主动推送服务,1、信息推送技术2、信息推送技术的服务形式3、信息推送的实现方式4、推送技术的工作流程5、数字图书馆中的推送服,1、信息推送技术,推送push技术:推送应用于B/S或C/S结构,是服务器主动向客户机传送信息。推送技术实质上是指一系列的软件,这种软件可以根据用户提交的用户兴趣文档,自动搜集用户最可能感兴趣的信息,然后根据用户指定的时间间隔,将信息报送到用户的计算机上。拉开pull技术:信息传输方式是Browser发送服务需求,在所属数据库中进行检索,查找到用户所需的信息后再把信息传送给Browser所属的计算机。,推送技术的核心思想:建立一个信息代理机制,把由客户端担负的责任转给服务器,由服务器将用户定制好的感兴趣的网上信息用推送或网播的方式直接传送到用户面前。,2、信息推送技术的服务形式,(1)通知(2)提要(3)自动拉出(4)自动推送,3、信息推送的实现方式,(1)邮件方式(2)基于CGI的推送方式(3)客户代理方式(4)频道方式,邮件方式:用电子邮件方式主动将有关信息推送给已在列表中注册的用户。基于CGI的推送方式:实质意是拉取技术,基本原理是:Web站点把HTML表单嵌入web页面中提供给用户,用户在浏览页面时填写并提交进行订阅。客户代理方式:通过代理服务器来收集用户兴趣信息,并与信息提供商建立联系,遍历相关站点,收集用户感兴趣的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论