第五章数字图书馆的构建_第1页
第五章数字图书馆的构建_第2页
第五章数字图书馆的构建_第3页
第五章数字图书馆的构建_第4页
第五章数字图书馆的构建_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、幻灯片幻灯片第一节第一节 数字图书馆的计算机技术数字图书馆的计算机技术第二节第二节 数字图书馆的体系结构数字图书馆的体系结构第三节第三节 数字对象唯一标识符系统数字对象唯一标识符系统第四节第四节 数字图书馆开发平台数字图书馆开发平台幻灯片第一节第一节 数字图书馆的计算机技术数字图书馆的计算机技术 一一 、Web技术及应用技术及应用n什么是什么是Web?nWorld Wide Web, WWW, 万维网万维网nWeb是建立在客户机是建立在客户机/服务器结构之上,以服务器结构之上,以HTML语言和语言和HTTP协议为基础,能够提供协议为基础,能够提供面向各种面向各种Internet服务的、一致用户

2、界面的服务的、一致用户界面的信息系统。信息系统。一一 、Web技术及应用技术及应用nWeb起源起源n1991年,年,WWW创始人,欧洲核物理实验室创始人,欧洲核物理实验室(CERN)的贝纳斯的贝纳斯-李(李(Tim Berners-Lee)完)完成了世界上第一个成了世界上第一个Web的开发的开发n1993年年2月,美国国家超级计算应用中心月,美国国家超级计算应用中心(NCSA)推出了)推出了Mosaic软件,解决了文字软件,解决了文字显示、连接和图像显示问题,使显示、连接和图像显示问题,使WWW技术技术得到了空前的发展和应用得到了空前的发展和应用n网景公司,网景公司,IE一一 、Web技术及应

3、用技术及应用nWeb服务的特点:服务的特点:n超文本、多媒体超文本、多媒体n与平台无关性与平台无关性n直观、易于使用的用户界面直观、易于使用的用户界面nWeb是分布式的是分布式的nWeb是动态的、交互的是动态的、交互的p.76一一 、Web技术及应用技术及应用nWeb的体系结构的体系结构n客户机客户机/服务器结构服务器结构n统一资源定位符统一资源定位符URLnHTTP协议协议nWeb与数据库技术与数据库技术nCGI ASP PHP JSPnODBC JDBC ADOp.79一一 、Web技术及应用技术及应用n统一资源定位器(统一资源定位器(Uniform Resource Locator)是全

4、球万维网系统服务器资源)是全球万维网系统服务器资源的标准寻址定位编码,用于确定资源相的标准寻址定位编码,用于确定资源相应的位置及所需要检索的文档(件)应的位置及所需要检索的文档(件)nURL的结构的结构n所使用的因特网文档传送协议(如:所使用的因特网文档传送协议(如:http、ftp、telnet、file等)等)n标识要检索的主机代号(域名或标识要检索的主机代号(域名或IP地址)地址)n检索文档在主机中的路径及文件名检索文档在主机中的路径及文件名一一 、Web技术及应用技术及应用n常见的常见的URLn网页,网页,http:/n网页,网页,http:/ 、Web技术及应用技术及应用 IPIP地

5、址地址 :00 域名域名 :一一 、Web技术及应用技术及应用nhttp工作原理工作原理:断开连接断开连接服务器应答服务器应答客户请求客户请求客户连接客户连接(多次多次)、建立、建立WebWebBrowserBrowserWebWebServerServer提出各种提出各种InternetInternet请求,并解释请求,并解释HTMLHTML文档文档以以HTMLHTML格式存放的多格式存放的多媒体资源媒体资源HTTPHTTP协议协议假设用户点击一个指向http:/ 的IP地址;(3)DNS返回202.194.15. .22;(4)浏览器向202. .194. .15.

6、.22的默认端口80请求建立TCP连接;(5)浏览器发出GET/index. .html;(6) 服务器发送文件index. .html;(7)TCP连接被释放;(8)浏览器显示index. .html的全部HTML内容。注意:index. .html文档中也可能包含一些图象、视频、声音等文件一一 、Web技术及应用技术及应用nWeb数据库访问技术数据库访问技术访问结果访问结果数据库访问数据库访问HTML页页请求信息请求信息HTML页页HTTP请求请求BrowserWebServerCGI Program数据库数据库Web应用程序应用程序ODBC开放开放数据库连接数据库连接DBMSJava A

7、ppletJDBC驱动程驱动程序序Web Server一一 、Web技术及应用技术及应用nWeb开发技术开发技术客户端客户端n脚本脚本 script JavaScript、VBScriptn组件组件 JavaBeans、ActiveXnDHTML(CSS脚本脚本HTML4.0)nJava AppletnWeb开发技术开发技术服务器端服务器端nCGI(公共网关接口公共网关接口)n服务器端脚本服务器端脚本 ASP、PHP、JSPnServlet技术技术一一 、Web技术及应用技术及应用nASP工作模型工作模型将查询结果返将查询结果返回回Web Server向向Web Server 提出提出数据库查

8、询请求数据库查询请求Web Server传递结传递结果(果(HTML)Web Server通通过过ODBC访问访问数据库数据库Web Server(IIS)DataBaseServerASP客户端客户端BrowserJSP运行模式通过通过ODBC或或JDBC访问数访问数据库据库客户机客户机BrowserJSP和和Serverlet执行引擎执行引擎Java BeanDataBaseServerWeb Server二二 、软件计算模式、软件计算模式n网络计算经历四个发展阶段网络计算经历四个发展阶段:n终端终端/主机模式、网络主机模式、网络/文件服务器模式、文件服务器模式、客户(浏览器)客户(浏览器

9、)/服务器模式、服务器模式、peer-to-peer模式模式 。二二 、软件计算模式、软件计算模式n两层客户两层客户/服务器结构服务器结构nB/S结构结构n多层客户多层客户/服务器结构服务器结构n几个要点几个要点n表示层、业务逻辑层与数据层表示层、业务逻辑层与数据层n开放与标准开放与标准n通用客户端与专用客户端通用客户端与专用客户端n客户端管理与维护客户端管理与维护二二 、软件计算模式、软件计算模式展现层展现层数据(资源)层数据(资源)层应用逻辑层应用逻辑层应用分层体系架构应用分层体系架构二二 、软件计算模式、软件计算模式客户机展现层展现层应用逻辑层应用逻辑层数据(资源)数据(资源)层层服务器

10、两层客户机两层客户机/服务器架构服务器架构二二 、软件计算模式、软件计算模式n中间件基本概念中间件基本概念:nIDC:IDC:中间件是一种独立的系统软件或服务程中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通器的操作系统之上,管理计算资源和网络通信。信。二二 、软件计算模式、软件计算模式n中间件分类中间件分类:n1 .1 . 数 据 库 中 间 件 (数 据 库 中 间 件 ( D MD M , D a t a b a

11、s e D a t a b a s e MiddlewareMiddleware)n2.2.远程过程调用中间件(远程过程调用中间件(RPCRPC,Remote Remote Procedure CallProcedure Call)n3.3.面向消息的中间件(面向消息的中间件(MOMMOM,Message Message Oriented MiddlewareOriented Middleware)n4.4.基于对象请求代理(基于对象请求代理(ORBORB,Object Object Request BrokerRequest Broker)的中间件)的中间件n5.5.事务处理中间件(事务处理

12、中间件(TPMTPM,Transaction Transaction Processing MonitorProcessing Monitor)二二 、软件计算模式、软件计算模式n应用服务器:特殊的中间件应用服务器:特殊的中间件n从概念上讲,应用服务器可以归于对象中间从概念上讲,应用服务器可以归于对象中间件的范畴,实际上,可以把应用服务器软件件的范畴,实际上,可以把应用服务器软件看成是中间件的看成是中间件的2121世纪版本,或者称做世纪版本,或者称做n n层层计算。之所以说它是一种特殊的中间件,是计算。之所以说它是一种特殊的中间件,是因为应用服务器的作用除了管理客户端请求因为应用服务器的作用除

13、了管理客户端请求与数据库之间的通信之外,同时具有跨系统与数据库之间的通信之外,同时具有跨系统平台(数据库、操作系统)的能力。平台(数据库、操作系统)的能力。 二二 、软件计算模式、软件计算模式客户机中间件服务器三层客户机三层客户机/服务器架构服务器架构二二 、软件计算模式、软件计算模式多层客户机多层客户机/服务器架构服务器架构二二 、软件计算模式、软件计算模式多层多层客户机客户机/服务器架构服务器架构三三 、数据仓库与数据挖掘技术、数据仓库与数据挖掘技术n数据仓库概念(数据仓库概念(InmonInmon)n支持管理决策过程的、面向主题的、集成的、随时支持管理决策过程的、面向主题的、集成的、随时

14、间变化的、但信息本身相对稳定的数据集合。间变化的、但信息本身相对稳定的数据集合。n特征特征n主题与面向主题主题与面向主题n数据的集成性数据的集成性n数据是随时间不断变化的数据是随时间不断变化的n数据的相对稳定性数据的相对稳定性n关键技术关键技术n数据抽取数据抽取n存储和管理存储和管理n数据表现数据表现三三 、数据仓库与数据挖掘技术、数据仓库与数据挖掘技术n数据仓库数据仓库数据方块数据方块DateProductCountrysumsum TVVCRPC1Qtr2Qtr3Qtr4QtrU.S.ACanadaMexicosumOverall sales of TVs in the USin 3rd

15、quarter数据仓库数据仓库三三 、数据仓库与数据挖掘技术、数据仓库与数据挖掘技术n数据挖掘的概念数据挖掘的概念n从数据中抽取有价值的信息,其目的是帮助决策者从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这寻找数据间潜在的关联,发现被忽略的要素,而这些信息对于预测趋势及决策行为是十分有用的些信息对于预测趋势及决策行为是十分有用的n数据挖掘的模式(数据挖掘的模式(P97P97)n分类模式分类模式n回归模式回归模式n时间序列模式时间序列模式n聚类模式聚类模式n关联模式关联模式n序列模式序列模式三三 、数据仓库与数据挖掘技术、数据仓库与数据挖掘技术三三 、数

16、据仓库与数据挖掘技术、数据仓库与数据挖掘技术数据仓库与数据挖掘之间的关系数据仓库与数据挖掘之间的关系n数据仓库是数据挖掘的基础数据仓库是数据挖掘的基础n数据挖掘促进并指导数据仓库的建设数据挖掘促进并指导数据仓库的建设三三 、数据仓库与数据挖掘技术、数据仓库与数据挖掘技术n数据仓库、数据挖掘技术对数字图书馆数据仓库、数据挖掘技术对数字图书馆提供以下方面的支持:提供以下方面的支持:n数据收集、存储和组织数据收集、存储和组织n数据分析和知识挖掘数据分析和知识挖掘n决策支持决策支持系统管理员系统管理员数据仓库数据仓库搜索引擎搜索引擎Internet元信息库元信息库浏览浏览 检索检索 推送推送WEB服务

17、器服务器数据以及业务演示平台数据以及业务演示平台用户用户源数据库源数据库1特色源数据库特色源数据库资源整理资源整理 分类分类 编目编目 挖掘挖掘用 户 信用 户 信息库息库源数据库源数据库2内容索引库内容索引库数据挖掘数据挖掘数据提取和过滤数据提取和过滤 数据概括和聚类数据概括和聚类文档库文档库主 题主 题 元元数据数据目录目录系统管理系统管理资料播发插件资料播发插件交互系统交互系统虚拟小组虚拟小组基于数字图书馆的领导决基于数字图书馆的领导决策信息咨询服务系统构成策信息咨询服务系统构成幻灯片第二节第二节 数字图书馆的体系结构数字图书馆的体系结构幻灯片 数字图书馆的体系结构是数字图书馆建设过程数

18、字图书馆的体系结构是数字图书馆建设过程中应首先考虑和解决的问题,是数字图书馆建中应首先考虑和解决的问题,是数字图书馆建设的基础和难点之一。体系结构主要解决的问设的基础和难点之一。体系结构主要解决的问题是数字对象的信息组织结构和分布式信息仓题是数字对象的信息组织结构和分布式信息仓储的组织结构。数字对象决定着信息组织、处储的组织结构。数字对象决定着信息组织、处理和利用方式。资源库组织结构的核心在于建理和利用方式。资源库组织结构的核心在于建立一个统一的、互操作的、可伸缩的组织框架立一个统一的、互操作的、可伸缩的组织框架,将分布互联的信息仓储集成为一个整体,将分布互联的信息仓储集成为一个整体 幻灯片

19、数字图书馆的建设到目前为止,并不存在一个数字图书馆的建设到目前为止,并不存在一个通用的数字图书馆体系结构,原因在于数字图通用的数字图书馆体系结构,原因在于数字图书馆收藏内容、规模大小、服务对象、知识产书馆收藏内容、规模大小、服务对象、知识产权等技术和非技术因素使数字图书馆体系结构权等技术和非技术因素使数字图书馆体系结构设计多样化,此外数字图书馆所采用的现代信设计多样化,此外数字图书馆所采用的现代信息技术和相关标准也在不断发展。息技术和相关标准也在不断发展。 一、数字图书馆体系结构设计原则一、数字图书馆体系结构设计原则 1 1、开放性。开放性。基本体系结构简单化基本体系结构简单化 ,功能模,功能

20、模块化,选取成熟的通用的标准和协议块化,选取成熟的通用的标准和协议 。 2 2、互操作性。互操作性。DLDL要向用户屏蔽分布的、异构要向用户屏蔽分布的、异构的各个的各个DLDL间的差别,提供一致化的检索和服间的差别,提供一致化的检索和服务。务。 3 3、扩展性。扩展性。DLDL的体系结构应该是灵活的和可的体系结构应该是灵活的和可扩展的,能随时接纳新的仓储和服务,而不扩展的,能随时接纳新的仓储和服务,而不需要大的改动。需要大的改动。 4 4、可伸缩性。可伸缩性。一个好的数字图书馆体系结构一个好的数字图书馆体系结构的设计必须能够适应不同规模的系统,使不的设计必须能够适应不同规模的系统,使不同规模的

21、系统都能够获取最佳的效率。同规模的系统都能够获取最佳的效率。 幻灯片K-WK-W体系结构体系结构(kahn-Wilenskykahn-Wilensky结构)结构)该数字图书馆的体系结构是由罗伯该数字图书馆的体系结构是由罗伯特特.卡恩(卡恩(Robert E.Kahn)和罗伯)和罗伯特特.威兰斯基(威兰斯基(Robert Wilensky)在)在1995年发表的年发表的分布式数字对象的分布式数字对象的框架框架(A Framework for Distributed Digital Object Services)一文中提出的。一文中提出的。幻灯片用户界面用户句柄系统资源调度系统唯一标识符系统名录

22、服务系统数据仓储元数据库仓储存取协议资源加工系统元数据检索系统解析句柄数据仓储提取元数据查询数字对象数字对象幻灯片 数字图书馆体系结构中的内容是以数字对象形数字图书馆体系结构中的内容是以数字对象形式存储的,数字对象是用全局唯一的持久名字式存储的,数字对象是用全局唯一的持久名字句柄标识的,句柄用命名服务器注册,用名句柄标识的,句柄用命名服务器注册,用名录服务器解析出句柄标识的数字对象的位置。录服务器解析出句柄标识的数字对象的位置。数字对象的存储和访问是由仓储服务系统来实数字对象的存储和访问是由仓储服务系统来实现。检索服务提供发现数字对象的机制,使用现。检索服务提供发现数字对象的机制,使用户易于从

23、馆藏中寻找和发现所需的对象。用户户易于从馆藏中寻找和发现所需的对象。用户接口网关提供以人为中心的数字图书馆的功能接口网关提供以人为中心的数字图书馆的功能入口。入口。 幻灯片二、数字对象(二、数字对象(Digital Object)数字对象是数字图书馆体系结构中存储信息的基本逻辑单位和实体,是以一定结构的数字形式来表达信息内容的一种方法,是网络环境下的数字资料。可以说数字图书馆是由数字对象构筑而成的,数字图书馆中的信息以数字对象形式存储、访问、传播和管理,数字对象存放于仓储中。数字对象由数字资料、元数据和数字对象由数字资料、元数据和唯一标识符组成。唯一标识符组成。 数字资料 元数据:或称属性、关

24、键元数据。 唯一标识符:是数字对象和其它因特网资源在全局范围内的永久的唯一标志符。在-W体系结构中唯一标识符被称为Handle(抓柄,句柄),但实际上存在多种唯一标识符体系,例如、等。幻灯片三、句柄和句柄系统三、句柄和句柄系统数字图书馆是由各种各样的成分组成的。这数字图书馆是由各种各样的成分组成的。这些成分包括人、计算机、网络、仓储、数据些成分包括人、计算机、网络、仓储、数据库、搜索系统、库、搜索系统、Web服务器、数字对象、数服务器、数字对象、数字对象的元素、书目记录等。记录这些组成字对象的元素、书目记录等。记录这些组成成分需要一种进行识别的系统化的方法。成分需要一种进行识别的系统化的方法。

25、CNRI (Corporation for National Research Initiatives,美国国家研究推进机构),美国国家研究推进机构)开发了一组开发了一组通用的标识符,叫做句柄,以及一个用于管通用的标识符,叫做句柄,以及一个用于管理理Internet上句柄的计算机系统,叫做句柄系上句柄的计算机系统,叫做句柄系统。统。幻灯片(一)句柄句柄(handle)也称为调度码:是数字对象和其他因特网资源在全局范围内的永久的惟一标志符,是URN(统一资源名称)的一种形式,该名称独立于具体的存储位置。幻灯片句柄的定义如下:句柄的定义如下:Handle:=Handle Naming Author

26、ity/Handle Local Namehdl: cnri.dblib/magazine指出指出该字该字符串符串是是hdl:hdl:类型类型前缀,命名前缀,命名授权授权(NA),命名权威代命名权威代码,命名机码,命名机构构后缀,后缀,项目标项目标识符识符幻灯片句柄由命名授权创建,其管理设备被授权创句柄由命名授权创建,其管理设备被授权创建和编辑句柄。命名授权的名称由一个或多建和编辑句柄。命名授权的名称由一个或多个 用 句 点 分 隔 的 字 符 串 组 成 。 例 如 :个 用 句 点 分 隔 的 字 符 串 组 成 。 例 如 :cnri.dblib loc.ndlp.amrlp 10.12

27、345 创建命名授权是按层次授权的。例如,全球创建命名授权是按层次授权的。例如,全球句柄注册中心(句柄注册中心(CNRI管理全球句柄注册中管理全球句柄注册中心)创建高层命名机构心)创建高层命名机构“loc”,供国会图书,供国会图书馆使用。馆使用。“loc“的管理者所创建的的管理者所创建的“loc.ndlp”供 国 家 数 字 图 书 馆 项 目供 国 家 数 字 图 书 馆 项 目 N D L P 使 用 ,使 用 ,“loc.ndlp”的管理者所创建的命名授权的管理者所创建的命名授权“loc.ndlp.amrlp”供供热阴极射线管消费汇热阴极射线管消费汇编编一书使用。一书使用。幻灯片(二)句

28、柄系统(二)句柄系统也叫名录服务系统、命名系统、调度系统。是针对长期标识符即数字对象名字的分配、管理及解析的综合系统。系统在整个因特网范围内为用户提供安全的名录解析和分布式的句柄管理服务,提供手段使句柄与数字对象关联,使地址与数字对象关联,并对系统中的人员、计算机资源、网络、数据仓库、数字对象、Web服务器等进行识别、监控和调度等。幻灯片在这个例子中,句柄是“cnri.dlib/july95.arms“,它确认D-Lib杂志中一篇文章。每个数据字段由两部分组成,第一部分是数据类型,第二部分是数据。cnri.dlib/july95.armsURLhttp:/www.dlib.olg/dlib/j

29、uly95/07armo.hlrmRAPrepository.dlib.olg幻灯片四、数据仓储四、数据仓储仓储也叫数据仓库或资源库。仓储是仓储也叫数据仓库或资源库。仓储是一种专门类别的仓库,特别适于保存一种专门类别的仓库,特别适于保存包含有价值信息的材料。包含有价值信息的材料。仓储是一个仓储是一个可通过网络访问的存储系统,数字对可通过网络访问的存储系统,数字对象存入于该系统中,供访问和检索。象存入于该系统中,供访问和检索。一个数字对象可储存于几个仓储里。一个数字对象可储存于几个仓储里。仓储负责安全存储。仓储负责安全存储。幻灯片仓储具有的机制支持往它的收藏中添仓储具有的机制支持往它的收藏中添加

30、新的数字对象,使用仓储访问协议加新的数字对象,使用仓储访问协议(Repository Access ProtocolRepository Access Protocol)进)进行访问。仓储有正式、唯一的名字,行访问。仓储有正式、唯一的名字,由一个全局命名授权分配和批准。由一个全局命名授权分配和批准。1仓储仓储实现的三层结构 仓储外层。它是仓储与外界的接口部分,它实现了仓储访问协议(),实现了数字对象的内外格式转换,并管理用户权限和访问许可。 永久存储层。仓储中的信息保存在永久存储层。永久存储层的实现对外界是完全透明的。 对象管理层。它在永久存储层所提供的服务和仓储外壳层所要求的面向对象功能之间

31、提供一种接口,并提供数字对象及其所在位置之间的映射。 幻灯片2 2仓储访问协议仓储访问协议在K-W结构中仓储通过仓储访问协议RAP与外界交互,也就是说所有访问仓储的操作活动,都须先执行RAP协议。RAP支持存放数字对象,通过句柄访问数字对象和有关的仓储服务。幻灯片 确 认 句 柄 已 在 句 柄 系 统 中 注 册确 认 句 柄 已 在 句 柄 系 统 中 注 册(VerifyHandle)访问仓储元数据(访问仓储元数据(AccessRepoMeta)确认仓储中已存有一个指定句柄的数字对象确认仓储中已存有一个指定句柄的数字对象(Verify-DO)访问一个指定数字对象的元数据(访问一个指定数字

32、对象的元数据(Access Meta)访问数字对象(访问数字对象(Access-DO)在一个仓储中存入一个数字对象(在一个仓储中存入一个数字对象(Deposit-DO)从一个仓储中删除一个数字对象(从一个仓储中删除一个数字对象(Delete-DO)编辑一个数字对象的元数据(编辑一个数字对象的元数据(MutateMeta)编辑一个数字对象(编辑一个数字对象(Mutate-DO)幻灯片五、五、 元数据检索系统元数据检索系统元数据检索系统,作为元数据组织和检索体系,支持通过一定搜寻协议从各个仓储备搜集、标引和组织数字对象元数据及句柄,支持对这些元数据的基本检索,向用户界面提供符合检索要求的数字对象元

33、数据记录及句柄。 幻灯片六、用户界面六、用户界面用户界面作为用户检索和存取数字对象的界面系统,支持对元数据的检索和对数字对象的存取,往往直接利用通用界面系统(例如标准浏览器)。 幻灯片第三节第三节 数字对象唯一标识符系统数字对象唯一标识符系统 幻灯片一、数字对象唯一标识符一、数字对象唯一标识符数字对象唯一标识符性能要求数字对象唯一标识符性能要求(一一) (1)(1)唯一性唯一性,即标识符在指定名字域内必,即标识符在指定名字域内必须是唯一和明确的,定义且只定义一个须是唯一和明确的,定义且只定义一个数字对象,但一个数字对象可拥有多个数字对象,但一个数字对象可拥有多个标识符;标识符; (2)(2)国

34、际性国际性,即标识符必须在国际范围内,即标识符必须在国际范围内或整个因特网上有效;或整个因特网上有效; (3)(3)应用独立性应用独立性,即标识符必须作为一种,即标识符必须作为一种公共标识符,独立于任何具体的应用和公共标识符,独立于任何具体的应用和应用系统;应用系统; (4)(4)永久性永久性,即标识符的生存周期必须是,即标识符的生存周期必须是无限的,尽管它所定义的数字对象的生无限的,尽管它所定义的数字对象的生命周期可能是有限的;命周期可能是有限的;数字对象唯一标识符性能要求数字对象唯一标识符性能要求(二二) (5)(5)可计算性可计算性,即标识符可由计算机处,即标识符可由计算机处理,最好是数

35、字表示或可转换成数字理,最好是数字表示或可转换成数字表示,最好内含校验码;表示,最好内含校验码; (6)(6)标识能力强标识能力强,即标识符的设计应保,即标识符的设计应保证标识系统可唯一地和永久地标识所证标识系统可唯一地和永久地标识所有需要标识的数字对象有需要标识的数字对象 ; (7)(7)支持现有系统支持现有系统,即标识符的设计应,即标识符的设计应支持现有的命名系统;支持现有的命名系统; (8)(8)可读性可读性,即标识符应能被人直接释,即标识符应能被人直接释读。读。数字对象唯一标识符类型数字对象唯一标识符类型从唯一标识符的形式上看从唯一标识符的形式上看,可以简单将其划,可以简单将其划分为数

36、字性、字符性和数字字符混合性。分为数字性、字符性和数字字符混合性。从功能上看可以将其分为从功能上看可以将其分为:掩码(掩码(opaque stringopaque string):纯粹是为了唯一):纯粹是为了唯一标识一个人或事物,号码本身无法分解为任标识一个人或事物,号码本身无法分解为任何有意义的信息。何有意义的信息。意码意码(meaningful code)(meaningful code):对号码中每个数:对号码中每个数字或字符赋予了具体的含义,这些含义由制字或字符赋予了具体的含义,这些含义由制定标准的机构事先确定。定标准的机构事先确定。 混合号码则是上述两种号码的结合,这种混混合号码则是

37、上述两种号码的结合,这种混合号码的某一部分具有明确的含义和内容,合号码的某一部分具有明确的含义和内容,可以方便地被机器和人识别。可以方便地被机器和人识别。幻灯片唯一标识符范例唯一标识符范例 URL、PURL、URN、URI等。等。幻灯片URL(Uniform Resourse Locator)URL(Uniform Resourse Locator)URLURL又称为统一资源定位符,用于在万维又称为统一资源定位符,用于在万维网上指定信息的位置网上指定信息的位置 。网页的。网页的URLURL地址地址由模式、由模式、WebWeb服务器的名字、网页在服务器的名字、网页在WebWeb服务器上的路径三部

38、分组成。其中,模服务器上的路径三部分组成。其中,模式指明了访问网页时所用的语言和协议;式指明了访问网页时所用的语言和协议;WebWeb服务器的名字,或叫做域名,指明了服务器的名字,或叫做域名,指明了存储网页的计算机服务器的名称;网页存储网页的计算机服务器的名称;网页在在WebWeb服务器上的路径指明了网页在服务器上的路径指明了网页在WebWeb服务器的具体位置。服务器的具体位置。幻灯片http:/ Universal Resource Locator)PURL称为永久通用资源地址称为永久通用资源地址http:/ /net/intercatnet/in

39、tercat协议 主机名称 用户定义字符串幻灯片PURLURL由在由在PURL服务服务器登记的用户生器登记的用户生成。成。PURL一旦一旦生成,便不可更生成,便不可更改。改。一个一个URL总是与一总是与一个个PURL相对应,如相对应,如果果URL改变,新的改变,新的URL仍与原来的仍与原来的PURL联系在一起。联系在一起。幻灯片客户端PURL服务器资源服务器服务器将服务器将PURLPURL与与唯一的唯一的URLURL联系联系在一起;在一起; 维护实用程序推维护实用程序推动动PURLPURL的生成的生成 和相应和相应URLURL的修的修改。改。客户利用客户利用PURLPURL服服务器返回的务器返

40、回的URLURL协协 商与远端资源的商与远端资源的链接。链接。1 PURL1 PURL2 2 URLURL3 URL3 URL4 RESOURCE4 RESOURCE/net/intercat幻灯片URN (Uniform Resource Names)URN称为统一资源名称。称为统一资源名称。URN 作为逻辑作为逻辑化的资源名称,可以是某个机构或联盟化的资源名称,可以是某个机构或联盟对资源的统一命名:如对资源的统一命名:如PURL,也可以,也可以是采用某种命名大纲制订的持久、独立是采用某种命名大纲制订的持久、独立于地址的资源标识符。通常由命名规范于地址的资源标识符

41、。通常由命名规范(Naming authority)、斜线)、斜线“/”和模糊和模糊字符串(字符串(Opaque string,OS)(如如OCLC/1234)组成。组成。幻灯片URI(Uniform Resource Identifier)URIURI称为统一资源标识符。作为称为统一资源标识符。作为Internet Internet 资源的统一的标识符体系,资源的统一的标识符体系,其中其中“资源资源”是能够被标识的任何对象。是能够被标识的任何对象。“标识符标识符”是一个对象可以引用的名称,是一个对象可以引用的名称,实际定义为符合某种语法规范的字符串。实际定义为符合某种语法规范的字符串。而而“

42、统一统一”则保证了现有不同类型的资则保证了现有不同类型的资源标识符可以采用统一的方式使用,并源标识符可以采用统一的方式使用,并为新的资源类型提供统一的标识框架。为新的资源类型提供统一的标识框架。实际上,实际上,URI URI 成为所有标识成为所有标识Internet Internet 资源的地址和名称的通用集合。资源的地址和名称的通用集合。URI 由三部分组成:由三部分组成:URN(统一资源名:统一资源名:Universal Resource Name):作为数字对象的逻辑名称;:作为数字对象的逻辑名称;URC(统一资源属性,统一资源属性,Universal Resource Characte

43、ristics):作为描述数:作为描述数字对象的元数据;字对象的元数据;URL(统一资源定位符:统一资源定位符:Universal Resource Locator):作为物理上对数字:作为物理上对数字对象定位和获取的机制。对象定位和获取的机制。 URI 机制被重新定义为包括机制被重新定义为包括URN 和和URL 的集合。的集合。 二、数字对象唯一标识符系统构成二、数字对象唯一标识符系统构成(一)(一) (1)(1)命名域命名域(Namespace)(Namespace),代表一定的,代表一定的标识系统,在该系统内遵循统一的命标识系统,在该系统内遵循统一的命名规则和程序。名规则和程序。 (2)

44、(2)唯一标识符,在特定命名域内按唯一标识符,在特定命名域内按一定规则给予数字对象的唯一和永久一定规则给予数字对象的唯一和永久名字。名字。 (3)(3)命名机构命名机构(Naming Authority)(Naming Authority),按照一定规则和权限管理命名过程的按照一定规则和权限管理命名过程的机构。机构。数字对象唯一标识符系统构成数字对象唯一标识符系统构成(二)(二) (4)(4)命名登记机构命名登记机构(Registry)(Registry),存储,存储命名登记数据的系统。具体存储内容命名登记数据的系统。具体存储内容可以是可以是标识符元数据标识符元数据、或、或标识符标识符地址地址

45、、或、或标识符地址元数据标识符地址元数据,可,可能辅助进行数字对象检索或地址解析。能辅助进行数字对象检索或地址解析。 (5)(5)地址解析系统地址解析系统(Resolutio (Resolutio System)System),负责将数字对象的唯一标,负责将数字对象的唯一标识符转换成相应的物理存放地址。识符转换成相应的物理存放地址。三、数字对象唯一标识符解析系统三、数字对象唯一标识符解析系统 数字对象唯一标识符的解析数字对象唯一标识符的解析(ResolutionResolution)指的是计算机按照某种协议向某个网指的是计算机按照某种协议向某个网络服务递交数字对象的唯一标识符,络服务递交数字对

46、象的唯一标识符,发出解析请求,该网络服务接收该请发出解析请求,该网络服务接收该请求后按照某种约定来调出与该唯一标求后按照某种约定来调出与该唯一标识符所标识对象相关的一个或多个相识符所标识对象相关的一个或多个相关信息,之后将这些相关信息返回给关信息,之后将这些相关信息返回给请求者的整个过程。请求者的整个过程。 幻灯片Global Handle Registry (GHR)LHS ALHS BLHS CLocal Handle ServicesServiceSite AService Site BLHS BHandleServiceHandleServiceHandle System幻灯片cnri

47、.dlib/july95.armsURLhttp:/www.dlib.olg/dlib/july95/07armo.hlrmRAPrepository.dlib.olg幻灯片handle 解析过程解析过程解析解析“cnri.dlib/july95-rms”幻灯片四、四、DOI系统系统DOI(Digital Object Identifier)数字对象标识符数字对象标识符幻灯片DOI DOI 系统是系统是CNRI CNRI 根据美国出版协会根据美国出版协会(The Association of American The Association of American PublishersPubl

48、ishers, AAP AAP )的要求定制开发)的要求定制开发的系统,它是的系统,它是Handle Handle 系统在出版行业系统在出版行业的应用。现由国际数字对象标识符基的应用。现由国际数字对象标识符基金会金会(International DOI Foundation(International DOI Foundation,IDF)IDF)管理。管理。幻灯片10.1006被赋予被赋予Academic出版社出版社doi:10.1006/012158328 An empirical study on the utilization of web academic resources in

49、humanities and social sciences based on web citations. your articles personal DOI 10.1007/s11192-009-0142-7. Your article in Scientometrics is now online at SpringerLink幻灯片CrossRefCrossRef是由多个出版机构联合建立的开是由多个出版机构联合建立的开放式参考文献链接系统。最早于放式参考文献链接系统。最早于19991999年年1111月由世界著名的月由世界著名的1212个商业和非商业出版商个商业和非商业出版商发起并宣

50、布成立。参加的成员组成了一个发起并宣布成立。参加的成员组成了一个非赢利组织非赢利组织Publishers International Publishers International Linking AssociationLinking Association(PILAPILA),负责),负责CrossRefCrossRef的运作及提供服务。的运作及提供服务。 DOIDOI系统典型应用:系统典型应用:CrossRef-CrossRef-跨出版跨出版商的开放的知识链接体系商的开放的知识链接体系幻灯片 CrossRef利用利用DOI形成跨出版商的链接服务形成跨出版商的链接服务Publisher A

51、Publisher CPublisher DPublisher APublisher BPublisher CPublisher DPublisher EPublisher FPublisher BPublisher EPublisher F15 bilateral relationships6 network relationships幻灯片123出版商出版商实现持久链接;通过实现持久链接;通过DOI系统实现引文到全文的链系统实现引文到全文的链接接,实现一站式服务,提高实现一站式服务,提高整个行业的服务数量和服整个行业的服务数量和服务质量,提升整个行业的务质量,提升整个行业的产品竞争力。产品

52、竞争力。DOIDOI的作用的作用二次文献数据库二次文献数据库实现二次文献数据库实现二次文献数据库与全文数据库的链接,与全文数据库的链接,SCI、EI、CSA、CABI等等都通过都通过DOI建立了建立了与全文的链接。与全文的链接。图书馆图书馆通过通过DOI,为用户提供访,为用户提供访问更多全文文献的机会。问更多全文文献的机会。幻灯片DOIDOI的作用的作用4搜索服务:搜索服务: 在学术搜索中引入在学术搜索中引入DOIDOI可以提高搜索质量。可以提高搜索质量。CrossRefCrossRef与与GoogleGoogle合作合作的的CrossRef SearchCrossRef Search。仅在成

53、员所提供的学术仅在成员所提供的学术内容中进行搜索,通过内容中进行搜索,通过DOIDOI保证了检索结果到保证了检索结果到全文的链接有效性和持全文的链接有效性和持久性。久性。政府机构:政府机构: 相关政府机构通过相关政府机构通过DOIDOI的推广和应用更有效地管的推广和应用更有效地管理学术信息资源,从标识理学术信息资源,从标识体系的建立和应用上实现体系的建立和应用上实现包括科技文献和科学数据包括科技文献和科学数据在内的资源整合,从而有在内的资源整合,从而有助于建立一个基于分布环助于建立一个基于分布环境下的一站式的科技基础境下的一站式的科技基础信息服务平台。信息服务平台。5幻灯片(1 1)分布式数字

54、图书馆机制)分布式数字图书馆机制/ /张晓林著,情报学报,张晓林著,情报学报,20022002(2 2)“数字资源唯一标识符数字资源唯一标识符” 方面论文,方面论文,现代图书情报技现代图书情报技术术20052005年第年第2 2期期参考文献参考文献幻灯片第四节第四节 数字图书馆开发平台数字图书馆开发平台幻灯片数字图书馆开发平台数字图书馆开发平台是以各种类是以各种类型数字资源和因特网上的各种资型数字资源和因特网上的各种资源为中心源为中心, , 以为用户提供方便、以为用户提供方便、快捷的信息服务机制为目的快捷的信息服务机制为目的, , 围围绕数字资源的加工建设存储和管绕数字资源的加工建设存储和管理

55、、访问和服务提供的一整套先理、访问和服务提供的一整套先进、实用、高效的工具进、实用、高效的工具, , 是开发是开发和利用数字图书馆的管理系统。和利用数字图书馆的管理系统。 幻灯片一、数字图书馆开发平台的基本功一、数字图书馆开发平台的基本功能能二、数字图书馆开发平台的现状二、数字图书馆开发平台的现状三、中文数字图书馆开发平台的选择三、中文数字图书馆开发平台的选择四、数字图书馆开发平台的发展趋势四、数字图书馆开发平台的发展趋势内容提纲内容提纲幻灯片资源加资源加工系统工系统元数据元数据标引系统标引系统异构资异构资源整合源整合数数字字资资源源加加工工资源管资源管理系统理系统资源存资源存储系统储系统资源

56、调资源调度系统度系统数数字字资资源源发发布布资源服资源服务系统务系统用户管用户管理系统理系统数字版数字版权系统权系统数数字字资资源源服服务务对象库对象库元数据库元数据库幻灯片一、数字图书馆开发平台的基本功能一、数字图书馆开发平台的基本功能二、数字图书馆开发平台的现状二、数字图书馆开发平台的现状三、中文数字图书馆开发平台的选择三、中文数字图书馆开发平台的选择四、数字图书馆开发平台的发展趋势四、数字图书馆开发平台的发展趋势内容提纲内容提纲 图书馆开发平台的来源主要有三种途径:自图书馆开发平台的来源主要有三种途径:自己开发,这需要一定的人力、物力和技术条件己开发,这需要一定的人力、物力和技术条件,但

57、可根据自己要求设计。联合开发,包括,但可根据自己要求设计。联合开发,包括多个多个DLDL以及和其它单位厂商合作。购买现成以及和其它单位厂商合作。购买现成的软件或连同数字资源一起购买,这是一种最的软件或连同数字资源一起购买,这是一种最主要的方式,也是一种趋势。据统计,在市场主要的方式,也是一种趋势。据统计,在市场上以上以DLDL命名的命名的DLSDLS产品多达几十种产品多达几十种DLS产品名称产品名称公司名称公司名称AOLONG数字图书馆系统数字图书馆系统北京澳龙枭科技发展有限公司北京澳龙枭科技发展有限公司BOS数字图书馆系统数字图书馆系统北京京东方软件有限公司北京京东方软件有限公司CDI数字图

58、书馆应用系统数字图书馆应用系统北京中数创新技术有限公司北京中数创新技术有限公司CALIS数字图书馆解决方案数字图书馆解决方案高等教育文献保障系统高等教育文献保障系统TPI数字图书馆建设与管理平台数字图书馆建设与管理平台清华同方光盘股份有限公司清华同方光盘股份有限公司TRS数字图书馆解决方案数字图书馆解决方案北京拓尔思信息技术有限公司北京拓尔思信息技术有限公司SHINE数字图书馆数字图书馆北京视翰科技有限公司北京视翰科技有限公司TBS数字图书馆解决方案数字图书馆解决方案北京金信桥网络技术有限公司北京金信桥网络技术有限公司数字图书馆整体解决方案数字图书馆整体解决方案北京国图数字有限公司北京国图数字

59、有限公司金鑫金鑫i-LIBS数字图书馆平台数字图书馆平台上海金鑫计算机系统工程有限公司上海金鑫计算机系统工程有限公司方正方正Apabi数字图书系统数字图书系统北大方正电子有限公司出品北大方正电子有限公司出品星澜数字图书馆星澜数字图书馆北京明道星澜科技发展有限公司北京明道星澜科技发展有限公司金碟数字图书馆系统金碟数字图书馆系统珠海金碟多媒体电脑有限公司珠海金碟多媒体电脑有限公司科教科教2000数字图书馆系统数字图书馆系统北京清华泰豪智能科技有限公司北京清华泰豪智能科技有限公司 博佳数字图书馆系统博佳数字图书馆系统福建博佳信息技术有限公司福建博佳信息技术有限公司太极数字图书馆系统太极数字图书馆系统

60、太极计算机股份有限公司太极计算机股份有限公司书生之家数字图书馆系统书生之家数字图书馆系统北京书生数字技术有限公司北京书生数字技术有限公司数字方舟数字图书馆系统数字方舟数字图书馆系统数字方舟信息技术有限公司数字方舟信息技术有限公司麦达数字图书馆麦达数字图书馆杭州麦达电子有限公司杭州麦达电子有限公司凌波数字图书馆软件凌波数字图书馆软件天津凌波科技有限公司天津凌波科技有限公司数字图书馆应用解决方案数字图书馆应用解决方案浙江天宇信息技术有限公司浙江天宇信息技术有限公司数字图书馆开发平台的基本情况数字图书馆开发平台的基本情况 1 1、支持非结构化文件,包括音频、支持非结构化文件,包括音频、视频等多媒体文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论