信息集成服务培训教程.ppt_第1页
信息集成服务培训教程.ppt_第2页
信息集成服务培训教程.ppt_第3页
信息集成服务培训教程.ppt_第4页
信息集成服务培训教程.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章信息集成服务,11.1信息集成服务的组织形式11.2信息集成服务的内容组织11.3信息集成服务中的系统互操作11.4信息集成服务的协同实现,11.1信息集成服务的组织形式,一、以资源为中心的信息集成服务二、以技术为中心的信息集成服务三、以机构合作为中心的信息集成服务四、以用户为中心的信息集成服务,一、以资源为中心的信息集成服务,以资源为中心的信息集成服务,是一种面向信息资源的,并以信息资源的发现、采集、加工与集成作为服务工作中心的信息集成服务类型。,二、以技术为中心的信息集成服务,以技术为中心的信息集成服务,是一种面向信息集成技术应用的,以信息集成技术的研发为依据的信息集成服务类型。(如图11-2),三、以机构合作为中心的信息集成服务,以机构合作为中心的信息集成服务,是以信息服务机构之间的多种形式的合作为基础,通过合作达到机构之间信息资源的集成与共享、服务技术的集成与共享、服务人员的集成与共享,从而增强各个服务机构的服务能力的一种服务(如图11-3)。,四、以用户为中心的信息集成服务,主要是个性化集成服务,是由用户个性化的需求为导向进行信息服务要素的动态集成的一种服务。强调用户的个性化体验,以提供用户满意的服务为目标,从用户角度进行服务的集成组织,因此,信息服务机构在提供信息集成服务时,一切从用户活动与行为出发,不仅强调信息用户现实信息需求的满足,同时也关注和挖掘用户的潜在信息需求(如图11-4)。,11.2信息集成服务的内容组织,一、集成化信息动态发布二、集成化信息检索三、信息集成化推送服务四、基于神经网络集成技术的专家系统服务,一、集成化信息动态发布,集成化信息发布平台能够自动根据其动态库中信息的变化、网上相关信息源的变化和深层开发的结果适时发布相关信息并及时提供相关资源。图11-5以新闻动态发布为例,显示了集成化发布的过程。,一、集成化信息动态发布,Web信息资源发布通常使用两种简单模型:一是页面发布(如图11-6),二是数据库发布(如图11-7)。无论是哪种模型,其发布的对象都具有一致性:被发布的对象是Web上的信息资源;利用常规的Web技术实现信息发布,即将Web作为信息发布渠道;用户采用类似于通常信息浏览的方式即可浏览被发布的信息;受众不确定和不可控制性,即对Web用户访问发布的资源不做限制。,一、集成化信息动态发布,二、集成化信息检索,集成化信息检索是以信息集成与服务集成为依据,以达到知识共享的最大化为目的,实现对互联网连接起来的数字资源库群的分布式存贮及跨平台、跨语种的网络化检索。集成化信息检索顺应用户的需求,本着截面无缝化、统一化的检索理念,为解决异构数据库的统一检索问题而提出。信息集成化检索的必要性表现在如下4个方面:,资源分散阻碍了知识共享。用户面临检索困境。现行检索方式的弊端。数字图书馆服务的推动。,二、集成化信息检索,现代网络环境和技术条件从多个方面保证了集成化信息检索的实现,关键技术包括标准与协议支持、数据库技术的发展、网络化检索的实现等。,标准与协议支持:基于网络的集成化信息检索系统的开发和运行得益于通用的网络协议,更依赖于和信息处理、传输与检索等有关的标准与协议数据库技术的发展:面向对象的技术与公共对象请求代理体系结构(CommonObjectRequestBrokerArchitecture,CORBA);动态数据库访问技术网络检索工具的发展,三、信息集成化推送服务,与传统的信息服务形式和信息服务模式相比,针对用户对信息服务提出的全面、准确和深入的要求,集成化信息服务中必须开发自动预测需求、自动跟踪、主动发布信息等功能以适应用户,这正是信息推送服务的优势所在。在用户特征和需求特征库建立之后,系统便可以根据用户的特殊偏好或需要,定期通过网络搜索获取的相关信息,通过智能化的筛选、分类,然后提供给相关用户,这相当于为每位用户编制一部完全符合其需求、适应其特点、属于他个人的动态信息集。这样才能最大程度地提高用户获取信息的能力,做到按需推送,以使从被动变为主动,更好的服务于用户。,三、信息集成化推送服务,根据系统集成和扩充程度的不同,推送服务功能的实现可以分为三种形式(具体模型如图11-8所示):,三、信息集成化推送服务,Web服务器扩展(CGI)方式。这种方式利用服务器扩展(CGI)来扩充原有Web服务器功能,实现信息推送。客户智能代理(Agent)方式。这种方式使用“智能代理(Agent)”定期自动的对预定的Web站点进行搜集,以收集更新信息并发送给用户。推(Push)服务器方式。这种方式对原有系统的改动最大,它提供包括推(Push)服务器、客户端及开发工具等一整套集成应用环境。还需要说明的是,信息推送服务是基于用户注册的服务,依据注册用户定制信息,按照其个性化需求,采用推送至终端或推送至邮箱的方式来实现。简要的流程是:未注册用户在注册过程中提供用户信息和需求特征信息,登录后自行设置定制信息,系统将服务器定期扫描用户定制信息之后的产品,定期提供给用户所需信息。,四、基于神经网络集成技术的专家系统服务,专家系统是一种智能的计算机程序,它运用知识和推理步骤来解决只有专家才能解决的复杂问题,它主要由知识库和推理机构成。基于神经网络集成的专家系统由基本部件和核心部件两大部分组成。基本部件即传统的专家系统的组件集成,主要包括用户界面、知识库、知识库管理系统、推理机、数据库、解释机等,核心部件包括神经网络集成知识自动获取模块(神经网络集成、规则抽取机构),其系统基本结构如图11-9所示。,如图11-9所示,几个基本模块运行如下:用户界面:人机交互的平台,服务提供方、资源提供方和用户可以方便地交流。解释机:对给用户提供的答案进行包括采用事实依据、逻辑推理路线、系统分析方式以及答案的肯定程度等给予必要的集成说明。推理机:模拟领域专家的思维过程,控制并执行对问题的求解。系统管理模块:系统管理员通过该模块对整个专家系统包括数据库和知识库行使存储、排序、检索、维护、更新等基本管理职能。数据库和知识库:数据库是用于存放从用户提问-问题分析-经验采纳-逻辑推理-初步结果-结果验证-最终结果-结果提交全过程的事实和数据,而知识库则存放着领域专家专门知识,库中还存储着从神经网络中抽取的规则,这也是基于神经网络集成的专家系统与普通专家系统的区别之一。,四、基于神经网络集成技术的专家系统服务,11.3信息集成服务中的系统互操作,一、系统异构与基于资源集成的系统互操作二、系统异构与互操作环境三、系统互操作的技术实现,一、系统异构与基于资源集成的系统互操作,目前关于信息系统互操作的研究主要集中在以下领域:电子政府领域的互操作研究英国政府UKe-GIF是第一个系统化的电子政务互操作框架,将相应的标准规范分为:系统互联(Interconnection)、数据整合(Dataintegration)和信息获取(Informationaccess)三个方面,包括了通信协议、安全机制、数据编码、数据标记、元数据、数据交换格式等层面的互操作.电子商务领域的互操作研究UN/CEFACT及OASIS共同推进的ebXML电子商务标准体系数字图书馆领域的互操作OCLC关于DSpaceHarvesting、DublinCoreMetadataInitiative、OpenArchivesInitiative、OpenURLActivities、RDFInteroperability、TerminologyServices、Z39.50互操作的研究等,推动世界范围内图书馆界的系统互操作和合作。多媒体出版领域的互操作规范,信息用户在使用信息系统时出现两大鸿沟:信息获取鸿沟和信息理解鸿沟,客观上提出了系统互操作的要求。系统互操作是达到共享目标的系统和系统间的有效交互能力。互操作的主要特征包括:自治性(Autonomy)。自治性是系统互操作的最重要的特征。其基本特征是,各个系统的每个构件本质上可独立于环境中其它构件进行操作,即具有一定程度的独立性和可局部管理性。服务性(Service)。这里的服务是靠构件实现的,即构件或一组协同操作的构件,它代表用户执行的一个活动或一组活动。物理分布性。开放性(Openness)。开放性是指构件与服务可在任何阶段加入到系统,或从系统中撤去。,一、系统异构与基于资源集成的系统互操作,一个理想的信息系统操作应该满足:支持丰富多样的资源和功能形式,能容纳各种各样的信息资源体系和服务体系。支持分布的各个系统的自主性,能持续支持支持各个系统的自主建设与发展,能有效保证对知识产权资源使用的本地控制,能支持专门的本地客户端机制和服务,能支持专门的甚至本地化的元数据格式和系统协议。保证整个分布式数字信息机制的低成本和进入该体制的低成本。保证在分布式数字信息机制中增加新的资源和服务系统的方便性和低成本;保证在分布式数字信息机制中使用任何一个资源和服务系统的方便性和低成本。提供整个机制的可伸缩性,能容纳甚至动态组合任意数量和类型的资源或服务体系。,一、系统异构与基于资源集成的系统互操作,信息系统互操作的目标是向用户屏蔽分布的、异构的各个信息系统间的差别,实现用户对多个信息系统的交叉浏览和交叉检索,提供统一入口的多个信息系统间检索和浏览服务,实现信息共享。当前环境下,信息集成服务要解决互操作的以下主要问题:屏蔽分布的各信息系统之间的差别,通过统一界面为用户提供一致的服务;为信息资源和信息系统提供一种灵活的集成机制,即允许各个相对独立的信息系统能自由增加新的服务,或修改以前的服务;信息资源整合和集成服务协议的制定,包括元数据协议、数字对象存储协议、信息搜索协议、付费协议、信息资源服务的运行管理协议等等;开发信息资源整合与集成服务系统高层协议中间件,实现分布子系统间各项服务的互操作。,一、系统异构与基于资源集成的系统互操作,二、系统异构与互操作环境,信息集成服务处于分布、异构数字化信息环境中,众多不同地域、不同技术平台、使用不同组织检索方式的系统并存,迫切需要建立有效的互操作机制来整合整个分布环境中的资源和服务。制约系统互操作的因素非常复杂,其中异构性是制约信息系统实现互操作的关键因素。,信息系统异构主要可以概括为两个层面:信息资源层面、技术层面。信息资源异构,资源是信息系统提供服务的基础,信息资源的异构问题主要表现为:命名问题格式问题描述体系的问题技术层面的异构,指信息系统所依赖的应用系统、数据库管理系统乃至操作平台之间各不相同,形成异构的技术环境。,二、系统异构与互操作环境,信息集成服务的系统互操作环境从宏观环境而言,信息集成服务互操作处于异构、集成和动态环境中。从微观环境而言,信息集成服务要跨越分布异构的资源集合和集成服务体系,实现一致的服务。图11-11详细说明了信息集成服务互操作的微观环境。,二、系统异构与互操作环境,三、系统互操作的技术实现,应用信息系统互操作的关键技术主要包括:应用层面的互操作技术:包括信息系统软件互操作技术、基于协议的互操作技术;资源层面互操作技术:主要包括元数据互操作技术和知识本体互操作技术。图11-13展示了一个信息系统互操作的技术框架。,三、系统互操作的技术实现,应用层面的信息系统软件互操作的技术实现软件互操作技术的核心是通过克服不同软件构件所采用的实现语言、运行环境和基本模式的差异,实现信息系统相互通信和协作,完成某一特定任务。外部协调(mediator)或中间件(middleware)技术。基于软件代理的互操作技术。分布式对象请求技术。基于描述得互操作技术。,基于描述的互操作技术,三、系统互操作的技术实现,应用层面的基于协议的互操作技术实现:协议是实现互操作的基础。在信息资源整合与服务中,信息系统互操作的实现需要相关协议的一致性应用,对信息系统集成与互操作影响较大的协议包括:Z39.50LDAPWHOIS+等。,Z39.50,Z39.50是信息检索应用服务定义和协议规范(InformationRetrievalApplicationServiceDefinitionandProtocolSpecification)的简称。Z39.50起源于图书馆界,最初是针对图书馆机读目录(MARC)数据库共享而开发的标准,Z39.50通过对编码方式和内容语义的标准化来实现不同系统间的互操作。Z39.50是一个模块化的标准(图11-14)。为了满足不同的Z39.50应用程序之间的互操作性,不同的应用领域就某些检索和查询的细节达成一致,业已形成了若干“Profile(大纲)”。,WHOIS+,WHOIS+协议最初作为目录服务开发,并提供简单的、基于模板的、分布式的和可扩展的信息查询服务。WHOIS+同时提供了为建立分布式数据库索引的通用架构。WHOIS+协议部署简单,并提供灵活的方式实现跨平台、数据集的查询;多语言支持。需要注意问题的是:(1)WHOIS+只提供有限的检索方式,因此部署相对简单的服务时,可以采用WHOIS+协议。(2)需要以CIP协议结合使用,WHOIS+协议和CIP协议结合使用才能实现查询路由和分布式索引,才能提高检索效率。(3)以一定的安全认证机制相结合。WHOIS+协议和它提供的检索路由机制,目前已经在ROADS软件平台和TERENA的TF-CHIC架构中实现。,三、系统互操作的技术实现,语义互操作技术语义上的异构是实现信息系统互操作面临的最大挑战之一,也是研究互操作的难点所在。实现信息系统的语义互操作主要通过两个途径:元数据互操作技术共享本体,元数据功能包括对资源的描述、管理和定位,以及对资源的评估。当在用不同元数据格式描述的资源体系之间进行检索、资源描述和资源利用时,就存在元数据的互操作性问题。元数据的互操作是指多个不同元数据格式的释读、转换和由多个元数据格式描述的数字化信息资源体系之间的透明检索。针对元数据互操作有多种解决方案,其中包括:元数据映射:(MetadataMapping)又称元数据转换。从语义角度提供元数据的互操作,从而实现跨资源库的统一检索。目前已有大量的映射程序存在,如DC与USMARC、DC与EDA、DC与GILS、GILS与USMARC等。开放描述:建立一个标准的资源描述框架(ResourceDescriptionFramework),来描述所有元数据格式,那么只要一个系统能够解析这个标准描述框架,就能解读相应的Metadata格式。实际上,XML和RDF从不同角度起着类似的作用。,三、系统互操作的技术实现,知识本体(Ontology)互操作基于Ontology的信息互操作方法主要是研究如何理解所获取的信息,重点解决不同部门、不同个人之间对信息理解的差距。解决的手段是通过在不同部门、不同个人之间建立共识的Ontology,使部门与部门及个人与个人之间对异构信息达到一定程度的共同理解,并能在此基础上进行相应的分析运用。知识本体(Ontology)是共享概念模型的明确的形式化规范说明。把每一个知识领域抽象成一套概念体系,再具体化为一个词表来表示,包括每一个词的明确定义、词与词之间的关系(例如用代、属、分、参关系)以及该领域的一些公理性知识的陈述,并且能够在这个知识领域的专家之间达成某种共识,即能够共享这套词表,所有这些就构成了该知识领域的一个“知识本体”。最后用一定的编码语言(例如RDF/OWL)明确表达上述体系(词表、词表关系、关系约束、公理、推理规则等)。,三、系统互操作的技术实现,11.4信息集成服务的协同实现,一、机构协同模式二、项目协同三、技术支撑协同四、资源组织协同,一、机构协同模式,“协同”反映了事物之间、系统或要素之间的配合性和依赖,以及由此而引发的合作。目前,机构协同已成为推进信息集成的一种重要方式。就整体而论,国外信息机构基于资源共享集成的协同服务强调资源共享的潜在战略利益。国内信息机构在协同服务中,主要是基于信息资源共建共享的信息集成服务。,以机构协同方式进行的信息集成服务,可以分为线性协同与网络协同两种。(1)线性协同线性协同模式根据协同服务的内容又可以分为水平协同和垂直协同。水平模式。信息机构根据自己的特点和发展方向,同其他的信息服务机构合作的协同模式,这种协同是在一个平面上进行的,协同的内容是综合性的。垂直协同模式。与水平协同服务模式相比,垂直模式是信息机构为了满足某一特定群体特定需要而进行的协同。这种协同是在同一系统或同一服务链上进行的纵向整合式协同。(2)网络协同网络协同是面向大众或面向诸多用户群体的信息资源服务机构普遍采用的协同方式,是既保证大众用户的集成信息需求,又为需要提高信息资源服务层次的用户提供集成服务的一种协同方式。以上协同服务方式在信息资源集成共享的协同服务中往往交叉应用。协同服务需要建立在各成员

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论