本体的简单介绍_第1页
本体的简单介绍_第2页
本体的简单介绍_第3页
本体的简单介绍_第4页
本体的简单介绍_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本体的简单介绍1主要内容 本体(Ontology)的概述本体的构建本体的异构问题本体的应用:基于本体的移动Agent通信模型总结2前言近些年来,随着计算机应用需求的不断增强,计算机科学与技术的发展不断变化着。然而在这种快速发展的同时,也面临着种种的困难。主要的困难包括:知识的表示、信息的组织、软件的复用等。特别是由于因特网的快速发展,面对信息的海洋,如何组织、管理和维护海量信息并为用户提供有效的服务也就成为一项重要而迫切的研究课题。为了适应这些要求,Ontology作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,自被提出以来就引起了众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书、软件复用、信息检索和Web上异构信息的处理、语义Web等。31本体(Ontology)的概述Ontology的定义Ontology最初是一个哲学的概念,从哲学的范畴来看,ontology是对客观存在的一个系统的解释和说明,关心的是客观现实的抽象本质。之后,Neches等人将ontology引入到了分布式人工智能(AI)领域,并将其定义为“给出相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇的规则的定义”。现在ontology的一个最为流行的定义是由Gruber提出的,即“ontology是概念模型的明确的规范说明”。41本体(Ontology)的概述随着研究的不断深入,研究人员最终将Gruber提出的定义扩展为:“ontology是共享概念模型的明确的形式化规范说明”。在这个定义中包含了四层含义:概念模型:指通过抽象出客观世界中一些现象的相关概念而得到的模型。概念模型所表现的含义独立于具体的环境状态明确:指所使用的概念及使用这些概念的约束都有明确的定义形式化:指ontology是计算机可读的,即能被计算机处理的共享:指ontology中体现的是共同认可的知识,反应的是相关领域中公认的概念集51本体(Ontology)的概述Ontology的建模元语(又称为ontology的组成部分):类:又称为概念,可以指任何事物。类通常由分类来进行组织,分类是通过具体化和一般化关系来组织本体中的知识,通过分类,可以进行单一的和多重的继承。关系:代表了在领域中概念之间的交互作用函数:一组特殊的关系,在这种关系中,前n-1个元素可以唯一的决定第n个元素公理:代表永断真言。人们用公理对永真的句子进行建模,其目的是为了限制信息,验证信息正确性以及推导出新的信息实例:即元素,是领域中的和某个特定的类关联在一起的元素(在类中生成实例)61本体(Ontology)的概述Ontology的描述语言在具体应用中,ontology的表示方式可以是多种多样的,按照表示和描述的形式化程度不同,可以分为:非形式化的、半非形式化的、半形式化的以及形式化的语言。本体论的形式化程度越高,越有利于计算机进行自动处理。几个主要的语义web①的本体描述语言有:OIL、DAML+OIL、OWL等。其中OWL(ontologyweblanguage)是W3C(万维网联盟WorldWideWebConsortiu)规定的国际通用的标准本体描述语言。①语义web:就是建立在一定标准语言基础上的,对web上的数据进行的一种抽象的表示。它的目标是使得web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对WWW上异构和分布信息的有效访问和搜索。72本体的构建由于本体构建的方法学还没有成熟的理论指导,而目前的本体构建方法都是针对具体的项目提出,因而导致了各种本体构建方法的提出。例如:骨架法、企业建模法、循环获取法、methontology、DEF-5、Bernerasetal方法、基于领域知识重用的虚拟领域本体构建方法等82本体的构建在这些方法中,若要了解本体构建的一个完整的过程,骨架法在所有方法中最具参考性,它提供了一个本体构建的方法学框架。骨架法的步骤:确定构建本体的目的和范围构建本体,包括本体获取、本体编码和本体重用本体评估文档化做出各阶段的指导方针92本体的构建本体的获取,可采用循环获取法或DEF-5方法。其中前一种是从文本中抽取领域本体的方法,采用的是一种环状结构的开发思路,类似于软件工程中的原型法思想,即先初步成型再不断改进;后一种方法是一种本体描述获取的方法本体的重用,可采用基于领域知识重用的虚拟领域本体构造方法,该方法主要采用本体语义相关度匹配的办法来搜索和匹配本体,并通过结合手工交互操作与系统自动分析来实现本体构建工具:现在有大量的本体构建工具存在,它们各有优点和缺点,能力参差不齐。如:ontosaurus、ontolingua、OLEd、protégé、ontoEdit等。102本体的构建举例:构建旅游信息资源本体过程:确定旅游信息资源本体领域和范畴列举旅游信息资源本体中的重要术语、概念建立旅游信息资源本体框架定义类和类的层次体系定义类的属性及其取值类型对领域本体编码、形式化112本体的构建确定本体范围和术语:明确领域本体的目的、范围、表示方法、用途等,得到目标本体的主要轮廓,最终生成本体开发目的和详细说明书。旅游信息本体中重要术语与概念为:人、组织机构、景区、旅游路线、交通方式、食宿、行程、地理位置、特产、娱乐活动、民族风情、旅行社、景区管理机构、交通运输企业、食宿企业、旅游局、保险公司、特产企业、娱乐企业、水文景观、地文景观、人文景观、历史遗产、国家非物质文化遗产、全程路线、地接线路……122本体的构建

定义类和类的层次结构:类用于描述抽象的实体对象,代表着一类具有共性的实例对象;类具有继承性并以层次结构的形式组织。定义类的层次采用自顶向下的方法,其中顶为父类。部分旅游信息资源本体类层次结构如图:父类子类子子类132本体的构建定义类的属性由于每个类的属性较多,原则是根据需求来定义该领域类的属性。如在旅游信息资源本体中,游客及景区的属性表示为:游客(姓名,性别,身份证,年龄,旅游类别,爱好,电话,邮箱)景区(名称,景点等级,管理机构,景点类别,地址,容纳人数,服务电话)生成本体通过利用上述信息,结合本体构建的工具,就可以建立起一个旅游信息资源本体库143本体的异构问题在分布式环境中,信息的表示是结构化的,本体可以用来描述信息的语义。随着web中信息量的增多,本体的数量也越来越多,并且单个本体不能充分完成目标任务,必须联合多个本体完成任务。但是,由于本体到目前为止没有一个统一的标准和规范,因此会因存在创建者不同、使用的建模方法不同或同一领域内参与的专家不同等原因,使得当需要多个本体协助工作时出现本体异构问题。异构的本体是不能进行互操作的,但实际中存在很多需要联合多个本体完成的任务,因此必须解决本体的互操作问题,也就是本体的异构问题。而本体映射便是解决本体异构问题的手段之一,其目的是找到不同本体之间的语义联系153本体的异构问题所谓本体映射,是指有两个本体A、B,对于本体A中的每个概念试图在本体B中找到一个语义相同或相近的对应概念,对于本体B中的每个概念也是如此。因而本体映射的最重要的过程就是发现语义关联目前,对于本体间的映射研究是从本体本身的定义出发的,本体的映射类型有:概念-概念、属性-概念、属性-属性等本体映射函数的形式化定义如下:map:O1→O2;如果sim(ei1,ei2)>th,则map(ei1)=ei2其中,th是阈值,ei1∈O1,ei2∈O2。即当ei1和

ei2相似度大于某一阈值th时,认为两者之间存在映射关系163本体的异构问题本体映射模型框架:输入两个异构的本体,本体映射系统的任务是建立原本体到目标本体的映射关系。映射过程是一个迭代的过程,如图所示:本体特征提取用户交互相似度计算映射发现映射映射迭代173本体的异构问题特征提取:解析本体文档,提取出本体词汇(包括概念、属性、关系等)用户交互过程:这是一个可选过程。用户可以通过这个过程在自动映射之前预先指定一个或多个映射关系,也可以在映射自动发现之后纠正本体映射系统发现的错误映射,或者创建遗漏的映射关系。相似度计算:根据概念与属性相似度计算的不同,采用不同的计算方法:前者考虑从名称、属性、结构和实例四个方面入手;后者仅从名称、定义域和值域三个方面匹配来确定其相似度映射发现:此过程基于迭代后的相似度值进行,根据某种选择策略并结合本体的约束和上下文关系等选择本体间元素的最优映射关系183本体的异构问题映射:根据映射函数,输出映射表,表中每一项对应一个映射关系。每一项包含四个元素集合:原本体O1中的元素集合{ei1},目标本体O2中的元素集合{ei2},元素对应的关系以及关系的相似度数值映射迭代:将所得到的相似度数值进行迭代运行,得到候选映射的综合预测值193本体的异构问题常用的本体映射方法有:基于语法的映射、基于概念实例的映射、基于概念定义的映射、基于概念结构的映射、基于规则的映射、基于统计学的映射、基于机器学习的映射。这里每种方法参照了本体定义的不同部分203本体的异构问题概念语义的相似度和相关度语义的相似度,就是两个概念在不同的上下文中可以互相交换使用而不改变文本中的句法语义结构的程度。两个词语如果在不同的上下文中可以互相替换且不改变文本的句法语义结构的可能性越大,二者的相似度就越高,否则越低语义的相关度,反映的是两个概念相互关联的程度,可以用这两个概念在同一个语境中共同出现的可能性来衡量213本体的异构问题常用的语义相似度和相关度计算方法根据世界知识计算的方法:此方法需要计算概念语义距离。该方法是利用一部同义词词典,同义词词典都是将所有的词组织在一棵或几棵树状的层次结构中,一棵树中任何两个结点之间有且只有一条路径,此时这条路径的长度就可以作为两个概念的语义距离的一种度量,长度越短,则两个语义越相似大规模语料库统计的方法:以大规模的语料库为基础,用统计的方法计算概念之间的语义相关度。224基于本体的移动Agent通信模型随着计算机网络尤其是互联网的迅速发展,Agent技术成为人工智能领域的一个研究热点。Agent的提出:传统的计算系统是封闭的,需要满足一致性的要求,然而社会机制是开放的,不能满足一致性条件,这种机制下的部分个体在矛盾的情况下,需要通过某种协商机制达成一个可接受的解。Minsky将计算社会中的这种个体称为Agent。这些个体的有机组合则构成计算社会——多Agent系统。Agent的定义:Agent是指驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动性等特征的计算实体。

234基于本体的移动Agent通信模型移动Agent:是Agent技术中的一个重要的组成部分,它是一种特殊的Agent,除了具有Agent的基本属性以外,移动性是其最重要的特点,它可以在异构的网络环境中从一台机器通过网络移动到另外一台机器上运行,并可以与其他Agent或资源交互,完成指定任务,是一个自治实体移动Agent系统的通信通常工作于一种较为复杂的,难以预测的计算环境中(如自知、异构、高度动态的开发网络环境)。由于移动Agent通信技术是移动Agent系统中的一个关键技术,因此需要构建正确、可靠、健壮的移动Agent通信的系统环境本体技术由于能够有效的实现共享、重用和互操作问题,因此能够应用于移动Agent系统中,解决移动Agent通信中遇到的部分关键问题244基于本体的移动Agent通信模型基于本体的移动Agent通信模型OMACM(Ontology-basedMobileAgentCommunicationModel)如图:Alignment254基于本体的移动Agent通信模型从内部功能的角度将通信模型OMACM分为三个部分:本体和用户的访问管理层(ontologyandusermanagement):该层负责处理本体的使用问题,包括处理来自外部的本体检索编辑和查询等请求,以及对授权用户的权利和安全检验虚拟本体库松散表示层:本体表示层负责本体的存储问题,包括分布式索引和查询辅助机制。对于虚拟本体库,是有来自不同授权用户的本体组成,通过分布式索引方法可以对该库进行管理本体修正层(ontologyalignment):可以完成各种信息的转换,当一个本体发生变化时,可能会引起其他与之相关的本体的变化,通过本体修正层可以完成其他相关本体信息的相应转换,以达到信息同步264基于本体的移动Agent通信模型通信模型OMACM具有的特点是:OMACM模型中包括本体和Agent的访问管理层、本体表示层和本体修正层建立了一个分布式本体环境,使Agent能够访问、共享和管理各种本体资源,为Agent提供本体服务,并支持Agent之间的可靠性通信给出了多种方式有效的控制了Agent对于本体的访问274基于本体的移动Agent通信模型不同环境下基于本体的Agent通信过程:通过发起者Agent1发出与接受者Agent2通信的请求判断Agent1与Agent2向本体服务器请求是否需要携带本体,若不需要携带本体,那么双方可以直接通信,通信过程结束若Agent1与Agent2需要携带本体进行通信,则向本体服务求请求获得携带本体的权限Agent

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论