(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf_第1页
(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf_第2页
(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf_第3页
(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf_第4页
(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf_第5页
已阅读5页,还剩73页未读 继续免费阅读

(计算机应用技术专业论文)基于本体的教学知识构建及应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着信息科学、计算机科学在教育方面的发展,大学课堂教育方式发生了 相应的变化。为了使学生更好、更有个性地学习,也为教育工作者提供一种教 学领域的内容标准,建立一套教学领域内可重用、共享和具有互操作的教学领 域概念模型具有重要意义,也是非常必要的。 本文在详细分析研究本体的基本概念、本体分类、本体特点、本体描述语 言o w l 、本体在数据库中的应用和本体构建方法。从基于知识分类的认知结构 和认知顺序两个方面,全面地描述了领域知识本身、认知结构以及知识之间的 认知顺序,对教学领域的知识进行分类,着重研究计算机图形学领域的知识分 类。 本文仔细分析研究教学领域知识体系,并建立了教学领域知识体系模型。 在构建教学领域知识体系模型时,本文把构建学科领域知识库本体看成一个复 杂的语义网模型,并由三个部分组成:课程结构、学科知识点本体、学习资源 本体。课程结构部分是一种树状结构,相当于词典的索引部分,学科知识点部 分概念与关系组成的网状结构,相当于词典的正文。学习资源本体是对知识点 所拥有的学习资源的规范化说明。通过元数据,一个学习资源实例映射到领域 知识本体相应的概念或知识点。并采用骨架法来构建计算机图形学本体,同时 本文采用w 3 c 组织下开发的o w l 语言对教学本体进行了详细描述。 论文最后以所建的计算机图形学本体知识库为基础,开发语义检索原型系 统,研究其构建原理、工作流程和开发方法,通过系统运行分析,基于语义检 索实验系统比传统的基于关键字的查询方法具有更高的查全率和查准率。 关键词:本体,教学本体,元数据,学习资源,o w l a b s t r a c t a b s t r a c t w i t ht h ee x p a n d i n ga p p l i c a t i o no fi n f o r m a t i o nt e c h n o l o g ya n dc o m p u t e rs c i e n c e i ne d u c a t i o na r e a s ,c o l l e g ec l a s s r o o mt e a c h i n gs t y l e sh a v ec h a n g e da c c o r d i n g l y i ti s o fg r e a ts i g n i f i c a n c e ,a l s oo fg r e a tn e c e s s i t y , t oe s t a b l i s har e u s a b l e ,s h a r i n g ,a n d e x c h a n g e a b l ec o n c e p t u a lm o d e lo ft e a c h i n ga r e a i n f a c i l i t a t i n g s t u d e n t s m o r e i n d i v i d u a l i z e dl e a r n i n g ,a n da tt h es a m et i m e ,p r o v i d i n gac o n t e n ts t a n d a r df o r e d u c a t i o n a lp r o f e s s i o n a l s i nt h i sp a p e r t h eb a s i cc o n c e p to fo n t o l o g y , t h ec l a s s i f i c a t i o no fi t ,t h ef e a t u r eo f i t ,t h eo n t o l o g yd e s c r i p t i o nl a n g u a g e ( o w l ) ,i t sa p p l i c a t i o no nd a t a b a s e s ,a n dt h e c o n s t r u c t i o no fo n t o l o g yi sd e l i c a t e l ya n a l y z e da n ds t u d i e d f r o mt h ea n g l eo f r e c o g n i t i o ns t r u c t u r ea n dr e c o g n i t i o no r d e ro fk n o w l e d g ec l a s s i f i c a t i o n ,t h er e g i o n a l k n o w l e d g ei t s e l f , r e c o g n i t i o ns t r u c t u r ea n dt h er e c o g n i t i o no r d e ra m o n gk n o w l e d g ei s d e s c r i b e dc o m p r e h e n s i v e l y , a l o n gw i t ht h ec l a s s i f i c a t i o no fk n o w l e d g ei nt h ef i e l do f t e a c h i n g ,e s p e c i a l l yo f t h ec o m p u t e rg r a p h i c s i nt h i sp a p e r , t h ek n o w l e d g es y s t e mi nt h ef i e l do ft e a c h i n gi s d e l i c a t e l y a n a l y z e d ,a n dt h em o d e lo fk n o w l e d g es y s t e mi nt h ef i e l do ft e a c h i n gi se s t a b l i s h e d w h e nb u i l d i n gt h em o d e lo fk n o w l e d g es y s t e mi nt h a tf i e l d ,t h ep r o c e s so fb u i l d i n g t h ek n o w l e d g ed a t a b a s eo n t o l o g yi ns c i e n t i f i cf i e l di sc o n s i d e r e dt ob eac o m p l e x s e m a n t i cn e t w o r km o d e lc o n s i s t i n go ft h ec u r r i c u l a rs t r u c t u r e ,t h ek n o w l e d g ep o i n t o n t o l o g yi ns u b je c t sa n dt h el e a r n i n gr e s o u r c e so n t o l o g y t h ec u r r i c u l a rs t r u c t u r ei so f t h et r e et y p e ,e q u i v a l e n tt ot h ei n d e xp a r to fad i c t i o n a r y ;t h ek n o w l e d g ep o i n ti n s u b j e c t si so ft h en e t w o r ks t r u c t u r e ,e q u i v a l e n tt o t h eb o d yo fad i c t i o n a r y ;t h e l e a r n i n gr e s o u r c e so n t o l o g yi st h es t a n d a r d i z e dd e s c r i p t i o nt o t h ew h o l el e a r n i n g r e s o u r c e so fi t a ne x a m p l eo fl e a r n i n gr e s o u r c ei sm a p p e do n t ot h ec o r r e s p o n d e n t c o n c e p to rk n o w l e d g ep o i n t sv i as o u r c ed a t a m e a n w h i l e ,t h eo n t o l o g yo fc o m p u t e r g r a p h i c si sb u i l tb yt h es k e l e t o nm e t h o d ,a n dt h et u t o ro n t o l o g yi sd e l i c a t e l yd e s c r i b e d b ya d o p t i n gt h eo w ld e v e l o p e db yt h ew 3 co r g a n i z a t i o n f i n a l l y , t h es e m a n t i c s s e a r c h i n gp r o t o t y p es y s t e mi sd e v e l o p e do nt h eb a s i so f o n t o l o g yd a t a b a s ef o rc o m p u t e rg r a p h i c sh a v i n gb e e nb u i l t t h eb u i l d i n gp r i n c i p l e , i l a b s t r a c t w o r k f l o wa n dm e t h o do fd e v e l o p i n ga r es t u d i e d t h r o u g ht h ea n a l y s i sw h e nr u n n i n g t h es y s t e m ,t h ee x p e r i m e n t a ls y s t e mb a s e do nt h es e m a n t i c s s e a r c h i n gp e r f o r m sb e t t e r i ni t ss e a r c h i n gi n t e g r i t ya n da c c u r a c yt h a nt h et r a d i t i o n a lo n ew h i c hi sb a s e do nk e y w o r d s k e yw o r d s :o n t o l o g y , t e a c h i n go n t o l o g y , m e t a d a t a ,l e a m i n gr e s o u r e ,o w l i l i 学位论文独创性声明 学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得直昌太堂或其他教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确 的说明并表示谢意。 学位论文作者签名( 手写) :璇复逛芳签字日期:切妒年越月馏日 学位论文版权使用授权书 本学位论文作者完全了解直昌太堂有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究 所将本学位论文收录到中国学位论文全文数据库,并通过网络向 社会公众提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:桨镒弓导师签名:协7 吲 签字日期:年朋喇目签字日期:年月 日 第一章引言 第一章引言 1 1 研究背景及问题提出 教育的每一次突破性进展,都与科学技术的革命性进步息息相关,并以此 为标志。2 0 世纪9 0 年代,随着现代通信技术、计算机网络技术以及多媒体技术 的快速发展,使教育的发展产生了质的飞跃。网络教育的诞生、兴起、发展、 繁荣并迅速应用到教育教学领域,受到了广大教育工作者和学习者的青睐,人 们应用网络教育的实时性与非实时性、可重复性和交互性以及借助i n t e m e t 强大 的网络服务功能,形成了无处不在的教育网络,大大方便了求学者学习。网络 教育是信息技术最新成果在现代教育学思想的指导下对传统教育模式的革新, 具有不受时空限制、资源可以共享重用、系统开放、协作多样等优势。 伴随网络教育的发展,网络上积累了大量的学习资源。这些学习资源为网 络教育的开展提供了可能,然而目前网络教学系统的资源共享,基本是在简单 的页和其他常用文件共享的基础上,缺少统一的知识表示结构,课件重复开发 严重,资源管理共享难度大,学习资源在各教学系统间难以交互操作。归纳起 来,现有的教学系统主要存在着以下问题: ( 1 ) 语义互操作不强。高度的语义互操作对于上不同教育应用平台之间的 交流是必需的,由于教学知识库的描述标准不一,在知识的结构、类型及属性 上各自定义,而且知识表示方式不同,所以导致知识难以得到交流和共享。 ( 2 ) 检索效率不高。由于教学知识内容多而广,传统的基于关键字的搜索 技术不能满足需要,目前实用化的教学信息检索系统对海量信息资源的揭示效 率不高、深度有限,一方面会导致检索到大量无关的学习材料,另一方面也会 丢失相关的重要学习材料。 资源构建是学习技术的核心技术。目前国内学习资源存在着需求大、来源 广、数量众、种类多等特点。这些学习资源包括音频、视频、网页、文本、表 格、应用系统、源代码、服务等多种形式。这些信息形式多样、缺乏统一的描 述方式,给学习资源的构建带来诸多挑战:如何使被管理学习资源具有应用程 序能够理解的含义,实现学习资源处理过程自动化、智能化;如何对学习领域 中积累的大量学习资源进行有效管理,使用户可以找到与需求相关的资源;如 第一章引言 何根据学习资源所具有的领域知识含义,将分散在各种异构系统中的相关信息 方便、快速地融合后呈现给用户;如何充分利用网络环境来科学组织管理学习 资源、实现不同资源库管理系统之间的互操作、提供高效优质的教育教学信息 资源服务;如何有效地组织这些学习资源,描述和刻画学习资源之i 口j 的联系。 对学习资源进行用户可以理解一致的描述,是解决这些问题的有效途径。 本体是共享概念模型的明确形式化规范说明,能够以一种明确的、形式化的方 式来表示领域知识,提高系统之间的互操作性,促进知识共享。本体提供一套 概念和术语来描述特定领域,并且获取该领域的本质的概念结构及概念之问关 系,然后知识库就可以运用这些术语去表达现实或者虚拟世界中的正确知识。 本体具有强语义特性,能够在人们和应用系统之间达成对术语含义的共享和共 同理解,有助于实现资源的语义互换和领域应用。 1 2 国内外研究现状 1 2 1 知识表示研究现状 知识表示的研究源于2 0 世纪5 0 年代,7 0 年代成为研究热点。知识表示一 直是人工智能的一个永恒的主题。到目前为止人们提出的具较大影响力的几种 知识表示方法包括谓词演算、语义网络、框架、概念图、本体论方法等。每一 种知识表示方法均能有效地表示某一类知识。这些知识表示方法各有不同的形 式化描述方法。不同的知识表示方法会直接影响对知识的高效利用和推理机制。 知识表示方法通常致力于提供对于领域的全面地表示以支持智能应用,也 即提供一种表示方法使得能够从显性知识推理出隐性知识。但是几乎每一种知 识表示方法都不能兼顾表示能力与推理能力。谓词演算注重推理能力,语义网 络、框架、本体论方法等基于网络图的知识表示方法注重表示能力。描述逻辑 竭力在基于网络的知识表示方法中添加更多规则限制以图在知识表示能力与知 识推理能力之间达到一个令人满意的平衡f 2 】。下面简单分析上述的几种知识表示 方法。 谓词演算支持强有力的推理且易于实现系统间交互【3 】,其重要功能是根据一 系列真实断言推理出新的正确的表达式,强调对合式表达式的保持真值的运算。 由此,谓词演算的知识表示语言广泛应用于自动推理,模型检查、验证系统等。 语义网络的研究源于q u i l l i a n l 9 6 7 年提出的语义记忆模型4 】,该知识表示方 2 第一章引言 法把知识表示为一种图,图中节点对应于事实或者概念,弧对应于概念间的关 系和关联。语义网络通常用于自然语言理解,其第一次计算机实现就是2 0 世纪 年6 0 代初期用于开发机器翻译系统。 框架【5 】是m i n s k y 于1 9 7 5 年在一篇论文中提出的,是语义网络的扩展。框架 的目的是在显式组织的数据结构中捕捉问题域中隐含的信息连接。它提供了一 种用于将实体表示为结构化的对象的工具,对象可以带有命名槽和对应值。其 中,槽包含的信息有框架标识信息,框架问关系,框架的特征描述,被框架描 述的结构的用法的过程信息以及实例信息等等。 概念图【6 】于1 9 8 4 年由s o w a 提出,是一种有限连接二部图。一般认为概念 图是语义网络和框架的进化产物。图的结点表示概念,概念间的关系,具体对 象( 狗、手机、超市) 或者是抽象对象( 爱、美丽、老实) 。每个概念图可以表 示一个命题,基于概念图建立的知识库中包含大量这样的图。概念图理论还包 括根据现有图产生新图的运算,比如复制,限定,联合,简化等。总之,该种 知识表示方法己经开始关注表示能力和推理能力的共同提高。 语义网络、框架、概念图等知识表示方法统称为非逻辑的知识表示方法, 也称为关系表示方法。这类方法基于心理学家和语言学家对人类理解、记忆和 执行任务过程的实验研究成果之上。使用这类方法建立的知识库一般是一个描 述世界的全局性的静态的图结构。从实践的角度看,关系表示方法支持连接和 相关推理规则的定义( 比如继承就定义了一种特殊的推理关系) ,其可用性应该 比逻辑方法更高。然而,近几年出现了大量文献质疑这类知识表示方法,例如, 机器人研究领域中b r o o k sr a f 7 1 ,l e w i sj a 和l u g e rg e 【8 】,情景认知领域中的 a g r ep 和c h a p m a nd 【9 1 ,他们指出非逻辑的知识表示方法缺乏明确的语义信息, 因而基于这类方法的应用系统相互问差异较大,几乎无法进行交互。 本体论本来是一个哲学上的概念,近二十年来,本体概念广泛应用到计算 机领域,用于人工智能研究中的知识表示、共享以及重用。本体是对某一领域 的概念及概念之问关系的显式说明。将本体技术应用于知识系统能够为人与计 算机系统之间的通讯提供语法或者语义上的标准,并有助于提高系统可重用性, 可靠性及知识获取能力【i o 】。就知识表示而言,本体语言作为描述逻辑语言,兼 顾表示能力与推理能力。本体论知识表示方法是目前最得广大知识表示研究者 信任的方法。 3 第一章引言 1 2 2 学习资源建设研究现状 在网络教育发展的初期,很多高等院校、教育部门和一些企业站点纷纷建 设了自己的网络教育体系,建设了大量的学习资源,从而极大地丰富了学习资 源库,促进了当时网络教育的发展。但是,由于缺乏一个统一的资源建设的标 准和规范,以及缺乏对资源的有效管理,网上充斥着由各种不同背景的开发者 制作的不同方向、不同领域、不同格式的各色复杂资源,导致了资源建设的重 复性、复杂性。这种状况,使资源的应用仅局限于各自的系统范围内,而无法 在整个i n t e r n e t 上实现资源的共享、重用,达不到互操作的要求。 为了实现网络上学习资源的共享和重复使用,达到互操作的要求,世界上 很多标准化组织都在致力于基于网络的学习资源标准化的研究筛0 定学习资源的 元数据规范用于描述数字资源,从而有效地发现资源、管理资源、增强资源的 互操作性。其中影响较大的有国际计算机图书馆中心( o n l i n ec o m p u t e r l i b r a r y c e n t e r , o c l c ) 的都柏林元数据核心集( d u b l i nc o r em e t a d a t as e t ,d c m s ) 、 教学管理系统全球学习联合公司( i n s t r u c t i o nm a n a g e m e n ts y s t e m ,i m s ) 的学习资 源元数据规范( l e a r n i n gr e s o u r c em e t a d a t a ,l r m ) 、国际电气和电子工程师协会学 习技术标准委员会( l e a r n i n gt e c h n o l o g ys t a n d a r dc o m m i t t e e ,i e e el t s c ) 的学习 对象元数据标准( l e a r n i n go b j e c tm e t a d a t a ,l o m ) 等。国内在2 0 0 0 年底,由国家 教育部科技司组织十余所高校成立了专门从事教育信息标准化的委员会 c e l t s c ( c h i n e s e e 1 e a r n i n gt e c h n o l o g ys t a n d a r dc o m m i t t e e ) ,致力于全国教育技 术相关标准的研制、认证和应用推广工作。c e l t s c 也推出了自己的学习对象元 数据标准c e l t s 3 ,教育资源建设技术规范c e l t s4 1 ,基础教育资源元数据规 范c e l t s4 2 等等。这些标准规范一方面为学习资源的开发者提供一致的标准, 做到统一学习资源开发者的行为,实现学习资源在区域内的广泛共享;另一方 面,在分布式的网络环境中,使用元数据可为学习者或教育者查找、评估、获 取和使用学习资源,获得最大效率提供支持。 1 2 3 本体研究现状 本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具, 自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到 了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和w e b 上异构 信息的处理、语义w e b 等。 4 第一章引言 由于本体具有良好的概念层次结构和对逻辑推理的支持,在处理信息组织 信息检索和异构信息系统互操作问题中有广泛应用【1 1 , 1 2 】。文献川给出了基于本体 的信息检索的基本设计实现思路。目前本体应用在信息检索中的著名项目包括 ( o n t o ) 2 a g e n t 13 1 、o n t o b r o k e r 1 4 1 和s k c 15 1 。这三个项目也分别代表了3 个方向。 ( o n t o ) 2 a g e n t 的目的是为了帮助用户检索到所需要的w w w 上已有的本体,主 要采用了参照本体。参照本体是以w w w 上已有的本体为对象建立起来的本体, 它保存有各类本体的元数据。o n t o b r o k e r 面向的是w w w 上的网页资源,目的 是为用户检索到所需要的网页,这些网页含有用户所关心的内容。s k c 是一个 正在进行的项目,其目标是解决信息系统语义异构的问题,实现异构的自治系 统之间的互操作。该项目希望通过在本体上建立一个代数系统,用这个代数系 统来实现各本体之间的互操作,从而实现异构系统之间的互操作。 国内在本体研究方面起步较晚,但是近年束相关研究也逐渐兴起。目前, 国内清华大学知识工程研究室、北京大学计算机科学视觉与听觉处理国家重点 实验室、北京师范大学现代教育技术研究所、中国人民大学数据与知识工程研 究所、复旦大学以及中国科学院计算所等单位在国内率先开展了和从事一些关 于本体、语义网络、基于本体的智能代理等领域的探索和研究工作,并取得一 定的研究成果。 。 1 3 研究工作 本文着重分析和研究本体理论、本体表示和本体应用,并重点研究了计算 机图形学学科领域知识的构建,利用本体提供的一套概念和术语来描述计算机 图形领域知识,获取学科领域的本质概念结构及概念之问的关系;并且还在计 算机图形学学科领域本体的构建中还引入了学习对象的概念结合学习资源的特 征,实现了计算机图形学知识点和学习资源之间的映射;并采用w 3 c 推荐的本 体语言o w l 对计算机图形学知识点的概念和相互之问的关系进行定义一方面 促进机器理解,另一方面可以从根本上解决知识共享和互操作问题。最后开发 了一个基于本体知识库的语义检索系统,进一步探讨基于本体的计算机图形 学知识检索系统模型的构建,解决了传统的基于关键字匹配检索方式的不足。 这使得教学本体得到初步的应用。总之在本体提供的规范的共享概念及关系的 支持下进行知识共享、知识检索在查全率和查准率方面都有所提高。 5 第一章引言 1 4 论文组织 具体章节安排如下: 第一章是引言,主要介绍本文的研究背景,论述教学知识系统的相关技术 及其重要性,并分析将本体引入教学知识系统的建模优势。然后综述国内外知 识表示、资源构建以及本体技术的相关研究现状,提出论文研究计划,最后介 绍本文研究内容以及论文的章节安排。 第二章是本体的相关知识,主要包括本体的基本概念、本体分类、本体的 建模元语、描述语言、本体的构造以及本体在知识库系统中的应用,通过分析 对比,给出本文所使用的本体描述语言o w l 和建模工具p r o t 6 9 6 3 1 1 。 第三章是o w l 语言描述,主要讲述o w l 的子语、o w l 的语法和语义表 达能力以及o w l 的知识表示能力,为本文的计算机图形学本体表示打下基础。 第四章是教学领域知识本体库的构建。把学教学域知识体系模型分成:课 程结构、领域知识本体、学习资源本体三个部分,然后对这三部分分别进行知 识表示。 第五章是教学本体构建实例,以“计算机科学技术 学科的计算机图形 学课程为例详细的介绍教学本体的构建。 第六章是基于本体知识库的语义检索系统,主要内容包括知识检索系统模 型、基于本体的各种检索策略和方法,并进行实验分析。进一步探讨基于本体 的计算机图形学知识检索系统模型的构建,解决了传统的基于关键字匹配 检索方式的不足。 第七章是总结与展望,对本文的主要研究成果及创新进行总结,并指出工 作上进一步研究的内容和方向。 6 第二章本体的相关知识 第二章本体的相关知识 2 1 本体的概念 本体( o n t o l o g y ) 最早是一个哲学上的概念,从哲学的范畴来说,本体是客观 存在的一个系统的解释或说明,关心的是客观现实的抽象本质。在人工智能界, 最早给出本体定义的是n e e h e s 等人,他们将本体定义为“给出构成相关领域词 汇的基本概念和关系,以及利用这些概念和关系构成的规定这些词汇外延的规 则的定义l l6 j ”。1 9 9 3 年,g r u b e r 给出了本体的一个最为流行的定义,即“本体是 概念模型的明确的规范说明【i 7 】”。后来,b o r s t 在此基础上,给出了本体的另外 一种定义:“本体是共享概念模型的形式化规范说明”【1 8 】。s t u d e r 等对上述两 个定义进行了深入的研究,认为本体是共享概念模型的明确的形式化规范说明。 这包含4 层含义【1 9 】:概念模型( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、形式化( f o r m a l ) 和共享( s h a r e ) 。 ( 1 ) “概念模型”指通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关 概念而得到的模型。概念模型所表现的含义独立于具体的环境状态。 ( 2 ) “明确 指所使用的概念及使用这些概念的约束都有明确的定义。 ( 3 ) “形式化”指本体是计算机可读的( 即能被计算机处理) 。 ( 4 ) “共享”指本体中体现的是共同认可的知识,反映的是相关领域中公 认的概念集,即本体针对的是团体而非个体的共识。 从以上不同研究者的定义,可以看出本体涉及到的概念为术语词汇、术语、 关系、规则、概念化、形式化的规格说明、领域知识、表达和共享。其实,本 体就是通过对于概念、术语及其相互关系的规范化描述,勾画出某一领域的基 本知识体系和描述语言。虽然不同研究者对本体有不同的描述,但是从内涵上 来看,他们对本体的认识是一致的,都是把本体当作某个领域内可以是特定领 域的,也可以是更广的范围不同主体人、代理、机器等之问进行交流对话、互 操作、共享等的一种语义基础,即由本体提供明确定义的词汇表,描述概念和 概念之间的关系,作为使用者之间达成的共识。 7 第二章本体的相关知识 2 2 本体的分类 目前关于o n t o l o g y 的研究非常广泛,尤其是在国外,许多研究研究组织和 机构都建立了各具特色的o n t o l o g y 。针对目前出现的各种各样的o m o l o g y ,也 出现了不同的分类,以下三种分类方法使用最为广泛。 ( 1 ) 根据o n t o l o g y 应用主题,可将o n t o l o g y 划分为五种类型2 0 1 领域o m o l o g y 。领域o n t o l o g y 在一个特定的领域中可重用,它们提供 该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领 域的主要理论和基本原理等。对特定领域的o n t o l o g y 研究和丌发目前已涉及许 多领域,包括企业o n t o l o g y 、医学概念o n t o l o g y 、生物学o m o l o g y 等。 通用或常识o m o l o g y 。关注于常识知识的使用。通用知识o m o l o g y 的 研究包括著名的c y c 公司的0 p e n c y c o n t o l o g y ,最新版的o p e n c y c 包括6 0 0 0 个概念和6 0 0 0 0 个关于这些概念的声明( 包括概念问的关系、对概念的限制 等) ,另外o p e n c y c 还包括一个基于o n t o l o g y 的常识推理机。 知识o n t o l o g y 。它的研究重点是语言对知识的表达能力。典型的有斯坦 福大学知识系统实验室提供的一种称为知识交换格式k i f ( k n o w l e d g e i m e r c h a n g e f o r m a t ) 的知识描述语言,以及可以在线将各种知识转换为k i f 的 o n t o l o g y 服务器。目前普遍认为,所有其它的知识表示形式都可以转换为k i f 的形式。 语言学o n t o l o g y 。是指关于语言、词汇等的o n t o l o g y 。典型的实例有 g u m ( g e n e r a l i z e du p p e rm o d e l ) 和普林斯顿大学研制的w o r d n e t 。 任务o n t o l o g y 。也称为方法o m o l o g y ,任务o n t o l o g y 是o m o l o g y 研 究的另一个分支,主要研究可共享的问题求解方法,这里的推理方法与领域无 关,任务o n t o l o g y 主要涉及动态知识,而不是静态知识。任务o n t o l o g y 的研 究以c h a n d r a s e k a r a n 等人的关于任务和问题求解方法o m o l o g y 的研究为代 表。任务o n t o l o g y 中经常描述的要素包括:任务目标、任务数据、执行状态等 等。具体的研究主题包括:通用任务、与任务相关的体系结构、任务方法结构、 推理结构和任务结构等。 ( 2 ) 根据o n t o l o g y 表示的形式化程度,可将o n t o l o g y 分为四种类型: 完全非形式化。完全采用自然语言进行表示,结构非常松散,典型的如 术语列表。 结构非形式化。采用受限的或结构化的自然语言进行表示,能有效提高 8 第二章本体的相关知识 o n t o l o g y 的清晰度,减少二义性。 半形式化:采用一种人工定义的形式化语言进行表示,目前己有许多研究 机构丌发制定了这类形式化o n t o l o g y 表示语言,许多采用o m o l i n g u a 描述的 o m o l o g y 都属于这一类。 完全形式化。具有详细的概念项定义、语义关系的形式化定义以及稳固 和完整的公理和证明。 在实际应用中,这几种表示方式各有所长。如果o m o l o g y 的应用目的是为 了加强人与人之间的交流,则非形式化的o n t o l o g y 将更为适用,如果对 o n t o l o g y 的处理需要由机器自动完成,则其形式化程度越高越好,在有些情况 下,需要将非形式化和形式化两种方式组合起来了使用。 ( 3 ) 根据o n t o l o g y 的研究层次,可将o n t o l o g y 分为四种类型: 顶层o m o l o g y 。主要研究非常通用的概念,如空间、时间、对象、事件、 行为等,他们完全独立于特定的问题或领域。因此可以说顶层o n t o l o g y 可以在 一个很大的范围内共享。 领域o n t o l o g y 。研究与一个特定领域相关的术语或词汇,如医学、企业 模拟等。 任务o n t o l o g y 。定义通用任务或推理活动,如诊断等。它们都可以应用 顶层o n t o l o g y 中定义的词汇来描述自己的词汇。任务o n t o l o g y 和领域 o n t o l o g y 处于同一个研究和开发层次。 应用o m o l o g y 。描述特定的应用,它既可以应用特定的领域o m o l o g y 中的概念,又可以引出现在任务o n t o l o g y 中的概念。 这四种本体之间具有一定的层次关系,如图1 1 所示,o n t o l o g y 的这种分 类有利于o n t o l o g y 的创建、集成、共享和应用。 图1 1 本体分类和层次 9 第二章本体的相关知识 在实际应用中,这几种表示方式各有所长。如果o n t o l o g y 的应用目的是为 了加强人与人之间的交流,则非形式化的o n t o l o g y 将更为适用,如果对o n t o l o g y 的处理需要由机器自动完成,则其形式化程度越高越好,在有些情况下,需要 将非形式化和形式化两种方式组合起束了使用。 2 3 本体的建模元语 p e r e 等人用分类法组织了本体论,归纳出5 个基本的建模元语( m o d e l i n g p r i m i t i v e s ) 2 1 1 。 ( 1 ) 类( c l a s s ) 或概念( c o n c e p t s ) :指任何事务,如工作描述、功能、行 为、策略和推理过程。从语义上讲,它表示的是对象的集合,其定义一般采用 框架( f r a m e ) 结构,包括概念的名称,与其他概念之间的关系的集合,以及用 自然语言对概念的描述。 ( 2 ) 关系( r e l a t i o n s ) :在领域中概念或者属性之间的交互作用,形式上定 义为n 维笛卡尔积的子集r :e l c 2 c n ,如二元关系:子类关系 ( s u b c l a s s o f ) 。 ( 3 ) 函数( f u n c t i o n s ) :一类特殊的关系。该关系的前n 1 一个元素可以唯 一决定第n 个元素。形式化的定义为f :c l c 2 c n 1 - - - - c n 。如f a t h e r - o f 就 是一个函数,f a t h e r - o f ( x ,y ) 表示y 是x 的父亲:p r i c e o f - a - u s e d c a l 也是一个函数, 如果要计算一部二手车的价格必须要考虑车型、制造同期和里程数来决定。 ( 4 ) 公理( a x i o m s ) :是用来限制类和实例的取值范围的,公理中包括许多 具体的规则和约束。 ( 5 ) 实例( i n s t a n c e s ) :用来表示元素。从语义上讲实例表示的就是对象。 在o n t o l o g y 中,概念之间的基本关系有4 种:p a r t o f ,a t t r i b u t e o f ,i n s t a n c e o f 和k i n d o f 。p a r t o f 表达概念之间部分与整体的关系; i n s t a n c e o f 表达概念的 实例和概念之间的关系;a t t r i b u t e o f 表达某个概念是另外一个概念的属性。例 如概念“作者”可作为概念“论文的一个属性。k i n d o f 表达概念之间的继承 关系,给出两个概念c 和d ,记c7 = x ix 是c 的实例 ,d7 = x ix 是 d 的实例 ,如果对任意的x 属于d7 ,x 都属于c7 ,则称c 为d 的父 概念,d 为c 的子概念。一般情况下,o n t o l o g y 的概念之间都存在着层次性关 系( 或者说上下位关系) ,更高层的概念代表更抽象的意义,更低层的概念代表更 l o 第二章本体的相关知识 具体的意义,低层概念与它上层的概念是“k i n d o f ”的关系。所有的层次性关系 构成一个树状结构。图2 2 反映了一个音乐艺术领域的概念层次。 图2 2 本体中的概念层次 在实际的应用中,不一定严格地按照上述5 类元语来构造本体。同时概念 之间的关系也不仅限上面列出的4 种基本关系,可以根据特定领域的具体情况 定义相应的关系,以满足应用的需要。 2 4 本体描述语言 本体描述语言是用来描述本体的,它让用户可以为领域模型编写清晰、形 式化的概念描述。作为表示本体的语言工具,本体描述语言应该满足以下要求: 良好定义的语法( aw e l l d e f i n e ds y n t a x ) 良好定义的语义( aw e l l d e f i n e ds e m a n t i c s ) 有效的推理支持( e f f i c i e n tr e a s o n i n gs u p p o r t ) 充分的表达能力( s u 伍c i e n te x p r e s s i v ep o w e r ) 表达的方便性( c o n v e n i e n c eo fe x p r e s s i o n ) 大量的研究工作者活跃在该领域,因此诞生了许多种本体描述语言,自上 个世纪9 0 年代以来,一些基于a i 的本体实现语言陆续被提出,如k i f 、o n t o l i g u a 、 c y c l 、l o o m 、o c m l 和f l o g i c 。随着w e b 的发展,又出现了基于w e b 标准 的本体描述语言如s h o e 、x o l t 2 2 1 、r d f 、r d f s 、o i l 、d a m l + o i l 和o w l 。 本文着重研究w e b 的本体描述语言。 ( 1 ) s h o e 2 3 1 s h o e ( s i m p l eh t m lo n t o l o g ye x t e n s i t i o n s ) 作为h t m l 的扩展,是马里兰大 第二章本体的相关知识 学开发的。它是基于框架和规则的。它使用不同于h t m l 的一些标记,使得可 以在h t m l 文档中插入文本。当x m l 产生并成为w e b 上交换信息的标准后, s h o e 的语法被修改为基于x m l 。目前,马里兰大学已经停止研究s h o e ,他 们有关o n t o l o g y 的研究项目丌始使用o w l 和d a m l + o i l 作为o n t o l o g y 的描 述语言。 ( 2 ) x o l 【2 4 1 x o l ( o n t o l o g ye x c h a n g el a n g u a g e ) 是s r ii n t e m a t i o n a l 的人工智能中心 ( a i c ) 开发的。它是一种简单通用的定义o n t o l o g y 的方法。其目的是在不同 的数据库、o n t o l o g y 丌发工具、或者其它应用程序之间交换o n t o l o g y 。x o l 设 计之初是为生物信息学领域o n t o l o g y 的交换,但是它可以应用于各种领域。 ( 3 ) r d f ,r d f 5 1 2 5 , 2 6 j r d f ( 资源描述框架,r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) 、r d f s ( r d fs c h e m a ) , 是w 3 c 在x m l 的基础上推荐的一种标准,用于表示任何的资源信息。r d f 只 定义一个简单模型来描述资源之问的关系,r d f 模型本身并不提供机制来描述 它的属性,也不提供任何机制来描述属性之间的关系。r d f s ( r d fs c h e m a ) 定 义了一套类和属性来用于描述其它类和属性,因此r d f s 是对r d f 的基于 x m l 的实现。r d f s 在提供简单的机器可理解语义模型的同时,为领域化本体 语言( o i l ,o w l ) 提供了建模基础,并使得基于r d f 的应用可以方便地与这 些本体语言所生成的本体进行合并。r d f 这一特性使得基于r d f 的语义描述 结果具备了可以和更多领域知识进行交互的能力,也使基于x m l 和r d f 的 w e b 数据描述具备了良好的生命力。 ( 4 ) o i l 2 5 1 o i l 是一种针对o n t o l o g y 的基于互联网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论