




已阅读5页,还剩57页未读, 继续免费阅读
(计算机应用技术专业论文)语义互联网系统中本体的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
上海交通大学硕士学位论文 语义互联网系统中本体的研究 摘要 语义互联网( s e m a n t i cw e b ) 是下一代w e b 技术的应用,主要在 于提供计算机软件可处理的元数据( m e t a d a t a ) 描述和信息表达方式。 随着资源描述框架( r o f ) 技术的提出,各种信息可用统一的格式进 行语义化描述,将传统人工智能领域的研究成果应到到w e b 信息描述 的工作日益受到重视。已有不少的方法被提出以解决基于r d f 的知识 库编辑,逻辑推理等问题,如d a m l ,o i l ,s h o e 。本文介绍以r d f ( s ) 技术为基础的在w e b 上表达知识信息的方法,着重讨论运用r d f ( s ) 技术建立知识表示本体( o n t o l o g y ) ,并探讨动态扩展基本的r d f ( s ) 描述集合方法来增强表示特定领域知识的能力。 与传统的知识表达方式相比,r d f ( s ) 提供了x m l 文档、n t r i p l e 和g r a p h 三种语义描述能力相同的表示模型。文中以x m l 文档的形式 对r d f ( s ) 规范提出了修改建议,在不改变其核心语法的基础上增强 了知识描述的灵活性;通过引入一阶谓词逻辑的r d f 本体定义,将传 统的谓词逻辑公式用r d f 的方式进行描述。 在提出的修改建议和阶谓词逻辑本体定义研究的基础上,作者 实现了可视化的知识库编辑系统( o e e ) 。该系统是基于r d f s 技术的 可视化知识编辑环境,允许添加各种模块来实现对技术可行性的研究 工作,在该系统中应用了一阶谓词逻辑本体来实现规则描述。它是基 于r d f 技术研究和可行性分析的平台,允许按照不同的领域建立知识 工程项目。文中对该系统的整体构架和关键性技术进行了详细的说 明。并介绍了o e e 系统相关的工具集,r d f 图形化自动生成器与基于 r d f ( s ) 描述的数据资源j a v a c + + 代码生成器。最后还对o e e 系统的 下一步开发计划中逻辑推理和知识自动获取部分进行了概要说明。 通过对r d f ( s ) 知识描述能力的研究和o e e 系统的开发过程,文中 概要的提出了运用基于r d f s 技术的四层元语集合来进行知识表示的 总体框架。这四层集合分别是:基本r d f ( s ) 元语集合、通用描述元 语集合、公理描述元语集合和关系约束元语集合。使用这四层元语集 合,结合文中提出的用r d f s 和x m ls c h e m a 来综合表示数据类型的方 上海交通太学硕士学位论文 式,可以将大多数领域的知识信息以r d f ( s ) 的方式存储在w e b 系统 平台上。最后作者对基于r d f ( s ) 技术的知识表达研究工作进行了总 结,并对相关技术的研究方向进行展望。 关键词语义互联网,本体,资源描述框架,一阶谓词逻辑,知识库 编辑系统 上海交通大学硕士学位论文 o n t o i o g ye n g i n e e r i n g i ns e m a n t i cw e bs y s t e m a b s t r a c t s e m a n t i cw e b s p e c i a l i z e s i nt h em e t a d a t ad e s c r i p t i o na n d i n f o r m a t i o nm a c h i n ep r o c e s s i n g a sn e x t g e n e r a t i o n w e b t e c h n o l o g y a ni n f r a s t r u c t u r eu s i n gr d f ( s ) t ob u i i dk n o w l e d g e o n t o l o g yw i t ho n l i n e i n f o r m a t i o i nh a s g a i n e dm o r e a t t e n t i o n n o w a d a y s s o m er d fb a s e d s o l u t i o i nf o rk n o w l e d g ee d i t o ra n d r e a s o n i n gh a v eb e e nr a i s e d ,s u c ha sd a m l ,o i l ,s h o e t h ep a p e r p r e s e n t sm e t h o d o l o g yo fk n o w l e d g ep r e s e n t a t i o nu s i n gr d f ( s ) , a n df o c u s e so no n t o l o g ye n g i n e e r i n g a 1 s ot h ep a p e rt r i e st o i n c r e a s et h ea b l i l i t yo fk n o w l e d g ed e s c r i p t i o nb yg i v i n ga n e x t e n d e dl a y e ro fr d f ( s ) r d f ( s ) p r o v i d s t h r e ek i n do f s y n t a xm o d e l s ,x m ld o c u m e n t , n - t r i p l ea n dr d fg r a p h t h ep a p e ru s e sx m ld o c u m e n tt om a k et h e s u g g e s t i o n w h i c hl e a d st ot h ef l e x i b i l i t yo fk n o w l e d g e d e s c r i p t i o na b o u tr d fs e m a n t i cm o d e l a 1 s ow i t hx m ld o c u m e n t i ti n t r o d u c e st h ef i r s to r d e r l o g i c a lo n t o l o g y d e f i n i t i o n ( f o l o d ) av i s u a l i z e dk n o w l e d g eb a s ee n g i n e e r i n gs y s t e mn a m e do e ei s i m p l e m e n t e dw i t ha b o v es u g g e s t i o na n df o l o d t h eo e es y s t e m p r o v i d e sam e c h a n i s mw h i c ha l l o w sa d d i n gn e wf u n c t i o nm o d u l e s d y n a m i c a l l y ,a n dt h i sf e a t u r ec a ng r e a t l yi n c r e a s i n gt h es p e e d o fc u r r e n tr e s e a r c hp r o j e c t i nt h ep a p e r ,t h ed e t a i1 s y s t e m a r c h i t e e t u r ea n dk e yt e c hp o i n ta r ed e l i v e r e d ,a n da l s of u t u r e w o r k s ( k n o w l e d g er e a s o n i n ga n dr e t r i e v a l ) a n do e er e l a t e dt o o l s e ta r ei n t r o d u c e di nt h ep a p e r a c c o r d i n gw i t hr e s e a r c ha n dd e v e l o p m e n to ft h eo e es y s t e m ,t h e p a p e rp r o p o s e saf o u rl a y e r so n t o l o g ym o d e l i n gi n f r a s t r u c t u r e , b a s i cr d f ( s ) ,d u b l i nc o r e ,a x i o m sa n dp r o p e r t yc o n s t r a i n t s 3 上海交通大学硕士学位论文 u s i n g t h e s e l a y e r s c o m b i n e sx m l s c h e m a :g e n e r a l d o m a i n k n o w l e d g ec a nb ee x p r e s s e da n ds t o r e di nr d f ( s ) b a s e ds y s t e m a tt h ee n do f p a p e r ,ac o n c l u s i o na n d l o o k i n g f o r w a r do f r e s e a r c hp r o j e c ta r eg i v e nb yt h ea u t h o r k e y w o r d ss e m a n t i c w e b ,o n t o l o g y ,r d f ,f i r s t o r d e r l o g i c k n o w l e d g ee n g i n e e r i n gs y s t e m 上海交通大学 学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下 独立进行研究工作所取得的成果。除文中已经注明引用的内容外, 本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。 对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名:旁i 疆靛 日期:2 口王年? 月2 2 日 - 上海交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 同意学校保留并向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位 论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印或扫描等复制手段保存和汇编本学位论文。 ,保密函,在砻年解密后适用本授权书。 本学位论文属于 一 不保密口。 ( 请在以上方框内打“4 ”) 学位论文作者签名:训烫搬 指导教师签名 日期:2 一”缉3 月2 己日 踏j 渺秽 上海交通大学硕士学位论文 第一章简介 随着互联网信息的日益增加,基于w e b 的系统平台正从简单的提供给人们可 浏览的网页到提供更多的具有语义特征的计算机软件可处理的信息方向转变。下 一代的w e b 技术支撑的平台将支持信息语义化和智能服务,例如智能搜索引擎, 智能代理,智能信息过滤器等等。语义化的互联网,称之为语义互联网( s e m a n t i c w e b ) ,正逐渐的将i n t e r n e t 变成一个巨大的全球化的知识库。这个知识库能够 满足人们浏览信息的需要,更重要的是通过标准的语义规范使计算机自动读取和 处理信息。 现今的互联网技术通过h t m l 等协议提供给人们阅读信息的手段,对于这些 信息计算机软件程序还无法有效的进行处理。通过浏览器可以处理信息的显示方 式但是无法以语义的方式处理网页中包含的信患。语义互联网( s e m a n t i cw e b ) 的提出就是对现今w e b 信息的表示形式提出了扩展,使得各种信息可以被计算机 程序直接处理以及相互交换。通过w e b 传递计算机可理解的语义信息,最初的尝 试是在h t m l 的协议中标签 对整个网页进行属性描述。而x m l 语言使得通 过w e b 表示更为复杂的语义信息成为可能,通过网页创建者自定义标签( t a g ) 来注释网页中特定领域信息的语义而不仅仅是h t m l 的表示形式。 x m l 文档作为承载任何信息表示的容器,仅仅是一种规范的描述语言定义信 息的语法结构和存储方式。作为下一代的互联网技术,不仅仅需要用x m l 技术来 存储任何领域的信息,更需要能够通过语义理解的方式来处理这些领域信息。如 果同时以语义和语法的方式来存储和处理信息,除了x m l ,我们还需要信息的语 义化定义规范。资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ) ,简称r d f 1 , 是由w 3 c 提出的描述资源信息的元语言( m e t a d a t al a n g u a g e ) ,它提供了在互联 网上传递和处理语义信息的互操作性标准。r d f 通过x m l 语言制定了其语法的标 准,它是构架在x m l 规范之上的语义信息表示的元语言 9 。语义互联网的基本 概念就是将传统人工智能领域的知识表达采用r d f 文档的形式进行描述,知识可 以通过以r d f 文档的形式在互联网上处理和交换 7 。 r d f 所描述的知识模型在信息交换和处理时候可以很方便序列化成x m l 文 档。通过) ( m 乙规范中的命名空间( n a m e s p a c e ) 的应用 2 ,r d f 提供了一种非常 方便的共享不同知识库信息的方法。可以说,r d f 提供了一种可以描述任何领域 具体信息的方式。在r d f 技术的基础上,w 3 c 又提出了资源描述框架定义集 ( r e s o u r c ed e s c r i p t i o nf r a m e w o r ks c h e m a ) ,简称为r d f s 。为了满足描述信 息的需要,r d f s 允许用户自定义除了r d f 基本描述集合以外的特定领域的概念 元数据集合,称为本体( o n t o l o g y ) 。例如,r d f 规范中仅仅定义了描述知识本 体的基本词汇,像资源( r e s o u r c e ) ,属性( p r o p e r t y ) 等等。这些词汇还不能 满足描述一个特定领域具体信息,为了描述像服装、汽车等具体的概念,r d f s 允许通过s c h e m a 来定义这些本体( o n t o l o g y ) 。例如有了服装这个概念本体,就 可以在知识库中建立像一件特定的衬衫类似的实例信息( i n s t a n c e ) 了,。 目前,语义互联网相关技术正由一些标准制定组织和研究机构积极的推动和 完善。例如w 3 c 的r d f 规范和语义互联网研究小组,美国国防部d a r p a 的d a m l 项目 2 1 ,斯坦福大学的语义互联网门户以及欧洲i s t 项目中语义互联网技术研 究 5 等。 上海变通大学硕士学位论文 本论文的研究内容是基于实验室与i b ms u r 合作项目“下一代互联网技术”, 该项目的目标是下一代互联网的基础技术理论研究,重点在于设计基于r d f 标准 的新型知识构架方案和实现r d f 知识管理系统原型。论文的研究内容主要包括对 目前仍在制定中的r d fs c h e m a 规范提出修改意见以便更符合知识表达的需要; 基于r d f s 的与一阶逻辑谓词等价的本体( o n t o l o g y ) 定义;基于r d f s 技术的新 型知识库管理系统原型设计( o e e ) ,并在这个系统中应用了前面两个部分研究的 成果;最后提出了对r d f s 知识表达能力进行扩展的理论框架。 1 1 人工智能领域知识表达研究简介 随着计算机技术的飞跃发展,信息技术的应用日益普遍。“知识工程”这一 名称,在1 9 7 7 年第五届国际人工智能联合会议上,由美国斯坦福大学计算机系 教授费哥巴姆( e d w a r da f e i g e n b a u m ) 在关于“人工智能的艺术”演讲中首次 提到的。知识表达( k n o w l e d g er e p r e s e n t a t i o n ) 是知识在计算机中的表示方法 和表示形式,涉及到计算机数据的逻辑结构和物理结构。知识库( k n o w l e d g e b a s e ) 类似于数据库,包括对知识的管理、组织、维护和优化。对知识库的操作 主要靠知识库管理系统的支持 3 。 在人工智能领域对知识的研究有很多方面,例如知识的分类、知识分布表示、 知识库模型等等。在这里主要介绍知识表达的内容。对于人而言,知识可以通过 语言、文字、数学、符号、图表、图像等形式来表达;而对于计算机而言,知识 通过显示( 一阶谓词逻辑、产生式规则、框架、语义网络等) 和隐式( 神经网络) 等形式来表达。 知识表达的方式很多,其中比较著名的包括逻辑表示( 1 0 9 i c ) ,产生式规则 ( p r o d u c t i o nr u l e s ) ,框架模式( f r a m e ) 以及语义网络( s e m a n t i c n e t w o r k s ) 3 2 。它们都各有优缺点,例如逻辑表示采用谓词演算,对知识的描述具有严密 性和可解释性,其求解的过程清晰,可控;语义网络采用节点和带标记的边构成 有向图,知识的相关性可以很清晰的表示,但是不存在标准的术语约定,对图的 搜索算法需要强有力的组织原则;而框架模式是m i n s k y 在1 9 7 5 年提出的,把某 一特殊事件或对象的所有知识存储在一起的复杂数据结构,当分析和解释遇到的 新情况时,就从以前的实践活动中积累的知识来连想出新情况的相应结构,并将 新情况的细节装填到该结构中。这种表示形式多用于固定的事件和信息,后面要 提到的r d f s 就是与框架模式非常相似的知识表示形式。 图1 - i 人工智能领域知识表达形式 f i g u r e1 - 1k n o w l e d g er e p r e s e n t a t i o ni n a l 2 上海交通大学硕士学位论文 人工智能领域多年的研究已经针对这些知识的表示形式建立了多种计算机 语言,例如,谓词逻辑中的p r o l o g 、l i s p 、d u c k 、p l a n n e r ;产生式规则中的o p s 5 、 0 p s 8 3 、y a p s :框架模式中的f r l 、k r l 3 5 ;语义网络中的o w l 、k l o n e ;面 向对象的s m a l l t a l k 、e 忖:以及神经网络中的a x o n 。 随着i n t e r n e t 的发展,建立基于w e b 的知识表示形式也成为了必然的趋势。 而人工智能组织所提出的各种表示语言并未在w e b 上得到广泛接受。尽管人工智 能领域多年的研究对于处理结构化的知识已有了很强的根基,但对于处理w e b 上的半结构化语言文档仍有很大的困难,而由w 3 c 组织提出的基于x m l 技术的 r d f 语言,可以很好的对w e b 资源进行元数据标注,也己成为w e b 上普遍认可的 知识表达标准规范 6 。 1 2 r d f ( s ) 知识表达一些关键概念的介绍 在哲学中,把人们了解知识的过程定义为三步,首先是对整个世界中具体事 物的认识,其次是对具体事物进行概念的抽象( 找出其共同的地方) ,最后是用 抽象的概念再去认识具体的事物 4 。个比较典型的例子就是生物学上的门纲 分类法。在下面的知识表达中,将具体的事物称为实例( i n s t a n c e ) ,对具体事 物的抽象成为本体( o n t o l o g y ) 。例如“人( p e r s o n ) ”就是一个本体,而“张三” 就是一个实例,由于两者之间存在定义关系,也称作“张三”是本体“人”的一 个实例。 实例( i n s t a n c e ) :现实世界中具体的事物 本体( o n t o l o g y ) :对同类事物的抽象概念 对同类事物的范围不同,所得到的抽象概念也不同。例如,对于“张三”, 可以看作是本体“人”的实例,也可以看作是本体“生物”的实例。这说明了本 体之间是有层次关系的,可以把本体之间的关系看作是一个有向图( 简单的来 看) ,箭头指向为源本体的子类,例如“人”就是“生物”的子类。生物学上的 门纲分类法就可以看成是最简化的有向图( 树) 。本体与本体之间除了父子 类这个基本关系外,还存在着各种各样的关系,如果把这些关系看成是实例,那 它们的抽象概念称为属性( p r o p e r t y ) ,属性也是知识表达中的一个重要概念, 例如本体“人”就存在属性“姓名”,还可能存在属性“子女”。属性的实例有值 域( r a n g e ) 和定义域( d o m a i n ) 的概念,例如属性“子女”的值域就是本体“人”, 它的定义域也是本体“人”。 属性( p r o p e r t y ) :本体之间的关系定义为属性,属性也是一个本体 子类( s u b c l a s s o f ) :父子类是本体之间最为基本的属性实例 由于描述的需要,对万事万物总的抽象概念,定义为资源( r e s o u r c e ) 。资 源是一个本体,它是其它任何本体的父类,也是属性的父类,它是人们认识领域 中最抽象的终极本体。资源在s c h e m a 、o n t o l o g y 中都作为所有类的父类存在。 资源( r e s o u r c e ) :所有事物的抽象本体,是一切本体( 包括属性) 的父类 上海交通大学硕士学位论文 人们对知识的认知分为两个部分,抽象概念( 本体、属性) 和具体事物( 实 例) 。在r d f 的表示中,实例是由本体来定义的,例如“张三”是被“人”定义 的。那么“人”是由谁来定义呢? 或者说本体是由什么来定义呢? 那就是r d p s c h e m a ( r d f s ) ,r d f s 是定义知识本体的元语言,又可以称为元知识。 r d fs c h e m a :基于r d f 的用来定义本体和属性的语言 r d fo n t o l o g y :用r d f 语言描述的被s c h e m a 定义的本体和属性 r d fi n s t a n c e :用r d f 语言描述的被本体( o n t o l o g y ) 所定义的实例 r d f s 中最重要的两个概念是r d f s :c l a s s 和r d f :p r o p e r t y ,所有r d f o n t o l o g y 中的本体都是由r d f s :c l a s s 来定义的,而所有的属性都是由 r d f :p r o p e r t y 来定义的。例如本体“人”就是r d f s :c l a s s 的一个实例,而“张 三”就是“人”的一个实例。 r d f s :c l a s s :用来定义本体的s c h e m a 关键字 r d f :p r o p e r t y :用来定义属性的s c h e m a 关键字 除了前面提到的c l a s s 和p r o p e r t y 以外,在计算机上有很多标准的数据类 型( 整数、字符串、时间、货币) 也需要有s c h e m a 定义的关键字,在r d f 中统 称为元数据了型r d f :l i t e r a l 。 r d f :l i t e r a l :用来定义计算机内标准数据类型的s c h e m a 关键字 以上介绍了关于r d f ( s ) 知识表达的关键概念,为了清晰的描述r d f 的规范, 以下介绍r d f 的三种常用表示方式:x m l 文档、n - t r i p l e 和r d fg r a p h 。x m l 文 档适合将知识在网页中进行存储和在不同应用之间传递:n - t r i p l e 适合计算机 来处理知识( 推理、搜索) ;r d fg r a p h 适合人们对所表达知识的了解。图卜2 中的实例表示了基于r d f 的以三种方式描述的老师的实例。 蠢匡#john,title,professor a r d f 文档b r d fg r a p h c n t r i p l e 图1 - 2r d f 的三种表示方式 f i g u r e1 - 2r d f 1 1 1 r e ek n o w l e d g em o d e l s 1 3r d f 规范介绍 资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 是用于描述元数 据( m e t a d a t a ) 的通用机制规范。r d f 提供了一种描述资源( r e s o u r c e ) 的模型。 r d f 将任何可由u r i ( u n i f o r mr e s o u r c ei d e n t i f i e r ) 唯一标示的对象定义为资 4 上海交通大学硕士学位论文 c:!:二“,。n。s。;。n” 如果对a u t h o r 要进行更加详细的描述,比如a u t h o r 的e m a i l 地址和练习方 式,那么就需要对上例进行扩展。在本例中,需要对j o h ns m i t h 详细的描述。 在描述j o h ns m i t h 的详细信息以前,需要新建立一个新的资源来表示他,对应 于此 n a m e i c h o m e i n c ,+ “j o h ns m i 吐l ” 图卜4 图形化r d f 表示( 二) f i g u r e 卜4r d fg r a p hs a m p l e ( 2 ) 上海交通大学硕士学位论文 在上图中,字符串”j o h ns m i t h ”被一个资源a u t h o r 一0 0 1 代替,这个资源与属 性类型n a m e ,e m a i l ,a f f i l i a t i o n 相联系。这样做的目的是为能使明确资源与 属性之间的联系。这是很重要的一点,因为j o h ns m i t h 可能同时是几个不同属 性类型的属性值。j o h ns m i t h 可以使d o c u m e n t l 的作者,也可以同时是一家公 司的总裁。建立可确认资源就保证了对各种信息重用的明确性,方便性。 在本例中,针对作者( a u t h o r ) 建立了资源,而不是针对作者的名字( n a m e ) , e m a i l 或者联系方式( a f f i l i a t i o n ) 。r d f 模型允许资源的多层次定义。比如我们 现在要对a u t h o r 的名字进行详细的分析,那么我们就可以建立一个代表作者名 字的资源,这个资源可以具有f i r s tn a m e ,s u r n a m e 等属性类型。显然,这样的 迭代描述可以持续很多层。 r d f 定义了一种简洁有效的描述资源的模式。为了存储这种模式生成的实例, 并可使这些实例是机器可读的,r d f 规定了x m l 作为其语法规则。这样做同时保 证了r d f 对语义表达的一致性要求。在不同的领域之间消除语义表达的歧义是非 常重要的。比如说,属性类型”作者”( a u t h o r ) ,在不同的领域里其所要表达的信 息可能是有区别的。为了防止这样的情况出现,r d f 利用x m l 命名域( n a m e s p a c e ) 机制定义了一套属性类型作为标准。x m l 命名域通过确定明确的单词表来无歧义 的表达语义。比如,d u b l i nc o r ei n i t i a t i v e 对属性类型”a u t h o r ”的定义是” 对资源的建立有智力贡献的人或组织”,并将其列入了d u b l i nc o r ec r e a t o r 的 元素当中。如果将d u b l i nc o r er d fs c h e m a 简写为”d c ”,那么上例数据模型如 下图所示: 图i - 5 图形化r d f 表示( 三) f i g u r e 卜5r d fg r a p hs a m p l e ( 3 ) 上图更加清楚地描述了资源d o c u m e n tl 具有已在d c ( t h ed u b l i nc o r e v o c a b u l a r y ) 中唯一定义的属性类型c r e a t o r 。这个属性类型的属性值是j o h n s m i t h 。与之相应的x m l 格式的描述方式如下: j o h ns m i t h 本例中,对r d f 和d u b l i nc o r e 进行了声明,并分别简写为r d f 和d c 。声明 r d fs c h e m a 是为了可以声明为了表达数据模型所需的单词表,声明d u b l i nc o r e s c h e m a 是为了利用其单词表来进行描述。与命名域相联系的u r i 指向了相应的 s c h e m a 。元素 在x m l 文件中声明了支持r d f 数据模式起作用范围。元 素 用来进行对于u r ih t t p :u r i o f d o c u m e n t 一1 的数据模式 的定义或者实例化。在 中的元素 描述了一个属 性类型d c :c r e a t o r 和对应的属性值”j o h ns m i t h ”。关于r d f 的更加详细的介绍, 6 上海交通大学硕士学位论文 请参阅w w w w 3 c o r g r d f 中的文档。 1 4 从框架表示到r d f s 规范 相对于r d f 而言,r d f s 在建立特定领域本体方面作用更为重要。r d f s 在r d f 基础之上定义了一组可清晰描述知识本体语义的元语集合,这里我们对r d f s 的 基本框架作介绍。 在r d f s 中,最上层的抽象根类结点是r d f :r e s o u r c e ,它又派生出两个子类 r d f s :c l a s s 和r d f :p r o p e r t y 。任何领域的知识都可以看成是这两个子类的实例。 r d f s :c l a s s 语义上代表了领域中的概念本体,而r d f :p r o p e r t y 代表了领域中本 体的属性。例如:t e a c h e r 和s t u d e n t 都是r d f s :c l a s s 的实例,相应的n a m e , t i t i e 等就是r d f :p r o p e r t y 的实例。在r d f s 规范中,特别定义了 r d f s :s u b c l a s s o f 作为r d f :p r o p e r t y 的实例来表示r d f s :c l a s s 的实例属性。这 样,就可以定义不同本体之间类的从属关系,从而建立了知识表达中最基本的本 体语义层次结构。类似的r d f s :s u b p r o p e r t y o f 作为r d f :p r o p e r t y 的实例来表示 r d f :p r o p e r t y 的实例属性,可以定义不同属性之间的从属关系。在r d f s 规范中, 定义了r d f s :d o m a i n 和r d f s :r a n g e 来表示r d f :p r o p e r t y 的实例所应用的范畴, 即r d f :p r o p e r t y 的实例是属于哪个r d f s :c l a s s 的实例的。例如:用 r d f :p r o p e r t y 来定义n a m e ,然后用r d f s :d o m a i n 来定义n a m e 是作用在t e a c h e r 和s t u d e n t 之上的。下面我们通过图i - 6 的例子来说明r d f s 怎么来定义知识本 体。 上海交通大学硕士学位论文 r d f s :c l a s sr d f :l d = t e a c h e r 。) 1 r d f s :c l a s sr d f i t d = ”s t u d e n t ) r d f s :c 】越s ) r d f :p r o p e r t yr d i d 芒t i t l e , r d f s :d o m a i nr d r e s o u r c e = ¥t e a c h 麓 r d 盎:d o m a i nr d f = f e $ o u r c e = w s t u d e n r ) k d f :p r o 啤r w ,蓑 篁 盆 r d t j p r o p c r t yr d i d 一t e a c h , r d f s :d o m a i nr d f ;r s o u r c e = t e a c h e r r d f :d e s c f i p t l o na b o u t = 1 j o h n , 盆茔 j e n n y 叫n a m e i 制f d e 轼r f 口n o n 图1 - 6 用r d f s 定义老师和学生本体以及r d f 实例描述 f i g u r e 1 6o n t o l o g yo ft e a c h e ra n ds t u d e n ti nr d f s 在图l 一6 中,两个r d f s :c l a s s 的实例被定义,它们分别是t e a c h e r 和 s t u d e n t 。由于r d f 中规定所有的知识都是r e s o u r c e 的子类,所以t e a c h e r 和 s t u d e n t 都拥有r d f s :s u b c l a s s o f 这个属性。随后定义的n a m e ,t i t l e ,t e a c h 分别是t e a c h e r 和s t u d e n t 的属性,是r d f :p r o p e r t y 的实例。注意到上半部分 r d f s 定义中没有任何实例涉及,也就是说r d f s 是用来定义知识的抽象和共同的 概念信息。 图1 - 6 中由于有了上半部分关于知识概念的定义,这部分内容除了语法信息 又包含了语义信息。应用程序可以通过r d f s 的定义来了解其语义,从而可以进 行基于语义的信息处理。这也就是r d f 所提供的知识表示的形式。r d f s 是一种 通用的表达知识的手段,它本身的定义也是用r d f s 来描述的。也就是说r d f s 是自描述的,通过这一点,就实现了知识表达功能定义的闭包。关于r d f s 的更 加详细的介绍,请参阅w w w w 3 o r g r d f 中的文档。 1 5 本文的组织 本文的第一章,即本章,对论文内容和背景做了简单的介绍。第二章对r d f s 目前规范定义中的某些地方提出修改建议。2 1 节说明了取消属性约束条件的原 上海交通大学硕士学位论文 因。2 2 节扩展现有d o m a i n 和r a n g e 对属性描述的支持。2 3 节对该章进行了小 结。 本文第三章对基于r d f s 的一阶谓词逻辑本体定义进行了详细的描述。3 1 节介绍了量词本体定义。3 2 节介绍了逻辑操作符本体定义。3 3 节对规则表达 式本体定义进行了详细的阐述。3 4 节描述了增加逻辑本体来关联规则表达式与 知识库中知识节点。3 5 节以学校信息定义为例子,说明了一阶谓词逻辑本体对 基于r d f s 的知识库规则使用。 本文第四章介绍了o e e 系统的原型实现。4 1 节描述了该系统的原型实现的 功能划分。4 2 节描述了该模型的总体构架,包括存储及功能模块划分。4 3 节 对运行态知识表示模型进行了阐述。4 4 节说明数据库存储方案。4 5 节核心r d f s c h e m a 集的动态加载算法。4 6 节介绍了规则本体的动态加载。4 7 节介绍了o e e 系统内部消息事件模型。最后4 8 节对o e e 系统进行了总结并介绍了下一步开发 计划。第五章介绍了与o e e 系统相关的r d f 辅助设计工具,5 1 节介绍了可视化 r d fg r a p h 生成器。5 2 节介绍了基于r d fs c h e m a 描述的资源信息j a v a 与c + + 代码生成。 通过对以上工作的总结,本文第六章介绍了基于r d f ( s ) 之上扩展知识库描 述元语集合。6 1 节介绍了通用描述元语集合。6 2 节介绍了公理描述元语集合。 6 3 节介绍了关系约束元语集合。最后在6 4 节给出了本章的小结。 本文第七章对所进行的r d f s 知识表达相关工作进行了总结,指出了目前研 究存在的不足,并对下一步的工作计划进行了展望。 上海交通大学硕士学位论文 第二章r d f s 规范修改建议 在应用r d f 实现基于w e b 的知识库管理系统中,发现了r d f s 规范中存在一 些并不实用的定义和约束条件,这里对这些部分提出了修改建议,以便更好的利 用r d f s 来进行知识的表达,这些修改不会对r d f s 核心解释产生歧义。鉴于r d f s 规范目前仍处在预发布阶段,以下的修改建议被认为是可接受的。 3 1 取消属性约束条件 r d f s 与传统的框架模式非常相似,在r d f s 规范中定义的核心元素集包括了 c l a s s ,p r o p e r t y 和c o n s t r a i n r e s o u r e e ,它们分别对应到框架模式中的f r a m e , s l o t 和f a c e t 。在1 4 节的r d f s 规范介绍中,说明了c l a s s 和p r o p e r t y 分别是 用来定义本体和资源( 本体、元数据类型) 之间的关系( 属性) 。在知识表示里, 往往需要对属性的定义进行约束,例如本体“人”与本体“汽车”之间有一个“拥 有被拥有”的属性。那么这个“拥有被拥有”的属性就需要用定义域( d o m a i n ) 和值域( r a n g e ) 来进行约束。这种约束被称为f a c e t ,也就是一个 c o n s t r a i n r e s o u r c e 的实例。 在r d fs c h e m a 规范中说明了定义c o n s t r a i n r e s o u r c e 的目的就是为了处理 r d f s 文档的程序模块可以明确知道所遇到的未知实例是否是用来定义资源的约 束条件。但在应用r d f s 规范实现知识表达程序时,发现可以把 c o n s t r a i n r e s o u r c e 也看成是p r o p e r t y ,这样资源的约束条件也成为了资源的属 性定义,大大简化的算法的复杂度,将r d f s 规范中的核心元素集变为了c l a s s 和p r o p e r t y 两个,将r a n g e 和d o m a i n 从c o n s t r a i n p r o p e r t y 的实例转变定义为 p r o p e r t y 的实例,简化了数据结构。图2 - 1 表示了d o m a i n 和r a n g e 的原r d f s 规范定义及修改后的定义。 将c o n s t r a i n r e s o u r c e 归类成p r o p e r t y ,在程序算法上简化复杂度,但是 也使其表示的知识无法用传统的r d fg r a p h 来表达。r d fg r a p h 用节点与箭头分 别表示本体与属性,或者属性与约束条件,而将c o n s t r a i n r e s o u r e e 与p r o p e r t l 合并后,就会存在节点是属性,箭头也是属性的情况,使入难以理解,也是这种 简化的缺点所在。但在前面讨论的关于r d f 的三种表达方式中的】( m l 和n - t r i p l e 都不会产生任何的影响。 1 0 上海交通大学硕士学位论文 d o m a i n 、r a n g e 原r d f s 规范定义( 略去注释部分) ( | r d f s :c o n s t r a i n t p r o p e r t y r d f s :r a n g er d f r e s o u r c e = ”# c l a s s ”, f i e l d 、r a n g e 修改后的r d f s 定义( 略去注释部分) r d f s r :a n g er d f i r e s o u r c e = ”h t t p :w w w w 3 o r g 2 0 0 0 0 1 r d f - s c h e m a # c l a s s ”序 图2 一ld o m a i n 和r a n g e 的原r d f s 规范定义及修改后的定义 f i g u r e2 - im o d i f i c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 间出租全套物品合同范本
- 税务服务类合同补充协议
- 福田指标房买卖合同协议
- 美术培训授课合同协议书
- 笔记本定制采购合同范本
- 生产安全施工协议书模板
- 混凝土地泵租赁合同范本
- 电子合同买卖协议书范本
- 精装房材料工程合同范本
- 股东借款给公司合同范本
- 2025年上海中考复习必背英语考纲词汇表默写(汉英互译)
- 油料保管员面试题库及答案
- 《中国脑卒中防治报告(2023)》
- 集团公司企业各岗位廉洁风险点防控表格(41份)
- 水泵知识培训课件
- 输液反应应急及处理流程
- 2024-2025学年人教版初中地理七年级下册课件 第7章 第2节 人文环境
- 组织的知识的理解
- 2025年烟台汽车工程职业学院单招职业技能测试题库带答案
- 门窗高空作业安全免责协议书7篇
- 设施农用地土地复垦方案报告书
评论
0/150
提交评论