




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 语义w 曲是现有w 曲的延伸,同时也被看成是下一代w 曲的发展方向,其目标 是让w 曲上的信息能够为机器所理解,实现w 曲信息的自动处理,从而使得计算机和 人类能够更好地协同工作。语义w 曲的技术体系是分层的,包括了x m l 、r d f 、i m f s c h e m a 、w 曲本体语言等等基本技术。其中r d f 是实现语义w 曲的关键技术之一, 它提供了一种标准的、可互操作的方式r d f 数据模型,以便对w 曲资源的含义加 以描述。i m fs c h e m a 作为对r d f 的扩展,用来增强对资源语义的进一步描述。 本体用于定义某个领域内的词汇及词汇之间的关系,以便于描述和表示该领域内 的知识。在使用计算机对数据进行处理的环境中,本体需要通过一种形式化的语言来 描述,计算机才能处理,这就是本体描述语言。o w l 是由万维网联盟设计开发的一种 本体描述语言。它以描述逻辑作为理论基础,同时吸取了d a m l + o i l 开发过程中的经 验和教训,既提供了很强的描述能力,又简单易用,从而使其具有了很好的应用前 景,本系统中也采用了0 w l 作为本体的描述语言。 本文以高校教师的信息处理为实际应用场景,探讨了怎样将语义w e b 技术和本体 技术进行结合,并应用于信息处理领域。通过这些技术的应用,使得该信息处理系 统,不仅具有了传统的信息处理系统的功能:信息的发布、查询和维护,同时使得该 系统具有了一些新的特点:易扩展性、查询灵活性以及对数据的自动处理能力。 关键字:语义w 曲,本体,i m f ,o w l a b s 仃a c t s e m a n t i cw e b ,a sa ne x t e n s i o no fm ec u e n tw e b ,i st h ev i s i o no ft h en e x tg e n e r a t i o n w e bt e c l l l l o l 0 2 yw h i c ha i m sa tt h a ti n f o h n a t i o no nt h ew e bc a nb eu n d e r s t o o db ym a c h i n ea n d c a nb ep r o c e s s e da u t o m a t i c a l ly ,s ot h a th u m a n sc a nc o m m u n i c a t ew i t hm a c h i n eb e t t e r _ s e m a n t i cw e bh a sal a y e r e da r c h i t e c t u r ei n c l u d i n g s o m e s p e c i a lt e c l l l l o l o g i e s a n d s p e c i f i c a t i o n s ,s u c ha sx m l ,r df ,r d fs c h e m a ,w e bo n t o l o g yl a n g u a g e r d f ,o n eo ft h e m o s ti m p o r t a n tt e c h n o l o g i e s ,i su s e dt od e s c r i b et h es e m a n t i c so fw e br e s o u r c e sb ya s t a n d a r d i z e di n t e m d e r a b l em o d e l r d fd a t am o d e l r d fs c h e m ai sa 1 1e x t e n s i o no fr d f w h i c hh a sm o r ee x d r e s s i v ea b i l i t vt od e s c r i b et h es e m a n t i c so f w e br e s o u r c e s o n t o l o g yi su s e dt od e f i n em ev o c a b u l a r ya n dt h er e l a t i o n s h i pa m o n g t 1 1 ev o c a b u l a r i e s , a n dt h e s ev o c a b u l a r i e sc a nb eu s e dt op r e s e n ta n dd e s c r i b et h ek n o w l e d g eo fs p e c i f i cd o m a i n s i nc o m p u t e r i z e de n v i r o l l i n e n t ,a no n t o l o g ys h o u l db ed e s c r i b e db yaf b r n l a ll a n g u a g et o e n s u r et h a tc o m p u t e r sc a np r o c e s st h eo n t o l o g y t h i sk i n do fl a n g u a g ei sc a e dw e bo n t o l o g y 1 a n g u a g e o w li so n eo fw e bo n t 0 1 0 9 yl a n g u a g e s ,d e v e l o p e db yw 3 c o w l i sb a s e do n d e s c r i p t i o nl o g i c sa 1 1 dm e1 e s s o n s1 e a m e df r o mt h ed e v e l o p m e n to fd a m l + o i lt h e f 音a t u r e so fe x p r e s s i v e n e s sa n de a s y t o u s ep r o v i d eav e r yg o o dp r o s p e c t i v eo fo w l a p p l i c a t i 。n i nt 王1 i ss y s t e m ,w e _ u s e 曲eo w ll a j l g u a g et od e s i g no u ro m o l o g 矿 b a s e do nt h ea c t u a la p p l i c a t i o ns c e n eo fp r o c e s s i n gc o i i e g et e a c h e r s i n f o m a t i o n ,t h i s p a p e rd i s c u s s e sh o w t oi n c o r p o r a t em et e c h n o l o g i e so fs e ma i 】t i cw e ba n do n t o l o g ya n da p p l y t 1 1 e mt ot h ea p p l i c a t i o ns y s t e m t h e s et e c h n o i o g i e sn o to i l l yp r o v i d et h eb a s i cf u n c t i o n s : p u b l i s h i n g ,q u e r y i n g ,a n dm a i n t a i n i n g ,b u ta l s o1 e a dt os o m en e wf e a t u r e s :e x t e n s i b i l i t y a r b i t r a r yq u e r ya n da u t o m a t e dd a t ap m c e s s i n g k e y w o r d s :s e m a n t i cw e b ,o n t o l o g y ,r d f ,o w l i i 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过 的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。 研究生签名: i 堡垒! 么日期:幽 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可 以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权东南大学研 究生院办理。 研究生签名:i 墨导师签名: 日期: 1 1 研究背景 第一章引言 近几年,随着互联网的发展,w 曲( w b r l dw i d ew 曲万维网,以下简称w 曲) 上信息的数 量也呈几何级数的增长,这一方面为人们提供了更多的可共享的信息:另一方面,却增大了人 们获取所需要信息的难度。虽然通过搜索引擎的帮助,一定程度上减小了这种难度,但目前所 采用的这种关键字匹配的搜索技术很难在查准率上让人们满意。而且随着多层w 曲体系结构 的应用,有越来越多的数据被存储到数据库中,这更让搜索引擎显得力不从心。同时,我们注 意到,在庞大的互联网环境中,几乎所有的计算机所起到的作用都只是存储数据、传输数据或 显示数据,担当着人与信息之问的媒介。如果能够让这些计算机理解所存储和传输的数据的 话,其势必可以帮助人们去选择、鉴别,并进而自动地去处理这些数据,这样将极大地提高数 据的自动处理能力。正是在这种情况下,w e b 的创始人t i mb e m e r s - l e e 在1 9 9 8 年提出了对新 一代w e b 的设想语义w e b ( s e m a n t i cw e b ) :语义w 曲是现有w e b 的延伸,它为w 曲的 实际信息内容提供形式化的含义,以实现信息在语义层的互操作,从而使得计算机和人类能够 更好地协同工作【l j 。亦即,语义w 曲的目标是让w 曲上的信息能够为机器所理解,从而实现 w 曲信息的自动处理( 如自动搜索、知识获取、逻辑推理等) ,以适应w 曲信息资源的快速 增长,更好地为人类服务。 由此可见,语义w 曲的主要观点就是以一种机器可理解的方式来表示w 曲上的数据。要 实现这个目标,首先得依赖于一些将w 曲数据进行形式化表示的语言规范( 如x m l ,x m l s c h e m a ,r d f ,r d fs c h e m a 等) 。在这些语言中,r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k 资 源描述框架) 是实现语义w 曲的关键技术之一,它提供了资源的通用描述方式,是一种用来 描述资源及其相互之间关系的语言规范。r d f s ( r d fs c h e m a ) 是r d f 的扩展,用来增强对 资源语义的进一步描述,如类、属性、类与属性之间的隶属关系等。 同时,为了提高对w 曲数据的自动处理能力,语义w 曲的研究者们又引入了在人工智能 和知识表示领域得到广泛应用的本体及其相关的技术。本体原本是一个哲学概念,以用来描述 事物的本质。后来,一些人工智能的研究者将本体应用至计算机领域用以描述或表达某一领域 知识的一组概念和术语。在语义w 曲中,本体可以看作是领域概念模型的显式表示,它们提 供了描述数据语义的元信息,方便知识的共享和重用,同时,通过提供本体概念间隐含的推理 规则,可以提高数据的自动处理能力。 本文的主题就是探讨在这种背景下,如何对这些技术进行整合,并进而应用至系统的开发 中,从而使得这些技术能够在这种新的w 曲应用系统中发挥更大的作用,为我们提供一个更 加智能化的信息共享和交互的途径。 1 2 发展现状 与语义w 曲相关的一些技术规范,比较有影响的应该是由w 3 c ( 万维网联盟) 所开发的 相关标准。早在1 9 9 9 年,w 3 c 就制订了“r d fm o d e la n ds y n t a ) ( ”规范【2 】该规范中介绍了表 示r d f 元数据的模型和对元数据进行编码的语法。2 0 0 0 年3 月2 7 日又发布了r d fs c h e m a 的 候选标准,其中介绍了如何使用r d fs c h e m a 来描述r d f 词汇,并为此专门定义了一些基本 的用于定义词汇的原语。 但在后来,w 3 c 的r d f 核心工作组又对“r d fm o d e la n ds y n t a x ”标准进行着不断的修 订,直到2 0 0 4 年2 月1 0 日,发布了新的一套r d f 相关技术的规范,其中包括:r d f p r i m e r p l ,r d fc o n c e p t s 【斗j ,r d fs y n t a x 【“,r d fs e m a n t i c s 【,r d fv b c a b u l a r y 【“,r d ft e s t c a s e s 【8 】共六个推荐标准。这套规范作为一个整体,对r d f 相关技术作了新的描述,用以取代 先前的规范r d fm o d e la n ds y n t a x ( 1 9 9 9 推荐标准) 和r d fs c h e m a ( 2 0 0 0 候选推荐标准) 。 其实,在w 曲本体语言方面,比较早的规范有美国的d a 砌) a 所开发的d a m l ( d a r p a a g e n tm a r k u pl a n g u a g e ) h 语言规范和欧盟的机构i s t 所开发的0 i l ( o n t o l o g yi n t e r c h a n g e l a n g u a g e ) 【l 叫规范。d a m l 和o i l 在许多方面有相似之处,因此两家机构于2 0 0 1 年成立了一 个联合委员会,对两个规范进行了整合,从而形成了一个新的w 曲本体语言规范 d a m l + o i l 【】。 与此同时,w 3 c 也成立了一个专门的工作组w 曲本体工作组( w 曲o n t o l o g yw o r k i n g g r o u p ) ,负责w 曲本体语言规范的制定工作。经过反复的讨论、修订之后,他们于2 0 0 4 年2 月1 0 日,发布了一套w e b 本体语言的推荐标准。共包括如下的几个规范:o w l o v e r v i e w 【12 1 ,o w lg u i d e 【1 3 】,o w lr e f e r e n c e 【1 4 】,o w ls e m a n t i c sa n da b s t r a c ts y n t a x 【15 1 ,o w l t e s tc a s e s ,o w lu s ec a s e sa n dr e q u i r e m e n t s 【1 7 】,o w l x m lp r e s e n t a t i o ns y n t a ) ( 【1 8 】等。 其实,在这些语言规范进行设计和开发的过程中,就已经有一些研究性的机构和组织在应 用系统的开发中采用了相关的技术。例如在h p ( 惠普) 实验室的e p e r s o n i l 州p u 项目中,采用 d a m l 定义了一个用来描述和表示个人信息的元数据模型,该模型对用户的个人基本信息、 兴趣爱好、电影、图片、音乐等信息进行了描述和标注。在麻省理工学院所开发的h a y s t a c k 【2 叫 项目中则大量地采用了砌) f 技术。而在卡内基梅隆大学的e w a l l e t 【2 u 项目中,则使用了r d f 技术和处于修订中的o w l 技术,他们通过r d f 来描述信息,然后采用o w l 定义了一套对这 些信息进行处理的逻辑推理规则。通过这些规则的定义和应用,使得该系统的数据处理能力大 大提高。 目前而言,由于语义w 曲的相关技术规范颁布不久,因此,当前采用这些技术所实现的 系统主要是基于处于修订中的一些规范,都还需要根据新颁布的规范作相应的完善。同时,语 义w 曲的相关处理工具的实现也非常少,而且在处理能力上也有待改进。 1 3 研究目标与内容 本文的主要研究内容就是设计并实现一个基于语义w 曲的高校教师信息处理系统,探索 基于语义w 曲的信息处理系统的系统结构和实现方法。同时,将在多种应用系统如a g e n t 系 统、知识管理系统中得到广泛应用的本体技术应用到本系统中,并分析本体技术对基于语义 w 曲的信息处理系统所起到的作用。 因此,本论文及相关的研究工作的目标就是以高校教师信息处理为实际应用场景,采用语 义w 曲技术和本体技术实现一个应用系统。 本文共分五章。其余各章的内容安排如下: 第二章详细介绍语义w 曲及其相关的技术,重点描述了语义w 曲语言r d f 及r d f s c h e m a 和w 曲本体语言o w l ;第三章介绍了本体的基本概念和本系统中本体的设计,然后 结合这些本体论述了基于本体的逻辑推理;第四章详细介绍了该系统的分析、设计与实现,包 括系统的需求分析,系统结构设计和详细设计等,并且对系统的实现作了一个完整的介绍;第 五章为本文工作的总结及进一步的展望。 2 第二章语义w - e b 基本技术 语义w e b 作为当前w e b 技术的一个发展方向,有着美好的应用前景。而且随着这几年, 语义w 曲研究工作的广泛且深入的开展,在支持语义w 曲应用的基本技术方面,尤其是基本 技术规范的制定上,取得了很大的进展。 2 1 概述 当前,w 曲技术正在迅猛地发展着,它的发展方向主要表现在如下的几个方面。一是资源 搜索方面,人们查找w 曲上的资源,正在从简单的关键字匹配向复杂的语义匹配发展;二是 w e b 用户方面,正在从纯粹意义上的人与人向着人、机可同时理解并共享w 曲上的资源的方 向发展;三是在w 曲所承担的任务和角色方面,正在从单纯的提供资源的角色发展至不仅可 提供资源,且能够提供各种服务并完成相应的行为。 要实现这些目标,通过现有的技术来表示w 曲上的数据是不够的。当前w 曲上的数据都 是采用h t m l 和x m l 等标准来表示的,随着互联网的发展,它们的弱点也表现得越来越突 出。h t m l 只是一种显示技术,并不能指出其标记说明所表示的含义。x m l 注重描述数据的 内容和结构,可以将数据和显示分离,但也只是在语法上统一了数据交换的格式,并没有提供 基于语义的表达方式。而要实现机器理解w 曲的内容,就必须提供对数据进行语义表示的方 式。于是,在1 9 9 8 年1 0 月,t i mb e m e r s l e e 提出了语义w e b 的设想。按照t i mb e m e r s l e e 及其合作者的构想,语义w 曲的体系结构是一种分层式的,如图2 1 所示: t r u s t p r o o f 。 l o g i c 与 营 o n t o i o g yv o c a b u l a 叮 呈p 竺 皇 r d f r d fs c h e m a 璺p 口 x m l ,x m ln a m e s p a c e ,x m ls c h e m a u n i c o d e u r j 图2 1 语义w 曲的体系结构 第一层由u r i 和u n i c o d e 构成,提供一种统一的w e b 资源的表示方式和编码方式;第二 层主要解决数据交换中的语法问题,由x m l 、x 池s c h e m a 等相关技术组成;第三层是解决 关于元数据的互操作性问题,主要有r d f 和i m fs c h e m a ;第四层为本体词汇层,目的是为了 提供一个对元数据进行描述和表示的通用模型,以便对事物以及他们的相互关系进行更深入的 描述,这也就是本体的语言层,目前主要有d a m l + o i l 和o w l ;第五层为逻辑层,主要是 希望在本体之上再提供一个描述推理规则的互操作语言,这样就可以通过所描述的事实和推理 规则对元数据和数据进行某种逻辑推理,从而得出一些潜在的结论;第六层为证明层,主要是 提供一个用来描述推理步骤的证明语言。通过该层,我们可以对所得到的结论的正确性进行验 证;第七层为信任层,主要解决推理结论的可信性问题。 在该体系结构中,具有语义描述能力的是r d f 、r d fs c h e m a 层及其以上层。本章将主要 介绍r d f 层和本体词汇层,重点讨论w 3 c 所开发的语言规范:r d f 、r d fs c h e m a 和o w l 。 由于其上的逻辑层、证明层和信任层的研究工作尚在进行中,目前,还没有相应的标准出台, 因此,在这里将不作讨论。但o w l 语言作为本体词汇层的语言规范,包含有相当多的推理规 则,为逻辑推理提供了一定的支持能力,因此将在下一章结合本系统中本体的设计对这一部分 作详细的介绍。 2 2r d f 与r d fs c h e m a 语义w e b 的核心思想就是让机器理解w 曲上的信息,即w 曲数据的语义。这就需要为机 器提供描述w 曲数据的数据,即元数据。为此,需要建立一个通用的元数据模型,r d f 正是 这样的一种标准。r d f 提供了一种通用的框架,即由资源、属性、属性值所组成的三元组, 以描述w 曲上的资源。r d f 描述的资源可以是任何一个能够用u r i 代表的事物,属性值可以 是原子实体,也可以是一个由某个u r i 代表的资源。因此,一个r d f 实例可以看作是一个带 标签的有向图。而i d fs c h e m a 是r d f 的扩展,它通过提供一些原语来定义类、属性、类与 属性之间的隶属关系等,来增强对资源语义的进一步描述。 2 2 1i m f 基础 在前面的叙述中已经提到,r d f 提供了一个由资源、属性和属性值组成的三元组来描述 w 曲上的资源。这种方式正是来源于现实生活中我们说明某件事物的属性的方式,即指明所要 说明的事物,该事物的某个特性及该特性的值。 比如,为了说明张三的职业,我们可能会说“张三的职业是学生”或者“学生是张三的职 业”,无论怎样表述,都涉及到三方面的信息:主体“张三”、主体的属性“职业”、属性的 值“学生”。如果需要更加详细地介绍张三,我们可以列举更多的属性,如性别、年龄、兴趣 爱好、性格、发型等等,这样就可以将一个栩栩如生的张三的形象呈现到我们的眼前。也就是 说,通过由主体、属性、属性的值所组成的三元组的集合,可以生动地描述自然界中的事物。 这也正是r d f 模型的思想来源。 2 2 1 1r d f 模型 在r d f 模型中,一个具有若干属性和相应的属性值的事物( 也称之为一个资源) ,可以 通过若干语句( 即三元组) 来进行描述,语句中的三部分又分别称作主语( s u b j e c t ) 、谓语 ( p r e d i c a t e ) 和宾语( o b j e c t ) 。其中主语即所要描述的资源,谓语为资源的一个属性,而宾语 为该属性所对应的值。r d f 模型的底层结构就是三元组的集合,其中每个三元组可以用节点 弧节点的连接来表示,显示如下: 图2 2r d f 三元组的图形表示 可以看出,每个三元组实际上表示一个语句。一套这样的三元组集合就称为r d f 图。在 r d f 图中,节点总是主语和宾语,而且弧的方向总是由主语指向宾语。r d f 三元组通过谓语 说明了事物间的某种联系。而i f 图的含义由图中众多的三元组共同进行说明。 4 一个椭圆代表一个r d f 节点,节点可以为主语或者宾语。节点的表示可以用一个 u r i r e f ,一个字面量( 1 i t e r a l ) 或者一个空白节点。字面量可以是字符串,整形数等等,空白 节点是没有正式标识符的一类节点。属性总是用u r i r e f 表示,而字面量也只用于宾语中。有 向弧表示谓语,总是出发于一个主语节点,终止于一个宾语节点。一个r d f 图就是由若干节 点和有向弧共同构成的。一个r d f 图中所有的u 融r e f 集,所有的字面量集和所有的空白节点 集都是两两不相交的。 于是上面的张三职业的例子就可以表示为: h t t p :x o b j e c t s s e u e d u c n s e m a n t i c w e b o n 群c a r e e r t i t l e 图2 3r d f 图的简单示例 这里,u r i r e f h n p :x o b j e c t s s e u e d u c n s e m a n t i c w e b o n 僻z h a n g s a n ”表示张三,他的职业是 个字面量“学生”,h t t p :x o b i e c t s s e u e d u c n s e m a n t i c w e b o n 博c a r e e r t i t l e 表示职业这个属性。 在r d f 中,r d f 图可以进行比较,两个r d f 图相等必须要满足节点和属性的一一对映。 也就是说,如果有两个r d f 图g 和g ,g 中所有的空白节点都对应g 中的空白节点,g 中的 字面量对应于g 中字面量,g 中用u 砌r e f 表示的节点也对应于g 中节点,还有对于g 中三元 组( s ,p ,o ) ,g 中也有对应关系,才能说明g 和g 是相等的。 研究使用r d f 时要画出实际图来比较不方便,可以采用另外一种途径,比如写下一条条 的语句。一般把每条语句的三部分按照主语,谓语和宾语的顺序,采用简略的标记写出来。 学生 与图不同的是,一个节点可以在三元组集合中出现多次,而在图中只可能出现一次。这是 比较好理解的,比如当该文章还有一个属性时,就要再写一个三元组,主语仍为 h 仕p :x o b j e c t s s e u e d u c n a n i c l e h t m ,而在图中则表现为该主语节点多了一个向外指的弧,主语 节点并没有相应增加。当然,这两种表示方式是等价的,表达的是相同的含义。图是i m f 中 最基本的模型表示方式,三元组的形式只是次要的。 2 2 1 2r d f x m l 语法 r d 脓m l 是一种r d f 的x m l 语法形式。前面已经提过,i m f 概念上的模型是图。r d f 提供了r d 脓m l 来描写r d f 图,进行相应的转换。与三元组形式不同的是,i m f 厂x m l 采用 的不是简化的符号,而是标准化的语法。 为了用x m l 对图进行编码,r d f 节点和谓语必须用x m l 术语表示,包括元素名,属性 名,元素内容以及属性的值。r d f ) ( m l 使用x m l 限定名( o n a m e ) 来表示r d fu r i r e f ,限 定名包含一个命名空间和一个本地名。限定名可以用来表示所有的谓语和一些节点的u r j r e f o 主语和宾语节点的u r i r e f 也能够以x m l 属性值的形式存在。r d f 字面量,前面已提过,只能 出现在宾语节点中,在x m l 表示中既可以是元素的文本内容,也可以是属性的值。 前面的例子用r d f x m l 语法表示为以下形式: 学生 本例中命名空间h 郇:x o b j e c t s s e u e d u c n s e m a n t i c w e b 用限定名称前缀x o b j e c t s 表示, 而 h 郇:、v w w w 3 o 唱1 9 9 9 0 2 2 2 r d f s y n t a x n s 撑约定前缀为r d f o 整个r d f 图,可以看成是节点,谓语弧,节点,谓语弧,节点这样周而复始的过 程,r d f m l 中就成了元素嵌套在元素中的序列,其中表示节点和表示谓语弧的元素交替出 现。起始节点就转换成最外层的元素,从其出发的谓语弧转换成外层元素的子元素,这样一直 转换下去。如果一个起始节点有多个从其出发的谓语弧,那么在r d f ) ( m l 中就表现为一个元 素有多个子元素,这种写法相对比较简洁。当谓语元素的内容是一个字符型的字面量,就有可 能将其作为节点元素的一个属性。只要谓语元素的元素名没有重复,那么,多个内容为这种字 面量的谓语元素都可以作为节点元素的属性出现。当谓语元素为r d c t y p e 时,也可以采用节点 元素属性的方式,属性的值就是宾语节点。 2 2 2i m f 及i m fs c h e m a 的词汇 在前面的叙述中已经提到,r d f 是一种声明性的语言,它通过标准的词汇来陈述一个主 张。其实,一个三元组就是对一种主张的陈述,又称为一个声明。从广义上来说,一个声明所 表达的准确的意义取决于多个方面的因素,如社会习惯、自然语言的注释以及和本声明相关联 的一些其它文档等。大部分类似的这种语义,机器是不能理解并加以处理的。因此,这里将从 更加通用的角度来讨论r d f 及r d fs c h e m a 中的主要的词汇,至于在r d f ) ( m l 编码中所使用 到的一些基本的符号,这里将不作介绍。 在介绍词汇之前,先明确几个命名空问的前缀: r d f 对应的u r j 是h 邱= 、 ,、 w w 3 o r g 19 9 9 0 2 2 2 r d f s y l l t a ) ( n s 群 r d f s :对应的u 是h 仕p :、v w w w 3 o 曙,2 0 0 0 0 1 r d f s c h e m a 撑 x s d :对应的u r j 是h 仕p :w m w 3 o 珞,2 0 0 l ) ( m l s c h e m a 撑 2 2 2 1 类 为了描述事物,一个基本步骤就是对事物进行分类。砌) f 及r d fs c h e m a 中把资源的分类 称为类( c l a s s ) 。这里的类与一般意义上的类一脉相承,并且也类似于面向对象编程语言中 的类的概念。 r d f 类可以用来表示任何事物,只要可以用u i u 引用,无论是可以通过网络访问的事物 还是无法通过网络访问的事物。r d f 中所有事物都被看成是资源,所以类本身也是资源。这 种类资源就是r d f s :c l a s s 。 类的成员称为类的实例( i n s t a n c e ) 。r d f 及r d fs c h e m a 中,可用r d f t y p e 属性来声明一 个资源是类的实例,只要属性的值为r d f s :c l a s s 。r d f s :c l a s s 本身有一个r d f t y p e 属性,并且属性 值也是r d f s :c l a s s 。一个资源可以是一个或多个类的实例。r d f s :s u b c l a s s o f 属性可以用来声明一 6 个类是另一个类的子类,而另一个类一定是该类的父类。例如:如果定义c 1 是c 2 的子类, 那么就说明了c 1 的实例一定也是c 2 的实例。一个类也可以是一个或多个类的子类。并且 r d f s :s u b c l a s s o f 属性具有传递性,如果定义c l 是c 2 的子类,c 2 是c 3 的子类,那么c l 一定 是c 3 的子类。因为所有r d f 类的实例都是资源,所以r d f 及r d fs c h e m a 中很自然的把所 有类都定义成r d f s :r e s o u r c e 的子类。 下面将以i 脓m l 的形式逐一介绍r d f 及r d fs c h e m a 中的主要的类。 r d f s :r e s o u r c e 在r d fs c h e m a 中对r d f s :r e s o u r c e 的定义如下: r d f s :i s d e f i n e d b yr d f r e s o u r c e 2 ”h t t p : v w w w 3 o 唱2 0 0 0 0 1 r d f s c h e m a 群”胗 r e s o u r c e r d f s :c o m m e n 伊t h ec l a s sr e s o u r c e ,e v e r ”h i n g r d f 中所有资源都是r d f s :r e s o u r c e 类的实例,所有其它类都是该类的子类。 类。 r d f s :c i a s s r d f s :i s d e f i n e d b yr d f r e s o u r c e = ”h t t p :、v 、州w 3 o r g 2 0 0 0 0 1 r d f s c h e m a 撑”胗 c l a s s t h ec l a s so fc l a s s e s 可以清楚的看出前面所讲的,r d f s :c l a s s 是本身的一个实例,并且是r d f s :r e s o u r c e 的子 r d f p r o p e r t v p r o p e r t y r d f s :c o m m e n 伊t h ec l a s so f r d fp r o p e n i e s r d f s :c o m m e n 伊 r d f s :s u b c l a s s o f r d f r e s o u r c e = ”h t t p :、 ,、 ,、 ,w 3 o r g 2 0 0 0 0 1 r d f - s c h e m 础r e s o u r c e ”胗 这是关于r d f 属性的一个类,该类的实例可以用来描述资源的属性。 r d f s :l i t e r a l l i t e r a l r d f s :c o m m e n 伊t h ec l a s so fl i t e r a lv a i u e s ,e g t e x t u a ls 仃i n g sa n di n t e g e r s r d f s :s u b c l a s s o f r d f :r e s o u r c e = ”h t t p :w w w w 3 o r g 2 0 0 0 0 1 r d f s c h e m 蒯r e s o u r c e ”胗 r d f s :l i t e r a l 类的实例是字面量,并且字面量也可以有普通和带类型之分。 r d f s t a t e m e n t r d f s :i s d e f i n e d b yr d f r e s o u r c e = ”h t t p : ,、 厂、 ,w 3 o r g 1 9 9 9 0 2 2 2 r d f - s y n t a x n s 撑”胗 r d f s :l a b e s t a t e m e n t r d f s :s u b c l a s s o f r d f r e s o u r c e = ”h t t p :、 ,、 ,w 3 o r g 2 0 0 0 0 l r d f s c h e m a r e s o u r c e ”胗 t h ec l a s so fr d fs t a t e m e n t s r d f s :c o m m e n 伊 r d f s t a t e m e n t 是表示i f 语句的类。语句有主语,谓语和宾语三部分。相应的, 7 r d f s t a t e m e n t 的实例具有的相关属性就有r d f s u b j e c t ,r d 邱r e d i c a t e 和r d f o b j e c t 。 r d t s :c o n t a i n e r r d f j :i s d e n n e d b yr d f r e s o u r c e 2 ”h t t p :w v ,、v w 3 o r g 2 0 0 0 01 r d f - s c h e m a 拌”胗 c o n t a i n e r r d f s :s u b c l a s s o f r d f r e s o u r c e = ”h t t p :、 n ,、w 3 o r g 2 0 0 0 0 l r d o s c h e m a # r e s o u r c e ”今 r d f 用容器( c o n t a i n e r ) 来表示包容一组事物的资源,被包容的事物称为容器的成员。与 集合或一般物理世界的包容不一样的是,同样的事物可以多次出现在同一个r d f 容器中,甚 至一个r d f 容器可以包容自身。 除了使用容器来描述一组资源外,还可以有其它各种各样的方式,所以r d f 容器的出现 只是为了更方便解释和定义,并不是强制性的。 r d f 中定义了三种类型的容器:r d f b a g ,r d f s e q ,r d f a i t ,它们都是r d f s :c o n t a i n e r 的子 类。 r d f s :c o n t a i n e r m e m b e r s h i p p r o p e r t y c o n t a i n e r m e m b e r s h i p p r o p e r 哆 r d f s :c o m m e n 伊t h ec l a s so fc o n t a i n e rm e m b e r s h i pp r o p e r t i e s ,r d f :1 ,r d f :2 , a l lo f w h i c ha r es u b p r o p e r t i e so f m e m b er f r d f s :c o m m e n 伊 r d f s :s u b c l a s s o f r d f r e s o u r c e = ”h t t p :w 、 ,、 ,w 3 o r g 1 9 9 9 0 2 ,2 2 一r d f s y n t a x 。n s j ! j p r o p e n y f 胗 这是容器成员属性,用来描述容器的每一个成员。该类是r d f p r o p e r t y 的一个子类,它的 实例分别用r d f = ,? ( n 为自然数) 来表示。 容器成员属性也可以应用到容器以外的资源上。并且,除了容器成员属性和r d f ! t y p e 属性 以外,容器资源也可以有其它的一些属性。 r d t l i s t r d f s :i s d e n n e d b yr d f r e s o u r c e 2 ”h t t p :w 、 ,、 ,w 3 o 唱1 9 9 9 0 2 2 2 - r d f s y n t a x n s 撑”胗 l i s t r d f s :c o m m e n 伊t h ec l a s so f r d f “s t s r d f s :c o m m e n 伊 容器的一个明显的问题在于缺乏结束标志,r d f 没有定义一种机制来限制容器的成员 数。容器永远是开放的,不可以声明容器中一定不存在某个成员。l m f 提供另一个概念叫做 集合,可以描述一组资源只包含特定的成员,而不再含有其它成员。r d f 集合在r d f 图中表 示为列表( 1 i s t ) 的形式,r d f l i s t 的实例就是这样的列表结构。r d f l i s t 有一个预定义的实例叫 做r d f n i l ,用来表示空的列表。 r d x m l 中为了表示集合,使用r d f p a r s e t y p e = ”c o l l e c t i o n ”作为谓语元素的属性,这样此 谓语元素下嵌套的全部第一层子元素就代表了这个集合的成员。 r d f s :d a t a t y p e r d f s :i s d e f i n e d b yr d f r e s o u r c e 2 ”h t t p :w 、w w 3 o 唱2 0 0 0 0 1 r d f - s c h e m a ”胗 d a t a t y p e r d f s :c o m m e n 伊t h ec l a s so fr d fd a t 嘶p e s r d f s :c o m m e n 伊 8 r d f s :d a t a t y p e 是关于数据类型的类,r d f 中整数值,浮点值和日期等数值用数据类型来表 示。r d f 中的数据类型概念与x m ls c h e m ap a n2 :d a t 嘶p e s 的概念是一致的。 r d f 只定义了r d f x m l l i t e r a l 一个数据类型,其它用到的数据类型是另外定义的。r d f 中 可以用一个或多个u r i r e f 来引用数据类型,预定义的x m ls c h e m a 中的数据类型就可以被 r d f 广泛使用。 数据类型包含词汇空间,值空间和词汇一值映射三个部分。词汇空间是一串字符串,用来 表示数据类型的值,它可以采用各种
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 土建工程装配式构件连接方案
- 校园消防安全教育动画
- 校园安全教育活动流程
- 排水管道更新方案
- 固危废中转料场建设项目技术方案
- 政治闭卷考试题目及答案
- 政府采购考试题库及答案2025年
- 郑州铁路期末考试题及答案
- 心理项目宣传活动方案策划
- 专业硅PU篮球场建造与赛事转播权合作合同
- 泌尿系结石 课件
- 物业投标书样本
- 安全保密管理方案(2篇)
- 【组织沟通障碍及其对策探究-以A企业为例12000字(论文)】
- 殡葬礼仪服务投标方案(技术方案)
- 血液灌流治疗癌症的原理与前景
- 2024年四川能投宜宾市叙州电力限公司招聘高频考题难、易错点模拟试题(共500题)附带答案详解
- -广告制作报价单-明细
- 屁屁辅助脚本
- 【顺丰集团财务共享中心运作问题与优化建议探析15000字(论文)】
- 肺功能科普知识宣传
评论
0/150
提交评论