RDF概念及语法.doc_第1页
RDF概念及语法.doc_第2页
RDF概念及语法.doc_第3页
RDF概念及语法.doc_第4页
RDF概念及语法.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RDF概念及语法资源描述框架 (Resource Description Framework,RDF)是一种用于表示Web上信息的框架。2. 动机和目标RDF有一个抽象语法体现了一个简单的基于图的数据模型,还有一个具有一个严格定义的蕴涵概念的形式语义,为RDF数据中的演绎推理提供了一个基础。2.1 动机RDF的发展被如下的一些应用所驱动,包括:l Web元数据:提供了关于Web资源和使用Web资源的系统的信息(例如:内容分级,性能描述,个人偏好,等等)。l 需要开放而非封闭的信息模型的应用(例如:活动安排,描述组织流程,Web资源的标注,等等)。l 正如万维网为超文本做的那样,为机器可处理的信息(应用程序数据)做同样的事:允许数据在创建它的特定环境以外被处理,且以一种能扩展到互联网的方式被处理。l 应用之间的互操作:合并来自单个应用的数据构成新的信息。l 软件Agent对Web信息的自动化处理:Web由仅有易于人类阅读的信息转变为一个世界范围的协同程序的网络。RDF为这些程序提供了一种世界范围的标准语言。RDF的设计目的是能以最低限度的约束,灵活地描述信息。它可以用于独立的应用,其中单独设计的数据格式可能更为直接和易于理解,但RDF的通用性使得数据的共享能提供更大的价值。.当信息被整个Internet中越来越多的应用程序接受时,信息也在不断的增值。2.2 设计目标RDF的设计试图达到如下几个目标:l 有一个简单的数据模型:RDF有一种便于应用程序处理和操作的简单数据模型。这个数据模型独立任何特定的序列化语法。l 有形式化的语义和可证明的推论:RDF有一个形式化的语义,它为对关于RDF表达式的含义的推理提供了一个可靠的基础。特别地,它提供了一个严格定义的蕴涵概念,从而为在RDF数据中定义可靠的推理规则奠定了基础。l 使用一个基于URI的可扩展词汇集:基于具有可选的片段标识符(URI 引用,或URIrefs)的URIs,词汇集是完全可扩展的。URI引用在RDF中被用来命名所有类别的事物。在RDF数据中出现的另一种值是文字。l 使用一种基于XML的语法:RDF有一个XML序列化格式的推荐标准RDF-SYNTAX (/TR/rdf-concepts/#ref-rdf-syntax),它可用来编码应用中信息交换所用的数据模型。l 支持XML Schema数据类型的使用:RDF可以使用根据XML Schema数据类型XML-SCHEMA2 (/TR/rdf-concepts/#ref-xml-schema2)表示的数值,因此有助于在RDF和其他XML应用程序中信息的交换。l 允许任何人发表关于任何资源的陈述:为了推动在互联网层次上的操作,RDF是一种允许任何人发表关于任何资源陈述的开放的框架。一般说来,不假设关于任何资源的所有信息都是可用到的。RDF并不阻止任何人发表那些毫无意义或者有悖于其他陈述,或有悖于人们看到的世界的声明。那些使用了RDF的应用程序的设计者应该了解这一点,并使设计的应用程序能够容忍不完全或是不协调的信息。3. RDF 概念RDF使用如下的关键概念:l 基于图的数据模型在RDF中任何表达式的基本结构是一个三元组的集合,每个三元组由一个主体、一个谓词和一个客体组成。一系列这样的三元组被称为RDF图((/TR/rdf-concepts/#section-Graph-syntax)),这可以用具有一个节点和有向边的图来表示,在图中每个三元组用一个节点-边-节点的连接表示(故称之“图“)。每个三元组表示由节点连接表示的事务之间的关系一个陈述。每个三元组有三部分:一个主体 (/TR/rdf-concepts/#dfn-subject),一个客体 (/TR/rdf-concepts/#dfn-object),和一个谓词 (/TR/rdf-concepts/#dfn-predicate)(也称为属性 (/TR/rdf-concepts/#dfn-property)),它表示一个关系。边的方向很重要:它总是指向客体。RDF图的节点 (/TR/rdf-concepts/#section-Graph-Node)是它的主体和客体。RDF三元组的断言说明一些关系,这是由谓词表示的,在三元组的主体和客体表示的事物之间的关系。RDF三元组的断言的总和就是断言图中所有的三元组,因此RDF图的含义就是对应所有图中三元组包含的陈述的关联(逻辑合取)。l 基于URI的词汇识:一个节点可以是一个URI跟随一个可选片断标识(URI reference (/TR/rdf-concepts/#dfn-URI-reference),或 URIref),文字,或是空节点(无单独的标识形式)。属性是“URI引用。(查看URI (/TR/rdf-concepts/#ref-uris),作为节点的一个URI应用或文字标识了这个节点表示的事物。作为谓词的一个URIref标识了由它连接的节点表示的事物之间的关系。一个谓词URIref在图中也可能作为一个节点。一个空节点 (/TR/rdf-concepts/#dfn-blank-node)既不是一个URI引用也不是文字。在RDF抽象语法中,一个空节点只是一个独特的节点,可以用在一个或多个RDF陈述中,但是没有内在的名字。有一个惯例用于RDF图的一些线性表达方式中:即通过空节点标识符,允许多个陈述引用同一个未标识的资源,它是一个和所有URIs和文字不同的本地标识符。当合并图的时候,为了保留空节点的含义,那么不同图中的空节点必须保持不同,这可能会导致重新分配空节点标识符。注意,这些空节点标识符并不是RDF抽象语法的一部分,而且包含空节点的三元组的表示完全依赖于特定的所用具体语法。 l 数据类型: 数据类型被RDF用来表示数值,如整数、浮点数数字和日期。一个数据类型由一个词法空间,一个值空间和一个词法-到-值的映射组成,查看第5节 (/TR/rdf-concepts/#section-Datatypes)。例如,对XML Schema的数据类型xsd:boolean的词法-到-值映射,其中值空间的每个成员(这里由T和F和表示)具有两个词法表达,如下所示:值空间 T, F 词法空间 0, 1, true, false 词法-到-值映射 , , , RDF仅预定义一个数据类型rdf:XMLLiteral (/TR/rdf-concepts/#dfn-rdf-XMLLiteral),用来把XML嵌入到RDF中。在RDF中没有内建的数字概念,或是日期,或者其他普通数值,相反,RDF允许独立的定义数据类型,且应用URI来标识。预定义的XML Schema数据类型XML-SCHEMA2 (/TR/rdf-concepts/#ref-xml-schema2) 就是为了这个目的,且希望能广泛的应用。RDF没有提供定义新数据类型的机制,XML Schema数据类型 XML-SCHEMA2 (/TR/rdf-concepts/#ref-xml-schema2) 提供了可扩展的框架,适合定义用在RDF中的新数据类型l 文字: 文字用以通过一种词法表示的形式表示一些值,例如数字和日期。任何可以用文字表示的事物都可以用URI来表示,但使用文字往往更方便和直观。一个文字可能是一个RDF陈述的客体,但不是主体或者谓词。文字可以是平凡的也可以是类型的:一个平凡文字 (/TR/rdf-concepts/#dfn-plain-literal)是结合一个可选的语言标签的字符串。这可能用在自然语言中的纯文本。正如RDF形式化语义RDF-SEMANTICS (/TR/rdf-concepts/#ref-rdf-semantics)中推荐的,这些平凡文字是自我表达的。一个类型文字 (/TR/rdf-concepts/#dfn-typed-literal)是由一个字符串和一个数据类型URI组合起来的。它表示了确定的数据类型的值空间的一部分,其中这个值空间是通过对文字字符串应用词法到值的映射得来的。可以通过使用XML Schema数据类型xsd:boolean定义的类型文字是:类型文字 词汇值映射 值 T T F F 对于可能包含标记的文本,用类型文字带类型rdf:XMLLiteral (/TR/rdf-concepts/#section-XMLLiteral)。如果需要语言注解,必须显式的作为标记,一般通过 xml:lang属性。XHTML (/TR/rdf-concepts/#ref-xhtml)也可能通过这种方式包含在RDF中。在后面这种情况(XHTML),需要额外的span或者div元素有xml:lang或者lang属性。l XML序列化语法: l 简单事实的RDF表达法:一些简单事实表达了两个事物之间的关系。这样的事实可以用一个RDF三元组表示,其中用谓词命名事物的关系,主体和客体指代两个事物。类似的事实表达可能在关系数据库中用表中的一行表示。该表具有两列,相对应着RDF三元组中的主体和客体。表名对应于RDF三元组中的谓词。更多的类似表示可能是一阶逻辑中的一个二元谓词。关系数据库允许一个表有任意多个列,表中表示信息的一行对应于一阶逻辑中的有任意元的谓词。这样的行,或者谓词,为了便于表达必须分解为RDF三元组。一个简单分解的形式引入一个新的对应于行的空节点,而且为行中的每个单元引入一个新三元组。每个三元组的主体是一个新的空节点,谓词相当于列名,客体对应于单元中的值。新的空节点也可以有一个rdf:type类型的属性,它的值对应于表名。一些简单事实表达了两个事物之间的关系。这样的事实可以用一个RDF三元组表示,其中用谓词命名事物的关系,主体和客体指代两个事物。类似的事实表达可能在关系数据库中用表中的一行表示。该表具有两列,相对应着RDF三元组中的主体和客体。表名对应于RDF三元组中的谓词。更多的类似表示可能是一阶逻辑中的一个二元谓词。关系数据库允许一个表有任意多个列,表中表示信息的一行对应于一阶逻辑中的有任意元的谓词。这样的行,或者谓词,为了便于表达必须分解为RDF三元组。一个简单分解的形式引入一个新的对应于行的空节点,而且为行中的每个单元引入一个新三元组。每个三元组的主体是一个新的空节点,谓词相当于列名,客体对应于单元中的值。新的空节点也可以有一个rdf:type类型的属性,它的值对应于表名。该信息可能对应于表“STAFFADDRESSES”中的一行,STAFFID是表的主键,STREET, STATE, CITY和POSTALCODE是其他的列。因而,用RDF表示更复杂的事实,需要用简单的二元关系中的“合取”(逻辑AND)。RDF不支持“取非”(NOT)或“析取”(OR)的表示。RDF通过使用可扩展的基于URI的词汇集,它提供了表达任意主体的事实的能力:如对特定的具名事物的具名属性的断言。一个URI可以为任意可以命名的事物而构造,所以RDF事实可以是关于任何事物的。l 蕴涵:RDF中关于含义和推理的概念的基础是形式化的蕴涵”概念。简单的说,一个RDF表达式A蕴涵另一个RDF表达式B,如果在世界上任何一个可能的使A为真的事物安排也使B为真。在这个基础上,如果假定或者证明A为真,则可以推断出B为真。4. RDF词汇集URI和名字空间(标准)RDF用URI引用来表示资源和属性。有几个URI引用在RDF中有特定的含义。明确说来,由以下字符串起始的URIref是由RDF规范定义的:/1999/02/22-rdf-syntax-ns# (通常关联的名字空间前缀是rdf:) 用于RDF/XML 序列化时,这个URI前缀对应着关联到RDF词汇集术语的XML名字空间的名字XML-NS (/TR/rdf-concepts/#ref-namespaces)。备注: 这个命名空间的名字和用于以前的RDF推荐标准 RDF-MS (/TR/rdf-concepts/#ref-rdf-ms)的名字一样。5. 数据类型 (标准)RDF中所用的数据类型抽象定义同XML Schema 第二部分:“数据类型”XML-SCHEMA2 (/TR/rdf-concepts/#ref-xml-schema2)所用的抽象定义相同。数据类型由一个词法空间,一个值空间和一个“词法-到-值”的映射组成。数据类型的“词法空间”是一个UnicodeUNICODE (/TR/rdf-concepts/#ref-unicode)的字符串集合。数据类型的“词法-到-值”的映射是一个序偶对集合,序偶对的首元素属于“词法空间”,序偶对的第二个元素属于“值空间”:词法空间的每个成员都确切地配对(映射)到一个值空间的成员。值空间的每个成员都可以配对到词法空间(那个值的词法表示)的任意数量的成员(包括0个成员)。一个数据类型由一个或者多个URI引用标识。即使没有用XML Schema的术语定义,RDF可以使用任何数据类型的定义,只要这个定义遵从这个抽象定义。某些XML Schema中的内置数据类型不适合在RDF中采用。例如,QName (/TR/2001/REC-xmlschema-2-20010502/#QName)数据类型在映射过程中,需要一个领域内命名空间的声明,因此不推荐在RDF中使用。RDF-SEMANTICS (/TR/rdf-concepts/#ref-rdf-semantics)文档中有关于XML Schema内置数据类型的更详细讨论 (/TR/2004/REC-rdf-mt-20040210/#dtype_interp)。备注:当一个数据类型用XML Schema定义:所有值都对应一些词法形式,要么是使用数据类型的词法-到-值映射,要么它便是一种使用关联到一种数据类型元素的联合数据类型。XML Schema保留了数据类型的刻面(facet),被XML Schema机制用来控制词空间和值空间;但是,RDF没有定义一个标准的机制来访问这些刻面(facet)。在XML-SCHEMA1 (/TR/rdf-concepts/#ref-xml-schema1)中,空白范式化(white space normalization) (/TR/2001/REC-xmlschema-1-20010502/#section-White-Space-Normalization-during-Validation)发生在根据空白刻面(whiteSpace facet) (/TR/2001/REC-xmlschema-2-20010502/#rf-whiteSpace)值地验证 (/TR/2001/REC-xmlschema-1-20010502/#key-vn)过程中。“词法-到-值”的映射在这之后RDF数据类型化中采用,故RDF数据类型化不受空白刻面的影响。6. 抽象语法 (标准) RDF的抽象语法是一个三元组的集合,称为RDF图。RDF图之间的等价性。等价性的定义在RDF测试用例RDF-TESTS (/TR/rdf-concepts/#ref-rdf-tests)规范中是必需的。实现注意: 这个抽象语法是定义形式语义的语法基础。实现者可以随意选择任意表示RDF图的其他等价形式。作为一个例子:在RDF图中,数据类型为rdf:XMLLiteral的类型文字可以用非规范的格式表示,也可以用在比较这两个文字过程中规范化后的格式。在这个例子中,这个比较可以在语法结构中进行,也可以在他们在论域中的指派中进行。6.1 RDF三元组 一个RDF三元组(triple)包含了三个部分:主体,它是一个RDF URI 引用 (/TR/rdf-concepts/#dfn-URI-reference) 或一个空节点 (/TR/rdf-concepts/#dfn-blank-node) 谓词,它是一个RDF URI引用 (/TR/rdf-concepts/#dfn-URI-reference) 客体,它是一个RDF URI引用 (/TR/rdf-concepts/#dfn-URI-reference),一个文字 (/TR/rdf-concepts/#dfn-literal)或一个空节点 (/TR/rdf-concepts/#dfn-blank-node) 一个RDF三元组通常以主体,谓词,客体的顺序书写。谓词也被称为三元组中的属性。6.2 RDF图 一个RDF图(graph)是一个RDF三元组的集合。一个RDF图的节点 集合是图中的三元组的主体和客体的集合。6.3 图的等价性两个RDF图G和G是等价的,如果在两个图的节点集合之间存在一个一一对应(bijection)M,使得:M把空节点映射为 空节点。 对任意G中节点的RDF文字 (/TR/rdf-concepts/#dfn-literal)lit,M(lit)=lit 。 对任意G中节点的RDF URI引用 (/TR/rdf-concepts/#dfn-URI-reference) uri, M(uri)=uri 。 三元组( s, p, o ) 在G中,当且仅当三元组( M(s), p, M(o) ) 在G中。 在这个定义下,映射M显示了G中的每个空节点是怎样可以被G的新空节点替换的。6.4 RDF URI引用一个RDF图中的URI引用(一个RDF URI引用)是一个满足下列条件的Unicode字符串UNICODE (/TR/rdf-concepts/#ref-unicode),满足: 不包含任何控制字符 ( #x00 - #x1F, #x7F-#x9F) 将生成一个有效的URI字符序列。在采用下列编码方法时,它是一个具有可选片段标识符的绝对URI。该编码方法为: 将Unicode字符串编码为UTF-8,给出一个由八位字节构成的序列。 对于无对应US-ASCII字符的八位字节,用%对它们进行转义处理。必须用%转义的非法八位字节包含所有那些无对应US-ASCII字符的字符、以及在URI (/TR/rdf-concepts/#ref-uris)的2.4节中列出的禁用字符,但数字符(#)、百分符(%)和方括号字符不在此列(虽然它们出现在禁用字符列表中,但在RFC-2732 (/TR/rdf-concepts/#ref-rfc-2732)中被重新允许出现)。对于非法的八位字节,必须对它们进行转义处理(也就是转换为%HH形式,其中HH为八位字节所对应的2位十六进制数字)。两个RDF URI引用是等价的,当且仅当它们的Unicode字符串中的字符个个相等。注意: RDF URI引用与XML Schema 数据类型XML-SCHEMA2 (/TR/rdf-concepts/#ref-xml-schema2)中定义的anyURI是相容的,因为RDF URI引用被限定为绝对URI引用而不是相对URI引用。注意: RD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论