信息组织与信息检索:DOI原理及网络资源标识_第1页
信息组织与信息检索:DOI原理及网络资源标识_第2页
信息组织与信息检索:DOI原理及网络资源标识_第3页
信息组织与信息检索:DOI原理及网络资源标识_第4页
信息组织与信息检索:DOI原理及网络资源标识_第5页
已阅读5页,还剩211页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DOI原理及网络资源标识

主要内容1URI相关知识3DOI的编码方式和解析机制2DOI的产生、概念和特征6以四川日报网络报纸为例进行DOI编码4DOI注册代理机构——Crossref5中文DOI的发展情况URIUniformResourceIdentifier统一资源标识符:作为因特网资源的统一的标识符体系,其中“资源”是能够被标识的任何对象,“标识符”是一个对象可以引用的名称,实际定义为符合某种语法规范的字符串,而“统一”则保证了现有不同类型的资源标识符可以采用统一的方式使用,并为新的资源类型提供统一的标识框架。实际上,URI成为所有标识因特网资源的地址和名称的通用集合。URN-

URC-

URL

URI是W3C的IETF工作小组提出的解决网络资源或信息单元永久标识问题的方案。根据早期的定义,URI由3个部分组成:①统一资源名(universalresourcename,URN),即数字对象惟一永久的标识,是与位置无关的网络对象和服务标识;②统一资源属性(universalresourcecharacteristie,URC),即描述数字对象的元数据;③统一资源定位符(universalresourcelocation,URL),用于定位和获取数字对象。即通俗意义上的网址。例如:/URN-

URC-

URL实际应用中URC从来没有得到广泛认同,取而代之的是各种类型的元数据。鉴于此,URI机制被重新定义为包括URN和URL的集合,其中URN作为逻辑化的资源名称,可以是某个机构或联盟对资源的统一命名,如PURL,也可以是采用某种命名大纲制定的持久、独立于地址的资源标识符。URL作为物理地址,代表因特网上某个具体的地址。URN和URL可以相对独立。DOI和URI的关系DOI解决了URL的死链问题。DOI也就是网络环境中的URI。如果仅仅将DOI作为标识符,它也可以被视为URN。DOI的产生背景DOI是DigitalObjectIdentifier的缩写,其名为数字对象标识,是针对数字资源的永久性标识。DOI的产生主要基于以下三点:(1)解决传统URL链接中的“死链”问题。(2)解决异质科技资源的相互引用和链接问题。(3)规范数字版权,保护知识产权。DOI的诞生DOI的诞生可追溯到1994年美国出版商协会TheAssociationofAmericanPublishers,AAP下属“技术授权委员会”(EnablingTechnologiescommittee)的成立,该委员会的任务是设计一种在数字环境下保护知识产权和版权所有者商业利益的系统。首先要引进一种出版业标准的数字信息识别码,以支持出版商与用户之间各种系统的相互转换,为版权与使用权之间的协调管理提供基础。DOI的诞生DOI系统在1997年法兰克福图书博览会上首次亮相,成为数字资源命名的一项标准。1998年在法兰克福成立了非营利性的组织国际DOI基金会(InternationalDOIFoundation,ID),负责有关DOI的政策制定、技术支持、名址注册等业务。DOI的含义DOI,即DigitalObjectIdentifier(数字对象标识符)的缩写,被形象地称之为数字对象的条形码。广义地说,DOI是指在数字环境(即网络环境)下标识和交换知识产权对象的一种开放性系统,它遵从URI(统一资源标识符)规范,并为基于数字对象结构公认标准的知识内容管理和知识产权管理提供了一个可扩展的框架。它包括4个组成要素:标识符、解析系统、元数据和规则DOI具有以下显着特征:惟一性(Unique)。DOI标识符能惟一地标识网络环境下的任何数字化对象,如文本、图片、声音、影像、软件等。持久性(Persistent)。DOI标识符一经产生和分配就永久不变,不随其所标识的数字化对象属性(如版权所有者、存储地址等)的改变而改变。可驱动性(Actionable)。DOI标识符类似于面向对象模型中的“事件”(Event),能用来驱动某个动作。基于DOI驱动的最简单的动作就是为它所标识的实体(即数字化对象)定位(Locating)。兼容性(Interoperable)。DOI系统具有与过去、现在及未来系统的兼容性,具体包括:①DOI标识符的兼容性。DOI标识符中可包含任何已有的标识符,如ISBN、ISTC(国际标准文本代码)、PII(出版者款目标识符)等;②DOI处理系统的兼容性。DOI处理系统具有高效性和可扩展性,能与任何现有或将有的因特网系统进行互操作;③DOI元数据的兼容性。DOI元数据能够最大限度地实现不同系统间的数据互用性。DOI的编码方式DOI标识符是一组由字母、数字或其他符号组成的字符串,包括前缀、后缀两个部分,中间用一斜杠分开。前缀中又以小圆点分为两部分,其结构式为:<DOI>=<DIR>.<REG>/<DSS><DIR>为DOI的特定代码,其值为10,用以将DOI与其他应用HandleSystem(句柄系统)技术的系统区别开。<REG>(Registrant’sCode)是DOI注册代理机构的代码,由DOI的管理机构IDF负责分配,由4位阿拉伯数字组成。DOI的编码方式前缀由DOI管理机构(目前只有一个,即CrossRef)分配给各出版商;后缀由各出版商自行指定并分配给其数字化出版物。前缀是一个由“10”开头的6位数的代码(必要的话,前缀也可以加长),如“10.1006”;后缀则是一组由出版商指定的任意形式的代码,如“jmbi.1995.0238”。一个完整的DOI标识符的形式是“10.1006/jmbi.1995.0238”DOI的编码方式后缀<DSS>(DOISuffixString)由DOI注册代理机构(目前主要是学术出版商)自行给出,规则不限,只要在该出版商的所有产品中具有惟一性即可,是对数字对象定义的本地标识符。一般DOI的注册者都通过在后缀中融入现有的惟一标识符如ISSN、ISBN或其他标识符来达到向下兼容。DOI的编码方式与前缀相比,DOI后缀的语法十分灵活CrossRef对此不做具体规定,而只给出几条总的指导原则,如简洁性原则、惟一性原则(在同一个前缀下的后缀必须惟一)、一贯性原则、逻辑性原则、兼容性原则、层次性原则、扩展性原则等。在此原则指导下,各出版商可自行指定其DOI后缀的语法规则,如:它可以是任何字母数字字符串;该字符串可以分节也可以不分节;若分节则必须要用分节符分隔;分节符可以是圆点、冒号、管道符或其他符号等等。DOI的解析机制DOI是基于HandleSystem(句柄系统)和<indecs>元数据框架两种技术的,它们为DOI提供了从单一解析(Resolution)到多重解析(Multipleresolution)的应用。HandleSystem是由美国研究创新联合会(CorporationforNationalResearchInitiative,CNRI)开发的技术平台,用于因特网信息的命名、解析和管理。DOI的解析机制<indecs>InteroperabilityofDatainE-CommerceSystems是一套用于在电子商务环境下实现数据互操作的元数据框架,选择<indecs>作为元数据框架为DOI的多种应用提供了基础。DOI能使用任何已存在体系的元数据,DOI元数据体系使用<indecs>元数据框架来实现语义的互操作。DOI的解析机制多重解析在现实世界中,一个被标识的数字对象可能会有很多相关资源,并且可能会有多个复本放置于不同的地方。因此,单一解析不能很好地满足用户的信息需求,而HandleSystem的多重解析机制较好的解决了这个问题。多重解析使DOI不仅能指向一个URL,而且可以指向多个相关URL,以及其他类型的元数据。DOI的解析机制目前,DOI在世界上得到了广泛应用。DOI系统从最初提供持久可靠的名称复位向服务,发展到目前拥有上千万个已经分配并解析的DOI号码、7个注册代理机构和几千个使用单位,跨越了美国、欧洲、亚洲和澳大利亚、亚洲。DOI元数据MetadataHandleSystem(DOI目录)DOIHandleData其它数据服务DOI注册服务Added-value

Indexes索引Filters过滤Queries查询VARsDOI的注册过程DOI&元数据前缀拥有者1.信息资源拥有者2.建立DOI与元数据3.注册服务3.1进入元数据库3.2进入DOI目录库Crossref的相关知识CrossRef是一个基于DOI实现文献引文跨出版商服务平台链接的参考文献链接服务系统。AIP,BlackwellPublishers,ElsevierScience,IEEE,Kluwer,Nature,Springer和Wiley等多家著名的学术出版商在2000年初联合创立了非盈利组织世界出版商联合会(PublishersInternationalLinkingAssociation,Inc.,PILA),负责对CrossRef进行管理容,是通过数字对象标识符来链接出版商成员提供的文章元数据。CrossRef运营机制CrossRef于2000年9月成为国际DOI基金会所授权的第一个注册代理机构。CrossRef目前在学术期刊方面得到了广泛的应用,国外的大型出版集团,如荷兰的爱思唯尔出版集团(www.elsevier.com)、德国的施普林格出版集团(www.spingerlink.com)等都对其期刊论文等数字信息资源进行了DOI标识。截至2010年5月31日,加入CrossRef联盟的出版社和学会有3072个;图书馆1586个。CrossRef运营机制每个加入CrossRef的出版商成员首先获得一个DOI作为前缀,出版商为其出版的每一篇期刊文献编制一个包含出版商本身DOI前缀的DOI号,并将DOI号附加到文献元数据和URL上。所有文章的元数据,出版商会以XML的形式提供给CrossRef元数据库(MDDB:MetadataDataBase),CrossRef再将每一篇文献的DOI和URL注册在一个统一的DOI名录中。CrossRef运营机制同时,出版商也将每篇文献的参考文献的数据提供给参考书目解析器,这一解析器是用来检索DOI群的,它是MDDB的主要部分。用户点击CrossRef链接,就可以链接到显示有该论文全部引文目录的出版商网页。引文全文获取形式取决于出版商的选择,引文可能以HTML形式发布,用户可以直接通过适当的机制获取全文;也可通过订购、文献传递、按浏览付费或者预印本付费等方式获得。CrossRef的主要功能1)永久指向。CrossRef解决了数据因URL发生变动后出现的断链问题,不会出现因网域的异动使数据消失的现象。2)动态维护。CrossRefDataBase中的数字对象元数据和URL由出版机构负责更新维护。如果成员出版商提供的文献URL发生变动,那么他只要向CrossRef提交并更新数据即可保证链接的准确性和有效性。CrossRef的主要功能3)实现一对多的路径。通过DOI将参考引文进行多项解析,方便快捷地链接到该文献的文摘或全文。4)支持新的应用。目前已经从学术期刊领域扩展到电子书、政府文档、教学参考、科学数据等方面。5)保护著者版权。CrossRefDataBas仅存储描述文件的MetaData,而不存储文件内容。这样可以避免使用者随意下载全文,保护了著者的版权。中文DOI的应用情况中文DOI代理机构——中文DOI注册中心2007年3月,北京万方数据股份有限公司与中国科技信息研究所共同获得国际DOI基金会(IDF)批准,在中国成立DOI注册机构开展中文DOI注册与服务。万方数据公司于2007年10月开始,在数字对象唯一标识符研究与应用领域与CNRI开展合作,目的是基于

CNRIandleystem,在中国建立具有先进的理念和技术的、与国际兼容的数字对象唯一标识符体系,促进我国数字资源的共享与利用,并促进我国新闻出版及版权保护领域的发展。国内大型的数字期刊生产商都不同程度使用了唯一标识符,并对期刊、论文、报纸等各种数字资源都进行了标识;万方数据、同方光盘和重庆维普都采用各自的唯一标识符方案;此外,其他类型的数字资源生产商,如方正Apabi电子图书同样使用了唯一标识符,慧科讯业将惠科新闻数据库中的每条新闻分配一个编号作为唯一标识符;

国内英文期刊:通过CrossRef加入;国内在应用唯一标识符方面仍处于初级阶段(内部系统\应用层次低\无解析功能)。清华同方(CNKI)万方维普唯一标识符编码规则采用自定义的数字期刊唯一标识符,自称为DOI。其唯一标识符的结构为:“CNKI:SUN:XXXX.0.YYYY-NN-ZZZ”。其中“XXXX”内部的期刊拼音刊名(4位);“YYYY”为文章所在期刊的出版年;“0”为文献类型;“NN”为文章所在期刊的期次;“ZZZ”为流水号采用“文章编号”对文章进行唯一标识。其结构为:“XXXX-XXXX(YYYY)NN-PPPP-CC”。其中:“XXXX-XXXX”:文章所在期刊的国际标准刊号ISSN;“YYYY”:文章所在期刊的出版年;“NN”:文章所在期刊的期次;“PPPP”:文章首页所在期刊页码;“CC”:文章页数。3/16/202633SWLayerCakeWebService34AmodelforcreatingdynamicdistributedapplicationswithcommoninterfacesforefficientcommunicationacrosstheInternet.Self-describing,self-contained,modularapplicationsthatcanbemixedandmatchedwithotherWebservicestocreateinnovativeproducts,processes,andvaluechains.WWWvs.WebService35WebservicesupportsdynamicinteractionHTMLXMLHTTPSOAPHumanMachineLanguageProtocolReaderTheElementsofaWebService36KeyPlayersTheServiceProviderTheServiceRequesterTheServiceRegistryKeyFunctionsPublishFindBoundWebServiceWebServiceWebServiceServiceProviderServiceRegisterServiceRequesterPublishFindBindExamplesofWebServices37Businessprocessexternalization:businesslinkagesattheworkflowlevel,netmarketplace,extendedsupplychains.E-governmentE-learningDigitallibraryWebServiceMechanism39Service

RequesterService

ProviderUDDIWSDLSOAP搜寻WebService注册WebService取得WebService信息描述WebService实际传递需求讯息传递响应消息WebServiceMechanism40UDDI:UniversalDescriptionDiscoveryandIntegrationWSDL:WebServiceDescriptionLanguageSOAP:SimpleObjectAccessProtocolEDI商务

上海海关通关业务EDI应用EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI系统EDI与互联网EDI软件EDI硬件EDI中心1997年:美国开始采用EDI方式进行政府采购美国1997年:英国大约有l万家公司应用EDI英国1997年:5万家EDI用户日本我国的EDI应用模式分为三种行业应用模式:如“海关EDI通关系统”、“国际集装箱运输EDI示范工程”等;EDI中心模式:如广东EDI中心,上海港航EDI中心等;ChinaEDI模式:由邮电通信网为支撑提供EDI增值服务。EDI翻译

EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心资料用统一标准利用电信号传递信息计算机系统之间的连接将商业或行政事务处理按照一个公认的标准,形成结构化的事务处理或报文数据格式,从计算机到计算机的电子传输方法。EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心手工条件下,贸易单证的传递方式EDI条件下贸易单证的传递方式EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI贸易的工作步骤EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDIFACT与ANSIx.12EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDIFACT标准语法规则报文设计指南语法应用指南数据表目录代码表复合数据表目录段目录标准报文格式适当的说明解释数据交换格式构成总览EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI标准三要素:标准报文、数据元素、数据段标准报文一份公司格式的商业单据必须转换成一份EDI标准报文才能进行信息交换EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI标准三要素:标准报文、数据元素、数据段基本数据元素是基本信息单元,用于表示某中有特定含义的信息,相当于自然语言中的字复合数据元素是由一组基本数据元素组成,相当于自然语言中的词电话号码:COM+2145551212:TE‘传真号码:COM+2145558239:FX‘电子邮箱代码COM+BCAF:EM‘四位编号,以“S”打头的编号表示用于传输控制的复合数据元。以“C”打头的编号为用户数据元,用于传输使用者需要传输的信息。例如:S002表示交换的发送方

数据元素EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素

EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI标准三要素:标准报文、数据元素、数据段数据段数据段是标准报文中的一个信息行,由逻辑相关的数据元素构成。EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心三层模型EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI翻译系统EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI翻译系统的内部结构EDI商务案例:订购商品的过程EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI翻译

EDI系统EDI与互联网EDI软件EDI硬件EDI中心格式转换软件公司单证格式转换成平面文件翻译软件通信软件平面文件翻译成EDI标准报文管理和维护贸易伙伴的电话号码EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI报文

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI报文

EDI系统EDI与互联网EDI软件EDI硬件EDI中心EDI中心的组成EDI中心的功能最终用户系统公共业务服务通信接口公用EDI服务手段邮箱管理回执响应功能分类区件断点重发功能编制管理报表EDI概述EDI定义

商业信息流通

EDIFACT

EDI标准EDI商务标准三要素EDI报文

EDI系统EDI与互联网EDI软件EDI硬件EDI中心Internet对EDI的影响实现EDI需要解决的问题Internet和EDI结合方式Internet电子邮件扩展Internet是全球网络结构ISP提供了多种服务方式映射问题安全问题利用SMTP/MIME邮件实现EDI与电子商务等增值业务InternetMailWeb—EDIEDI商务山东抽纱进出口公司系统结构EDI商务单证流向EDI商务上海联华超市EDI商务EDI在港航集装箱运输中的应用中远集团网络结构EDI商务交通部“四点一线”网络总体结构EDI商务金融EDI应用EDI商务商检EDI应用3/16/202666SWLayerCakeLayersofSemanticWeb67Unicode+URI(foundation)layerXML(syntacticinteroperability)layerRDF+Schema(datainteroperability)layerOntology(datainter-conversion)layerLogic(interoperability)layerW3CWorldWideWebConsortium

69万维网联盟创建于1994年,是Web技术领域最具权威和影响力的国际中立性技术标准机构。到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,有效促进了Web技术的互相兼容,对互联网技术的发展和应用起到了基础性和根本性的支撑作用。W3C标准不是某一个标准,而是一系列标准的集合。3/16/202670XMLW3CSchools

/xml/default.aspW3CXML

/TR/2006/REC-xml-20060816/XML.com

ATechnicalIntroductiontoXMLhttp:///pub/a/98/10/guide0.html3/16/202671Mark-upLanguagesDigitalizinginformationContentFormatSGMLHTMLXMLRDFOWL…

3/16/202672FromSGMLtoHTMLSGMListoocomplicateandhardtomasterWriteabrowserforprocessingSGMLbecomesdifficultW3CproposeHTML3/16/202673HTMLHyperTextMarkupLanguageSubsetofSGMLNouser-definedtagsNoDTDEasytolearnEasytowritebrowser3/16/202674FromHTMLtoXMLNouser-definedtagsDescribesonlydataformat,nocontentLackofcompatibilitywithotherpopularbrowsersToomanyincorrectHTMLfiles(wrongHTMLgrammer)XML3/16/202675XMLeXtensibleMarkupLanguageDataformatanddatacontentUser-definedtagsHasitsowngrammerDescribestructuredandunstructureddataStructured:database,table,Unstructured:webpage,eCommercedocument,etc.Platformforstoringandsharingdata(Oracle,IBM,Microsoft)3/16/202676MoreaboutXMLSimplifiedSGMLdescribingdataformatandcontentStoringstructuredandunstructureddataExtensible(user-definedtag)Platform-freeText-based(anytexteditor),Unicode-based(languagefree)3/16/202677XMLExample<?xmlversion="1.0"encoding=“UTF-8"?><customertable> <customer> <company>NortheastInventionInc.</company> <contact>AliceHeath</contact> <photofile="alice.gif"/> <position>MarketingDirector</position> <address>EastAvenue52</address> <tel>493972904</tel> </customer>

<customer> <company>InsightInc.</company> <contact>TomHepp</contact> <photo/> <position>SalesRepresentative</position> <address>SundownAvenue30</address> <tel>676873201</tel> </customer></customertable>3/16/202678Well-formedXMLdocumentInmoredetails:Firstisxmldeclaration(xmlversion)Onlyhasonerootelement,otherelementsareallthesub-elementofrootelementTagsmustbecorrectlyclosed.CorrectlynestedAttributehastousesingleordoublequotationmarksCasesensitive3/16/202679XMLdocumentValidationUserdefinedtagandattributemustfollowtheregulations.IfoneXMLdocumentfulfillthetagandattributedefinitionregulations,andwithoutusingcorrespondingDTD,thenthisXMLdocumentiswell-formedXMLdocumentIfonewell-formedXMLdocumentusescorrespondingDTDandpassesDTDvalidation,thenitisavalidXMLdocument3/16/202680RDF–WebstandardResourceDescribeFrameworkRDFbecameaW3CRecommendationin2004AW3CRecommendationisunderstoodbytheindustryandtheWebcommunityasawebstandard.AW3CRecommendationisastablespecificationdevelopedbyaW3CWorkingGroupandreviewedbytheW3CMembership.LanguageStackinSemanticWeb813/16/202682WhatisRDFItprovidesamodelfordata,andasyntaxsothatindependentpartiescanexchangeanduseit.RDFisdesignedmainlytobereadandunderstoodbycomputersRDFisnotdesignedforbeingdisplayedtopeopleRDFiswritteninXMLAnyXMLprocessor,parserscanparseandprocessRDFTheXMLlanguageusedforRDFiscalledRDF/XML3/16/202683FromXMLtoRDFInXML,therearemanyways:Way1:<author><uri>page</uri><name>Ora</name></author>Way2:<documenthref="page"><author>Ora</author></document>Way3:<document><details><uri>href="page"</uri><author><name>Ora</name></author></details></document>Way4:<document><author><uri>href="page"</uri><details><name>Ora</name></details></author></document>Way5:<documenthref="/test/page"author="Ora"/>3/16/202684WhyRDFInRDF,itissimplyatriple:

Triple:page,hasAuthor,Ora3/16/202685RDFTriplesTripleAResource(Subject)isanythingthatcanhaveaURIAProperty(Predicate)isoneofthefeaturesoftheResource:URIsAPropertyvalue(Object)isthevalueofaProperty,whichcanbeliteraloranotherresource:URIs,literal,blanknodesResource(subject)Value(object)Property(predicate)LiteralscanbetheobjectofanRDFstatement,butcannotbethesubjectorthepredicate3/16/202686BasicIdeasbehindRDFRDFusesWebidentifiers(URIs)toidentifyresourcesRDFdescribesresourceswithpropertiesandpropertyvaluesEverythingcanberepresentedastriplesTheessenceofRDFisthe(s,p,o)tripleResource(subject)Value(object)Property(predicate)Subjecthasapropertywithvalue“object”3/16/202687TherelationalmodelAtypicalrelationaldatabasetableforbooksISBNtitleauthorpublisherIDpages0596002637PracticalRDFShelleyPowers76423500596000480JavascriptDavidFlanagan3556936..............................3/16/202688TherelationalmodelThebookhasatitlewithvalue“Javascript”3/16/202689RDFdesigngoalHavingasimpledatamodelHaveformalsemanticsandprovableinferenceUsinganextensibleURI-basedvocabularyUsinganXML-basedsyntaxSupportinguseofXMLSchemadatatypesAllowinganyonetomakestatementsaboutanyresourceMorepropertiesWhataboutshowingmorepropertiesisbntitleauthorpublisherIDpages0596002637PracticalRDFShelleyPowers76423500596000480JavascriptDavidFlanagan3556936..............................3/16/2026903/16/202691Moreproperties3/16/202692WhatcanweuseRDF?RepresentinginformationaboutresourcesintheWWWDescribingpropoertiesforshoppingitems,suchaspriceandavailabilityDescribingtimeschedulesforwebeventsDescribinginformationaboutwebpages,suchascontent,author,createdandmodifieddateDescribingcontentandratingforwebpicturesDescribingcontentforsearchenginesDescribingelectroniclibraries3/16/202693RDFandtheSemanticWebRDFisthekeypartoftheSemanticWebactivities.IthelpstorealizethevisionoftheSemanticWebthat:WebinformationshouldhaveexactmeaningWebinformationcanbeunderstoodandprocessedbycomputersComputerscanintegrateinformationfromtheWeb3/16/202694DatatypesRDFtakesXMLSchemaDatatypes,suchasInteger,date,number,…RDFpredefinesjustonedatatype:rdf:XMLLiteral:forembeddingXMLinRDFRDFprovidesnomechanismfordefiningnewdatatypesXMLSchemaDatatypesprovidesanextensibleframeworksuitablefordefiningnewdatatypesforuseinRDF.3/16/202695SimpleexampleofRDF<RDF><Descriptionabout="/RDF"><author>JanEgilrefsnes</author><homepage></homepage></Description></RDF>/RDFauthorhomepageJanEgilrefsnes3/16/202696RDFStatementsThecombinationofaResource,aProperty,andaPropertyvalueformsaStatementAResource–thesubjectofaStatementAProperty–thepredicateofaStatementAPropertyvalue–theobjectofaStatement3/16/202697StatementexamplesStatement:“Theauthorof/RDFisJanEgilRefsnes”Subject:/RDFPredicate:authorObject:JanEgilRefsnesStatement:“Thehomepageof/RDFis”Subject:http:///RDFPredicate:homepageObject:3/16/202698RDFsyntaxStartingwith<rdf:RDF>andendwith</rdf:RDF><rdf:Description>isthemainelementtodefinethesubject,predicateandobjectofthestatementRDFNamespace/1999/02/22-rdf-syntax-ns#,Fileformat:.rdf3/16/202699RDFExample<?xmlversion=“1.0“encoding=“UTF-8“?><rdf:RDFxmlns:rdf="/1999/02/22-rdf-syntax-ns#"xmlns:cd="http://www.recshop.fake/cd#"><rdf:Descriptionrdf:about="http://www.rechshop.fake/cd/EmpireBurlesque"><cd:artist>BobDylan</cd:artist><cd:country>USA</cd:country><cd:company>Columbia</cd:company><cd:price>10.90</cd:price><cd:year>1985</cd:year></rdf:Description><rdf:Descriptionrdf:about="http://www.rechshop.fake/cd/Hideyourheart"><cd:artist>BonnieTyler</cd:artist><cd:country>UK</cd:country><cd:company>CBSRecords</cd:company><cd:price>9.90</cd:price><cd:year>1988</cd:year></rdf:Description><!--morecds--></rdf:RDF>3/16/2026100RDFisagraphAn(s,p,o)triplecanbeviewedasalabeledgraphTheformalsemanticsofRDFisalsodescribedusinggraphsThinkintermsofgraphs,notXMLordocumentsNodesingrapharethings(resources),arcsarerelationshipbetweenthings(resources)3/16/2026101ReferencesRDFtutorial

/2005/rdf-intro/W3CRDF

/RDF/RDFResourceGuide

/guide/Ontology本体本体描述语言OWL本体加工工具protégé本体开发之入门一个虚构的例子N的记者Miller和他的上司Joe目睹了“9.11”事件经过。但他当时并不知道,好友Bush是事件的罹难者之一,仅在半年前他还在Miller的手下工作过,Miller至今还保存有他们唯一的一张在N大厦前合影的照片。事件后一个月,Miller把照片连同一篇名为《风中之烛》的文章在N上发表以悼念好友。Issues搜索主题 “911事件中大厦的照片”搜索主题 “Bush生前曾在N上发表的文章”搜索主题 “事件的罹难者中也有一个Joe”搜索主题 “Bush是否曾在N工作过”误误误漏搜索引擎对内容的语义不能真正“理解”罹难者大厦照片目击者网站N“9.11”事件JoeMillerBush文章Joe(2)什么是“关系”-Relation只有把这些“关系”理清,“理解”这段文字人是如何认识现实世界的?概念知识:概念+概念间关系现实世界中的“关系”等级、等同、矛盾、因果、条件、整体与部分相关…RDFS揭示的概念间关系概念间的关系:(RDFS中的property)等级关系是最主要的表示方法,如分类法RDFS中有rdfs:subClassOf,rdfs:subPropertyOf随后所有的本体实例中都会看到,等级关系是最主要的部分相关关系(条件、因果、矛盾等等)RDFS中有一部分,如rdfs:seeAlso等同关系RDFS中没有,在OWL本体语言中有能不能只依赖RDFS,不引入本体?能不能只依赖元数据,不引入本体?本体概述OntologySimilartoadictionaryorglossary,butwithgreaterdetailandstructurethatenablescomputerstoprocessitscontent.Anontologyconsistsofasetofconcepts,axioms,andrelationshipsthatdescribeadomainofinterest.Anupperontologyislimitedtoconceptsthataremeta,generic,abstractandphilosophical…

--StandardUpperOntology(SUO)WorkingGroup按揭示内容的深度(ContentDepth)分KeyWord(Freeword):uncontrolledwordsVocabulary(Lexicon):authorizedwordsISO/BSR,CALS/UDEF,DublinCoreTypeTaxonomy:simpleclassification(主要是层级关系)DDC,UDCThesauri:Taxonomyplusrelated-termsISO/BSR,WordNet,EuroWordNet,UN/SPSC,UMLS…Ontology:concept/relation,Axiom,rule/reason……从数据库到知识库元数据用于建立DB,本体则用于建立KB!DB和KB的一个粗略比较DBMSDB:recordsKBMSKB:Facts+Terms+Relations+Rules+…本体不是…不是知识库只是KB的一个组成部分不是玄学方法可以看得到,可以数得出不是一成不变的圣经八股因描述对象而异,因使用需要而异不是“只此一家,别无分店”来源于任何人、任何机构、任何行业本体实例1-WordNetWordNet-英语词汇库1985年由普林斯顿大学认知科学实验室建立提供OWL格式:160M(3.0版)同义词集(Synsets)WordNet将英语的名词、动词、形容词、和副词组织为Synsets,每一个Synset表示一个基本的词汇概念概念之间关系同义关系(synonymy)反义关系(antonymy)(指针!)上位关系(hypernymy)(指针@)下位关系(hyponymy)(指针~)其它关系整体关系(名词、指针#m/#s/#p)部分关系(名词、指针%m/%s/%p)蕴含关系(动词、指针*)因果关系(动词、指针>)近似关系(形容词、指针&)WordNet的层级表名词的层级表

{plant,flora}{livingthing,organism}{animal,fauna}{person,humanbeing}{thing,entity}{naturalobject}{non-livingthing,object}{artifact}{substance}{food}

WordNetOnline本体实例2-SUMOSUMO–SuggestedUpperMergedOntology上层知识本体,由IEEE开发提供OWL格式:36M映射WordNetSUMO的类层级表EntityPhysicalProcessInternalChangeMotion…ObjectCollectionAgentRegionSelf-ConnectedObjectContent-BearingPhysicalAbstractAttributeRalationGraphPropositionGraphElement本体实例3-HowNet“知网”中文词汇集:/

目的:用于计算机处理中文语料作者:董振东、董强HowNet的层级表-{thing|万物}{entity|实体:{ExistAppear|存现:existent={~}}}-{physical|物质}{thing|万物:HostOf={Appearance|外观}, {perception|感知:content={~}}}-{animate|生物}{physical|物质:HostOf={Age|年龄},

{alive|活着:experiencer={~}},{die|死:experiencer={~}},{metabolize|代谢:experiencer={~}},{reproduce|生殖:agent={~},PatientProduct={~}}}-{AnimalHuman|动物}{animate|生物:HostOf={Sex|性别}, {AlterLocation|变空间位置:agent={~}},{StateMental|精神状态:experiencer={~}}}-{human|人}{AnimalHuman|动物:HostOf={Name|姓名}{Wisdom|智慧}{Ability|能力},{think|思考:agent={~}},{speak|说:agent={~}}}称为Taxonomy-义原层级Hownet概念定义示例医生:DEF={human|人:domain={medical|医},HostOf={Occupation|职位},{doctor|医治:agent={~}}}患者:DEF={human|人:domain={medical|医},{SufferFrom|罹患:experiencer={~}},{doctor|医治:patient={~}}}医院:DEF={InstitutePlace|场所:{doctor|医治:location={~},content={disease|疾病}},

domain={medical|医}}W_C=机敏地抓获女劫机犯W_E=catchawomanhijackercleverlyDEF={catch|捉住:manner={clever|灵}, patient={human|人:{rob|抢:agent={~}, possession={wealth|钱财}}, modifier={female|女}}}典型的OntologySUMO:WordNet:EuroWordNet:HowNet:Cyc:DBPedia:

特定本体今后的发展方向无论是WordNet,还是SUMO,这些本体主要的工作量在于词汇的收集词汇含义(内涵)的描述词间关系的整理本体间的映射(或合并),至少在不同的语种间原来各自采用的组织体系和方法,都应该向语义WEB靠拢本体的描述语言,应该统一到WEB本体语言OWL之上本体本体描述语言OWL本体加工工具protégé本体开发之入门本体语言完成的交互WEBTrust&Proof早期的本体语言对Ontology的描述需要由某种语言具体实现前期的基础工作OIL:OntologyInferenceLanguageDAML:DARPAAgentMarkupLanguage统一到DAML+OILSHOESimpleHTMLOntologyExtensions这些工作的目标与成绩支持推理形式化语义TheSemanticStackandOntologyLanguagesABFrom“TheSemanticWeb”technicalreportbyPierceTheSemanticLanguageLayerfortheWebA=OntologylanguagesbasedonXMLsyntaxB=OntologylanguagesbuiltontopofRDFandRDFSchemaAWEB本体语言OWLRDF(S)可胜任否RDF提供了描述resource的模型RDFSchema定义RDF词汇及资源的property定义Class定义Class和property的层次语义OWL-W3CWebOntologyLanguageOWL语言系列规范OWL规范的文档OWLOverview概述OWLGuide指南OWLReference参考OWLSemanticandAbstractSyntax语义及抽象句法OWLtestcases测试用例OWLusecasesandrequirement用例及需求2013-02-05RIFRDFandOWLCompatibility(SecondEdition)Recommendation

OWL22012-12-11OWL2WebOntologyLanguageMappingtoRDFGraphs(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageNewFeaturesandRationale(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguagePrimer(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageProfiles(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageQuickReferenceGuide(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageRDF-BasedSemantics(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageStructuralSpecificationandFunctional-StyleSyntax(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageXMLSerialization(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageConformance(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageDirectSemantics(SecondEdition)Recommendation

2012-12-11rdf:PlainLiteral:ADatatypeforRDFPlainLiterals(SecondEdition)Recommendation

2012-12-11OWL2WebOntologyLanguageDocumentOverview(SecondEdition)Recommendation

OWL2004-02-10OWLWebOntologyLanguageOverviewRecommendation

2004-02-10OWLWebOntologyLanguageGuideRecommendation

2004-02-10OWLWebOntologyLanguageReferenceRecommendation

2004-02-10OWLWebOntologyLanguageSemanticsandAbstractSyntaxRecommendation

2004-02-10OWLWebOntologyLanguageTestCasesRecommendation

2004-02-10OWLWebOntologyLanguageUseCasesandRequirementsRecommendation从RDF到OWLOWL丰富了描述Class和property的功能类间的不相交基数限制等价类及等价property对称property枚举类等RelationsdefinedinOWLOWL语言结构OWLLite最小子集OWLDL“DL”OWLFull对应RDF的表达但不可判定OWL子语言间的具体区别DLProvideExplicitTypingKeepnamesseparateRestrictionsClassaxioms&Propertyaxioms&Individualaxioms…………Lite遵循DL所有规则禁用词汇:owl:unionOf,owl:complementOf,owl:oneOf,owl:hasValue,owl:disjointWith等详见“OWLReference”的AppendixE.rulesforOWLDL3.OWLLite3.1OWLLite的RDFSchema特征owl:Classrdfs:subClassOfrdf:PropertyProperty表达了一种非常广泛的关系,它可以是实体间的、实体与值间的、类间的、类与实体间的、实体与特性间的、特性与特性间的关系!OWL定义了两种主要的Propertyowl:ObjectProperty:表示个体之间的关系eg:“father”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论