网络信息资源描述_第1页
网络信息资源描述_第2页
网络信息资源描述_第3页
网络信息资源描述_第4页
网络信息资源描述_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2讲 网络信息资源描述2.1 基本概念2.2 基本方法2.3 关键技术2.4 语义化描述研究现状2.1 基本概念 网络信息资源描述:根据信息组织和检索的需要,依据一定的规则和标准,对网络信息资源的主题内容、形式特征等进行分析、选择和记录的活动。2.1 基本概念 网络信息资源描述的类型:全文标引简单标引简单字段标引字段标引高度结构化标引语义标注知识表示主题标引分类标引2.2 基本方法 内容方面:针对普通信息(网页、数据库):元数据针对特殊信息:词表-SKOS,本体-owl、应用系 统-WSDL(SAWSDL)2.2 基本方法 格式方面:HTMLXML, XHTMLRDF2.3 关键技术 元数据

2、元数据是指用于帮助识别、描述和定位网络化的电子资源的结构化数据,通过它可以揭示各类电子文献的内容和其他特征以方便检索。是关于数据的数据,或关于数据的结构化的数据。 一个元数据格式包括三种特征:一组有限的元素、每一个元素的名称及每一元素的意义。2.3 关键技术 元数据常用的元数据类型常用的元数据类型 简单的(DC)、复杂的(MPEG-21 DIDL) 通用的(DC)、专用的(CDWA) 标准化程度高的(MARC)、标准化程度低的(CDWA)2.3 关键技术 元数据 名称:Dublin Core Metadata, DC 简介:都柏林核心元数据是一个由计算机专家、网络专家和图书馆专家等人员所组成的

3、非正式小组开发的,目的是要建立一个广泛的元数据元素集,可以描述任何网络信息资源,并足够的简单以至任何作者无需专门的培训就可以创建自己文件的元数据。 DC具有创建和维护简单、广为理解的句法、系统互用性、可扩展性等特点。目前,DC已经拥有15个基本元素,并可以使用TYPE和SCHEME限定词以及LINK参照对元素进行扩展。 网址:2.3 关键技术 元数据CDWA(艺术作品描述目录艺术作品描述目录)名称:The Categories for the Description of Works of Art简介:艺术作品描述目录(CDWA)由AITF(the Ar

4、t Information Task Force)于1996年开发,主要为提供和使用艺术信息的团体(如博物馆和档案馆)描述艺术作品(包括其图像)提供结构化工具。它的描述重点在于“可动”的对象及其图像,包括来自不同时期和地理范围的油画、雕刻、陶艺、金属制品、家具、设计、表演艺术等等。该元数据有26个主要类目,每一个类目有其子类目,包括主题、记录、管理等项目。网址:/gii/cdwa/2.3 关键技术 元数据 VAR Core(可视资源委员会核心元数据可视资源委员会核心元数据) 名称:Visual Resources Association Core

5、 简介:美国可视资源委员会(VAR)为了规范描述可视文化作品及其图像资源,颁布了此项标准,2000年6月已经出版到第三版。可视作品主要指绘画、雕塑、表演、乐曲、文艺作品、建筑物、建筑设计或其他含有文化含义的物品等,这些物品可以独立存在,也可以由多个部分组成。元数据描述的对象可以是这些物品的复制品或代表物,可以是幻灯、照片、录相或各种数字化形式。一个作品可以拥有多个数字化形式。该方案含有17个核心元素。2.3 关键技术 元数据 CDF(频道定义格式) 名称:Channel Definition Format 简介:频道定义格式由微软公司在1997年三月提出。作为一个开放的专门说明,CDF允许网页

6、出版商实现从任何自动传输的WEB服务器到相容的接受程序之间提供快速更新的信息集合或频道。CDF使用XML,并对XML和Web Collections进行了扩展,面向的用户是创建网页的个人或机构。它使用一个简单句法创见频道,因而除了WEB服务器和CDF适应的浏览器之外,不需要任何技术支持。 网址:/pub/WWW/TR/WD-xml-961114.html2.3 关键技术 元数据ROADS元数据(主题信息服务的资源组织和发现)元数据(主题信息服务的资源组织和发现)名称:Resource Organisation And Discovery in Subject-b

7、ased services简介:是英国高等教育领域对互联网信息资源进行收集组织并提供检索服务的系统,其主要目标是建立一个主题信息网关,帮助信息服务机构快速构建能够有效组织和检索专业领域信息的系统。ROADS系统利用一组元数据应用模版(Metadata Templates)来定义和组织描述不同类别资源所需的元数据,并且有一套注册系统负责支持重用这些元数据模版、元素,并实现这些不同类别资源在元数据语义方面的互操作。2.3 关键技术 元数据 IEEE LOM(IEEE学习对象元数据)学习对象元数据) 名称:IEEE Learning Object Metadata 简介:由IEEE学习技术标准委员会

8、P1848.12学习对象元数据工作组建立,用以完整、充分地描述一个学习对象的特征。定义了学习对象模型,学习对象元数据的语法和语义,目的在于使用最小属性集完成对学习对象的管理、检索和评估,并且便于将来对其属性进行扩展。2.3 关键技术 元数据 BibTex(科技文献书目资源格式科技文献书目资源格式) 名称: 简介:BibTex是描述科技文献书目资源的格式,是LaTeX的一部分(LaTeX是文件打印设置系统)。BibTex是一个单独的程序,通过从一个书目数据库获取信息从而产生文件的来源列表。主要用在科学和学术界以及工业领域。 网址:/tex-archive/bib

9、lio/bibtext/distribs/doc/2.3 关键技术 元数据 GEM(教育资源网关)(教育资源网关) 名称:the Gateway to Educational Materials 简介:,美国教育部支持,致力于组织和整合美国各类网站上的教育资源,以便人们方便地检索和获取。项目复用了DC15个元素,并扩展了8个新元素。2.3 关键技术 元数据CIMI(博物馆信息计算机交换标准框架博物馆信息计算机交换标准框架)名称:A Standards Framework for the Computer Interchange of Museum Information简介:CIMI是博物馆信

10、息计算机交换标准框架,完整的框架包含交换协议、交换格式、低层网络和通信以及内容数据标准。现阶段CIMI的主要计划是CHIO(Cultural Heritage Information Online,文化遗产联机信息),主要目标是提供对各类博物馆信息的记录方式,包括展览目录的全文本、展品文字解释(wall texts)、图象以及传统的文献类信息。CHIO包括两个部分:CHIO结构(包括内容数据标准及其格式)和CHIO存取(access)。前者使用SGML,后者使用Z39.50。网址:/pub/sgml/ead2.3 关键技术 元数据REACH元数据格式元数据格式名称:RLG

11、 REACH Element Set简介:1997年美国研究图书馆协会RLG(Research Library Group)为探索有效组织博物馆信息、提供博物馆资源在线服务为探索有效组织博物馆信息、提供博物馆资源在线服务而提出了这个元数据格式而提出了这个元数据格式,包含20个基本元素。2.3 关键技术 元数据 名称:Encoding Archival Description, EAD 简介:编码文档描述是SGML的一个专用数据类型(DTD)。美国国会图书馆网络开发/MARC标准办公室是它的维护机构,美国档案管理员协会(SAA,the Society of American Archivists

12、)是该标准的所有者。EAD主要用于描述档案和手稿资源主要用于描述档案和手稿资源(manuscripts collections),并利用网络检索和获取档案手稿类信息资源。相对于提供概括性描述和整体存取的MARC记录,EAD意在提供具体细节的描述和存取。 网址:/pub/sgml/ead2.3 关键技术 元数据 ONIX(在线信息交换在线信息交换) 名称:Online Information eXchange 简介:是一种描述、传递和交换出版物元数据的国际性标准,克服了MARC在支持电子贸易EDI和电子商务方面的不足。由出版商、发行商、零售商、图

13、书馆以及在这条供应链上其他环节的经营者共同制定,参加者有许多出版发行行业的国际协会和巨头。目前的版本是2001年7月形成的ONIX2.0版。2.3 关键技术 元数据 EELS(工程电子化图书馆工程电子化图书馆) 名称:the Engineering Electronic Library 简介:工程电子化图书馆是瑞典大学技术图书馆的一个合作计划,为网络信息资源的质量评价提供一个信息系统。EELS使用的元数据是该计划所专有的。目前,该格式只由图书馆员与信息专家使用。EELS格式包括11个属性. 网址:http:/www.ub2.lu.se/eel/eelhome.html2.3 关键技术 元数据E

14、EVL(爱丁堡工程虚拟图书馆爱丁堡工程虚拟图书馆)名称:EEVL,Edinburgh Engineering Virtual Library简介:爱丁堡工程虚拟图书馆是欧洲电子图书馆计划(eLib, the Electronic Libraries Programme)资助的计划,目的是为工程领工程领域的高质量信息资源域的高质量信息资源提供主题查询网关。它的元数据格式为该计划专有,包括22个属性,用于专门描述网络资源。网址:http:/www.eevl.ac.uk/pubs.html2.3 关键技术 元数据 FGDC(联邦地理数据委员会联邦地理数据委员会) 名称:FGDC,the Federa

15、l Geographic Data Committee 简介:联邦地理数据委员会在1992年建立了一个地理数据文件的术语和定义集合,并在1994年通过数字化地理元数据的内容标准(Content Standards for Digital Geospatial Metadata),名为CSDGM,但通常仍叫做FGDC。FGDC包括300多个元素,包括7个主要段和3个辅助段。国家地理信息交换所(National Geospatial Data Clearinghouse)作为主题化信息网关利用FGDC实现数字化地理数据数字化地理数据的发现、评价和下载。 网址:/

16、Metadata/metahome.html2.3 关键技术 元数据 GILS(政府信息定位服务政府信息定位服务) 名称:the Government Information Locator Services, GILS 简介:政府信息定位服务由美国联邦政府建立,面向普通公众和政府用户提供如何定位和查找由许多政府机构产生的有用信政府机构产生的有用信息息,因此它的用户非常广泛,许多国家的政府机构,如加拿大、澳大利亚等正密切注视美国的GILS计划。 网址:/public/gils/prof_v2.html2.3 关键技术 元数据 MARC(机读目录格式机读目录格

17、式) 名称:MARC 简介:机读目录格式是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被图书馆用来描述和存取电子信息资源,例如扩展MARC格式的“电子位置及提取方式字段”(即856字段,可重复)可利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、FTP站点等)的特征、连接方式和提取要求。最近,有关机构还开展了MARC与SGML等元数据格式互操作性的试验。 网址:/marc/marc.html2.3 关键技术 元数据 MOA2(美国的创建(美国的创建II) 名称:the Making Of America II 简介:美

18、国的创建项目起始于1995年,由美国Digital Library Federation支持,最初由米歇根大学和康乃尔大学合作进行,对美国南北战争以前关于美国社会历史的珍贵书刊进行扫描,提供电子版本服务。因此这个元数据标准主要是关于数字图像的元数据,分结构性元数据、管理型元数据等,对图像数字图书馆的资源加工、管理和元数据元素的选取、元数据方案的制定具有很好的参考作用。2.3 关键技术 元数据 MCF(元内容框架元内容框架) 名称:Meta Content Framework,MCF 简介:元内容框架,由网景公司于1997年6月提交给W3C。它是过去多项元数据工作(如XML、CDF、PICS、W

19、eb Collection)发展的结果,产生了一个“数据模型和相应的交换格式”,足够强大以适应任何应用。MCF主要应用于:描述WEB站点或频道集合的结构;贯穿email;PIM功能;分布式注解和创作;交换相关于商业的信息,如价格、存货清单、送货日期。 网址:http:/ 关键技术 元数据 PICA+(荷兰图书馆自动化中心荷兰图书馆自动化中心) 名称:The Dutch Center for Library Automation,PICA 简介:荷兰图书馆自动化中心为荷兰图书馆以及许多德国图书馆网络提供共享编目、馆际互借以及文件传送等服务,建有NCC/IBL系统,它提出了基于MARC的文献数据库

20、和其他信息资源描述格式。 网址:http:/www.ukoln.ac.uk/metadata/desire2.3 关键技术 元数据 PICS(网络内容选择平台网络内容选择平台) 名称:Platform for Internet Content Selection,PICS 简介:网络内容选择平台始于1995年8月,最初用于帮助父母和老师控制儿童获取网络资源,后来作为一项技术规范,使用户能够轻松找到合适的内容又避免那些对自己或儿童不适合、不需要的内容。该规定易于创建和获取,标记各种系统以及相关的内容选择和过滤机制,从而允许不同的人和机构以最适合各自观点的方式标记网页内容。PICS技术规范最终在1

21、996年初完成,此后PICS被结合到一系列产品中,例如基于PICS的评级服务和过滤工具被大量地开发出来。 网址:http:/www.ariadne.ac.uk/issue9/pics2.3 关键技术 元数据 TEI Header(文本编码先导计划文本编码先导计划) 名称:the Text Encoding Initiative,TEI 简介:文本编码计划开始于1987年,其目标是定义一个表现电子化文本资料的通用格式,使研究者能交换和重复使用资源,不受软件、硬件和应用领域的限制。美欧的许多学术团体已加入到该计划中,并组成多个委员会考虑编码的各个方面。TEI Header作为TEI格式中元素定义部

22、分,基于SGML/DTD,可作为TEI文件的一部分,或作为独立的元数据存在。 网址:ftp:/info.ox.ac.uk/pub/ota/TEI/doc/teij31.sgml2.3 关键技术 元数据 SOIF(概略对象交换格式概略对象交换格式) 名称:the Summary Object Interchange Format,SOIF 简介:概略对象交换格式,是科罗拉多大学Harvest体系的一部分。SOIF记录由Harvest搜集器产生,并由Harvest代理使用,用于用户搜索,提供了由Harvest搜索器找到的资源的概况。在1996年3月,网景公司宣布在其目录服务器中使用SOIF,其它搜

23、索引擎也准备支持SOIF。 网址:http:/ -g/Harvest/user-manual/nodel51.html2.3 关键技术 元数据 ICPSR SGML Codebook(政治和社会研究方面的校际联盟政治和社会研究方面的校际联盟) 名称:ICPSR,Interuniversity Consortium for Political and Social Research 简介:政治和社会研究方面的校际联盟,在1995年建立了一个委员会,针对社会科学研究团体对国际性Codebook标准的需要,开发描述社会科学数据集的结构化信息集。一个Codebook通常包括结构、内容、数据文件或数据集

24、的信息,该委员会力图覆盖社会科学中各类数据集和数据集系统,其Codebook中的元素是从社会科学调查、研究、档案和技术团体中使用的一系列使用指南和标准中选取的。 网址:/codebook.html 2.3 关键技术 元数据 LDAP DIF(轻便型目录获取协议轻便型目录获取协议) 名称:LDAP,the Lightweight Directory Access Protocol 简介:轻便型目录获取协议为那些在OSI低层中无法运行目录获取协议的机器提供获取X.500目录服务的方式。LDIF,即LDAP数据交换格式(LDAP Data Interch

25、ange Format)已被网景公司采用,它声明要将LDAP结合到它的网景导航器(Netscape Navigator)中,这意味着WWW的用户将拥有一个被直接传送到用户桌面的目录搜索和检索协议,这相对于目前通过第三者进行搜索和检索工作的现状,的确是一个进步。 网址:/rsug2.3 关键技术 元数据 RFC 1807(书目记录格式书目记录格式) 名称:A Format for Bibliographic Records, 1995 简介:由R. Lasher和D. Cohen在1995年提出的方案,用以描述计算机科学技术报告和以FTP等网络资源形式存储在

26、网络服务器中的文档。万维网协会(W3C)的许多技术标准文档均以RFC开头,意为Request For Comment,从字面上看并不是标准,文档内容中也常常说明RFC文档不是标准,然而许多RFC确实是实实在在的事实标准。RFC1807的具体版本格式被称为TR-v2.1,取代了1992年的RFC1357。该格式被NCSTRL:Networked Computer Science Technical Reference Library等项目应用,其优点在于文档的创建和阅读都很容易,可使用任何文本编辑器,不需要专门的程序。 网址:/htbin/

27、rfc/rfc1807.html2.3 关键技术 元数据 URCs(统一资源特征统一资源特征) 名称:URCs,Uniform Resource Characteristics/Citation 简介:统一资源特征用于识别:关于联机资源编目信息的长术语;连接元数据或描述信息的标准方式;作为将URN分解到URL的过程信息;选择资源时的应用信息。URC的目的在于全面确保电子资源的机器可检索性。 网址:/URI2.3 关键技术 元数据 MPEG-21 DIDL 复杂对象格式有多种,如MPEG-21 DIDL、METS、MODS和SCORM等,尽管这些格式语

28、法互不相同,但都具有以下三个特点:第一、描述的数字资源可包含多个数据流(对数字资源的收割实质上变为对数字资源所包含的部分或全部数据流的收割);第二、能利用base64编码方式将数据流与元数据放置在同一个记录中;第三、如果数据流和元数据不在同一个记录中则采用统一的方式明确指出数字资源的URL567。对于采用这些复杂对象格式来描述数字资源的OAI数据提供者(如美国的LANL Research Library8),则可以利用后两个特点,实施基于OAI-PMH的数字资源收割。现以MPEG-21 DIDL为例来说明复杂对象元数据格式的基本情况。2.3 关键技术 元数据 MPEG-21 DIDL DIDL

29、 (Digital Item Declaration Language)是基于MPEG-21标准的数字对象描述语言,尽管来源于MPEG,但由于它具有较强的灵活性,可以用来描述任何类型的数字资源(包括只有一个数据流的简单数字对象和由多个数据流组成的复合数字对象),还允许将简单的元数据格式如oai_dc嵌入到DIDL记录中。DIDL的基本组成单位是Item,一个DIDL文档可以由多个Item组成,每个Item又可由多个子Item、多个Descriptor或多个Component组成,其中Descriptor描述该Item的元数据和其它一些信息,Component绑定一个Resource和一个Des

30、criptor,而一个Resource则是一个单独可识别的数据流如一个视频剪辑或一个JPG文件。图2给出了一个DIDL文档的结构图,该文档包含两个Item,第一个Item由两个Descriptor和两个Component组成,第二个Item由一个Descriptor、一个Component和一个子Item组成。DescriptorComponentDescriptorResourceComponentDescriptorResourceDescriptorItemDescriptorComponentDescriptorResourceComponentDescriptorResourceIt

31、emItem一个DIDL文档 /此处省略了对资源的identifier的描述 /此处省略对资源元数据的描述(oai_dc格式) PEJJT1NJU0NpdGF0aW9uIERvYPEJJT1NJU0NpdGF0aW9uIERvY0lkPSI1NjY5MTM1Ij48SG.0lkPSI1NjY5MTM1Ij48SG. /此处省略了对另外一个Item的描述 一个DIDL文档的结构图 一个DIDL文档的代码片段资源描述示例(元数据格式为资源描述示例(元数据格式为DC):): Sonyas xarintaa Ceremony Song Poetry This recording was made du

32、ring a community-wide feast in the Nanti community of Montetoni on the Camisea River in southeastern Peru Christine Beier Lev Michael /search/resource.html?r_id=130 COX001R003 Peru 资源描述示例(元数据格式为资源描述示例(元数据格式为MARC):):原始的MARC记录(ISO2709):01142cam 2200301 a 450000100130000000300

33、0400013005001700017008004100034010001700075020002500092040001800117042000900135050002600144082001600170100003200186245008600218250001200304260005200316300004900368500004000417520022800457650003300685650003300718650002400751650002100775650002300796700002100819 92005291 DLC 19930521155141.9 920219s199

34、3 caua j 000 0 eng -a 92005291 -a0152038655 :-c$15.95 -aDLC-cDLC-dDLC -alcac 00-aPS3537.A618-bA88 1993 00-a811/.52-220 1 -aSandburg, Carl,-d1878-1967. 10-aArithmetic /-cCarl Sandburg ; illustrated as an anamorphic adventure by Ted Rand. -a1st ed. -aSan Diego :-bHarcourt Brace Jovanovich,-cc1993. -a1

35、 v. (unpaged) :-bill. (some col.) ;-c26 cm. -aOne Mylar sheet included in pocket. -aA poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the images reflection in the provided Mylar

36、 cone. 0-aArithmetic-xJuvenile poetry. 0-aChildrens poetry, American. 1-aArithmetic-xPoetry. 1-aAmerican poetry. 1-aVisual perception. 1 -aRand, Ted,-eill.资源描述示例(元数据格式为资源描述示例(元数据格式为MARC):):XML格式的MARC记录: 01142cam 2200301 a 4500 92005291 DLC 19930521155141.9 920219s1993 caua j 000 0 eng 92005291 01520

37、38655 : $15.95 DLC DLC DLC - lcac - PS3537.A618 A88 1993 - 811/.52 20 - Sandburg, Carl, 1878-1967. - Arithmetic / Carl Sandburg ; illustrated as an anamorphic adventure by Ted Rand. - 1st ed. - San Diego : Harcourt Brace Jovanovich, c1993. - 1 v. (unpaged) : ill. (some col.) ; 26 cm. - One Mylar she

38、et included in pocket. - A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the images reflection in the provided Mylar cone. - Arithmetic Juvenile poetry. - Childrens poetry, Am

39、erican. - Arithmetic Poetry. - American poetry. - Visual perception. - Rand, Ted, ill. 资源描述示例(元数据格式为资源描述示例(元数据格式为MPEG-21 DIDL):): /此处省略了对资源的identifier的描述 /此处省略了对资源元数据的描述(oai_dc格式) PEJJT1NJU0NpdGF0aW9uIERvY0lkPSI1NjY5MTM1Ij48SG. /此处省略了对另外一个Item的描述2.3 关键技术 元数据 元数据互操作:不同元数据格式之间的相互映射。 主要方法有:直接对照、基于某种格式的

40、转换对照Dublin CoreCNMARCUSMARCTitle200($a,$e,$d)225($a,$h,$v)245($a,$b,$h,$k,$n,$p,$s)400($a,$b,$c,$d,$n)410($a,$b,$c,$d,$n)411($a,$b,$c,$d,$n)440、490(所有子字段)Identifier ISBN ISSN 010($a)011($a)020($a,$z)022($a,$z)URL856($u)856($u)Publisher210($a,$c)260($a,$b)Contributor702($a,$b)712($a,$b)700($a,$b,$c,$

41、d,$n)710($a,$b,$c,$d,$n)711($a,$b,$c,$d,$n)730($a,$b,$c,$d,$n)Creator700($a)701($a)710($a)711($a)100($a,$b,$c,$d,$n)110($a,$b,$c,$d,$n)111($a,$b,$c,$d,$n)130($a,$b,$c,$d,$n)Description330($a)520($a)Date210($d)260($c)Format Extent105(bit 8)head(bit 7) (s=期刊,1=会议录,0=图书)008(bit 29)head(bit 7) (s=期刊,1=会

42、议录,0=图书)DC格式与CNMARC、USMARC格式直接对照表2.3 关键技术 元数据 元数据互操作:不同元数据格式之间的相互映射。 主要方法有:直接对照、基于某种格式的转换对照基于某种格式的转换对照:在这种模式中,某种格式被作为多种格式之间的转换机制。不需要再对每两种格式之间进行映射,每种元数据格式只需映射到转换格式就可以。2.3 关键技术 元数据 元数据登记:元数据登记站的目的就是收集有关元数据格式方面的数据, 通过促进元数据的发现和重用, 推动其跨学科和团体的广泛使用, 加速元数据的标准化和互操作性。元数据登记站的基本组成部分包括数据模式、元素、元素集、编码格式、应用框架、元素使用信

43、息和元素对照等的确认。除了这些共同的组成以外, 每个登记站都有自己的特定规模。2.3 关键技术 元数据 四类元数据登记系统(来自赵景明论文):( 1) 跨学科和跨格式登记站。如UKOLN的SCHEMAS Registry, 包含了元数据元素集和相关文献, 可以通过Web界面进行检索和浏览。 http:/www.ukoln.ac.uk/projects/iemsr/ /schema/show/id/29.html( 2) 特定领域跨格式登记站。如UKLON的MEG登记站推动教育领域内的元数据格式登记。( 3) 特定项目登记站。如欧洲图书馆( T

44、EL) 元数据登记站的目的就是记录与TEL 有关的所有元数据活动。登记站包括对元素名称的翻译, 公布元素是否可以重用,是否可检索, 是否是强制施行等。( 4) 特定格式登记站。如都柏林核心元数据登记站负责记录DC内的有效元素, 目前这个登记站提供有关元素、可控词表和编码格式等方面的详细资料。2.3 关键技术 元数据 中国元数据规范中国元数据规范 我国数字图书馆标准与规范建设项目(CDLS)是科技基础性工作专项资金重点项目。 主要针对数字图书馆系统的数字资源建设与服务,制定我国数字图书馆标准规范发展战略与标准规范框架,制定数字图书馆核心标准规范体系,建立数字图书馆标准规范开放建设与开放应用机制,

45、促进我国数字图书馆的快速、经济和可持续发展。 项目一期从2002年10月开始,到2005年9月结束。项目二期从2006年开始。2.3 关键技术 元数据 中国元数据规范中国元数据规范 我国数字图书馆标准与规范建设项目(CDLS)是科技基础性工作专项资金重点项目。 主要针对数字图书馆系统的数字资源建设与服务,制定我国数字图书馆标准规范发展战略与标准规范框架,制定数字图书馆核心标准规范体系,建立数字图书馆标准规范开放建设与开放应用机制,促进我国数字图书馆的快速、经济和可持续发展。 项目一期从2002年10月开始,到2005年9月结束。项目二期从2006年开始。http:/ 关键技术 元数据 中国元数

46、据规范中国元数据规范 我国数字图书馆标准与规范建设项目(CDLS)是科技基础性工作专项资金重点项目。 主要针对数字图书馆系统的数字资源建设与服务,制定我国数字图书馆标准规范发展战略与标准规范框架,制定数字图书馆核心标准规范体系,建立数字图书馆标准规范开放建设与开放应用机制,促进我国数字图书馆的快速、经济和可持续发展。 项目一期从2002年10月开始,到2005年9月结束。项目二期从2006年开始。http:/ 关键技术 RDF 资源描述框架(Resource Description Frame)假设有一个叫John Smith的人创建了某个网页。如果用自然语言(如英语)来陈述该事实,一种简洁明

47、了的方式是采用下面这种简单陈述的形式: /index.html has a creator whose value is John Smith /index.html has a creation-date whose value is August 16, 1999 /index.html has a language whose value is English其中关键的三点: 陈述所描述的事物(譬如此例中John Smith所创建的网页)陈述所描述事物的具体属性(

48、property)(譬如本例中的creator)陈述所描述的作为该属性(陈述所描述事物对应的)的值的事物(如这个网页的creator是谁)。 2.3 关键技术 RDF RDF的基本思想是:用一个或一组陈述来描述一个资源,其中每个陈述都由一个三元组,即主体(subject),谓词(predicate),客体(object)组成。上述关于网页的三元组描述可用如下图形表示: 2.3 关键技术 RDF上图的RDF描述如下: 1. 2. 5. 6. August 16, 1999 7. en 8. 9. 10. 2.3 关键技术RDF以下是一个完整的基于dc和RDF/XML的资源描述例子: D-Lib

49、Program W3Schools - Free tutorials Refsnes Data as 1999-09-01 Web Development text/html en 2.3 关键技术RDF RDF/XML语法概要RDF根元素:根元素: Description子元素 DESCRIPTION子元素:子元素: 属性元素 2.3 关键技术RDF RDF/XML语法概要属性元素:属性元素: 或 属性值 其中属性元素名必须是Qname形式的值,形如:dc:creator Qname:qualified name,限定名2.3 关键技术RDF RDF/XML语法概要rdf:RDFThe ro

50、ot of an RDF documentrdf:DescriptionContainer for the description of a resourcerdf:resourceDefines a resource to identify a propertyrdf:datatypeDefines the data type of an elementrdf:IDDefines the ID of an elementrdf:liDefines a listrdf:_nDefines a noderdf:nodeIDDefines the ID of an element noderdf:

51、parseTypeDefines how an element should be parsed2.3 关键技术RDF RDF/XML语法概要rdf:Listrdf:Propertyrdf:Statementrdf:Altrdf:Bagrdf:Seqrdf:XMLLiteralrdf:first rdf:rest rdf:subjectThe subject of the resource in an RDF Statementrdf:predicateThe predicate of the resource in an RDF Statementrdf:objectThe object o

52、f the resource in an RDF Statementrdf:valueThe property used for valuesrdf:typeThe resource is an instance of a class2.3 关键技术RDFSRDFS:资源描述框架模式,RDF Schema。 RDFS的引入的引入-为什么需要为什么需要RDFS?RDF只定义用于描述资源的框架,并没有定义用哪些词汇来描述资源。RDF允许任何人用词汇集描述语言来创建自己的词汇集。问题:RDF没有提供任何机制来说明类的特性、类与类之间的关系、特性之间的关系以及特性与类之间的关系。RDFS2.3 关键技

53、术Ontology及owlOntologyd的概念的概念Studer认为:共享概念模型的明确的形式化规范说明Ontology的四层含义:概念模型(conceptualization)。通过抽象出客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态。明确(explicit)。所使用的概念及使用这些概念的约束都有明确的定义形式化(formal)。Ontology是计算机可读的(即能被计算机处理的)。共享(share)。Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即Ontology所针对的是团体而非个体的共识。Ontolog

54、y的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇之间相互关系的明确定义。 2.3 关键技术Ontology及owl Ontology中的关系中的关系 从语义上讲,基本的关系共有4种: 实际上,概念之间的关系不限于上面列出的4种基本关系,可以根据领域的具体情况定义相应的关系,以满足应用的需要。 关系名关系描述Part-of表达概念之间部分与整体的关系。Kind-of表达概念之间的继承关系,类似于面向对象中的父类与子类之间的关系。给出两个概念C和D,记C=x x是C的实例,D=x x是D的实例,如果对任意的x属干D,X都属干C,则称C为D的父概念,D为C的子概念。instance-of表达概念的实例与概念之间的关系,类似于面向对象中的对象和类之间的关系。attribute-of表达某个概念是另一个概念的属性。如概念“价格”是概念“桌子”的一个属性。2.3 关键技术Ontol

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论