SNS中基于差序格局的知识共享研究.docx_第1页
SNS中基于差序格局的知识共享研究.docx_第2页
SNS中基于差序格局的知识共享研究.docx_第3页
SNS中基于差序格局的知识共享研究.docx_第4页
SNS中基于差序格局的知识共享研究.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于关联数据的农业知识管理体系以FAO为例基于关联数据的农业知识管理体系以FAO为例【摘要】 关联数据的出现使得语义网发展取得了实质上的突破,被W3C推荐为语义网的“最佳实践”,得到各个领域的关注。关联数据为农业知识管理提供了新的解决方案,农业知识管理领域也是关联数据的最佳应用平台。在FAO良好的本体、信息管理系统和标准工作的基础上,基于关联数据的农业知识管理已经取得了很大的进展。介绍基于关联数据的农业知识管理研究与应用,并对此进行总结、分析与展望。【关键词】 关联数据 农业 知识管理 知识组织李楠中国农业科学院农业信息研究所 博士研究生中国社会科学院研究生院图书馆 副馆长张学福中国农业科学院农业信息研究所教授 博士生导师数据库研究室副主任收稿日期:2012.11.20发表日期:2013.03.30由于关联数据具有结构化、标准化、语义化和实现简单的特性,被W3C推荐为语义网的一组“最佳实践”,成为当前数字资源揭示、整合和利用的关键技术,并成为开放获取、互操作、语义查询服务的事实标准1。在知识的组织、发现和管理方面具有广泛的应用前景。农业领域一向是信息和知识的组织与管理应用的重要领域,知识组织方法、网络和信息技术对于农业领域的科研、生产和发展影响巨大。关联数据时代的到来同样为农业领域带来了新的机遇与挑战。农业信息与关联数据 联合国粮食与农业组织(Food and Agriculture Organization,FAO)是一个信息和知识管理的组织。FAO的活动包含知识的获取与分析、知识的传播与共享、知识存储和知识供给这4个与信息和知识的不同方面紧密相关的领域。开发和维护农业信息和知识管理的目标可以归结于FAO的知识交换、研究和扩展2。为了实现这一目标,FAO一直以来充分借助和发挥计算机网络技术、信息技术的作用,依靠信息和知识引领全球对抗饥饿和贫穷的运动,取得了骄人的成就,为农业信息和知识管理建立了坚实的基础,并考虑了可持续发展的战略。关联数据是将标准、方法、工具和环境有机结合的一套“最佳实践”,为信息和知识的整合提供了概念模型、描述方法、应用协议乃至知识网络的全面解决方案,使语义网发展取得了实质上的突破。由于目标高度一致,关联数据也为FAO的农业信息和知识管理提供了新的方法和新的机会。基于良好的基础和可持续发展的战略,FAO的农业领域的关联数据实践得以顺利开展。FAO采纳和调整了农业领域关联数据发展策略,并逐步完成了核心词表的改造和关联数据化,建立了基于关联数据的农业信息和知识开放获取平台,并且基于关联数据的简单、标准、共享的特点,面向全球进一步推动和扩展了农业元数据交换。农业领域关联数据的基石AGROVOC 2.1 AGROVOC的发展AGROVOC是一个多语言的农业叙词表,由FAO和欧盟委员会于20世纪80年代初期开发3。该叙词表自建成以来,被广泛地应用并且成为农业领域实施上的核心词汇表。2003年以来,FAO开始使用更精炼和精确的方法,开发一个包含语义网和词汇关系的新模型。通过近10年的努力, AGROVOC由传统的叙词表转换为一个本体化的概念服务,成为一个建立在农业领域中的多语言概念知识库。随着关联数据概念的出现, AGROVOC又于2011年被发布为关联数据,成为农业领域关联数据应用的标准和核心。2.2 AGROVOC的重新组织面向本体重新组织的AGROVOC,是一个多领域、多主题和多语言的结构化词表。其核心特征是以概念方案进行组织,覆盖多个领域,使用本体关系组织相关概念和术语。新的AGROVOC使用20种语言,拥有近600 000个术语,约40 000个概念4,成为农业知识通用术语的一站式中心。其中的概念和术语被组织为使用SKOS(Simple Knowledge Organization System)模型表示的概念框架(concept scheme),如图1所示:图1 AGROVOC的SKOS模型AGROVOC也是一个基于“概念/术语/字符串”的系统,经本体化改造后,使用本体关系(层级、关联、相等)组织相关的概念和术语,见图25。图2.AGROVOC概念方案的层次(来源:/standards/agrovoc/concept-scheme)抽象的概念构建了概念方案的实际结构。一个概念可以使用所有的首选和非首选的术语表示,也可以使用所有的语言表示,它们之间通过内部层次关系关联,包括概念和术语间的关系以及术语与字符串间的关系。概念和术语都可以通过内部层次关系与其他概念和术语关联,即概念和概念间的关系以及术语和术语间的关系。2.3 AGROVOC发布为关联数据AGROVOC通过本体化的重新组织,形成了AGROVOC Concept Server及相应的管理工具,具有以下的功能6:l 对应于传统的基于词的索引,新的AGROVOC实现了基于URIs的索引系统,同时也能够创建更好的基于互操作的分类体系。l 使用本体,能够允许其他系统更好地互操作,概念服务可以进行映射和重用,如果不能重用现有概念,就包含指向其他概念的URI链接。l 允许用户自由地使用任何他们习惯使用或希望使用的语言进行检索。l 允许用户使用推荐术语之外的术语进行查询。 可见,大量的农业概念和术语已经通过重组具有了统一的标识和语义关联。AGROVOC实际上成为了结构化的语义数据。藉此,FAO决定将AGROVOC发布为关联数据,并与其他的本体、词表和标准良好地关联,升级到网络环境,推动知识组织能力的发展,有效地提高了农业领域信息和知识管理的效率、互操作能力和扩展能力。不同的词表之间通过映射链接相互关联,链接和可参引的URIs实现关联数据的关联。良好链接的词表既有效地提高了跨领域、跨数据集的互操作,也避免了大量分散数据集之间依靠人工建立链接的困难。AGROVOC目前已经与关联开放数据云中的其他12个标准词汇表建立了链接,也已经使用通用的URI与其他相关的词汇表建立了概念层次的链接,同时也与LOD云中的其他数据集(如DBpedia)链接,具体见表17和表25。包含良好链接的AGROVOC成为农业领域关联数据的基石,是农业领域的标准词汇、本体、命名空间和链接的中心。以AGROVOC为核心,农业关联数据发展具备了扎实的基础和巨大的潜力。表1 AGROVOC链接的词表7T资源名称T涉及的主题T概念个数T关联数据T链接的类型AGROVOC农业、食品、渔业、林业等31 956是skos:broader, skos:narrower, skos:relatedHTUEUROVOCUT通用6 779是skos:exactMatchHTUGEMETUT环境5 298是skos:exactMatchHTULibrary of Congress Subject Headings (LCSH)UT通用30,784是skos:exactMatchHTUNAL ThesaurusUT通用30 298否skos:exactMatchHTURAMEAU UT通用16 407skos:exactMatchHTUSTW - Thesaurus for EconomicsUT经济1 165是skos:exactMatchHTUTheSoz - Thesaurus for the Social SciencesUT社会科学7 750是skos:exactMatchHTUGeopolical OntologyUT国家名称253是skos:exactMatchHTUDewey Decimal ClassificationUT通用409是skos:exactMatchHTUDBpediaUT通用10 989是skos:exactMatchHTUSWD (Schlagwortnormdatei)UT通用6 245是skos:exactMatch,skos:closeMatch,skos:broadMatch,kos:narrowMatchHTUGeoNamesUT地理数据库212是skos:exactMatch表2 AGROVOC与其他数据集的链接统计5向内链接(Inlinks)向外链接(Outlinks)AGROVOCGEMENT:1 191(个)AGROVOCEurovoc:1 297(个)AGROVOCTheSoz:846(个)AGROVOCGEMET:1 191(个)AGROVOCRAMEAU:686(个)AGROVOCLCSH:1 093(个)AGROVOCGeoplitical Ontology:253(个)AGROVOCNALT:13 390(个)AGROVOCSTW:1 136(个)AGROVOCTheSoz:846(个)AGROVOCRAMEAU:686(个)AGROVOCDBpedia:993(个)AGROVOCDDC:409(个)AGROVOCGeopolitical Ontology:253(个)所有AGROVOC顶层概念映射:21(个)向内链接映射的总量:2 976(个)Outlinks映射的总量:21 315(个)农业书目数据库到农业开放知识网络OpenAGRIS 3.1 AGRIS的发展AGRIS(Agriculture Information System)服务始于1975年,最初是一个中心化的数据库,使用自己的数据结构、交换格式以及应用软件。2000年以后,AGRIS开始使用一个更强调关系、联系和连接的模型替代传统的书目系统,这样书目元数据的价值才能因网络的互联性的不断增强而相应增长,才能够为研究人员提供全球的领域研究资源的图谱。在链接正式出版物和产品(论文、数据)的同时,也提供更广泛的灰色文献(预印本、手稿)和交流平台(博客、论坛),帮助研究者将查询置入一个更广泛的数据网络环境中,并获得更全面的信息和知识。2006年以来,关联数据实质性地推动了语义网版本的发展和对分散知识进行语义互联设想的实现。为此,2010年开始,AGRIS设计了新的框架和原型,新的应用平台OpenAGRIS遵循关联数据的原则,强调网络、链接和开放性。OpenAGRIS不仅能够为研究者提供信息访问,并且也提供数据服务以扩展他们的知识。3.2 AGRIS的重新架构AGRIS重新架构的主要目标是增强语义互操作能力,即完成实体的识别和参考。将AGRIS的关联数据化,首要的问题是使用URI标识和参考其描述的实体,以便语义搜索引擎或者整合系统能够以一个精确和正确的方法聚合信息,最终产生“信息/知识空间”,作为查询的结果,如图3所示:图3 AGRIS重构框架3.3基于关联数据的OpenAGRIS虽然AGRIS中具有URLs的记录数量在过去5年中急速增长,但也仅仅占全部数据量的3%。这些记录是由编目人员手工创建的,他们通常了解一个资源是否具有连接到全文的链接。此外,记录是孤立的,不包含与其他书目记录或信息源的关系或关联。为了丰富AGRIS数据库的内容,OpenAGRIS从2010年开始作为一个网络应用程序,整合来自不同网络的信息。OpenAgris是遵循关联数据原则的,AGROVOC则被作为互联内容的主干。因此,OpenAgris具有以下特点9:OpenAGRIS是一个网络应用程序;它将所有XML格式的书目记录转换为RDF格式并且关联到其他资源;能够从AGRIS以外获取和聚合更多信息;是一个融合了多个互联的数据集合的关联数据环境。OpenAGRIS转换的数据包含了全部的AGRIS书目数据记录。AGROVOC词表成为OpenAGRIS的关联中心。在应用中,OpenAGRIS查询AGROVOC词汇表,抽取查询关键词与其他关联数据集和的关系,实现相关资源的发现和聚合。OpenAGRIS应用结构如图4所示9:图4 OpenAGRIS应用结构OpenAGRIS深化了原有AGRIS的服务,并且为合作者之间更好地实现互操作提供了可能,增强了数据的传播能力。它使得数据的网络化和标准化更加容易,而且通过AGROVOC更好地链接到关联数据环境中。OpenAGRIS为未来的工作和其他机构与研究者提供了可重用的资源和可参考的实施过程。面向关联数据的农业元数据编码与交换 4.1面向关联数据的元数据编码建议将数据从其特定数据格式仓储中释放出来已经成为一个通用的策略10。然而,简单的转换数据格式到RDF并非是真正的关联数据。根据W3C对数据关联程度定义的5个“星级”渐进标准10-11,真正的关联数据不但需要“以W3C的开放标准进行标识和描述(URI+RDF),为别人提供链接的可能”,更需要“尽可能引用别人以URI+RDF发布的数据,从而为数据提供一种共同的上下文语义”。因此,如果缺少RDF三元组存储之间创建自动链接的能力,所创建的RDF存储仍然是孤立的仓储。促进数据集合间自动链接创建的最简单方法是采用标准词汇表,包括描述数据/元数据元素的词表和表示值的标准词表。农业信息管理标准AIMS(Agriculture Information Manage System)推出面向关联数据的(Linked Open Data Enabled,LODE)元数据编码建议,为数据提供者选择生产关联开放数据集中可用数据的适合编码策略提供支持和建议,这一套建议将逐步涵盖多种资源类型,包括生产关联数据可用书目数据的编码策略以及用于描述书目数据中的代理、地点和主题的词表的编码策略。为了提高互操作的质量和信息交换的效率,LODE推荐5个关键的建立原则:促进使用建立良好的元数据标准和现有关联开放数据云中的可用词表;鼓励尽一切可能使用权威数据、受控词表和语法编码标准,以便增强互操作的质量和信息交换的效率;在数据值可用的时候,鼓励使用资源名称作为URIs;根据数据编码,促进以交换和重用为目的的决策过程;为关联数据需求的属性和元数据术语的开放建议提供参考支持。4.2书目数据的LODE建议:LODE-BD2010年,欧盟农业和水产养殖数据库开放获取项目(Virtual Open Access Agriculture & Aquaculture Repository,VOA3R),提出为数据提供者和VOA3R平台之间提供兼容关联开放数据原则的元数据交换的编码建议,为此遵守LODE原则的LODE-BD(Linked Open Data-Enabled Bibliographic Data)被首先发布到AIMS上。该建议可应用于结构化描述书目数据资源(如文章、专著、论文、会议论文、演讲材料、研究报告、学习对象等,包括打印或者电子的格式),在未来,这一推荐可能被扩展去适应其他类型的信息资源。LODE-BD的目标是解决两个问题:如何以跨数据库交换数据为目的,对不同的开放数据库中的书目数据进行编码;如何将这些数据编码成关联开放数据(Linked Open Data,LOD)可用的书目数据。所有工作都是面向数据交换和重用的目标,面向关联数据的元数据编码建议不但为FAO组织内部和其合作者乃至更广泛的农业信息使用者和数据提供者之间的数据交换和扩展提供了标准框架,而且降低了数据编码的门槛,充分发挥了关联数据标准化、简单化、可扩展的特点,很好地扩展了国际农业领域信息和知识管理合作和持续发展的能力。总结与展望 关联数据为以增强农业科学技术信息管理、查询和传播能力为目标的农业知识管理提供了新的解决方案,农业知识管理领域也成为农业关联数据应用的最佳平台。当前,在FAO的领导下,农业关联数据已经建立了以AGROVOC为基石,拥有OpenAGRIS关联开放数据平台和LODE元数据编码建议为标准的良好框架,并且致力于关联数据的推广和应用研究。在未来的工作中,FAO将基于关联数据,建立农业领域完善的基础设施框架。AgINFRA(Agriculture Infrastructure)项目12将基于关联数据,整合农业领域的5项基础服务(OE、AGRIS、AgroPEDIA、CIARD、AgLR),从而建立农业领域的完善的基础设施框架。该框架设想的层次体系如图5所示:图5 AgINFRA结构AgINFRA结构是基于关联数据的,农业知识网络服务、数据转换、元数据收割、三元组存储、内容管理和查询系统、关联知识发现等模块,都基于关联数据服务或面向关联数据提供解决方案。因此,关联数据应当被视为农业领域信息和知识交换、研究和扩展的基础和方向,关联数据最佳实践将在农业领域发挥更大的作用。参考文献1 Berners-Lee T. Linked dataEB/OL.2012-02-11./DesignIssues/LinkedData.html.2 Baker T, Keizer J. Linked data for fighting global hunger: Experiences in setting standards for agricultural information managementEB/OL.2012-02-11./content/pdf/10.1007%2F978-1-4419-7665-9_9.3 Liang A C, Lauser B, Sini M, et al. From AGROVOC to the Agricultural Ontology Service/Concept Server: An OWL model for creating ontologies in the agricultural domainEB/OL.2012-02-11./Vol-216/submission_31.pdf.4 Caracciolo C, Stellato A, Rajbahndari S, et al.Thesaurus maintenance, alignment and publication as linked data: the AGROVOC use caseJ. International Journal of Metadata, Semantics and Ontologies, 2012, 7(1): 65-75. 5 Soergel D, Lauser B, Liang A, et al. Reengineering thesauri for new applications: The AGROVOC exampleEB/OL.2012-02-11. /docrep/fao/008/af234e/af234e00.pdf.6 Morshed A, Caracciolo C, Johannsen G, et al. Thesaurus alignment for linked data publishingC/International Conference on Dublin Core and Metadata Applications,2011: 37-46.7 Sini M, Rajbhandari S, Singh J, et al. Smart Organization of Agricultural Knowledge. The

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论