实用分类系统及其实现方法(一)_第1页
实用分类系统及其实现方法(一)_第2页
实用分类系统及其实现方法(一)_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用分类系统及其实现方法 一 1 语义网与实用分类系统 目前计算机硬件技术如处理速度、数据存储、网络通讯设备的能力 等已经有了长足的开展, 但是大量数字化信息的表达还停留在 “机读 水平,缺乏应有的 “智能去“读懂 数字化信息;互联网仍然处在 “混沌 网和缺乏互操作性的阶段,其根本问题在于缺乏语义。语义网的出现 将改变这种状况,简单地说,语义网就是机器可以理解的信息,是数 据网或全球性的数据库。作为当前因特网的延伸,语义网赋予信息以 清晰的定义和含义, 为数字化的信息加上 “智能 ,促进人与计算机的合 作,能够最大限度地发挥因特网的潜力,使该技术能够让机器支持全 球化的知识交流 1。W3CWo

2、rldwidewebco nsortium在语义网的开发中,将工作重点放在了 可扩展置标语言XML和资源描述框架RDF为根底的实施技术方面,而 其中的核心局部便是对实用分类系统On tology的开发和利用,实用分 类系统与计算语言学相结合,将成为应用领域里关于数据含义的聚集 库。实用分类系统是为共享领域内的通用说明、定义和关系提供的一 个语义框架,它的最终目标是精确地表示那些隐含的或不明确的 信息,使得它们可以被软件系统重用和共享2。语义网的整套标准和技术可以划分为一个从根底的国际码 Uni code和 统一资源标识URI到最高的信任层Trust的层式结构,如图1所示3。国标码、统一资源 标

3、识、可扩展置 标语言及其相关 技术如名域Namespaee和 可扩展置标结构语言XMLSchemaLanguage简称XMLSchema构成语义网的原始物理根底,这一层奠定了数据的格式 和语法,但并不能赋子数据以语义,即数据的含义和各种数据之间的 联系4。资源描述结构及其语言RDFSchemaLanguage简称RDFSchema 通过定义概念之间的关系使数据能够自我描述,这项标准建立了 “计算 机可读懂数据 的环境。但是这还不够,因为计算机不能像人那样 聪明地判断 “电脑就是“计算机,而且“掌上电脑 是电脑中的一个类型, 可以具有记事、日历、上网的多种功能。要让信息系统能够处理并懂 得这些数

4、据不同名称和它们之间的关系,就必须设计实用分类系 统词汇表ontologyvocabulary来定义这些概念,统一用词,建立参照 系统将有关的概念联系在一起,逻辑推理logic、证明proof和信任trust这些最高层次的技术必定依赖于实用分类系统的建立。2 实用分类系统和图书馆分类法 实用分类系统的主要成分是一套对某一领域里的知识进行表述的词和 术语,编制者根据该知识领域的结构将这些词和术语组成等级类目, 并且应用面向对象Object-Oriented的方法按需要给一些类目加上更细 的定义如特性、限制、推纳规那么等 。实用分类系统与传统知识分类 工具的一个根本区别就是系统的概念、特性、限制条

5、件等都是计算机 可读懂的,所以实用分类表中的知识定义可以被再利用。具体区 别参照表 13。由上表可以看出实用分类系统中概念之关系的表达比图书馆分类法要广而且深,这是由于实用分类系统主要为机器增加 “智能 进而实现自动 化处理信息、知识分享和再利用而建立的。所以在数据模型和表述语 言方面,它的结构和数据库很接近,通过简单的处理即可以将整个分 类系统转换成数据库而直接实施到信息系统的开发和建设当中去,为 知识采集和知识库的建立搭建平台。实用分类系统中的概念、特性、 关系和规划就像神经网络中的神经单元,统管着自己那个小领域的知 识内容、特征和方法,建造实用分类系统相当于建造信息处理所需的 智能单元,

6、是开发语义网的根底。3 实用分类系统的构造设计构造和设计实用分类系统Ontology是很复杂的,这主要是因为有关实用分类系统的研究尚处在雏形阶段,没有统一的定义和固定的应用领 域。专有领域实用分类系统和共享领域实用分类系统的建立都是刚刚 起步。但现阶段构造实用分类系统的素材却是多种多样的,就其完整 性而言,有结构的、半结构的和无结构的等 5。有结构的素材如数据库结构、叙词表、术语分类表等。 数据库的结 构 对于建立实 用 分类 系 统有 重要的 影响, 但是数据库样式表 Databaseschema和实用分类系统ontology中的实例instances是不同 的,和 Databasesche

7、ma相比,ontology具有以下特点:ontology也可 视为数据, ontology 是和语义相结合的, ontology 被经常地重复使用, ontology在本质上是分散的,Ontology数据模型是丰富多样的,层级关 系也可视为 ontology 的同等概念。 由于按照叙词表对文献进行标引 之后,可以利用计算机对文献信息进行快速、准确、全面的检索, 20 世纪 80 年代以来叙词表的编制有了长足的进展。在网络环境下,叙词 表不但在建立各个领域的实用分类系统中将充当重要角色,而且,更 重要的是要首先结合各个知识领域的开展与自身概念性强的特点,建 立能够驾驭各领域的具有叙词语言特色的实

8、用分类系统,为将来语义 网中的智能检索奠定根底6。术语分类表是长期以来各学科开展的 重要成果,在这方面充分利用也要比从头做起容易得多。半结构的素材包括网页(特别是XML标记的网页)、词典或字典等半结 构的来源。有专家把实用分类系统分作静态(Staticontology)、动态(Dynamicontology)、目的(Intentionalontology)、社会(Socialontology)4类, 在编制实用分类系统时, 具有完整结构的素材固然有较好的利用价值, 但是半结构以及无结构的素材因为有较好的开放性、可扩展性,对于 描述动态实用分类系统(Dyn amic on tology)和社会实用分类系统 (Socialo ntology更有开发前景。实用分类系统(ontology)在编制中应首先被视作一种具有生命周期的东 西,西方有学者将标准化(Specificadon、概念化(Conceptualization)、格 式化(Formalization)、执行(Implementatio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论