【毕业学位论文】(Word原稿)Ontology在农业信息管理中的构建和转化-农业经济与管理博士论文_第1页
【毕业学位论文】(Word原稿)Ontology在农业信息管理中的构建和转化-农业经济与管理博士论文_第2页
【毕业学位论文】(Word原稿)Ontology在农业信息管理中的构建和转化-农业经济与管理博士论文_第3页
【毕业学位论文】(Word原稿)Ontology在农业信息管理中的构建和转化-农业经济与管理博士论文_第4页
【毕业学位论文】(Word原稿)Ontology在农业信息管理中的构建和转化-农业经济与管理博士论文_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

密级: 论文编号: 学位论文 农业信息管理中的构建和转化 要 体论)最早是哲学上的一个概念,后被应用于计算机人工智能研究领域。 20世纪 90 年代起,研究者将其应用于信息系统研究领域,主要概念是指某一专业领域的全部术语、对术语的定义以及术语间的关系构成的知识系统。 近年来,图书情报界和其它许多领域都对本体论表现出浓厚的兴趣,从不同角度研究了它在知识组织、情报检索等领域的应用潜力。为了探索本体论在农业信息管理中的理论和应用价值,研究叙词表在网络信息时 代的发展方向,本论文研究了领域本体论的构建、以及从叙词表向本体论的转化方法。 在系统介绍和分析了本体论构建理论的基础上,使用目前在国际上性能比较完善的本体论构建和维护工具 行了本论文的研究工作。论文把本体论的理论方法与传统的知识组织工具结合起来,利用已有的知识和技术,具体实现了本体论原型的构建。研究的核心是以食物安全本体论的构建作为分析案例,具体构建方法可以划分为 4 个步骤: 第一步是通过领域专家的参与,挑选典型的 5 篇食物安全论文,选择其中的重要词汇,人工构建了一个含有 58 个术语的食物安全核心本体论 。 第二步选择中国农业科学叙词表中作物分类大类( 989 个词汇),通过 序,将叙词表数据库转化为 式文件,生成 读叙词表本体论,再人工选择一些叙词表中与食物安全有直接关系的叙词,按语义关系加入到本体论中,完成从叙词表向本体论的转化。 第三步是将前面的两个本体论合并,借助现有网络搜索引擎,在因特网上人工挑选 60 条与食物安全相关的论文、会议等各类信息,组成一个 16 万字的食物安全语料库,人工选择重要词汇,统计词频,将合适的词汇也加入到合并的本体论中,则基本建成了食物安全本体论。 第四步即进行 定期的维护和更新。通过食物安全一个专业领域的研究,总结具体构建的过程和方法,将来即可依据类似方法,建立农业其它领域的本体论,甚至整个农业领域的本体论。 论文其它部分则围绕本体论相关的主题,展开相应的调查和分析,总结出本体论在国内研究属于起步阶段,从多语种叙词表转化本体论是一个可行的环节,并展望了本体论在农业信息领域的应用前景等 。 本研究是在国内图书情报领域最早研究本体论的论文之一,首次将部分中国农业科学叙词表转化为 式本体论,这是论文的重要创新成果之一。论文构建了食物安全本体论原型,无论是构建方法方 面,还是从叙词表进行转化,研究成果都具有创新性,对国内开展本体论理论和实践研究,具有参考价值;在我国农业信息管理领域,对实现智能化信息处理和信息检索,具有重要意义。 关键词 : 息管理,叙词表,情报检索 he is of of it to a of a In in in of in In to in to of in of on of of to a it of of to it of 8 to a A 0 on a 60 by to a be to of a to an of so is of in a of of It is to of is to I 目 录 第一章 序 言 1 1.1 信息系统中的概念解释和中文翻译 1 际上本体论的研究概况 2 内本体论研究概况 5 究的目的和意义 8 索国际前沿研究领域 8 进农业本体论在农业信息领域的应用 9 力发展成为综合性农业信息管理人才 9 研究要解决的问题 9 研究的思路与方法 10 究特色与创新点 10 语种叙词表中英文叙词对应译法 10 农业科学叙词表到农业本体论 10 内外本体论研究特征对比 10 第二章 本体论研究的背景分析 12 目 12 究项目背景和目的 12 相关概念的定义 13 目最新进展 13 届 际研讨会介绍 14 作研究伙伴 16 目对本研究的启发 16 踪分析 究的文献量特征 17 体论相关文献量的统计结果 17 英文相关文献量的特征 18 英文文献量 增长速度特征 19 网页计量研究的优势和缺点分析 20 络搜索引擎 特点及开发语义网络搜索引擎的现实需求 20 索引擎的一些特色功能 21 用 存在的一些问题 22 用 结 25 于本体论的语义网络搜索引擎的现实需求 25 论文研究背景小结 26 第三章 究项目和工具介绍 27 现本体论语言概况 27 体论研究项目的领域分布 27 体论研究网络链接站点介绍 28 些本体论研究项目和计划简介 28 体论构建软件工具 绍 30 安装 30 功能 30 作平台 31 要工作菜单 32 找( 能 37 贴板 37 体论构建软件工具 37 38 38 绍 39 展标记语言发展史 39 言简介 40 介 40 第四 章 核心 构建 42 物安全本体论构建整体思路 42 物安全本体论构建中词汇的处理及方法的总结 42 物安全本体论构建中直接使用现有工具的策略 42 体论构建的标准 43 建一个食物安全核心本体论 43 构建核心本体论专业术语的选择 43 现核心本体论的构建 44 建成的核心食物安全本体论介绍 50 心食物安全本体论构建体会 51 第五章 从叙词表向 转化 52 题法 52 题法 52 词法 52 词法 53 键词法 53 农业科学叙词表介绍 53 类法 53 业本体论与主题法分类法的关系 54 词表与本体论的关系 55 词表概况 55 叙词表相关的一些名词术语概念 55 词表编制历史 56 词表编制的发展趋势 58 词表的结构特点和语义关系 59 词表与本体论的相同点 61 词表与本体论的不同点 61 体论比叙词表新增功 能的实例分析 61 叙词表向本体论的转化 63 词表词间关系分析及向本体论的转换方式 63 、分关系 63 、代关系 64 关关系 64 畴和限义词的处理 64 农业科学叙词表向 农业本体论转化的具体方法 65 化生成字顺表格式数据文件 65 程转换建立 据库 66 应用 序转换为 式文件 66 物安全词表转化本体论的制作 67 词表中与食物安全相关词汇的类目 67 词表中与食物安全相关词汇的选择方法 67 词表中与食物安全相关词汇的选择数量 68 词表食物安全本体论术语属性的补充 68 词表食物安全本体论转化体会 68 第六章 合并和完善 70 体论的合并 70 合并本体论的加工 71 念需要统一时的加工方法 71 性关系的加工 71 概念不必统一存在的合理性讨论 72 义含义加工规范 72 搜索引擎搜索部分食物安全信息资源 73 络搜索引擎的选择 73 “百度”随机搜索和选择的食物安全信息的加工 73 机搜索和选择的食物安全信息的加工 75 于网络信息修改合并的本体论 78 工选择和收集到的网络食物安全信息 78 于语料对合并的食物安全本体论进行修订 78 于基于词频选择术语的讨论 81 体对待叙词表术语在语料库中的词频信息 81 第七章 多语种本体论的构建 82 语种叙词表的编制 82 语种叙词表的翻译 82 语种叙词表汉化相关信息 83 择具有何种知识背景的翻译人员 83 供以族首词及相应所有下位词的格式 83 校人员专业背景的选择 84 对词翻译问题 84 V 除词汇重复翻译现象 84 支配语言的修正 85 织人员需考虑的问题和应具备的素质 85 语种叙词表的维护 86 汇的增加由支配语言引起 86 增加词的规则 86 语种叙词表与农业本体论的关系 89 语种叙词表是多语种本体论术语源之 一 89 语种叙词表与多语种本体论的并行发展 89 语种叙词表转化为本体论后的词间关系和语义关系的对应方法 89 第八章 农业本体论在农业信息管理中的应用分析 91 体论在数字图书馆中的应用 91 字图书馆形成和发展 91 体论在数字图书馆中的应用领域 92 义网与本体论 93 义网 93 义网的基本组成部分 94 器翻译与本体论 94 器翻译概况 94 体论在机器翻译领域的应用 95 第九章 结束语 96 究工作总结 96 后的研究计划 97 参考文献 99 附录 简单本体论实例 语言程序 104 致谢 107 作者简历 108 表目录 图 1于本体论全文自动标引系统概要 7 图 1能检索工具的体系 结构 8 图 1文研究的技术路线 11 图 2体论相关中文网页数 19 图 2络上英文 关的网页数 20 图 3层次的标准本体论语言 29 图 3作平台各部分分布图 31 图 3件下拉菜单 32 图 3辑下拉菜单 33 图 3并前的窗口 33 图 3一个地名本体论合并后的窗口 33 图 3示下拉菜单 34 图 3序下拉菜单 34 图 3置演变参数窗口中可设置项目 35 图 3找功能窗 口 37 图 3通过拖拉将选择的节点拖入图形区 37 图 3贴板功能 37 图 3 38 图 4个本体关联的各部分的关系 45 图 4建立“人”的概念 45 图 4序自动生成关于概念“人”的各类关系 46 图 4备属性与赋予属性窗口 46 图 4粮食”具备的两种属性 47 图 4立一个新的实例 47 图 4念与分概念的关系 47 图 4概念上点击鼠标右键出现的窗口 48 图 4属性上点击鼠标右键出现的窗口 48 图 4心食物安 全本体论 50 图 5词表结构和词间语义相关 60 5个简单的本体论例子图示 62 图 5顺表形式的作物分类 据库 65 图 5有三个 的 66 图 5牧草”原叙词表词间关系显示 67 图 6法增加相同概念窗口 70 图 6本体论合并后同时存在“食品”概念 71 图 7概念“鱼”在多语种本体论中的图示表达 90 表 2体论研究相关网络文献量增长情况 18 表 2键词“计算机”在不同范围内网络网页数 24 表 2每隔 1 小时查询 1 次含有“计算机”的网页数统计 25 表 4建核心食物安全本体论的的 5 篇主要文章 44 表 6自“百度”搜索 引擎经选择的食物安全信息 73 表 6自 索引擎经选择的食物安全信息 76 表 6料库中统计词频选择的 171 个词汇 79 表 7003 年 增加的叙词和非叙词 86 中国农业科学院博士学位论文 第一章 序 言 1 第一章 序 言 2002 年,笔者承担了联合国粮食与农业组织 (中国农业科学院科技文献信息中心的一个国际合作项目,目的是为 农业多语种叙词表 (加中文版翻译。为了使该项目 顺利开展, 际农业科学和技术信息系统 ( 词表的负责人士, 2002 年初来华访问,对词表翻译项目作了具体讨论。同时介绍了 目。通过对 目的了解,本能意识到 文中将使用“本体论”这一汉语译名)研究在农业信息管理中的巨大理论和应用前景。而当时在国内农业信息管理领域,或农业图书情报领域, 将这 一研究介绍到国内农业信息管理领域,笔者对国内外与 关的研究进行了分析,并就 构建、以及从叙词表向 化方法等方面,进行了创新研究。选择农业科学叙词表中与食物安全相关的部分,通过数据转换和 程,实现了将叙词表向本体论进行转化,构建了一个约含有 1000 个术语的食物安全本体论原型;这些研究都构成了本论文的创新之处,是论文的主体部分。本章介绍这一研究领域的国内外研究现状,本论文要解决的问题,以及本研究工作在经济建设、科技进步和社会发展中的实用价值和理论意义。 1.1 信息系统中的概念解释和中文翻译 自从开展 究以后,由于 农业信息管理领域是一个新概念,经常遇到不同领域研究专家的提问,什么是 何作用?甚至有人问与矛盾论、实践论有何联系与区别。为此,作者探究了 概念演变过程。中国大百科全书哲学卷中详细介绍了 西方哲学史上的含义,认为 指关于存在及其本质和规律的学说。而且区分了 西方哲学史和中国哲学史中的不同含义。在 中国古代哲学中,探究天地万物产生、存在、发展变化根本原因和根本依据的学说,这种概念解释是在哲学领域的含义 (中国大百科全书总编辑委员会 1987)。 在广泛应用于人工智能、计算语言、数据原理等领域。特别是在知识工程、知识表示、语言工程、数据设计、信息模型、信息集成、信息检索、信息摘要、知识管理等领域。研究非常活跃,甚至被应用到自然语言翻译、医药、电子商务、地理信息系统、法律信息系统、生物信息系统等许多领域 (998)。 在韦伯斯特 976)中,对 个是用于哲学上的解释,另一解释为 A of of to be to a 可以理解为:“一种涉及各种实体的原理,即可被一种语言系统确认的各类抽象实体”。这个解释虽然有些抽象,但已经表达出用于语言系统,去表达事物的存在方式。 概念有一个演变过程,在人工智能界,最早给出 义的是 .( 1991)等人,他们将 义为“给出构中国农业科学院博士学位论文 第一章 序 言 2 成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则”。斯坦福大学 后又指出, 对一个概念集的规范说明( a of a 1993),后又明确“ 对概念化的精确描述” (1995)。 最终目标是精确地表示那些隐含(或不明确)的信息,使得它们可被计算机软件系统识别和共享,从而通过术语概念去表示真实世界的知识关系。以上这些概念解释多为从计算机科学、人工智能角度出发,去理解 含义。 农业信息管理中的应用研究,这里首先介绍 发起的 目研究。此项研究旨在提高网络信息的准确检索方法,建立农业分专业的信息标引、检索和知识管理平台。他们已开展了一系列研究工作,给出了一个易于理解的简明的 义,认为 :“包括一个领域中各类标准术语词汇,并对这些术语词汇进行准确定义,以及明确这些术语间的各种关系”。 以是在叙词表基础之上,借助语义相关和扩展标记语言( 信息技术,在增加术语相关性的基础上形成的知识系统。 在英语中,由于 新的含义也是引伸发展借用而来 ,是一个新概念,所以出现了翻译成不同的中文名称的现象。 人工智能或信息系统中的中文翻译,目前在国内的各类媒体中,有不同的翻译方法,尤其是一些情报学、图书馆学的中文核心期刊,各自使用着不同中文名称。通过对一些 比较权威的核心期刊的检索,常见使用以下几种翻译方法:概念集、应用知识体系、概念分类体系、实体论、本体论、存在论、本体模型、本体、本体簇等 (常春 2003)。图书情报工作期刊中有论文译作本原模板 (梁树柏 2003)。甚至在同一刊物中,中文名称也不一样,例如情报学报 2002 年的论文把 作概念集 (张晓林 2002),而 2003 年的论文有的译作本体论 (叶鹰 2003),有的译作知识本体 (刘炜 2003)。由于 信息系统中是一个新概念,所以翻译成不同的名称是可以理解的,正如 始在中文中的译名有:国际互联网,万维网,因特网,英特网,网际,互联网等等,但后经全国科学技术名词审定委员会统一为“因特网”。而 前还没有经过这样权威的统一审定推广,一些刊物本着先引进的目的,在文章中直接使用 不加以翻译。鉴于 中译名在英汉词典中已有“本体论”的译法 (简清国 等 1997),而且汉语中同一词汇在不同领域有不同含义是允许的。同一学术领域的研究使用人员使用的频次多了,大家也就认同了,而目前计算机科学的研究人员多数译作“本体论”,所以在 本研究中就直接使用“本体论”这一中文译名了。为了避免与矛盾论、实践论等的类似理解,笔者也同意翻译成“本体”。相信随着人们对 广泛认识和了解,将来一定会形成一个公认的、统一的译名。 际上本体论的研究概况 国际上对本体论研究非常活跃,主要集中在人工智能和知识表示领域,近几年来由于因特网的普及,信息技术的发展,网络信息数量以指数形式增长,基于关键词和简单主题分类的网上信息查询结果往往不尽人意,一时间各类信息查询方法和研究如雨后春笋般发展起来,其中用于知识表示和知识管理的本体论,被认为是最 有前途的办法之一。本体论的研究兴起是近几年的事,也是网络快速发展的需求。本体论研究的成果交流,也充分体现了当今网络信息传播的优势。一篇有重要意义的科技论文,要想在国际上有一定影响的期刊上发表,出版时滞少则中国农业科学院博士学位论文 第一章 序 言 3 半年,多则 1 年以上。而近年来与本体论相关的国际会议非常多,既在网络上征集会议论文,又在召开会议的同时及时发布相关重要论文。使得本体论的研究成果迅速得以传播,成为了解本体论研究进展的最佳选择。以下介绍一些相关研究的国际会议、网站、研究论文、研究成果等。 国际语义网研讨会 (1)。 2001 年 7月 30 日 8 月 1 日在美国加利福尼亚斯坦福大学举办,主题是语义网站基础设施及应用,语义网是一个理想:这一理想是对网上的数据进行定义及链接以便能够供机器使用,不仅是为了显示,而且还为了各种应用数据的自动化、一体化和再利用。为了使这一理想成为事实,必须设计支持性标准、技术和政策以便使机器对因特网更加敏感,结果使该网站对人类更为有用。本体论的终极目标是在语义网站上实现智能信息检索。这个会议到 2002 年就改称为 际论坛,每年召开 一次。 国际语义网大会 (2)。首届国际语义网大会于2002 年 6 月 9在意大利撒丁岛举办。 9 展了题为“为农业标准化而努力”的研讨活动,集中强调了当前农业信息领域的现状和存在的问题,倡议为建立农业专业领域本体论而开展各组织的合作。 2003 年 10 月 20 ,在美国佛罗里达召开了第二届 际研讨会, 要是讨论语义网络的一个国际论坛,本体论的研究是重要议题之一。 2004 年的会议计划在日本广岛 召开, 2005 年的会议计划在爱尔兰的 办。 可扩展标记语言会议及展览 ( 2001 年 12 月 13 日,在美国佛罗里达 行。是此类会议的第一个会议,吸引了“公司、政府和非盈利组织的主要决策人员等重要人物,探讨采用可扩展标记语言技术以改进其工作的新方法。 建立本体论的主要方法。 业本体论服务发起小组成员 )代表农业本体论服务项目计划介绍了 究进展。 都柏林核心与元数据应用国际会议 (n 2001 年 10 月 22 ,在日本东京国家信息学研究所,召开了都柏林核心与元数据国际应用会议。会议议题包括:元数据基本模型;执行元数据应用系统和工具;元数据应用的调查及实例研究;以元数据为基础的新活动;各个元数据系统的可通用性;各项元数据标准之间的关系。本体论作为信息管理的标准之一,与此类会议有紧密关系。 美国第 18 届人工智能大会 (美国人工智能协会 (于 1979 年成立,几乎每年举办一次年会。 2002年的第 18 届人工智能大会, 7月 28 日至 8 月 1日,在加拿大 设本体论与语义网分会场,讨论了本体论在语义网中的应用。由 出的语义网概念,目的是让计算机象人一样去理解和使用万维网上的信息和服务。语义网将创造一个环境 ,使软件非常容易实现为人类查询、理解、集成和使用信息。语义网的工作原理在于本体论能够表达信息的含义。研讨会讨论了本体论的描述语言、工具、方法及内容。在 2003年 8 月 12, 墨西哥 办了第 15 届人工智能革新应用大会 ( 农业本体论服务( 目。作为 一个大型的政府间中立国际合作组织,联合国粮食及农业组织( 1945 年成立以来,为所有成员国人人获得良中国农业科学院博士学位论文 第一章 序 言 4 好的营养作了大量工作,此项工作包括四大活动领域:使人们能够获得信息;分享政策专业知识;为各国提供会议场所;将知识送到实地。在使人们能够获得信息方面,建有世界三大农业数据库之一的 统,以及用于标引和检索的 2001 年 11 月,在 部罗马,发起了 目,目的是开展本体论相关的研究,研制基于语义的网络信息搜索工具,在网络信息资源数量以指数增加的当今信息社会,通过网络准确获得信 息,成为社会发展的需要, 是在此背景下由 起的一项国际合作研究, 2001 年以后, 分别在英国牛津、美国佛罗里达和挪威哥本哈根召开了三届国际研讨会,鉴于中国农业科学院科技文献信息中心与 信息管理方面的长期成功合作, 2004 年 4 月 27 至 29 日,由 中国农业科学院科技文献信息中心在友谊宾馆,共同举办了第五届 际研讨会,这必将推动我国国内农业图书情报界对本体论的了解和研究。 美国斯坦福大学的 在 1993 年就报道了简易本体论转化方法规范,可以算作本体论在知识工 程领域最早的报道。 E 995 年发表了题为“农业领域知识的本体论和多主题表达”的论文;以后在此领域的报道如 1997 年 于知识系统开发的外在本体论使用”,其它如知识分享和重用,本体论的原理、方法和应用等都属于知识工程方面的研究报道。本体论在知识表示方面的研究例如 知识表示:逻辑、哲学和计算基础一书( 1998),以及 式化本体论,概念分析和知识表示”的报道( 1998)。道了一种用于语义网的大型本 体论的应用,讨论了用于语义网的大型形式化本体论的开发和应用( 2002)。 关于本体论研究方面报道比较多,尤其是一些新成立的专业协会网站,定期开展相关学术研讨会,并发布各类标准,研究非常活跃,斯坦福大学在研究知识表示系统中,已经研制出比较成型的本体论构建工具 本升级和更新比较快,每年都举办国际性的研讨会,世界各国研究人员可以免费下载测试使用该软件( )。 网络 讨论有关本体论在网上使用的工具和标准,在2002 年 10 月 24 日,他们发布了网络本体语言测试案例标准 )。 本体论用于机器翻译的研究,国外也有一些报道。 机器翻译建立了大型知识库( 1994)。新墨西哥州立大学报道了他们的 器翻译系统是一种基于知识的机器翻译系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论