(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf_第1页
(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf_第2页
(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf_第3页
(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf_第4页
(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(教育技术学专业论文)知识表示在教学领域的应用研究——《教育信息处理》的知识表示.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

知识表示在教学领域的应用研究 一一 的知识表示 起源于哲学的本体论近年来受到信息科学领域的广泛关注,其重要性也已在 许多方面表现出来并得到广泛认同。尤其前几年本体论在w e b 上的应用导致了语 义w e b 的诞生,在w 3 c 的主导下有望解决w e b 信息共享时的语义问题,从而实现 世界范围内的知识共享和智能信息集成。 从哲学意义上看,本体论关注的是“存在”,即世界在本质上有什么样的东 西存在,或者世界存在哪些类别的实体。所以哲学上的本体论是对世界任何领域 内的真实存在所做出的客观描述,而这种描述不一定完全建立在已有的知识基础 上,还包括“求真”的过程。 t o mg r u b e r 和n i c o l ag u a r i n o 分别在1 9 9 3 年和1 9 9 8 年借鉴哲学本体论思 想的内涵,并考虑到本体论在人工智能和信息系统领域应用的具体特点,提出了 概念化( c o n c e p t u a l i z a t i o n ) 这一重要定义,对信息科学领域中本体论的定义 做了进一步的辨析和规范。美国斯坦福大学知识系统实验室的g r u b e r 认为:概 念化是从特定目的出发对所表达的世界所进行的一种抽象的、简化的观察。每一 个知识库、基于知识库的信息系统以及基于知识共享的智能a g e n t 都内含一个概 念化的世界,或是显式的或是隐式的。本体论是对某一概念化所做的一种显式的 解释说明。因此严格地说,本体是一个逻辑理论的陈述性描述。与概念化的区别 就在于:概念化是语言无关的,而本体是语言相关的。 通过上述的定义可以看出,本体是为说明某语言词汇表的内在意义而设计的 一套逻辑公理。给定一个语言l 和本体承约k ,语言l 的本体就是基于以下目的 而设计的逻辑公理集合:其自身模型尽可能地接近依照k 的由语言l 描述的所有 预定模型,但事实上这样的逻辑公理集合不容易找到,本体只能以一种间接的方 式详细说明一个概念化。因此在澄清本体、预定模型和概念化的基础上得到下面 的本体的定义: 本体是一个逻辑理论,用来说明一个正规词汇表的预定含义。 在对于本体的描述中,作为其他本体描述语言的基础,描述逻辑正得到积极 地应用。这里,“描述”是指对一个领域知识采用描述的方式表达,即利用概念 和规则构造符将原子概念( 一元谓词) 和原子规则( 二元谓词) 构建出描述表达 式。2 0 0 2 年7 月,w 3 c 在提交的d a m + o i l 基础上发展了o w l 语言,以使其成为 国际通用的标准本体描述语言。o 盹建立在) 【m l r d f 等已有标准基础上,通过添 加大量的基于描述逻辑的语义原语来描述和构建各种本体。目前,国外使用较多 的本体描述语言包括有:k i f 与o n t o l i n g u a 、o k b c ( o p e nk n o w l e d g eb a s e c o n n e c t i v i t y ) 、o c m l ( o p e r a t i o n a lc o n c e p t u a lm o d e l i n gl a n g u a g e ) 、f r a m e l o g i c 、l o o m 等。嘲 【6 】幸善平,胡玉杰等,本体论研究综述,计算机研究与发展,第4 1 卷2 0 0 4 年7 月,p 1 0 4 1 1 0 5 2 9 知识表示在教学领域的应用研究一一教育信息处理 的知识表示 本体是实现知识共享的重要途径。本体的目标就是结构化领域知识,建立领 域相关的统一的术语,给出这些术语之间相互关系的明确定义,促进知识的共享 和重用。本体表示强调信息共享性,也就是说本体所表达的信息要为他人所充分 接收。它所要表达的一般是共享知识,是一种约定和标准,而不是个人观点。 3 、计算科学 计算科学形成于2 0 世纪3 0 年代后期,来源于对数理逻辑、计算模型、算法 理论、自动计算机器的研究,是在数学和电子科学基础上发展起来的一门新兴学 科,既有很强的理论性,又有很强的实践性。计算科学是对描述和变换信息的算 法过程( 包括其理论、分析、设计、效率分析、实现和应用) 的系统研究。全部 计算科学的基本问题是:什么能有效地自动进行,什么不能有效地自动进行。 语言学理论是计算科学研究的重要基础。计算科学由于其研究与开发中思维 方式的特殊性而与数学建立了密切的联系。数学和计算科学共同使用的符号系统 或语言与一般语言有着相似的系统特征。两者虽然说法不同,但都是自如地运用 各自的语言刻画事物的一种属性观察。语感是语言学研究中一个很难严格、准确 定义却又存在的概念,它与一个人对语言的认识和感悟有关。长期使用符号系统 或数学语言处理问题和事物,也会产生对数学的一种感悟,并逐渐形成思维方式 的数学化,达到数学上的某种成熟性。但是,要从这样了种感性思维方式上升为 理性思维方式,必须依靠哲学或思维科学,特别是与推理有关的形式逻辑与数理 逻辑。由此可以看出计算科学与逻辑学和哲学中本体论之间的联系。 每个学科都有自身的知识组织结构,学科形态、核心概念和基本工作流程方 式,计算科学也不例外。理论、抽象和设计是计算科学的三个基本学科形态。基 本工作流程方式是:对现实世界中被研究的对象进行抽象,建立必要的基本概念, 运用数学工具和方法对其进行基础和应用基础研究,为实验设计和工程设计与实 现提供方法和技术,开展实验和工程设计与实现工作”。其中,抽象是三个基本 学科形态中最重要的一个形态,是连接学科科学研究与工程应用开发研究的重要 环节。 作为知识表示的三个应用领域,与逻辑学和本体论相比,计算科学保证了将 知识表示与纯粹的哲学体系区分开,并将逻辑学和本体论两者所表现的知识因子 和知识关联在计算机程序中实现,是衔接两个方面的桥梁。 虽然知识表示在逻辑学、本体论和计算科学的基础上得到了长足的发展,但 每个领域都会因为学科特点而存在一定的局限性,知识表示也因此在这三个领域 遇到了不同的难题m ,。 闭对计算科学发展内存规律的认识,h t t p :w w w 2 c c n v c o m c n 1 9 9 6 3 8 t 4 6 9 7 0 s h t m l ,1 9 9 6 f 8 】j o h nf s o w a ,k n o w l e d g er e p r e s e n l a t i o m o g i c a l ,p h i l o s o p h c a l , a n dc o m p u t a t i o n a lf o u n d a t i o n s ,2 0 0 3 ,p 1 9 2 1 0 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 ( 1 ) 逻辑学:不同的执行方案支持不同的子集和不同形式的逻辑。在将信 息由一个小的、低成本的子集传输到一个大的子集的时候通常会自动执行,但是 在逆向传输时,只有两个子集都支持的信息才能得到传输和表达,其余的信息则 会在传输的过程中丢失。 ( 2 ) 本体论:对同一个实体而言,不同的系统可能使用不同的名称;更为 糟糕的是,它们可能使用相同的名称去表示不同种类的实体。有时如果在系统中 已经将两个具有不同定义的实体规定为了同一个实体,但是想要证明两者确实是 同一实体却是相当困难的。 ( 3 ) 计算科学:即便前面所描述的名称和定义都是一致的,计算或执行过 程中的副作用仍然可能产生问题,使得同样的知识在不同的系统中执行不同的动 作。比如,在某些执行过程中,数据的顺序和输入的规则可能会导致某部分推论 和计算结果的错误,从而可能会使得一个系统中的简单推理到了另一个系统中却 变成了死循环 因此,在知识表示的研究过程中,我们一定要注意上述的问题,避免错误的 发生,使得知识表示系统的作用得到最大限度地发挥。 2 1 3 知识表示的层次性 美国印第安纳州立大学j o h nf s o w a 教授在所编著的知识表示:逻辑、哲 学和计算基础一书中指出,知识具有层次性,知识表示的方法和过程同样也具 有层次性。 j o h nf s o w a 教授提出了知识表示的三个层次:知识、能力和设计的层次”。 ( 1 ) 知识层次:知识层次包括五个方面,它们分别是:执行的,涵盖数 据结构的层次,如数据元,代理物的指示器、列表和其他的一些设计符号;逻 辑的,主要是指一种符号化的逻辑,带有谓词、变量、量词、布尔操作符以及陈 述性的命题;认识论的,用于定义概念类型,包括图表类型、继承和机构化的 关系等;概念上的,说明表示的语义关系、语言学上的角色、对象和行为等; 语言学的,描述自然语言中的任意概念、文字和表达式的能力层次。 ( 2 ) 能力层次:在不用的应用背景中,能力层次所表述的内容是不同的, 因此对能力层次的研究需要结合具体的应用实际。这里我们以卓越的机器人学者 罗德尼布鲁克斯( r o d n e yb r o o k s ) 所提出的机器人能力为例,他认为在人工 智能系统中一个机器人具备八个层面的能力,即:回避障碍物、空间漫步、环境 探查、地图绘制、异常情况注意、推理、规划和未知情况的预见。 1 9 】j o h ne s o w a 著,k n o w l e d g er 。p r e s e n t a t i o o g i e a l ,p h i l o s o p h i c a l ,a n dc o m p u t a t i o n a lf o u n d a t i o l u ,p 1 8 6 1 1 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 ( 3 ) 设计层次:设计层次的目的在于阐明信息系统体系结构的框架,参照 传播学中的“5 w ”模式,s o w a 教授和z a c h m a n 教授指出表示的设计层次应包括 信息系统体系结构中的:内容( w h a t ) 、方法手段( h o w ) 、适用范围( w h e r e ) 、 适用对象( w h o ) 、适用时间( w h e n ) 、适用对象的反馈( w h y ) 。 因此,在基于知识表示系统的实际设计过程中,要兼顾地考虑设计层次的三 个方面,做到整体把握,保证知识系统的实用性。 2 1 4 知识表示的机制 随着知识工程学的发展,知识表示也随之得到了快速地发展。在知识经济时 代,知识表示的基本机制可以归纳为:知识本体论构建技术,动态知识的表示方 法、知识表示工具的集成技术等。 l 、知识本体论构建技术 面对信息时代,人们以往的知识获取方式和传统的知识传授的方法受到挑 战。因此知识获取、表示、存储、检索,呈现等各个环节的方法都需要重新作出 调整,以适应信息时代和知识经济时代的需求。正是由于这种需要,人们运用本 体论来整理知识和信息资源,并按照本体论理论来认识信息时代的“知识”和“资 源”,从而获得一种在信息时代教育适应的能力。 互联网已经渗透到人们社会生活的每一个角落,同时人们在使用中已经认识 到了互联网提供的第一代w e b 的不足,并且提出了下一代的网页技术语义网 页。为了适应新一代网页技术,运用本体论理论通过互联网整理知识和信息资源 是必要的。以本体论构建的知识不仅有助于知识、信息资源的系统化,而且也便 于知识、信息资源的扩展和更新,使之更容易满足不同层次、不同需求的个人终 生学习。另外,由于目前的知识已经愈来愈明显地表现出跨越多学科的特点,此 种结构特点使得知识表现模型的相关性显得复杂且不单一,而基于本体论理论整 理知识和信息资源的方法,在强调了概念的单一性和无二性的同时,在概念和概 念之间、对象与对象之间建立了清晰的相关联系。所以我们可以借助本体论理论 在不同学科间对相关概念和知识建立联系,形成联想式学习模型。 目前,基于本体论的知识、信息资源组织和管理技术研究主要有:已成为标 准的w 3 c 之x m l 、k s l 之d a l l 和欧洲的o n t o w e bn e t w o r k “。他们的研究可以让 人们随意地定义一些标记来描述文件中的数据元素,使信息搜寻更加具有逻辑 性、准确性,快速和有序,同时也使人们所获得的信息内容更复杂、丰富、完整 和符合个性化要求。 【l o 谭寨璐,朱礼,基干本体论的知识表达模式及其必要性,2 0 0 2 1 2 知识表示在教学领域的应用研究一一教育信息处理的知识表示 ( 1 ) k s l ( 知识系统实验室) 美国斯坦福大学的k s l ( k n o w l e d g es y s t e ml a b ) 联合该校的计算机科学系 在知识共享技术方面的研究一直走在世界的前列,他们在该领域的研究主要有: 本体论法合并和诊断( o n t o l o g ym e r g i n ga n dd i a g n o s i s ) 、语义w e b 技术 ( s e m a n t i cw e bt e c h n o l o g i e s ) 和大型可重复利用知识库( l a r g e s c a l e r e p o s i t o r i e so fr e u s a b l ek n o w l e d g e ) 等。 在本体论法合并和诊断研究方面,k s l 开发出了一个名为c h i m e r a s 的软件 工具,它可以结合本体论法使用,利用功能函数合并相关知识和清除多余知识分 支。在语义w e b 技术研究方面,k s l 的研究人员已经开发出来一种本体论语言: d a h i l 一0 n t 语义w e b 语言。利用这种语言人们可以随意地自行编写d a m l - - o n t 程 序,达到快速且智能分类查找信息的目的。在大型可重复利用知识库研究方面, 他们设想建立一个世界范围的知识再现中心,提供分类收集环境给人们浏览、更 新、修改和使用。 ( 2 ) o n t o l o g yn e t w o r k 欧洲的o n t o l o g yn e t w o r k 是最近建立的网络,该网络的目标是集合那些在 欧洲从事促进跨学科工作和加强欧洲特性( 欧洲文化多样性和欧洲语言多元化) 语义网页标准的研究人员和产业,使其在o n t o l o g y 领域的研究占有更强的地位。 同时这个网络致力于给欧洲一个探索和研究基于o n t o l o g y 技术的机会,并且在 这个刚刚兴起的领域起领先作用。他们在基于o n t o l o g y 技术的知识共享研究有: 促进和支持s e m a n t i cw e b 研究从学术到产业的转化; 展示和协调与o n t o l o g y 相关的各领域的研究,如:w e b 标记语言、知识 查询、知识工程、知识再现、信息系统和数据综合、信息回归、语言工程、数据 化图书库、软件代理和可读学习; 加强欧洲o n t o l o g y 研究领域和k s l 在d a m l 方面的协作; 接轨w 3 c 的元数据标准语言等。 ( 3 ) w 3 c 的捌l w 3 c ( 万维网联盟) 推出的x m l 是一种能够提供信息自描述( i n f o r m a t i o n s e l f - - d e s c r i b i n g ) 语言。这种语言与我们曾经使用的h t m l 相比,其主要区别在于 x m l 是描述数据的通用语言,它通过通用使用标记来定义网页上数据的结构,赋 予数据上下文相关功能,使用户可以自己控制文档的结构,不是简单地描述数据 如何显示出来。而h t m l 是一个陈述性语言,它不描述网页的内容,只是通过标 记描述这些内容如何在网页上显示出来,它用超连接技术建立网页间的连接。基 于h t m l 的搜索工具使用关键字和文本,基于】( m l 的搜索工具使用数据结构和元 数据。下一代w 3 c 的网页是基于x m l 搜索方式的网页,它可以更加容易进行操作, 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 使得搜索更加精确。 2 、动态知识的表示方法 传统的哲学认识论所阐述的知识观是种静态的知识观。它认为知识作为人 类认识的成果,是客观事物的属性与联系的反映,是客观事物的主观映像;知识 具有客观性、普遍性,确定性等特征。它试图揭示知识的真理性,没有揭示知识 的多种属性,排斥了知识具有“真”以外的其他意蕴。而动态的知识观强调用发 展和变化的观点来把握知识的本质和性质,不再把知识看成是一成不变的永恒真 理,注重把握知识的不确定性。认为知识具有文化性、不确定性、境域性和价值 性等基本性质1 ;知识的“真理性”不是静止的、永恒的,而是动态的、偶然的。 动态的知识观认为知识是流动着的,而且在知识流动的过程中会根据实际的 需要进行适当的调整,通过扩充知识本体的内涵和外延来达到实用的需求。 f i s h e r 和f i r s c h e i n 于1 9 8 7 年提出了知识的一般性定义,他们认为知识就是人 或机器储存起来以备使用的信息或模型,用来对外部世界作出解释、预测和适当 的反应。用这个定义中可以看出知识的动态属性,它需要针对外部世界作出适当 的反应。而众所周知,在信息化时代的今天,知识大爆炸使得知识的更新速度越 来越快,即便是储存量再大的知识仓库也有被淘汰的可能。这就要求我们在建立 知识库之时要充分考虑知识的创新,利用知识的动态性,根据知识库中已有的知 识,经过相关的计算得出知识库中尚未储存的新的知识。因为知识仓库本身就具 有数据的加工能力,其特色不仅仅是体现在大的储存量上,更为重要的一点就在 于知识的创新上。而知识创新最根本的落脚点就是知识的动态性。 在知识管理领域中,通过知识管理的流程可以清楚地看到知识在使用过程中 的各个环节,目前主要有两种流程体系,分别是知识管理十步走和k 9 知识链。 前者主要包括知识定义、知识共享、知识选择、知识存储、知识应用、知识传递、 知识共享、知识创新、知识测评、知识销售等十步。而k 9 知识链将知识的流程 看作一个闭环,如图2 4 所示。 图2 4k 9 知识链 【1 1 】曾文俊高中生物学教学中动态知识观的培养t2 0 0 5 1 4 知识表示在教学顿域的应用研究一一教育信息处理) 的知识表示 对比两种流程体系,有7 项是完全相同的。另外在十步走中的知识选择- - - - k 9 的知识整理+ 知识更新。也就是不断根据已经规划好的知识体系对获取的知识资 源进行甄别和筛选,将符合知识规划的知识保留下来,而将与知识体系无关的知 识剔除掉。 前面已经对知识的表示方法进行了阐述,有主观和客观之分,种类也较多。 因此在知识流通的过程中,各个环节可以选用的知识表示方法有很多种。若采用 不同的表示方法就会导致交流过程中的不便,因此在知识的动态流程的各个环节 可以对知识的存储采用动态的方式,不应该只局限于一种表示方法,可以根据具 体知识对象的特性动态地选择合适的知识表示方法,保障知识流通过程中的畅 通。特别是针对不同知识表示方法存储的知识库之间的通信,建立了不同表示方 法之间的动态转化,就便于实现分布式的数据库存储,知识的创新也显得更加便 捷。 3 、知识表示工具的集成技术 随着知识工程学科体系的不断成熟,与之相关的技术手段也得到了长足的发 展。如在知识的获取阶段,可以采用搜索引擎、知识门户、知识地图等工具,而 知识应用的工具有网上培训系统、知识推送技术与系统、自学习技术与系统以及 可视化工具等。根据上一节的介绍,知识表示的工具主要有:概念图制作工具 m i n d m a p p e r 、c a m p t o o l s 、o p e n m i n d 、i n s p i r a t i o n 、p e r s o n a l b r a i n 、易思一认知 助手等;思维导图制作工具f r e e m i n d 、m i n d m a n a g e r 、i d e a g r a p h 、v i s i o 、p o w e r c o n c e p t 、易思一思维导图等;采用谓词逻辑的软件p r o o g 、产生式系统的推理 机、框架结构表示、采用隶属度表示模糊知识的工具、面向对象的表示工具等。 相关的知识表示工具在下一章进行详细介绍。通过这些工具已经开发出了一些成 型的知识库,作为专家系统的后台知识库,支撑专门学科领域的相关问题的求解 和知识的表达。 但是,如此繁多的知识表示工具,怎样才能选择合适的开发工具来对知识库 中的知识结构进行表达呢? 对于开发者而言这是一个难题,如果表示方法选择错 误就意味着将付出更多,而且在使用的过程中也不一定就会达到理想的效果。因 此最为理想的就是将这些庞杂的知识表示工具集成起来,通过友好的界面提示让 开发者选择合适的知识表示方法。 2 2 知识表示的应用实例 知识表示的实质是知识的符号化,其表示方法呈现多样化的特点。知识表示 发展至今已经在专家系统中有了非常广泛的应用。接下来将举例说明知识表示的 应用现状。 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 2 2 1 知识表示应用实例的介绍 1 、计算机智能导师系统“” 首都师范大学计算机系王陆副教授对计算机智能导师系统( i t s ) 的知识表 示方法进行了研究。使用模糊关系数据模型讨论建立学科知识库,并用隶属度函 数及模糊中心数等方法描述知识点属性,以知识点的模糊关系建立知识库,并实 现了基于模糊关系数据模型的推理过程。 一个基于教学过程的i t s 模型,由知识库、学生模型、教学策略推理机等模 块组成。其中知识库包括有知识点属性数据库、知识点链接数据库和教学材料数 据库三部分,它们构成了i t s 的主要知识表示。学生模型主要由学生基本情况数 据库和学生学习情况数据库组成,前者主要用于记录学生的个人基本情况,后者 主要用于记录各知识点的学习测验成绩。教学策略推理机是由教学规则库和教学 策略推理算法构成的。 知识点的属性包括知识点编号、类型、难度、重要程度和要求掌握的水平等。 知识点编号的目的是用于检索和查找,故应具有唯一性。知识点类型按照加涅分 类理论分为:事实、概念、规则、高级规则和认知策略。知识点难度和重要程度 为模糊对象,分为三级,用隶属度看书分别表示为:i i ( x ) e a s e = o 3 0 1 ,0 6 0 2 , 1 3 ) l i ( x ) i m p = ( 0 3 0 1 ,0 6 0 2 ,1 3 ) 。要求掌握的水平用定义模糊中心数( c , r ,p ) 的方法来表示,解释为落在以c 为中心,r 为半径的“超球”之中的可能 性为p ,便于更科学和准确地描述教学大纲对知识点的掌握要求。具体的( c ,r , p ) 求取方法是根据积累已经通过考试学生的成绩构造数据样本,进行统计分析 求得。 另外就是对知识点之间链接关系的描述。在某一学科中各知识点的链接关系 描述了该学科的知识体系。知识点的链接关系是双向的,有上行和下行之分。一 个知识点的上行知识点,即树结构的父结点;下行知识点即树结构中的子结点。 由教学和学习过程本身可知,知识点之间关系的紧密程度不同,因此我们可以将 它处理成一个模糊对象,用链接确信度来度量,用s ( x ) 表示,且o s ( x ) 2 6 2 9 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 由上述的一般表现形式可以看出,产生式的基本形式与谓词逻辑中的蕴涵式 具有相同的形式,两者的区别就在于:蕴涵式只是产生式的一个特殊情况。蕴涵 式只能表示精确性知识,其逻辑值要么为真,要么为假,而产生式不仅可以表示 精确性知识,而且可以表示不精确知识。另外,在用产生式表示知识的智能系统 中,决定一条知识是否可用的方法是检查当前是否有已知事实与知识中的前提条 件相匹配,这种匹配可以是精确匹配,也可以是不精确匹配,只要按照某种算法, 求出前提条件与已知事实的相似度达到某个指定的范围。就认为是可匹配的。但 在谓词逻辑中,蕴涵式前提条件的匹配总是要求精确匹配。 下面将从知识的不同类型来讨论产生式的知识表示方法。 ( i ) 确定性规则知识的产生式表示 确定性规则知识的产生式表示形式为: p o 或者 i fpt h e nq 其中,p 是产生式的前提,用于指出该产生式是否是可用的条件;q 是一组 结论或操作,用于指出前提p 所指示的条件被满足时,应该得出的结论或应该执 行的操作。 ( 2 ) 不确定性规则知识的产生式表示 产生式可用于不确定知识的表示,不确定性规则知识的产生式形式为 p q ( 可信度) 或者 i fpt h e nq ( 可信度) 其中,p 、q 所指代的意义同上。这一表示形式主要在不确定推理中当己知 事实与前提中所规定的条件不能精确匹配时,只要按照“可信度”的要求达到一 定的相似度,就认为已知事实与前提条件相匹配,再按照一定的算法将这种可能 性( 或不确定性) 传递到结论。这里“可信度”的表示方法及其意义会由于不确 定推理算法的不同而不同。 ( 3 ) 确定性事实性知识的产生式表示 事实性知识可看成是断言一个语言变量的值或是多个语言变量间的关系的 陈述句。语言变量的值或语言变量问的关系可以是一个词,不一定是数字。如: 教育信息是可测的,其中教育信息是语言变量,其值是可测的;数学成绩与物理 成绩相关,其中数学成绩、物理成绩是两个语言变量,两者的关系值是相关。 事实性知识的表示形式一般使用三元组来表示: ( 对象,属性,值) 或者( 关系,对象l ,对象2 ) 知识表示在教学领域的应用研究一一教育信息处理的知识表示 其中对象就是语言变量,这种表示的机器内部实现就是一个表。如事实“试 卷a 的难度为o 5 0 ”,便可表示成 ( t e s t a ,d i f f i c u l t y ,0 5 0 ) 这里,t e s t a 是事实性知识涉及的对象,d i f f i c u l t y 是该对象的属性,丽 o 5 0 则是属性的值。而“数学成绩和物理成绩是正相关的”,可写成第二种形 式的三元组: ( p o s i t i v e c o r r e l a t i o n ,m a t h ,p h y s i c s ) 这里,m a t h 和p h y s i c s 分别是事实性知识涉及的两个对象,而p o s i t i v e c o r r e l a t i o n 则表示这两个对象间的关系。 ( 4 ) 不确定性事实性知识的产生式表示 有些事实性知识带有不确定性。比如,“试卷a 的信度很可能是o 7 ”,因 为是很可能,所以试卷a 的信度是0 7 的可能性可以取8 0 。又比如说“音乐 成绩与数学成绩相关的可能性不大”,我们对音乐成绩与数学成绩相关的可能性 只能取1 0 。那在知识的表示过程又该如何进行表示呢? 不确定事实性知识的表示形式一般使用四元组来表示: ( 对象,属性,值,可信度值) 或者( 关系,对象l ,对象2 ,可信度值) 例如,“试卷a 的信度很可能是0 7 ”,可以表示为 ( t e s t a ,b e l i e f ,0 7 ,0 8 ) 而“音乐成绩与数学成绩相关的可能性不大”,可表示为 ( c o r r e l a t i o n ,m u s i c ,m a t h ,0 1 ) 一般情况下,为了求解过程中查找的方便,在知识库中可将某类有关的事实 以网状、树状结构组织连接在一起,提高查找的效率。 把一组产生式放在一起,让它们相互配合,协同作用,一个产生式生成的结 论可以供另一个产生式作为已知事实使用,以求得问题的解决,这样的系统称为 产生式系统。一个产生式系统主要由三个基本部分组成:规则库、综合数据库和 控制系统。三者的结构关系如下图3 2 所示。 图3 2 产生式系统的基本结构 其中,规则库是用于描述某领域内知识的产生式集合,是某领域知识( 规则) 的存储器,其中的规则是以产生式形式表示的。规则库中包含着将问题从初始状 知识表示在教学领域的应用研究一一教育信息处理,的知识表示 态转换成目标状态( 或解状态) 的那些变换规则。规则库是产生系统赖以进行问 题求解的基础,可以有效地表达某个领域内的过程性知识并对知识进行合理的组 织和管理。它是专家系统的核心,也是一般产生式系统赖以进行问题求解的基础, 其中知识的完整性和一致性、知识表达的准确性和灵活性以及知识组织的合理 性,都将对产生式系统的性能和运行效率产生直接的影响。 综合数据库是一个用于存放问题求解过程中当前信息的数据结构,又称为事 实库,如:初始事实、推理中得出的中间结论及最终结论等。当规则库中的某条 产生式的前提可与综合数据库中的某些已知事实匹配时,该产生式就被激活,并 把用它推出的结论放入综合数据库中,作为后面推理的已知事实。显然,综合数 据库的内容是在不断变化,是动态的。 控制系统由一组程序组成,它负责整个产生式系统的运彳亍,用来控制和协调 规则库和综合数据库的运行,包含了推理方式和控制策略,以实现问题的求解。 控制策略的作用就是确定选用什么规则或如何应用规则。通常从选择规则到执行 操作分3 步完成:匹配、冲突解决和操作。而产生式系统的控制系统在推理过程 中主要有正向推理、反向推理和双向推理三种。 ( 1 ) 正向推理是从已知事实出发,通过规则库求得结论。正向推理方式也 被称为数据驱动方式或自底向上的方式。它的推理过程是: 规则库中的规则与综合数据库中的事实进行匹配,得到匹配的规则集合; 使用冲突解决算法,从匹配规则集合中选择一条规则作为启用规则; 执行启用规则的后件,将该启用规则的后件送入综合数据库或对综合数据 库进行必要的修改。 重复这个过程直至达到目标。 ( 2 ) 反向推理是从目标( 作为假设) 出发,反向使用规则,求得已知事实。 这种推理方式也被称为目标驱动方式或自顶向下的方式。其推理过程是: 规则库中的规则后件与目标事实进行匹配,得到匹配的规则集合; 使用冲突解决算法,从匹配规则集合中选择一条规则作为启用规则; 将启用规则的前件作为子目标。 重复这个过程直至各子目标均为已知事实,则反向推理的过程就算成功结束。 ( 3 ) 双向推理是一种既自顶向下又自底向上的推理。推理从两个方向同时 进行,直至某个中间界面上两方向结果相符便成功结束。 从产生式系统的结构可以看出,一个产生式系统中存在有两个库:规则库和 综合数据库。对于用户输入的问题和要求,首先就是要进行规则的匹配,而对于 规则的匹配问题就不可避免地会存在许多的问题,如:规则的精确匹配问题,是 采用关键词检索、全文的检索,或是模式识别领域的内容检索? 在关键词的检索 知识表示在教学领域的应用研究一一教育信息处理 的知识表示 系统中,涉及到抽取关键词的问题,而且并非所有的规则都会是一一对应的,因 为每个用户对某件事物描述的方式可能与系统完全不同,这种多样化的情况必然 会导致规则匹配上的一对多。笔者认为可以采用模糊数学中的可信度因子进行表 示,根据空间向量中矩阵夹角的算法,计算出用户提出的问题与规则库中相应规 则的相似度,然后根据相似度的大小给出可能的规则供用户选择。对于用户选择 的最后结果作为反馈意见返回到产生式系统中,作为规则库更新和知识创新的依 据,规则库可以据此进行自适应地学习。 基于产生式规则的知识表示方式的知识内容在计算机内的表示,较之谓词逻 辑而言,就显得十分简单和方便,是一种条件匹配的线性或链式的模式。之所以 说是链式,是因为知识的内容很多时候都不只包括一个产生式规则,一个产生式 规则的输出结果可以作为另一个产生式规则的输入条件,这样就能产生如同数据 结构中存储的链式结构。在对数据库中存储的知识进行搜索时,遍历所有的产生 式规则,将i f 部分与用户的输入要求进行相似度的计算,其中最为关键的就是 隶属函数的确定。根据相似度的大小按降序的方式排列出来呈现给用户。另外, 可以将用户检索的结果以网页的形式存储起来,以作为其他用户检索的参考,因 为任何人的检索内容都不是孤立的,而是应处于某个群体之中。系统就可以经过 判断,将具有相似性检索内容的结果推荐给用户。 因此综上所述,产生式表示法有以下特点: ( 1 ) 清晰性。产生式表示格式固定、形式简单,规则( 知识单位) 间相互 较为独立,没有直接关系,使知识库的建立较为容易,处理较为简单。 ( 2 ) 模块性。知识库与推理机是分离的,这种结构给知识库的修改带来方 便,无须修改程序,对系统的推理路径也容易做出解释。基于这些原因,产生式 知识表示法常作为建造专家系统首选的知识表示方法。 ( 3 ) 自然性。产生式表示法用“如果,则”的形式表示知识,符 合人类的思维习惯,是人们常用的一种表达因果关系的知识表示形式,既直观自 然,又便于推理。另外,产生式既可以表示确定性知识,又可以表示不确定性知 识,更符合人们日常见到的问题。 3 2 3 语义网络知识表示法 语义网络是1 9 6 8 年奎廉( j r q u i l l i a n ) 在研究人类联想记忆时提出的 心理学模型。奎廉认为,记忆是由概念问的联系实现的。随后在他设计的可教式 语言理解器t l c ( t e a c h a b l el a n g u a g ec o m p r e h e n d e n ) 中将这种心理学模型( 语 义网络) 用做知识表示,1 9 7 2 年西蒙首先将语义网络表示法用于自然语言理解 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 系统。1 9 7 5 年,亨德里克( g 6 h e n d r i x ) 又对全称量词的表示提出了语义网 络分区技术。目前,语义网络已成为人工智能中应用较多的一种知识表示方法。 语义网络是一种智能的网络结构,其主要开发任务是使数据更加便于电脑处 理和查找,扩展当前的w w w ,使得网络中所有信息都具有语义,便于人和计算机 之间的交互与合作,从而将万维网中一个个现存的信息孤岛发展成一个巨大的数 据库。这正好与知识管理所倡导的知识共享目标一致,便于知识的挖掘、转移和 集成。客观世界中的事物是错综复杂的,相互问除了具有因果关系、类属关系等 表面上的一些关系外,各事物、概念等之问还存在着含义上的联系或者语义上的 联系。语义网络就是为了研究描述概念、事物、属性、情况、动作,规则等以及 它们之间的语义联系而引入的。其研究的侧重点在于如何将信息表示为计算机能 够理解和处理的形式,即带有语义。 语义网络是通过概念及其语义关系来表示知识的一种网络图,它是一个带标 注的有向图。在语义网中,各个节点代表概念、事物、属性、情况、动作、状态 等,节点通过描述各节点间相互关系的弧连接。可以用不同的方法定义弧,这取 决于被表达的知识种类。如:用来描述层次的常用弧包括i s a 和h a s p a r t ( 具 有部分) ;用来描述自然语言的语义网络使用的弧有诸如动作者,对象和接 受者。从本质上讲,节点之间的连接是二元关系,因此谓词逻辑中一元和多元关 系很容易转换成语义网络,如下图3 3 所示: l 正方形l 一! ! 一长方形i 竺 ,l平行四边形i 图3 3i s a 常用弧的实例 从图中可以非常直观地看出两个陈述句:正方形是长方形;长方形是平行四 边形。由于已知连接各结点的关系特性( 即i s a 关系是可传递的) ,所以,虽然 第三旬没有明确地标出,但可以从语义网络中推断出这一陈述语句:正方形是平 行四边形。而对于多元逻辑关系,可以通过加入附加结点的办法将其改成语义网 络表示法,其根本方法是将多元关系表示成二元关系的组合或合取。”。 知识的语义网络表示法,可由一个三元组表示为:( 节点1 ,弧,节点2 ) 。 图3 4 所示的有向图表示,称作基本网元。图3 5 为多个基本网元关联在一起时 得到的语义网络。 图3 4 基本网元 1 2 0 1 张仰森,人工智能原理与应用,2 0 0 3 i i i 3 0 1 2 l 】知识表示, h t l p j w w w 2 g d i n c d c n j k x w e b s t u d y 2 4 a r t i f i c i a l 2 0 i n t e l l i g e n c e w e b p a g e m u l u p a g e c h a p 4 4 5 6 h t m 2 0 0 4 3 4 知识表示在教学领域的应用研究一一教育信息处理的知识表示 圈3 5 语义网络结构 在语义网络中,节点还可以是一个语义予网络。因此,语义网络实质上可以 是一种多层次的嵌套结构。 语义网络的知识表示法与前两节的谓词逻辑表示法和产生式知识表示法存 在着一定的联系,具体表现在: ( 1 ) 从谓词逻辑表示法来看,一个基本网元相当于一组一阶二元谓词。因 为三元组( 节点l ,弧,节点2 ) 可写成p ( 个体1 ,个体2 ) ,其中个体l 、个体 2 对应节点l 、节点2 ,而弧及其上标注的节点l 与节点2 的关系由谓词p 来体 现。例如,对“数学成绩与物理成绩相关”可以表示为三元组( 数学成绩,相关, 物理成绩) ,对应的语义网络如下图3 6 所示,而如果用一阶谓词表示法表示, 则可写成p ( 数学成绩,物理成绩) ,谓词p 表示数学成绩和物理成绩为相关的 关系。 圈3 6 实倒 ( 2 ) 产生式表示法是以一条产生式规则作为知识的单位,各条产生式规则 之间没有直接的联系。而语义网络则不同,它不仅将基本网元视作一种知识的单 位,而且各个基本网元之间又是相互联系的。人脑的记忆便是由存储了大量的这 种基本网元来体现的。但每一条产生式规则可以表示为语义网络的形式。比如“如 果a ,那么b ”是一条表示a 和b 之间因果关系的产生式规则,则它对应的语 义网络表示如下图3 7 所示,其中,r , m 表示a 与b 之间的语义关系,即“如果, 那么” 厂卜生l 凡 圈3 7 实例 从功能上讲,语义网络可以描述任何事物间的任意复杂关系。但是,这种描 述是通过把许多基本的语义关系关联在一起来实现的。基本语义关系是构成复杂 语义关系的基石,也是语义网络知识表示的基础。但由于语义关系很复杂,语义 联系的种类也是多种多样,在实际使用中,人们可根据自己的实际需要进行定义。 知识表示在教学领域的应用研究一一教育信息处理) 的知识表示 接下来介绍l o 种基本的语义关系嘲。 ( 1 ) 类属关系 类属关系是指具有共同属性的不同事物问的分类关系、成员关系或实例关 系。它体现的是“具体与抽象”、“个体与集体”的层次分类。其直观含义是“是 一个”,“是一种”、“是一名”、“是一只”。在类属关系中,具体层节点位于 抽象层节点的下层,其中一个最主要特征是属性的继承性,处在具体层的节点可 以继承抽象层节点的所有属性。常用的类属关系有: a k o :含义为“是一种”( a k i n d 一0 f ) ,表示一个事物是另一个事物的一种 类型。 a m o :含义是“是一员”( a m e m b e r o f ) ,表示一个事物是另一个事物的一 个成员。 i s a :含义为“是一个”( i s a ) ,表示一个事物是另一个事物的一个实例。 在类属关系中,具体层节点除具有抽象层节点的所有属性外,还可以增加一 些自己的个性,甚至还能够对抽象层节点的某些属性加以更改。例如,所有的信 息都具有需要载体、没有质量、可以共享、昨传递和处理过程中不增值、具有知 识的本性、不是虚无飘渺而是具体的等特征。教育信息作为一种特殊的信息,除 具有上述的这些特征之外,还具有量度水平低、注重个体数据的分析、教育数据 多是一些小样本的数据、多是一些模糊信息等特有的性质。 ( 2 ) 包含关系 包含关系也称为聚类关系,是指具有组织或结构特征的“部分与整体”之间 的关系。它和类属关系的最主要区别是包含关系一般不具备属性的继承性。常用 的包含关系如下; p a r t o f :含义为“是一部分”,表示一个事物是另一个事物的一部分。用 它连接的下层节点的属性可能和上层节点的属性是很不相同的,即p a r t o f 联 系不具继承性。例如,“学生关系管理是大学资源规划的一部分”可采用包含关 系,但“学生关系管理”不一定具有大学资源计划的某些属性。 ( 3 ) 占有关系 占有关系是事物或属性之间的“具有”关系。常用的占有关系如下: h a v e :含义是“有”,表示一个节点拥有另一个节点所表示的事物。 ( 4 ) 时间关系 时间关系是指不同事件在其发生时间方面的先后次序关系,节点间的属性不 具有继承性。常用的时间关系如下: b e f o r e :含义为“在前”,表示一个事件在另一个事件之前发生; 1 2 2 】几种最常用的基奉语义关系,h t t p :l l a i i t e d u b t f o a r t l c l c p h p 4 2 ,2 0 0 5 3 6 知识表示在教学领域的应用研究一一教育信息处理 的知识表示 a f t e r :含义为“在后”,表示一个事件在另一个事件之后发生: d u r i n g :含义为“在期间”,表示某一事件或动作在某个时间段内发生。 ( 5 ) 位置关系 位置关系是指不同事物在位置方面的关系,节点间的属性不具有继承性。常 用的位置关系如下: l o c a t e d - - o n ;含义为“在上”,表示某一物体在另一物体之上; l o c a t e d - - a t :含义为“在”,表示某一物体处在某一位置; l o c a t e d - - u n d e r :含义为“在下”,表示某一物体在另一物体之下; l o c a t e d - - i n s i d e :含义为“在内”,表示某一物体在另一物体之内; l o c a t e d - - o u t s i d e :含义为“在外”,表示某一物体在另一物体之外。 ( 6 ) 相近关系 相近关系是指不同事物在形状、内容等方面相似或接近。常用的相近关系有: s i m i l a r - - t o :含义为“相似”,表示某一事物与另一事物相似; n e a r - - t o :含义为“接近”,表示某一事物与另一事物接近。 ( 7 ) 推论关系 推论关系是指从一个概念推出另一个概念的语义关系。 ( 8 ) 因果关系 因果关系是指由于某一事件的发生而导致另一事件的发生,适于表示规则性 知识。通常用i f - - t h e n 联系表示两个节点间的因果关系,其含义为“如果a , 那么b ”。 ( 9 ) 组成关系 组成关系是一种一对多联系,用于表示某一事物由其他一些事物构成,通常 用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论