(计算机应用技术专业论文)lpss双层网络模型.pdf_第1页
(计算机应用技术专业论文)lpss双层网络模型.pdf_第2页
(计算机应用技术专业论文)lpss双层网络模型.pdf_第3页
(计算机应用技术专业论文)lpss双层网络模型.pdf_第4页
(计算机应用技术专业论文)lpss双层网络模型.pdf_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究 成果。据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经 发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在 文中作了明确说明并表示谢意。 作者签名: 学位论文使用授权声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保 留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权 将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有 权将学位论文的内容编入有关数据库进行检索。有权将学位论文的标题和摘要 汇编出版。保密的学位论文在解密后适用本规定。 学位论文作者签名:页久 导师签名:7 笔,匕易手 日期:趁! 竺! ! 摘要 本文将事例推_ m ( c b r ) 、基于本体的建模方法引入学习支持系统( l p s s ) 中, 用人工神经网络的方法改造这两种技术,研究并设计了l p s s 双层网络模型。 本模型包括自适应本体网络层和c b r 领域知识层。自适应本体网络层把本 体网络结构转化为h o p f i e l d 网络结构,使信息处理在本体论的基础上充:宁利用 了h o p f i e l d 网络的推理功能。c b r 领域知识层是在c b r 理论的基础上,根据 l p s s 系统要求,设计的l p s s 事例推理的三层结构。 l p s s 双层模型实现了l p s s 的用户问题处理功能和用户信息适应功能,使 得l p s s 不仅能够”理解”用户的问题,而且能够适应用户对问题解答的接受水平 和接受习惯,提高了l p s s 的针对性和适应性。 【关键词】l ? s s 双层网络模型事例推理本体人工神经网络 a b s t r a c t l p s s ,s h o r tf o rl e a r n i n gp e r f o r m a r i c es u p p o ns y s t e m ,j sp r e s e n t e d t op r o v i d et h eb e s ta s s i s t a n c ew h e n e v e rc l i e n t sn e e d t h i sp a p e rp r e s e n t sd o u b l e l a y e rn e t w o r k sm o d u l et 0i m p l e m e n t l p s s b yi n t e g r a t i n g c b rr e a s o n i n ga n do n t o l o g yw i t hn e u r a l n e t w o r k s t h ea r c h i t e c t u r eo ft h i sm o d u l ec o n s i s t so fa u t o a d a p t i v e o n t o l o g yl a y e ra n dc b rl a y e nt oe n h a n c ea d a p t i v ea b i ( i t yo fl p s s , a u t o - a d a p t i v eo n t o l o g yl a y e r i sb a s e do n o n t o l o g y m o d e l i n g m e t h o d o l o g ya n dr e s t r u c t u r e db yh o p f i e l dn e t w o r k c b rl a y e oa t r i p i e l a y e rs t r u c t u r e ,a i m sa tb e t t e ru n d e r s t a n d i n go ft h ep r o b l e m d e s c r i p t i o n s b a s e do nt h i sm o d u l e ? l p s sc a nu n d e r s t a n dc l i e n t s jc o n c e r n s | a d a p t i n gi t s e l ft oc l i e n t s l e a r n i n ga b i l i t ya n dp r o v i d i n gt h em o s t e f f i c i e n ts o l u t i o nt i m e l ya n di n d i v i d u a l l y k e y w o r d s :d o u b l e - l a y e rn e t w o r k f o rl p s s ,c b r ,o n t o l o g y ,a n n 1 1 问题的提出 第一章概述 从1 9 5 6 年m m a c ar t h y 在美国召开的利用计算机模拟人类智能行为的学 术会议上提出”人工智能”丌始,人们便对人工智能展开了全面深入的研究。在研 究中,人工智能研究人员逐渐意识到,用人工智能系统来解决现实社会中各种复 杂的问题是非常困难的。于是,7 0 年代针对特殊领域知识的人工智能研究逐渐 受到人们的重视。1 9 6 5 年,第一个专家系统d e n r a l 问世。随后,数学专家 系统m a c s y m a 等基于不同领域知识的专家系统不断涌现。 计算机的应用使得人们能够把知识存储在计算机上,这结束了几千年来人类 只能把获取的知识存储在书籍上的历史。1 9 7 7 年在国际人工智能会议上 e d w a r da f e i g e n b a u m 提出”知识: 程”这一概念后,人们开始了对如何高效 地获取和使用知识的研究,人工智能的研究步入了对知识工程科学的研究阶段, 并建立了一门新的实验性学科一一知识二二程。 知识工程带动了以计算机辅助教学为基础的智能教学研究的发展。人工智能 和知识工程研究的显著成果为智能教学奠定了研究基础。智能教学系统涉及到知 识表示、推理技术、机器学习、自然语言理解、信息智能检索等等诸多问题,因 此它还是个复杂的问题,。以1 9 7 7 年s t a n f o r d 大学医学专家系统m y c i n 的智能教学系统g u i d o n 为代表,研究人员在智能教学系统的设计原理、实现 方法,以及专家系统在智能教学中的应用等领域进行了深入研究并取得了许多成 果,如:帮助学生分析句子的i l l d a 系统和航海设备教学的s t e a m e r 系统等 等。 在l p s s 出现之j u ,传统的智能教学系统主要研究如何使特定的对象具备特 定领域的知识基础和部分技能,以便适应将来的工作。通俗地讲,这叫做”先学 后干”。但是从某种意义上讲,人们的更多的学习需要却发生在实际工作中,因 此人们需要针对性强的”边于边学”或”干中学”【lj 。为了满足人们这种需要,l p s s 应运而生。 籀一章概述 l p s s ( l e a r n i n gp e r f o r m a n c es u p p o r ts y s t e m ) 是基于p s s 思想而 设计的个学习支持系统,重点要体现出”及时学习”和“即求即应”的功能。它 使得用户在工作或学习中遇到问题时能够得到及时准确的帮助。 为了实现”及时学习”和“即求即应”的功能l p s s 必须具备以下几点基本功 能: 用户主要通过友好界面直接向系统提出自己的疑难问题。因此,l p s s 必须能够通过”理解”,分析出用户提出的问题和类型。 在对问题的“理解”的基础上,l p s s 需要在结构化知识库中进行检索并 搜寻到相关的知识或解答。 l p s s 应该能够记录不同用户的程度和学习方式的偏好。在提供解答的 时候,l p s s 能够针对当前用户的特点给出适合的解答。 如果l p s s 不能理解用户的问题,系统则会将问题存放到新问题库中, 同时告知用户系统暂不能答复该问题。 l p s s 的基本矾、任r j 如图i 1 。 r 、攀牌乡j i 抒析产4 ¥自# j i ,e i n j q 螂不妇功 口月1 r t一“。 ;一- l 一 ,一一,一、 姜三三,三身i + i 兰三三三豸 键亨咋 j 颢城 件 , 一一7 、一 吲lil p s s 的基本流群 l p s s 在强调即时给用户提供帮助的 可时还必须注重对用户学习方式的适 应。因此,本系统还必须解决以f 两个主要问题。 用户问题处理。它对用户提出的问题进行预处理,把用户问题转化成知 识库中知识的存储形式。这是一个系统对问题的”理解”过程。应浚着重 指出的足,l p s s 中的问题理解不是自然语言的理解,而是根据用,9 的 窆,蜜 第章 l 【述 问题描述精确的搜索到知识库中已存储的能够和用户问题吻合的知识 全部信息的过程。 用户信息适应。在理解问题的基础上,根据用户的学习方式给用户特定 的解答方式。( 如:提示、简解、详解;又如:语音、图像、动画等) 但是,目前l p s s 的系统设计要完全实现上述各项基本功能依然存在着诸 多技术难点需要我们研究并突破。本文利用当前事例推理方法( c b r ) 、本体和 人工神经网络的进展详细讨论了实现l p s s 的关键技术、系统模型和实现方案。 1 2 事例推理技术的引入 用户问题处理需要对用户的问题进行”理解”。它的输入是用户的问题,输 出是按用户特点做出的解答。我们将采用事例推理的方法解决这个问题。 传统的专家系统通过在特定领域中抽取可显示表达的知识来建立一个知识 模型。这干叶t 模型大多是基于规则和对象的。从大量的知识中抽驳规则不但可以 节省存储大量知识的空间还可以进行模糊推理。这种基于规则( r b r , r u l e b a s e dr e a s o n i n g ) 的专家系统已经取得了许多成就。然而在研究中,研 究者也遇到了一些困难。 规则很难涵盖领域中所有知识。对于一些不在规则描述范围的特殊情 况,这些规则就显得无能为力了。 知识的获驭非常困难,通常称之为知识获取瓶颈( k n o w l e d g e e l i c i t a t i o nb o t t l e n e c k ) 。专家系统的规则需要领域专家和人工智能专 家的共同合作并手亡编写规则。 知识是不断发展的。专家系统需要系统设计者不断地进行维护。而这个 维护又是非常困难的。 1 9 8 2 年,r o g e rs c h a n k 在其著作d y n a m i cm e m o r y 中描述了基于事 例的推理( c b r ,c a s e b a s e dr e a s o n i n g ) 。它的核心思想是:在问题求解 时,人们可以利用以前对该类问题的解决经验,即事例,进行推理。 基于事例的推理是先对过去的事例进行检索,找出和新问题相近的事圳, 把事例中的信息和知c _ 复用到新问题中,并调整相关问题的解来解决新问题。 这和人们思考问题的方式很相像,当八们遇到问题的时候,总是根据以往的经 蝌一翠概述 验进行分析判断并做出决定。把当前面i 临的问题或情况叫做目标事例( t a r g e t c a s e ) ,把汜忆的问题或情况叫做源事例( s o u r c ec a s e ) 。基于事例推理就是 出目标事例的提示而获得记忆中的源事例,并由源事例来指导目标事例求解的 过程。应用经验来求解问题是c b r 的标志,因此c b r 被认为是符合人类认 知过程的心理学理论的 引,它提供了人们如何求解问题的一种认知模型。 c b r 比起r b r 具有如下优势: c b r 不需要显示的表达领域知识,它通过使用中动态的获取新c a s e 来丰富知识库。这就避开了“知识获取瓶颈”问题。 c b r 在无法得到领域模型的时候也可以建造。如果用r b r 的思想开发 l p s s ,理解用户的问题将非常复杂,而且很难总结出基于规则的领域 模型。 c b r 在操作层面( o p e r a t i o n a ll e v e l ) 上表示事例,一般通过从事例中 抽取特征( f e a t u r e s ) 的方式来表示事例。c b r 系统运行过程中不需要 一个完善的事例库。因此,它解决了r b r 系统中的潜伏问题 ( b u g b e a r s ) 。 c b r 系统通过学习新事例将逐渐掌握使用者的经验。c b r 使l p s s 能 够逐渐适应用户的提问方式。 当然,r b r 也有它长处,我们将遵循文献 3 的思想,以c b r 为主r b r 为辅的方式实现用户问题处理功能。 一一般认为,c b r 过程可划分为以下四个阶段:事例检索( s i m i l a r i t y r e t r i e v e ) ,事例复用( r e u s e ) ,解决方案修f ( r e v i s e ) 和事例保存( r e t a i n ) 。 这四个步骤组成了著名的c b r 循环 4 ( 图1 2 ) 。 第一步c b r 系统首先根据新问题的特点,从事例库中检索出与新事例相 近的事例或事例集合。 第二步,把第步获得的事例或事例集中选出的最优的事例中的信息和知 识复用到新问题上。 第三步,修正建议的解答并得到验证过的解答。 第四步,把这次成功或失败的经验( 事例) 保存到事例库中,丰富事例厍。 第1 睢概连 【新问题卜、 转“i 。的觯笄( c 。? ”呐“。“毗“名( r e v i 。e ) 一一4 撞索到的事例 t-一 建议m 祥符( g * ch t t 、dl 【1 l i 、nj 图1 2c b r 循耶;j 我们在应用c b r 理论处理用户问题的时候,必须首先解决知- i _ 获取、事例 表示和事例库的组织、事例检索和适应性修改、事例推理过程和事例学习过程 等问题,它们组成了用户问题处理模块,它们都是c b r 推理和学习过程中不可 或缺的组成部分: ( 1 ) 知识获耿 这个模块的知识获取是为了帮助系统理解用户的问题。用户问题的类别和 内容是多种多样的,很难用规则的方式表示。因此,我们必须用c b r 柬代替 r b r 。我们只关,l 、用户问题中对问题理解有帮助的特征( f e a t u r e ) 摒弃那些无 关的特征。因此在我们的l p s s 中,首先定义了一组有助于理解的重要特征。 ( 2 ) 事例表示和事1 歹| j 库的组织 我们选择c a s l 语苦 5 6 1 来表示事例,使用“记忆组织包”( m e m o r y 0 r g a n i z a t i o np a c k e t ,卜1 0 p ) 建立个树状模型来组织事例。为了提高事例的 检索速度,我f l 还将引入一个索引机制。 ( 3 ) 事例适应性修改和检索 当事驯库中的事例没有和新事例完全匹配时,系统只能找到和待求问题最 相近的事例。这个时候就需要适应性修改了。一般情况下t 我们通过直接向待 第一亭概迷 求问题的解决方案中添加删除替换些内容等方式在一定程度上实现适应性 调整。显然,要使c b r 系统得到足够的适应性修改的知识( a d a p t a t i o n k n o w l e d g e ) 是一件长期又艰巨的任务f ”。在本系统中,用户问题的模糊说法 将被预处理,使得后续的检索更加准确。 事例的检索是利用事例的索引机制,根据相似性度量的方法,在一起的相 似性程度阀值下,从事例库中找出一组与新事例匹配较好的事例,并从甲选出 一个最佳的事例。事例检索主要分为两个过程:初始匹配( i n i t i a l l ym a t c h ) , 搜索( s e a r c h ) 和选择( s e l e c t ) 。 系统首先通过索引机制搜索到一组可行的候选事例,然后采用l p s s 事例推 理三层结构中基于反向传播神经网络的计算方法得到每个候选事例的相似度,最 后确定相似度较高的几个事例,供用户作最终判断。 ( 4 ) 事例推理过程和事例学习过程 事例推理的四个过程可以通过编程实现,事例的学习过程也就是保存新的 事例和修改每个用户的事例权矩阵的过程。 1 3 基于本体的建模方法 用户信息适应模块需要| 己录每个用户的信息并能适时地做出调整。它输入 的是用户对l p s s 所提供的解答方式的适应性的确认信息,这个确认信启、可能 是诈向的也可能是对其他解答方式的请求;输出的是回应当前用户信息的凋整 信息。为了使l p s s 能够在”理解”用户问题的基础上,捌有强大的知识库作为 基础,并能够对当前用户给出适当的解答方式,我们必须从知识库系统建模方 法的角度讨论用户信息适应问题的解决方案。 知识库系统( k n o w l e d g e - b a s e ds y s t e m ) 是随着9 0 年代以来数据库技术 和a i 技术的迅速发展而发展起来的。它主要研究如何有效地利用、存储、管理、 组织、维护和更新大规模的知i = ,如何有效地利用存储的知识进行推理和问题 求解。 近年来,为了适应知识的表示、信息的组织、软件的复用的需要,为组织、 管理和维护海量信息提供有效的服务以满足用户的需要,受本体论的哲学思想 的影响,对实体的存在性和实体存在性的本质的深屡次研究受到了普遍的重视, 第一市概述 提出了一种能在语义和知识层次上描述信息系统的概念模型建模工具 一一o n t o i o g y ,它自被提出以来就引起了国内外众多科研人员的关注。 1 9 9 3 年,g r u b e r 给出了o n t o l o g y 的一个最为流行的定义【8 】,即 ”o n t o l o g y 是概念模型的明确的规范说明”。后来,b o r s t 在此基础上,给出了 o n t o l o g y 的另外一种定义一j :”o n t o l o g y 是共享概念模型的形式化规范说明”。 s t u d e r 等对上述两个定义进行了深入的研究,认为o n t o l o g y 是共享概念 模型的明确的形式化规范说明。这包含4 层含义【lu j :概念模型 ( c o n c e p t u a i i z a t i o n ) 、明确( e x p l i c i t ) 、形式化( f o r m a l ) 和共享( s h a r e ) 。 ”概念模型”指通过抽象出客观世界中些现象( p h e n o m e n o n ) 的相关概念而 得到的模型。概念模型所表现的含义独立于具体的环境状态。”明确”指所使用 的概念及使用这些概念的约束都有明确的定义。”形式化”指o n t o l o g y 是计算 机可读的( 即能被计算机处理) 。”共享”指o n t o l o g y 中体现的是共同认可的知 识,反映的是相关领域中公认的概念集,即o n t o l o g y 针对的是团体而非个体 的共识。o n t o l o g y 的目标是捕获相关领域的知识,提供对该领域知识的共同理 解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词 汇( 术语) 和词汇问相互关系的明确定义 t 8 】。它被广泛应用于知识工程、数字 图书馆、软件复用、信息检索、语义网络和w e b 上异构信息的处理引等。 为了解决用户信息适应问题,除了拥有强大的知识库基础外,我们必颁设 计出一个能够在领域知识基础上适应不同用户的模型。因此,我们将在 o n t o l o g y 建模的基础上,引入人工神经网络技术,并讨论它在本体网络中的应 用。 我们设计的l p s s 的流程图如图1 3 所示。其中,基于事例推理的用户问 题处理模块和基于本体网络的用户信息适应模块是本系统的关谴。 o 第一帚_ | l 述 幽l3l p s s 流样蚓 我们设计的l p s s 双层网络,包括自适应本体网络层和c b r 领域知识层, 它们在本系统中的位置如图1 4 所示。其中,自适应本体网络层是为用户信息 适应模块设计的,而c b r 领域知识层是为用户问题处理设计的,我们在下面的 两章分别讨论这两层的概念及其功能的实现原理。 图l4l p s s 双联网络“系统中的化胃 第二章自适应本体网络层 2 1 自适应本体网络层概述 o n t o l o g y 可以按分类法来组织,o n t o l o g y 包含5 个基本的建模元语 ( m o d e l i n g p r i m i t i v e ) l ”j 。这些元语分别为:类( c l a s s e s ) ,关系( r e l a t i o n s ) , 函数( f u n c t i o n s ) ,公理( a x i o m s ) 和实例( i n s t a n c e s ) 。 ( 1 ) 通常也把本体中的类( c l a s s e s ) 写成概念( c o n c e p t s ) ,这是广义的概 念,它除了可以是一般意义上的概念以外,也可以是人物、功能、行为、策略、 推理过程等等。本体的这些概念构成一个分类层次。 ( 2 ) 本体中的关系表示概念之间的一类关联。典型的二元关系如子类关系形 成了概念类层次结构。一般情况下,形式上定义为n 维笛卡儿乘积的子集。用r : c ,c :a c 。表示概念类c l ,c ! ,a ,c 。之i a j在 元关系尺。 ( 3 ) 函数是一种特殊的关系,其中第 个元素相对于前面月一1 个元素是唯一 的。一股情况下,函数形式化的定义用,:c c 二x a c ,寸c ,表示。基本的 关系有4 种:p a r to f , k i n do f ,i n s t a n c eo f 和a t t r i b u t eo f 。 p a r to f 表达概念之间部分与整体的关系,如”叶子”是”树”的一部分。 k i n do f 表达概念之i u j 的继承关系,类似于面同剥+ 象中的父类和子类之间的 关系。给出两个概念c 和d ,畦c7 = 0 ; v ,( f ) = o ; y ,( ,) o : 这罩n 为网络节点总数;目是阀值,是0 的一个属性,阀值的大小来源于号 家知识:甜。,是当前用户权值矩阵缈中相应项的权值。 上式也可以用符号函数写成 p ,( f + 1 ) = s g n 口 定义2 7 若存在,使得 i 吼0 ,。,1 i i ) +f 量 勺 分个 一帚的中 r 十f 甙 中 苴一 第一帝自适m 本体州络甚 则称自适应本体网络在迭代f ,次后达到稳定状态。 显然,若自适应本体网络达到稳定状态,则 e ,= s 耐叮“,) q 一引, 目适应本体网络是按照h o p f i e l d 网络的并行方式计算的。因此,根据文献 2 2 能量函数可以定义为, e :一去咄。,巳( h 1 ) e 凡) 一三臼。h 1 ) + q ( r ) ,i = 一寺p 7 u + 1 ) w e ( f ) 一寺护 p o + 1 ) + p o ) 】; 由,) = 珊。n 可推得 业= 一l e t ( r + 1 ) 耽一寻口( f + 1 ) + 哪) + 丢e ) 耽( f _ 1 ) + 告趴邢) + 印_ 1 ) :一; e ( r ) 7 e o + 1 ) 一e ( r 一1 ) 一;臼7c e ( f + 1 ) + e ( f 一1 ) = 一; p “) 7 + 臼7 】 p ( f + 1 ) 一日( r 一1 ) 又, p ( f ) 7 w 臼7 中每个分量i 与其在g “+ 1 ) 中对应的每一分量p ,( r + 1 ) 同号 v “ p ( f ) 7 w + 臼7 p ( f + 1 ) 一e ( t 一1 ) 】0 故o 。 当缸= 0 且口( f ) e ( t 一1 ) = e ( i + 1 ) 时,网络将”稳定”在周期为2 的震荡环。 其他情况,网络都将收敛在一个固定的冲量向量,达到稳定状态。 定义2 8 若存在f ,使得 e ( t ) e ( t 一1 ) = e ( t + 1 ) , 则称自适应本体网络在迭代t + 1 次以后达到亚稳定状态。 如果网络处于稳定状态或亚稳定状态,则函数f 的运行终止。当网络在迭代 t 次后达到稳定状态时,则输出稳定状态的冲量向量e ( r ) :当网络在迭代,+ 1 次 第一争白适、vk 体州络层 后达到亚稳定状态时,则输出p ( ,一1 ) ,即g ( f + 1 ) ,也就是说,如果网络收敛在 个固定的冲量向量,则输出这个稳定状惫下的冲量向量p “) 。 系统将根据网络处于稳定状态或亚稳定状态后的输出的冲量来修改该用户 相关概念类集中的元素的a n s w e l _ 1 - y p e 属性。 因此,c 。( s ) 运行的一般步骤如下: s t e p1 把e 保存在e 1 口; h s t e p2 用e 2 j l = s g n 吼。e l ( j ) - 0 j 得到e 2 i = l s t e p3 用e 3 j = s g n 吒。n e 2 ( j ) 一巳 得到e 3 s t e p4 当( e 1 e 2 ) a n d ( e l e 3 ) 时做s t e p 4 一s t e p 6 ; s t e p5 e l = e 2 】;t m p = e 2 ;e 2 = e 3 ; s t e p6 用9 3 = s g n g o “n t m p ( j ) _ - - , 得到e 3 : s t e p7 r e t u r ne l ; 用户每当进行一次答案的确认就会产生一个冲量向量,m 次确认的所有冲量 向量用缸1 ,“二“” 表示,且“ 1 ,+ l 卜i = l 一2 ,m 。 神经心理学家h e b b 指出的学习规则可归结为”当某一突触( 连接) 两端的神 经元的激活同步( 同为激活或同为抑制) 时,该连接的强度应增强,反之则应减 弱”。采用胁蚰规则,有u ,2 ,7 e ,印所以n w ,。吉善“知;,i = 1 2 ,n 其 中z z 为第k 个冲量向量w 。的第i 个分量,于是本体权矩阵可写为 = 去喜c “ z c 一,= 去善“女“一詈, 其中,是单位矩阵,“t7 表示向量的外积。具体步骤为 s t e p1 】从用户配置文件中读出。 s t e p2 从k = 1 到m ,输入“。对所有连接( f ,) ,令 第一章白适心奉仆州络层 1 印i 扩赫+ “; s t e p3 】把结果w 保存到用户配置文件。 有关h o p f i l e d 网络的其他学习算法可参阅文献e 2 2 。 第三章c b r 领域知识层 3 1c b r 领域知识层概述 c b r 领域知识层是为了给c b r 领域知识提供支持而设计的。用户用自然语 言描述的问题记作q 0 ,计算机经过处理后判断出来的问题记作q l 。我们认为9 0 由描述知识点信息的概念词和描述有关该知识点的不同问题的关系词组成。如: 问题”树和树林有什么区别? ”中,概念词为”树”和”树林”;关系词为”区别”。 概念词还分为主概念词和从概念词两种。主概念词是正式使用的概念词。从 概念词是学生经常出现的对正确概念的模糊或错误的随法。 c b r 领域知识层可用以下6 元组表示。 0l p s s c b r m a s t e r c | l p s s c b r s l a v e c f l p s s c b r r m t o m f l p s s c b r r m t o s ,l p s s c b r q i ? p e ,l p s s c b r p o w e r m a t r i x 、, 其中,l p s sc b rm a s t e r c 是主概念词集,它和自适应网络屡中的 l p s so n t o0 一一对应;l p s sc b rs l a v e c 是丛属概念词集, l p s sc b rrm t o m 是主概念词问有向关系集,它和自适应网络层中的 l p s so n t o r 一对应:l p s s c b rrr n t o s 是由主撅念词指向从概念词的 有向关系集;上j d 对一c b r q t y p e 是关系词集;三只镕c b r p o w e r m a t r i x 是事 例权矩阵的集合。 图2 5 是c s r 领域知识层的示意图。可以看出,不是所有的主概念词节点 都有相应的从橛念词节点,而且一个从概念词节点也可以从属于两个主概念词节 点。系统根据教学经验预设部分从概念词,而其它从概念词是在系统的运行过程 中通过维护逐步添加的。 为了使系统能够适应不同用户的提问特点,可以在每个主概念词指向从概念 词的有向关系上附加权值,其方法与自适应本体网络的方法相似,因此不再重复。 旃= 常c b r 领域知识层 i i ,f 一心。孓 、, 、 8 ,沁、 ,。 旷y 、,、晰,义k3 、墨。, 弧一 一j , c 、 5 - j 一一茸歹夕葡0 1 0 、,、, 一 、一+ ,? ,垂一乏叫3 ,?等一一一!堡!:!x=i二一毒、:、叫3 32 事例表示 图3ll p s s 双层网络c b r 领域知识层 我们发计l p s s 的问题处理模块的目的是通过事例推理的方法把用户提出的 司题转化成计算机可以理解的问题并在事例推理的基础上找出和用户问题匹配 第= 章c b r 领域知识层 程度最高的已知领域知识,因此必须首先解决作为事例推理基础的事例表示问 题。 尽管事例推理有很多指导性设计思想,但是,由于不同领域的知识的特殊性, 事例表示至今还没有一般意义上的方法。我们必须结合学习支持系统的具体情况 来设计事例表示。我们认为二元组( 问题,解答) 组成了用户提问的原始信息。 我们把每次用户得到学习支持的信息保存下来,以使未来的判断得到经验的支 持。为了满足事例推理的需要我们还要从用户的问题中提取特征( f e a t u r e ) 。这 些特征可分为:确定性必要特征和其他特征【2 3 】。确定性必要特征指与该事例相 似特征必不可少的且能够用肯定或否定逻辑关系表示的特征;其他特征可细分为 确定性不必要特征和不确定特征。确定性不必要特征是指能用肯定或否定逻辑关 系表示的征兆,但其出现只对事例与待求问题的关联程度起增强作用,并不是必 需的;不确定的征兆是指不能用肯定或否定的逻辑关系表示的征兆,需要用模糊 关系或其他方法来处理。我们设计的事例由两部分组成:问题的属性描述和问题 的解答描述,即l p s s 事例1 1 事例属性集+ 解答。 我们要对事例属性做尽可能详尽的收集,以使l p s s 事例获得问题的更详尽 的描述信息。用户总是对某一个或一些领域知识的各个方面进行提问的。因此, l p s s 事例的特征应包括表示确定性必要特征的主概念词、表示确定性不必要特 征的从概念词和表示问题类型的关系词。 于是,我们把l p s s 事例表示为:s p ( a ,t ,d ) ,其中,a 为属| 生集, a = ( 爿川a ;) ,a 。= ( “ 口。,a n ) 为主概念词集,a ,= ( “矿a 。,口“) 为从概念 词集:t = ( ,。,f ,) 为关系词集:d 为答案集td = ( d i s c r i p t i o n ,d p p ) 。 d e s c r i p t i o n 是答案描述,t y p e 是答案类型。 例如,一个l p s s 事例可由以下信启表示 问题描述部分解答部分 事问主概主概主概从概从概从关系关系问题 放 答口 纂 题念词念词念词念词念词概词编词编描述案案 描编号编号编号编号编号念号1号2 ( s ) 编类 号述 z 3 12词 口 型 可 辩- 二乖c b r 领域知识层 ( u )编 号3 表3 1l p s s 事例库结构 系统可以根据需要限韦4 个问题中出现的主概念词和从概念词的数量。本例 中,系统对该数量的限制为3 。我们可以对所有的主概念词和从概念词建立对应 的权值,权值因用户的不同而不同,并以数据库表的形式存放在用户配置文件中。 如:用户的问题是:“什么是树? ”,”树和森林的关系是什么? “,“树和森林 的区别是什么? ”,”树林是什么? ”。那么这四个事例将按照如下方式存储。从 概念词树林隶属于主概念词森林和树。在系统运行过程中,如果判断出用户问题 和多个已知领域知识的关联程度很接近,系统会提示用户进行选择。这种情况对 于新用户发生的次数较多。 3 。3 事例库 问题描述部分解答部分 恳 问题描 主概 主概 主概 从概从概从概关系关系问题答案编答 述( u ) 念词念词念词念词念词念词词编词编描述案 编号编号编号编号1编号编号号1 号2 ( s ) 类 i 号 132j型 1什么是100oo0101计么是2 树?树? 2树和森12o00ol22掰和森1 林的关林的关 系是什系是什 ,r 么? 3树和赢12o0 001 33树和森 3 林的区林的区 别是什别是什 , 么? 批二章c b r 领域知识层 4树林是 00o1o0101 0 r什么是2 什么? 正 树? o r 什么是 森林? 表3 2l p s s 事例库库示意表 表中,主概念词1 = 树;主概念词2 = 森林:从概念词1 = 树林,关系词1 = 什么,关系词2 = 关系,关系词3 = 区别;注:本图为示意图,具体编号以系统 数据库为准。 一般说来,一个事例和数据库的一条记录有很多相似之处,但由于c b r 的 特殊性,它与普通的数据库有以下不同。 每个事例有两组字段。一组用于描述问题和问题的特征,一组用于描述 问题的解答。 非索引字段可能在特定的事例中被省略。每组字段至少有一个字段,问 题描述部分至少有一个字段作为索引。 事例可能有扩展部分( e x t r as e c t i o n s ) 。 因此,我们采用c a s l 语言建立事例文件。”t h ec a s p i a nc a s eb a s e d r e a s o n e r ”川使用这些c a s l 文件在内存中建立事例库,我们的l p s s 就是在 这个r e a s o n e r 源代码的基础上编写的。 c a s l 语言主要结构如下: i n t r o d u c t i o n 【c a s ed e f i n i t i o n 【i n d e xd e f i n i t i o n 【m o d i f i c a t i o nd e f i n i t i o n c p r e p r o c e s s i n gr u l ed e f i n i t i o n 】 r e p a i rr u l ed e f i n i t i o n c a s ei n s t a n c e ( 1 ) i n t r o d u c t i o n c a s l 语言 i n t r o d u c t i o n 语法为: s y n t a x : 第二三尊c b r | :面域知识层 l p s s 事例库 i n t r o d u c t i o n 部分描述为 ( 2 ) c a s ed e f i n i t i o n c a s l 浯言 c a s ed e f j n l t j o n 语法为 s y n t a d e f n s :c a s ed e f t n i t i o ni sf i e l d d e f se n d ; f i e l d d e f s :f i e l d f i e l d f i e l d f i e l d i d e n t i f i e rt y p ei ss t r i n gw e i g h t d e fp r o m p t d e f ; d e n t i f i e rt y p ei sn u m b e rw e i g h t d e fp r o m p t d e f ; d e n t i f i e rt y p ei se n u m e r a t i o nw e i g h t d e fp r o m p t o e f ; d e n t i f i e rt y p ei sl i s tw e i g h t d e fp r o m p t d e f w e i g h t d e f :w e i g h ti sr e a l n u m l p s s 事例库事例结构定义为 c a s ed e f i n i t i o ni s f i e l dc a s e i dt y p ei sn u m b e r ; f i e l du s e r _ p r o b l e m d e s c r i p t i o nt y p ei sl i s t ; f i e l dm a s t e rc o n c e p t i d lt y p ei sn u m b e r ; f i e l dm a s t e r c o n c e p t i d 2t y p ei sn u m b e r ; 篓望旦塑塑坚l 一一 f i e l dm a s t e r _ c o n c e p t _ i d 3t y p ei sn u m b e l ; f i e l ds l a v e c o n c e p t i d it y p ei s n u m b e ; f i e l ds l a v e c o n c e p t i d 2t y p ei s n u m b e r ; f i e l ds l a v e c o n c e p t i d 3t y p ei s n u m b e ; f i e l dq u e s t i o nt y p e i d lt y p ei s n u m b e ; f i e l dq u e s t i o n _ t y p e i d 1t y p ei sn u m b e o : f l e i ds y s t e m p r o b l e m d e s c r i p t i o nt y p e i sl i s t ; f i e l ds y s t e ma n s w e r _ i dt y p ei s n u m b e r ; f i e i ds y s t e ma n s w e r _ t y p e i dt y p ei sh u m b e r ; e n d ; ( 3 ) i n d e xd e f i n i t i o n ! ! ! ! 兰型壁耋! ! 奎量塑! ! 一 一一 i n d e xd e f i n i t i o n 。5 n d e xo nm a s t e rc o n c e p t i d i ; n d e xo nm a s t e r c o n c e p t i d 2 ; n d e xo nm a s t e r c o n c e p t i d 3 ; n d e xo ns l a v e c o n c e p t _ i d l ; i n d e xo ns l a v e c o n c e p t i d 2 ; i n d e xo ns l a v e c o n c e p t _ i d 3 ; 籀一葶c b r 瓤域知识崩 ( 4 ) m o d i f i c a t i o nd e f i n i t i o n c a s l 语言 m o d i f i c a t i o nd e f i n i t i o n 语法为 m o d i f i c a t i o n 主要用于检索,l p s s 事例库中事例的修改部分主要是对主从 概念词定义。 m o d i f i c a t i o nd e f i n i t i o nl s 一t h ed e f i n i t i o no fr e l a t i o n sb e t w e e nm a s t e rc o n c e p t sa n ds l a v e c o n c e p t ss e c t i o n a b s t r a c t i o n 树i s ( 树木,树林 a b s t r a c t i o n 森林i s ( 树林,) ; 一t h ed e f i n i t i o no fq u e s t i o n _ t y p es e c t i o n a b s t r a c t i o n 概念类问题i s ( 是纠么,什么是, e n d ; ( 5 ) r e p a i rr u l ed e f i n i t i o n 由于我们设计的l p s s 。p 的r e p a i rr u l ed e f i n i t i o n 比较复杂,凼此我们先使 用r e p a i rr u

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论