(计算机应用技术专业论文)mobile+agent在自动答疑系统中的应用研究与实现.pdf_第1页
(计算机应用技术专业论文)mobile+agent在自动答疑系统中的应用研究与实现.pdf_第2页
(计算机应用技术专业论文)mobile+agent在自动答疑系统中的应用研究与实现.pdf_第3页
(计算机应用技术专业论文)mobile+agent在自动答疑系统中的应用研究与实现.pdf_第4页
(计算机应用技术专业论文)mobile+agent在自动答疑系统中的应用研究与实现.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

丕直太堂亟土堂位论奎撼要 摘要 远程教学是利用计算机网络技术、多媒体技术等现代信息技术手段开展起来的一种新 型教学形式它使得广大受教育者可突破传统教育在教育资源和教育方法方面的限制,实 现优秀教育资源和教育方法不受时间和空间约束的共享。答疑作为教学活动中的一个重要 环节,随着远程教育的发展正日益引起关注。然而,目前国内具有代表性的远程教育系统 中的答疑部分,还仍然不能令人满意。 论文的研究目标是,设计与实现一个基于自然语言的面向远程教育领域的自动答疑系 统,该系统能够实现多个站点间的答疑资源共享。 论文的主要工作如下: 设计搜索a g e n t 。系统通过搜索a g e n t 到其它远端共享资源站点进行知识搜索,经 处理后补充到本地知识库,以解决目前自动答疑系统知识资源不足问题,实现教 育资源共享。 提出采用m o b i l e a g e n t 技术构建m o b i l e a g e n t 环境下多站点之间的自动答疑平台, 实现答疑资源的共享。各站点即相互芡享又相对独立,它们可以根据自己子学科 的特点定义各自站点的查找算法、查找结果的处理方法等,具有相对独立性。 研究并设计基于加权语义的综合相似度计算模型。基于语义树的加权语义相似度 算法和基于词语统计的词频相似度算法各有自己的优缺点,系统将二者结合起来 建立新的计算模型来进行答案的自动搜索。并支持用自然语言表达的简单句、复合 旬与条件句等多种句式进行提问。 研究并在系统中引入m o b i l ea g e n t 技术,用统一的知识结构表示知识,以基于知 识、语义来搜索答案,以达到能够在“信息高速公路”上自动、快速地进行知识 搜索的目标。 通过对比实验和实例证明系统的有效性。 关键字:移动a g e n t ,远程方法调用,自动答疑系统,自然语言处理 丕商太堂亟堂位j 幺塞 丛墅卫盟 a b s t r a c t r e m o t ee d u c a t i o ni san e wt e a c h i n gm e t h o du s i n gm o r d e nc o m m u n i c a t i o nt e c h n o l o g ym c a n s s u c h c 叩哪盯n e t w o r kt e c h n o l o g ya n dm u l t i m e d i at e c h n o l o g ya n de t c g r e a t n e s se d u c a t e s c o u l db l 曲1 1 l 伽g ht r a d i t i o ne d u c a t i o nr e s t r i c ti ne d u c a t i o nr e s o u r c e sa n de d u c a t i o nm e t h o d s t h r o u g hn e t w o r ke d u c a t i o n , a c h i e v e m e n ts h a r ei ne x c e l l e n c ee d u c a t i o nr e s o n r c f sa n de d u c a t i o n m e t h o d sw h i c hh a v i n gn ot i m ea n ds p a c e sr e s t r i c t i o n q u e s t i o na n s w e r i n gi s 锄i m p o r t a n t e d u c a t i o n a la c t i v i t y w i t l lt h ed e v e l o p m e n to fr e m o t ee d u c a t i o n , m o ma n dm o r ea t t e n t i o ni sp a i d t oi t h o w e v e g , o v e rc u r r e n tc i v i lr e m o t ee d u c a t i o ns y s t e m s ,t h el e v e ro fq u e s t i o na n s w e r i n gi s s t i l lf a rf r o ms a t i s f a c t i o n t h i sp a p e rf o c u s e s0 1 1d e s i g n i n ga n di m p l e m e n t i n gar e m o t ee d u c a t i o no r i e n t e dn a t l l r a l l a n g u a g es h a r i n ga m o n gm a n ys i t e sb a s e di n t e l l i g e n tk n o w l e d g er e s o u r c er e s e a r c hs y s t e mi n m o b i l e a g e n te n v i r o n m e n t 1 1 m a i nw o r ko f t h i sp a p e ri s t h ef o l l o w i n g : d e s i g nt h es e a r c ha g e n t n ”s y s t e mr e s o l v e st h ep r o b l e mo fl a c kr e s o u l v * a n s w e r i n g s y s t e m0 1 1m o b i l ea g e n tr e s e a r c h i n g , w h i c hm a l c a si te a s yt os h a l m o u l l a m o n gt h e s i t e s as y s t e mi nm o b i l ea g e n te n v i r o n m e n ti sp r e s e n t e dd u et ot h el a c ko f r a s o n r e ea b o u t t h e q u e s t i o n a n s w e r s y s t e m ,w h i c h i s b a s e d o n m o b i l e a g e n t a n d t h es a n l e k n o w l e d g e s t r u c t u r e d e s i g n e das i m i l a r i t y m a t h e m a t i cm o d e lt oe v a l u a t et h em a t c h i n gl e v e ro ft w o s e n t e n c e s 1 1 * s e m a n t i cs i m i l a r i t yi sp r o p o s e dt oc o m p o s et h ef i n a ls i m i l a r i t ym o d e l a u t oq u e s t i o n a n s w e rs y s t e mi sp r e s e n t e dd u et ot h el a c ko f r e s o u r c ea b o u tt h e q u e s t i o n a n s w e r s y s t e m , w h i c h i s b a s e d o n m o b i l e a g e n t i t i n a k e s i t e a s y t o s h a r e r a s o m c ea m e n g t h es i t e si nm o b i l e a g e n te n v i r o n m e n t v e r i f y t h ee f f e c t o f a l l t h e a r i t h m e t i c p r o p o s e d b y t h i s p a p e r k e y w o r d s : m o b i l e a g e n t , r e m o t em e t h o di n v o c a t i o n , a u t oq u e s t i o n a n s w e r i n gs y s t e m , n a t u r a ll a n g u a g ep r o c e s s ( n l p ) - 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的 学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己 在论文中作了明确的说明并表示了感谢。 研究生签名:孑长叫 日 期:二冱吐- l 东南大学学位论文使用授权说明 东南大学、中国科学技术信息研究所,国家图书馆有权保留本人所送交学位 论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人 电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论 文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文的公布( 包 括刊登) 授权东南大学研究生院办理。 研究生签名:蓟叫 导师签名: 蠢亩太堂亟皇位论塞簋= 重量i 宣 第一章引言 本章首先介绍论文的研究背景及研究现状,接下来指出论文的研究目标,最后介绍论 文的结构及研究内容。 1 1 研究背景和现状 随着社会的发展以及网络的普遍应用远程教学逐渐普及,而自动答疑则是远程教学 活动中的一个重要环节,基于自然语言的自动答疑系统成为人们关注和研究的一个新的答 疑模式,国外在研究英语方面的自动答疑系统有了很大进展,国内由于汉语自身的语言特 点,实现自然语言自动答疑难度很大,近年来远程教育自动答疑系统的研究也取得了一些 进展,但由于种种原因,导致使用起来效果仍然不佳【l 】【2 】。 ( 1 ) 现有的自动答疑系统研究基本上局限于单个站点的研究,也就是答疑资源在本地 获取。对分布式环境下多教育站点问自动答疑系统共享平台的研究很少,使得教育答疑资 源得不到很好共享,造成教育资源的巨大浪费。 ( 2 ) 不同站点的学科答疑资源极不平衡,有的网络教育站点,其中的某些学科答疑资 源较丰富而另一些学科答疑资源却十分匮乏由于各教育站点知识库不能共享,使得各知 识库中的知识十分“单薄”这样,当学生提问问题时,常常会找不到答案或找不到满意的 答案 ( 3 ) 现有的自动答疑系统大都缺乏单独的支撑平台,往往将其作为远程教学平台的一 部分,其功能自然得不能充分发挥,效果不佳 ( 4 ) 现有的自动答疑系统的实现多数是基于关键字匹配,不考虑词语的语义以及词语 问的语义关系,匹配的结果往往含有一些与用户问题无关的答案。而且,多数是把答案来 源定位于i n t e n 谢,针对网络教育特定领域的自动答疑系统的研究也较少 在这种背景下,本文作者收集了大量的国内外资料,根据目前国内外m o b i l ea g e n t 技 术和自动答疑的研究现状,以m o b i l ea g e n t 技术和自动答疑作为结合点展开研究,提出采 用m o b i l ea g e n t 技术构建m o b i l ea g e n t 环境下多站点之间的自动答疑平台,通过知识资源 搜索完成答疑任务并补充和完善本地知识库,实现答疑资源的共享。 a g e n t 的研究起源于人工智能领域,m o b i l ea g e n t 是a g e n t 技术与分布式计算技术相结 合的产物f 3 】,它与传统的c l i e n 【t s e r v e r 、b r o w e r s e r v e r 模型相比,服务器并不需要被动地等 待客户的请求,也不需要在交互过程中始终保持网络连接。因此m o b i ka g e n t 的应用,极 大地降低了系统对网络带宽的依赖,因而很适合于i n t e m e t 这样的分布式开放环境 国外已经有多家公司提供了多种移动a g e n t 平台 4 1 1 5 ,如i b m 的a 一船,g e n e r a lm a g i c 的t e l e s c r i p t 等。但是目前尚未有完全实现其全部功能的移动a g e n t 系统,已实现的系统都 还有待进一步完善。这些平台的升级远远落后于其底层的j a v a 升级,j a v a 提供的诸多强大 实用的新功能没有得到支持,从而在这些平台上进一步开发新系统也相应地受到限制 6 。 远程教育中的问答系统有很大的专业性,对它建立一个专用的移动平台在效率和灵活度方 面都有很大的帮助如果结合移动a g e n t 技术,可以在独立性和多样性等方面提高自动答 疑系统的性能。 苤直太兰亟望位i 金奎簋= 重量i 矗 1 2 研究内容和目标 m o b i l e a g e n t 环境下的自动答疑系统( a u t oq u e s t i o n a n s w e r i n gs y s t e mi nm o b i l e a g e n t e n v i r o n m e n t 简称q a m a ) 是以m o b i l e a g e n t 技术和自动答疑作为结合点进行研究,构建独 立的分布式环境下多教育站点间自动答疑系统平台,进行答案的自动搜索,在“信息高速 公路”中实现教育答疑资源共享。下面是论文的研究目标: 1 ) 系统通过搜索a g e n t 到其它远端共享资源站点进行答案的搜索,在返回答案给用户 的同时也将答案补充到本地知识库,以解决目前自动答疑系统知识资源不足问题, 实现共享教育资源的目标。这是本系统不同于其它自动答疑系统的重要特点。 力系统采用基于加权语义的综合相似度算法来进行答案的搜索,能够接受用自然语言 表达的简单句、复合句与条件句等多种句式,并返回与用户闯题相似的答案,拥有 很高的答案查全率和准确率。 3 1 系统采用m o b i l e a g e n t 技术构建m o b i l e a g e n t 环境下多站点之问的自动答疑平台, 各站点既相互共享又相对独立,它们能够相对独立地维护自己的子系统。 4 ) 各个站点的服务器上安装了q a m a 系统后,这些站点用统一的知识结构表示知识, 以基于知识、语义来搜索答案;系统能够自动,快速地进行知识资源搜索 1 3 论文的组织结构 论文的组织结构如下: 第一章“引言”,首先介绍论文的研究背景和现状;接下来给出论文的研究内容和目标; 最后介绍论文的组织结构。 第二章。m o b i l ea g e n t 和相似度计算模型的相关知识”,首先介绍g o b il ea g e n t 系统概要 及其研究现状:进而介绍m o b i l ea g e n t 系统的标准化问题及其体系结构;最后介绍 相似度计算模型的相关知识。 第三章“q a m a 原型系统的功能、体系结构与实现策略0 介绍q 姒原型系统的功能需求 和体系结构;然后分析原型系统的实现策略。 第四章。q a m a 原型系统的详细设计与实现”,首先,分析q a 姒原犁系统中几个关键问题 的设计与实现,包括m o b il ea g e n t 的运行环境( 1 l a e ) 及对象迁移机制、q a m a 原型系 统中m o b i l ea g e n t 的通信方式与路由策略、基于加权语义的综合相似度计算模型 等;然后,讨论q a 姒原型系统中各功能模块的详细设计与实现 第五章“q a 姒原型系统的性能分析”。讨论问答系统的性能评估方法;然后介绍为验证算 法正确性所做的两组对比实验:最后对原型系统的性能进行评价分析。 第六章“总结与展望”,首先对论文的主要j 二作加以总结;按下来展望论文的下一步主要 工作。 论文的最后,是“主要参考文献”以及作者在论文写作期间的“论文发表情况” 一2 - 丕蘑古堂硒堂位论塞筮三重m q 鲤蛔塑扫赵厦盐差燕型殴担羞翅迟 第二章m o b i l ea g e n t 和相似度计算模型的相关知识 本章首先介绍m o b i l e a g e n t 系统概要;再介绍m o b i l e a g e n t 的研究现状;接下来论述 m o b i l e a g e n t 系统的标准化问题及其体系结构;最后介绍相似度计算模型的相关知识。 2 1m o b il e & g e n t 系统概要 二十世纪七十年代后期,从事分布式人工智能( d a i ) 和计算机科学的研究人员开始对 a g e n t 进行研究。随着计算机网络、计算机通信技术的发展,对于a g e n t 的研究己成为分布 式人工智能领域的一个热点,使其成为一个迅速发展的领域。对于软件a g e n t ,没有明确的 定义,可以简单地说,它是一段具有自主性能的软件实体。a g e n t 应具备的基本特性包括了 自治性( a u t o n o m y ) 、社会性( s o c i a l a b i l i t y ) ,反应能力( r e a c t i v i t y ) ,自发行为( p r o - a c t i v i t y ) 、 移动性( m o v e m e n t ) 阴。 对于m o b i l e a g e n t 的定义,不同的文献或应用系统各不相同。一般地,对m o b i l e a g e n t 的理解,我们认为【8 1 :m o b i l e a g e n t 是一类特殊的软件a g e n t ,它可以自主地在异构的网络 上按照一定的规程移动,寻找合适的计算资源、信息资源或软件资源,利用与这些资源处 于同一主机或网络的优势,就近处理或使用这些资源,从而代表用户完成特定的任务。 m o b i l e a g e 嗽钧移动性、自主性、反应性、主动性和交互性使锝它在许多领域中,特别 是i n t e m e t 领域中的各种应用显示了其强大的优势。它具备的基本特性如下f 8 】【9 1 : 降低网结负载,克服网络延迟m o b i l e a g e m 的本质是将计算移动到数据端,直接在数 据端进行本地处理,只返回最终结果,从而避免了大量中间数据在通信两端的传输。这一 特性也概括了m o b i l e a g e n t 的分布式计算的特点。同时,m o b i l e a g e n t 一次可以携带多个服 务请求移动到服务器端进行本地调用,避免了多次远程调用。 封装网络协议随着l m e m e t 的发展,新的协议和数据格式不断产生,通常会有一方希 望对协议进行升级,这就需要对应用进行大量改动,这对原有系统而言,很难实现。而对 于利用m o b i l ea g e n t 技术开发的应用系统,由于在m o b i l ea g e n t 系统中封装了低层网络协 议,开发人员无须了解低层实现即可开发网络应用,在协议修改时,只需修改m o b i l e a g e n t 系统中相关的功能实现,而无须修改m o b i l e a g e n t 应用程序 支持异步自主执行使用m o b i l ea g e n t 技术,用户可以将整个任务而不是单个请求提 交给多个a g e n t 去执行,在提交了请求之后,移动设备可以断开与网络的连接,这些a g e n t 被发送到网上之后,可以独立于发送它们的客户端,异步、自主、协作地完成任务,移动 设备则可以在这之后再连接上网络,收回a g e n t ,取得服务结果。 具有动态适应性m o b i l e a g e n t 具有感知运行环境和对其变化做出自主、快速反应的能 力。多个a g e n t 可以拥有在网络上各主机间合理分布的能力,使整个系统始终保持在最优 配置状态。 健壮性和窖错能力m o b i l e a g e n t 支持离线计算,这大大降低了网络应用对网络连接可 靠性的要求。m o b i l e a g e n t 的反应性使之能及时感知网络节点的失效,其自主性可以使它能 自主地处理并修正错误,更容易建立容错能力强的分布式系统。 一3 一 苤直太堂亟堂位监窑基三重丛垒坠地g 塑l 塑搁丝麈让差燕型曲担羞翅识 2 2m o b il ea g e n t 的研究现状 自从1 9 9 4 年第一个商业化的m o b i l e a g e n t 系统t e l e s c r i p t 【1o 】( 由g e n e r a lm a g i c 公司推 出) 问世以来,m o b i l e a g e n t 技术就受到了学术界、工业界的广泛关注。众多著名的大学、 研究机构和公司都投入到对m o b i l e a g e n t 的研究和开发中来。 对m o b i l ea g e n t 技术应用的研究,着重是m o b i l ea g e n t 技术在各个方面的应用。例如 在电子商务、网络管理、信息检索、移动计算、工作流管理、计算机协同工作、并行处理 等领域中m o b i l e a g e n t 的应用。 目前m o b i | e a g e n t 系统的实现技术已从过去的理论探索进入到实用阶段。近十多年来, 在较短的时间内出现了一批实验性和商品化的m o b i l ea g e n t 的开发系统和执行环境,对于 这些系统或执行环境,大致可以分为三类:一类是基于j a v a 语言的;一类是基于传统解释 性语言的;另一类是基于c o r b a 平台的。 旭i e t 的实现技术由i b m 东京研究中心研制,是最早基于j a v a 的商业化m o b i l e a g e n t 系统【1 1 】。a g l d 系统采用图形化界面,提供了一个简单,全面的m o b i l ea g e n t 编程模型, 并为a g e n t 间提供了动态和有效的通信机制和详细的安全机制。a d e t 的系统框架如图2 1 所示,一个a 9 1 e t ( 在a g l e t 中,将一个a g e n t 称为a g j e t ) 是一个执行实例,它的迁移过程 如下:首先一个a 酉e t 对a g l e tr u n t i m e 层发出请求,a o e tr t m t i m e 层负责将a g j e t 的代码 与状态进行序列化处理,转换为字节数组,并将字节数组传送给a t c i ( a g e n t 传输通信接口) , 在a t c i 层提供了a t p ( a g e n t 传输协议) 、r m i ( 远程方法调用) 等接口。之后,系统会在 相应字节数组后附加上相关系统信息和a g l e t 的标识信息,以比特流方式通过网络传输给远 端机器。远端机器再重用a t c i 层提供的a t p 接口接收传来的字节数组,再由a g t e t r u n t i m e 层对字节数组反序列化,取出a g l e t 的代码及状态,在远端机器执行。 图2 1a g j e t 系统框架图 a g i e t 的迁移采用弱迁移( 不能保存当前执行的状态栈的内容) 方式,这受到j a v a 开发 语言的一定限制( 标准的j a v a 虚拟机不支持到线程状态的捕获) a g l e t 采用消息对象 ( m e s s a g e ) 封装a g t e t 之间的消息交换,消息传递机制支持同步和异步两种方式。目前的 a 翊e t 由于j d k 安全支持的力度不够,并没有完全实现a g e n t 的认证,授权,审计与防抵赖 以及数据完整性,但是已经提供了一个可以容忍( r e a s o n a b l e ) 的安全层次,并且随着j d k 安全的发展而不断得到改善。 t o i z $ o r i p t 的实现技术t e l e s c r i p t 是用t e l e s c r i p t 语言( 一种面向对象的解释型语言) 来完成的,g e n e r a l m a g i c 公司用t e l e s c r i p t 开发了第一个商业化的m o b i l e a g e n t 系统并用该 语言命名【1 2 l 。t e l e s c r i p t 系统中,a g e n t 实现了强迁移机制( 包括了代码、数据、执行状态) , a g e n t 之间的通信有两种方式:当两个a g e n t 运行在同一环境中,可以互相调用对方的方法; 对象运行在不同空间的时候,通过建立连接,互相传递对象。 正 盔亩太坐亟堂位监童星三重丛q 鲤趔麴趋型匿盐凳搓型艘担羞翅蛆 t e l e s c r i p t 是一个功能较为完备的移动a g e n t 系统,其缺点是资源消耗比较大,此外, t e l e s c f i p t 语言过于专用,这极大的限制了t e l e s c r i p t 系统应用范围,随着j a v a 语言的出现以 及跨平台特性的完善,限制了t e l e s c r i p t 系统的发展。g e n e r a l m a g i c 公司重新开发了基于j a v a 的m o b i l ea g e n t 系统o d y s s e y 。o d y s s e y 完全继承了t e l e s c r i p t 的概念,并扩展了通信机 制,提供了对j a v ar m i 、c o r b ah o p 和m i c r e s o f ld c o m 的支持。 g r a s s h o p p e r 的实现技术g r a s s h o p e r 是i k v + + 公司的产品。它是一种基于c o r b a 的 m o b i l e a g e n t 系统。g r a s s h o p e r 的通信基础设计非常巧妙,既可以通过c o r b a 来进行通信, 还可以通过j a v a 砌m 和s o c k e t 连接进行通信,整个通信结构实现采用插件技术,具有很好 的扩充性,并同时支持异步或同步的通信,动态消息机制和多点发送g r a s s h o p e r 的安全服 务采用x 5 0 9 证书实现身份认证,采用s s l 来保证传输中的安全性,通过用户定制的安全 管理器来完成资源访问控制,并实现了数字签名功能【8 】。 2 3m o b il ea g e n t 系统的标准化 与m o b i l e a g e n t 技术研究相关的各研究机构和企业,为了加快m o b i l e a g e n t 技术与应 用的发展,形成了一些标准化组织,旨在为不同的制造商开发的a g e n t 系统提供互操作支 持,并为未来的a g e n t 系统开发建立一个公共的规范。目前最有影响力的m o b i l e a g e n t 系 统规范有m a s i f 和f i p a 。 m a s i f m a s i f ( m o b i l ea g e n ts y s t e mi n t e r o p e r a b i l i t yf a c i l i t i e s ) 0 3 是o m g 组织制 定的m o b i l ea g e n t 系统规范,该规范于1 9 9 8 年3 月正式推出,旨为解决不同厂商间a g e n t 系统的互操作性。m a s i f 首先规定了通用概念模型,基本涵盖了现有移动a g e n t 系统的所 有主要抽象数据,定义了固定a g e n t 、移动a g e n t 、a g e n t 状态、a g e n t 授权者、a g e n t 名字、 a g e n t 环境、定位地址、区域等一系列概念。m a s i f 规范中建议对a g e n t 管理、跟踪、迁 移以及与一些服务的集成进行标准化,具体包括: a g e n t 管理:包括a g e n t 创建,终止、挂起、恢复执行等标准化方法。 a g e n t 跟踪:分布式环境中a g e n t 的定位 a g e n t 迁移:a g e n t 在网络中的迁移,规定了a g e n t 迁移前和迁移后的动作。 a g e n t 与a g e n t 系统的命名:a g e n t 以及a g e n t 系统中语法和语义的标准化,提供产生 惟一标识符的机制。 a g e n t 系统类型及位置语法:a g e n t 系统类型的标准化主要是提供a g e n t 系统的一些信 息,使目的a g e n t 系统判断是否支持此系统;位置语法的标准化主要为了使不同的a g e n t 系统可以有效定位对方。 a g e n t 系统与其它系统的集成;包括了a g e n t 系统与通用c o r b a 服务的集成标准化。 此外,m a s i f 定义了两个标准构架:m a f f i n d e r 和m a f a g e n t s y s t e m ,通过接口定义 语言( 1 d l ) 对它们属性、操作和返回值进行了明确的规定m a f f i n d e r 是一种名字服务, 负责a g e n t 系统的注册、注销、查询等服务。m a f a g e n t s y s t e m 接口具体负责a g e n t 的接收、 获得a g e n t 状态、获得m a f f i n d e l 接口,列出a g e n t 等功能。 f i p a f i p a ( f o u n d a t i o n f o r i n t e l l i g e n t p h y s i c a l a g e n t s ) 是由多个国家的活跃于a g e n t 领域的大学和公司组成的非盈利性组织,目的是促进a g e n t 技术的发展,制定国际性的规 范,最大限度的使基于a g e n t 的各种应用得以有机地结合。f i p a 规范从不同方面规定或建 议了a g e n t 在体系结构、通信、移动、知识表达、管理和安全等方面的内容,对于a g e n t 技术起到了很大的推动,其中a g e n t 管理,a c l ( a g e n tc o m m u n i c a t i o n1 a m g u a g e ) ,a g e n t 安全管理和a g e n t 移动管理【1 4 】与移动技术关系较紧密。 a g e n t 管理:制定了一个标准性框架,与f i p a 相兼容的a g e m 在此框架下可以存在、 5 一 丕直太望亟雯位i 幺奎差三重丛业韭g 匹塑扫1 丛崖让簋攥型的扫羞翅识 运行和被管理。与m a s i f 较相似,该部分定义了标准的开放式接口和管理服务,同时也规 定了a g e n t 管理本体和a g e n t 平台消息传输。 a c l 管理:通过定义a c l 实现功能和语义的互操作。a c l 是基于语言行为为理论, 消息被视为行为或通信行为,它们被发送去执行某种动作。a c l 定义了消息类型和对语言 的描述。基于模态逻辑,通信行为被表述成叙述性表格和形式化语义。 a g e n t 安全管理:分析了在a g e n t 管理中关键安全危险,并提出了在f i p a 兼容的环境 中如何维护a g e n t 间的安全通信。包括a g e n t 注册、交互、配置、a g e n t 平台间交互,用户 与a g e n t 问的交互和a g e n t 移动时的安全管理。 a g e n t 移动管理:提出了在f i p a 环境中支持软件a g e n t 移动的标准框架,此框架包含 了所需的最基本的技术。 2 4i i o b ii ea g e n t 系统的体系结构 不同的m o b i l ea g e n t 系统的体系结构各不相同,但几乎所有的m o b i l ea g e n t 系统都包 括如下两部分:a g e n t 和m o b i l ea g e n t 环境( m a e ) 。如图2 3 所示。在m o b i l ea g e n t 系统 中,m a e 为a g e n t 提供安全、正确的运行环境,实现a g e n t 的移动、m o b i l ea g e n t 执行状 态的建立、m o b i l e a g e n t 的启动、实施m a 的约束机制、容错策略、安全控制、通信机制。 一台主机上可以有一个或多个m a e 通常情况下,一个m a e 只位于一台主机上【8 】。 图2 3 m o b i l ea g e n t 系统构成 a g e n t 可以分为m o b i l e a g e n t ( 也称移动a g e n t 、用户a g e n t 、u s e r a g e n t ) 和服务a g e n t ( 也称系统a g e n t 、s y s t e m a g e n t 、静态a g e n t 、s t a t i c a g e n t ) 两种。m o b i l e a g e n t 可以从一 个m a e 移动到另一个m a e ,在m a e 中执行,并通过通信机制与其他m a 通信或访问m a e 提供的服务m o b i l ea g e n t 的移动和任务求解能力很大程度上决定于服务设施所提供的服 务。服务a g e n t 不具有移动的能力,其主要功能是向本地的a g e n t 或来访的a g e n t 提供服务。 通常,个m a e 上会有多个服务a g e n t ,分别提供不同的服务,如文件服务等系统级服务, 预订服务、数据库服务等应用级服务。m a e 为a g e n t 提供基本的服务( 创建,传输、执行、 挂起等) ,一般来说,这些服务应包括以下内容: 生命周期服务:实现a g e n t 的创建、移动、存储、消亡和执行环境的分配。 事件服务:包括a g e n t 传输协议和a g e n t 的通信协议,实现a g e n t 间事件传递与交互。 目录服务:提供定位a g e n t 的信息,形成路由选择。 安全服务:提供安全的a g e n t 执行环境,保证a g e n t 以及a g e n t 系统不受攻击。 应用服务:能在生命周期服务基础上提供面向特定任务的服务接口。 6 一 壅厦太堂亟主兰位论奎簋三童丛业韭趔捆擅丝崖让墨搓型的扫羞翅堡 2 5 相似度计算模型 前面几节,对m o b i l ea g e n t 系统概要、研究现状、标准化问题以及体系结构做了简要 介绍。本节将首先说明“向量空间模型”的含义:进而介绍“词语权重”和“句子向量模 型”等方面内容;最后讨论有关“相似度”和“语义相似度”知识。 2 5 1 向量空间模型 向量空间模型( v e c t o r s p a c e m o d e l ) 是目前信息检索最常用的数学模型之- - 1 5 ,其基 本思想是将用户问题和知识库中的候选答案中心句分别用向量表示,然后计算向量间的相 似度,再将相似度的计算结果排序,把排在最前面的几个候选答案返回给用户。 一个语句通常由多个词语组成,但是每个词语在句子中的分量( 重要性) 是不一样的, 为了快速准确的找到答案。必然要给这些词语赋予不一样的权值,以体现这种差别。我们 称之为词语的权重( w e i g h t ) 要分析用自然语言表达的句子之间的相似程度,需要用一种数学模型来表示它。为此, 定义下面的模型来表示一个句子a : a = ( x 1 x 1 , x 2 x 2 , x 3 x 3 ) 其中,x l 、x 2 、x 3 分别是从句子a 中提取的词语。x l 、) 2 、】3 分别表示x l 、x 2 、 x 3 的权重。x l 、x 2 、x 3 的顺序按它们的编号大小排列,而与在句子中出现的先后次序无 关,这就是句子的向量模型 向量的维数由句子中可提取的关键词语的个数决定。 2 5 2 相似度 问答系统的核心计算模块是问题句子与答案中心句之间的匹配计算模块。向量空间模 型中用“相关度( r e l e v a n c e ) ”这个量来表示问题句子与答案中心句的匹配程度,也有文献 用“相似度( s i m i l a r i t y ) ”。在本文中选择用“相似度”这个词。 对于问答系统来说,“句子之问的语义相似度”主要是反映用户问题与知识库中答案中 心句在意义上的符合程度在本文中,如果把词语的权重考虑到句子之间的语义相似度中 去,那么,称之为“句子之间的加权语义相似度”而“句子之间的词频相似度”是指,不 考虑词与词的关系,也不考虑语义扩充,单纯地根据句子里字面上的词语计算句子与句子 之间的相似度。本文中的相似度计算模型,则综合考虑了以上两种类型的相似度,称为“基 于加权语义的综合相似度”。 。综合相似度”把句子之间的语义相似度和词频相似度适当地组合,充分地发挥了它 们的优点,从而获得晟佳的系统性能。语义相似度又分为词语之间的语义相似度和句子之 间的加权语义相似度两种类型。 在4 1 5 节将对“基于加权语义的综合相似度计算模型”傲详细介绍。 - 7 丕崮盘堂亟主堂焦监塞箍三里q 丛丛厘型丕蕴的功毖置耋:链丕结拽皇塞强筮登 第三章q a m a 原型系统的功能需求、体系结构与实现策略 前面一章,对m o b i l e a g e n t 和相似度计算模型的相关知识做了介绍,包括m o b i l e a g e n t 系统的标准化问题、m o b i l e a g e n t 系统的体系结构以及相似度计算模型的相关知识。本章将 先介绍q a m a 原型系统的功能需求;再对q a m a 原型系统的工作机制进行讨论;接下来 给出原型系统的模块组成及模块框图;最后介绍系统的实现策略 3 1o a 卧原型系统的功能需求 论文是研究m o b i l ea g e n t 环境下的知识搜索问题,主要是面向远程教育领域,因此, 有其特殊性。首先,知识来源是有限的若干个知识库,是一个个具体学科的问题及答案, 而不是整个i n t e r n e | ;其次,每个站点有其相对独立性,有自己的一套完整独特的查询方案。 用户在浏览器端用自然语言提问问题,q a m a 系统接收用户的问题,从本站点或远端共享 资源站点搜索用户问题解答,并将最相关的答案返回给用户,同时将搜索到的问题解答补 充到本地站点知识库。 因此,q a m a 系统应具有如下功能需求: 1 ) 在基于m o b i l e a g e n t 的分布式环境下工作,有效地支持m o b i l e a g e n t 的迁移以及在目 的地动态类装载后的执行。 2 ) 支持m o b i l e a g e n t 某种命名机制和通信方式,支持m o b i l e a g e n t 以某种路由策略和访 问路径自适应机制在系统平台的有限个共享站点间移动。 3 ) 能够实现系统平台的多个站点之间的知识资源共享。在远程教育教学里,学生问题答 疑是关键的一环,而知识库的建立却是费时间、费精力的事情,系统应支持有限个远 程站点的知识库共享。 4 ) 支持用户用基于自然语言的简单旬、复合句与条件句等多种句式进行提问,使用基于 加权语义的综合相似度算法来进行答案搜索,有较高的答案查全率和准确率。 5 )原犁系统各共享站点用统一的组织结构形式来构建自己的知识库,在保持知识库良好 的基础上,能够方便地进行各自的领域知识的维护。 6 ) 系统中引入m o b i l e a g e n t 技术,构建m o b i l e a g e n t 环境下多站点问分布式自动答疑平 台,各站点即相互共享又相对独立。这些站点可以相对独立地维护自己的子系统,它 们可以根据自己子学科的特点定义各自的查找算法、查找结果的处理方法等,具有相 对独立性。 - 8 - 丕亩盍堂硒堂焦j 盆塞差三重q 丛i 蕴型丕蕴殴功能置塞! 佳丕缝翅生塞理董略 3 2o a 姒原型系统的体系结构 前面一节,对q a m a 原型系统的功能需求进行了分析讨论。本节将首先结合q a m a 系统的总体框图介绍原型系统的工作机制;接下来给出原型系统平台部分的模块组成及框 图和知识搜索部分的模块组成及框图;同时,对q a m a 原型系统的模块组成进行分析讨论。 3 2 1 卧卧原型系统工作机制 q a m a 原型系统采用b r o w s e r s e r v e r 工作模式。用户通过浏览器提问问题并获得问题 解答。图3 1 是整个原型系统平台的总体框图。 前端是用户与系统连接并可直接提问问题的站点服务器,远端是事先约定好的并可以 进行资源共享的有限个站点服务器。用户通过浏览器,用自然语言向前端站点服务器提问 某具体学科的问题,前端服务器通过其中的分词模块对自然语言进行处理后,首先在本地 查找答案;若没有查找到,则派遣搜索a g e n t 移动到远端有限个共享站点服务器依次进行 查找,直到找到为止,并将查找到的答案返回到本地站点的管理a g e n t ,由管理a g e n t 返回 给用户,并补充本地知识库,以丰富本地资源。若搜索a g e n t 在以上均未找到答案,管理 a g e n t 将用户问题转发给人工处理模块,由人工解答并补充知识库。 远靖共享站点服务器部分 远端围 注:m a e 为移动a g t m ! 的运行环境 图3 1q a m a 原型系统平台的总体框图 9 - 丕直盍生亟芏焦监塞苤三童q 丛i 丝型丕筮艘功能孟塞! 佳丕绮翅生塞理筮虽 3 2 2 姒姒原型系统的模块组成及框图 从原型系统的实现机制来看,整个原型系统由两大部分组成:q a m a 系统平台部分和 知识搜索部分。而从原型系统的工作机制来看,整个原型系统主要由四大部分组成:用户 端部分,前端站点服务器部分,远端共享站点服务器部分,知识搜索部分,其中前三个部 分属于m o b i l e a g e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论