(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf_第1页
(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf_第2页
(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf_第3页
(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf_第4页
(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机科学与技术专业论文)基于agent的网上答疑系统研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院学位论文 摘要 计算机和网络的发展与普及,使得基于网络的远程教育越来越受关注它融合了现代 教育教学思想、教学模式和教学系统,实现了教学模式的转变,克服了传统教育的时间和 空间限制,使得原本分散的教学资源融为一体。答疑作为教育活动的一个必不可少的环节, 是网络教育系统中的一个重要模块,它综合运用自然语言处理、信息检索等技术,对用自 然语言描述的问题,自动生成简洁、准确的答案;但在现阶段答疑系统存在着智能性差, 师生交互手段单一等问题 本文引入a g e n t 概念,利用现有自然语言处理技术,构建了基于a g e n t 的智能的网上 答疑系统模型,克服了现阶段网络答疑系统中的某些局限和不足,并构造了一个基于a g e n t 技术的网上答疑系统在该系统中,a g e n t 的智能性、自主性、交互性和可移动性等优点, 增强了系统的智能化,个性化,从而便于创造良好的学习环境,改善教学效果 本文所做工作可归纳为以下几个方面: 1 构建了基于a g e n t 的智能的网上答疑系统模型,在该模型中将每个用户都视为一 个a g e n t ,分布在网络的各个节点上,系统由用户a g e n t ,问题检索a g e n t ,用户 模型a g e n t 等a g e n t 和知识库、用户模型库、词典和用户信息库等数据库组成, 各a g e n t 协同工作,实现自主联合答疑,提高了动态实时交互性; 2 对各种常用的汉语分词、歧义分析、问题和答案的相关度计算方法进行了分析, 总结了各算法的优缺点,提出了一种改进的汉语分词、歧义处理算法,该算法能 提高汉语处理速度和歧义分析能力; 3 提出并实现了a g e n t 之间一种简单的基于f i p a - a c l 语言的通信机制; 4 根据系统的实际需要和a g e n t 的特点,制定了本系统的安全机制; 5 利用i b m - a g l e t 平台,开发了大学计算机文化基础课网上答疑实验系统 本文所构建的答疑系统具有智能性、协同性本文在提高网络教育智能化方面所做的 探索和研究,为全面推进基于网络的教学积累了一定的经验。 关键词:网络,远程教育,智能答疑,答疑系统,a g e n t ,自然语言,分词 国防科学技术大学研究生院学位论文 1 1 r e m o t ee d u c a t i o nb a s e do nn e t w o r kg e t sm o l ea n dm o l ec o n c e n t r a t i o na sn o v e l e d u c a t i o n a lf a s h i o nd u et ot h ed e v e l o p m e n ta n ds p r e a do fc o m p u t e rs c i e n c ea n dn e t w o r k q u e s t i o na n s w e r i n g ( q a ) t a k e sa ni m p o r t a n tm o d u l ei nt h en e t w o r ke d u c a t i o ns y s t e m , a n di ti s r e g a r d e da sa l le s s e n t i a ll i n ki ne d u c a t l o n a la c t i v i t i e s i tc o m b i n e sn a t u r a ll a n g u a g ep r o c e s s i n g t e c h n o l o g yw i t hi n f o r m a t i o ni n s p e c t i o nt e c h n o l o g yt oa n s w c tq u e s t i o n sd e s c r i b e di nn a r l r a l l a n g u a g ea u t o m a t i c a l l y , c o n c i s e l ya n da c c u r a t e l y h o w e v c l , t h e r ea r es o m ec o m l n o n f a u l t ss u c h a sl i 础i n t e l l i g e n c e b a l di n t e r a c t i v em e t h o d sb e t w e e nt e a c h e r sa n ds t u d e n t si nt h ee x i s t i n gq a s y s t e m s i nt h i sp a p e r , t h es h o r t c o m i n g sa b o v ea r eo v e r c o m eb yc o n s t r u c t i n gam o d e lo fi n t e l l i g e n t o n l i n eq as y s t e mb a s e do na g e n tu s i n gs o m ec x i a i n gn a t u r a ll a n g u a g ep r o c e s s i n gt e c h n o l o g i e s a n dw eg e tal o to fa d v a n t a g e sf r o ma g e n ts u c ha si n t e l l i g e n c e , i n d e p e n d e n c y , i n t e r a c t i o n , a n d m o b i l i t yi nt h i sq as y s t e m i ti n t e n d st oc r e a t i n ga ne x c e l l e n ts t u d ye n v i r o n m e n ta n de n h a n c i n g t h et e a c h i n ge f f e c t 1 1 1 ec o n t r i b u t i o n so f t h i sp a p e ra r e 豳f o l l o w s : 1 am o d e lo f a g e n t - b a s e di n t e l l i g e n to n l i n eq as y s t e mi sc o n s 栅c t e d , i nw h i c he a c hu s e r i sr e g a r d e d 越a l la g e md i s u i b u t e do nn o d e si nn e t w o r k t h i ss y s t e mc o m p o s e so f k n o w l e d g eb a s e , u s e rm o d e ld a t a b a s e ,d i c t i o n a r y ,u s e ri n f o r m a t i o nd a t a b a s ea n dv a r i o u s a g e n t si n c l u d i n gu s e ra g e n t , q u e s t i o nr e t r i e v a la g e n t , a n db s e rm o d e la g e n t , a n da l l t h e s e a g e n t sc o o p e r a t e w i t he a c ho t h e r i ti s c a p a b l e o fa n s w e r i n gq u e s t i o i l s i n d e p e n d e n t l ya n d j o i n d y , a n di m p r o v i n g t h ed y n a m i cr e a l - t i m ei n t e r a c t i o n 2 a l g o r i t h m sa r ea n a l y s e d , w h i c ha r ei nc o m m o n u s eo fc h i n e s ew o r dd i v i d i n g , a m b i g u i t y a n a l y s i s ,c o r r e l a t i o na n a l y s i s f o rq u e s t i o n sv s a n s w e l - s a ni m p r o v e da l g o r i t h mo f c h i n e s ew o r dd i v i d i n ga n da m b i g u i t yp r o c e s s i n gi sp r e s e n t e d , w h i c ha r ea b l et op r o c e s s c h i n e s em o r eq m c h ya n dt oa n a l y s e sa m b i g u i t ym o l ee f f i c i e n t l y 3 as i m p l ef u n c t i o no fc o m m u n i c a t i o nb 胤嘲a g e n t si sp r o p o s e da n dc a r r i e do u tb a s e d o nf i p a a c l l a n g u a g e 4 an e c e s s a r ys e c u r i t ym e c h a n i s mf o rt h eo n l i n eq as y s t e mi sm a d ea c c o r d i n gt ot h e a c t u a ln e e d s o f t h es y s t e ma n dt h ef e a t u r e so f t h ea g e n ti ni t 5 a no n l i n eq as y s t e mf o rc o l l e g ec o m p u t e rc u l t u r eb a s ec o u r s ei sd e v e l o p e db a s e do n t h em o d e lt o g e t h e rw i t ht h ei b m a g l e tp l a t f o r m i nt h i sp a p e r , t h eo n l i n eq as y s t e mh a v et h ea d v a n t a g e so fi n t e l l i g e n c ea n dc o o r d i n a t i o n n l cr e s e a r c h0 1 1i m p r o v i n gt h ei n t e l l i g e n c eo fr e m o t ee d u c a t i o ni nt h i sp a p e ra c c u m u l a t e sal o t e x p e r i e n c ef o rg e n e r a l l ye n h a n c i n gt h ep r o d u c t i o no f r e m o t ee d u c a t i o n - k e y w o r d s :n e t w o r k ,r e m o t ee d u c a t i o n ,i n t e l l i g e n ta n s w e r ,q u e s t i o na n s w e r i n g s y s t e m ta g e n t ,n a t u r a ll a n g u a g e ,w o r dd i v i d i n g i i 国防科学技术大学研究生院学位论文 图目录 图2 - 1a g e n t 的特性9 图2 - 2 混合型体系结构i l o 图2 - 3a t p 的示意图1 3 图2 - 4a g l e t 的对象模型1 5 图2 - 5a g l e t 基本通信模型1 5 图3 - i 系统框架图1 9 图3 - 2 系统流程图2 1 图3 - 3 1 管理a g e n t 结构图2 3 图3 - 4 登录a g e n t 结构图2 3 图3 5 用户个性a g e n t 结构图2 4 图4 - i 知识库组织方式2 7 图4 - 2 向量空间模型3 5 图4 3 语义处理过程3 6 图5 - i 系统管理界面4 3 图5 2 知识前测界面4 4 图5 3 用户提问界面4 5 图5 - 4 系统的回复界面4 5 图5 5 用户管理界面4 6 国防科学技术大学研究生院学位论文 表目录 表4 一l 知识库结构2 8 表4 - 2 知识库字段形式2 8 表4 - 3 问句类型表3 2 表4 - 4 关键词列表结构3 3 表4 _ 5 词表结构3 3 表4 _ 6 系统消息类型表3 8 v 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意 学位论文题目 学位论文作者 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留,使用学位论文的规定本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印,缩印或扫描等复制手段保存汇编学位论文 ( 保密学位论文在解密后适用本授权书) 学位论文题目 学位论文作者 作者指导教师 国防科学技术大学研究生院学位论文 第一章绪论 1 1 研究背景及意义 近几年来,计算机、多媒体等高新技术的迅猛发展,标志着人类已经进入了信息社会, 信息社会对人才的培养以及教育提出了许多新的要求。培养的人才要具有“信息能力”、。创 新能力”;对劳动力能进行终身教育与培训等基于i n t e r n e t 的网络教学能很好她满足信 息社会对人才培养与教育提出的这些新的要求,而i n t e r n e t 的应用普及为教育的发展提 供了新的契机和新的手段,它融合了现代教育教学思想、教学模式和教学系统,实现了教 学模式的转变,克服了传统教育的时间和空间限制,使得原本分散的教学资源融为一体。 网络教育作为一种全新的教学方式越来越受到人们的重视 基于网络的远程教育是以i n t e r n e t 网络为基础的新的教育方式。它以网络作为传输 信息的载体,是网络和多媒体技术相结合的一种新型的教育技术,它打破了传统教育的时 空限制、地域限制,提供了便捷的学习方式,使学习者可以按照自己的学习计划在网上学 习,能更充分利用网上丰富的资源,所以基于网络的远程教育将是未来教育的一个发展方 向;在整个远程教育教学过程中除了课堂教学之外,学生的自主学习占了相当大的比例, 要完成自主学习的功能就必须有相应繁荣支撑系统来完善远程教学的各个环节,增强学生 自主学习的效果。这些系统包括:课件制作工具,师生交流系统、智能答疑系统、网上作 业系统、网上考试系统等子系统。 由于地理位置上的离散,当学生遇到疑难问题时需要网络教学系统给以及时的答疑和 帮助,消除学生自主学习中的障碍,网络答疑就成了网络教学系统的重要组成部分之一, 同时也是实现学生自主学习的一个重要途径。网络答疑它综合运用自然语言处理,信息检 索等技术,对用自然语言描述的问题,自动生成简洁、准确的答案。 本文讨论的是基于a g e n t 酬”的网上智能答疑系统,它是网络教育的一个重要组成模 块。在传统的教学模式中,所谓答疑就是学生问、教师答,是师生面对面的交流,有效的 学习知识必须有学生和教师之间的交流,答疑是教学中的一个重要环节;而伴随着信息技 术的发展和广泛应用,新的答疑模式必将代替传统的模式,学生可以不受时空、地域的限 制,随时随地的提问,接受答案,给人们提供了很大的便利;但在网络环境中,教师不可 能时刻在线解答,不可能随时回答学生的问题,因此如何能让计算机自动解答学生的提问, 提高答疑系统的智能性将成为目前网络教育系统的一个研究重点。本文作者作为一位大学 教师就有切身的体会,每次上机辅导的时候,学生会提大量的问题,但是老师只有一位, 所以答疑速度比较慢;而且学生提的问题有可能有重复的,那么老师就要重复的解答,所 以研发一个智能化的自动答疑系统可以利用网上传递信息的方便,减轻老师在传递信息方 第1 页 国防科学技术大学研究生院学位论文 面的压力,投入到协助学生进行分析、综合、提升方面,提高学生的素质:经过对本校学 生的调查,学生本身对智能型的答疑系统也非常期待;目前国内也出现了一些答疑系统, 但在现阶段答疑系统存在着智能性差、师生交互手段单一等问题。从8 0 年代a g e n t 的概 念提出以来,a g e n t “瑚嘲m 脚技术一直受到业界的广泛关注,并得到较快的发展,它在分 布式信息管理和共享领域的应用非常引人注目,应用研究已经从理论研究阶段走向实用化 阶段基于对答疑系统的智能化等要求,本课题引入a g e n t 理念、利用自然语言理解技术, 将a g e n t 智能化的思想应用到答疑系统的开发中,让计算机自动解答提问,并自动返回答 案;学生可以通过网络随时随地提出问题和获得答案利用网络进行智能答疑,一方面可 以充分发挥教师的作用和潜能,如由教师组成专家组,共同回答学生的问题、组织教学内 容及组建问题库;另一方面,学生可以在不同时间,地点通过答疑进行学习,为学生提供 更为广阔的学习空间,学生由被动接受,变为主动学习,实现个性化的学习。此模型充分 体现了网络教育的开放式,学生可以及时、有效地获得解答;为教师改进教学方法提供参 考,成为辅助教学的有效工具。 1 2 国内外研究现状 “解惑”是教育活动中一个重要环节,传统意义中,教师的一个重要职责是为学生 解惑。及时解答学生的疑难问题,消除学生的学习障碍,它是教育活动中一个必不可少的 环节。它必然也是现代网络教育平台中的一项重要功能,不但支持了网络教学的正常进行, 而且也是传统课堂教学的有益的补充;而答疑系统的智能化对网络教学的效果有着直接的 影响,在每年一度的文本信息检索( t r e c ) 会议上,自动答疑( q u e s t i o n a n s w e r t r a c k ) 是最受关注的主题之一【9 l 【1 0 i 。目前很多研究机构都纷纷开展了对专家系统,问答式搜索引 擎、基于自然语言查询接口的数据库查询系统,智能答疑系统等的研究【1 1 1 【4 】。那么到底现 在国内外答疑系统的现状如何? 带着这个问题,作者对国内外现有的答疑系统进行了深入 的调研【1 4 】【1 坷【阍。 1 2 1 国外答疑系统发展情况 作者调研了国外几家较典型的网络答疑系统,其中包括a s kj e e v e s 公司的a s kj e e v e s f o rk i d s 姗网上答疑系统、m i t 人工智能实验室b o r i sk a t z 博士组织开发的s t a r t 系统渊 等,国外教育网站中答疑的实现主要通过各种网络交互的手段和技术来实现,答疑系统具 有较好的交互、答疑和反馈机制,智能性高。 这些典型的答疑系统有如下: l 、a s kj e e v e sf o rk i d s “”网上答疑系统:该系统是美国a s kj e e v e s 公司开发的。 第2 页 国防科学技术大学研究生院学位论文 它允许用户用自然语言句子提问,检索系统会自动分析用户的提问,然后通过与用户的交 互进一步明确用户的真正意图,这种检索方式得到的结果比单纯基于关键词的更符合用户 的要求”,它的提问模块不仅支持了自然语言提问,而且设计了问题的确认交互,通过这 层交互,系统能够更精确地理解用户的问题,为问题的准确解答提供了保障 2 ,s t a r t 系统:是由m i t 人工智能实验室b o r i sk a t z 博士组织开发的该系统是第 一个面向国际互联网的自然语言答疑系统,它能够回答针对m i t 信息实验市的地理学知识 的用户提问;而且它的答案的简洁性和正确性较高s t a r t 系统使用主体一关系对象三元 组的形式存放系统知识以及回答问题,回答能力有限;同时,该系统是以英文为母语的, 只能识别用英语提交的问题“” 3 、a n s w e r b u s :也是一个比较成熟的答疑系统。它是一个多语种的自动答疑系统,不 仅可以回答英语的问题,还可以回答法语、德语等语言的问题 下面从几个方面总结国外现有答疑系统的特点: l 、系统智能化水平高,交互手段多样化 目前因为基于英语的自然语言处理技术有 了长期的发展,并取得了较好的成果。所以机器理解自然语言水平高,提问更准确,人性 化,系统智能性更强;答疑的实现通过各种网络交互的手段和技术来实现,交互手段多样。 2 、系统独立性强。国外大多数出色的智能系统全部都是独立运行的系统,它们不属 于任何教学或学习平台。 3 、资源库丰富国外答疑系统的资源库的突出特点是拥有丰富、高质量的内容,比 如a s kj e e v e sf o rk i d s 网上答疑系统的所有答案是来自数万计通过查询和研究确定的和 问题有关的其他网站链接。 i 2 2 国内答疑系统现状 作者调研”1 了国内几家典型的网上教育平台、教育网站,发现有的平台根本没有答疑 系统,即使有答疑系统,它的功能也较简单,大多数采用基于传统的i n t e r n e t 工具( 电 子邮件、留言板、b b s ,聊天室等) 的交互方式实现答疑,无法适应网络答疑中大规模、 动态,实时的特点,智能化程度很低,还停留在传统教学中的人际交互的模式中,没有把 网络技术、人工智能、自然语言理解等先进技术充分利用到答疑系统中。 国内几种典型答疑系统介绍: l 、哈工大统计分词系统 该系统是一种典型的运用统计方法的纯分词系统,它试图将串频统计和词匹配结合起 来。系统由三个部分构成:一,预处理模块,利用显式和隐式的切分标记将待分析的文本 切分成短的汉字串,这大大地减少了需要统计的( 无效) 字串的数量和高频单字或量词边 界串;二、串频统计模块,此模块计算各个已分开的短汉字串中所有长度大于l 的子串在 局部上下文中出现的次数,并根据串频和串长对每个这样的子串进行加权三、切分模块, 首先用临时词库对每个短的汉字串进行切分,使用的是逐词遍历算法,再利用一个小型的 常用词词典对汉字短串中未切分的子串进行正向最大匹配分词。此系统能够利用上下文识 别大部分生词,解决一部分切分歧义,但是统计分词方法对常用词识别精度差的固有缺点 第3 页 国防科学技术大学研究生院学位论文 仍然存在。 2 ,杭州大学改进的删分词系统 该系统采用改进的姗算法,包括下面几个步骤:正向扫描、增字最大匹配( 包括“跳 跃匹配非连续词”) 、词尾歧义检查( 逐次去掉首字做姗匹配以发现交叉歧义字段) ,“归 右原则”( x t 于“连续型交叉歧义”还需要。左结合原则”) ,系统的词典采用一级首字索 引结构,词条中包括了。非连续词”( 形如g 奉g ) 系统精度的实验结果为9 5 ,低 于理论值9 9 7 3 ,但高于通常的姗,r m m 、d 删方法 3 、北大计算语言所分词系统 本系统由北京大学计算语言学研究所研制开发,属于分词和词类标注相结合的分词系 统由于将分词和词类标注结合起来,系统可利用丰富的词类信息对分词决策提供帮助, 并且在标注过程中又反过来对分词结果进行检验、调整,同时将基于规则的标注排歧与基 于语料库统计模型的排歧结合起来,使规则的普遍性与灵活性得到统一,而且对未登入词 的估算到达了相当高的准确率 4 、清华大学s e g t a g 系统 此系统着眼于将各种各类的信息进行综合,以便最大限度地利用这些信息提高切分精 度系统使用有向图来集成各种各样的信息,为了获得切分结果,系统采用在有向图d a g 上搜索最佳路径的方法,使用一个评价函数e v a l u a t e ( p a t h ) ,求此评价函数的极大值而 获得最佳路径p m a x 。所运用的搜索算法有两种,即“动态规划”和“全切分搜索+ 叶子评 价”,使用了词频、词类频度、词类共现频度等统计信息。通过实验,该系统能够处理未 登录词比较密集的文本 根据目前国内的具有代表性的远程教育系统中有关答疑部分的特点,可以将之分为以 下几类司: 1 、没有专门的答疑部件。此类系统中教师与学生的信息交流方式仅局限于电子邮件 直接联系,或者利用系统留言版发布公告信息。如北京邮电大学现代远程教育系统,华南 理工大学远程教育中心、浙江大学现代远程教育中心等研制的系统和大部分面向中小学的 远程教育系统等均属于这一类 2 ,具有初步的答疑部件。此类系统的特点是提供w e bb b s 的讨论方式,也可以进行 教师主持下的w e b 实时聊天讨论。如清华大学远程教育系统和湖南大学多媒体信息教育学 院的远程教育系统就属于这一类 3 、具备了自动答疑功能的答案部件此类系统的典型代表是上海交通大学的远程教 育设计中心设计开发的a n s w e rw e b 自动答疑系统,它是一个动态的问题及答案的数据库, 用户可以输入关键词在系统的已有的问题和答案数据库中查找相关的材料,新的提问和答 案将增加到系统库中,如果没有找到答案,则会自动转发给专家请求帮助解答 从上面的分析中,下面从几个方面具体介绍国内现有答疑系统的特点和不足: 1 、国内的智能答疑系统没有国外发展快,技术还不成熟。国外的研究成果已经能够 在特定领域发挥作用,但是由于这些系统大都是以英语为背景进行研究的,还不能直接移 植到中文来。这是因为中文在使用中比英语要复杂的多我们可以借鉴国外的研究思路, 应用到中文智能答疑系统中。 第4 页 国防科学技术大学研究生院学位论文 2 、系统智能性不够,交互手段单一因为目前机器理解自然语言水平不高的原因, 大多数答疑系统采用电子邮件、b b s 或是基于关键词的答疑方式,主要靠人工实现答疑, 系统智能性不够。以上海交通大学的远程教育设计中心设计开发的a n s w e rw e b 为例,它 虽然具备自动答疑功能,应该是目前国内答疑系统中较出色的,但是用户在提问时,只能 采取纯文本的关键词的逻辑组合方式,这就要求用户有一定的提取关键词和逻辑组合的能 力,无疑给不懂计算机的用户带来困难 3 、系统独立性不足。调研发现国内具有答疑功能的独立平台或系统很少,大多数答 疑系统都嵌套在网络教学平台或系统中,不是一个独立的系统;而且很多的网络教学系统 只是提供一些简单的答疑方式,并没有专门的答疑系统 4 ,资源库缺失国内答疑系统寻求答案的资源库主要是基于课程章节组织的,资源 非常有限,这与网上丰富浩瀚的教学资源形成强烈的反差。 5 、相关技术的牵制目前i 自然语言处理技术、数据挖掘、文本检索、专家系统等 技术的水平影响了答疑系统智能化的发展。 6 、各教育机构各自为政,所开发的教育软件重复率高,覆盖面窄。 可见国内大部分教育人员对网上答疑的认识还局限在传统教学中的人际交互模式中, 而忽视或者应该说回避了网络技术、人工智能等先进技术给答疑提供的强大支持 针对目前国内外智能答疑系统的发展现状的研究。我们可以了解世界网上智能答疑系 统已经逐渐受到人们的关注并已经开始了实践,但我国的网上智能答疑系统还处于起步阶 段,正在探索中,尽管国内人工智能发展水平以及缺乏教育应用的经验都严重制约了网上 答疑系统的智能水平,但是国外的实践经验在各方面都给国内提供了启发和参考,鉴于此, 国内需要从高效利用网络资源、改善提问方式、整合已成熟的高新技术等几个方面重新进 行答疑系统的建设。 1 3 研究内容、主要贡献和创新点 本文首先分析了国内外典型的网上答疑系统,总结出其各自的优缺点;然后了解了 a g e n t 、m a s 等概念,着重分析a g e n t “叭埘实现技术、通讯模式与它们所支持的计算模式; 接下来,分析了自然语言处理技术乜1 聃1 中常用汉语分词、相关度匹配算法的优缺点。基 于上述工作,本文提出了一个基于a g e n t 的智能网上答疑系统模型,并用i b l - a g l e ta g e n t 平台对其进行了实现。和现有网上答疑系统相比,其智能性,实时性、个性化、交互性等 方面都有所提高,为教学提供必要的补充,改善了教学质量。 本文的基于a g e n t 的智能的网上答疑系统构建了b a s ( b r o v s e r a g e n t d a t a b a s e s e r v e r ) 三层结构模型,这三层结构分别对应用户晃面层、多a g e n t 层和数据资源层。用 户界面层主要体现在浏览器端( b r o w s e r ) ;多a g e n t 层是一个多a g e n t 系统( m a s ) ,各 第5 页 国防科学技术大学研究生院学位论文 个a g e n t 相互协作实现界面层的功能;数据资源层主要实现各种信息资源,如答案、关键 词、用户信息等的存储 与现有网上答疑系统相比,本文构造的基于a g e n t 的智能的网上答疑系统具有如下优 点: 1 、在系统中引入了a g e n t 与汉语处理技术整个系统由管理a g e n t ,用户a g e n t 、检 索a g e n t ,用户个性a g e n t 等a g e n t ,知识库、用户模型库、词典和用户信息库等 数据库组成;各a g e n t 代表着参加交互的各方,通过a g e n t 之间的协商,可以将 分布的信息资源融合为一个有机的整体该系统实现了自主联合答疑;针对不同 的用户建模,实现了用户的个性化和人性化的服务;实现了动态实时交互。与现 有答疑系统相比。系统的智能性、交互性和可维护性都有所提高。 2 、为了适应不同的应用场景,系统实现了可配置如为了实现如下场景( 用户不论 是否是教师,只要具有回答某问题的能力,都可提供答案) 则对用户在第一次登 录时都要进行知识前测,将用户实测结果以用户a g e n t 的快照方式,存放在信息 库中;系统如果在知识库中找不到答案,就可以根据用户信息库将问题交给具有 解答该问题能力的用户系统的可配置性,拓展了系统适用范围,提高了系统产 生可能正确答案的实时性系统中各a g e n t 是相互独立而又彼此联系的实体,提 高了整个答疑系统的可维护性和可扩充性 3 、对各常用的汉语分词,歧义分析、问题和答案的相关度计算方法进行了分析,总 结了各算法的优缺点,提出了一种改进的汉语分词,歧义处理算法,该算法能提 高汉语处理速度和歧义分析能力。 4 、提出并实现了a g e n t 之间一种简单的基于f i p a - a c l 语言的通信机制。 5 、根据系统的实际需要和a g e n t 的特点,靠4 定了本系统的安全机制。 6 、结合汉语处理技术,利用i b m a g l e t 平台、j a v a 语言和s q ls e v e r 2 0 0 0 数据库系 统,实现了一个智能化的网上答疑实验系统,该实验系统是基于大学计算机文 化基础课的。 1 4 论文结构 本文共分六章,内容组织如下: 第一章为绪论,分析了本文的研究背景和国内外答疑系统的特点和不足;强调了发展 智能化网上答疑系统的重要性和意义 第二章为a g e n t 的概念、技术及开发平台的介绍,它们是下一步工作的起点与基础; 第三章详细描述了基于多a g e n t 的智能的网上答疑系统的模型,给出了系统的总体设 计和各 部件的功能。 第四章对基于多a g e n t 的智能的网上答疑系统模型进行深入的研究,对其中几个关键 第6 页 国防科学技术大学研究生院学位论文 技术进 行详细的阐述,在结合现有的汉语处理技术的基础上,改迸了汉语分词、歧义处理算法, 提出了答案和提问相匹配的相关度算法;结合系统的具体要求和a g e n t 的特点,给出了各 a g e n t 之间的通讯机制和系统的安全策略 第五章在前几章的基础上,利用j a v a 语言、数据库系统,设计实现了基于i b m - h g l e t 开发平台的大学计算机文化基础课的网上答疑系统,给出了具体程序和系统的各操作 界面。 第六章总结全文并展望了未来工作,提出了需要进一步研究的几个方面。 第7 页 国防科学技术大学研究生院学位论文 第二章a g e n t 的概念、技术及开发平台 智能主体( a g e n t ) 的研究开始于2 0 世纪8 0 年代,源于分布式人工智能d a i ( d i s t r i b u t e da r t i f i c i a li n t e l l i g e n c e ) ,它是一种处于一定环境下包装的计算机系 统,为了实现设计目的,它能在那种环境下灵活地,自主地的活动它为分布式开放系统 的分析、设计和实现提供了一个崭新的途径,并在不同的领域得到了广泛的应用。 智能化和网络化的发展促成了a g e n t 技术的发展,许多专家信心十足的称:a g e n t 技 术将成为2 l 世纪软件技术发展的又一次革命 2 1 1a g e n t 概念 2 1a g e n t 有关的概念与特性 a g e n t 一词直译为“代理”,也有人把它翻译为。智能代理”,广义上它是指具有智 能的任何实体,包括人类、智能硬件,智能软件等。 a g e n t 思想的诞生可归功于j o h nm c c a r t h y 在2 0 世纪5 0 年代提出的。t h ea d v i c e t a k e r ”系统,该系统被设想为具有目标性,系统内实体间用人类的术语交流,它们从用 户利益来考虑从事各种任务目前a g e n t 已经被应用到很多领域中,许多学者提出了各自 对a g e n t 的定义,但是对a g e n t 到底是什么并没有取得一致的意见。每个领域都从自身的 角度来定义a g e n t ,其中一个致力于a g e n t 技术标准化的组织一f i p a ( f o u n d a t i o nf o r i n t e l l i g e n tp h y s i c a la g e n t ) 给出了一个定义:a g e n t 是驻留在环境中的实体,它可以 解释从环境中获得的反映环境中所发生事件的数据,并执行对环境产生影响的行为。在这 个定义中,a g e n t 被看成是一种在环境中“生存”的实体,它既可以是硬件( 如机器人) , 也可以是软件,它是具有自治性、反应性( 对环境进行感知和动作) 和面向目标特性的实 体 我们可以从以下两个角度来看a g e n t :从最终用户角度,a g e n t 是一种程序,它代表 用户,是用户实现其意图的软件助手;从系统角度,a g e n t 是一个软件对象,生存于一个 执行环境中并拥有自己的特性我们研究a g e n t ,研究得更多的是如何支持和应用a g e n t , 而不是a g e n t 怎么才算智能;关注得更多的是如何利用a g e n t 的概念来更好地解决实际应 用中的阀题而不是怎么样才算是一个真正的a g e n t 瞵1 2 1 2a g e n t 的特性 在有关a g e n t 特性的研究中,最经典和最广为接受的是w o o l d r i d g e 等人有关“弱定 义”和“强定义”的讨论啪1 ,文献在分析一些经典的研究报告和应用系统中,在对a g e n t 第8 页 国防科学技术大学研究生院学位论文 的描述或定义的基础上指出。一个a g e n t 的最基本的特性应该包括:自治性、反应性、面 向目标性和针对环境性 1 、自治性:一个a g e n t 能在没有与环境的相互作用或来自环境的命令的情况下自主 执行命令这是a g e n t 最重要的特性之一,是a g e n t 区别于普通软件程序的基本属性,任 何其他程序单元无法访问其操作,它具有更好的封装性,因而也具有更高的安全性 2 、反应性:a g e n t 可以感知环境并及时地做出反应其行为通过触发规则和执行定义 好的计划来更新a g e n t 的事实库,并发消息给环境中的其他a g e n t 3 ,面向目标性( 主动性) :a g e n t 不仅可以对环境的变化做出反应,而且在特定情况 下采取主动行动,面向特定的目标行动。 4 、针对环境性:a g e n t 都是针对特定环境的,在某个环境中存在的a g e n t 换了一个环 境之后就有可能不再是a g e n t 了。因为它有可能无法对变换了的环境进行感知和反应,各 类a g e n t 往往只满足于他们所存在的环境 每个a g e n t 首先要具有以上这4 点最基本的特性,然后再根据其应用情况拥有其他特 性a g e n t 可以拥有的其他特性包括;移动性、自适应性、通信能力( 包括协商,协作等) 、 持续性等特性。一些研究人员还从a g e n t 精神状态出发,对a g e n t 的特性进行了更为深入 的研究嘲。a g e n t 的属性如下图所示 2 1 3a g e n t 体系结构 图2 1a g e n t 的特性 a g e n t 的体系结构矧洲描述了组成a g e n t 的基本成员及其作用,各成员的联系与交互机 制、如何通过感知到的内部状态和外部环境确定a g e n t 应采取的不同行动的算法、a g e n t 的行为对其内部状态和外部环境的影响等。目前提出的a g e n t 的体系结构大致可分为以下 三类: 1 ,主动型体系结构这种结构是基于逻辑的,为理性a g e n t 建立起一套形式化公理, 第9 页 国防科学技术大学研究生院学位论文 公理化是利用信念、愿望,意图,目标等a g e n t 心智状态( 表示成逻辑公式) 建立a g e n t 行为的形式化模型而得到的,这种a g e n t 通过传感器感知外界环境。并将其表示成a g e n t 的某种心智状态,然后从这些心智状态出发,经过依据公理的逻辑脱离来决定所执行的动 作著名的b d i ( b e l i e v e - d e s i r e - i n t e n t i o n ) 就是典型的主动型结构。这种体系结构的 缺点是在于不能很好的适应实时环境 2 、反应型体系结构它们没有对外界环境的表示和繁杂的推理,利用刺溃卜响应行为 工作它直接以传感器感知的外界环境信息为点火条件,而且它的所有行为分为优先级不 同的几种类型,健壮性和容错性是它的两个重要特点。另外,反应型a g e n t 速度快,适用 于实时环境它的缺陷在于它只基于局部信息做出反应,而不考虑全局信息 3 、混合型体系结构在实际的应用环境中,仅有基于逻辑的或仅有反应型的a g e n t 是不够的,对于既需要有一定推理又需要满足实时要求的复杂系统,我们可以综合两者优 点,对于不同智能层次的行为采用不同的处理方式,构造混合型体系结构图2 就是一个 典型的混合型体系结构 醛凌输入 动f l ;输珏: 图2 2 混合型体系结构 三种体系结构都有它适用的范围,很难评价孰优孰劣。 2 i 4 多a g e n t 系统( m a s ) 由于现实世界的问题的复杂性,以至于单个a g e n t 因个体所拥有的知识、计算资源和 视图的限制而力不能及,单个a g e n t 很难完成给定的任务,于是便由多个a g e n t 共同承担 一个任务,这就是所谓的m a s ( m u l t i - a g e n ts y s t e m ) ,m a s 提供了一种解决复杂问题的 第l o 页 国防科学技术大学研究生院学位论文 分而治之的方法当一个问题特别复杂、庞大,唯一的解决的方法是将问题划分,构造一 些有一定功能的a g e n t ,由这些a g e n t 去分别处理子问题,各a g e n t 通过相互协商和合作 来互相通信m a s 一般具有个体信息不完全、个体能力受限、无全局控制、数据分散化和 计算异步等特点 上一节描述的是单个a g e n t 的体系结构,而在m r s 中各a g e n t 的权威关系不但决定 了a g e n t 之间的通讯方式,也决定了系统中信息的存储和共享方式。下面主要介绍i t , s 中 几种常见的体系结构 1 、a g e n t 网络结构:在a g e n t 网络结构中,没有特权者,a g e n t 之间直接通信,并且 通信是固定的,每个a g e n t 必须知道信息应该在什么地方和应该发送到什么地方,系统中 哪些a g e n t 是可以合作的,分别具有什么能力。但是在a g e n t 数量很多时,这种有一对一 交互的效率就会很低。 2 、a g e n t 层次结构:m a s 中各a g e n t 被分层,在每一层的决策和该层

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论