




已阅读5页,还剩62页未读, 继续免费阅读
(计算机应用技术专业论文)基于agent的个性化信息检索技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
哈尔滨工程大学硕士学位论文 摘要 近年来,智能信息检索( i n t e l l i g e n ti n f o r m a t i o nr e t r i e v a l ) 作为人工智能( a i ) 的一个独立研究分支得到了迅猛的发展。随着i n t e m e t 的发展和普及,越来 越多的用户利用搜索引擎来搜索网上信息。尽管搜索引擎的发展已较成熟。 但人们在使用中却发现要准确、快速地查找自己所需要的信息是越来越困难。 面对网络信息服务的这种现状,人们在寻求一种将信息用户感兴趣的信息主 动推荐给用户的服务方式,这便是个性化的主动信息服务。在实现个性化的 主动信息服务中,智能a g e n t 技术起到了至关重要的作用。 本文系统地研究了基于a g e n t 的个性化主动信息服务中所涉及的关键技 术,提出了一种基于m u l t i - a g e n t 的i n t e r n e t 信息检索系统模型。该系统由 用户a g e n t 、信息搜索a g e n t 、信息过滤a g e n t 三个模块构成。通过用户信息 需求的表达和信息反馈,形成并训练用户a g e n t 。用户a g e n t 通过基于记忆 观察的学习机制、接受反馈的机器学习机制、改进的i d 3 算法的归纳学习机 制三种机器学习方法,学习用户的兴趣,使其具有一定的智能性。信息搜索 a g e n t 通过查询代理与i n t e r n e t 搜索引擎连接,既可实现元搜索,又可以在 返回的网址较少或不满足用户的要求时,使用自身搜索工具在网络上自主搜 索,而且搜索算法从查询代理返回的网址出发进行搜索,减少了搜索的范围, 加快了搜索的速度。信息过滤a g e n t 根据用户已有的信息资源分析用户喜好, 采用向量空闯法进行信息过滤。三个模块密切协作,从而实现了网上信息的 个性化、主动性、智能性检索。 关键词:a g e n t ;信息检索:智能检索;i d 3 算法;向量空间法 哈尔滨工程大学硕士学位论文 a b s t r a c t i nr e c e n t y e a r s ,a s ab r a n c ho fa r t i f i c i a l i n t e l l i g e n t ( a i ) ,t h ei n t e l l i g e n t i n f o r m a t i o nr e t r i e v a lh a sb e e nd e v e l o p e dr a p i d l y w i lt h ed e v e l o p m e n ta n dt h e s p r e a do fi n t e m e t ,m o r ea n dm o r eu s e r s s e a r c hf o ri n f o r m a t i o no n l i n e u s i n g s e a r c h e n g i n e s a l t h o u g ht h ed e v e l o p m e n t o ft h es e a r c h e n g i n e h a sb e c o m e m a t u r e y e tw h e nu s i n gi t t h ep e o p l ef i n di tm o r ea n dm o r ed i m c u l tt ol o o kf o r t h ei n f o r m a t i o nn e e d e df o rt h e i ro w n f a c e do nt h ec u r r e n ts i t u a t i o no fn e t w o r k i n f o r m a t i o ns e r v i c e ,p e o p l ea r es e a r c h i n gf o rak i n do fs e r v i c em o d e lt h a tt h e r e q u i r e d i n f o r m a t i o nf o ru s e r si sr e c o m m e n d e dt ot h e ma c t i v e l y t h a ti st h e p e r s o n a l i z e da c t i v ei n f o r m a t i o n s e r v i c e t h ei n t e l l i g e n ta g e n t t e c h n o l o g yp l a y sa n i m p o r t a n tp a r ti nc a r r y i n go n t h ep e r s o n a l i z e da c t i v ei n f o r m a t i o ns e r v i c e t h ep a p e rh a ss y s t e m a t i c a l l ys t u d i e dt h ek e yt e c h n o l o g yd e a l i n gw i t ht h e a g e n t b a s e dp e r s o n a l i z e da c t i v ei n f o r m a t i o ns e r v i c ea n dp u t sf o r w a r da ni n t e r a c t i n f o r m a t i o nr e t r i e v a ls y s t e mm o d e lf o rt h em u l t i a g e n t t h es y s t e mc o n s i s t so f t h r e ep a r t s ,w h i c ha r eu s e ra g e n t ,i n f o r m a t i o ns e a r c ha g e n ta n di n f o r m a f i o n f i l t e r i n ga g e n t w es h o u l df o r ma n dt r a i nt h eu s e ra g e n tt h r o u g ht h ee x p r e s s i o n o fi n f o r m a t i o nr e q u i r e m e n ta n di n f o r m a t i o nf e e d b a c kb yt h eu s e r t h eu s e ra g e n ts l i m su pt h et h r e ek i n d so fm a c h i n el e a r n i n gm e t h o d s , t h r o u g hm e m o r yo b s e r v a t i o n b a s e dl e a r n i n g ,a c c e p t i n gf e e d b a c k b a s e dl e a r n i n g a n di n d u c t i o n - b a s e dl e a r n i n go fi m p r o v e di d 3a l g o r i t h mt os t u d yt h ei n t e r e s t so f t h eu s e r , s oa st oh a v ei n t e l l i g e n c e t h ei n f o r m a t i o ns e a r c ha g e n tt h r o u g hi t s i n q u i r ya g e n tc o n n e c t si n t e r n e ts e a r c he n g i n e s ,n o to n l y r e a l i z e sm e t a - s e a r c h ,b u t a l s om a k e ss e l f - s e a r c ho nt h ew e b ,w h e nt h er e c a l l sc o u l d n tm e e tt h en e e d so f t h e u s e r t h es e a r c ha l g o r i t h ms t a r t si t ss e a r c h i n gf r o mt h er e c a l l so fi n q u i r ya g e n tt o r e d u c et h er a n g eo f s e a r c h i n ga n di n c r e a s et h es p e e do fs e a r c h i n g a c c o r d i n gt o t h eu s e rr e a d y m a d ei n f o r m a t i o nr e s o u r c e s ,i n f o r m a t i o nf i l t e r i n ga g e n ta n a l y s e s t h eu s e r sf a v o r i t ea n da d o p t sv e c t o rs p a c em e t h o dt oc a r r yo u tt h ep e r s o n a l i z e d i n f o r m a t i o nf i l t e r f i n a l l y , t h ep a p e rd e s i g n e dt h ee n t i r es t r u c t u r eo fi n t e l l i g e n ta g e n t t oe n s u r e t h ec l o s ec o o p e r a t i o no ft h et h r e em o d e l ss ot h a tt h ei n f o r m a t i o nr e t r i e v a lc a nb e f u l l yr e a l i z e dp e r s o n a l i z e d ,a c t i v e l ya n di n t e l l i g e n t l y k e yw o r d s :a g e n t ;i n f o r m a t i o nr e t r i e v a l ;i n t e l l i g e n t r e t r i e v a l ;i d 3a l g o r i t h m ; v e c t o rs p a c em e t h o d 哈尔滨工程大学硕士学位论文 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本文的所有工作,是在导师的指导下, 由作者本人独立完成的。有关观点、方法、数据和文献等引 用已在文中指出,并与参考文献相对应。除文中已经注明引 用的内容外,本论文不包含任何其他个人或集体已经公开发 表的作品成果。对本文的研究做出重要贡献的个人和集体, 均已在文中以明确方式标明。本人完全意识到本声明的法律 结果由本人承担。 作者签名:燃 日期:洳弓年6 月6 日 哈尔滨工程大学硕士学位论文 第1 章绪论 1 1 问题提出的背景 随着i n t e r n e t 的发展和普及,越来越多的用户利用搜索引擎来搜索网上 信息。尽管搜索引擎的发展已较成熟,但人们在使用中却发现要准确、快速 地查找自己所需的信息是越来越困难。主要原因有两个:( 1 ) 搜索的结果( 一 系列u r l 地址) 可能有成千上万条,而在这过于庞大的信息群中,有用信息 只是其中的小部分,并且常常发生收到或下载的信息难以消化的情况,即所 谓的“认知过载”。( 2 ) 目前的搜索引擎都是服务器端软件,用户需要严格按 照各种引擎所要求的格式输入查询词,但种种限制使用户不知道如何贴切地 表达自己的信息需求( 目前技术也没有提供合适的表达手段) ,也不知道如何 更准确地寻找所需信息,即所谓的“迷航”i l “。 传统的搜索引擎,如:a l t a v i s t a , n f o s e e k ,l y c o s ,y a h o o 等都是服务器端软 件,用户需严格按照各个引擎所要求的格式输入查询串。如果把搜索工具与 查询数据库分离,把搜索工具安置在客户端,并且利用机器学习技术,使客 户端搜索软件具备智能性,能够学习用户兴趣,就能弥补传统引擎的不足。 这种搜索工具被称之为基于a g e n t 的i n t e r n e t 智能信息检索。用户只要提交自 己感兴趣的w e b 文档给a g e n t ,它就能利用机器学习技术学习到用户的兴趣, 自主地在i n t e r a c t 上漫游,收集用户感兴趣的信息。每个用户都能按照自己 的习惯配置搜索工具,使之具有个人的独特风格和识别特定的语义模式的能 力。这是提高搜索引擎的灵活性、准确性、自主性、智能性的较好方法【l 3 1 。 本文利用基于a g e n t 的网上智能信息检索技术,设计了一个系统模型, 该模型由三个a g e n t 模块共同协作,提供了一种基于a g e n t 的个性化主动服 务:用户a g e n t 是根据用户兴趣的偏好和信息的反馈训练出来的,从而实现 了个性化服务:信息搜索a g e n t 自主运行,及时获取用户喜欢的最新信息, 从而实现了主动信息服务:信息过滤a g e n t 实现网上信息资源和用户个性化 需求模式的匹配,体现了信息服务个性化的特点。 哈尔滨工程大学硕士学位论文 1 2 课题研究的意义 面向i n t e r n e t 的信息获取与处理技术是当前计算机科学与技术领域急需 研究的课题。基于a g e n t 的智能信息检索技术( i n t e l l i g e n ti n f o r m a t i o n r e t r i e v a l ) 是基于目前i n t e r n e t 网上信息的无组织、异构分布和动态的特点提 出的,用于解决信息检索中“信息过载”和“资源迷向”等问题,实现i n t e m e t 网上信息个性化主动服务。智能a g e n t 技术作为近年来a i 领域的研究热点, 因其自主性、反应性、适应性和社会性等特点正得到广泛的应用。将智能 a g e n t 技术应用于信息检索中,可以十分灵活地提供多种智能化的信息处理 手段,将有利于开拓i n t e m e t 网络资源的信息服务。 1 3 国内外智能信息检索的研究动态 1 2 - 1 6 l 1 3 1 信息检索的发展过程 其实,早在四十年代人们就已经意识到大量信息的存储和查找所引发的 各种问题,一门新的学科“i n f o r m a t i o nr e t r i e v a l ”随之应运而生。这个名词 翻译的时候译成了“情报检索”,而且一直沿用至今,不过现在看来,译成“信 息检索”似乎更为贴切。 信息检索研究的对象是书面形式的文献材料。初期的信息检索系统是以 存储和检索文献的标识为主,如标题、作者、出版物、索引号等著录事项。 标识远比文献本身简单,处理操作仅限于按号归类和匹配查找。现代信息检 索系统不但收录了文献的标识,而且还包括文摘甚至是文献的全文,信息检 索发展成为对文本信息的检索,所以也称为“文本检索( t e x tr e t r i e v a l ) ”。 文本检索的基本任务是根据使用者的检索要求,将系统中的文本按其相 关性的高低依次排列。确定文本相关程度的最精确的办法是让检索系统的使 用者阅读全部文本,然后根据其内容给每个文本打分。但是这样做是完全不 现实的,检索系统的目的就是减轻使用者的阅读负担,不可能向使用者提出 这样的要求。只有依靠检索系统对文本内容的自动分析来计算相关程度。目 前自然语言处理的研究水平尚不能实现对篇章语义的完全理解,所以检索系 2 哈尔滨工程大学硕士学位论文 统判断相关性的大小主要是根据文本中所用词语的统计特性,并没有涉及语 言本身所反映的内容。 纵观国外计算机信息检索系统的发展,可以将其发展过程划分为以下三 个阶段: 第一阶段:1 9 7 1 年以前,是第一个发展阶段。在此阶段,虽然计算机信 息检索系统刚刚起步,却引起了人们的普遍关注。人们建立了许多信息检索 系统并取得了一定的进展。1 9 5 4 年美国海军兵器中心( n o t s ) 图书馆首先 在i b m 7 0 1 型计算机上成功地建立了世界上第一个计算机文献检索系统。5 0 年代到6 0 年代,工业发达国家提出了采用批量处理的多种计算机情报检索系 统,在这一阶段,计算机信息检索系统的处理能力在1 至2 年内成倍地增长, 信息检索主要采用批处理方式。然而由于受计算机硬件发展的限制,数据的 大容量存储及数据间的通讯是此阶段信息检索系统的主要问题。 第二阶段:从1 9 7 1 年开始,尤其是1 9 7 1 年到1 9 7 2 年这两年闻,信息检 索系统发生了很大的变化,产生并发展了联机情报检索系统。在经历了批量 处理的计算机情报检索之后,许多系统都实现了在线检索。其中,美国国家 医药图书馆中心发展了在线的计算机图书馆中心o c l c ( o h i oc o l l e g el i b r a r y c e n t e r ) ,s d c 公司的s y s t e m d e v e l o p m e n t c o m p a n y 及l o c k h e e d c o r p o r a t i o n 的d i a l o g 推出了在线商用数据库查询系统。这些系统的推出标志着信息检 索系统第二个发展阶段的到来。此时,由于计算机硬件的发展,提供了高速 处理器和廉价的大容量外部存储设备,使得信息检索系统的计算及存取能力 成指数倍地增长,具有完备的数据库在线检索功能。但是,此时的计算机信 息检索系统都采用集中式的管理方法,如何最好地实现系统中的数据通讯是 此阶段的关键问题。 第三阶段:社会信息化、数据的分布处理,各种计算机资源的共享等多 种应用要求推动着计算机技术朝着群体化方向发展,促使当代的计算机技术 和通讯技术紧密结合。1 9 8 3 年至今,全球最大的网络系统i n t e m e t 从一个小 型的实验研究项目发展成世界上最大的计算机网络。i n t e m e t 的出现,标志着 计算机信息检索系统进入了一个新的阶段。此阶段,通讯及网络技术的迅速 发展使得信息检索系统的三个基本要素之间达到了协同使用的最佳状态。此 时,计算机信息检索系统大多采用分布式的网络化管理。其信息资源的主要 哈尔滨工程大学硕士学位论文 特点是:数字形式表达,通过网络利用,多媒体,多载体,内容覆盖全社会 领域,分布无序、无政府,难于规范和结构化,内容特征抽取复杂,用户界 面要求更高等。这些特点导致在信息处理方面从传统模式向新型模式转变: 体系结构从终端主机方式向客户机服务器结构方式转变,网络环境从局域网 向i n t e r n e t 等开放网转移,应用接口从封闭界面向w w w 等转移,信息结构 从结构化向非结构化转移,系统功能从单纯信息检索向综合信息管理和服务 转移等。 ,j 信息在此基础上,随着连续性语音识别技术的不断发展,预示着计算机 信息检索系统将会跨入另外一个新的阶段。 我国计算机信息检索起步于8 0 年代初期。在计算机编制主题词表、汉语 自动分词和标引、数据库建造、情报检索和相关软件的研制、联机检索、机 器翻译、图书馆业务管理、情报检索理论等主要领域取得了很大进步。科技 信息领域建立了1 0 0 多个检索系统,全国创建了8 0 0 多个数据库,为图书情 报的现代化作出了贡献。 由于汉语语言的独特性,我国的计算机信息检索十几年来基本上仍咀传 统的顺序检索、顺序检索与倒排文档相结合的检索方法为主。限于以传统人 工赋词标引方法为主的目录或摘要第二次文献,以及基于词检索的全文系统。 目前还与国外信息检索系统有一些差距。 1 3 2 国内外智能信息检索研究现状 现在世界上有许多高校、科研院所投入到了智能a g e n t 的研究工作之中。 在国内做得稍微好一点的有北京邮电大学、清华大学、中国科技大学、山东 大学;在台湾的有台湾中央研究院、基辅大学;在这方面研究工作做得比较 多的是美国。 如c a r n e i g i em e l l o n 大学的相互作用的半自动化异构软件a g e n t ,这是个 多a g e n t 系统。各个a g e n t 之间可以进行通讯,做到资源共享、知识共享。 m i t 的p a t t i em a c s 小组,他们描述了一个称为n e t w 的电子新闻扫描器 的原型,n e t w 通过感知用户从不同的新闻组中检索某些文章而得到训练, 经过一段时间以后,n e t w 将能不断的推荐给用户感兴趣的文章。 s t a n f o r d 大学和n a s a 共同承担的某个工程设计中,也采用了软件a g e n t 哈尔滨工程大学硕士学位论文 技术。a g e n t 在该系统中负责知识处理和不同成员的工作协调。其中的一个 重要构件是网络图书管理员( w e bl i b r a r i a n ) ,它是由一个叫做d e d a l 的智能 a g e n t 实现的。d e d a l 可以将各种不同类型的文献( 会议记录、技术报告、工 程图纸等) 按照内容分类存储,并可以实现基于内容的搜索( c o n t e n tb a s e d r e t r i e v a l ) 。 另一个成功的智能a g e n t 系统是r o w s e rb u d d y ,它是一个用于组织和链 入w e b 页面的基于规则的a g e n t 。经过整夜的信息搜索以后,它会在早上给 用户提供一个服务清单。在它的导引下,用户可以迅速进入那些需要长时间 交互才能到达的页面。 a g e n tw a r e 最近发布的a u t o n o m ya g e n t 是一个典型的学习a g e n t ( l e a r n i n ga g e n t ) ,它使用神经网络( n e u r a ln e t w o r k ) 而不是关键词来识别 信息的模式。用户使用类似自然语言的描述将a g e n t 限制在一个概念区域中, 然后a g e n t 在用户的教导下不断训练,直至能有效地找到用户感兴趣的文档。 a u t o n o m y 的核心是c a m b r i d g en e u r o d y n a m i e s 开发的动态推理引擎( d y n a m i c r e a s o n i n g e n g i n e ) 。它综合使用了神经网络与模糊逻辑( f u z z y l o g i c ) ,广泛 地应用于数据挖掘( d a t am i n i n g ) 3 3 1 o 目前还开发了一系列用于在w w w 上寻找特定信息的专用软件a g e n t , 其中几个比较有名的系统是: ( 1 ) f i r e l y ,使用信息过滤技术来帮助用户查询他所喜爱的电影和音乐, 它通过对用户查询、搜索行为的数据统计来建立对用户的描述。 ( 2 ) c m u 的w e b d o g g i e ,一个基于规则的系统,它可以按照用户的兴 趣向用户推荐网络资源。 ( 3 ) c m u 的n e w s w e e d e r ,一个智能的新闻阅读器,它基于机器学习 的理论来学习用户的兴趣,查找新的页面和文档。 随着网络的发展和普及,分布式运行的a g e n t 将成为发展趋势,a g e n t 之问的交互和合作问题将更加复杂,需要发展新的交互合作算法,实现社会 过滤。 哈尔滨工程大学硕士学位论文 1 4 智能信息检索的特征押】 智能信息检索追求的目标是:根据用户的请求,从可以获得的网络资源中 检索出对用户最有价值的信息。一般而言,智能信息检索有3 个主要的特征: 1 网络蜘蛛的智能化 网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机从 i n t e m e t 上自动收集、整理的信息。众所周知,信息动态更替无时无刻不在进 行,即使在搜索过程中,文档也会被添加、删除、改变。因此,需要设计一 系列网络蜘蛛,自动完成在线信息的索引。 搜索引擎能在i n t e m e t 的任何地方工作,能尽可能地挖掘和获得信息。 网络蜘蛛既可收集特定站点的信息,又能遍历整个i n t e m e t ,对整个i n t e m e t 进行索引。为了提高搜索速度,基于a g e n t 的智能搜索可以同时启动多个引 擎并行工作,将各个引擎的搜索结果整理,作为一个整体存放到数据库中。 2 自适应用户的能力 智能代理a g e n t 能通过观察用户的行为,了解用户的兴趣爱好,另外能 通过不断的训练学习增长智能。用户查询时,智能a g e n t 能够根据用户的个 性和兴趣爱好对查询结果进行过滤,筛选出用户最想要的信息并按照相关度 的大小依次排序,提供给用户。用户对返回的信息进行评价,智能a g e n t 根 据用户的评价或动作来调整自己的行为。 3 人机接口的智能化 智能a g e n t 应该可以通过自然语言和用户交互。它采取诸如语义网络等 智能技术,通过汉语分词、句法分析、概念聚类与概念联想,有效理解用户 的请求,甚至能体会出用户的弦外之音。最大程度地了解用户的需求。 1 5 作者的主要工作和论文的组织 本文对基于a g e n t 的网上智能信息检索技术进行了比较全面的研究,利 用a g e n t 技术理论,设计了一个系统模型,该系统由三个模块构成:用户 a g e n t ,信息检索a g e n t 和信息过滤a g e n t 。作者对这三个模块中所采用的关 键技术,如1 1 3 3 学习算法、自主搜索算法、向量空阃算法以及三个模块之间 哈尔滨工程大举硕士学位论文 懿关系等绘予了重点讨沧。 论文的具体组织方式如下: 燕一章绻论,篾嚣奔绍了鲻题提媳斡背最、谖题磺究的意义、禽内羚智 能信息检索的研究动态以及智能信息检索的特征,最后介绍了本论文完成的 主要工 乍和论文豹组织。 第二章介绍了有关a g e n t 与m u l t i a g e n t 技术方面瀵本理论,介绍了a g e n t 的特性及分类,播述了a g e n t 与m u l t i a g e n t 的结棉,给出了一个a g e n t 的形 式化窳义。 第三章介绍了用户a g e n t :包括用户模型的建立和使用,刹用机器学习 对用户模型进行重整以及用户a g e n t 的结构。用户a g e n t 采用了基于观察汜 忆的学习机制、基于用户反馈的学习机制和基于i d 3 归纳的学习机制。 本章在讨论了i d 3 算法的优缺点臻础上给出了一个改进的i d 3 算法。 篇四章介绍了信息搜索a g e n t :该模块通过查询代理,与i n t e m e t 搜索引 擎连接实现元骥索,溺搜索弓 擎查询强来的两艟不够多或不黥满足用户需求 时,a g e n t 可以启动自身搜索工具,利用有限深度一广度优先的算法实现自 主援索。本章簸后给滋了信惫羧索a g e n t 的体系结奉鼋。 第五章介绍了信息过滤a g e n t :罄先系统地介绍了信息过滤技术的理论 背景、研究动悫l 美及瑷有信惫l 篷滤算法豹类型;其次奔绥了傣意过滤a g e n t 的算法实现,该模块采用向量空间法实现网上信息和用户个性化需求模式的 莲配,俸疆了信息骚务令性纯煞特点;最嚣奔缁了售惑过滤a g e n t 懿体系结 构。 第六章奔绍了罄熬a g e n t 绩惠检索懿整钵设计,绘窭了系统模受豹整体 结构图,并详细阐述了三个a g e n t 模块的相虱关系。 最惹,佟蠢怼瘊擞静工臻热鞋总终,著爨建了毒德避一多探讨豹溺题。 7 哈尔滨工程大学硕士学位论文 第2 章a g e n t 与m u i 七i - a g e n t 技术研究 2 1 a g e n t 特性及分类 2 3 , 2 4 2 。1 。1 a g e n t 的特性 ,# a g e n t 的研究始于2 0 世纪8 0 年代后期,9 0 年代以来逐步成为人工智能 敬研究瓣标帮核心。它徒表了穰怠按零激嚣潘豹发震方淘,是爨有划f l 雩代藏 略意义的研究热点之一。比尔盖茨曾称a g e n t 软件为软件中的软件。a g e n t 是人工羧术实瘸纯懿集中俸凌。焉嵌入a g e n t 技术静较件产品将遵徭这样一 个质的飞跃过程:从增值到竞争力提高,继而发展为生存所必鬻。 鼠缀终爝户角度,a g e n t 怒静程净,它代表瘸户,是瑁声实瑗荚意圈 的软件助手,它因用户向它指派工作而起作用。 觚系统角度来看,a g e n t 楚一个软件对象,生存予一个撬行环境势键有 以下基本特征: ( 1 ) 代理髓:a g e n t 最薹本盼功链楚“健瑗”用户躐软 聿突成菜些诺务。 如“代理”用户查找i n t e m e t 上的信息,“代理”软件与其他软件进行通信。 2 ) 主韵穗:a g e n t 静“代毽”葫麓是裉撵魂户的需求或警前静环缓状 态以主动服务方式提供的。例如,网络j | 矗控a g e n t 将主动报告网络资源的使 糟现状。 ( 3 ) 自主性:要保迂a g e n t 的主动性,则a g e n t 本身应该是一独立自主 的计算实俸。它熊根据当前动态变佬的环境状态,在无鬻拜界参与的谤况下, 独立地发现和利用完成任务所需的资源和服务,独立地制定完成任务的规则, 最终实璇规划、迭封目标。例鲡,若一缀自主的a g e n t 协同完成芷俸流管瑾, 当某个a g e n t 的意图临时改变时,则其他a g e n t 要能重新制定兜成任务的规 划。 ( 4 ) 智能性:自主性的实现需要a g e n t 具有相关的知识、能够进行相关 哈尔演工程大学硕士学能论文 翦推理或餐藐计算。魏终,当耀户翡嚣求没鸯弱确绘爨薅,a g e n t 麓够箍溅 用户的意图、袋好或趣并为其代劳。a g e n t 还能从经验中不断学习,以提 蕞叁身经理翔麓豹麓力。这些郝说襞a g e n t 兵肖较高豹“智麓”。铡茹,a g e n t 代替用户在网上购物时,可以根据用户的爱好戏消费水平,挑选用户辫爱的 商品。遴过分擀用户对掰选麓髓晶静态度( 磐淹兴、诀鼙、不饔欢) ,霹戳送 一步掌握用户购物的意向。 ( 5 ) 交纛往:据莱把各耱诗算资源( 包旗久) 郝包装藏a g e n t ,各个 a g e n t 都有标准的外部接口,采用统的通信语言进行信息交流,则多个 a g e n t 可良通进程互游裔帮资僚来共舔完成复杂兹任势。嚣量,各穆a g e n t 可以作为标准构件,接插到一个通用的集成框架中构造多a g e n t 系统,可以 实瑶电子商务、c i m s 等诸多疲耀。 ( 6 ) 机动性:a g e n t 是计算机用户的“代理”、“秘书”,能够随计算机 用户静移动丽移动,不管是建瑾位置黪移动还燕计冀“位置”移动( 魏u r l 的改变) 。例如,便携机的用户移动到妫一个地方,他在i n t e m e t 上的童机地 丘也醣之改交,这对德冒良逶避谴懿令入移动a g e n t 与当遮瓣务器籀逡,实 现在i n t e m e t 上的即插即用。 强主这些a g e n t 技术特馁辛荨在i n t e m e t 静舞发审得蜀充分应瘸,并健 a g e n t 成为i n t e m e t 上的核心技术之一鼢2 4 1 。 2 1 2 a g e n t 的分类 由于a g e n t 酌定义不统一,各个鬏域煞簪 毙者都稳其有菜蹙a g e n t 藩往 的研究对象称为某类a g e n t 。网此,为明确这贱a g e n t 的具体含义,必须根 据a g e n t 的不湖功能帮特往对a g e n t 避行分类。本文对这些a g e n t 逶稃鲳类 总结,并解释它们的具体含义。 a g e n t 可分为人类a g e n t 、疆件a g e n t 和软件a g e n t ,如甏2 1 所承,本 文研究的重点怒软件a g e n t 。圈2 2 中歹i j 出了在文献中缀常提到的一些a g e m 类型犯孤。 9 哈尔滨工程大学硕士学位论文 图2 1 一簸a g e n t 分类 藿2 2 鞍终a g e n t 分类 按幼戆划分,毒如下几类: 信息i n t e m e ta g e n t ( i n f o m a a t i o n i n t e m e ta g e n t ) :它支持用户在分布式系 绞或i n t e r n e t 网络中智熊搜索信息或智熊管理网络资源。 界磷a g e n t ( i n t e r f a c ea g e n t ) 或个人助手;它的主要任务蹩协助用户完 成乏味蕊重复性豹工作。a g e n t 将观察并监督用户怎样执行特定的任务,当 这些a g e n t 能确定用户特定情况下将如何反应时,它就开始替代或帮助用户 完成任努。这些a g e n t 忍针对巢一用户进行了个性化处理,适成于特定用户 的行为。这些问题与入梳接口( h c i ) 、掰户建模和模式匹配密切相关。 任务a g e n t ( t a s ka g e n t ) :它是帮助人类谶行复杂决策和其他知识处理 的软件a g e n t 。这些a g e n t 鼓a i 领域的祝器学露、计潮、资源受限的捺理、 知识表达等为基础在一个实用框架中应用。 按麟经巅分,有翔下凡类: 反殿a g e n t ( r e a c t i v ea g e n t ) :具备对当时处境的实时反应能力的a g e n t 。 审馕a g e n t ( d e l i b e r a t i v ea g e n t ) :在嚣稼指导下粪备鑫主行动麓力的 a g e n t 。 0 哈尔滨工程大学硕士学位论文 合作a g e n t ( i n t e r a c t i v ea g e n t ) :具备社会合作能力的a g e n t 。 混合a g e n t ( h y b r i da g e n t ) :具有实时反应、目标指导下自主行动及合 作等综合能力的a g e n t 。 按行为方式划分,有如下几类: 自主a g e n t ( a u t o n o m o u sa g e n t ) :在复杂动态环境中自主感知和行动。 多重a g e n t ( m u l t i a g e n t ) :一个a g e n t 能利用关于其他a g e n t 的知识来 协调它与其他a g e n t 的行动或合作完成目标。 助手a g e n t ( a s s i s t a n ta g e n t ) :只与人类a g e n t 相互作用。 其他一些特殊类型a g e n t : 移动a g e n t ( m o b i l ea g e n t ) :位于网络中并通过迁移或服务接口能与网 络中其他程序进行通信的a g e n t 。它通常是由客户端迁移到服务器端执行的 脚本程序。 可信a g e n t ( b e l i e v a b l ea g e n t ) :它是在与人的相互作用( 如在一个计算 机游戏) 中以“令人信任”的特征来执行,它需要处理与人的相互作用中发 生的各种情况,而不是局限于把少量事情做得特别好。典型例子有教育、娱 乐a g e n t 等。 2 2 a g e n t 的结构 a g e n t 具有统一的结构特征,包含:通信管理机、推理控制机、a g e n t 状态栏和a g e n t 知识库。如图2 3 所示【2 4 】。 通推 ) a e n t 状态栏 一, 信理 管控 一 、 理制 知识库 机机 、 图2 3 a g e n t 的总体结构 一个a g e n t 的内部行为表现为:通信管理机接受外部环境的信息( 来自 哈尔滨工程大学硕士学位论文 其毽a g e n t 豹满意与喜毒求) ,交接理控铡枧攫掇这些溃患( m e s s a g e ) 、请求 ( r e q u e s t ) 、a g e n t 的状态( s t a t u s ) ,进行分析、理解、推理后执行相关的动 馋( a c t i o n ) ,形贼a g e n t 豹薮状态,出姥可能孳l 起进一步豹a g e n t 推理活动 ( 如:通知其他a g e n t 的请求结果,向藏他a g e n t 发出请求,等等) 。必须指 明的是:a g e n t 的活动行为不是被动的,蕊是主动进行的,a g e n t 的推理控制 机每隔一个时间片都要检测通惰状态和自身的状态,完成一次推理活动。 2 2 1 通信篱理撬 运嫠管理救是整个a g e n t 与牙部环境进行信息交纛豹接口,具有图2 ,4 所示的组织结构f 2 4 1 。 捧 醋2 4 邋信管理税的组织结构 其中: 接 陂器:臻收来自豁部环辘中其袍a g e n t 的信患( 遴知、请求等) ,进行 初步的通信语法检查后,排队到入通信队列。 发遴器;校旗警透信驮残审豹裾瘦静透信肉容,将该信惠笈往指定懿夕 部环境中的a g e n t 。 社嚣成员表:它是a g e n t 添劝环壤秘藏受清荦,它溪定了a g e n t 鹣遴售 活动范围。环境中每个能与该a g e n t 进行通信交互的成员( 其他的a g e n t ) 都将登溆鬟享主联成员表审,孬该a g e n t 穗哭缝与辜圭区袋受表孛熬a g e n t 进露 通信,嶷体结构如下: l a g e n t - t y p e a g e n t - n a m e l a g e n t - a d d r e s s | 哈尔演工程大学硕士学位论文 冀孛: a g e n t - t y p e标明环境中不同a g e n t 的种类,如:管理者,一般职员等。 a g e n t - n a m e在环境中谚 妫该a g e n t 款暌一标悫。 a g e n t a d d r e s sa g e n t 的地址,表示该a g e n t 在环境中所处的位鬣。如: 崔网终中可采明i p 地蜓来表承a g e n t 的地址。 出入通信队列是a g e n t 内部进行通信流墩控制的组织。采用先迸先出的 处理方法依次处理队列中每个通信单元。这些通信单元必须满足a g e n t 阅的 通信协议规定一通信语法。通信语法定义了a g e n t 间通信的三种方式。 ( 1 ) i n f o r m 通知某个a g e n t 在莱时( t i m e ) 的某个事实( f a c t ) 。 ( 2 ) r e q u e s t 请求菜个a g e n t 在莱时( t i m e ) 执行某个动作( a c t i o n ) 。 ( 3 ) i n v o k e 取消菜个a g e n t 程某时( t i m e ) 魏行某个动作( a c t i o n ) 。 2 。2 。2 推理控制枫 推理控制枫是a g e n t 行为的控制中心,采用特定的推理控制算法控制 a g e n t 的内部浠动。箕缱织结构如图2 5 所示澎j 。 图2 。5 通信管遐机的缎织结构 其中: 通信生成嚣根据推理控制中心的要求生成相应的通信请求内容,通过 通信管理机发给环境审其他静a g e n t 。 通信解释器解释、分析通信管理机收到的外界信息,弗将结果传给推 哈尔滨工程大学硕士学俄论文 瑾控惹l 中心挟锯。 推理控制中心是a g e n t 活动的控制中心,由一种或多种通用的推理算 法缀戏。熟数攘驱动( 戆蠹) 、嚣标制撂( 逆内) 、双内维理等等。 2 2 3 a g e n t 状态栏 状态栏是a g e m 的状态表示集合。结构如下: 其中:s t a t u s t y p ea g e n t 的状态种类,用赣区分a g e n t 状态翡不同侧蟊。 s t a t u s n a m e 状态名称,唯一表示a g e n t 的一个状态。 s t a t u s - v a l u e 状态德,反欧状态静警篱承平。 t i m e s t a m p 状态时戳,记渌状态的设定时间。 通过定义不露类黧鹃获态,可戮表示a g e n t 静不嗣状态特鬣,热:信念、 选择、承诺等嚣。由于状态的变迁具有时序特征,因而在状态栏中加入时戳 是必要懿。 2 ,2 4 a g e n t 知识麾 a g e n t 知识库是a g e n t 活动的依据也是萁向外界承诺的基础。采用产 生式溪溺俘荛知识戆萋零表示形式,掇供鼹元缀知识一方法豹诱爱警段。 a g e m 知识库的定义必须符合a g e n t 的规则语法。 r u l e ( ( ) ( ) ( ) ) 表示:当得到通信单元m e s s a g e s ,并且满足a g e n t 状态s t a t u s 时,启动 蒡瓠行凌馋捌袭a c t i o n - l i s t 孛懿各瑷动馋。 其中:m e s s a g e s 建符合通信语法的通信单元的逻辑组合,以a n d 和 o r 连接。 s t a t u s 是a g e n t 的状态的逻辑组合,以a n d 和o r 连接。 a c t i o n - l i s t 是动作捌表,一个动撵以是一个通信单元,媳可以 是对知识库元知识一一方法的调用或对a g e n t 状态栏 孵蒯毅。 哈尔滨工程大学硕士学位论文 元知识调用语法: c a l l 状态栏刷新语法: r e f l a s h 2 3 a g e n t 的形式化定义2 4 】 通过前面的描述,我们为个a g e n t 定义下列部件: ( 1 ) a g e n t 的类型、名称; ( 2 ) a g e n t 所在环境的社区成员;一个a g e n t 获得其所在社区成员的方 法有两种:在生成时先加入已有的成员,在其后加入的成员通过广播的方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年全国叉车证理论考试题库(含答案)
- 2025年电工证考试题模拟试题及答案
- 2025年水痘内容培训试题及答案
- 2025年交管12123驾驶证学法减分题库(含答案)
- 2025年食品安全培训试题食品安全知识培训考核试题(答案+解析)
- 水果脆块加工创新创业项目商业计划书
- 影视娱乐直播点评创新创业项目商业计划书
- 心理健康教育课程创新创业项目商业计划书
- 大班上学期语言教案《让世界变得更美丽》
- 2025年消毒技能竞赛个人竞赛试题(附完整答案)
- 医学实验室安全培训
- 工贸企业安全生产标准化诊断报告编制指南
- 离子检验-教案-
- GB/T 12643-2025机器人词汇
- Unit 5 Lesson 20 The Spring Festival Is Coming!(说课稿)-2024-2025学年冀教版(三起)英语五年级上册
- 智能悬架系统集成开发关键技术与实践-2024-12-技术资料
- 应用PDCA降低药占比
- 超重与失重+说课高一上学期物理人教版(2019)必修第一册
- 公司收取管理费协议书范本
- JTS-165-6-2008滚装码头设计规范-PDF解密
- 设备维修与保养(课件)
评论
0/150
提交评论