




已阅读5页,还剩58页未读, 继续免费阅读
(计算机软件与理论专业论文)基于agent技术的智能辅助浏览技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东北大学硕士学位论文摘要 基于a g e n t 技术的智能辅助浏览技术研究 摘要 随着网络信息的日益庞大,人们常常为了查询某一信息而不得不从庞大的信 息中人工进行搜索和挑选工作,所以使用a g e n t ,w e b 挖掘等技术为访问w e b 嘲 页的用户提供方便快捷的智能辅助浏览服务成为了目前的研究重点。 本文重点讨论如何在a g e n t 结构的基础上设计和实现为用户提供高质量个性 化辅助浏览服务的智能辅助浏览系统一一a h b r o s w e r 。 a h b r o s w e r 系统的核心部分由分析器和建议器组成。分析器利用w e b 挖抵技 术,结合用户的浏览习惯,将网络信息进行结构化表示:利用基于关联规则的知 识聚类和规则合并的方法对初始的规则集进行筛选,获得辅助规则集。最后建议 器根据a g e n t 特点,构造出辅助浏览a g e n t ,使用辅助规则集进彳亍链接的推荐j i 作, 成为个人浏览助手。 最后本文从推荐响应时间和推荐效率两个方面对a h b r o s w e r 系统进行r 性能 评价。实验表明,a h b r o s w e r 推荐系统具有很好的查全率和查准率及和更快的响 应速度,因此具有较强的可行性和实用性。并对下一步的工作作了展望。 关键词:辅助浏览;a g e n t :w e b 挖掘;知识聚类 东北大学硕士学位论文 r e s e a r c ho ni n t e l l i g e n ti n t e r n e t b r o w s i n g a s s i s t a n tt e c h n o l o g yb a s e do na g e n t a b s t r a c t w i t ht h ei n c r e a s i n gq u a n t i t yo fi n f o r m a t i o n ,i t sb o r i n ga n dt r i v i a lt of i n du s e f u l i t e m si nt h eg i g a n t i cv o l u m eo fi n f o r m a t i o n a m o n gt h e m ,t h ei n t e l l i g e n ti n t e r n e t b r o w s i n ga s s i s t a n tt e c h n o l o g yb a s e do nt h es o f t w a r ea g e n ta n dw e bm i n i n gh a s b e c o m eak e yr e s e a r c hi s s u e w h i c hc a np r o v i d eb r o w s i n ga s s i s t a n ts e r v i c e sf o r i m e r n e tc l i e n te x p e d i e n t l y t h i s t h e s i sf o c u s e so nh o wt o d e s i g na n di m p l e m e n ta ni n t e l l i g e n t i n t e r n e t b r o w s i n ga s s i s t a n ts y s t e mb a s e do na g e n t ,w h o s en a m ei sa h b r o s w e r t h ea h b r o s w e rs y s t e m sc o r ei s c o m p o s e do ft w op a r t s :t h ea n a l y z e ra n dt h e a d v i s e r ,t h ea n a l y z e rm a k e su s eo fw e bm i n i n gt e c h n o l o g ya n du s e r sb r o w s i n gh a b i t t ot r a n s f o r mt h ei n t e r n e ti n f o r m a t i o ni n t os t r u c t u r e dr e p r e s e n t a t i o n ,a n dt h e ni tu s e st h e a s s o c i a t i o nr u l e s - b a s e dk n o w l e d g ec l u s t e r i n gm e t h o da n dr u l ec o m b i n a t i o nm e t h o dt o f i l t e ra s s o c i a t i o nr u l e sa n do b t a i na s s i s t a n tr u l e s a tl a s tt h ea d v i s e rc o n s t r u c t sa n i n t e r n e tb r o w s i n g a s s i s t e da g e n tb a s e do na g e n tt e c h n o l o g y ,t h ea g e n tr e c o m m e n d st h e l i n k sa c c o r d i n gt oa s s i s t a n tr u l e s ,a n db e c o m e st h ep e r s o n a lb r o w s i n ga s s i s t a n t i nt h el a s tc h a p t e r ,t h et h e s i se v a l u a t e st h ec a p a b i l i t yo fa h b r o s w e rs y s t e mi n s p e e da n de f f i c i e n c y t h ee x p e r i m e n tr e s u l t ss h o wt h a tt h ea h b r o s w e rs y s t e mh a s b e t t e rp r e c i s i o na n dc o v e r a g eo fr e c o m m e n d a t i o na n dh i g h e rs p e e d ,t h e r e f o r e ,i ti s f e a s i b l et op u tt h i sb r o w s i n ga s s i s t a n ts y s t e mi n t op r a c t i c e a n di tg i v e sap r o s p e c tt o f o r w a r dw o r k i n g k e y w o r d s :a s s i s t a n tb r o w s i n g ;a g e n t ;w e bm i n i n g ;k n o w l e d g ec l u s t e r i n g 独刨性声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的 研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的 研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同1 :作 的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢 意。 、,。 学位论文作者签名:垂敏j 日 期:z 口口占鼻阍b 明 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部 或部分内容编入有关数据库进行检索、交流。 学位论文作者签名: 日期: 另外,如作者和导师不同意网上交流,请在下方签名;否则视为同意。 学位论文作者签名: 签字日期: 导师签名: 签字日期: 东北大学硕士学位论文第一章绪论 第一章绪论 1 1 问题提出 i n t e r n e t 是一个巨大的信息资源宝库,其中迅速增长的信息在为我们的生活和 二i :作提供了极大方便的同时,也使上网的用户越来越难以依靠自身的力量在浩瀚 的i n t e r n e t 信息海洋中获得自己想要得到的信息。那么甩户如何在数百万个网站中 快速有效的寻找想要得到的信息呢? 我们就要借助于网络搜索引擎,但是,目莳 虽然有了诸如g o o g l e ,y a h o o 等著名的搜索引擎,但实际上,他们搜索结果中依 然存在着大量的信息冗余,人们仍然要从非常大量的信息中进行挑选。 现在的w e b 的信息面临着很多问题: ( 1 ) 信息量多 用户在进行查询和浏览时,所要求的可能仅仅是某些网页、甚至是网页中某个 片断的信息,但得到的却是大量相关、甚至不相关的页面链接,用户需要在这众 多的页面链接中不断进行手工的或自动的“二次搜索”,才可能获得满意的结果。 ( 2 ) 查询精度低 用户在查询搜索引擎的时候,最经常遇到的问题是返回结果太多,返回的信息 不满足用户本身的兴趣、爱好或需求,这使得用户无所适从。从技术角度上说, 这就是查准率过低的问题。由于目前网站的搜索都是基于关键字、或在此关键字 基础上扩充的新关键字的匹配,而这种匹配方法很难真正体现用户的需求和兴趣。 f 3 1 不满足个性化需求 网站信息的雷同、垃圾信息的增多、网络门户信息的多样,网站提供的推荐和 导航信息更多的是从网站的利益出发,因而用户难以从中获得自己所需要和感兴 趣的信息,搜索引擎中的检索软件很少通过用户以前的浏览行为、浏览历史或浏 览习惯,自我学习、自我适应,以获得用户的兴趣,尤其是不同用户或同一用户 不同阶段的兴趣。所以它们给出的结果也不能满足不同群体或用户个体的个性化 需求。 因此,当前基于w e b 的信息检索面临着许多问题,人们提出了具有个性化、 智能化和自适应的智能个性化信息服务系统,这种系统能够面向目标、面向用户 具有学习和自适应能力。 东北走学硕士学位论文第一章绪论 1 2 个性化信息服务 1 2 1 个性化信息服务的含义 所谓个性化的信息服务,是指能够满足用户的个体信息需求的一种服务,即用 户可以按照自己的目的和要求,在莱一特定的网上功能和服务方式中,自己设定 网上信患的来源方式、表现形式、特定的网上功能及其它的网上信息服务方式等。 或者是通过对用户个性、兴趣、心理和使用习惯的分析,丽主动地向用户提供其 可能需要的信息服务。这种服务首先应该是能够满足用户的信息需求,用户可以 定制传送到计算机上的信息,在需要的时候查看,甚至可以离线阅读。它是在研 究用户的个性、习惯、兴趣、知识结构、心理倾向、信息需求和行为方式的基础 上,通过用户的自助服务,使用户接触到所需的相关信息和感兴趣的知识内容 以节约查找时间,提高效率。 1 2 2 个性化信总服务的支撑技术 目前个性化信息服务的支撑技术已经基本成熟,主要包括w e b 数据库技术、 完成用户登录、身份认证、数据匹配等;网页动态生成技术( a s p 、i s a p i 、c g l 等) ,根据用户数据动态生成网页:数据推送技术,实现主动服务:过程跟踪技术, 跟踪用户身份、监控用户过程,例如c o o k i e 等:安全身份认证技术。提供安全严 密的身份认证管理,例如x 5 0 9 、p k i 技术等:数据加密技术,保障数据( 尤其是 私密数据) 在网络环境下的安全传输,例如公开密钥技术、s s l 协议等:智能代理 技术,克服搜索引擎和在线浏览的缺陷,智能化的理解用户的信息需求,使用自 然语言、信息检索、机器学习等,为用户提供准确、可靠、方便的信息。丽数掘 推送技术是完善个性化信息服务的关键技术。推送技术又称p u s h 技术或w e b c a s t i n g 技术( w e b 广播技术) ,它实质上是一种软件,可以根据定义的准则,自动 搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传送至用户指定的“地 点”。因而从技术上看,推送技术就是具有一定智能性的、可以自动提供信息服务 的组计算机软件。或者将其描述为,基于i n t e m e t i n t r a n e t 网络环境下一个商度 专业化、智能化的网络专题信息服务系统。该软件能够根据用户提供的兴趣类型 主动从网上搜寻信息推送给用户。 东北大学硕士学位论文第一章绪论 1 2 3 个性化信惠服务模式的探讨 ( 1 ) 个性化信息咨询 网络个性化信息咨询是指信息咨询顾问和用户之间借助于各类网络进行信息 传递和交流,具体地说,就是信息咨询顾问针对用户的信息需求,利用各类网络 检索、选择、加工、传递信息,并形成信息咨询报告,提供给用户。要做好这 :作,除了要提高情报咨询部门员工的素质外,还要拓展图书馆的专业空l 、日j ,;u 以建立多个分门别类的专业咨询系统,每一大类又可细分为若干个小类,每个小 类可由若干名不同层次的人员组成,可分成专家咨询、专业咨询、一般咨询等, 当然每一等级的咨询系统的收费标准也不一样,这样用户就能找到他所需要的服 务。 f 2 ) 推送服务 目前,在个性化信息服务中应用的最多的智能信息代理技术主要是推送技术。 其实质上是借助一种特殊的软件系统,该软件能够根据用户事先向系统输入的信 息请求( 包括用户的个人档案、用户个人信息主题、研究方向等) ,主动地在网上搜 索出符合用户需求的主题信息,并经过筛选、分类、排序,按照每个用户的特定 要求,在适当的时候传递给用户指定的“地点”。可见推邀模式网络信息服务就是 基于i n t e r n e t i n t r a n e t 网络环境的一个高度专业化、智能化的网络专题信息服务系 统,它将成为未来个性化服务的基础性技术支撑。接送服务突出的是信息的主动 服务,即改“人找信息”为“信息找人”,通过邮件推送、“频道”推送、预留网 页等多种途径,送信息到人。如清华同方公司最近推出“c n k i 数据交换服务中心”, 向全社会各类结构和个人实施个性化服务,其中,个人数字图书馆可以开展订阅 型推送服务、检索型推送服务、邮件型推送服务。订阅型服务主要用于期刊报纸 类电子版的订阅,系统定麓就资料通过电子酆件系统发送给用户;检索型攥送服 务需要用户详细给出自己的检索要求,系统定期将最新的相关资料发送给用户。 f 3 ) 课题检索服务 课题检索是图书馆个性化服务的一项重要工作,尤其在普通高校,馆长是学 术委员会成员,学校每年都有立项课题,馆长了解立项情况,围绕科研谍题开腰 服务是图书馆的中心工作,扶课题立项直到成果的评审的整个过程。图书馆应始 终担任跟踪服务的角色,课题研究工作者虽然具有专业特长,但在使用检索工具 和文献数据库方面,他们往往不如图书馆专业人员得心应手。 f 4 ) 呼叫服务 东北走学硕士学位论文 第一章绪论 呼叫服务是一种最新发展起来的专门提供一对一用户服务的系统,这种服务 是集电话、传真机和计算机等通信和办公设备于一体的交互式服务系统,有人f 坐席、自动语音设备等,可以宜接回答用户咨询问题,用户可以通过电话、传真 及m o d e m 拨号接入和访问互联网站并进入图书馆服务系统,对图书馆来说开展 呼叫服务必须具有全方位功能,其服务中心应该全天2 4 小时值班,若不能全天2 4 小时值班,夜间必须开通自动语音系统,以便回答用户咨询的简单问题。 由于个性化信息服务的目的是为了改变以往的网络提供什么,用户就得接受什 么的方式,达到用户需要什么,网络就提供什么的方式,真正实现以用户的需求 为中心的服务模式。随着经济与现代信息技术的不断发展,技术与技术之问的有 机结合,相信个性化的信息服务将具有十分广阔的前景和更好的经济与社会意义。 1 2 4 个性化信息服务分类 国内外关于个性化信息服务的研究很多,而且个性化服务的研究是和人工智能 a g e n t 、多a g e n t 系统的研究及数据挖掘的研究相结合的。目前存在着许多个性化 服务系统,它们提出了各种思想以实现个性化服务。 ( 】) 个性化服务系统根据其所采用的推荐技术可以分为两种:基予规则的系 统和信息过滤系统。信息过滤系统又可以分为基于内容过滤系统和协作过滤系统。 基于规则的系统如:i b m 的w e b s p h e r e ,b r o a d v i s i o n ,i l o g 等,它们允许系 统管理员根据用户的静态特征和动态属性来制定规则,一个趣则本质上一个语句, 规则决定了在不同的情况下如何提供不同的服务。基于规则的系统其优点怒简单、 直接,缺点是规则质量很难保证,而且不能动态更新,此外,随着规则的数量增 多,系统交得越来越难以管理。 基于内容过滤的系统如:p e r s o n a lw e b w a t c h e r ,l e t i z i a ,c i t e s e e r 和 w e b p e r s o n a l i z e r 等,它们利用资源与用户兴趣的相似往来过滤信息基于内容过 滤的系统其优点是简单有效,缺点是难以区分资源内容的品质和风格,而且不能 为蹦户发现新的兴趣点,只能发现和用户已有兴趣相似的资源。 协作过滤系统如s i t e s e e 等,它们利用用户之闯的相似性过滤信息。基于协作 过滤系统的优点是能为用户发现新的感兴趣的信息,缺点是存在两个很雉解决的 问题:一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评 价系统很难利用这些评价来发现相似的用户,另一个是可扩展性,亦即隧着系 统用户和资源的增多,系统的性能会越来越低。 还有一些个性化服务系统如:w e b s i f t ,f a b ,a n a t a g o n o m y 和d y n a m i c 东北大学硕士学位论文 第一章绪论 p r o f i l e r 等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种技术可 以克服各自的一些缺点,但是为了克服协作过滤的稀疏性问题,可以利用用户浏 览过的资源内容与其用户对其他资源的评价,这样可以增加资源评价的密度。利 用这些评价再进行协作过滤,从而提高协作过滤的性能。 ( 2 ) 根据个性化信息服务系统运行的地点和目的不同,又可将它分为两种类 型:一种是运行在搜索引擎网站的服务器上,称为智能搜索引擎( i n t e l l i g e n ts e a r c h e n g i n e ) ,其目的是为群体用户搜索网络资源,并将搜索到的网络资源在搜索引擎 网站服务器上建立索引,为用户提供检索服务。一种是运行在网络用户的客户端 称为智能浏览器( i n t e l l i g e n tb r o w s e r ) ,其目的是为单个用户搜索和浏览其感兴趣的 主题。 智能测览器f 2 ,也就是在现有溯览器的萋础上提出了个性化服务技术,使用 a g e n t 技术,利用a g e n t 的自治性,健壮性,智能性,动态适应性,通过智能学习, 掌握和了解用户的兴趣,爱好,建立用户的兴趣空间,构造建议器,经过一段时 间的学习和训练后,能够成为用户的个人浏览助手,帮助用户在i n t e r n e t 中浏览信 息。 本文主要研究和讨论智能浏览器系统。 1 2 5 国内外研究现状 国外卡耐基梅隆大学开发的w e b w a t c h e r 是一个非常著名的导航器,运行在 服务器上的系统,它介于用户与w w w 之间,用户在测览器中通过键入一个描述 自己兴趣的主题词进入w e b w a t c h e 的主页面。w e b w a t c h e r 接受请求后用一个嵌入 了w e b w a t c h e r 命令菜单的界面替换掉当前页面,使w e b w a t c h e 伴随用户浏览嘲 络。它将不断地给用户推荐一系列站点并建立超链接。由于w e b w a t c h e r 运行在服 务器上,所以它可以记录数以万计的用户数据来训练自己,从而不断更新知淤。 如果用户指示某次检索结果是成功的,w e b w a t e h e 会对每一个超链接用代表用j 。 兴趣的关键词加以注释,并存入知识库。 l e t i z i a 和w e b w a t c h e r 不同,它是一个运行在客户端的系统,它收集有关用户 测览习惯的信息,熟悉用户的兴趣爱好,并使用各种扁发式策略对现有的知识进 行推理,从而实现了一个w e b 上有限资源的智能搜索。 德国的a l e x a n d e r p r e t s c h n e r 和美国的s u s a n g a u c h 一起研究基于o n t o l o g y ( 作 为概念层次) 的个性化搜索。用户的个性化模型( 用户概貔) 建立为单个用户在w e b 上浏览历史的函数,是一个由大约4 3 0 0 个节点( 使用空间向量模型) 组成的加权概 东北大学硕士学住论文 第一章绪论 念层次,用户概貌根据用户在某一页面上停留的时间和页面的长度进行修正。该 系统目标是通过搜索结果与用户概貌的匹配来重新摊序和过滤搜索结果从而提 高搜索系统的性能。 1 4 本文的研究工作 本文将以一个基于a g e n t 技术的辅助浏览器a h b r o s w e r 为基础,具体磺究如 何使用a g e n t ,w e b 挖掘等技术为用户提供辅助浏览服务,研究的问题主要包括: 1 ) 为什么要采用基于a g e n t 技术的智能辅助浏览系统? f 2 、系统如何获得用户的浏览行为,并记录它? ( 2 ) 系统如何对应用w e b 挖掘技术进行处理得到各种信息? ( 4 1 系统如何使用推荐技术为用户提供服务? ( 5 ) 推荐系统以何种形式将推荐信息返回给用户? ( 6 ) 系统的性能怎么样? 1 5 本文组织结构 第_ - 2 章a g e n t 技术与w e b 挖掘技术的研究。 主要介绍a g e n t ,w e b 挖掘相关知识。 第三章基于a g e n t 技术的智能辅助浏览系统的设计与实现。 主要介绍系统的体系结构的划分,各模块的相关技术,算法及具体实现。 第四章智能辅助浏览系统实验结果分析 主要使用实验数据对系统的特点进行分析,与传统朴素贝叶斯分类进行比较 及从时间和效率两个方面对系统作出评测。 第五章结束语 主要介绍论文的意义和贡献及下一步研究工作。 东北大学硕士学位论文 第二章a g e n t 技术与w e b 挖掘技术研究 第二章a g e n t 技术与w e b 挖掘技术研究 2 1a g e n t 技术 2 1 。1 a g e n t 定义 a g e n t 理论最初是作为一种分布式智能的计算机模型被提出来的1 2 ,当6 $ a g e n t 和多a g e n t 系统已经成为计算机科学和分布式人工智能研究的一个重要方 向。事实上,在人工智能研究走过的4 0 多年时间里,熬个a i 发展的道路是曲折 的,7 0 年代由于专家系统的提出和知识工程的应用,a i 进入了兴旺时期,但s o 年代末到9 0 年代初走入低潮,引起了a l 界的反思,尽管最近十年问取得了腾 成就但在总体上a i 在方法和技术上还只能处理那些“成型”的问题,如利用成 功的经验知识进行求解的模式,面对现实环境的变化无能为力。因此,引入a g e n t 和多a g e n t 以试图走出一条a i 的研究路线,从雨在智能a g e n t 的水平上实现a j 学科的核心内容与目标。 m i n s k y 在思维的社会一书中提出了a g e m ,认为“社会中的某些个体经 过协商后可求得问题的解,这些个体就是a g e n t ,他认为a g e n t 是具有技能的个体”, 因此,a g e n t 应具有社会交互性和智能性。w o o l d r i g e t 和j e n n i n g s 在归纳了多数研 究者的观点的基础上,提出将a g e n t 视为拥有一下基本特征的软件系统。 ( 1 ) 自治性( a u t o n o m y ) :在没有入或其他系统软件的直接干预下,能自行操作 并以某种方式控制自身的动作及其内部状态。 ( 2 ) 社会性( s o c i a la b i l i t y ) :它也称为协作性,能够通过某种a g e n t 逶信语言与人 或其他a g e n t 相互作用。 ( 3 ) 响应性( r e a c t i v i t y ) :它能够接受环境的信惠并作出反应,这墨环境包括其他 的a g e n t ,人及i n t e r n e t 等,并能及时响应环境的变化。 ( 4 ) 能动性( p r o a c t i v e n e s s ) :它不仅仅能对环境作出反应。而且呈现目标驱动的 特征。 根据上述定义,a g e n t 是可以见到一个子程序,一个进程,也可以是一个复杂 的软件机器人( s o f t b o t ) 。所以为a g e n t 下确切的定义是非常困难的。实际上,a g e n t 应视为伞形术语,这样各种技术均可容纳于其下,从不同侧面反应a g e n t 的菜 东北大学硕士学位论文 第= 章a g e n t 技术与w e b4 9 t & , 捷术研究 方面的含义,不过,其总体上应可设想为能代表用户去执行计算和信息处理任务 的镪能化软件实体。 a g e n t 的另一方面是多a g e n t 系统,多a g e n t 系统试图用a g e n t 来模拟人的理 性行为,主要应用在对现实世界和社会的模拟、机器人、和智能机械等领域。而 在现实世界中生存、工作的a g e n t 要面对的是一个不断变化的环境。在这样的珥 境中,a g e n t 不仅要保持对紧急状况的及时反应,还要使用一定的策略对中期的行 为作出规划,进而通过和其他a g e n t 的建模分析来预测未来的状态,以及通过通 讯语言实现和其他a g e n t 的协作和协商。 现在,a g e n t 和多a g e n t 技术目前应处于研究和开发阶段,将其转变为实用的 软件智能化技术仍面临巨大的挑战。 2 1 2a g e n t 的分类与应用 目前,各式各样的a g e n t 研究项目和成果很多1 2 1 ,可以从流动性、思考性和行 为特性来进行分类分析。 流动性:以能否在分布计算的环境中移动,将a g e n t 分为静止型和流动型。 思考性:以能否基于知识表示和符号推理技术去规划和协调自身在协同工作中 的行为,将a g e n t 分类为思考型和反应型,后者不作符号推理,其行为是对环境 状态的反应。 行为特性:依据a g e n t 拥有的行为特性分类。理想a g e n t 的基本特性酊归纳为 3 个:自治性、合作性和学习性。 这里自治性包含主动性,而合作性则建立在社交能力和响应性基础上。囊l 卜的 智能化a g e n t 应具有学习能力,以便在与外部环境相互作用的过程中逐步提高适 应性。理想的a g e n t 尚未到达实用阶段,目前实用的a g e n t 逶常只具备这3 个基 本特性中的两个,如图2 1 所示: 另外,如果从a g e n t 所扮演角色来分,a g e n t 则可分为信息a g e n t 、任务a g e n t 和接口a g e n t 等。但需要注意的是,以上的各个方两作分类分析并不是完全独立 的,也不是完备和精确的。不过,我们研究分类的匿的不在于分类研究本身,只 是想区分出值得推广应用的一些a g e n t 类。从以上的分类分析,可鉴别出5 类有 实用前景的a g e n t :合作型a g e n t 、接e l 型a g e n t ,流动型a g e n t 、信息型a g e n t 和反应型a g e n t 。 在上面的五类中,现阶段比较实用的蠢三类a g e n t :接口型a g e n t 、流动型a g e n t 和信息型a g e n t ,其中,接口a g e n t 协助用户处理各种专门的应用;流动a g e n t 能 东北大学硕士学位论文第二章a g e n t 技术与w e b 挖掘技术研究 与i n t e r n e t 上的其他主机交互、代表主人( 流动a g e n t 的拥有者) 到这些主机收集所 需信息或处理结果,然后返回到主人拥有的主机:信息a g e n t 用于访问信息源 收集和处理从这些信息源得到的信息,回答用户或其他信息a g e n t 的问题。下面 我们就对这三类a g e n t 简略介绍。 理想型 a g e n t 合作型 a g e n t 接口型 a g e n t 图2 1 基于行为特征的a g e n t 分类 f i g 2 。la g e n tc l a s s i f i c a t i o nb a s e do nb e h a v i o rc h a r a c t e r 21 2 1 接口型a g e n t 接口型a g e n t 最常见的是智能个人助理,它们强调自治性和学习能力,能将任 务的复杂性隐藏起来,协助用户轻松地完成很困难的任务。用户可以提出高层次 的要求,而它们通过搜索和推理,找到方法来实现用户的请求。它们能发现并容 忍用户请求中的模糊、遗漏甚至错误。它们能够通过观察用户的操作、兴趣、习 惯和偏爱,自动建立用户模型,从而按照用户的习惯,爱好为用户完成任务。它 们还能对用户进行训练和辅导,帮助用户与其他用户协调地工作。当然,接口型 a g e n t 也允许用户独立地进行操作,就像助手一样,在用户旁边观察用户的操作, 发现并学习用户的工作模式、爱好。在熟悉了用户的工作、爱好之后,就可以帮 助用户做更多工作,大大减轻用户的工作负担。 一般情况下,可以从4 个方而学习: ( 1 ) 观察用户的行为,即监视跟踪用户的操作,发现其规律件及重复模式。 ( 2 1 利用用户的反馈信息,在a g e n t 向出户提出建议后,用户可能会否定这一 建议,或者采用不同的操作。 ( 3 ) 用户提供实例对a g e n t 进行训练。 ( 4 ) 向执行同样任务的其他用户的a g e n t 询问。当用户的a g e n t 对某一情况不知 如何处理时可以向服务于其他用户的a g e n t 发出询问,以该a g e n t 的回答作为 借鉴。特别是,当该用户是某一领域的专家时其他用户的a g e n t 在处理该领域 的问题的过程中就可向用户的a g e n t 询问处理方法。 东北走学硕士学位论文第二章a g e n t 技术与w e b 挖掘技术研究 这里,前3 种均为从用户学习的方式,请求其他接1 2 1 型a g e n t 的帮助通常仅限 制二 获取建议,并非协同工作。学习方法主要局限于较简单的死记硬背和参数调 整模式,尽管引入更先进的学习方法已在研究和开发中。 智能个人助理的学习功能使得最终用户和应用开发者的工作量显著减少,有利 于系统自动适应用户的喜好和习惯,并根据他的喜好和习惯完成用户的任务。 典型的智能个人助理是m a e s 设计的应用于计算机辅助教学的a g e n t ,如图22 所示,用户正在学习应用某个软件,如电子表格或操作系统,智能个人助理则观 察和监视用户与计算机交互时的输入操作,学习用户的操作捷径,并建议执行任 务的更好方式。 1 卜挈叫 用户 卜 应 、一一1 1 用壶察遗 l 反馈意见和 、一p 一产一? j - 一一交互+ 用户 请求叫另一用户接口型a g e n t 圈2 2 接口型a g e n t 。 作状况 f i g 2 2t h eo r d e ro fi n t e r f a c ea g e n t 从近年来开发的许多智能个人助理中,可归纳出这类a g e n t 在人机交互中所引 起的智能作用如下: ( 1 1 作为主动帮助用户的敏捷助手。 ( 2 ) 作为用户查询所需信息的导航。 f 3 ) 作为用户的记忆助手。 ( 4 ) 作为信息筛选和评价助手。 ( 5 ) 作为需求匹配助手。 ( 6 ) 作为用户在电子商业中产品的买卖代表。 ( 7 ) 作为用户娱乐生活的助手。 2 1 2 2 流动型a g e n t 在网络技术高速发展的今天,人们可能每天都要在嘲上做各式各样的查询。 最经常使用的查询方式可能是基于关键字或基于内容的检索,这需要信息查询程 序从i n t e r n e t 的各个信息源下载许多可能相关的文档,显然大薰文档的下载需要昂 贵的通信费用,并易于引发通信堵塞。于是,一个基本的设想是a g e n t 不必有固 定的驻留位置,而使用流动型a g e n t 漫游分布于网络的信息源,就地搜索信息- 东北走学硕士学住论文 第二章a g e n t 技术与w e b 挖掘技术研究 并把结果返回给用户,以大幅度减少通信量。如此可见,所渭流动型a g e n t 是指 能与i n t e r n e t 上的其他主机交互、代表流动型a g e n t 的拥有者到这些主机收集所需 信息或处理结果,并把结果返回给主人拥有的主机的智能软件。流动型a g e n t 既 其有自治性也表现出合作性。流动型a g e n t 需要的合作不属于协同工作,仪表示 为一个a g e n t 要求其他a g e n t 提供所需的数据或信息。例如,漫游到菜一薹机上: 的a g e n t 要求本地a g e n t 为它提供需操作的对象和方法在该主机上的地址。 一般情况下,流动型a g e n t 可以获得比静止型a g e n t 高得多的性能,归纳起 来其优势可表现任如下几个方面: ( 1 ) 可以缩减通信代价,尤其是在查询多媒体信息的情况下。 ( 2 ) 只需有限的本地资源去处理和存储由流动型a g e n t 返回的结果。 ( 3 ) 易于协调,因为协调若干独立的远程询问并校对返回的结果是简单的。 ( 4 ) 异步计算,因为派遣流动型a g e n t 后主机可以傲其他事情,不必等待;流动 型a g e n t 会将处理结果返回到用户的电子邮件信箱。 ( 5 提供一个自然的执行“自由市场”贸易服务的开发环境,新的服务髓动态地 到来和离去、灵活的和较差的服务可以共存,从两给消费者更多的选择机会。 ( 6 ) 灵活的分布计算环境,流动型a g e n t 的运行方式不同予静止型a g e n t 。7 1 4 创 了一种革新的分布式计算方式。 目前主导的流动型a g e n t 设计和操作手段是t e l e s c r i p t ,它是一个解释执行的 面向对象的远程程序设计语言。t e l e s c r i p t 语言的瓣释器和运行环境构成t e l e s c r i p t 机通过称为t e l e s c r i p t a p i 的应用程序设计接口,多个t e l e s c i p t 机可以集成到宿 主机的操作系统。如图2 3 所示: ,:j 、 i ! 竺! 竺l l r 广某操作服务地址 : i i ,一 i t - f m l b 厶一莱摄作鹰务地址 、l 一l ,p 、= 正五口一1 丽i l 一 一上! ! :! ! 竺 移动到地址 j d x 找瑚i ,f 宿主帆撮作系统 1,。一 f r ,“、k 一 、 rt 、 一fi n t e r n e t : 、 、 j ,r 图2 3t e l e s c r i p t 应用舫体系结构 f i g 2 3t h es y s t e mf r a m eo ft e l e s c r i p t 构成一个t e l e s c r i p t 应用的3 个主要概念是p 1 a c e s ,a g e n t 和0 0 。其中,p l a c e s 定义可提供的操作服务所在的唯一的网络地址:p l a c e s 具有层次结构,即一个 东北大学硕士学位论文第二章a g e n t 技术与w e b 挖掘技术研究 p l a c e s 可以包含随意数目和深度的下层p l a c e s 。a g e n t 由t e l e s c r i p t 语言定义,一 个t e l e s c r i p t 机可以容纳多个共享数据和信息的a g e n t 。p l a c e s 和a g e n t s 均视为由 t e l e s c r i p t 机解释执行的过程,不过a g e n t 不能包含其他过程,但能在不同的网络 站点间漫游。当某a g e n t 需要启动定义在某一站点的操作服务时,其必须先移动 到那个站点,再就地启动它。两个或更多的a g e n t 能够会合在同一地点,通过应 用m e e t 命令,以使它们能相互提供操作服务。 “g o ”是推动过程间( 尤其是a g e n t s 间) 通信的原语,其请求获取所需操作服 务驻留的网上地址,即目的地。一旦获取到该目的地址,t e l e s c r i p t 机就可将相关 的数据、栈和指令指针与要派遣的a g e n t 封装在一起,发送该a g e n t 穿越浩翰的 i n t e n e t ,到达目的地。目的地t e l e s c r i p t 机则解歼封装,校对权限,然后让该a g e n t 在权限范围内自主操作,即启动目的地有关操作服务。一旦完成工作,该a g e n t 再返回出发地原主机。而当某站点拒绝接收外来a g e n t 时,站点间的合作失败。 在自由市场模式下,流动型a g e n t 技术十分诱人。如上所述,各种操作服务 可以在i n t e r n e t 上就地安置,就等这类a g e n t 前来漫游,协商服务的提供,启动服 务,为服务付账,并将结果返回给a g e n t 的主人。所以,尽管目前流动型a g e n t 应用还不多,但预料短期内会快速增长。特别是随着t e l e s c r i p t 技术的免费公开发 行,各种基于该技术的应用已经在开发中。如索尼公司开发的m a g i cl i n k p d a 和 p i c ( p e r s o n a li n t e l l i g e n tc o m m u n i c a t o r ) 已经商品化,可用以辅助管理用户的电子邮 件、传真、电话以及i n t e r n e t 的消息传送和通信服务。此外,t e l e s c r i p t 技术自身 也在进化为活跃的w e b 工具技术。 但流动型a g e n t 技术让很不成熟,还存在很多问题,特别是安全性问题。如何 使之安全地出入于各种组织或个人私有网络,方便快捷地服务于人类,同时) ( 能 确保维护主人的隐私,不被黑客利用,不感染病毒,不损害系统的正常运行等等。 这些将成为研究和开发流动型a g e n t 技术所面临的新的难题。 21 2 3 信息型a g e n t 信息型a g e n t 与前面的流动型a g e n t 和接口型a g e n t 功能上可能有些重叠 因为它们的分类方法不同,信息型a g e n t 则是按功能角色鉴别的,而前二者是按 行为特性分类的。信息a g e n t 是实际需要的产物。随着i n t e r n e t ,尤其是高速信息 公路的快速发展,人们迫切需要先进的计算机工具帮助他们管理、操纵和整理来 自分布的信息源的爆炸量信息,解决所谓的信息超载问题,信息型a g e n t 应运而 生。这里最大的挑战是如何建立简单的用户界面,使得应用信息类a g e n t 进行信 息搜索和查询,就像人们打电话和读报那样轻而易举。近年来,科学技术和商业 东北大学硕士学位论文笨二章k g e n t 技术与w e b 挖掘技誉研究 信息的快速膨胀,推动了信息型a g e n t 技术的开发。 由于信息型a g e n t 按功能角色鉴别的特性变化放大,既可以是静止的或流动 的,也可以是非合作型的或需要协作的,还可以有或无学习功能,所以不存在标 准的操作模式。尽管能在网络上漫游的信息型a g e n t 前景诱人,但目前主流的工 作方式仍是静止驻留于用户的本地站点。 一个典型的信息a g e n t 工作环境如图2 4 所示。该a g e n t 嵌入网络浏览器,并 使用一套i n t e m e t 索引和搜索工具去收集用户请求的信息。一种有效的网络索引和 搜索工具称为s p i d e r ,它通过深度优先的搜索为分布于w w w 的信息源建立索引 包括将w w w 的拓扑结构存贮于d b m s ,将u r l 索引存贮于称为w a i s 的索日l 系 统,一旦某信息型a g e n t 接收到用户请求收集和整理某个主题的信息时,它就通 过网络索引和搜索工具从w w w 快速检索到相关文档,下载到本地站点。 信息型a g e n t 的典型应用实例是e t z i o n i 和w e l d 设计的i n t e m e ts o f t b o t 。尽 管其仍处于原则开发阶段,但他们已经表现出较高的性能。用户只需提出高级请 求,而由该s o f t b o t 应用搜索和推理知识决定如何满足请求,并容许用户的请求中 出现二意性、省略和不可避免的错误。s o f t b o t 模拟机器入的方式去描述与i n t e r n e t 的接口,把发送信息的网络设备( 如f t p ,t e l n e t 。e m a i l 等) 以及各种文件操作命令 视为促动器,而提供信息的网络设备( g o p h e r ,n e t f i n d 等) 以及各种文件操作命令则 为传感器。 翻2 4 典型的信息型a g e n t 的f 作环境 f i g 2 4t y p i c a lw o r k i n gc o n d i t i o no fc o m m u n i c a t i n ga g e n t 预计信息型a g e n t 的应用将在今后几年内大幅度增长,因为这方面技术的开发 比前几类更趋于成熟。例如:在美国的b t 实验室,1 9 9 5 年开发的称为j a s p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 监管公司准入管理制度
- 白酒仓库库存管理制度
- 职工驿站日常管理制度
- 职工师生健康管理制度
- 与群众协同管理制度
- 电厂培训基地管理制度
- 种植质量安全管理制度
- 乡政府收支管理制度
- drg付费管理制度
- 管网建设安全管理制度
- 2025年安徽省中考数学试卷真题(含标准答案)
- 2025至2030年中国高纯氧化镁行业市场运行格局及前景战略分析报告
- 高级记者考试试题及答案
- 2025国家开放大学《高级财务会计》期末机考题库
- 2025至2030年中国电工开关行业市场发展潜力及前景战略分析报告
- 贵州毕节中考试题及答案
- 北京市朝阳区2023-2024学年三年级下学期语文期末考试卷
- 2025年烟花爆竹经营单位主要负责人模拟考试题及答案
- 租房合同到期交接协议书
- 道路人行天桥加装电梯导则(试行)
- 中国废旧轮胎橡胶粉项目投资计划书
评论
0/150
提交评论