




已阅读5页,还剩48页未读, 继续免费阅读
(计算机应用技术专业论文)基于移动agent的分布式个性化推荐系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
:! 查竺竺主竺苎竺苎苎竺竺! ! ! 竺! 竺竺! 苎! 竺兰苎苎苎竺 基于移动a g e n t 的分布式个性化推进系统研究 摘要 信息过载和资源迷向己经成为制约人们高效使用i n t e r n e t 信息的瓶颈。信息 过载是指用户面对太多的信息难以及时地消化、吸收;资源迷向是指用户不知 道如何确切地表达对网上资源的需求,也不知道如何准确有效地寻找资源。而 个性化推荐系统能够根据用户的兴趣偏好主动推荐他所需的资料。它的出现解 决了人们寻找信息难的问题,并且在电子商务中得到了广泛应用。 目前有很多类型的推荐系统,每种推荐系统都嵌入了特殊的算法来计算两个 相关对象的相似性。所以,这些推荐系统一般都只适用于一定范围的推荐应用, 往往很难做到对所有情况的最优化,因此,随着推荐方法的数目的不断增长和 用户兴趣的变化,我们认为最好的办法就是允许多种推荐方法同时存在,本文 引入了移动a g e n t 思想,提出了一个基于移动a g e n t 的分布式个性化推荐系统 架构m a b d p r s 。该系统允许多种推荐方法同时为用户生成推荐,并能协同它 们共同工作,从而能够弥补单一推荐方法的不足,满足多种推荐需求。另外, 由于该系统是开放的、分布式的计算系统,新的推荐方法能够灵活地加入到系 统中,使系统更能适应复杂多变的应用环境。 论文首先提出基于移动a g e n t 的分布式个性化推荐系统的框架结构并分析了 其运行机制,随后详细讨论了该系统中的几个关键技术。另外,采用本论文所 提出的体系结构模型,作者采用j a v a 语言在旭i e t 平台上设计实现了一个原型 系统,并通过应用实例说明了系统达到了预期目标,验证了论文思路的正确性。 i l f 移动a g e n t 的分布式十性化推荐曩兢 最后是工作小结和未来展望。 关键字:推荐系统;移动a g e n t ;分布式计算;资源分配;拍卖 ! 查竺竺兰竺竺竺查苎竺竺! ! ! 竺竺竺! 苎! 竺兰苎曼苎苎 am o b i l e - a g e n t - b a s e dd i s t r i b u t e dp e r s o n a l i z e d r e c o m m e n d a t i o ns y s t e m a b s t r a c t n f o r m a t i o no v e r i o a da n di n f o r m a t i o nd is o t i e n t a t i o na r eo b s t r u c t i o n s w h i c hr e s t r a i np e o p i ef r o mu s i n gi n t e r n e ti n f o r m a t i o ne f f i c i e n t i y i n f o r m a t i o no v e ri o a dm e a n st h a ti ti sd i f f i c u i tf o rp e o p l et oa b s o r ba n d u n d e r s t a n din f o r m a tio nw h e nf a cin gs om u c hd a t a in f o r m a tio n d is o r i e n t a t i o nr e f e r st ot h es t a t et h a tp e o p i ep u z z i eh o wt oe x p r e s sa n d s e a r c hin f o r m a tio nt h a tt h e yn e e d p e r s o n ai iz e dr e c o m m e n d a tio ns y s t e m c a nr e c o m m e n din f o r m a tio na u t o m a tic aiiya c c o r d in gt ou s e r s in t e r e s t ts o i y e st h ek n o t t i n e s st h a tp e e p i et r o u b i et of i n di n f o r m a t i o n a n d h a sw i d e i ya p p iie di nt h ee l e c t r o n i cc o m m e r c e aia r g en u m b e ro fr e c o m m e n d a tio nfi it e rin gm e t h o d sh a v eb e e nd e v eio p e d e a c hr e c o m m e n d e rs y s t e mt y p i c a ii ye m b e d ss o m es p e c i f i ca i g o r i t h mt o c o m p u t ec o rr e i a t i o n s ( t h es i m ii a r i t yo ft w or e l e v a n to b j e c t s ) s o t h e s e r e c o m m e n d e rs y s t e m sa r eu s e dt ob e e na p p ii e di ns p e c i a is j t u a t i o n sa n d th a sb e e ns h o w nt h a tn oo n et e c h n i q u eisb e s tf o ra i iu s e r si na s i t u a t i o n s g i v e nt h e s eo b s e r v a t i o n s r e c o m m e n d a tio nm e t h o d sa n dinf a c eo f w j t ht h eg r o w in gn u m b e ro f e v o i v i n gu s e r s in t e r e s t s 。w e b e ii e v et h eb e s tw a yf o r w a r di nt h i sa r e ai st oa ii o wm u i t i p i e r e c o m m e n d a tio nm e t h o d st oc o e xis t t oc o m b a tt his 。t h ep a p e rd e v eio p e d am o biie - a g e n t b a s e ddis t rib u t e dp e r s o n ai iz e dr e c o m m e n d a tio ns y s t e m ( m a b d p r s ) t h a ta li o w sm u i t i p i er e c o m m e n d a t i o nm e t h o d st oc o m p e t ew i t h o n ea n o t h e rt op r e s e n tt h eirb e s tr e c o m m e n d a tio n st ot h eu s e r t hiss y s t e m 1 1 1 - i 夫掌砸学位馘? x 羞f 移动a g e n t 的9 布式十t 推荐鼻藏 c a nm a k eu dt h es h o r t a g eo fsin gier e c o m m e n d a tio nm e t h o da n d s a tis f y v a r i o u sr e c o m m e n d a t i o nn e e d s a n d ,t h es y s t e miso p e na n dd is t r i b u t i o n a n dn e wr e c o m m e n d e rm e t h o dc a nb ea d d e de a s iiyinf a c eo fc o m pi ic a t e d a n d v o i a t ii ea p p ii c a t i o ne n v ir o n m e n t t h ep a p e rd e v eio p e daf r a m e w o rko ft h em o biie - a g e n t b a s e d dis t rib u t e dp e r s o n aiiz e dr e c o m m e n d a tio ns y s t e m ( m a b d p r s ) a n da n aiy sis o p e r a t i o nm e c h a n is m f o ii o w in g ,w ed is c u s ss e v e r a ik e yt e c h n i c a p r o b ie m sa b o u tt h es y s t e m 。t h ea u t h o rd e v eio p sas y s t e mp r o t o t y p aia t a g ie tpia t f o r m a n dd e m o n s tr a t e dt h a tt h es y s t e ma c hie y e de x p e c t a tio n a i ma n di ti sr i g h tint h ep a p e r st h o u g h t a ti a s t t h ep a p e rp r o v i d e s as u m m a r yo ft h ew o r ka n ds o m e t h ;n ge x p e c t e d k e yw o r d s :r e c o m m e n d e rs y s t e m ;m o b i l ea g e n t :d i s t r i b u t i o nc o m p u t e r e s o u r c ed i s t r i b u t i o n :a u c t i o n | l f 穆口a g e n t 的分布j 汁性抻:荐最垃 1 1 论文的研究背景及意义 第一章绪论 i n t e m e t 的迅猛发展将人类带入了信息社会和网络经济时代,对企业发展和个人生活都 产生了深刻的影响,w e b 已成为人们获取信息的一个重要途径。美国c y v e i l l a n c e 公司于2 0 0 0 年针对i n t e m e t 规模发表的调查报告1 1 增出,当时i n t e m e t 的网页总数超过2 1 亿页,但到2 0 0 5 年初,仅g o o g l e 搜索引擎索引的网页就已经超过了8 0 亿。i n t e m e t 信息量的爆炸式增长由此 可见一斑,目前i n t e r n e t 的网页总数应该在4 0 0 亿左右。由于w e b 信息的日益增长,人们不 得不花费大量的时间去搜索、浏览自己需要的信息,并且要找到正确的、用户需要的信息也 越来越困难,这种现象就是信息过载【2 1 。 在征服信息过载方面,搜索引擎等检索工具得到了广泛的应用,它可以给人们在寻找信 息时提供一定的帮助,提高查找信息的效率,但这种信息检索技术和用户信息的需求之间仍 然存在许多矛盾,主要体现在以下几个方面: l 、 使用搜索引擎进行信息查找,只要所输入的关键字相同,就会返回相同的信息, 而不会考虑到不同用户的不同兴趣爱好。而且,返回的信息往往成千上万,良莠 不齐,还需要用户花费大量的时间精力去筛选以期获得自己真正需要的信息。 2 、 网络上的信息是动态变化的,往往这种变化是用户最关心的,然而传统的信息获 取方法如搜索引擎并不能主动给用户反映这种变化。 3 、往往具有相同兴趣的用户对信息的需求基本一致,但传统的搜索引擎方式并不能 提供协作过滤功能,因而也就使用户失去了准确获取信息的一个重要方式。 4 、搜索引擎要求用户自己输入关键字,而关键字质量的高低直接影响到返回的结果 的好坏。作为普通用户往往并不能准确地用关键字描述自己的信息需求,导致用 户获取信息的困难。 为了解决以上矛盾,克服信息获取的困难,推荐系统( r e c o m m e n d e rs y s t e m s ) 1 3 j 也就应 运而生。它能从i n t e r n e t 的大量信息中向用户自动推荐出符合其兴趣偏好或需求的资源。推 荐系统有非个性化系统和个性化系统之分。非个性化推荐系统向所有用户提供具有同样内容 的推荐,如电子商务站点的畅销排行。而个性化推荐系统则区分不同的用户或用户群,根据 用户的兴趣爱好,推荐符合用户兴趣爱好的对象。由于个性化推荐系统的信息过滤效果及推 1 ! 查竺竺主竺兰兰查兰兰竺竺皇! ! ! ! 竺兰! 苎! 兰兰苎! 竺 荐被用户接受的程度都远胜于非个性化推荐系统,因而在电影、音乐、产品、新闻和w e b 页 面推荐等方面得到了越来越广泛的研究与应用。个性化推荐技术集成了许多传统的研究方法 ( 如文本信息抽取、数据挖掘等技术) 有很广阔的研究空间,所以它也吸引了大量的研究人 员投入其中。g r o u p l e n s 就是一个很有影响的研究项目,它的关于协同推荐的首篇论文1 4 】,被 认为是推荐技术的“开山之作”。 目前有很多类型的推荐系统,每种推荐系统都嵌入了特殊的算法来计算两个相关对象的 相似性。这些推荐系统一般都只适用于一定范围的推荐应用,往往很难做到对所有情况的最 优化1 5 】。随着推荐方法的不断增多,面i 临用户兴趣的不断变化,我们认为最好的方法是提供 一个开放式的系统框架:它允许多种推荐方法同时存在;它允许新的推荐方法被增加;它能 够协调多种推荐方法的输出以获取最好的推荐信息提供给用户。由于智能a g e n t 的许多特性 决定了它适合解决复杂的系统6 7 】: 1 、它有能力处理开放系统的动态改变。 2 、它为开发复杂的、大型的、不可预知的系统模型提供了强有力的工具,这样,整个问 题可以被分成许多小的、简单的、容易开发和处理的部分。 3 、代理可以帮助系统更加主动,更加智能的完成任务,达到预期目标。 为此,本文通过引入智能a g e n t 思想,提出了一个基于移动a g e n t 的分布式个性化推荐系 统架构m a b d p r s 。该系统允许多种推荐方法同时为用户生成推荐,并能协同它们共同 工作,弥补了单一推荐方法的不足,从而为推荐系统更能适应复杂多变的应用环境、满足多 种推荐的需求开辟了一条崭新的道路。 。1 2 国内外研究现状及水平 随着9 0 年代中期一篇介绍g r o u p l e n s 推荐系统文章的发表,越来越多的研究者投入推 荐技术的研究中,引起了一股研究热潮。a c m 决定于1 9 9 9 年开始每年召开一次电子商务研 讨会,其中推荐技术作为一项重要的议题。同年,w e b k d d 讨论组成立,专门致力于研究 w e b 挖掘技术和推荐技术。另外人工智能会议( a a a i ) 和协同工作会议( c s c w ) 也纷纷 把推荐技术作为研究主题。 国内外对个性化推荐系统的研究主要可分为两方向,一是对推荐系统中算法本身的研究 及应用,二是对推荐系统中各个算法组合方法的研究及应用。这些研究主要是集中在算法的 2 二! 查竺! 圭兰堡竺查兰! 竺竺! ! ! 坐竺竺! 苎! 坠苎! ! 竺 改进或者组合的方法上。 基于规则的系统如i b m 的w e b s p h e r e ( w w w i b m c o m w e b s p h e r e ) , b r o a d v i s i o n ( w w w b r o a d v i s i o n c o m ) ,i l o o ( w w w i l o g c o m ) 等,它们允许系统管理员根据用户的静态特征和 动态属性来制定规则。另外,文献嗍通过一个数据挖掘算法对w e b 数据产生一系列关联规则, 然后根据关联规则建立预测模型,从而提供推荐的效率,减少推荐错误。文献 9 1 利用关联规 则来挖掘项目之间的相关性,然后,利用项目之间的相关性减少协同过滤算法中数据的稀疏 问题。文献f 1 0 1 提出了个关联规则的分级算法,算法通过对比属于同一个关联规则的用户的属 性来度量一个用户同关联规则的相关性。如果适当的对关联规则评级,则基于关联规则过滤 算法的精度就会得到很大改良。文献1 1 1 1 通过定义多个关联规则模板,减少用户不感兴趣的规 则的数目,试验结果显示了推荐的精度有大幅度的提高。 基于内容过滤的系统如p e r s o n a lw e b w a t c h e r 1 2 1 ,c i t e s e e r 1 3 1 ,i f w e b 1 4 1 ,s i f t e r 1 5 1 , 和w e b p e r s o n a l i z e r 1 6 1 等,它们利用资源与用户兴趣的相似性来过滤信息。基于内容的方法 主要被应用于推荐“信息”类项目,如文本,w e b 站点、新闻消息等文本丰富型应用,它往往无 法很好的解决多媒体信息的推荐问题。由于基于内容方法的局限性,现在已经很少有研究者 将其单独作为推荐方法,而是更多的采用这种方法或直接使用信息处理研究领域最新的研究 成果作为改善协同方法的一种途径,与之构成某种混合推荐形式。 协作过滤推荐系统如:w 曲w j t c h c r l 用,l e t sb r o w s e 1 引,g r o u p l e n s 4 1 ,f i r e f l y 1 9 1 ,s e l e c t 2 0 , l i k e m i n d s ( w w w m a c r o m e d i a c o m _ ) 和s i t e s e e r l 2 1 1 等,它们利用用户之间的相似性来过滤信息。 目前很多技术都是围绕协同过滤展开研究的。协同过滤技术是个性化推荐系统中最常用的技 术,围绕协同过滤算法进行研究的文献也很多,它们对协同过滤算法进行了分析和改进以适 应某一领域的应用。 对于混合方法的研究主要集中在混合的方式研究上。f a b 【2 2 1 系统是比较早的一种混合方 法推荐系统,它采用融合的混合方法把基于内容和协同方法结合进行推荐,文献田1 对该方法 进行了详细的描述。还有一些个性化服务系统如:w e b s i f t 2 4 1 和a n a t a g o n o m y 2 5 1 等,也同时采 用了基于内容过滤和协作过滤这两种技术,结合这两种过滤技术可以克服各自的一些缺点, 为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对其他资源的评 价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。 另外,文献【2 6 】提出了线性结合各种推荐组件的方式来混合不同的推进技术。 国内推荐技术的研究在2 0 0 0 年左右才陆续出现了一些相关的论文,文献【2 刀是一篇比较详 3 ! ! 查竺竺圭竺竺竺苎苎! 竺竺! ! ! ! ! 竺兰竺苎! 竺兰苎兰至兰 细的综述,文献【2 8 】提出了对于基于项目的协同方法的改进,文献【2 9 】采用默认评分的策略减少 协同方法的数据稀疏性问题。文献【3 0 】对用户评价矩阵采用k m e a n s 聚类的方法产生推荐。文 献1 3 1 1 从数据挖掘的角度对提高推荐质量进行了有益的探索。文献【3 2 1 提出了一种基于内容预测 和项目评分的协同过滤推荐算法,根据基于内容的推荐计算出用户对未评分项目的评分,在 此基础上采用一种基于项目的协同过滤推荐算法计算项目的相似性,随后做出预测。 由于智能a g e n t 的许多特性决定了它适合解决复杂的系统【6 7 1 。这些优势已经被许多研究 者认识到1 3 3 ,蚓,并且也有许多基于代理的推荐系统被开发:f a b1 2 2 1 ,m e m o i r1 3 5 1 ,l i n k i n g i n c o n t e x t l 3 6 1 。文献口7 1 引入网络智能的思想,利用多a g e n t ( 智能代理) 技术提出了一个基于 a g e n t 的个性化推荐系统架构。与此同时,移动a g e n t 也得到了应用和发展1 3 8 ,3 9 1 。目前移动a g e m 的应用主要有以下几个方面 4 0 4 3 :电子商务,个人助理,安全代理,分布式信息检索等等。 文献】从现有信息服务系统的不足出发,提出了一种基于移动a g e n t 技术的全新信息服务模式, 较好地满足了用户个性化方面的需求;文献4 5 1 在移动电子商务中引入移动a g e n t 技术。文献 4 6 1 将移动a g e n t 应用到了个性化信息检索系统中。 综上所述,推荐系统作为解决信息过载问题的有效工具已经被越来越多的人认识到,许 多研究者在推荐系统算法的改进和组合方法上已经做了大量的研究,并取得了丰硕的成果。 但是这些推荐系统有个共同的弱点,那就是每种推荐系统都嵌入了特殊的算法( 一种或两种) 来计算两个相关对象的相似性,所以这些推荐系统一般只适用于一定范围的推荐应用,往往 很难做到对所有情况的最优化。 特别要提到的是,将移动a g e n t 技术应用于个性化推荐系统中,搭建一个开放的、分布式 的、混合多种推荐技术的推荐系统,并引入市场拍卖的机制来协调各个推荐技术产生的推荐 结果是一个新的研究方向。 1 3 本文研究内容及组织结构 如前所述,目前存在着许多个性化推荐系统,它们提出了各种思路以实现个性化推荐服 务,但都只适用于某个应用领域,难以满足推荐应用的多种推荐需求,并且扩展性差。因此, 本文比较了现有的推荐系统,并分析了它们存在的不足之处,通过整合移动a g e n t 、个性化推 荐和基于拍卖机制的资源分配等技术,提出了一个基于移动a g e n t 的分布式个性化推荐系统 框架,以满足用户的多种推荐需求和复杂多变的应用环境。 4 i f 移动a g e n t 的2 布式个佳化推荐曩棘 本文研究的主要内容包括: l 、对涉及的各相关领域的理论进行分析,讨论了移动a g e n t 技术、推荐系统和市场拍卖 等三个方面的概念、特性、功能和关键技术。 2 、提出一个基于移动a g e n t 的分布式个性化推荐系统的总体架构,设计各个子系统的功 能结构及其相互关系,充分发挥移动a g e n t 的特点以适应分布式个性化推荐系统的要求。 3 、在信息推荐过程中,通过引入市场拍卖机制,统一了不同推荐方法对项目质量的度量 标准,解决了不同推荐a g e n t 产生的推荐结果的筛选过滤问题。 4 、通过对推荐项目内在质量( i n q ) 的分类,为推荐代理建立一个用户兴趣学习模型,使 系统能推荐出更符合用户兴趣的推荐项,从而提高系统推荐质量。 5 、在i b m 的a g l e t 移动平台下,设计并实现了一个基于移动a g e n t 的分布式个性化推荐 系统原型。通过试验验证了系统的可行性和有效性。 论文组织结构如下: 第一章为绪论,介绍本研究的背景和研究内容,概况本论文要做的工作。 第二章为相关理论探讨,共分为四个小节: 第小节介绍针对个性化推进系统进行了探讨,分析了不同推荐技术。 第二小节介绍移动a g e n t 相关理论和技术。 第三小节针对分布式计算模型进行了相关讨论。 第四小节讨论基于市场经济模型的资源分配机制。 第三章首先介绍了基于移动a g e n t 的分布式个性化推荐系统设计任务和目标,提出系统 的整体架构,然后说明系统运行机制和内部各个子系统的功能,阐述它们的功能、特点和作 用;并对a g e n t 技术应用的相关技术问题作了讨论。 第四章介绍了本系统所设计的关键技术和解决方案。 第五章为原型系统的设计与实现,并对实现结构进行了分析。 第六章总结了本论文的研究工作并提出需要进一步砑究的领域。 ,- 口夫掌女掌m 论- i i - 十穆 a g e n t 的# 布武个性* 推荐曩麓 第二章理论基础与相关技术 2 1 个性化推荐系统概述 2 1 1 个性化推荐系统简介 推荐系统是为解决i n t e m e t 上的信息过载问题而提出的一种智能代理系统【4 ”,能从 i n t e r n e t 的大量信息中向用户自动推荐出符合其兴趣偏好或需求的资源。所谓个性化推荐系 统( r e c o m m e n d e rs y s t e m l 就是根据用户个人的喜好、习惯来向其推荐信息、商品的程序。 电子商务网站可以使用推荐系统分析客户的消费偏好,向每个客户有针对性地推荐产品,帮助 客户从众多商品目录中挑选适合自己的商品。推荐系统不仅可以将一个浏览者变为购买者、 促进销售,而且有利于提高客户的忠诚度。推荐系统已经成为电子商务的研究热门之一。 推荐系统还有很多应用领域。1 9 9 7 年以前,推荐系统主要用于信息过滤,如电子邮件的 过滤、新闻组文章的过滤等,代表系统有t a p s t r y ,o r u o p l e n s ,p h o a k s ,f a b ,r e f e r r a l w e b ,s i t e s e e r 等1 4 , 2 1 , 2 2 4 8 , 4 9 。1 9 9 7 年以后,推荐系统发现了一个新的应用领域一电子商 务。在未引入推荐系统之前,电子商务系统面临着这样一种窘境:提供给用户的项目列表往 往含有大量的商品,而顾客真正有兴趣的仅仅占- - 4 部分。这种窘境带来的直接后果是:顾 客很有可能花费了很长时间来查找项目列表,但是仍然找不到自己想要购买的商品,从而无 法形成交易。在引入推荐系统以后,电子商务系统可以预测用户的喜好,仅仅把用户可能有 兴趣的商品形成列表推荐给用户。由于这种列表往往很小,顾客可以很容易的找到自己感兴 趣的商品,这样不仅极大的方便了顾客,而且潜在的增加了电子商务的交易量,为商家带来 了可观的收益。因此,电子商务商家纷纷开始把推荐系统嵌入到他们的电子商务系统中,引 发了推荐系统研究和应用的热潮。到目前为止,很多商业公司开展了推荐系统的研究,例如 i b ma l m a d e nr e a r c hc e n t e r 、c o m p a qr e s e a r c hc e n t e r 等:美国几乎所有知名的大学 都有专门从事推荐系统的研究组,如u cb e r k e l e y 的b e r k e l e y w o r k s h o po nc o l a b o r a t i v e f i l t e r i n g 世界上几乎所有的大的电子商务商都为顾客提供个性化推荐服务,有的商家甚至同 时提供几种推荐服务。例如a m a z o n 书店( a m a z o n c o r n ) ,同时提供y c u s t o m e rw h o b o u g h t 。e y e s ,a m a z o n c o r nd e l i v e r s ,b o o km a t c h e r ,c u s t o m e rc o m m e n t s 等个性 化推荐服务。除了可以应用于信息过滤领域和电子商务领域之外,推荐系统还可以应用到许 6 ! 查竺! 主竺兰竺苎兰! 竺竺璺! ! 堕竺! ! 苎! ! ! 兰兰! 坠 多其他领城,如社会( s o c i a ln e t w o r k ,大众传媒等。 由于可以根据用户的爱好,为不同的用户做不同的推荐,推荐系统已经成为个性化服务 的主要技术之一。可以这么说,只要是需要提供个性化服务的领域,就会有推荐系统的用武 之地。 2 1 2 个性化推荐系统分类 目前存在着许多个性化服务系统【5 0 1 ,它们提出了各种思路以实现个性化服务个性化服务 系统根据其所采用的推荐技术主要可以分为两种:基于规则的系统和信息过滤系统,信息过滤 系统又可分为基于内容过滤的系统和协作过滤系统。 基于规则的系统允许系统管理员根据用户的静态特征和动态属性来制定规则,一个规则本 质上是一个i f - t h e n 语句,规则决定了在不同的情况下如何提供不同的服务基于规则的系统 其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新,此外,随着规则的数量增多, 系统将变得越来越难以管理。 基于内容过滤的系统利用资源与用户兴趣的相似性来过滤信息。基于内容的推荐方法【5 1 j 来源于对文本信息的信息抽取与信息过滤的研究,其中使用了很多过去的研究中曾广泛使用 的技术( 如1 t i d f 、贝叶斯分类、人工神经网络、聚类等) 。因此,许多当前的基于内容的 系统主要被应用于推荐“信息”类项目,如文本、w e b 站点、新闻消息等文本丰富型应用, 它往往无法很好的解决多媒体信息的推荐问题【5 2 1 。基于内容过滤的系统其优点是简单、有效, 缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现 和用户已有兴趣相似的资源。 协作过滤系统利用用户之间的相似性来过滤信息。协同技术( 或称协同过滤技术) 的灵 感来源于对社会网络的研究,即在日常生活中,人们的价值取向往往决定于亲朋好友或是兴 趣相同的人的推荐5 3 1 。所以协同技术的研究重点不在推荐项目之间的相似性,而在于寻找与 目标用户兴趣相似的用户组。因此,该技术避免了基于内容方法的“文本局限性”问题,它 适合于推荐任何形式的项目。目前很多技术都是围绕协同过滤展开研究的,最典型的有稀疏 问题( s p a r s i t y ) 和冷开始问题( c o l d - - - s t a r t ) 。除此之外,还有新用户问题和算法健壮性等问 题。 协同技术进一步可细分为:基于用户( u s e r - b a s e d ) ,基于项目( i t e m b a s e d ) 和基于模型 7 l f 穆动r g e n t 的2 布式十佳化推荐量兢 ( m o d e l b a s e d ) 。 基于用户的协同算法1 5 3 ,5 4 j 是最先提出的协同算法,它的关键任务是根据用户描述 ( p r o f i l e s ) 找准最近的邻居用户。 基于项目的协同算法 s s l 是对传统基于用户协同算法的改进,它以类似用户描述的形式计 算项目之间的相似性。 基于模型的协同算法【5 6 1 是从概率的角度出发,预测在给定信息的条件下目标用户对项目 做出评价。 基于协作过滤系统的优点是能为用户发现新的感兴趣的信息,缺点是存在两个很难解决 的问题:一个是稀疏性,亦即在系统使用初期由于系统资源还未获得足够多的评价,系统很 难利用这些评价来发现相似的用户。另一个是可扩展性,亦即随着系统用户和资源的增多, 系统的性能会越来越低。 除了以上介绍的比较常用的推荐技术,还有一些比较有代表性的技术,包括基于效用的 推荐、基于知识的推荐和基于用户统计信息的推荐等。 基于用户统计信息的推荐( d e m o g r a p h i c - - b a s e dr e c o m m e n d a t i o n ) :推荐系统基于用户个人 属性对用户进行分类,再基于类对类中的用户进行推荐绷。不要求有一个历史的用户数据, 而协同过滤和基于内容的推荐技术都需要。 基于效用的推荐( u t i l i t y b a s e dr e c o m m e n d a t i o n ) :它是根据对用户使用项目的效用进行计 算的,核心问题是如何为每个用户创建效用函数,并考虑非产品属性,如提供商的可靠性 ( v e n d o rr e l i a b i l i t y ) 和产品的可用性( p r o d u c ta v a i l a b i l i t y ) 等。 基于知识的推荐( k n o w l e d g e b a s e dr e c o m m e n d a t i o n ) 在某种程度上可以看成是一种推理 ( i n f e r e n c e ) 技术,各方法因所用的知识不同而有明显区别隅矧。 还有一些个性化服务系统如:w e b s i f t 2 4 1 ,f a b 旧,a n a t a g o n o m y 2 5 1 和d y n a m i cp r o f i l e r 6 0 1 等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种过滤技术可以克服各自 的一些缺点。为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对 其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高 协作过滤的性能。二者结合主要采取融合( c o l l a b o r a t i v ev i ac o n t e n t ) 【2 3 】和组合( c o m b i n e s e p a r a t ec o l l a b o r a t i v ea n dc o n t e n t b a s e d ) 2 6 1 两种方式。 ! ! 查竺竺主竺兰兰苎苎要竺竺塑! ! ! 竺兰! 兰! 竺垡兰兰竺 在实际的应用中,因为每种推荐技术一般都适用于一定范围的推荐应用,往往很难做到 对所有情况的最优化,所以这就需要采用混合的技术,将各种算法纳入一个统一的框架,扬长 避短,以适合各种实际应用。在组合方式上,r o b i nb u r k e f 6 1 1 提出了七种的思路: 1 、加权组合型:由多个推荐算法的计算结果,辅以权重的方法组合而成; 2 、转换型:根据具体情况,在多种候选算法中选取最合适的技术: 3 、混合型:同时采用多种推荐技术,并给出多种推荐结果,为用户提供参考: 4 、特征组合型:组合来自不同推荐数据源的特征被另一个推荐算法所使用; 5 、层叠型:先用一种推荐算法产生一种粗糙的推荐结果,后一种算法在此结果上进行细 化,做出更精确的结果; 6 、特征递增型:一种推荐算法产生的附加的特征信息嵌入到另一种推荐算法的特征输入 中: 7 、元层次型:一种推荐算法所建立的模型作为后一个算法的输入。 个性化推荐技术由于它巨大和直接的应用价值,引起了工业界( 特别是电子商务业界) 的 广泛兴趣,在此技术上进行了大量的深入研究,推出了一些比较成功的推荐服务系统,比如 a m a z o n 的图书推荐系统、c d n o w 的c d 推荐系统和m o v i e f i n d e r 的电影推荐系统。 2 1 3 个性化推荐系统比较 由以上分析可见,各种推荐算法都具有一定的局限性,适应于具体的某种环境,比如: 基于内容的推荐算法主要考虑信息项本身的内容是否和用户兴趣相关,并计算这两者的相似 度作为是否推荐的依据。但内容特征的提取能力有限、无法推荐更多更新的信息资源和需要 过多的用户反馈是其主要的缺点;协作过滤推荐算法是考虑和用户兴趣相类似的其他用户对 某个信息项的喜好,并由此判断用户对此信息项是否感兴趣以决定是否推荐。但稀疏性,可 信度和随着规模增长而带来计算复杂度的几何增长是其面i 临的主要问题。所有推荐技术都有 其优点和缺点,如下表: 9 广i 大掌掌论文 墓十移动a g e n t 的# 布式十性化推荐系统 推荐技术优点缺点 新异兴趣发现,不需要领域知冷开始问题、稀疏问题; 识;随着时间推移性能提高:新用户问题; 协同过滤推荐 推荐个性化、自动化程度高:质量取决历史数据集; 能处理复杂的非结构化对象系统开始时推荐质量差 推荐结果直观,容易解释;不 稀疏问题,新用户问题;复杂属性 基于内容推荐 不好处理;要有足够数据构造分类 需要领域知识 器 新异兴趣发现: 基于用户统计信息推荐没有新用户问题;用户的人口信息统计资料难得到 不要领域知识 关联规则抽取难、耗时; 发现新兴趣点; 基于关联规则推荐产品名同意性问题; 不要领域知识 个性化程度低 把用户需求映射到产品上;:知识难获得; 基于知识推荐 考虑非产品属性推荐是静态的 无冷开始和稀疏问题;用户必须输入效用函数; 基于效用推荐对用户偏好变化敏感; 推荐是静态的、灵活性差: 考虑非产品特性属性重叠问题 表2 1 常用推荐技术优缺点比较 由于各种推荐方法都有优缺点,所以在实际中常采用组合推荐( h y b r i dr e c o m m e n d a t i o n ) 。 尽管理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最 重要的原则,就是通过组合后要能避免或弥补各自推荐技术的弱点,如对于基于内容和协同 过滤的技术,不论如何组合,总是存在初始化( r a r n r l l p ) 问题,因为它们都要求有一个历史 的评价数据。 基f 移动a g e n t 的分布式十性化推荐秉槐 2 1 4 总结 个性化推荐系统能够根据用户的兴趣偏好向用户推荐信,尽管目前有很多类型的推荐系 统,但这些推荐系统都有各自的有缺点,所以这些推荐系统一般都只适用于一定范围的推荐 应用,往往很难做到对所有情况的最优化,这就需要采用组合的技术将各种算法纳入到一个 统一的框架中,取长补短,从而提高推荐质量。在组合方式上,r o b i nb u r k e 引i 提出了七种 的思路对推荐方法进行组合来弥补单一推荐方法的不足,但仍然不能满足灵活多变的应用环 境。随着推荐方法数i f l 的增加和面临着用户兴趣的不断改变,最好的办法是允许多种推荐方 法共存( 同时存在) ,协同它们共同工作为用户提供最好的推荐。就需要设计一个框架结构的 开放系统( 开发系统的自身结构能够动态改变,其特点是它的组件是事先不知道的,能够随 时改变的) 允许添加新的推荐方法,并协调它们的输出从而为用户提供最好的推荐。 2 2 移动a g e n t 技术 2 2 1a g e n t 技术简介 a g e n t 是一个运行于动态环境的实体,它具有较高的自治能力,能够接受另一个实体的 委托并为之提供帮助和服务,能够在该目标的驱动下主动采取各种必要的行为( 比如:社交、 学习等手段) 以感知、适应动态环境的变化,并能进行适当的反应。 a g e n t 的基本属性【4 0 】如下: 1 、自治性( a u t o n o m y ) :a g e n t 能够在无任何外界干预的情况下完成其大部分功能,控 制其内部状态。 2 、社会能力( s o c i a l a b i l i t y ) a g e n t 能够主动和其他a g e n t 或人交互,以实现其目标 3 、响应能力( r e a c t i v i t y ) :a g e n t 能感知周围环境,并对环境的变化产生实时响应,这 些动作的执行基于触发规则和预订的执行计划。 4 、预动性( p r o - a c t i v e n e s s ) : a g e n t 的行为是主动的、自发的。a g e n t 感知周围环境的 变化,并做出基于目标的行为。 二! 查竺竺竺兰竺苎兰三竺竺! ! ! ! ! 竺竺! 苎! 竺兰苎兰墨苎 5 、可移动性( m o b i l i t y ) :a g e n t 可以携带数据和指令移动到其他环境中并在那里执行指 令。 6 、持续性( p e r s i s t e n c e ) :a g e n t 的进程是连续的,不断地进行计算直到完成其目标,甚 至反复实现某一功能以达到学习的目的。 7 、自适应性( a d a p t a b i l i t y ) :a g e n t 能适应环境的变化,这是通过学习机制实现的。 8 、协作性( c o o p e r a t i v e s ) :a g e n t 具有协作求解和管理通讯的能力。 前四种是基本特征,具有这四种属性的一个计算机程序就可以叫做最简单的a g e n t 。 2 2 2 多a g e n t 技术 m a s ( m u l t i a g e n ts y s t e m ) 是由多个智能a g e n t 组成的系统。m a s 作为解决复杂系统的 一个有效方法,能够利用并行分布式处理技术和模块化设计思想,把复杂系统划分成相对独立 的a g e n t 子系统,通过a g e n t 之间的合作与竞争来完成对复杂问题的求解。实际系统中的 a g e n t 可由不同开发者在不同时间运用不同的工具和技术来实现,因此它们各自具有不同程 度的问题求解能力。 2 2 3 移动a g e n t 简介 2 0 世纪9 0 年代由g e n e r a lm a g i c 公司在推出商业系统t e l e s c r i p t 时提出了移动a g e n t 的概念 4 0 1 ,简单的说,移动a g e n t 是一个能在异构网络环境中自主地从一台主机迁移到另一 台主机,并可与其他a g e n t 或资源交互的软件尸体。它是分布式计算与a g e n t 技术相结合的 产物,它除了具有a g e n t 的最基本特性智能性、社会性、交互性和环境适应性外还具有 移动性,是9 0 年代以来发展起来的一种新型的分布式计算模式。它为分布式开放系统的分 析、设计和实现提供了一种崭新的方法,被誉为软件开发的又一重大突破。它的实质是一独 立的计算机程序,可自主地在异构网上按一定的规程移动以寻找合适的计算资源,代表用户 完成特定的任务。它的实现机制有别于传统的b s 和c s 模式。c s 结构的程序在网上传输 的是数据,传输量往往很大,容易造成网络拥塞。而移动a g e n t 在网上传输的是代码,而代 码的数据量往往较小,当有大量数据传输时能降低网络负载。移动a g e n t 应用是一种分布式 应用。一个基于移动a g e n t 的应用由一组移动a g e n t 构成,每一个a g e n t 根据自身的目标 1 2 ! 查竺! 主竺兰竺查兰三竺竺! ! 竺! 竺兰! ! 婴竺! 苎苎些 和环境的状况移动到拥有计算所需资源的节点上,进行计算。计算的过程中,可能需要与其 他a g e n t ( 或者是同一应用中的其他a g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 恒隆地产基金从业考试题及答案解析
- 保险转备协议书
- 姑妈的协议书
- 多功能花盆创新创业项目商业计划书
- 动迁协议书购房
- 林业政策动态监测服务创新创业项目商业计划书
- 自提车协议书
- 植物能源转换材料制造创新创业项目商业计划书
- 2025年疼痛医学评估与处理能力测验模拟卷答案及解析
- 招聘流程可视化工具创新创业项目商业计划书
- 【道法】2025~2026学年度第一学期七年级上册道德与法治第一次月考试卷
- 5年(2021-2025)高考1年模拟物理真题分类汇编专题04 机械能守恒、动量守恒及功能关系(广东专用)(解析版)
- 2025湖南生物机电职业技术学院单招《语文》考试历年机考真题集【必考】附答案详解
- 2024年齐齐哈尔市公安局招聘警务辅助人员真题
- 4.2《让家更美好》 课件 2025-2026道德与法治七年级上册 统编版
- 2025耿马傣族佤族自治县司法局面向社会公开招聘司法协理员(10人)考试参考题库及答案解析
- 北师大版三年级上册第八单元8.1《评选吉祥物》课时练(含答案)
- 麻精药品培训知识课件
- 手术室无菌技术操作讲课
- 布控球使用管理办法
- 收费员考试题库及答案
评论
0/150
提交评论