




已阅读5页,还剩72页未读, 继续免费阅读
(计算机科学与技术专业论文)旅游多媒体信息主动服务系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:孑】! 篮日期:里望! ! ! 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有 权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被 查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、 缩印或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守 此规定) 本学位论文不属于保密范围,适用本授权书。 本人签名:亟:逮 同期:丞堡生,2 :坦 导师签名: 日期:皇翌厶兰: 翌 北京邮电人学硕上研究生学位论文 旅游多媒体信息主动服务系统 旅游多媒体信息主动服务系统研究 摘要 随着信息服务业的不断发展,基于用户个性化的主动信息服务作 为一个新的研究热点和一种新型的信息服务模式,得到了越来越多的 关注。本论文对旅游多媒体信息主动服务系统进行了研究,论文完成 的主要工作如下: ( 1 ) 完成了基于多代理的系统实现方案设计和主要功能模块的设 计,包括用户接口a g e n t 、过滤排序a g e n t 、兴趣学习a g e n t 、监控a g e n t 和信息检索a g e n t 五个功能模块;完成了数据库设计。 ( 2 ) 给出了用户兴趣模型的设计和实现,包括用户兴趣信息的获 取和预处理,基于向量夹角的k 近邻算法的应用,用户兴趣模型的 建立及其模型评价,用户兴趣模型的更新和调整方法。对k 近邻算 法进行了改进,实验结果表明,改进后的算法在分类效率和分类精度 两方面都有所提高。 ( 3 ) 开发并实现了基于j a d e 开发平台的旅游多媒体主动服务系 统,实现了各a g e n t 模块的具体功能,给出了用户个性站点、多媒体 主动服务等服务的具体应用实例,对系统进行了测试,测试结果表明 系统在主动服务质量与推荐精确度上均取得了满意的效果,可基本满 足用户的个性化需求。 本文建立的旅游多媒体信息主动服务系统,通过搜集各种旅游相 关多媒体信息,采用显式与隐式相结合的方法提取出用户兴趣信息, 建立用户兴趣模型,可为用户提供个性化的旅游多媒体信息主动服 务,满足人们日益增长的个性化旅游服务需求。 关键字:智能信息推拉,多代理系统,主动服务,用户兴趣模型, k 近邻算法 北京邮电大学硕上研究生学位论文 s t u d yo nt o u r i s m w i t ht h ed e v e l o p m e n t0 i n f o r m a t i o ns e r v i c ei so b t a i n i n gi n c r e a s i n ga t t e n t i o n sa san e wr e s e a r c h f o c u sa n dan o v e li n f o r m a t i o ns e r v i c ep a t t e r n t h et h e s i ss t u d i e st h e t o u r i s mm u l t i m e d i aa c t i v es e r v i c es y s t e ma n dt h em a i nw o r kd o n eo ft h e t h e s i sa r ea sf o l l o w s : ( 1 ) c o m p l e t et h ei m p l e m e n t a t i o ns c h e m ed e s i g no ft h em u l t i a g e n t b a s e ds y s t e ma n dt h ed e s i g no ft h em a i nf u n c t i o n a lm o d u l e s ,i n c l u d i n g u s e ri n t e r f a c ea g e n t ,f i l t e r i n ga n do r d e r i n ga g e n t ,i n t e r e s tl e a r n i n ga g e n t , m o n i t o r i n ga g e n ta n di n f o r m a t i o ns e a r c h i n ga g e n t ,a sw e l la st h es y s t e m d a t a b a s ed e s i g n ( 2 ) c o m p l e t et h ee s t a b l i s h m e n to f u s e ri n t e r e s tm o d e l ,i n c l u d i n gt h e c o l l e c t i o na n dp r o c e s so fu s e ri n t e r e s ti n f o r m a t i o n ,t h ea p p l i c a t i o no f k - n e a r e s t n e i g h b o ra l g o r i t h mb a s e do nv e c t o ra n g l e ( v a k n n ) ,t h e e s t a b l i s h m e n ta n de v a l u a t i o no fu s e ri n t e r e s tm o d e l ,a n dt h eu p d a t ea n d m o d i f i c a t i o nm e t h o d so fu s e ri n t e r e s tm o d e l i m p r o v et h ev a k n n ,a n d t h er e s u l t so fc o m p a r a t i v ee x p e r i m e n t si n d i c a t et h ei n c r e a s eo ft h e i m p r o v e d 溺一k n n o nc l a s s i f y i n gs p e e da n d a c c u r a c y ( 3 ) i m p l e m e n tt h et o u r i s mm u l t i m e d i aa c t i v e s e r v i c ep r o t o t y p e s y s t e mb a s e do nj a d ed e v e l o p m e n tp l a t f o r m ,i n c l u d i n gt h e t o u r i s m m u l t i m e d i aa c t i v ep u s hs e r v i c em o d u l e ,t h et o u r i s mm u l t i m e d i aa c t i v e p u l ls e r v i c em o d u l ea n dt h et o u r i s mm u l t i m e d i aa c t i v ea d v e r t i s i n gs e r v i c e m o d u l e ;i m p l e m e n ts y s t e mt e s t i n g ,a n d t h er e s u l t si n d i c a t et h a tt h e s y s t e ma c h i e v e sg o o de f f e c t so nt h eq u a l i t yo fa c t i v es e r v i c ea n dt h e a c c u r a c yo fr e c o m m e n d i n ga n dc a l lm e e t st h ep e r s o n a l i z e dr e q u i r e m e n t s o ft o u r i s t s i i i 北京邮电人学硕十研究生学位论文 第一章绪论 1 1 论文来源 1 2 论文背景 1 3 论文研究内容1 1 4 研究意义2 1 5 论文结构2 第二章关键技术4 2 1 智能推拉技术4 2 1 1 信息推送与信息拉取技术4 2 1 2 智能推拉技术5 2 1 3 智能推拉技术的服务方式6 2 1 4 智能推拉技术的应用7 2 2a g e n t 技术8 2 2 1a g e n t 概念与特性8 2 2 2 多代理系统9 2 2 3 面向a g e n t 技术的程序设计l o 2 2 4a g e n t 的通信1 l 2 3 用户兴趣建模方法1 2 2 3 1 向量空间模型1 3 2 3 2 文本训练及分类算法1 4 2 4 本章小结1 6 第三章旅游多媒体主动服务系统的总体设计1 7 3 1 系统需求分析1 7 3 2 系统框架设计1 7 3 2 1 总体框架1 8 3 2 2 工作流程1 9 3 3 主要功能模块2 0 3 3 1 用户接口a g e n t 2 0 3 3 2 过滤排序a g e n t 2 0 3 3 3 兴趣学习a g e n t 2 l 3 3 4 监控a g e n t 2 1 3 3 5 信息检索a g e n t 2 l 3 4 数据库设计2 2 i v 北京邮电火学硕上研究生学位论文旅游多媒体信息主动服务系统 3 5 本章小结2 6 第四章用户兴趣模型的建立2 7 4 1 传统用户兴趣建模方法分析2 7 4 2 用户兴趣信息获取和预处理2 8 4 2 1 用户兴趣信息获取2 8 4 2 2 用户数据预处理3 0 4 3 基于向量夹角的k 一近邻算法用户兴趣建模3 1 4 3 1 文档模型建立及其结构化处理3 2 4 3 2 用户兴趣判定3 4 4 3 3 模型评价3 5 4 4 算法改进3 6 4 4 1 算法分析3 6 4 4 2 基于分类效率的改进3 8 4 4 3 基于分类精度的改进3 9 4 4 4 实验分析4 1 4 5 用户兴趣模型更新4 3 4 6 本章小结4 5 第五章旅游多媒体主动服务系统实现4 6 5 1 系统各a g e n t 模块实现4 6 5 1 1 用户接口a g e n t 4 7 5 1 2 兴趣学习a g e n t 4 7 5 1 3 过滤排序a g e n t 4 8 5 1 4 信息检索a g e n t 5 0 5 2 旅游多媒体主动服务原型系统的实现5 0 5 2 1 用户兴趣注册5 1 5 2 2 用户个性站点5 2 5 2 3 多媒体主动服务5 3 5 3 系统测试5 5 5 3 1 测试用例设计5 5 5 3 2 测试结果分析5 7 5 4 本章小结5 8 第六章总结与展望5 9 6 1 论文总结5 9 6 2 进一步研究工作6 0 v 北京邮电大学硕士研究生学位论文 参考文献 致谢 攻读学位期间的研究成果 申请发明专利6 6 发表学术论文6 6 v i 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 1 1 论文来源 第一章绪论 8 6 3 计划“新一代高可信网络 重大项目( 2 0 0 8 a a 0 1 a 3 0 8 ) :新兴业务的研 究基于宽带网络的旅游智能导航系统。 1 2 论文背景 近年来旅游业在世界范围内迅速发展,并且已经取代了汽车、石油等传统产 业,成为推动世界经济和社会全面发展的重要因素。伴随着旅游业的蓬勃发展, 对旅游信息化建设的要求也越来越高,同时也决定了发展旅游信息产业具有广阔 的前景。中国具有丰富的旅游资源和巨大的旅游市场,因此旅游信息产业在我国 具有巨大的发展潜力和空间。但中国旅游信息产业起步较晚,而且过于依靠传统 的经营方式导致信息传递不畅、信息共享水平低,越来越不能满足旅游者的个性 化、综合化的需求。 目前,主流的旅游电子商务系统主要是通过建立w e b 服务站点向旅游者提 供各种信息集合服务,旅游者通过浏览相关内容来获取信息。但是这种服务方式 是被动的,没有充分考虑用户个体间的个性化需求,无法提供个性化的旅游信息 化产品和服务。另一方面,通用的多媒体搜索引擎提供信息检索服务,例如百度、 搜狗,也无法提供差异服务,不能满足人们同益增长的个性化的需求,有效地返 回用户感兴趣的相关旅游信息,而且经常伴随大量重复或不相关信息。针对上述 问题,发展一种更为主动和智能的旅游信息服务成为旅游者的迫切需求。 因此,本论文采用智能信息推拉技术,设计和实现旅游多媒体信息主动服务 系统,根据用户兴趣模型的分析结果,有针对性地向旅游用户主动推送个性化的 信息服务。全国风景名胜区每年的游客接待量都在数亿人次,建立旅游多媒体信 息主动服务系统,在全国风景名胜区内建立集旅游目的地资源推介、旅游资讯、 公益宣传为一体的旅游目的地信息服务,将加速旅游数字化的进程,可带来良好 的经济效益和社会效益。 1 3 论文研究内容 论文研究如何提供基于用户个性化的旅游智能信息服务,引入智能推拉技术 为用户提供基于个性化的主动信息服务。 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 设计基于多代理技术的系统实现方案,包括用户接口a g e n t 、过滤排序 a g e n t 、兴趣学习a g e n t 、监控a g e n t 和信息检索a g e n t 五个功能模块。系统各 a g e n t 可以通过不断自主学习,发现用户的兴趣,满足人们对旅游信息的个性化 要求。 信息的获取和预处理。采用“显式和“隐式 两种用户兴趣信息收集方法, 并通过向量空间模型( v s m ) 对用户兴趣信息做预处理,提取特征向量。 用户兴趣模型分析与建立。研究如何建立应用模型来有效的表示用户的兴 趣。针对传统的用户兴趣建模方案的不足,设计基于向量夹角k 近邻算法用户 兴趣模型方案。采用显式和隐式两种用户兴趣信息收集方法,并通过向量空间模 型( v s m ) 对用户兴趣信息做预处理,提取特征向量;实现基于向量夹角的k - 近邻算法用户兴趣模型,完成兴趣分类判断;最后,提出用户兴趣模型的更新方 法。 针对基于向量夹角的k - 近邻算法,提出基于分类速度和精度两方面的改进 方案,并进行数据对比实验。 完成基于j a d e 开发平台的系统各a g e n t 模块的具体实现,给出基于用户兴 趣的多媒体信息主动服务原型系统的实现,并完成系统功能测试。 1 4 研究意义 本论文的研究成果对于以丰富的多媒体手段促进旅游行业的信息化建设,促 进旅游宣传,提高服务质量,具有重要的应用价值。论文通过建立用户兴趣模型, 采用智能a g e n t 技术和智能推拉技术的设计思想,实现旅游多媒体信息主动服 务。可为用户提供针对每个人兴趣偏好的个性服务,在一定程度上满足用户兴趣 需求的差异性;同时,旅游者可以通过系统查阅相关旅游信息,系统会根据其兴 趣知识返回用户兴趣度更高的多媒体内容,这样可以节省用户的时间和精力,提 供高质量的旅游资讯。本文的研究对于建立高质量智能化的旅游信息服务具有一 定的理论意义和应用价值。 1 5 论文结构 第一章是绪论,包括论文来源、论文背景以及主要研究内容。 第二章介绍了涉及系统主要功能的智能推拉技术、a g e n t 技术和用户兴趣建 模技术的相关概念和理论。首先分析了信息推拉技术的发展状况,然后引入智能 推拉技术的概念和应用领域;重点介绍了作为系统实现方案的a g e n t 技术,m a s ( m u l t i - a g e n ts y s t e m ) 的原理和特点;最后介绍了本文所使用的用户兴趣建模 2 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 方法的相关技术。 第三章给出了旅游多媒体主动服务系统的总体设计和基于多a g e n t 技术的 系统框架设计,讲述了实现系统主要功能的各个a g e n t 模块,完成了系统数据库 的总体设计和各数据表的定义。 第四章给出了用户兴趣模型的设计和实现,包括用户兴趣信息的获取和预处 理、基于向量央角的k - 近邻算法应用、用户兴趣建模的方法及其模型评价、建 模算法的进一步改进以及兴趣模型的更新。 第五章实现了基于j a d e 开发平台的系统各a g e n t 模块,给出了基于用户兴 趣的多媒体信息主动服务的实现效果,完成了系统功能测试。给出了旅游多媒体 主动服务原型系统的具体实现,包括旅游多媒体信息的主动推送和拉取服务模 块,以及用户个性站点服务模块。 第六章是总结与展望。 3 北京邮电大学硕士研究生学位论文 旅游多媒体信息主动服务系统 2 i 智能推拉技术 第二章关键技术 2 1 1 信息推送与信息拉取技术 随着信息技术的不断发展,信息获取和信息传递技术的发展也呈现多样化的 趋势。信息推拉技术以其直接、高效的特点,越来越受到用户的肯定。信息推拉 技术包括信息拉取和信息推送两种模式【1 1 。因而用户获取信息的方式也可以分为 两类:一种是用户主动向信息提供者或者信息服务器发出请求并索取信息的拉 ( p u l l ) 技术;另一种是信息的提供者或者信息服务器主动向用户推送信息的 推( p u s h ) 技术。 p u l l 技术,即信息拉取技术,是现在主流搜索引擎服务采取的一种通用模 式。p u l l 技术基于请求响应模式,用户主动向信息服务器提出自己的需求,而 服务器对这个具体的请求做出响应,返回用户需要的信息。p u l l 技术要求用户 在获取信息前首先确定信息源,然后向该信息源发出请求信息。同时,要求用户 提供的请求尽可能明确,防止数据风暴现象的产生。这样就要求用户平时对这些 信息进行搜集整理,以确定哪些信息源可以提供自己想要的信息。p u l l 技术作 为i n t e m e t 上寻找信息的最基本的方式,其突出的优点是实现机制简单以及返回 信息的针对性。 p u s h 技术【2 】是一种基于客户朋艮务器机制,由服务器主动的将信息发往客户 端的技术。同传统的拉技术( p u l l ) 相比,两者最为主要的区别在于前者的是由 服务器主动发送信息,而后者则是由客户机主动请求信息。在p u s h 应用中,在 服务器发送内容给客户机之前,没有明显的客户机请求,即p u s h 事务是由服务 器发起的。p u s h 技术的本质在于让信息去主动的寻找用户,因此其优势在于信 息的主动性和及时性,通过使用该技术可以尽快的将信息推送到用户面前1 3 卅。 无论是p u l l 技术还是p u s h 技术,就目前的发展来看,都存在一定的问题。 首先,p u l l 技术是一种用户主动的信息获取方式,因此该模式具有目的明确、 在一定程度上可以满足不同用户的个性化要求等优点。但是,p u l l 技术的缺点 也非常突出【踊1 。 ( 1 ) 对用户参与度要求高。p u l l 技术只有在用户需求明确,信息服务器 理解正确的前提下才能满足用户的个性化要求。所以,要求用户对服务器端的信 息系统具有深入理解,并且掌握一定的查询技巧。 4 北京邮电大学硕七研究生学位论文旅游多媒体信息主动服务系统 ( 2 ) 信息及时性差。随着i n t e m e t 上信息的急剧增加,服务器端的信息更 新速度也十分惊人,即使用户可以及时到服务器端处拉取最新信息,但仍然不能 保证最新信息可以有效地传递给用户,而用户接受到大量非时效的信息,浪费了 用户的时间和精力,影响了信息的及时性传递。 ( 3 ) 大量冗余信息的产生【7 1 。由于i n t e r n e t 的飞速发展,网络信息量的不断 增加,搜索引擎数据库也在越来越庞大。但搜索引擎并不能深入了解用户的个性 化需求,因此用户查询的返回结果中更多的是无用的冗余信息,需要用户在结果 中进一步过滤、筛选,这也是目前搜索引擎技术所面临的核心难题。 p u s h 技术的应用也同样存在问题【8 。9 1 。首先,在固定互联网应用中,计算 机等固定设备为用户提供了足够的资源和能力去查找信息,所以人们通常将它作 为一个浏览信息的窗口,而不是被动的信息接收者,用户对于信息准确性的要求 也远胜于对其及时性的要求。 第二,p u s h 技术不能保证信息送达用户面前。由于p u s h 技术采用的是广 播机制,当网络信息中心发送信息时,如果客户端正好在网上,且转换器和接收 器都正好切换到同一频道上,传输才会发生作用,用户才能获取信息。如果用户 不在网上,则该用户就会丢失网络中心广播的信息。这对于那些要确保能收到信 息的应用领域是不适合的。 第三,p u s h 技术无法没有状态跟踪。p u s h 技术采用的是开环控制模式, 没有客户反馈信息,没有状态跟踪。一个信息发布后,客户收到没有? 收到了信 息的客户端是否已按信息的指示执行了任务? 这些问题答案信息发布者无从得 知。这对于需要根据用户反馈信息来做决策的信息中心来说是无法接受的。 第四,p u s h 技术的目的性差。p u s h 技术并未区分用户个体的差异性,而 是按照某种简单规则来推送信息,对不同的用户推送的可能是同样的信息,难以 实现个性化服务。 第五,容易造成数据风暴问题。由于推送服务的主动权掌握在信息服务器端, 所以一些用户根本不感兴趣的无关信息仍然可能被推送,加重了网络的传输负荷 和浪费了用户时间。 2 1 。2 智能推拉技术 影响传统推拉技术的进一步推广,很大程度上是因为其智能性不够,无法根 据用户需求准确地确定推送对象和推送内容,导致了推送的盲目性。在传统的推 拉技术的基础上,智能推拉技术【1 明融入了人工智能、知识发现等技术,在对信 息进行分类整理的同时,结合对用户的需求和兴趣的分析,使推送的信息更能满 足用户的个性化需求。智能推送技术不仅具有主动服务的优点,而且具有一定的 5 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 智能性,是进一步提供个性化的主动信息服务的技术基础。在具体应用智能推拉 技术的过程中,需要解决两个核心问题:推送内容和推送目标的选择。 然而,人工智能和知识发现技术的迅速发展使p u s h 技术解决上述难题成为 可能。首先,数据挖掘技术可以对收集的大量信息进行预处理,提取能反映其关 键特征的代表信息,并进一步对信息进行分类和归档,为信息的检索提供了良好 的基础。另一方面,知识发现技术可以对用户的个人信息以及用户行为进行分析, 提取出用户的兴趣,并据此推送相关的内容。 对于信息拉取技术,为提高信息获取的准确性,对智能化的要求也十分迫切。 搜索引擎作为拉取技术的典型应用,往往返回许多无关的结果,导致用户的满意 度降低。因此,信息拉取技术需要结合人工智能技术,对查询条件进行预处理, 并根据用户需求对查询结果的分类排序,使返回的结果更加具有针对性。智能推 拉技术是将推送技术与拉取技术结合,使二者优势互补,并且结合了人工智能, 知识发现及数据库等技术,在用户需求模糊的情况下主动向用户提供有价值的信 息服务【1 1 1 2 l 。智能信息推拉技术的系统图如图2 1 所示。 智能推拉技术 i 知识工程兴趣库i t 知识发现,机器学习 一t 一工 信息 推送 信息推送ll 信息拉取卜一一 拉取 策略 j千 i 一j r 蟊嗣r 飘嗣 、_ , 图2 - 1 智能信息推拉技术 2 1 3 智能推拉技术的服务方式 。 用户 智能信息推拉技术是在信息获取技术中加入了智能成份,从而有助于用户在 海量信息中高效、及时地获取最新信息,提高了信息系统主动信息服务的能力。 智能推拉技术的具体服务方式可归纳为以下四种【3 1 4 】。 先推后拉式:先由信息源服务器及时推送公共信息,再由用户有针对性地拉 取个性化信息。该服务模式可适用于图书情报部门的信息服务。例如,可将电子 6 北京邮电大学硕十研究生学位论文 旅游多媒体信息主动服务系统 期刊的目录信息推送给用户供其浏览,用户一旦发现自己所需信息内容,可再连 接到服务器浏览或者下载全文。 先拉后推式:用户先根据需求拉取所需信息,服务器进一步根据用户的兴趣, 再有针对性地推送相关的其它信息给用户。目前该模式应用包括个性化的频道订 阅、邮件订阅、电台节目点播服务等。该模式既能满足用户个性化需求,又能提 供主动服务,所以目前这种方式在i n t e r n e t 上应用较多。 推中有拉式:在信息服务器向用户推送信息的过程中,用户可以随时选择中 断该服务,并且定格在所感兴趣的内容上,并执行进一步的搜索,主动拉取更进 一步想要获取的信息。该种方式在搜索引擎领域可以得到应用。 拉中有推式:该模式下的用户在信息拉取过程中,信息服务器会根据用户输 入的检索信息,向用户主动推送相关信息和最新的信息。该模式在电子商务领域 应用十分广泛。 上述四种方式的应用重心各不相同,具体方式的选择需要根据实际的应用选 择。 2 1 4 智能推拉技术的应用 智能推拉技术在一定程度上解决了从海量信息中获取有效信息的问题,满足 了不同用户的个性化需求,提高了信息服务系统主动服务的能力。目前,智能推 拉技术的应用形式和应用领域也在不断的扩展。 数字图书馆建设【1 5 1 。传统的数字图书馆信息服务系统的服务模式是单向被 动服务,不能满足用户的需求。智能推垃技术是提高信息服务系统主动服务能力 的重要途径。采用智能推拉技术的数字图书馆,除提供普通的用户拉取服务外, 还可以主动锁定一批系统用户,并根据个人兴趣需求,为他们提供主动的信息服 务。这样,系统能够主动地为用户工作,就会减轻用户的脑力和体力劳动。 电子商务系统。随着电子商务在i n t e r n e t 上的蓬勃发展,互联网上的产品也 惊人的速度增长。这样,客观上导致用户寻找自己需要的产品变得有些困难。对 于销售者来讲,推销产品在保持积极主动的同时,更需要有针对性。因此,采用 智能推拉技术,消费者可以主动预定某类别产品信息,便捷地拉取所需产品的最 新动态信息;商家也可以通过分析用户行为推断不同用户的兴趣、爱好,进而向 潜在的用户主动推送商品信息。 e - m a i l 服务【1 6 1 。e m a i l 现在已越来越成为人们工作和生活不可或缺的一部 分。然而,传统的电子邮件系统采用的是信息推送模式,收件人无法主动选择是 否接受邮件,只能被动接收所有信件并自动存放到自己的收件箱。这样,往往会 导致大量的垃圾邮件或者用户反感的广告邮件进入用户收件箱,与有用的用户信 7 北京邮电大学硕上研究生学位论文 旅游多媒体信息主动服务系统 息混杂到一起。因而,利用智能推拉技术的智能性,新型电子邮件系统可以解决 上述问题。采用智能推拉技术的电子邮件系统可以采用这样的操作模式:收件人 收到发件人代发邮件的信号,若收件人想收此邮件,则可根据指示收取邮件,若 拒绝接收,则此邮件一直滞留在发件人的邮箱内。因此,采用智能推拉技术的新 型电子邮件收发模式可以减少不必要的邮件发送,节省用户时间,降低网络负荷, 并且有效阻止垃圾邮件。 手机w a p 领域【1 7 】。w a p 即无线应用协议,用户可利用w a p 手机访问w a p 网站,执行收发电子邮件等简单操作。由于w a p 手机一般内存较小,而且受无 线传播带宽限制往往传播速度较慢,因此用户对信息准确性的要求比较高。采用 智能推拉技术可以收集旅游用户个人需求信息,进而分析、预测用户的兴趣倾向, 针对不同类型的用户提供特色的信息服务,使手机用户能随时随地地掌握最有价 值的旅游信息资讯。 此外,智能推拉技术在其他领域也有很好的应用前景,例如企业管理【l 引, 远程网路教育【1 9 】等。 2 2a g e n t 技术 2 2 1a g e n t 概念与特性 ( 1 ) a g e n t 的定义 a g e n t 技术来源于分布式人工智能领域,也有人将其称作智能主体。对a g e n t 技术的研究开始于2 0 世纪8 0 年代,对于a g e n t 的精确定义目前仍存在的讨论, 不同领域的人对a g e n t 技术有着不同的理解。p a t t i em a e s 认为【2 0 】“a g e n t 是在复 杂的动态环境中能够自主地感受并且作用于环境,从而实现被赋予的目标或完成 相应任务的计算机系统 。r u s s e l l 等认为【2 l 】“a g e n t 是任何能通过传感器感知 环境并通过执行器对环境进行动作的实体 。 w o o l d r i g e 和j e a n i n g s 给出了a g e n t 的两种定义【2 2 】:“( 弱定义) a g e n t 是一 个硬件环境或者软件系统,它具有自治性、社会性、反映性、能动性;( 强定义) a g e n t 除了具有弱定义中的所有特性外,还应具备移动性、准确性、合理性等类 似人类的特性一 。但是,对a g e n t 的典型定义大致可以归类为以下两种。 第一种定义来自a g e n t 技术标准化组织f i p a ( f o u n d a t i o nf o ri n t e l l i g e n t p h y s i c a la g e n t ) 认为“a g e n t 是驻留在环境中的实体,并可以从环境中获得反映环 境中所发生事件的数据,并执行产生环境影响的行为 。 第二种定义:软件a g e n t 研究者认为“智能软件a g e n t 是能为用户执行特定 的任务、具有一定程度的智能以允许自主执行部分任务并以一种合适的方式与环 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 境相互作用的软件程序 。 尽管在概念和理解上存在差异性,但是在更多的应用领域中,研究者倾向于 把凡是具有智能行为和交互特征的分布式实体都称为a g e n t 。因此人类、机器人、 智能嵌入式设备或智能软件都可以是a g e n t 2 3 】。 ( 2 ) a g e n t 的特性 根据以上a g e n t 定义,智能a g e n t 应该具有以下四方面的属性。 自治性( a u t o n o m y ) :a g e n t 具有属于其自身的计算资源和局部于自身的行 为控制机制,能够在没有外界直接操纵的情况下,根据其内部状态和感知到的环 境信息,决定和控制自身的行为。例如,互联网管理技术s n m p 中的a g e n t 就 是独立运行在被管理单元上的自主进程。 反应性( r e a c t i v i t y ) :即对环境的感知和影响能力。a g e n t 能够感知所处的 环境( 可能是物理世界,操纵图形界面的用户,或其他a g e n t 等) ,并对相关事 件做出适时反应。例如,一个模拟飞机的a g e n t 能够对用户的操作做出适时反应。 交互性( s o c i a la b i l i t y ) :即指a g e n t 的通信能力。在多个a g e n t 构成的社会 环境中,a g e n t 能够通过某种a g e n t 通讯语言与其它a g e n t 进行信息交互,实现 与其它a g e n t 的合作和协调。 自发性( p r o a c t i v e n e s s ) :传统应用程序是机械运行的,而a g e n t 的行为则 应该是主动的。a g e n t 感知周围环境变化,能够主动地产生目标,继而采取主动 的行为。例如,一个i n t e r n e t 上的主动服务a g e n t ,在获得新的信息之后能够按 照约定主动将其提交给需要的用户;一个工作流管理a g e n t ,能够按照约定将最 新的工作进展情况主动通报给有关的工作站。 2 2 2 多代理系统 由于单个a g e n t 具有功能局限性,因此在很多情况下它仅能在有限的范围内 对环境变化实现自适应和实时响应,从而缺乏对系统整体需求改变的应变能力。 多代理系统( m a s ) 是指具有不同目标的多个a g e n t 相互协作,对其目标、资 源等进行合理的安排,协调各自行为,最大程度地实现各自的目标。由于m a s 由多个a g e n t 组成,而每一个a g e n t 又是一个自治功能实体,具有目标、知识和 能力。因此m a s 优于仅由单个a g e n t 构成的系统 2 4 - 2 5 1 。在m a s 系统中,每一 个a g e n t 自治的履行自己的职责,即它们可以是不同的独立功能模块,因此可以 采用不同的设计方法和开发语言实现。另一方面,每个a g e n t 与其它a g e n t 通信 获取信息,互相协作解决整个问题【2 6 - 2 7 1 。 多代理技术是人工智能技术的又一次新的飞跃,提供了一种崭新的解决问题 的思路:首先,通过智能主体之间的通讯,可以开发新的规划和求解方法,用以 9 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 处理不完全、不确定的知识。其次,通过智能主体之间的协作,改善每个智能主 体的基本能力。最后,可以用模块化风格来组织系统【2 睨9 1 。 2 2 3 面向a g e n t 技术的程序设计 面向a g e n t 的程序设计( a o p ) 是a g e n t 技术、m a s 在实践中的具体应用, 而系统a g e n t 问的合作是完成系统任务的关键所在【3 0 】。近年来,a o p 在相关研 究领域取得了一定的进展,一些具有代表性的面向a g e n t 软件开发方法和语言已 经被提出,例如j a c k ,j a d e 等。 由于面向对象的程序设计方法发展比较成熟,具有面向对象语言以及工具强 大支持。因此研究人员根据对相关领域研究的分析,提出了面向a g e n t 程序中的 一种基于面向对象技术的软件a g e n t 体系实现方法【3 ”2 1 。该方法结合现有成熟的 面向对象设计方法,对面向a g e n t 技术的开发进行扩展,采用通过面向对象程序 设计的语言与工具实现软件a g e n t 功能。本文的系统实现过程中,采用了这种基 于对象的软件a g e n t 设计模型,对每个独立a g e n t 模块进行开发。在a o p 框架 下,软件a g e n t 的体系结构包含以下几个基本模块,如图2 2 所示。 ( 篡羹) u 环境、广 能 图2 - 2 软件a g e n t 体系结构 任务列表:a g e n t 所要完成的功能和任务。 外围环境感知模块、执行模块和通信模块:与系统环境和其他a g e n t 进行交 互。 信息处理模块:对感知和接受到的信息进行初步的加工处理和存储。 决策与智能模块:运用知识库中的知识,对信息处理产生的外部环境信息和 其它通讯信息进一步的分析、推理,为以后通信或从任务列表中选择适当的任务 供执行模块执行做出正确的决策。 1 0 北京邮电大学硕士研究生学位论文 2 2 4a g e n t 的通信 a g e n t 通信语言目前有k q m l ( 1 ) k q m l k q m l 定义的是信息的公共格 以及多个参数。一个k q m l 的例子如下: a s k - o n e :c o n t e n t ( p r i c ei b m ? p r i c e ) :r e c e i v es t o c k s e r v e r :l a n g u a g el p r o l o g :o n t o l o g yn y s e - t i c k s ) 其中a s k o n e 是k q m l 中定义的语用词,而带冒号的是一些参数名字,它带 冒号的部分以及紧跟着它的那部分构成一个“属性值 对。这样的一对就表示 这个动作的参数。 上面由k q m l 定义的消息的参数有下面几种: c o n t e n t :就是消息的内容本身。 f o r c e :消息的发送者是否会拒绝消息的内容。 r e p l y - w i t h :发送者是否期待回答,如果是,给出回答标识符。 i n r e p l y - t o - 参考r e p l y - w i t h 。 s e n d e r :消息的发送者。 r e c e i v e r :消息的接收者 目前,也有几个多a g e n t 系统采用k q m l ,并取得成功。但是,k q m l 还 是有一些不尽人意的地方。k q m l 的语用词采用自然语言描述其含义,使得含 义比较模糊;k q m l 的通信层没有严格规定,使得即使两个a g e n t 都使用k q m l 也不能保证可以通信;k q m l 语用词也不完备。 ( 2 ) f i p a a c l a g e n t 技术标准组织f i p a 已经推出了a g e n t 通信语言( f i p a a c l ) 以及a g e n t 系统与传统软件系统的集成规范。而目前大部分的基于a g e n t 系统的开发都是通 过以下方式进行:编程言语大多使用j a v a ,c + + ,l i s p ;通信语言使用f i p a a c l 或k q m l 。 f i p aa c l 通信语言包括两层: 第一层负责定义消息的语义,与消息实际的内容无关。f i p aa c l 规定所有 通信活动必须建立在准确、明确的形式语义基础上。具体的通信活动有r e q u e s t , 北京邮电大学硕士研究生学位论文旅游多媒体信息主动服务系统 a g r e e ,p r o p o s e ,a c c e p t p r o p o s a l ,i n f o r m 和n o n u n d e r s t o o d 等。 第二层负责定义消息的语法。目前f i p a 有三种不同的编码方案,分别是 f i p a - x m l s t d ,f i p a - s t r i n g - s t d 和f i p a - b i t e f f c i e n t - s t d 。 f i p a a c l 消息定义包括消息通信协议、a g e n t 发送标识符、a g e n t 接收标识 符、消息本体、消息内容语言以及消息内容。消息内容可以使用高级程序语言表 示,例如j a 、,a 。下面是一个f 1 p a a c l 消息的例子: i n f o r m :s e n d e ra g e n t l :r e c e i v e ra g e n t 2 :c o n t e n t ( p r i c eg o o d 215 0 ) :l a n g u a g es l :o n t o l o g yh i , l a u c t i o n ) k q m l 与f i p a a c l 的消息结构是一样的,而它们之间最重要的区别在于语 用词的集合。另外,更重要的是f i p aa c l 的开发者通过一种称为s l 的形式语 言给出了这种语言的形式语义。s l 允许表示一个a g e n t 的信念、愿望和意图以 及这个a g e n t 执行的动作。如果要发送良定义的消息,消息发送者必须满足一定 的约束,称为可行条件。另外,语义还用s l 定义了消息的目的,也就是a g e n t 发送一条消息意图实现什么,称为动作的合理结果。 2 3 用户兴趣建模方法 用户兴趣建模是指从有关用户兴趣的各种行为信息( 如浏览行为、浏览内容、 知识背景等1 中挖掘归纳出可计算的应用模型的过程【3 3 】。用户兴趣模型是针对 用户的个人兴趣建立的应用模型,是对用户在某段时间内的相对稳定的个性化信 息需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年建筑行业资深工程师面试指南及热点预测题详解
- 法律知识培训中学生民法典主题班会动态模板
- 2022年采购主任中层岗位竞聘培训
- 傣家竹楼教学课件
- 动画教学课件制作
- 新解读《GB-T 36761-2018工业用乙二胺》
- 甘肃省兰州市第五十八中学2024-2025学年高一下学期期末物理试卷(含答案)
- 2024-2025学年上海市松江九峰实验学校八年级(下)3月月考数学试卷(含答案)
- 新解读《GB-T 28827.1-2022信息技术服务 运行维护 第1部分:通 用要求》
- 新解读《GB-T 6374-2018凿岩机械与气动工具 尾柄和衬套配合尺寸》
- 项目经理考核试题及答案
- 车载信息娱乐系统的设计与开发-全面剖析
- 安检岗位培训课件模板
- 2025-2030中国水产饲料原料和产品行业市场现状供需分析及投资评估规划分析研究报告
- 抖音火花合同协议
- 安全文明施工和质量管理制度
- 2025二手汽车场地租赁合同
- 高一新生入学纪律教育
- 茆诗松概率论教案
- 《Java程序设计任务式教程》课件 603 构造方法
- 军队基本医疗设备配备标准
评论
0/150
提交评论