




已阅读5页,还剩55页未读, 继续免费阅读
(计算机软件与理论专业论文)个性化信息服务技术研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西北工业大学硕士学位论文 摘要 在现代化信息服务环境下,用户的信息需求日趋多元化和个性化,不同的 用户之浏存在着明显的个性差异。随着社会信息化进程的加速,个性化的生产 和服务开始流行。与标准化的产品和服务相比,个性的产品和服务更能满足用 户的需要,更能提高产品的服务的质量,信息技术的发展使得生产个性化产品 及提供个性化服务的成本大大降低,社会经济的进步导致了用户的个性化产品 与服务的巨大需求。 在这样的背景下,本文结合国际合作项目,对个性化信息服务系统的关键 技术,p - o a g e n t 技术,元数据组织,表示以及个性化推荐技术等方面做了研究。 个性化信息服务技术中,利用a g e n t 的智能性,根据不同用户的需求对原有的信 息空间进行变形,将其划分成多个个性化信息空间,拉近了用户与相关信息实 体之间的距离,加宽了用户与其不相关的信息实体之间的间隔,其最终结果是 提高了信息服务的整体效率。基于此,论文在研究a g e n t 及其特点基础上,重点 研究了基于a g e n t 的服务模式,多a g e n t 间的通信等。元数据即描述文件,论文 从用户元数据,资源元数据两个方面进行研究。在个性化推荐技术方面,论文 全面研究了基于规则的技术以及信息过滤技术,比较了两种技术的优点和缺点, 深入分析了不同的过滤模型的特点以及应用范围。数字电视节目( d t v ) 作为特殊 的媒体,不同于传统意义上的w e b 站点。针对数字电视节目个性化服务的特点, 论文提出了面向数字电视节目个性化服务的多a g e n t 体系结构,数据物理组织形 式,特征提取的方式和面向数字电视节目的个性化推荐方法。 本文重点结合传统个性化信息服务系统的关键技术,将这些技术运用到数 字电视节目个性化信息服务系统中,并且对一些关键技术结合数字电视节目个 性化服务的特点。进行修正。 最后,论文列出了备个主要a g e n t 的设计以及界面设计。 关键词: a g e n t ,用户p r o f i l e ,信息过滤,向量空间模型,x l v l l ,t v a n y t i m e p d r , 机器学习,个性化推荐,相关反馈 西北工业大学硕上学位论文 a b s t r a c t i nt h ec o n t e x to fm o d e mi n f o r m a t i o n 壳r v i c e t h ei n f o r m a t i o nd e m a n do fu s e r b e c a m ev a r i o u sa n dp e r s o n a l i z e d d i f f e r e n tp e r s o nh a sr e m a r k a b l yd i f f e r e n c ei n p e r s o n a l i t y t h eb a s i cc h a r a c t e ro f i n d u s t r i a l i z es o c i e t yi sl a r g es c a l eo f p r o d u c t i o n a n ds e r v i c e w i t ht h e d e g r e e o f s o c i e t y i n f o r m a t i o n p r o c e s ss p e e d i n gu p , p e r s o n a l i z e dp r o d u c t i o n a n ds e r v i c ei s p o p u l a r c o m p a r i n g w i t hs t a n d a r d p r o d u c t i o na n ds e r v i c e ,p e r s o n a l i z e dp r o d u c ta n ds e r v i c e sw e l is a r i s f yt h ep e r s o n s d e m a n da n di m p r o v et h eq u a l i t yo fs e r v i c e t h ec o s to f p r o d u c i n gp e r s o n a l i z a t i o n p r o d u c t i o na n dp e r s o n a l i z a t i o ns e r v i c ei sg r e a t l yr e d u c e d e c o n o m i cd e v e l o p m e n t r e s u l ti nt h eg r e a t l yd e m a n do f p e r s o n l a z i a t i o ns e r v i c e i nt h i sb a c k g r o u n d t h e p a p e rc o m b i n e s w i t ht h e j o i n tp r o j e c ta n dr e s e a r c h e st h e k e yt e c h n o l o g yo fp e r s o n a l i z a t i o ni n f o r m a t i o ns e r v i c e ,n a m e l ya g e n tt e c h n o l o g y , m e t a d a t aa n d p e r s o n a l i z a t i o n r e c o m m e n d a t i o n t e c h n o l o g y p e r s o n a l i z a t i o n i n f o r i i l a t i o ns e r v i c et e c h n o l o g ym a k ef u l lu s eo f t h ei n t e l l i g e n c eo f a g e n t ,a n d d e c o m p o s et h ei n f o r m a t i o ns p a c eb yd i f i e r e n tp e r s o nd e m a n d w h i c hm a k e 血e u s e rc l o s et ot h ei n f o r m a t i o n0 b i e c t p a p e rf o c u s e so nt h em o d t eo fa g e n ts e r v i c e a n da g e n tc o m m u n i c a t i o no nt h eb a s i so ft h ec h a r a c t e ro fa g e n t m e t a d a t ai s p r o f i l e p a p e rr e s e a r c h e su s e rp r o f i l ea n d r e s o u r c ep r o f i l e a sf o rp e r s o n a l i z a t i o n r e c o m m e n d a t i o nt e c h n o l o g y , p a p e rl u c u b m t e st h et e c h n o l o g yo fb a s e dr u l ea n d i n f o r m a t i o nf i l t e r i n g a sa s p e c i a lm e d i a d i g i t a lt v ( d t v ) p r o g r a m i sd i f f e r e n t f r o mt r a d i t i o n a lw e bp a g et h e r ea r es o n i cp o i n ta n dd i f f e r e n tp o i n tb e t w e e nt h e t w oo b j e c t s p a p e rp r o p o s e st h ep e r s o n a l i z a t i o ns e r v i c ea r c h i t e c t u r ef o rd i g i t a lt v a tt h es a l n et i m e ,p a p e ri m p l e m e n t st h em e t a d a t ap r e s e n t a t i o n ,f e a t u r ea b s t r a c t i o n a n dr e c o m m e n d a t i o nw a y w h i c ha r ef o rd i g i t a lt v p a p e rf o c u so nr e s e a r c h i n gt h et r a d i t i o n a lp e r s o n a l i z a f i o ni n f o r m a t i o ns e r v i c e t e c h n o l o g ya n dp u t t i n g i tu s ei nt h ed t v p e r s o n a l i z a t i o ni n f o r m a t i o ns e r v i c e c o n t e x t f u r t h e r m o r e p a p e rm o d i f i e ss o m ek e ya l g o r i t h ma c c o r d i n g t h e d i g i t a lt v p r o g r a mp e r s o n a l i z a t i o n s e r v i c ec h a r a c t e r a t l a s t ,p a p e rg i v e st h ed e s i g n o f m a i n a g e n ta n d t h eu s e ri n t e r f a c e k e yw o r d s :a g e n t ,m e t a d a t a ,i n f o r m a t i o nf i l t e r i n g ,v s m ,t v a n y t i m e ,p d r , m a c h i n el e a r n i n g ,p e r s o n a l i z a t i o nr e c o m m e n d a t i o n ,r e l e v a n c ef e e d b a c k i l 西北工业大学倾1 :学位论殳 绪论 第一章绪论 1 1 研究背景及意义 在现代化信息服务环境下,用户的信息需求目趋多元化和个性化,不同的 用户之间存在着明显的个性差异。大规模的生产和服务是工业化时代的一个基 本特征。随着社会信息化进程的加速,个性化的生产和服务开始流行。与标准 化的产品和服务相比,个性的产品和服务更能满足用户的需要,更能提高产品 的服务的质量,信息技术的发展使得生产个性化产品及提供个性化服务的成本 大大降低,社会经济的进步导致用户的个性化产品与服务的巨大需求。 另一方面,随着通信技术,越来越多的信息通过卫星,地面广播和有线电 缆传播,这种情况就会导致一种信息的过载。随着互联网的不断发展,人们对 网络的依赖性越来越强。然而,要从网络中获取所需的信息并非易事。各种搜 索引擎如y a h o o ! e x c i t e ,g o o g l e 等发挥着极其重要的作用,它们为用户的获取信 息提供了便利。然而,随着网络资源的不断丰富和网络信息量的不断膨胀,现 有搜索引擎技术不足逐渐显现出来。人们发现,使用现有搜索引擎查询出来的 结果是成千上万,良莠不齐。并且,针对不同的用户使用同一种搜索引擎对同 一个关键宇进行检索时,得出的结果均是相同的,不能满足用户个性化的需求。 可见,信息物质载体的多样化和信息传播技术手段的多样化为个性化信息 服务创造了需求,也带来了更大的复杂性和难题,用户作为各个相对独立的个 体,对信息的物质载体和传播手段有自由的选择性。以文字信息为载体,以印 刷体文献为支撑,以文献借阅为传播手段是较传统的手段,是现在依然常用的 信息服务方式,但已不是一统天下。随着以色,形作为符号,以光电作为支撑, 以计算机电视机,现代通信技术作为手段的信息服务方式的发展,网络信息 体系,虚拟图书馆,个性化数字电视节目服务等对我们已不是遥远的事情。 个性化信息服务是指由人类个体特性所决定得其对信息需求的一种信息的 组合,也就是由人类个性对信息需求的决定关系产生的一系列对个体有用的信 息:个性化信息服务的主要目的就是要为用户提供一种个性化的信息。个性化 信息服务应该是能够满足用户的个体信息需求的一种服务,即根据用户提出的 明确要求提供信息服务,或通过对用户个性,使用习惯的分析而主动地向用户 提供可能需要的信息服务。个性化信息服务是网络信息环境发展的产物,是信 息服务发展的必然趋势。 在信息服务的各个领域,比如,信息检索,文本过滤,电子商务以及未来 数字电视节目服务,如何根据用户各神不同的个性化信息需求,实现个性化信 息服务,具有非常深远的意义。 西北工业犬学硕匕学位论文 绪论 1 2 个性化信息服务技术发展现状 个性化的实质是针对性,即对不同的用户采取不同的服务策略,提供不同 的服务内容。个性化服务将使用户以最少的代价获得最好的服务。在信息服务 领域,就是实现“信息找人”,实现信息的主动服务。既然是信息找人,那么 找什么“人“就成为关键,每个用户都有特定的,长期作用的信息需求。用这 些信息需求形成过滤条件,对资源流进行过滤,把符合用户要求的资源流提取 出来给用户,这种方法就叫做信息过滤。信息过滤是个性化主动服务的基础。 信息搜索方面:目前在i n t e r n e t 上进行信息搜索由两种方法,一种简单的 方法是现有的搜索引擎常用的方法,即根据原始资料提供者向搜索引擎提交索 引信息来获取该信息的连接。这种方法适用与大型信息服务商。查n y a h o o 等,但 这种方法也有一定的不足,主要表现为这些搜索引擎家所处理的信息量太庞大, 且一个特定的搜索引擎主要包含某一特定领域的信息;在个性化搜索方面,由 于h t t p 协议的无状态性,使得搜索引擎不能很好的跟踪用户的偏好,虽然现在 有些搜索引擎可对检索结果进行打分并按得分高低来呈现给用户,但他根本没 考虑到用户个人的兴趣爱好,不同的用户对于同样的检索关键词检索出的信息 是相同的,另一种方法是使用智能代理技术,在i n t e r n e t 上搜索所需的信息, 但目前的浏览器和检索工具还没有智能搜索功能。因此目前的信息服务系统能 提供的查询方式非常有限,对需求的满足精度不高,对智能化查询和个性化查 询的满足程度相对较低。 信息分类方面:为了便于信息的管理和查询,应采用i n t e r n e t 上比较流行 的分类方式在系统内部对信息分类,这种分类方式类似于图书管理中的分类方 式,涉及面比较广,通用性比较强。另外每个用户对信息所属类型的理解不同, 他们需要的信息分类方式也不同,因此还存在用户的个性化分类,个性化信息 服务系统提供给用户的应该是一种可以由用户自己决定的分类,但如何将通用 性较强的系统内部分类和个性化较强的个性化分类结合起来以使信息服务系统 提供更好的服务还没有找到较好的方法。 用户享受服务的方式和时效方面:受现有的客户服务器模式的制约,用户 通常只能在客户端主动地要求服务器端的服务,因此就不能及时地享受到服务 器端新的服务,更不能实现在客户端享受服务器端的“上门服务”。而且服务 器端有限的服务是很难满足形形色色用户的需求的。 个性化信息的获取与分析方面:目前的多数系统都通过用户自己提交的方 式来获取其个人信息,缺乏跟踪用户行为和主动分析其行为并提取用户个性特 征的能力,因而其系统内部的个性化信息是静态的。由于用户的兴趣和需求是 不断变化的,因此其个性信息也必须是动态可维护的,而且大多时候用户提交 的个人信息是很粗略的,所以也就有必要不断地丰富其个人信息。但如何很好 地通过监视用户的动作来主动地分析并提取其个性特征是个性化信息服务系统 急需解决的问题。 目前,信息过滤研究的一个显著趋势就是增加信息过滤系统的自动化,以 便自动的修改p r o f il e 和进行相关的过滤操作。通常研究人员利用“a g e n t ”来实 现信息系统的自主操作。将a g e n t 应用于信息过滤领域,既克服无智能过滤的弊 两北工业大学硕l 学位论文 绪论 端,又克服人工智能局限于较旧的应用领域等特点,开拓a g e n t 在信息领域的发 掘作用。 迄今,个性化系统已经得到大量的研究,个性化的理论和思想被应用到许 多领域,比如电子邮件,电子商务和w e b 。 目前存在着很多个性化信息服务系统,他们提出了各种思路以实现个性化 信息服务。个性化服务系统根据其所采用的推荐技术可以分为两种:基于 规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协 作过滤系统。 基于规则的系统如:i b m 的w e b s p h e r e ( w 、v w i b m c o m w e b s p h e r e ) , b r o a d ( w w w b r o a d v i s i o n t o m ) ,i l o g ( w w w i l o g c o r n ) 等,他们允许系统管理员根 据用户的静态特征和动态属性来制定规则,一个规则本质上是一个i f t h e n 语 句,规则决定了在不同的情况下如何提供不同的服务,基于规则的系统其优点 是简单,直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规 则的数量增多,系统将变得越来越难以管理。 基于内容的过滤系统如:p e r s o n a lw e b w a t c h e r ,s y s k i l l & w e b e r t , l e t i z i a ,c i t e s e e r ,i f w e b ,p v a ,w e b m a s t e r ,w e b a c e ,e l 和w e b p e r s o n a l i z e r 等,它 们利用资源与用户兴趣的相似性来过滤信息。基于内容的过滤系统其优点是简 单,有效,缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的 感兴趣的资源,只能发现和用户已有兴趣相似的资源。 协作过滤系统如:w e b w a t c h e r ,l e t sb r o w s e ,g r o u p l e n s ,f i r e f l y , s e l e c t l i k e m i n d s 和s i t e s e e r 等,它们利用用户之间的相似性来过滤信息。基 于协作过滤系统的优点是能为用户发现新的感兴趣的信息,缺点是存在很难解 决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够 多的评价系统很难利用这些评价来发现相似的用户。另一个是可扩展性,亦 随着系统用户和资源的增多,系统的性能会越来越低。 还有一些个性化服务系统如:w e b s i f t ,f a b ,a n a t a g o n o r n y 和d y n a m i e p r o f i l e r 等,同时采用了基于内容和协作过滤这两种技术。结合这两种过滤技 术可以克服各自的一些缺点,为了克服协作过滤的稀疏性问题,可以利用用户 浏览过的资源内容预测用户对其他资源的评价,这样可以增加资源评价的密度, 利用这些评价再进行协作,从而提高协作过滤的性能。 可见,个性化信息服务技术已经已经得到了广泛的研究与应用。 1 3 个性化服务在d t v 领域的应用 除了以上信息领域,电视是另一个需要个性化的信息源。电视节目的个 性化和纯文本、w e b 页面的过滤推荐不同,其原因是,描述电视节目信息的元 数据一般属于半结构化数据,真正文本数据并不多,所以传统的词频统计方法 并不适于它的特征提取;而且,对于传统文本信息,只考虑用户有没有看过 至于在该信息上投入多少时间,并不重要。但是对于电视节目,它具有时间特 性,用户在一个节目上投入时间的多少,直接反映了用户的满意程度;相对 西北_ t 业大学颂 :学位论立绪论 于w e b ,电视的使用更普遍,更广泛,用户更大众化,因此个性化的的易用性要 求较高,一个用户友好的个性化电视应该易于使用,易于学会,易于理解,易 于排错,易于维护和易于群体共享。 t v a n y t i m e 组织正在致力于开发一套为用户提供智能及节目推荐服务的需 求与规范。有了这套规范,就能为用户提供节目推荐,为用户提供个性化服务。 这样一来,用户迫切需要一个“代理人”对传输过来的节目进行管理,并且自 适应地根据用户不断改变的喜好与需求,对服务商提供的节目进行过滤,并将 用户感兴趣的节目推荐给用户。 针对过多的电视节目,近年来出现了一些个性化的电视系统,它们提出了 各种思路来实现电视节目个性化服务,其中包括不同的用户兴趣学习方法和节 目推荐技术。t v 3 p 采用了显式输入和隐式反馈对用户兴趣进行跟踪,t v a d v i s o r 则使用了显式反馈,t vr e c o m m e n d e r 和p - e p g 同时使用了显式和隐式反馈,v i d e o i n d e x i n g 使用了基于内容的视频分割、分类和索引,并且同时结合了语法和语 义特征,p t v $ 口t v s c o u t 采用了混合的推荐策略,将基于内容过滤和协作过滤 结合使用,d y n a m i cr e c o m m e n d a t i o n 同时利用了显式和隐式反馈信息,并且将 基于内容过滤和协作过滤结合使用,形成动态推荐过程。v i r t u a lc h a n n e l 为个 性化电视中节目的动态组织和表现提出了一种虚拟频道的模式,对用户来说好 像就存在一个频道始终为其播放喜爱的节目。 1 4 论文结构 本论文主要研究个性化信息服务一些关键技术,并且结合数字电视节目个 性化服务这个课题,进行关键技术研究,原型系统的开发。论文的内容分为五 章。第一章简要介绍了个性化信息服务技术的目前发展现状。第二章全面就个 性化信息服务的关键技术做了研究。第三章深入研究了面向数字电视节目的个 性化服务的体系结构以及一些相关技术。第四章介绍了面向数字电视节目的个 性化服务系统的实现。第五章总结论文,并提出了个性化信息服务的发展方向。 4 西北丁业大学 0 i f :学位论文个性化信息服务关键技术 第二章个性化信息服务关键技术 2 1a g e n t 技术 随着信息容量越来越大,同时信息处理越来越复杂,为用户提供智能化信 息服务是个性化信息服务的关键。因此,a g e n t 以其独有的特点,成为个性化信 息服务中的项关键技术。 2 i 1a g e n t 的特点 在个性化信息服务中,利用a g e n t 的智能性,根据不同用户的需求对原有的 信息空间进行变形,将其划分成多个个性化信息空间,拉进了用户与相关信息 实体之间的距离,而加宽了用户与其不相关的信息实体之间的间隔,其最终结 果是提高了信息服务的整体效率。 在a g e n t 技术的系统中,a g e n t 的定义和表现各不相同,那么,究竟什么是 a g e n t ,他又有哪些特性。这些是a g e n t 研究者和应用者最为关心的问题,也是 目前a g e n t 研究领域一直在争论和探讨的热点问题之一。 在有关a g e n t 特性的研究中,最近的和广为接受的w o o l d r i d g e 等人有关 a g e n t 的”弱定义”和“强定义”的讨论。一个a g e n t 的最基本特征应当包括:反 应性,自治性,面向目标性和针对环境性。每个a g e n t 首先应具备这四条虽基本 的特性,然后再根据其应用情况有其他特性。a g e n t 可以拥有的其他特性包括: 移动性,自适应性,通信能力( 包括协商,协作等能力) ,理性,持续性或时 间连续性,自启动,自理等特性。一些研究人员还从a g e n t 的精神状态出发,对 a g e n t 的特性进行了更为深入的研究。 研究和开发人员没必要构建一个包括上述所有特性的a g e n t 或多a g e n t 系 统,它们往往是从应用的实际需要出发来开发包含以上及部分特性的a g e n t 系 统。但我们认为,既然是成为面向a g e n t 的技术或系统,那么就应当满足上述提 到的四条最基本的特征。我们可以根据a g e n t 的特性给出一个a g e n t 的简单定义: a g e n t 是一类在特定环境下能感知环境,并能自治地运行以代表其设计者或使用 者实现一系列目标的计算实体或程序。 为提高信息服务的个性化特征。a g e n t 必须在收集用户信息,维护用户兴趣 模型和分析用户特征特等个性化方面发挥重要的作用。这里主要利用a g e n t 的以 下几个主要特征来让系统更好地了解用户,并提供些新的个性化服务。 自主性:使得它既可以在不受用户监控和指导下由自己的决策机制决定采 取什么行动,并与用户并发工作,又可以学习记忆用户的兴趣爱好,建立用户 兴趣模型来知道自己的决策,使之符合用户的需求。 移动性:移动a g e n t 是指具有跨平台持续运行,自我控制移动能力,模拟 西北丁业大学硕k 学位论文个性化信息服务关键技术 人类行为关系,并能提供一定人类智能服务的程序。移动a g e n t 可以从网络中某 个节点移动到其他节点来执行完成一定的任务,移动a g e n t 技术具有动态性和分 布计算的特点。进一步扩展了a g e n t 处理事务的功能。利用它使得定制服务和即 时服务成为可能,而且提高了采集用户兴趣和搜索信息的效率。 协作性:协作性是多a g e n t 系统的重要特征,它指a g e n t 能与其他a g e n t ( 包 括人) 进行交互并有效地协调工作,因此协作性能使a g e n t 更好地了解用户,收 集更完善的用户资料,提高a g e n t 为用户解决问题的能力;分布性为分布式资源 的管理提供了途径。 主动性:a g e n t 能主动地分析和读取用户的个性信息并根据用户的兴趣模型 了解用户的潜在需求,采取主动的行为,因此它使得主动服务成为可能。 a g e n t 的这些特点非常适合分布式信息的管理和个性化信息服务的工作,当 然以上只是个性化f 氰息服务中a g e n t 具有的最基本的特点,随着应用场合的不 同,各个a g e n t 可以有一定的差别。 2 1 2 基于a g e n t 技术的服务模式 基于个性化信息服务的需求,可以利用a g e n t 的以上特性来提供一个新的服 务模式。如定制服务,即时服务和主动服务等。 定制服务:若把已有的服务称为“基本服务”,根据不同的用户的特点, 喜好,可以利用a g e n t 技术使a g e n t 移动到相应的节点并对基本服务进行 定制或通过配置基本服务来产生新的服务。为了提供定制服务,可以开发 合适的定制a g e n t 传到对应的服务器上执行,通过客户端的个性化a g e n t 与这些a g e n t 的交互,使得移动到服务器上的a g e n t 能很好的掌握用户的 个性特征,然后根据这些特征对基本服务进行定制或以不同的方式进行功 能扩充,并向个性化a g e n t 提供一个定制服务来模仿基本服务,它们的作 用就相当于一个前端服务接口,同时定制服务还可以进行定制。 即时服务和主动服务:现有的客户服务器技术中,用户必须执行客户应 用程序才能访问远程服务器,因此客户在使用服务之前必须先安装客户应 用程序,进行初始化连接和发出请求等。这种服务的主动方是客户,因而 服务器端出现新的服务时,就不能根据用户的个性特点和潜在要求来即时 地为用户主动服务。利用移动a g e n t 技术,只要将用户的兴趣资料和服务 客户程序放到移动a g e n t 中,移动a g e n t 自身可以根据用户的个性特征移 到相应的客户端,当客户收到这个移动a g e n t 时就可使用新的服务。因此 服务器可以通过创建一个移动服务客户移动到客户端,从而可以向可能的 客户发送新的客户服务程序,用户也就即时地得到了新的服务。当用户登 录时,服务器端的a g e n t 也可即时捕获用户和会话信息,根据这些信息从 用户信息库和索引库中提取相应的信息进行计算,然后将用户会话信息和 用户的兴趣,当前的社会潮流以及相关的信息进行匹配,得出服务的推荐 集合,从而可以实现主动为客户服务。 6 西北t 业大学硕l :学位论文个性化信息服务关键技术 定制服务,即时服务和主动服务都是利用a g e n t 技术实现的新的服务模式, 这些服务模式都在很大的程度上满足了用户的个性化需求,随着a g e n t 技术的进 一步发展,必然会出现更多新的个性化服务。 一个智能a g e n t 成败的关键是它对用户行为习惯的了解及用户对a g e n t 自 主行为的认可程度,这就涉及到a g e n t 设计中的两个问题: ( 1 ) 能力问题,r w a g e n t 女b 何获得必要的知识咀决定在何时或以何种方式帮 助用户。能力问题要求a g e n t 要有很强的领域知识的获取和推理能力。 ( 2 ) 信任问题,即如何使用户信赖和认可a g e n t 所采取的自主行为。信任问 题要求智能ag e n t 必须得到用户的信赖。传统上有两种方法来解决这两个问 题。第一种:让最终用户来对a g e n t 编程,即用户定义和编写a g e n t 的思维和行 动规则。这种方法的优点在于解决了信任问题。但是,在解决能力问题方面欠 缺。因为这种方法要求最终用户具有很高的分析、理解、规划等技术能力,否 则a g e n t 的性能就要受到影响。第二种:知识库为主的方法,即由知识工程专家 来定义所有的知识及规则。这种方法很好地解决了能力问题,但又不能解决信 任问题。因为由专家定义的a g e n t j t 为规则难以满足个体间的差异,容易造成用 户对a g e n t 的某些自主行为不理解,从而对a g e n t 失去信任,采用机器学习技术 刚好在“信任”和能力之间找到一个平衡点,通过学习,既能使a g e n t 不断丰富 和充实自我,又可保持与用户良好的沟通,很好的掌握用户个体的差异。因此, 我们决定用机器学习的方法设计我们的个性化信息服务a g e n t 。 2 1 3 多a g e n t 系统 多a g e n t 系统( m a s ) 是由多个a g e n t 组成的系统,它在a g e n t 理论的基础上 重点研究a g e n t 的互操作性以及a g e n t 间的协商和协作等问题。基于a g e n t 的系统 ( a g e n t b a s e d s y s t e m ,简称a b s ) 是指使用t a g e n t 思想或技术的系统。a b s 可能只 包含一个a g e n t ,如用户接口a g e n t 或软件秘书等,但通常是指m a s 的应用实例。 j e n n i n g s 等人还指出,a b s 可以是只借用a g e n t 概念而用其他技术( 虫n o o p ) 实现的 系统 在m a s 中,a g e n t 不是孤立存在的,a g e n t 的资源和能力都是有限的,a g e n t 的行为必须满足某些理性,不能为所欲为。所以,理性就是多a g e n t 在交互时, 如何在多个可能的行为策略之间做出合理的选择。j e n n i n g s 在i j c a i 9 9 发表的 论文“基于a g e n t 计算”中指出,研究m a s 就是研究以自治为前提,面对群体交 互的社会性要求如何建立理性a g e n t 。理性关系着m a s 做出正确的决策和产生成 功的行为,是一种平衡,是一种有序结构和一种预定的社会规范。具体讲就是, 能把知识放到合适的位置( 关联性) :当知识出现断章片文时,也能理解( 整体 性) ;对外来信息不用形式化就能提取所需知识( 主动性) ;当系统出现矛盾的知 识或熏复知识时,能选择其一,同时删除另一个( 动态性) ;能够从个别的例子 中抽象出具有普遍意义的法则( 归纳性) ,当知识不够用时能够进行通信,获取 知识( 开放性) 。 m a s 的协作求解问题的能力超过单个a g e n t ,这是m a s 产生的最直接的原因。 导致m a s 研究逐渐兴起的其他原因还包括:与已有系统或软件的互操作;求解那 西北t 业大学顾l 学位论文个性化信息j 】l i 务关键技术 些数据、能力和控制具有分布特性的问题以及提高系统的效率和鲁棒性等。与 单个a g e n t 十h 比,m a s 有如下特点:每个成员a g e n t 仅拥有不完全的信息和问题求 解能力( 因而其观点是有限的) ,不存在全局控制,数据是分散或分布的,计算过 程是异步、并发或并行的。 具体来讲,多a g e n t 系统有以下好处。第一,多a g e n t 系统能够通过并行处 理提高系统的处理速度。比如,一个域往往可以被分为好几个部分,几个独立 的任务可以被几个不同的a g e n t 完成。多a g e n t 的另一个优点是鲁棒性。如果一 个任务的完成依靠几个a g e n t 是足够的话,那么我们可以用一个或者多个a g e n t 来容错。多a g e n t 的另一个好处是它的可扩展性,因为在本质上它具有模块性, 所以很容易添加新的a g e n t 到这个多a g e n t 系统中。如果系统的处理昭力和参数 需要修改的话,那么多a g e n t 系统非常适合。 2 i 4 a g e n t 间通信 在多系统中,合作是a g e n t 获取信息的重要途径。a g e n t 之间进行合作的基础 是交互,而通信是实现a g e n t 交互的一种重要方式和手段。为研究a g e n t 女h 识获 取的合作模型k a c m ,有必要首先研究k a c m 所涉及的a g e n t 通信行为。a g e n t 间的 通信行为是一类特殊的行为,因为它将对交互双方a g e n t 的内部状态产生影响。 言语行为理论是研究a g e n t 通信行为的一个重要理论。它认为:人类交际的语言 不仅仅是为了描述某种状态,而是为了完成一定的行为,如“通知”、“询问” 等等。言语行为的特点是说话者通过说一句或若干句话来执行一个或若干个上 述所列举的行为,这些言语行为的实现可能给说话者或者听者带来某些后果。 目前国际上最著名的a g e n t 通信语言是美国a r p a 的知识共享计划 ( k n o w l e d g es h a r i n ge f f o r t ) 中提出的两个相关的语言:一个是k q m l ( k n o w l e d g eq u e r ya n dm a n i p u l a t i o nl a n g u a g e ) ,另一个是k i f ( k n o w l e d g e i n t e r c h a n g ef o r m a t ) k q m l 定义了一种a g e n t 之间传递信息的标准语法以及一 些”动作表达式( p e r f o r m a t i v e ) ”这些“动作“主要是从言语行为理论中演化 出来的。谢n t e l l ,p e r f o r m ,r e p l a y 等等。k i f 则给信息的内容提供一种语法, 它基本上用类似于l i s p 的语法书写的一阶谓词逻辑演算。 k q m l 是一种最通用的a g e n t 通信语言。k q m l 规定了消息格式和消息传递系 统,为多a g e n t 系统( m a s ) 通信和协作提供了一种通用框架,特别是提供了一 组识别,连接建立和消息交换的协议。消息的语义内容在k q m l 中规定并不详细。 因为标准是开放的,各种语言可以用来传递知识,也可以集成在k q m l 中。 在k q m l 中,不是所有的对话都是一种简单的问回答处理模型。k q m l 目l 入了 一种通信服务器,允许使用更复杂的数据结构。通信服务器的主要任务是把搜 索引擎信息的a g e n t 与提供信息的a g e n t 连接起来。 k q m l 的特点可以归纳为如下: 1 k q m l 是程序之间用于交流“态度”的语言,诸如询问,陈述, 信任,要求,定购,提供等“态度”信息,这些信息本身与k q m l 语言无关,在k q m l 表达中通常包含有“内容语言”的子表达, 即信息内容也可以用另外一种完全不同的语言来描述。 西北工业大学硕卜学位论文个性化信息服务关键技术 2 一条k q m l 消息成为一个行为原语( p e r f o r m a t i v e ) 。该术语来源 于言语行为理论的“言语行为“,使表示发送这条消息是为了接受 方执行某些动作,k q m l 定义了一些基本的行为原语用于a g e n t 之间常用的通信。 3 k q m l 语言具有扩展性。针对不同应用领域多a g e n t 系统,开发 人员可以定义新的行为原语,只要它们遵循k q m l 规范。k q m l 中,语言内容和通信的独立性,提高了系统的灵活性。目前k q m l 实现使用通信和消息协议作为传输层,这些协议包括t c p i ee m a i l , l i n a d a ,h t t p 和c o r b a 等。 2 2 数据组织 2 2 i 用户p r o f i l e 用户p r o f i l e 组织形式 对个性化服务系统来说最重要的是用户的参与,为了跟踪用户的兴趣 与行为,有必要为每个用户建立一个用户p r o f i l e ( u s e rp r o f i l e ) 。用户p r o f i l e 亥l j 画 用户的特征与用户之间的关系。在制定用户p r o f i l e ,需考虑下面几个问题:有 没有现成的标准? 收集什么数据? 收集的数据用于什么目的? 如何收集数 据? 根据什么信息源柬收集? 收集的数据如何组织? 用户信息能否自适应 地更新? 用户p r o f i l e 还没有一个统一的标准,如w 3 c ( 塑i 型! 塑3 :q ! g ) 直西仝造星出应 描述文件的标准:p i c s ( p l a t f o r mf o ri n t e m e tc o n t e n ts e l e c t i o n ) 和a p p e l l 0 ( ap 3 p p r e f e r e n c ee x c h a n g el a n g u a g e1 o ) ,p i c s 是父母和老师用来控制孩子的浏览能力 的,提供了过滤规则定义语言p i c s r u l e s 。a p p e l l o 可定义用户感兴趣的站点 和过滤规则,这些规则大部分是在p i c s r u l e s 的基础上发展起来的。此外, n e t s c a p e ,f i r e n y 牙口v e r i s i g n 曾向w 3 c 的p 3 p ( p l a t f o r m f o r p r i v a c yp r e f e r e n c e s ) i 作 组提交了一个o p s ( o p e np r o f i l i n gs t a n d a r d ) 草案,由于目前p 3 p 版本不打算考虑 如何进行数据传输,因此该草案被搁置一边,o p s 描述了如何表示一个用户描 述文件以及用户与w e b 站点交互的问题 在收集用户的信息之前,首先需分析用户愿意提供什么信息,用户一般都 很注意个人信息的保密性,w w v v c y b e r d i a l o g u e c o r n 的调查显示,8 0 的用户愿意 向w e b 站点提供自己的姓名、性别、年龄、教育背景和兴趣,但大多数用户不 愿意提供私有、敏感的信息,比如个人收入和信用卡号等,该公司另一项调查 显示,2 8 的用户愿意w e b 站点向其他w e b 站点共享自己的信息。为了规范w e b 用户信息的保密性,w 3 c 成立了p 3 p 工作组来解决这个问题,它允许用户有选 择地向w e b 站点提供自己的信息,从而达到保护用户信息的目的。目前已有一 些站点和浏览器支持了p 3 p ,比如w w w w 3 c o r g w w w m i c r o s o f t c o m w w w a 0 1 t o m ,w w a t t t o m 等站点和m i c r o s o f t a t & tp 3 p 浏览器等等,但还处 于试用阶段。 9 两北t 业大学硕i 学位论殳个性化信息月务关键技术 不同个性化服务系统的用户p r o f i l e 各有其特点,用户p r o f i l e 从内容上可以划 分为基于兴趣的和基于行为的两种类型。基于兴趣的用户p r o f i l e 可以表示为加 权矢量模型、类型层次结构模型、加权语义网模型、书签和目录结构等。基于 行为的用户p r o f i l e 可以表示为用户浏览模式或访问模式。在具体实现时可以综 合基于兴趣和基于行为这两种表达方式。 用户p r o f i l e 可以用文件来组织,也可以用关系数据库或其他数据库来组 织。目前有一些系统采用基于x m l 的r d f ( r e s o u r c ed e f i n i t i o nf r a m e w o r k ) 来表 达用户p r o f i l e ,并利用支持x m l 的数据库系统来存储用户p r o f i l e ,这样,不仅利 用了x m l 的优点,也保持了系统的性能,后面的章节会详细介绍x m l 技术。 用户p r o f i l e 更新方式 在用户第一次
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 康平县总工会社会工作者招聘考试真题2024
- 大同市辅警考试题库2025
- 2024年鞍山钢铁集团公司职工大学招聘真题(行政管理岗)
- 2025官方版标准合同协议书
- 工业互联网平台生态构建策略与政策环境适应性分析报告
- 2025正规农产品购销合同书
- 湖南邵阳洞口县自来水公司招聘笔试题库2025
- 工业互联网平台构建2025年策略规划:生态布局与创新发展研究报告
- 2025照明设备供应合同范本
- 2025年车位买卖合同
- 急腹症的基本临床实践指南解读
- ECMO联合CRRT护理查房
- 血压基础护理讲解
- 厂房建筑结构设计方案
- 2025护理岗招聘笔试题库及答案
- 监督工作培训课件
- 2026届安徽省淮南市中考试题猜想语文试卷含解析
- NB/T 11636-2024煤矿用芳纶织物芯阻燃输送带
- GPR39mRNA在糖尿病大鼠组织中的表达特征及关联机制研究
- 2025年专升本艺术概论考试模拟卷(艺术史论重点与艺术史研究方法探讨试题)
- 幼儿园健康预防蚊虫叮咬
评论
0/150
提交评论