(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf_第1页
(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf_第2页
(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf_第3页
(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf_第4页
(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf_第5页
已阅读5页,还剩88页未读 继续免费阅读

(计算机应用技术专业论文)面向使用环境的端到端web服务推荐方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a t h e s i sf o rt e n dt o 萄 ; 。 晦 芦 墓 , 独创性声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的 研究成果除加以标注和致谢的地方外,不包含其他人已经发表或撰写过的 研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示诚 挚的谢意。 学位论文作者签名: 签字 日期: 镙坞 汛飞1 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论 文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部 或部分内容编入有关数据库进行检索、交流。 作者和导师同意网上交流的时间为作者获得学位后: 半年口一年日一年半口两年口 学位论文作者签名:彭象i 鸪 签字日期: 护9 7 7 导师签名:伙 签字日期:夕9 7 7 1 ji 利_一铀jr二引,j1 文 摘要 面向使用环境的端到端w e b 服务推荐方法 摘要 随着w e b 服务( 以下称w s ) 的兴起,i n t e m e t 上涌现出了大量提供公共w s 的服务提 供者。随之而来的,许多不同的w s 提供者提供相同或相似服务功能的现象也开始在网 络上大量出现。当选取一个w s 时,服务质量( q o s ) 是一个非常重要的考虑因素。当前 的w s 选取和推荐主要是基于服务器端的性能属性的,然而实际情况是,w s 客户端分 布在多种不同的环境中,不同客户对同一个服务所感知到的性能是大不相同的。因此, 已往单一基于服务器端性能的推荐机制不能保证其有效性。如何针对客户所在的使用环 境,为其选择最适合的服务就成为目前研究的热点问题。 针对这个需求,本文研究的核心问题是在已经满足w s 功能需求的前提下,如何针 对用户所处的不同使用环境,推荐给客户最适合它的服务。本文深入研究不同使用环境 对客户感知服务质量的影响,提出一种集成w s 监测、分析、评价和推荐框架的新型推 荐方法。该方法以端到端w s 监测为基础,客户端对服务质量的感知为依据,克服了已 往推荐方法单方面信任服务提供者或者第三方监测的弊端。本文在评价w e b 服务质量 时选取了q o s 指标中最重要属性之一:性能。建立以客户为中,t l , 的q o s 指标体系,明 确提出了客户在感知服务q o s 属性中的中心地位。 在对服务感知质量研究的基础上,本文对面向使用环境的端到端w e b 服务推荐机 制作了研究。该推荐机制主要包含3 个组成部分:端到端监测、客户分组、服务推荐。 基于客户调用服务时使用环境的不同,本文重点对客户分组方法进行了深入研究,依据 客户感知的吞吐率,通过聚类和推论算法对客户进行分组,并逐层深入和细化,通过合 理的分组使组内的客户相似性达到最大,而组间的客户使用环境有明显不同。最后本文 通过在互联网环境下的实验,展示了使用本文所提出的评价技术的推荐方案,验证了推 荐方法的有效性。 关键词:w 曲服务;w e b 服务质量( q o s ) ;客户为中心的q o s ;端到端服务腆i - t 厶匕l - 匕, iw e b 服务推荐 t - - 0 ; j k e y w o r d s :w e bs e r v i c e ;q u a l i t yo fw e bs e r v i c e s ( q o s ) ;c l i e n t - s i d eq o s ;e n dt oe n dw s p e r f o r m a n c e ;w e bs e r v i c er e c o m m e n d a t i o n i i i , l ,剞1 东北大学硕士学位论文 目录 目录 独创性声明i 摘要i i a b s t r a c t i i i 第l 章绪论1 1 1 课题背景和意义1 1 2 研究的主要问题及主要研究内容2 1 3 论文的组织与结构3 第2 章相关研究5 2 1 动态w e b 服务质量监测技术5 2 1 1 基于对底层网络数据包进行监测的方法6 2 1 2 基于代理( p r o x y ) 的方法,6 2 1 3 基于修改s o a p 引擎库的方法一7 2 1 4 基于应用响应测量( a r m ) a p i 的方法7 2 2 目前主要q o s 评价方法8 2 2 1q o s 指标体系的定义8 2 2 - 2 基于q o s 行为属性的评价方法9 2 2 3 基于综合评价的q o s 评价方法1 0 2 2 4 基于多维q o s 模型的评价方法1 1 2 3w e b 服务推荐方法1 1 2 3 1 基于u d d i 服务订阅的w 曲服务推荐机制1 2 2 3 2 使用序列挖掘的w e b 服务推荐方法l3 2 3 3 个性化的w e b 服务推荐方法1 3 2 4 小结1 4 第3 章面向使用环境的w i 端w e b 服务推荐机制1 5 3 1 研究背景1 5 3 2 面向使用环境的端到端w e b 服务推荐框架一1 7 3 2 1 端到端q o s 监测模型1 8 3 2 2 客户分组过程2 1 3 2 3w e b 服务推荐过程2 3 3 3 以客户为中心的w e b 服务q o s 性能指标体系2 5 3 4 小结2 8 第4 章客户分组方法2 9 i v 东北大学硕士学位论文 目录 4 1 客户分组的动机2 9 4 2 客户分组指标属性31 4 2 1 客户分组的静态属性3 1 4 2 2 客户分组的动态属性3 2 4 2 3 特殊服务的处理3 3 4 2 4 属性分组模型3 4 4 3 客户分组过程及客户分组算法3 6 4 3 1 基于聚类客户分组算法3 6 4 3 2 累加分组的触发时机3 9 4 4 分组结果及推论算法4 0 4 4 1 分组结果分析4 1 4 4 2 分组指标推论算法4 l 4 5 小结一4 4 第5 章面向使用环境的端到端w e b 服务评价与推荐算法4 5 5 1 基于使用环境的端到端w e b 服务的评价方法一4 5 5 1 1 自相似评价4 6 5 1 2 组相似评价4 6 5 1 3 按发布值评价4 7 5 2 数据对象间的相异度度量方法4 8 5 3 服务推荐值可信水平的计算4 9 5 3 1b e t h 信任度评估模型分析4 9 5 3 2 面向使用环境的端到端w e b 服务推荐值可信计算5 0 5 4 基于使用环境的端到端w e b 服务推荐5 3 5 4 1 服务推荐方式5 3 5 4 2 服务推荐算法5 4 5 5 小结5 6 第6 章实验与分析5 7 6 1 实验环境5 7 6 1 1 网络部署方案5 7 6 1 2 实验用w e b 服务及q o s 的说明5 8 6 2 监测数据获取6 0 6 2 1w e b 服务性能监测:6 0 6 2 2 客户端环境监测6 1 6 3 客户分组实验6 2 6 3 1 静态分组6 2 6 3 2 动态分组6 3 v v i 、, 东北大学硕士学位论文第1 章绪论 1 1 课题背景和意义 第1 章绪论 近年来,随着国际互联网的发展,w e b 应用从局部化发展到全球化,从集中式发展 到分布式。传统僵硬的紧耦合的应用集成方式难以适应开放多变的业务环境。而面向 服务架构的松耦合平台、位置透明、协议独立的应用程序服务为开放环境下的分布式应 用集成问题带来了曙光 2 1 。 随着i n t e r n e t 上信息的爆炸性增长,用户的“信息过载”和“资源迷向”问题越来 越突出。为了解决这些问题,人们研发了许多智能推荐服务系统和相关技术,如 w e b w a t c h e r 系统采用跟踪用户浏览w e b 站点的行为或者访问路径方法。基干w e b 的方 法可分为基于信息内容的方法和基于用户访问行为的方法,如根据用户的访问路径模式 预测用户未来可能的h t t p 请求,让代理服务器执行预取操作,并将相关的w e b 页放 入其c a c h e 中,以加快访问速度。或者利用数据挖掘技术从访问文件中提取用户的访问 模式,用于市场决策和智能推荐服务。 伴随着w e b 服务( w e bs e r v i c e s ,w s ) 的兴起,涌现出大量提供公开、公共w s 的服 务提供者。随着w s 提供者的数量不断增多,许多不同的w s 提供者提供相同或相似服 务功能的现象也大量出现f 3 - 5 】。从客户的角度看,服务质量( q u a l i t yo fs e r v i c e ,q o s ) 是用 来区分不同w s 提供者的最重要的因素之一。许多学者提出相关的w sq o s 模型,大量 广泛的q o s 属性被提出并定义【4 卅,这些属性通常有着不同的含义【7 】o 现有一些基于q o s 的w s 选取方法,其中一种办法是采用u d d i e ,由服务提供者发布q o s 信息,用w s m e 这样的匹配器使得服务请求同时从客户端和服务提供者两方面指定。 在面向服务体系结构下,通过发布、查找、绑定三个基本操作,在服务使用者和服 务提供者间保持一种松散的绑定关系,使得服务提供者对服务使用者具有位置、实现等 多方面的透明性,便于在二者间建立动态的绑定关系,从而提供一种松耦合的编程模型, 具备了支持动态应用集成的潜力。但服务所具有的使用者与提供者相分离的特征增加了 使用者得到所需服务的难度。特别是随着i n t e m e t 上发布的w e b 服务数量的大规模增加, 在服务选取过程中,可供选择的具有同等功能的原子服务越来越多,如何让用户及时得 到所需服务是一个需要解决的问题。 东北大学硕士学位论文第1 章绪论 推荐系统为解决这一问题提供了一种新的途径。服务质量描述了服务满足用户需求 的能力,对于能够提供相同功能的服务,q o s 是评价与选择的主要标准1 8 】。当前对q o s 的定义与监测都是针对服务器端进行的【9 1 ,没有考虑调用服务的客户在不同的使用环境 中所感知的q o s 不同。随着w e b 服务数量的大规模增长,如何从客户的使用角度端到 端地、动态地选择出最适合用户需求的w e b 服务是目前的一个研究热点。 1 2 研究的主要问题及主要研究内容 为了弥补已往单方面信任服务提供者或者服务器性能监测的弊端,本文提出面向使 用环境的端到端w e b 服务推荐方法,更准确、更合理地对客户端感知的服务质量进行 评价,并根据客户端感知到的服务质量对客户进行逐层深入的分组,用于推荐给未来的 客户。在满足w s 功能需求的前提下,针对用户所处的不同使用环境,选择最佳适合的 服务推荐给用户。本文充分考虑了不同环境因素,提出一种集成了w e b 服务监测、分 析、评价和推荐框架的新型推荐方法。基于这个目标,本文就如下内容展开研究。 首先,针对目前业界对于客户端感知q o s 的研究较少,且大多数的q o s 模型都仅 仅考虑了服务层的质量因素,例如费用、运行时i 、日j 等,忽略了与w e b 服务领域相关的 服务质量,即业务层的质量,例如服务的地理位置等问题。本文提出了以客户端为中心 的q o s 指标体系,从客户端的角度重新定义了相对完整的q o s 的指标体系,重新定义 了客户端的q o s 服务属性指标的计算方法,从而与规范化指标一起形成一套完整用于计 算的客户端服务q o s 的指标体系;另一方面,本文针对已往计算q o s 指标用于评价服 务质量时单一考虑响应时间一个属性,或者仅仅考虑了延迟、传输率等指标的片面因素, 提出了以吞吐率作为衡量服务性能的典型指标,将服务的响应时间扩充为环路时间,同 时包括延迟和传输率两部分所涉及的时间;并且引入了数据量的因素,使评价更加科学 可信。 其次,在评价一个w e b 服务的质量时,仅仅依靠服务提供者发布的性能,也就服 务器端的性能【4 】发布这种方法是无法满足不同客户的需求。这是因为,与服务提供者所 处的操作环境一样,客户和服务提供者之间的连接,作为客户端所感知的环境,在评价 服务性能时,同样需要被考虑。当前对服务性能的测量主要是基于服务器端的,例如对 吞吐量,延迟等服务器端性能指标的测量。传统的研究方法,客户端所感知到的感知性 能通常被忽略。虽然在某些情况下,客户感知的性能指标对服务质量的预测影响不大, 然而随着客户数量的增多,客户端环境复杂程度的多样,客户端的上下文对评价服务性 2 东北大学硕士学位论文第1 章绪论 能往往有着决定性作用【6 j 。针对上述f - j 题,本文通过对客户感知性能的研究,提出以客 户为中心的w sq o s 指标体系。在此基础上,本文提出基于使用环境的端到端w e b 服 务推荐机制,就是为了根据客户所处的不同的使用环境,更好的预测客户未来将要感知 到的性能,以此为客户推荐最合适的服务提供者。本文在研究如何评价服务性能时,着 重强调了客户对服务质量的感知,是通过对服务性能的感知得到的,本文的研究充分强 调了客户端感知性能的重要性。 在此基础上,本文着重研究了不同使用环境中的客户分组方法。本文根据w e b 服 务客户端和服务器( 即服务提供者) 之间端到端的环境不同,对w e b 服务q o s 属性进行实 时监测。根据监测的结果计算每次服务调用的吞吐率,根据吞吐率对服务提供者进行聚 类分析。根据聚类算法产生的结果,在影响服务感知质量的有限集中,推断出当前影响 客户感知质量的主要因素。据此,对客户所属类别进行建模、分组。而后,通过历史感 知性能预测未来性能;通过相似端到端网络环境的同类其它客户所感知到的性能,推荐 自身将要感知的性能;通过用户需求与监测质量的相似性,推荐最有效的服务提供者。 由此可见,合理的客户分组模型的是推荐的前提和基础,而精确的聚类和推理算法又是 分组的保证。根据推论算法准确的推论影响服务感知质量的主要因素,对不同网络环境 中的客户进行准确的分组,才能保证推荐结果的准确。 最后,在研究了如何针对不同的使用环境对客户进行逐层深入的分组的基础上,本 文将进一步研究如何根据聚类算法的结果,既w s 视图和客户视图,以及相关的监测同 志,根据相似性计算对满足功能的服务进行按性能排序。调用推荐算法对需要调用服务 的客户进行服务推荐。在此基础上,本文的研究还针对推荐给用户的服务性能值的可信 程度进行了研究,针对数据的更新周期和数据量大小这两个方面的因素对某次推荐的置 信水平进行了深入分析和研究。 1 3 论文的组织与结构 本文主要研究基于用户使用环境的端到端w e b 服务的推荐方法。针对目前业界在 服务推荐方法的研究上,普遍缺少针对客户端的性能作为w e b 服务推荐依据这一问题, 现在的研究大多没有从用户的角度考虑推荐算法,用户处在不同的使用环境给w e b 服 务感知性能的带来了巨大差异,本文依据上述问题分析研究,提出了以客户为中心的 w e b 服务q o s 模型;进一步,对基于用户的使用环境的端到端w e b 服务的推荐方法行 了研究,提出了针对客户使用环境对客户进行多层分组归属的方法;并对支持该分组的 1 东北大学硕士学位论文第1 章绪论 推荐算法进行了深入研究。本文对以客户为中心的w e b 服务q o s 模型监测系统、客户 分组系统、推荐方法执行机制的研究分别进行了阐述,在此基础上,对相关系统进行了 原型实现。 全文的内容分为七章: 第1 章,作为绪论,提出本课题的研究背景、意义以及要解决的主要问题和大体上 的解决思路,并给出论文的组织结构。 第2 章,将对本文所涉及到的相关知识面,包括动态的w e b 服务质量监测现状, 以及现存的q o s 的性能分组、评价方法,并简单阐述了作为本文研究基础的w e b 服务 的推荐方法的现状。 第3 章,阐述面向使用环境的端到端w e b 服务推荐机制,首先从总体上阐述服务 推荐方法的研究背景和框架,然后分析基于使用的服务推荐框架的三个模型:端到端 q o s 监测模型、客户分组模型、w e b 服务推荐模型。其中,推荐模型主要描述所需的内 容为两个过程:分析过程和推荐过程,分别说明两个部分的主要工作。 第4 章,详细研究客户分组的方法,支持静态、动态的分组标准和方法,在此基础 上阐述了属性分组模型;深入研究了聚合分组的过程,详细阐述了聚类算法和指标推论 算法。 第5 章,对评价方法做了阐述,说明了三种评价方法的原理;阐述了相似性计算方 法并在此基础上对推荐算法进行了原型实现。深入研究当前的信任模型,对本文服务推 荐的可信水平进行了研究。 第6 章,通过实验验证本文推荐方法的可行性。 第7 章,总结全文,说明下一步的研究问题和方向。 4 东北大学硕士学位论文第2 章相关研究 第2 章相关研究 本章主要讨论本文研究的相关概念,以及本文研究相关的主要研究问题目前在业界 的研究现状和发展趋势,对现有方法进行分析和比较。 首先,阐述当前动态w e b 服务质量检测的现状,对当前盛行的几种监测方法如: 基于对底层网络数据包的方法、基于代理的方法、基于对s o a p 引擎库进行修改的方法、 基于应用响应测量a p i 等方法进行了分析和比较,归纳出每种方法的优缺点、适用范围 与局限性。其次,对目前主要的q o s 评价方法如:基于q o s 行为属性的评价方法、基 于综合评价的q o s 评价方法、基于多维q o s 模型的评价方法的优缺点进行了分析和比 较,为本文后面章节进一步提出的以客户为中心的q o s 评价模型做好铺垫。最后,对当 前主要w e b 服务推荐方法如:基于u d d i 服务订阅的w e b 服务推荐方法、使用序列挖 掘的w e b 服务推荐方法、个性化的w e b 服务推荐方法同样进行了分析和比较,归纳出 每种方法的优缺点、适用范围与局限性。 2 1 动态w 曲服务质量监测技术 端到端w e b 服务质量监测的意义:对功能相同或相似的w e b 服务,采用服务质量 作为选取和评价的标准;对服务质量进行监测,反映了服务所提供的实际质量,为服务 选取、评价和付费提供了客观依据。从应用自仃景来看,服务质量监测是服务提供者和消 费者之间、面向组合服务的多个服务提供者之间建立良好的信任关系和协作机制的基 础,是w e b 服务在商业应用中获得成功的关键。 w e b 服务质量监测的定义:依据服务提供者预先发布或与客户协商的服务等级协议 中的指标,对服务所承诺的质量、所提供的实际质量以及客户所感知到的质量进行度量 和统计,且根据客户需求的权重归一化后作为服务选取和服务评价的非功能标准。 目f j ,研究人员已经提出了一些对w e b 服务的服务质量进行获取的方法,包括基 于对底层网络数据包( p a c k e t s ) 进行监测的方法、基于代理( p r o x y ) 的方法、基于对s o a p 引擎库进行修改的方法和在w e b 服务应用的源代码中使用应用响应测量( a r m ) a p i 来 进行获取的方法等等。 东北大学硕士学位论文第2 章相关研究 2 1 1 基于对底层网络数据包进行监测的方法 当前已经有一些工具可以实现对底层网络数据包( p a c k e t s ) 的监测和捕获,如l i b p c a p , w i n p c a p ,c o m m v i e w 等,它们被广泛用来监测网络流量和进行包过滤。采用这种方法来 对w e b 服务的服务质量进行度量的核心思想是捕获含有s o a p 请求消息和s o a p 响应 消息的数据包。 这种方法的优点主要是监测程序与w e b 服务应用的源代码完全分离。基于底层数 据包进行监测的方法同时有如下不足。 ( 1 ) 与硬件联系紧密 由于监测程序是在整个系统的较低层次进行网络数据包的拦截,它与网络链路层的 协议结合得较为紧密。因此,监测程序需要能够识别多种不同的链路层协议,包括 p p p o e ,p p p o a ,e t h e r n e t 等与网络硬件环境相关的协议。这就意味着监测程序需要较 多的c p u 资源来进行协议的识别、数据包的解析和网络会话的重构等分析处理工作。 ( 2 ) 会影响整个系统 同样因为监测程序是在网络的底层进行拦截,所以它截获的内容涵盖了整个系统的 所有网络通信,而度量活动的对象往往只是系统中的某一个进程,并且与该进程相关的 网络通信通常也不仅仅是对目标w e b 服务操作的调用。这就导致了监测程序所截获的 信息当中有很大一部分是与度量目标无关的数据,需要将它们都过滤掉,而过滤操作同 样需要消耗一定的c p u 资源。 综上所述,基于对底层网络数据包进行监测的度量方法会对整个系统的运行效率产 生较大的影响,监测程序本身也较为复杂。而本文提出的服务质量度量方法其拦截的位 置位于系统网络架构的中间层次,无需关心底层网络的实现细节,同时拦截的范围仅限 于被度量应用本身,不会对整个系统造成全局性的影响,度量程序本身的逻辑也并不复 杂。 2 1 2 基于代理( p r o x y ) 的方法 该方法将代理作为w e b 服务客户端和服务端之间通信的桥梁,两者之问交换的所 有s o a p 消息对代理来说都是可见的,由代理负责进行服务质量的获取。 这种方法的主要优点是获取活动与系统平台以及实施s o a p 消息传递的网络承载 6 一 东北大学硕士学位论文第2 章相关研究 协议无关。此外,与基于对底层网络数据包进行监测的方法相比,对c p u 资源的占用 也要小很多。不足是在进行获取时,需要对被度量的w e b 服务应用的源代码进行修改, 对它进行配置以便使用代理,而在该应用独立运行时,又需要将代码恢复为原样。所以 对于不开放源代码的w e b 服务应用,该获取方法就无能为力了。 2 1 3 基于修改s o a p 引擎库的方法 该方法对w e bs e r v i c e s 架构中的s o a p 引擎库( 负责进行s o a p 消息的传输和对其 进行序列化反序列化等处理) 进行修改,向其中添加必要的代码来记录与w e b 服务操作 的服务质量相关的各种数据1 0 1 。 这种方法的主要优点是c p u 开销小,同时也不必修改被度量的w e b 服务应用的源 代码。而它的缺点是与系统平台以及s o a p 引擎库的具体实现紧密相关。对于不同系统 平台上的各种s o a p 引擎库的实现都需要做同样的修改才能实现截获的通用性和广泛 性。这通常需要得到各开发厂商或开发团体的支持和协助,况且,并不是所有的s o a p 引擎库都公开其源代码,例如,m i c r o s o f t n e tf r a m e w o r k 中的x m lw e bs e r v i c e s 的 s o a p 引擎库就是如此。 2 1 4 基于应用响应测量( a r m 、) a p i 的方法 应用响应测量提供了一组与平台无关的a p i ,用来度量应用的执行时间。应用在其 源代码中将需要度量的代码片段标识成a r m 事务,然后通过对a r ma p i 的调用来指 出a r m 事务的开始和终止事件,从而获得事务的执行时间【l l 】。 这种方法的优点是获取活动与系统平台无关,并且可以控制度量的粒度,进行细粒 度的度量。通过传递相关信息,度量活动甚至可以深入到后端业务逻辑的实现当中。其 不足之处在于和前面两种方法相类似,该方法需要能访问被度量的w e b 服务应用的源 代码,一旦度量过程发生改变或者应用本身在被度量和独立运行之间进行切换,则整个 应用都需要进行重新编译和部署。因此,这种方法更适合于在w 曲服务应用的开发阶 段用来保证应用符合其在服务质量方面的需求,而不是在应用的运行过程中动念地对其 服务质量进行截获。 由此可见,在上述的四种截获方法中,后三种方法共同的缺陷就是需要访问目标 w e b 服务应用或者s o a p 引擎库的源代码,这在某些情况下( 比如出于商业利益或者安 全上的考虑) 是做不到的。 一7 东北大学硕士学位论文第2 章相关研究 2 2 目前主要q o s 评价方法 服务推荐和选取必然要遵循某种标准进行,这个标准需要体现用户对w e b 服务的 非功能性的属性要求,需要反映组合服务的质量品质,如何建立这样一个标准是影响组 合服务质量好坏的关键。 q o s 是一个可以衡量服务质量的广泛的概念,它包含了一系列的像费用、运行时间、 可用性、信誉度、可靠性等这样的非功能属性【1 2 】,它能够体现服务满足用户需求的程度。 q o s 可以作为服务选取的标准,这是因为:首先,q o s 可以体现服务的质量,因为它本 身就是一个可以衡量服务质量的概念;其次,q o s 可以体现用户对服务的满意程度,因 为通过对服务的各个q o s 因素的衡量,可以反映出服务的质量等级;再次,q o s 可以 反映用户对服务质量的个性化要求,通过对某个质量因素的特定的要求,能够得到满足 用户对这个质量的需求;最后,利用q o s 进行服务选取在现实中是可行的,文献 1 3 1 5 】 都是利用q o s 进行服务评价的成功范例。 尽管利用q o s 对服务质量进行评价是可行的,但是目前构建一个合适的、有效的 q o s 服务质量评估模型仍然存在着一系列的问题。首先,当前对服务性能的测量主要是 基于服务器端的,例如对吞吐量,延迟等服务器端性能指标的测量。传统的研究方法, 客户端所感知到的感知性能通常被忽略。虽然在某些情况下,客户感知的性能指标对服 务质量的预测影响不大,然而随着客户数量的增多,客户端环境复杂程度的多样,客户 端的上下文,对评价服务性能往往有着决定性作用【6 】。对q o s 的监测不应是单端的,而 应该是端到端的环境。其次,对q o s 模型的定义多种多样【5 刁】,没有一个统一的标准, 既然要做基于使用环境的端到端w e b 服务推荐,就必须建立以客户为中心的q o s 模型。 最后,目前的大多数的q o s 模型都仅仅考虑了服务层的质量因素,比如说费用、运行时 间等,忽略了与w e b 服务领域相关的服务质量,即业务层的质量,比如说服务的地理 位置等等。 2 2 1q o s 指标体系的定义 服务的q o s 模型有多种建立方式,许多学者通过不同方式定义了大量的q o s 属性 值。 尽管利用q o s 进行动态服务选取和推荐是可行的,但是目前构建一个合适的、有效 的q o s 服务质量评估模型仍然存在着一系列的问题。首先,q o s 衡量的是服务的质量, 这个服务的质量既应包括服务器的,也应该包括客户端的,但是目自仃对于客户端的q o s 一8 东北大学硕士学位论文第2 章相关研究 的研究较少;其次,既然是客户端的q o s ,这里就存在着性能向量与服务端对性能向量 定义的不同,比如说,客户端的相应时间应该是服务器的响应时间加上传输时间。然而, 目前大多数的对于组合服务的q o s 的研究仅仅处于将q o s 属性看成服务提供者端的独 有上;最后,目前的大多数的q o s 模型都仅仅考虑了服务层的质量因素,比如说费用、 运行时间等,忽略了与w e b 服务领域相关的服务质量,即业务层的质量,比如说服务 的地理位置等等。 文献 3 3 1 提出了一种基于内在属性对q o s 进行分组的服务q o s 模型。与外部属性依 赖于服务所处环境不同,内部属性独立于服务所处的环境。尽管事实上的情况可能要比 这个情况复杂的多,但是这个模型给出了q o s 属性测量的一般准则。 表2 1 服务的q o s 指标分组 t a b l e2 1c l a s s i f i c a t i o no fq o s 文献【7 】对q o s 属性进行分组和整理,得出如下概括: ( 1 ) 运行相关可扩展性,容量,性能( 响应时间,时延,吞吐量) ,可靠性,可用性, 鲁棒性灵活性,异常处理和准确性。 ( 2 ) 传输相关传输完整性。 ( 3 ) 配置管理和成本相关管理,支持标准,稳定性变更周期,成本和完整性。 ( 4 ) 安全相关认证,授权,机密性,问责制,可追溯性和审核,数据加密和非否认。 尽管定义q o s 属性不是本文的主要目标,但是明确本文的分组和评价系统可以覆盖 以上大部分指标是很重要的。 2 2 2 基于q o s 行为属性的评价方法 基于q o s 行为属性的评价方法由以下几个步骤组成。 ( 1 ) 计算各属性的权重 计算各属性的权重一般采用美国萨提教授发明的用于决策的层次分析法( a h p ) 1 1 6 1 , 其特点在于对复杂问题的本质、影响因素及其内在关系等进行分析的基础上使决策过程 9 东北大学硕士学位论文第2 章相关研究 数学化。具体步骤如下: 1 ) 确定思维判断定量化的标度。 2 ) 构造判断矩阵,用两两比较法对属性评分。 3 ) 计算权重。 为符合属性权重标度的建立含义,尽量用同类评价函数,且上限要一致,还要统一 量纲,最后为了使差的服务可能导致信任度下降,某些评价导致负数。 ( 2 ) 评价每次行为的各个属性 在现实应用中,不同属性有差别,属性根据实际情况有其评价方式。不过既然属性 是影响信任度的最基本因素,则其评价应该是该属性的一元函数。 为符合属性权重标度的建立含义,尽量用同类评价函数,且上限要一致,还要统一 量纲,最后为了使差的服务可能导致信任度下降,某些评价导致负数。 ( 3 ) 该次行为的评价 得出属性的权向量和各属性的评价后,计算得合成权就是对该次行为的评价。 这种评价方法的计算方法简单明确,对不同属性量化,属性和有关属性的计算都有 具体公式可以直接使用,使复杂的问题有明确的数学模型可依1 7 】。然而,所有的属性取 值由w - e b 服务发布者直接提供,系统人为的假设所有服务的q o s 属性值都是可信、准 确的,这显然是不符合实际情况的,这种评价方法没有考虑客户端环境对q o s 属性值所 造成的影响。 2 2 3 基于综合评价的q o s 评价方法 基于综合评价的q o s 评价方法在充分考虑评估服务质量主、客观因素的基础上,按 是否可以用数学语言精确描述为标准,对影响服务质量的属性进行了分组【1 9 】,并分别用 模糊数学和概率统计相关方法进行建模,最后,给出了一个加权的q o s 模型 2 0 , 2 1 】。用此 模型计算的服务质量评价值不仅仅可以体现了服务的固有品质,而且也反映了客户使用 的感受。 w e b 服务是在i n t e m e t 上的应用,q o s 不仅依赖于自身的算法和服务器性能,而且 与网络质量、服务器负载情况、服务提供商的执行策略有关。因此,在讨论q o s 时,既 要考虑服务质量本身可用精确数学语言描述的属性,又要考虑它是应用层上的应用,有一 部分难以用精确数学语言描述的属性。这种方法认为,在讨论w e b 服务质量时,单纯 只考虑w e b 服务固有性能或只考虑用户在获取服务时的感受作为服务质量评价依据都 1o 东北大学硕士学位论文第2 章相关研究 不能较全面地反映w e b 服务质量;只有两者兼顾,才能更接近现实反映服务质量。这 正是本文研究的动机所在。 这种方法的优势在于: ( 1 ) 既考虑了服务质量本身可用精确数学语言描述的属性,又要考虑它是应用层上 的应用,有一部分难以用精确数学语言描述的属性。 ( 2 ) 考虑w e b 服务固有性能的同时,又考虑用户在获取服务时的感受作为服务质量 评价。 它的主要不足之处是: ( 1 ) 当前对w e b 服务- 的q o s 模糊类属性建模的方法普遍只有思想阐述,没有一个普 遍承认的算法。 ( 2 ) 考虑用户使用感受上,该算法主要考虑用户对某个q o s 指标的重视程度,但这 只是从结果上考虑。而服务调用过程中的q o s 监测取值方法方法上,没有考虑 客户端环境对q o s 属性值所造成的影响。 2 2 4 基于多维q o s 模型的评价方法 w 曲服务立体q o s 模型,给出其中若干关键质量指标的量化定义【2 1 2 2 1 ,在此基础 上应用模糊数学中的模糊算法设计w 曲服务质量的模糊评价方法【1 8 】。通过原型系统对 该q o s 模型和评价方法进行了验证,结果表明其具有一定的可行性和适用性。 这种方法的优点是立体q o s 模型体现了质量可感知、过程可控制、计费可参与、 服务可改进的人性化服务提供方案;w e b 服务质量模糊评价方法可以指导w e b 服务不 同生命周期阶段中的服务选择、实时监控、管理和计费。缺点是分层次太多给服务q o s 指标的监测,以及相应的指标值的获取都带来了困难。有一些指标只能从理论上获取, 实际中无法操作。这么多层的指标在计算方法上,没有统一的数学公式可以遵循。 2 3w 曲服务推荐方法 本文研究的主要内容是w e b 服务的推荐方法,更细一步说,是要做关于基于使用 环境的端到端w e b 服务的推荐方法的研究。对满足用户功能需求的所有w e b 服务的q o s 进行评价,依据评价结果基于可信程度重排名,选择适当方法在充分考虑用户倾向和数 据可信程度的基础上,给出最佳符合当前用户需求的服务排名。本节将对这一领域当前 的业界研究现状进行综合分析和比较,对于当前服务推荐主要几种方法,现在分别分析 东北大学硕士学位论文 第2 章相关研究 如下。 2 3 1 基于u d d i 服务订阅的w e b 服务推荐机制 u d d i ( u n i v e r s a ld e s c r i p t i o nd i s c o v e r y & i n t e g r a t i o n ,全局描述、发现和集成) 是 w e b 服务中用来进行服务发布的关键技术。它提供了一种服务注册的机制,通过制定一 系列标准a p i 来规范服务发布及查询,使得w e b 服务能够方便、及时地被发现并集成 到应用中。因此,u d d i 为基于w e b 服务的软件提供了进行互操作所需要的重要基础 设施1 2 3 】。 u d d iv 3 2 5 】中提出了一种服务订阅机制,允许用户向u d d i 注册中心订阅w 曲服 务。当订阅的w e b 服务注册信息变化的时候( 或每隔一定周期) ,注册中心将会通过e m a i l 或调用一个用户提供的w e b 服务等方式通知服务订阅人。服务订阅人也可以主动检查 所订阅内容的更新情况【26 1 。这种订阅机制原本目的是用于实现u d d i 注册中心之间的 信息同步,特别是用于私有或半私有u d d i 从全局注册中心u b r 中更新相关注册信息。 而实际上w e b 服务的消费者也可以看成维护着一个小型u d d i 注册中心,因此可以使 用这套机制及相应的a p i 获得服务注册的更新信息,从而更加有效、实时的掌握w e b 服 务的变化。 为了利用u d d i 服务订阅达到w e b 服务推荐的目的,服务的消费者需要有一个专 门的模块来管理服务订阅,并根据服务更新( 推荐) 通知完成修改w e b 服务绑定的过程。 这里采用了一个“w e b 服务客户端代理”来实现该功能。w e b 服务客户端代理的主要 功能是封装远程w e b 服务,使本地应用系统不必关心所使用的具体w e b 服务,而可以 像访问本地资源一样通过代理访问远程的w e b 服务。w e b 服务客户端代理的构造主要 依赖于w e b 服务的接口。对于同类( 实现了相同接e 1 ) w e b 服务,其客户端代理应该是通 用的。当有服务推荐信息到达时,客户端代理将收到一个服务的推荐列表,其中列明每 个被推荐w e b 服务的各项指标,用户可以为w e b 服务客户端代理指定一个策略,用于 控制如何更新对w e b 服务的绑定。当需要从一个w e b 服务切换到另一个w e b 服务的时 候,可以完全由客户端代理完成,应用系统不受影响。 这种方法的优点是u d d i 作为w e b 服务中用来进行服务发布的关键技术被广泛接 受,简单、明白、统一性强。标准被广泛的接受,可以作为默认的统一标准。它的不足 是完全意义的服务提供者为中心的推荐。没有考虑客户端对服务质量的感知,无法确定 服务提供者发布信息的真实性。另外,该方法也没有一个惩罚与奖励的机制,服务的发 1 2 2 3 2 使用序列挖掘的w e b 服务推荐方法 这种服务发现方法其核心思想是通过从以往服务组合序列中发现高频率出现的组 合序列集,然后利用该序列集进行服务推荐。给出了服务推荐系统框架;对序列模式算 法进行了改进【2 7 】,以适应连续序列挖掘的需求,并描述了服务推荐的匹配算法;最后通 过在一个原型系统的性能测试证明服务推荐方法是可行和有效的。 该方法利用数据挖掘技术从以往服务组合记录中发现高频率出现的服务组合序列 【2 6 】;在动态绑定服务时,根据发现的高频服务组合序列来进行服务推荐。一组服务能够 组合在一起,说明这些服务之间有着某种内在的依赖或关联关系,服务之间在静态属性 和动态行为上是匹配的;一组服务高频率组合在一起,说明组合中的服务组合方式被大 多数流程定义者所认可,能够反映普遍性的规律,因此推荐的服务具有较高的服务组合质 量。在服务推荐时,r s b s m 方法并不需要复杂的服务在功能、行为、q o s 上查询匹配 过程,而是通过与高频服务组合序列比对查找来实现服务推荐。因此r s b s m 方法在保 证服务发现质量的前提下,提高了服务发现效率,达到了准确快速发现服务的目的。 这种方法的优点是r s b s m 方法并不是从单个服务的需求描述与服务发布描述之间 匹配关系的角度来发现服务,而是把服务所在组合序列作为一个整体,通过与以往高频 率出现的服务组合序列进行匹配,以此来发现服务。它的缺点是缺点这种方法主要针对 的是文本数据的挖掘服务,成熟的算法不具备普遍性。没有充分的考虑客户使用环境, 不同客户的不同需要。 2 3 3 个性化的w e b 服务推荐方法 随着网络技术的发展及机器学习、模式识别等知识发现新技术的出现,电子商务竞 争己使得信息服务方式从传统的“一对多”发展到“一对一”的个性化服务方式。随着 电子商务中引人个性化用户服务方式,企业需要对环境下的客户资料数据进行深人的统 计与分析,找出不同用户兴趣所在,透视隐藏在这些数据之后的更重要的用户兴趣模式 信息以及关于这些数据的整体特征的描述并预测其发展趋势等。 个性化推荐服务是利用个性化技术将传统的数据挖掘对象同需要访问信息结合起 来,利用w e b 挖掘【1 7 1 的方法抽取用户感兴趣的潜在有用模式与信,自, i 2 s , 2 9 】,然后基于这些 模式和信息为用户提供“一对一”【3 u j 的具备自适应性的智能个性化推荐服务。 1 3 东北大学硕士学位论文第2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论