基于用户用户响应的web服务内在性能测度_第1页
基于用户用户响应的web服务内在性能测度_第2页
基于用户用户响应的web服务内在性能测度_第3页
基于用户用户响应的web服务内在性能测度_第4页
基于用户用户响应的web服务内在性能测度_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于用户用户响应的web服务内在性能测度

1质量管理的一般过程随着互联网技术和应用的快速发展,网络服务模式逐渐受到破坏。服务模式是网络的弱点。目前某些服务供应商(SP)已开始提供规定多项可测指标的合同化服务,如果实际提供的服务不满足约定的各项指标的要求,SP将按约予以经济补偿,这种合同也称服务等级协约(ServiceLevelAgreement,SLA)。SLA是客户和SP双方就服务特性、责任和优先权商定的一份正式合同,可能包括性能、资费、服务交付以及补偿等陈述。合同双方可以是端用户(单个用户或一个组织,如校园网)和SP,或者是2个SP。目前关于互联网SLA的研究还有很多问题未能达成共识,例如客户与应用服务供应商(ASP)之间应用服务SLA(记为EASLA)的参数设置。根据全面质量管理中质量第一、用户至上、用数据说话等观点,质量应与成本相结合,对不同的用户应按其要求提供不同的质量;要使质量尽可能满足用户要求以使用户满意;对问题除定性分析之外还应尽量采用定量分析法以避免主观盲目性。对于EASLA服务模式,用户满意源于用户感知服务质量(user-PerceivedQualityofService,PQoS)与用户需要(即协定的服务等级)的比较。服务等级应当与用户感知相关联,否则无意义也无法使用户达到满意。而PQoS主要由服务实绩决定,但具有主观性、差异性和可抵赖性。可见无论为了制定合理的服务等级或验证EASLA合同遵从程度或推测用户满意度,客观定量地估计PQoS都是关键。因此必须尝试定义适当的测度,监测实际业务流,实现PQoS的客观定量估计。对PQoS起主要作用的服务实绩由服务结果(技术质量)和服务过程(功能质量)组成。对于传送文本、图片、简单动画等非流式数据的普通Web服务,技术质量主要指信息内容本身质量(超出EASLA的范围);而功能质量主要包括信息交付质量,当信息质量都相当不错时,信息交付质量是影响PQoS的最重要因素。本文主要目的就是寻求能够估计用户感知Web服务质量的服务内在性能参数。2web服务功能2.1非基页网页的多线程连接普通Web以提供各种信息为主,产生弹性流量;也有少量Web服务器提供声视频的在线播放,产生流式流量。本文只针对前者。用户访问Web资源,先通过点击超链、按钮,或者直接输入向浏览器提供Web地址,若需要再经过域名解析,然后浏览器与相关Web服务器交互,便能获得Web地址所对应的一组网页。为描述方便,将上述过程称为一次访问。一次访问中,浏览器采用3次握手方式与各Web服务器建立TCP连接。连接建立期间,双方商定TCP初始序号和最大段大小。在第一个TCP连接上,浏览器发出第一个HTTP请求(如Get、Post方法),Web服务器回应第一个网页(基页)的HTML文档H0。H0决定Web页面布局并包含部分文本内容;它封装在若干TCP报文段中从服务器逐渐传至浏览器,浏览器从中逐渐获悉基页中还涉及哪些图片、动画、HTML文档等元素,随即陆续与有关Web服务器建立若干新TCP连接。浏览器使用这些TCP连接针对每一个元素分别发送HTTP请求(取文件命令),服务器返回HTTP响应(发送文件)。一个TCP连接可以仅传送一个元素,传完后便释放,但当Web服务器支持HTTPkeep-alive时允许串行(不允许交错)传送多个元素,因而在初始TCP连接上,H0传完后还可以接着传其他元素。非基页网页的传送方法类似。网页的HTML文档和其他元素允许分开存储在不同的Web服务器上。一组网页传送过程中,常同时存在2~4个TCP连接并行传送着网页的各元素。HTTP请求与响应报文放在TCP报文段中传输,一个TCP连接的数据传输阶段可以传送一个或多个元素,如图1所示。服务器在收到HTTP请求后常先发纯ACK再发HTTP响应(若干DATA段),也有立即回应DATA段的。浏览器方TCP实体收到两个DATA后或收到PSH置位的DATA后或收到失序DATA后即发送纯ACK。服务器方TCP实体根据接收方通告窗口和拥塞窗口动态决定其发送窗口:取二者中较小的值。TCP拥塞窗口初值为一个最大段大小,以后如果不发生拥塞(指超时或收到重复ACK),则每收到一个ACK,拥塞窗口就增大一个段。图1中除DATA分组含有HTTP响应外,其余分组都只含有IP首部和TCP首部,属于控制分组;括弧中列出TCP序号和确认号,L表示第一个HTTP请求长度。从客户方捕获大量访问“新浪”和“搜狐”两Web站点的流量,作简单统计分析发现:(1)上行流量中,控制分组数占总出方向分组数的80%以上,平均分组大小(IP包总长度)一般小于100字节。(2)下行流量中,控制分组数占总入方向分组数的30%~60%,这主要取决于元素的大小、一个TCP连接传几个元素和元素是否已在浏览器的缓存中等因素;控制分组和大DATA分组(IP包总长度>1400字节)数约占总入方向分组数的70%以上,这主要取决于元素的大小、服务器至浏览器路径上各段链路的MTU限制和元素是否已在浏览器的缓存中等因素;平均分组大小一般大于500字节。(3)浏览器访问新Web地址时,上下行分组数目常常相近。可能的解释是:一个TCP连接只发一个HTTP请求,一组网页的传输过程实际就由若干交错着的图1所表示的信息交换过程所组成。当DATA为2~5个时,上下行分组数接近或相等。(4)宽带或校园网LAN上网时,一组网页下载过程中下行分组到达间隔基本上都小于3秒,平均只有几十到上百毫秒;56K拨号上网时分组到达间隔基本都小于6秒、平均近二百到近四百毫秒。2.2单次访问情况用户访问Web的行为受到上网收费方式、用户的阅读能力、网页信息含量、用户性格等因素的影响。当采用按月固定收费或按流量计费时,用户访问网络的动作一般比较惬意,轻松浏览或查询感兴趣的信息。当然用户时常会发现对正在下载的页面并不怎么感兴趣或只对部分信息感兴趣,便会中断传输或设法转移。对于转移:(1)如果是宽带或LAN上网,等到用户通过点击超链等方式输入新Web地址时,先前的一组页面时常已下载完成;统计发现用户两次访问引发的承载不同组网页的分组一般至少相隔3秒到达;较少出现快速而连续的两次访问,使得两组网页的分组交错到达,从时间上无法区分;(2)对于56K拨号上网,时常无法从入分组的到达间隔上辨明用户的两次访问。当采用计时收费时,用户访问网络的动作有可能比较紧凑,抓紧时间查询并下载感兴趣的信息,不一定在线阅读,因此发生快速而连续的多次访问的可能性较大。总的说来,单个用户的Web访问行为可以分为3种情况:(1)一次一次的访问,指各次访问从入分组到达时间上可以区分:对于用户相邻两次访问引入的两组分组,就到达时间而言,宽带或LAN接入时组间相隔多在3秒以上,56K拨号接入时节奏较慢组间相隔多在6秒以上。(2)相邻两次访问引入的分组在时间上有少量重叠,一串连续多次访问称为一次弱突发访问,一次访问也可归为此类。(3)多次访问在时间上有较多重叠,并发的多次访问称为一次强突发访问。随着上网条件的改善,人们的访问行为将更多属于前两种。从客户方观察Web流量,根据入分组到达间隔的大小,能够有效划分突发访问。3http请求响应延迟及组次突发到达率本文指标设计目标是:指标综合在一起能够反映用户对Web服务质量的感知;容易测量;指标之间的相关性尽可能低。为刻画特定Web站点对单个用户的信息交付质量,选取了两个指标:平均响应延迟(单位:毫秒)和交付速率(单位:分组个数/秒)。在确定指标的测量与计算方法后,指标可称为测度。这两个测度都可以基于单个测量点测量,测量点可设在用户主机或与用户主机在一个广播信道上的其它主机上。(1)平均响应延迟,定义为一段时间内用户对指定Web站点的访问流量中所有HTTP请求响应延迟的均值。HTTP请求响应延迟定义为一个TCP连接中SYN+ACK分组和Web服务器为响应该连接上第一个HTTP请求(Get/Post)而发的第一个DATA分组到达客户机方(测量点)的时间差,见图1。这两个分组的特征是具有相同的源宿IP地址、源宿端口号和协议号6,TCP序号相差1,源IP地址可指向该Web站点的任一Web服务器,宿IP地址指向用户主机。(2)交付速率,定义为一段时间内各次突发访问的分组突发到达率的均值。分组突发到达率定义为用户对指定Web站点的一次突发访问过程中,发自该站点的一组Web服务器的分组到达客户机的速率。属于同一次突发访问的入分组的典型特征为:分组的源IP地址指向站点的任一Web服务器,宿IP地址指向用户主机,分组到达间隔小于阈值(TAG)。TAG是个动态变化的离散型变量,在某一段时间(如5分钟)内TAG可以认为是常数,经过大量实验发现TAG设为max(2秒,HTTP请求响应延迟的95%分位数)基本能区分出各次突发访问。设一次突发访问引发的入分组到达时间为t1,t2,…,tn,n为入分组数,则分组突发到达率为:(n-1)/(tn-t1)。实际上一次突发访问引入的分组序列中,尾部可能存在少量离散、间隔大的分组,且多为控制分组,对用户的感觉影响极小,因此为避免将它们判为另一次或多次突发访问,n必须设置一个下限值,忽略入分组数少于下限值的一次突发访问。4实例与分析4.1主观评价值及回归模型的建立实验1在某校园网内以下3处进行:一个在学校科研楼,通过1Gbit/s光纤与校园网中心相连;一个在学校主楼,通过155Mbit/s光纤与校园网中心相连;一个在住宅,通过拨号至学校拨号服务器连入校园网。这3种接入最终都通过学校的1Gbit/s出口链路联入ChinaNet。一般情况下,在科研楼进行Web冲浪用户感觉相对最好,在主楼稍次,拨号方式时感觉尚可,但明显不如前两种。分别在3处使用性能相当的主机随意访问“新浪”网站一段时间,记录实际Web流量计算上述两测度,同时记录当时感知Web服务质量(PWQoS)的主观评价,测量结果见表1。下面研究测度与PWQoS之间的关系。PWQoS实际上就是人对所访问网站的服务质量(主要指信息交付质量,内容质量不在考虑之列)的即时感觉;鉴于人感觉的复杂性,它没有绝对的客观值只有主观评价值。另外,PWQoS是时变的,但在短时间内具有一定的稳定性(即使在尽力而为服务模式下)。因此实验中尽量客观地依据访问“新浪”网站时的真实感觉给出那段时间PWQoS的主观评价值,用0~10之间的实数表示,10表示最好。将两个测度作为自变量、PWQoS作为因变量y,对表1中的观察数据建立线性回归模型:y=Xβ+ε其中‚ε~Ν(0,σ2Ι),X=(1123.97948.2231183.75324.4561259.31118.2061188.17412.08411829.0515.148),β=(b0b1b2),y=(988877)。利用MATLAB解得参数β的最小二乘估计值,得到回归方程:ˆy=7.5774-0.0004x1+0.0292x2(1)下面考虑两个假设检验。(1)检验y与x1,x2是否有较好的线性关系。当b1=b2=0时,y与x1,x2没有关系,回归模型没有意义,所以要检验假设H0∶b1=b2=0是否成立。假设H0为真,那么F=n∑i=1(ˆy-ˉy)2mn∑i=1(yi-ˆyi)2n-m-1~F(m,n-m-1)给定显著性水平α,当F>F1-α(m,n-m-1)时,假设H0不成立。对于本例,m=2,n=6,F=(2.7477/2)/(0.0856/(6-2-1))=48.1387>F1-0.01(2,3)=30.8165,所以拒绝H0,即感知Web服务质量关于两个变量的回归方程在水平α=0.01下有显著意义,也即回归效果高度显著。(2)虽然y与x1,x2之间确有线性关系,但并不意味着每个自变量对随机变量y都有显著影响。因此要检验xi对y是否有显著影响,相当于检验m+1个假设H0j∶bj=0j=0,1,2是否成立。当假设H0j(j=0,1,or2)为真时,tj=ˆβjˆσ√cjj~t(n-m-1)j=0,1,or2其中,cjj为矩阵(X′X)-1的对角线上第j+1个元素,ˆσ2=n∑i=1(yi-ˆyi)2n-m-1。给定显著性水平α,当|tj|>tα/2(n-m-1)时,应拒绝假设H0j。对于本例,m=2,n=6,解得t0=36.8232,t1=-3.2822,t2=4.5879,查表得t0.05/2(3)=3.1824。显然,应拒绝所有H0j,也即两个测度在水平α=0.05下对PWQoS都有显著影响。实验1在3种上网条件下测试,主要是为了佐证PWQoS主观评价的真实性,对于本文其实并非必需;不过,同时在不同上网条件下访问同一网站相近内容可用来研究用户端网络对PWQoS的影响程度。4.2回归模型的建立及显著性检测实验1已较好证实了两测度一起确实能够反映用户访问“新浪”网站时的PQoS,实验2将进一步证明两测度用于客观定量估计PWQoS的有效性。在不同地点不同时间随意访问“搜狐”网站一段时间,记录实际Web流量计算上述两测度,同时记录当时对PWQoS的主观评价,测量结果见表2,其中测试地点略。对表2中的观察数据建立相应线性回归模型,再解得参数β的最小二乘估计值,得到回归方程:ˆy=8.3997-0.0004x1+0.0774x2(2)下面考虑两个假设检验。(1)检验y与x1,x2是否有较好的线性关系。对于本例,m=2,n=9,F=(4.2160/2)/(0.2640/(9-2-1))=47.9052>F1-0.01(2,6)=10.9248,所以拒绝H0,即PWQoS关于两个变量的回归方程在水平α=0.01下有显著意义,也即回归效果高度显著。(2)检验xi对y是否有显著影响。另解得t0=35.1430,t1=-6.7302,t2=3.9240,查表得t0.01/2(6)=3.7074。显然,应拒绝所有H0j,也即两个测度在水平α=0.01下对PWQoS都有显著影响。5关键性能参数及其目标值ITU-T向来关注PQoS,2001年11月在G.1010中从端用户角度对不同应用分析了影响PQoS的性能参数,建议中明确指出应用服务的性能参数要关注用户可感知的效果,要能够在服务接入点被客观或主观地测量。该建议给出了数据类、音频类和视频类各应用实例的关键性能参数及其目标值,建议中对Web应用服务建议将Web页面拆分为HTML文档、图片、音频/视频片断等不同成分分开处理,例如HTML文档检索服务的关键性能参数为单向延迟和信息丢失率,音频片断的关键性能参数为单向延迟、延迟变化和信息丢失率。然而用户的一次点击往往涉及多个Web服务器,页面中有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论