软件老化的多元时间序列分析方法资料_第1页
软件老化的多元时间序列分析方法资料_第2页
软件老化的多元时间序列分析方法资料_第3页
软件老化的多元时间序列分析方法资料_第4页
软件老化的多元时间序列分析方法资料_第5页
已阅读5页,还剩5页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、MV Illi W*HM* Tvi*i tdvtmrwOir iwnUlCM *7fKcWO HIdat cc人1$ Iiicu C:IKM* wrKI rw:iu o环 y funw4*,、“專广/Sua、ja4jnc MMil JHtMtMHM|mc4鼻WW“ WtWtW4- w 91V 4 mt UM A:C3 Huill 100m丄 rw wi MNJ FJ EMXMOO III*UM MiladRR-tl Az 1wiVR二130 Journal of Frontiers of Computer Science and Tech nolog计算机科学与探索 2012, 6(2 Fig

2、.3 Trun cated diagram of Gran ger causality tesE 3 格兰杰因果性检验结 果片段图 过程中,有些参数间存在着显著的相互影响性,而有些参数间则不存在显 著的相互影响性。检验结果 从中可以看出,HelixServer的分的某个片段如图3。 配输出带宽总量与其内存耗用量间有极强的相互影响性,而HelixServer工作线程数目与处理器利用 率间则不存在显著的相互影响性,I/O速率与处理器 利用率间则 存在着单向影响性,即I/O速率显著地 影响了处理器利用率,反之则不。因此,本 文发现并首次利用统计分析的方法,证实了软件老化过程 中某些参数间存在显著 的

3、相互影响性或者单向影 响性。变量间的两两相互影响检验结果较多,本文的重点 不是描述相互影响,而是侧重于发现和统计 证实,因此不在此全部列出。原貌。对于实验中监测的初始参数集S,根据第5章的结果,计算得到了其相互影响显著的最 大参数子集为:SO=Helix_TotalActualBandwidthOutput,Helix_TotalSubscribedBa ndwidthOutput, Helix_%ProcessorTime,Helix_%UserTime, Helix_MemoryUsed,Helix_MemoryUsedPeak并且影响显著的最大参数子集是唯一 的。因此可以 得出如下结论,

4、即软件老化形成和发展过程中 S0集合内的元素存在显著的相互影响性,它们的相互作 用和影响共同决定了软件老化的特征。7.2向量自回归模型建立与预测 在上节中,通过变量选择,选择出了 6个描述7 7.1软件老化 的向量自回归建模与预测 模型变量的选择 从上文的结论可以看出,软件老化过程 中有些HelixServer软件老化现象的性能参数(SO。由于这6个参数只表征了 3种资 源,并且每种资源的两个参 数间有很强的单向影响性,为了简化模型,只保留每种 资源中的一个参数用于建模。如Helix_Memory-性能参数间存在着显著的相互影 响,而有些参数间 则几乎没有影响。因此要在众多参数中选择出相互影响

5、显著的参数,剔除与其他参数间影响不显著的 参数,才能得到一个合理的多参数联合模型。 另外根据Occam s Razo法则,应该优先选择拟合数据 最简单的假设,因此从这个 角度看参数的选择也是 必要的。本文的参数选择策略是:对于一个给定的初始参数集合,通过集合内元素两两间的格兰杰因果检验,在给定显著性水平下选出相互影响显著的最大 参数子集,该最大参数子集可能不是唯一的。选择最大参数子集的目的是尽可能多地保留系统运行 时的参数,从而最大限度地维持软件老化发生时的 UsedPeak对Helix_MemoryUsed的单向影响性比反 过来强得多,因此保留前者。依 此类推,最终用于 建模的 3 个参数是

6、Helix_TotalSubscribedBandwidth- Output(TB, Helix_MemoryUsedPeak(MP, Helix_%ProcessorTime(PT。本文使用了原样本集(19 432个样 本中的2/3(Sample1至Sample13000用于VAR模型参数的OLS估计,剩 余的1/3(Sample13001至Sample2230用于预测,这样作的依据是 Holdout方法。并 且根据SC信息准则选取模型的滞后阶数为 29。表2是VAR模型在估计样本 Samplel至Sample13000上的迭代拟合情况,从3个资源参数拟合 的决定系数、修 正的决定系数以及平

7、均绝对误 差(mean absolute error, MAE可以看出,VAR模型郑鹏飞 等:软件老化的多元时间序列分析方法131 Table 2 Goodness of fit tableof VAR model表2 VAR模型拟合优度状况表 VAR模型拟合情况 决定系数(R- squared修正的决定系数(adjusted R-squared平均绝对误差(MAE MP 0.999 907 0.999 907 7.594 MB PT 0.947 862 0.947 436 9.675% TB 0.999 913 0.999 913 13 357.812 Kb/s Table 3 Descri

8、ption table of AR model表3 AR模型描述表 用于对比VAR模型的AR 模型 时间序列变量MP PT TB AR模型滞后阶数1 5 4 Grottke创建的AR模型 时间 序列变量 FreePhysMem ResponseTime UsedSwapSpace A模型滞后阶数 8 92 1Table 4 Goodness of fit table of AR model表4 AR模型拟合优度状况表 用作对比的 AR模型拟合情况 决定系数(R-squared修正的决定系数(adjusted R-squarec平均绝对 误差(MAE MP 0.998 293 0.998 293

9、 126.207 MB PT 0.939 393 0.939 375 44.203% TB 0.999 888 0.999 888 59 820.760 Kb/g艮好地拟合了软件老化过程中各个参数的真实 变化曲线。文献中Grottke等人通过联立多个相互独立 的AR模型来描述和分 析软件老化。为了比较本文 方法与文献5方法在多个参数维度上的老化曲线 拟 合及预测情况,参照文献的方法分别建立了 MP、PT和TB的AR模型,见表 3。表4是作为对比的文献 中AR模型对估计样 本Samplel至Sample13000的 迭代拟合情况。从表使用Sample13000的观测值作为初始值,递归地使用预测值

10、进 行迭代预报,预报误差统计如表 5。Table 5 Forecasti ng error table of VAR model a nd AR model表5 VAR模型与AR模型的预测误差表 模型VAR模型AR模型平均绝 对误差(MAE MP/MB 8.277 186.315 PT/(% 6.385 59.465 TB/(Kb/s 9 867.217 82 974.810 4中可以看出,3个独立AR模型拟合的决定系数、修正的决定系数都低于多参数VAR模型,而平均绝对误差均大于VAR模型,因此3个独立的AR模型对 于软件老化曲线的拟合状况是不如多参数模型准确的。AR模型不准确的原因是它 仅考

11、虑了自身滞后项的影响性,而没有顾及到其他参数对自己 的影响,因此它对软 件老化的描述不够全面和深 刻。从图4中可以直观地看出,VAR模型较准确地 描 述了软件老化过程中各个参数的变化规律。接下来研究模型在多个参数维度上的预测性 能。采用Sample13001至Sample19432进行预测,从预报误差统计表中可以 看出,对内存耗用量 的平均预报误差不超过10 MB,对处理器利用率的 平均预报误 差不超过7%,对网络带宽的平均预报 误差不超过9 868 Kb/s,这都说明VAR模型 对软件老化发展情况有良好的预测性能。由预测绝对误差可以看出,3个独立的AR模型的预测准确性均不及 VAR模型,这也

12、说明了 VAR模型较独立AR模型的 联立模型更为合理。 综上所述,本文考虑参数间相互影响性的多元时间序列联合模型,较文献中未考虑参数间相互132 Journal of Frontiers of Computer Science and Tech nolog计算机科学与探索 2012, 6(2 Fig.4 Resource parameters fit curve图4资源参数拟合效果图 影响的 多个 参数的独立AR模型来说,在各个参数维度上的拟合和预测性能更优越,这同时也反映了 VAR模型用来描述和预测软件老化的合理性。Washington, DC, USA:IEEE Computer Soci

13、ety, 1995: 3814390. 3 Marshall E. Fatal error: how patriot overlooked a scudJ. Scienee, 1992, 255(5050: 1347. 4 Controneo D, Natella R, Pietrantuono R, et al. Software aging analysis of the Linux operating systemC/Proceedi ngs of the 2010 IEEE 21st In ternatio nal Symposium on Software Reliability E

14、n gi neeri ng (ISSRE 10, San Jose CA, USA, 2010. Washi ngto n, DC, USA:IEEE Computer Society, 2010: 71-80. 5 Grottke M, Li Lei, Vaidyanathan V, et al.An alysis of software aging in a Web serverJ. IEEE Tran sacti ons on Reliability, 2006, 55(3: 411 F20. 6 Kourai K, Chiba S. A fast rejuve nation tech

15、ni que for server con solidati on with virtual mach in esC/Proceed ings of the 37th Annual IEEE/IFIP Intern ati onal Conference on Depe ndable Systems and Networks (DSN 07, Edin burgh,UK, 2007. Washington, DC, USA: IEEE Computer Society, 2007: 24555. 7 CastelliV, Harper R, Heidelberger P, et al. Pro

16、active man ageme nt of software agin gJ. IBM Journal of Research and Development, 2001,45(2: 311332. 8 Grottke M, Nikora A, Trivedi K. An empirical investigation of fault types in space mission system softwareC/ Proceed ings of the IEEE/IFIP Intern ati onal Conference on Depe ndable Systems and Netw

17、orks, Chicago, IL, USA, 2010. Washington, DC, USA: IEEE Computer Society, 2010: 44756. 9 Matias R, Beicker I, Leitao B, et al. Measuring software aging effects through OS kernel instrumentationC/Pro- 8结束语 本文首次通 过统计分析的方法,利用格兰杰因 果性检验,发现并判定出软件老化过程中各个性 能参数间存在着显著的相互影响。弓I入了向量自回归模型来描述软件老化,定量地解释了处理器、内存、网络带宽

18、间的相互影响,同时模型能够对未来一段 时间内 软件老化的发展在3个维度上进行较为准确 的预测。本文的研究是基于HelixServer-VOD平台的,因此下一步的工作将在其他类型的系统上,通过大量实验验证参数间的相互影响性是否是软件老化的共性特征,并检验VAR模型是否是描述软件 老化的一个普适模型。另外本文的VAR模型没有考 虑参数间的单向影响性,结合单向影响性的多元时 间序列分析将更合理,这也是本文有待改进的地 方。 Refere nces: 1 Avritzer A, Weyuker E. Mon itori ng smoothly degrad ing systemsfor in crea

19、sed depe ndabilityJ. Empirical Software Engin eeri ng, 1997, 2(1: 57. 2 Huang Y, Ki ntala C, Kolettis N, et al. Software rejuve natio n: an alysis, module and applicatio nsC/Proceedi ngs of the 25th Intern ati onal Symposium on Fault Tolera nt Computing (FTCS 95, Pasadena, California, USA, 1995.郑鹏飞

20、等:软件老化的多元时间序列分析方法133 ceedings of the IEEE 2ndIntern ati onal Workshop on Software Agi ng and Rejuve nati on (WoSAR, San Jose, CA, USA, 2010. Washi ngto n, DC, USA: IEEE Computer Society, 2010: 1-6. 10 An drzejak A, Silva L. Robust and adaptive modeling of software agingEB/OL. (20082011-07. http:/cit

21、eseerx. /viewdoc/summary. 11 Alonso J, Torres J, Berral J, et al. Adaptive on-li ne software aging predictio n based on mach ine learni ngC Proceed ings of the IEEE/IFIP Intern ati onal Conference on Depe ndable Systems and Networks, Chicago, IL, USA, 2010. Washi ngt on, DC, USA: IEEE Com

22、puter Society, 2010: 507- 516. 12 Jia Yun fei, Zhao Lei, Cai Kaiyua n. A non li near approach to modeli ng of software agi ng in a Web serverC/Proceedi ngs of the 2008 15th Asia-Pacific Software Engineering Conference (APSEC 08, Beijing, China, 2008. Washington, AC, USIEEE Computer Society, 2008: 77-84. 13 Gran ger C. I nvestigat ing causal relatio ns by econo metric models and cross-spectral methodsJ. Econo metrica, 1969, 37(3: 42438. 14 Sims C A. Macroeconomics and realityJ. Econometrica, 1980, 48(1: 48.ZHENG Pen gfei was born in 1986. He is a Ph.D. can didate at Xi an Jiaoto ng Un

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论