数据挖掘与故障定位(1)_第1页
数据挖掘与故障定位(1)_第2页
数据挖掘与故障定位(1)_第3页
数据挖掘与故障定位(1)_第4页
数据挖掘与故障定位(1)_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于数据挖掘的多故障定位总体思路:总体思路: 运用数据挖掘的两种方法(关联规则和形式概念分析),用程序执行和执行所覆盖的行、执行结果的二元关系表作为输入构建失败格(failure lattices),最后根据失败格指示的失败概念(failure concept)遍历失败格,找出故障所在行,定位故障。关联规则:关联规则: 关联规则是形如XY的蕴涵式, X和Y分别称为关联规则的先导和后继。这里的X、Y分别代表了执行覆盖的行、执行结果。例如:规则r3表示了line 105, line 97, line 93, line 58, . FAIL.形式概念分析(形式概念分析(FCA):): 概念格是FCA

2、的核心数据结构。概念格的每个节点是一个概念,由外延和内涵组成。外延是概念所覆盖的实例;而内涵是概念的描述,是该概念所覆盖实例的共同特征。概念格结构模型是形式概念分析理论中的核心数据结构。其本质上描述了对象和特征之间的联系,表明了概念之间的泛化与例化关系,概念格构建的过程是半自动化的。 外延:程序执行的集合extent(line 57, line 58) 表示执行覆盖57、58行的所有的程序执行集合。extent(FAIL) 表示所有执行失败的程序执行集合 内涵:程序执行所覆盖的行、执行结果。失败格失败格(failure lattice) 输入:程序执行和执行所覆盖的行、执行结果的二元关系表,每

3、次执行所覆盖的语句用来描述这次执行。 support:覆盖轨迹中所有的事件的失败执行的数量。 例如:r3中116个失败执行,C3的轨迹覆盖了105, 97,93,58, . . . . lift:程序执行覆盖的轨迹中行的增加是否增加了程序执行失败的概率,大于1说明增加。 failure lattices通常是非常大的并且不清晰、易读 。不需要全部计算出,也不需要全部显示给用户。C,C1为失败格中两个概念,有: C的子概念:如果C1比C更加具体,C1就是C的子概念,C1包含C的所有前提。 C的超概念:与子概念相反。 失败概念C:存在失败的执行结果,在C的执行轨迹上包含C所有的内涵,但是不包含所有

4、C的子概念的内涵。例如:C4、C5。 支持簇(support cluster):支持度相等的相关联的概念的最大集合。一个support cluster最多只有一个failure concept。失败格的两个特征:失败格的两个特征:1、If C1 C2 then sup(C1) sup(C2)2、If C1 lift(r2)算法Cfailure :还没有被解释的失败概念的集合。Cnext:等待遍历的概念集合。 一个规律:找到一个错误,错误所在行所属的概念的支持簇(support cluster)中其他概念也就被解释(即排除含有错误)。支持簇概念错误的依赖性:错误完全独立错误部分依赖错误完全依赖 总结 本文将数据挖掘

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论