外文翻译.doc

【JL079】基于灰色理论的故障预测方法研究

收藏

压缩包内文档预览:(预览前20页/共23页)
预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图
编号:687017    类型:共享资源    大小:796.57KB    格式:RAR    上传时间:2016-07-03 上传人:棒*** IP属地:湖北
25
积分
关 键 词:
jl079 基于 灰色 理论 故障 预测 方法 法子 研究 钻研
资源描述:
【JL079】基于灰色理论的故障预测方法研究,jl079,基于,灰色,理论,故障,预测,方法,法子,研究,钻研
内容简介:
数据中心的故障预测 采用时间序列和故障树分析 一 、引言 如今云计算已经成为流行,因为提高可用性,节能和点播服务。云计算的主思想是巩固大资源量和虚拟化他们。这样的设施,内部计算机系统通常被称为数据中心。基于云计算的数据中心,包括处理器,内存单元,磁盘驱动器,网络设备以及各种类型的感应器可以支持多种应用程序和用户。任何系统运行的应用程序与这些异质性和密集工作量有时可能容易受到不同种类的故障,在这种 “硬件故障 ”是单一最大原因系统故障。因此,本研究强调硬件故障的处理。 通过回顾文献,主动故障处理策略最近已 广泛研究。故障预测和作业迁移结合使用,以管理硬件故障的影响,并增加系统可在用户的角度来看的精度预测模型,从而起到对这一战略的重要作用。 从我们的研究,预测模型可分为 2 类:神经网络和时间序列分析。每个类是适合于数据的某些特性和系统环境。 在基于神经网络模型,支持向量机(支援向量机)和 工神经网络)是最流行的技术,因为它们可以提供一个很好的解决方案对非线性数据的短期预测。人工神经网络采用神经网络的算法来训练的节点。输入数据集流入输入层和在每个节点的每个隐含层由训练数据调整,直到误差是最小化或可行的解决方 案为止。然后,可以输出从输出层获得的。沿着同样的想法,支持向量机是一种基于分类和回归者的技术使用训练数据集映射数据,建立预测模型。然而,这两种模式可以停留在当地最小值作为其初始状态是随机的,模型是缓慢的本质上收敛。 许多的研究工作,然后使用创建的混合动力车型 子群优化), 沌粒子群优化算法),或 群优化),以估计参数的支持向量机和人工神经网络。另一个有趣在这个算法类的工作使用贝叶斯模型和决策树分类。本文提出使用贝叶斯作为一种无监督的学习方法来表征正常状态,并检测云不规则行为计算系统 。之后的异常进行验证,决定然后介绍了树分类是有监督学习 预测未来故障发生在系统中。该的监督学习算法的主要缺点是事实上模型往往缓慢收敛,并且是不适合实时预测。 另一种流行的预测算法类是时间系列模。这些方法分析过去数据,以决定将在未来发生什么。已经有许多研究工作的预测为基础的机制对于 统开发。这些问题包括自回归( 移动平均线( 自回归移动平均( ,自回归整合移动平均( 模型和线性回归( 精度结果依赖于数据的特性。彼得 负载。他们评估了 负荷预测。该结果表明,身就足以产生最佳结果(使用顺序 16 日, 回归也被用来构造线性预测模型短期预测的基于互联网的服务器。 首先,他们开发的过滤器模型,消除的 用率,网络收集的数据中的噪声吞吐量和磁盘吞吐量。其运行时管理通过采用回归勾勒线性预测模型方法,即 数加权移动平均), 验结果表明该 为模型不迅速作出反应的数据模式的变化。该文中还讨论了使用动态 型 的不断更新的每一个预测参数。该结果表明,动态跑赢大盘的 在本文中,我们提出了一个战略,保护系统可用性专注于预测模型。时间序列为基础的选择方法,因为实时预测是一个的目标。使用较低的复杂度模型用更少的培训时间也应该是更有效的。故障树分析也框架中的控制反馈回路采用。 本文的其余部分安排如下:背景对预测模型的研究,提出在第 2 节。详情故障预测方法在第 3 节中描述。该的 真器的使用中提到的第 4 节。第 5节而第 6 讨论和实验结果。最后,该结束语在 供。 二、背景研究 自回归移动平均线 自回归移动平均线或 两种型号: 型被称为自回归,因为目前的观察上退步以前的一系列数据的回归观察量( x)的也术语 “ 秩序 ” 或 “ 滞后 ” 下知订单可通过 P来表示。 动平均线)使用以往的系列观测误差(等)以获得当前并且将来数据。以前的错误数观测可以通过 “ Q” 来表示。因此,我们称之为自回归模型 p)和呼叫移动平均模型 Q)。 型是 型的实现订购 型的序第 q。 P,Q)是由公式 1 给出。 凡 在时间的观测系统参数值 提出了一系列的错误以前在观察时间 们使用的 X 和 q 前值 值错误制定的模型。 P表示窗口的大小或自回归条件的顺序,而 “ Q” 代表顺序的滞后预测误差。 的值, 和 是一前数据的常数,系数和系数前者的残留,系数可以得到从回归分析矩阵使用一个操作训练数据集。最后 1 是一个预测系统在未来的某个时间, t 参数值。每一次的未来状态参数预测,它被存储在数据库故障树故障树是一个系统安全性的分析工具,一般用于可靠性分析。故障树的用途其产生的链条的图形显示技术事件以确定潜在的贡献者故障。 使用故障树,这是很容易理解的系统特 性为事件中的上层可以被分解成子事件中随后的水平。事件是由布尔连接在一起逻辑门。每个逻辑门代表不同的关系之间的事件。有三个最常用的门相当于布尔逻辑运算。一个 与 门代表工会的运作。或者门代表 “ 十字路口 ” 的操作。在 不 门代表互补的操作。构建故障树的顶事件的描述被指定的系统状态。热门事件,然后扣除,连接到通过布尔逻辑门及其子事件(原因)。这些原因被称为 “ 一级贡献者 ” 。选定逻辑门表示顶事件之间的逻辑关和原因。每一级的贡献也扣和连接到所述第二的 “ 第二级 ” 贡献者通过另一套逻辑门的水平。这个过程一直持续直到达到分辨率 的极限。的限制分析分辨率或故障树的叶节点被称为 “ 基本事件 ” 。在这项工作中,我们应用故障树,以减少未来国家对所有系统参数为一个值在顶事件(树的根)布尔值。此值然后表示系统不可用。 三 、 故障预报模型 在这项工作中,自回归移动平均模型( 故障树分析是用来预测可能的系统故障的数据中心。图 1 显示了我们的失败预测模型的设计。 一组性能用于从每台机器集群中获得的参数作为输入到预测模型。这一套预先选择的参数,其值可以是硬件故障可靠的预测,收集周期性。这些统计数据是从多个获得元件,包括处理器,存储器和 I/O。 型被用来制订一套预测的那将产生未来值,这些收集的输入数据。 该预测器的输出被转换为二进制形成基于阈值,然后送入故障树。故障树使用二进制数据来分析失败的概率对每一台机器。如果存在任何可能对未来状态,故障树故障将预测的时间步长可能发生的故障传入和迁移建议信号可被触发。程序可用性分析 测。 图 1 有效分析的过程 型首先建立并训练从一组数据从每个计算节点收集。实时串流每个选定的性能参数的数据被收集并送 型。为了提高准确率,我们设计了 一种自调整的 中该模型将重新训练自己。统计学配对 t 检验中使用的自调节过程。预测值,并从最近的历史实际数据进行比较,如果该值在统计学上是不同的, 型的重构将被触发。在重塑步,再创近期收集的数据作为新的训练集。 此外,作为 型只能预测中的值下一个时间步长,就不能在给预测值更远离未来。如果所选择的时间步长间隔太小,迁移可能不能及时被触发。如果时间步骤太大时,存在这样的可能性,该系统可能会失败没有被预测步骤间隔。然后,我们学习自适应预测与多个 型在为了取得多个时间步长预测一次。多步 以在等式 2 进行说明。 在等式 1 中所示的传统的 于通过添加一个额外的参数, S。 S指定的数量在预测未来所需的步骤。 B 在预测数据的转化使用阈值故障树采用探测性指数的思想状态中评估在每个树节点。送入必备的树值被设置为 1,如果可以检测到发生该事件的和 0 的否则。换句话说,如果一个节点的状态发生是 1,一个 指示,否则为 释。 然后,转换所需的一组阈值的一个预测每个参数的值转换成二进制形式。这二进制值将指示是否的未来状态参数可能产生系统故障。方程 3, 4,和 5 被用在数据转换。 方 程 3 描述了 “ 超过阈值 ” 的情况下。是从相应的 到的预测值模型参数 x 的,在时间 t。是的初始状态参数 示参数的阈值 “ X” 是表示高严重性值。高严重性可如果一个参数值超过阈值的注意。 “ 阈值之下 ” 的事件,与此相反,将检测到的情况下高苛刻度,如果一个参数值比阈值低如公式 4 所示。 方程( 5)描述的范围阈值。在这种情况下,高严重性可以,如果一个参数值超出应注意在阈值范围的参数的例子是电源电压及风扇转速。在系统可用性分析使用故障树在我们的框架,对移民的决定是基于制造使用故障树的可用性分析。 换句话说,所有观察到的系统参数的二进制形式被减少到可用性决策。 首先,系统不可被定义为头等大事故障树。顶级盛会将获得他们的原因是否硬件故障事件,可导致系统不可用所谓的 “ 重头戏 ” 。四个主要的事件是处理器过热,资源枯竭,访问坏扇区,并电源故障。一个完整的故障树设计基于衍生对分析来自 记录的故障 , 一个完整的故障树结构如图所示。 过程过热( A):这个事件经常发生任何因为 身或与过热两个子活动相结合 ; 高 载和低风扇转速。从图 3,布尔表达式的事件, A 可以写为 A = E ( F G)。 资源枯竭( B): 本次活动时可出现系统运行的内存或磁盘空间。表达可被指定为乙 =H 一 坏扇区接入( C):指一个事件时,程序试图访问磁盘的坏扇区或内存。然而,对于一个存储器中,有许多方法来纠正这样的错误。因此,我们只交关注磁盘访问。表达式为 C=J。 电源故障( D):电源失败的可能原因到瞬间断电,过载,中断或输出下降时在其寿命的结束。电源故障可使用的电压值来识别。该表达式为 D=L。 图 2 错误的树结构 图 3 失败的联机预测时间关系 在我们的故障树,顶事件表达式可以写成在式( 6)所示。 7 叶节点的状态将被削减, 而顶级盛会值, U 是确定的。在结合使用故障树多步骤的 型,顶事件的价值, U 将同时计算出在许多时间步长。对于任何价值的 评估为真,其无故障时间( 报告结果。 从图 3,在当前时刻 t,如果状态 U 是真, 故障发生是要在某个时间步向前预测(交货时间 用,并且系统可以在有故障这就是所谓的预测期内 据由监视处理的数据内捕获长度 3 引入的最小警告 果所需的时间比警告时间短,将不会有足够的时间来执行任何预防或准备 行动。在本文中,我们设置了一段警告时间 障管理框架的核心思想是准确预测系统的未来状态,并提供一个效率的解决方案,以维护系统的可用性。当一组从每个节点的参数进行监测,在监测数据被发送到预测模型,以预测可用性。如果有任何可能发生的故障对未来状态,被预测为故障节点将发送一个信号到一个节点所谓的资源管理器。资源管理器可以再对于确定的节点( S)执行迁移的决定。何时若干节点有可能在同一时间,迁移失败序列是基 于故障时间( 布置和需要迁移的时间。资源管理器也选择对每个移民事务的目的地。一的概率低到故障计算节点更可能可以选择。一旦资源管理器完成其决定,迁移模块可以触发实际的传输。 四 、 模拟集群上的 为了评估我们的预测模型的精确度,我们已经建立了一个模拟集群。在模拟器上大可以在几个数字来生成服务器数物理计算机。此外,故障可以很容易地在注入为了观察系统故障。 在我们的工作中,风河公司的 真器是就业。 一个完整的系统仿真平台,可以模拟整个系统包括网络, 储器 ,总线,芯片组并存储。换句话说,虚拟可提供的硬件。这样的 支持设计,开发和测试电脑在硬件和软件水平上的 户可以部署一个实际的操作系统和为了测试实际运行的应用程序或基准测试工具该系统的性能,可靠性和效率。在此外,仿真器是可控的和确定的,也就是说,在同一个目标上运行相同的软件节点将产生相同的结果。 在的 环境,一台机器上运行的 称为一个 “ 主机 ” 和一机多用的 拟的是一个目标机器。所有网络组件都完全虚拟化。以太网链路可以连接以太网组件和设备一起在模拟机。 提供了一组函数,可用于管理两个的 象和之间的相互作用的 象和模拟核心。更重要的是系统故障注入可以通过运行一个 障可以在 4 个地点是处理器被注入寄存器,存储器数据总线,内存地址总线和 I/O 数据总线。两个瞬时故障和永久故障可注入在模拟系统。永久性故障中断系统随即,而瞬时性故障慢慢中断硬件组件。在我们的工作中,瞬时故障注入类似于文献的工作方法,重点和实验是在下一节中描述。 五、实验 基于的 境,实验测试床建具有下列规格。八的 标机 器是一台 机上运行。 服务器版本 猫 ) 被安装到每台目标机器。每个目标机器包含一个 64 位英特尔 奔腾 4E 处理器,拥有 4 超执行绪, 1存和 22盘。所有的主机和目标机都连接在使用的 络相同的以太网交换机功能。此外,我们实施监控,预加工,并且可用的分析模块是部署到所有客户端节点。在资源管理器模块但是被安装在服务器节点上。 故障然后在测试床使用 注入脚本。 布用来拟合一个受欢迎的功能失败的数据,采用模拟的故障分布。利用均匀分布 的随机变量故障节点被选择分布。每次注入故障后,系统状态是观察并记录失效时间的情况下故障状态确实发生了。平均时间到失败是再用于识别故障发生。 在试验台客户机上的几个参数进行监测,并定期基于预定义的收集这是根据经验选择的时间间隔。一个 施提出的故障预测框架在第 3,然后用于捕获和处理这些实时数据。我们用矩阵操作进行 型的训练。资源管理器然后可以通知当紧急事件发生。 包含可用于将值参数列表找出我们的故障树的叶子节点的状态显示在表 1中。注意, 度不能测直接在模拟。因此,我们研究了相关所有的参数和使用数据的温度之间从实际的计算机系统所收集。 回归分析然后,用来估计在使用温度模拟。我们没有估计风扇速度和电压由于依赖性的原因。模拟数据中心建成后,我们再部署了一系列节目的用户具有不同的特性上的所有客户端计算的准确性和我们设计的故障预测方法的有效性可能然后进行评价,并在下一节介绍。 六、业绩及 数值预测的准确率 使用均方根误差( 示测量方程 7。其中 从所获得的实际值仿真 , 是 测值在时间 t, n 是个别组合的数目。 在 型在我们的框架能够自 我调整时 , 从配对 测和测量值在统计学上是不同的错误 , 从均方根误差计算每个参数百分数都是 图 4X 轴示出了每个单独的参数在如表 1 中呈现的顺序相同。观察 14 最大误差参数 “ 磁盘写入速度 ” 。磁盘读 /写速度取决于很多上的应用程序。在我们的实验中,我们跑了多个程序具有不同特性和在 I/O 模式是如此难以 预测。小于 1的错误率在 2 的观察参数和整体的预测精度是 注意,通过使 型自我调整, 9改善均方根误差方面也从我们的观察实验。 每个 型的误差百分比从 到的预测的参数值模型,然后送入故障树,以预测故障集群中的机器状态。以评估的准确性故障预测,一个混淆矩阵被使用。矩阵包括四个类别:真阳性( 假阳性( 假阴性( 真阴性( 图 4 每个 型的误差百分比 从表 2,故障状态预测给予了高度的 97的准确性,但在 53相对低的精度。高精度表明,当故障发生做预测模型将预先知道和计算的损失和数据可以最有可能通过迁移来预防。然而,低精度意味着我们的预测方法失败几乎两倍于实际的故障。因此,故障警示可提高往往造成过度迁移。进一步调 查是需要解决的问题。 此外,我们还计算了真阳性率使用公式(福利)和假阳性率(成本 ) 10 和11,用于学习的敏感性和特异性 预测采用受试者工作特征( 节。 图 5 线 图 5 示出 线。在我们的实验中,来自 30 个时间步长 30 点的数据。然而,一些中华民国数据点具有相同的( 标。 从图中,点( 0, 0)表示一个非正决定(没有真或假阳性)和点( 1, 1)代表一个非负的决定(没有 真或假阴性)。点( 0)表示的最佳预测结果,其中真阳性率最大化,并且假阳性率是最小化。点上面的对角线因此代表好结果。从我们的实验数据, 21 分是在位置( 0, 0),这意味着三分之二的数据的表示的情况下其中预测结果是正确的,当没有失败发生。请注意,在我们的实验中,最短暂的注入故障并未最终导致失败。这些案件都是这样不显著的研究。然后,我们专注于在休息数据点。图中显示了上述三个六个数据点指出下面的对角线。整体的预测结果因而被认为是良好的 。 七、结论 本文提出了一个系统的可用性框架预测在群集内。两种方法, 自我调整型和故障树,用的都是我们的框架。列表系统参数,可能会导致系统故障是定期监控。 型可以指示异常这些值,这些值被转换成二进制值,并供给进入故障树。如果故障是有可能的,该框架可以提醒群集的资源管理器和相应的操作即可为防止数据或计算的损失。 为了评估故障预测的准确性,我们建立在的 真器模拟集群。结果显示高达 97的预测精度。但是,所观察到的预测精度为 53。该结果我们的模式与频率高于预测故障实际数字。为了修补这个问题,有限状态机( 应整合,以避免多余的从误报事件迁移。 以设计成在多个时间步长的连续故障预测的迁移之前被认为是必需的。我们相信,随着一些进一步的微调,拟议的框架可能是部署到改善集群中的总效率未来。 of of is a of to as of of be to of in is of of in to of in of of an on be is of In as a of a to on is by is or a is be is a on by a to a in as is is to by to VM in to as an to to of is a is to in of is to is is to in on PC of on of . et as a in R, R is to R of 6 to of
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:【JL079】基于灰色理论的故障预测方法研究
链接地址:https://www.renrendoc.com/p-687017.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!