IT运维自动化概述_第1页
IT运维自动化概述_第2页
IT运维自动化概述_第3页
IT运维自动化概述_第4页
IT运维自动化概述_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IT 运维自动化 概述目录什么是 IT 运维自动化传统运维管理方式存在的问题IT 运维自动化迫在眉睫IT 运维自动化管理的具体内容IT 运维自动化的工具建立高效 IT 运维自动化管理的步骤1.什么是 IT 运维自动化?随着信息时代的持续发展, IT 运维已经成为 IT 服务内涵中重要的组成部分。面对越来越复杂的业务, 面对越来越多样化的用户需求,不断扩展的 IT 应用需要越来越合理的模式来保障IT 服务能灵活便捷、安全稳定地持续保障,这种模式中的保障因素就是IT 运维(其他因素是更加优越的 IT 架构等)。从初期的几台服务器发展到庞大的数据中心,单靠人工已经无法满足在技术、业务、管理等方面的要

2、求,那么标准化、自动化、架构 优化、过程优化等降低 IT 服务成本的因素越来越被人们所重视。其 中,自动化最开始作为代替人工操作为出发点的诉求被广泛研究和应 用。IT 运维从诞生发展至今,自动化作为其重要属性之一已经不仅仅只是代替人工操作, 更重要的是深层探知和全局分析, 关注的是在 当前条件下如何实现性能与服务最优化,同时保障投资收益最大化。自动化对 IT 运维的影响,已经不仅仅是人与设备之间的关系,已经 发展到了面向客户服务驱动IT运维决策的层面,IT运维团队的构成, 也从各级技术人员占大多数发展到业务人员甚至用户占大多数的局 面。因此, IT 运维自动化是一组将静态的设备结构转化为根据

3、IT服务需求动态弹性响应的策略,目的就是实现 IT 运维的质量,降低 成本。可以说自动化一定是 IT 运维最高层面的重要属性之一,并且 需要与之配套的一系列软硬件平台环境及体系。2. 传统运维管理方式存在的问题目前许多企业的 IT 运维已经实现从人工运维到计算机管理, 但延展咨询在同客户的交流中发现其中很多企业的 IT 运维管理还只是 处在“半自动化” 的运维状态。因为这种 IT 运维仍然是等到 IT 故障 出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、 半自动式的 IT 运维管理模式经常让 IT 部门疲惫不堪, 主要表现在以 下三个方面 :(1) 运维人员被动、效率低在 IT

4、运维过程中,只有当事件已经发生并已造成业务影响时才 能发现和着手处理, 这种被动“救火”不但使 IT 运维人员终日忙碌, 也使 IT 运维本身质量很难提高,导致 IT 部门和业务部门对 IT 运维 的服务满意度都不高。目前绝大多数的企业 IT 运维人员日常大部分 时间和精力是处理一些简单重复的问题, 而且由于故障预警机制不完 善,往往是故障发生后或报警后才会进行处理, , 使到 IT 运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现 恶性连锁反应。(2) 缺乏一套高效的 IT 运维机制目前许多企业在 IT 运维管理过程中缺少自动化的运维管理模式, 也没有明确的角色定义和责

5、任划分, 使到问题出现后很难快速、 准确 地找到根本原因, 无法及时地找到相应的人员进行修复和处理, 或者 是在问题找到后缺乏流程化的故障处理机制, 而在处理问题时不但欠 缺规范化的解决方案,也缺乏全面的跟踪记录。(3) 缺乏高效的 IT 运维技术工具随着信息化建设的深入,企业 IT 系统日趋复杂,林林总总的网 络设备、服务器、中间件、业务系统等让 IT 运维人员难以从容应对, 即使加班加点地维护、 部署、管理也经常会因设备出现故障而导致业 务的中断, 严重影响企业的正常运转。 出现这些问题部分原因是企业 缺乏事件监控和诊断工具等 IT 运维技术工具,因为在没有高效的技 术工具的支持下故障事件

6、很难得到主动、快速处理。运维自动化迫在眉睫尽管 IT 运维管理的技术在不断进步, 但实际上很多 IT 运维人员 并没有真正解脱出来,原因在于目前的技术虽然能够获取 IT 设备、 服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息 堆积在一起更本没法判断问题的根源在哪里。 另外,目前许多企业的 更新管理绝大多数工作都是手工操作的。 即使一个简单的系统变更或 更新往往都需要运维人员逐一登录每台设备进行手工变更, 当设备数量达至成百上千时, 其工作量之大可想而知。 而这样的变更和检查操 作在 IT 运维中往往每天都在进行,占用了大量的运维资源。因此, 实现运维管理工作的自动化对企业来说已迫

7、在眉睫。现在随着 IT 运维管理工作的复杂度和难度的大大增加, 仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业 开始需要运用专业化、 标准化和流程化的手段来实现运维工作的自动 化管理。因为通过自动化监控系统能及时发现故障隐患, 主动的告诉 用户需要关注的资源,以达到防患于未然。例如,全天候自动检测与及时报警能实现 IT 运维的“全天候无人值守”,大大降低 IT 运维人员的工作负担。而且,通过自动化诊断 能最大限度地减少维修时间 , 提高服务质量。因此 , 对于越来越复杂 的 IT 运维来说,将纯粹的人工操作变为一定程度的自动化管理是一 个重要发展趋势首先, IT 运维流程自

8、动化能够提高流程的可控性,可以基于业 务需求来制定个性化的流程, 使企业领导有机会看见他们的业务流程, 对企业流程有一个深刻的分析和理解,进而改造和优化流程。其次, IT 运维流程的自动化能提高透明度。因为随着业务需求的变 化可能会有多个版本出现, 手工流程的不透明将会给流程定制和优化 带来相当大的困难, 而自动化流程可以使用户能够一目了然的看到整 个流程的各个节点运转情况, 自动化工具潜移默化地提升业务保障能 力。再者,运维系统实行了自动化监控以后, 通过工具自动监控对人的工作是一种减负,也是一种降低成本的表现。运维自动化管理的具体内容IT 运维已经在风风雨雨中走过了十几个春秋,如今它正以一

9、种 全新的姿态摆在我们面前 - 自动化,这是 IT 技术发展的必然结果。现在 IT 系统的复杂性已经客观上要求 IT 运维必须能够实现数字化、 自动化维护。所谓 IT 运维管理的自动化是指通过将日常 IT 运维中大量的重复 性工作(小到简单的日常检查、配置变更和软件安装,大到整个变更 流程的组织调度) 由过去的手工执行转为自动化操作, 从而减少乃至 消除运维中的延迟,实现“零延时”的 IT 运维。简单的说, IT 运维自动化是指基于流程化的框架,将事件与 IT流程相关联, 一旦被监控系统发生性能超标或宕机, 会触发相关事件 以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可

10、帮助 IT 运维人员完成日常的重复性工作( 如备份、杀毒等 ),提高 IT 运维效率。同时, IT 运维的自动化还要 求能够预测故障、在故障发生前能够报警,让 IT 运维人员把故障消 除在发生前,将所产生损失减到最低。运维自动化的工具对于企业来说,要特别关注两类自动化工具:一是 IT 运维监控 和诊断优化工具; 二是运维流程自动化工具。 这两类工具主要应用于: 监控自动化,是指对重要的 IT 设备实施主动式监控 , 如路由器、交换 机、防火墙、机房环境监测设备等;配置变更检测自动化, 是指 IT 设备配置参数一旦发生变化, 将触发变更流程转给相关技术人员进行确认 , 通过自动检测协助 IT 运

11、 维人员发现和维护配置。维护事件提醒自动化 , 是指通过对 IT 设备和应用活动的时时监控, 当发生异常事件时系统自动启动报警和响应机制, 第一事件通知 相关责任人。系统健康检测自动化 , 是指定期自动地对 IT 设备硬件和应用系 统进行健康巡检 , 配合 IT 运维团队实施对系统的健康检查和监控。维护报告生成自动化 , 是指定期自动的对系统做日志的收集分析 , 记 录系统运行状况 , 并通过阶段性的监控、分析和总结 , 定时提供 IT 运 维的可用性、性能、系统资源利用状况分析报告。6. 建立高效 IT 运维自动化管理的步骤(1) 建立自动化运维管理平台IT 运维自动化管理建设的第一步是要先

12、建立 IT 运维的自动化监 控和管理平台。通过监控工具实现对用户操作规范的约束和对 IT 资 源进行实时监控,包括服务器、数据库、中间件、存储备份、网络、 安全、机房、业务应用和客户端等内容,通过自动监控管理平台实现 故障或问题综合处理和集中管理。例如,在自定义周期内进行自动触发完成对 IT 运维的例行巡检,形成检查报告。 包括自动运行维护, 以完成对系统补丁的同步分发与 升级、数据备份、病毒查杀等工作。(2) 建立故障事件自动触发流程,提高故障处理效率所有 IT 设备在遇到问题时要会自动报警,无论是系统自动报警还是使用人员报的故障,应以红色标识显示在运维屏幕上。然后 IT运维人员只需要按照相

13、关知识库的数据,步一步操作就可以。因此,企业需要事先建立自动工单式流程管理,当设备或软件发生异常或超出预警指标时会触发相关的事件, 同时触发相关工单处 理流程给相关 IT 运维人员。 IT 运维人员必须在指定时间内完成流程 所规定的环节与工作,以提高 IT 运维响应问题的效率。(3) 建立规范的事件跟踪流程,强化运维执行力度IT 运维自动化管理建设时,首先需要建立故障和事件处理跟踪流 程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定 期回顾从中辨识和发现问题的线索和根源。事实上许多实践也证明, 建立每种事件的规范化处理和跟踪指南,可以减少 IT 运维操作的随 意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自助服务台、 电话服务台等随时追踪该故障 请求的处理状态。(4) 设立 IT 运维关键流程,引入优先处理原则设立 IT 运维关键流程,引入优先处理原则是指要求 CIO 定义出IT 运维的每个关键流程,不仅仅是定义流程是什么,还包括要指出 每个关键流程对企业有什么影

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论