如何有效进行IT运维管理_第1页
如何有效进行IT运维管理_第2页
如何有效进行IT运维管理_第3页
如何有效进行IT运维管理_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

如何有效进行IT运维管理如何有效进行IT运维管理

如何有效进行IT运维管理

如何有效进行IT运维管理

导读:信息化程度的提高使得IT部门在企业中不行或缺,但由于运维管理跟不上,IT

人员成了企业中最劳碌的人,繁重的运维负担让他们疲于奔命,不堪重负。本文和大家共享一下自己在IT运维管理方面的思索和阅历。

由于工作缘由笔者常常和企业IT人员打交道,所见所闻中对他们的日常工作应当说特别了解。信息化程度的提高使得IT部门在企业中不行或缺,但由于运维管理跟不上,IT人员成了企业中最劳碌的人,繁重的运维负担让他们疲于奔命,不堪重负。本文和大家共享一下自己在IT运维管理方面的思索和阅历,盼望能够关心到你。

1、一个真实的案例

作为某知名物流企业的CIO,刘总负责整个公司的IT服务管理工作。笔者常常看到他每天忙得刘总团团转,甚至连杯水都来不及喝,但还总是被种种问题困扰,节假日还得加班。就这样,老总常常会接到业务部门的投诉:我们的业务员明明将远程配送业务系统问题报障给了网络部。但他们就是推托说网络一切正常不是他们的问题,让我们找系统部。而系统又说是应用的问题,让我们找应用部,应用部说需要设备部先更换硬件才能升级应用程序。我们只好找到了设备部,设备部又说需要网络和系统的协作才能更换配件。就这样我们的问题转了半天没得到解决,耽搁了送货时间,用户要求赔偿。2、IT运维管理势在必行

上面的案例应当说特别普遍,也特别值得我们思索。在业务应用日趋细分化、简单化的今日。IT建设的迅猛进展,政府机关、企事业单位、学校等,几乎都全部依托于IT环境进行日常办公管理和业务管理。人员和业务流程对于网络及IT设备的依靠度也提高到不行或缺的地步。网络的运维与单位的持续进展紧密相关,稍有不慎就可能会令单位蒙受巨大的损失。因此,IT系统运行的稳定性和健壮性对单位来说,将显得特殊重要。特殊是对于一些大中型单位,IT设备和信息系统多而简单,单靠人工管理它们的运行和维护状况己不行能。这样就需要一套切合实际的IT运维管理系统来帮助单位信息中心或信息服务部门进行自动化管理。

3、IT运维中的不良习惯

下面笔者结合自己的见闻和经受,就我们的IT人员在运维中的不良习惯进行一些有益的总结,以供大家杜绝。

(1).治标不治本。IT设施故障往往是突发的、随机的、不行猜测、不行掌握的。也很难自动提示和警告。运维和管理人员成天处于高度紧急状况,节假日也提心吊胆。一旦发生故障,往往手忙脚乱来不及认真多方面观看、分析缘由,也无法很快精确     定位。为了尽快恢复业务,只能实行重启、清除等不行回朔操作。这种治标不治本的维护措施,不能根本解决问题,类似现象仍旧可能再发生。

(2).没有排错记录。我们的许多IT人员没有排错记录的习惯,这样当事后查找缘由缺乏当时记录,就算找到点痕迹也缺乏进一步分析数据。由于故障不能再现,很难有预备地捕获有效信息。而要在生产环境模拟故障业务几乎不允许。开发环境又很难模拟和再现。少量片面的系统日志很难看出问题症结,缺乏自动实时捕获问题关键点并忠实记录工具。造成问题发生后无法回朔,问题解决无法找到头绪。

(3).缺乏统一的规范要求。消失同题时解决方法因人而异,缺乏方法和工具,无法制定统一的规范要求。在专家解决问题的阅历缺乏记录、整理、积累和继承。从保障稳定看,必需高价保持足够专业运维人员。工作支配松了不利于人员进展和稳定,但支配太紧又无法保证准时响应和解决问题。

(4).应对危机太被动。对反映的问题和解决状况缺乏统一管理和跟踪,全靠个人素养和责任感。无法衡量、统计员工的业绩贡献,也无法发觉哪些问题最影响系统稳定。造成问题的因素是在积累还是在减弱,更缺少预警提示机制。只能被动无序地等问题发生甚至很严峻了才意识到。

4、IT运维管理的内容

笔者理解,IT运维管理是指单位IT部门采纳相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(如硬软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。假如进行细分的话,应当包括以下几个方面:

(1).设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理;

(2).应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理。如邮件系统、DNS、Web等的监控与管理;

(3).数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;

(4).业务管理:包含对企业自身核心业务系统运行状况的监控与管理和对于业务的管理;

(5).名目/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理:

(6).资源资产管理:管理企业中各IT系统的资源资产状况;

(7).信息平安管理:企业平安组织方式、资产分类与掌握、人员平安、物理与环境平安、通信与运营平安、访问掌握、业务连续性管理等;

(8).日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作支配、供应绩效考核量化依据、供应解决阅历与学问的积累与共享手段。

5、IT运维管理方案

在以上内容的基础上,笔者供应一套IT运维管理的解决方案,以供大家借鉴。

(1).建立IT运维管理服务平台

IT运维管理服务平台关心IT部门内部各专业部门以单点联系窗口的形式对外服务,业务部门不必了解IT部门内部的运作流程。只需将故障报告给IT部门服务窗口的一线服务台人员即可。由一线支持人员对故障进行分类以电子工单方式派发到相关的专业部门或相关人员处进行准时处理和响应,并向用户准时进行反馈。用户对不同专业部分的询问、问题和投诉都通过该窗口进行,以避开用户与各级支持人员直接联系带来的种种弊病。如消失不同问题找不同支持人员、找不到人、问题得不到准时反馈和解决等等现象。

(2).实现IT监控和统一呈现

面对业务监控和统一呈现能够评估各种IT基础设施和服务在设定的某个时段是否发挥其应有的功能,同时实现对网络、系统及应用服务等全方位监控的统一呈现。统一告警平台汇总、压缩和关联各种设备或服务的告警信息,实现统一监控和呈现。这样,各专业部门可以协同作战发挥更大的作用。

(3).构建科学、规范的服务流程管理

依据企业的实际组织架构,把故障支持划分不同的类型和等级,形成梯队化的故障处理流程,避开消失资源铺张。并且在每个级别的故障大事处理中,通过自动跟踪机制实现故障的自动跳转和升级,从而确保不同紧急程度的故障得到准时的响应和处理,关心企业建立起一套科学规范的1T服务管理流程。企业环境下首次或者突发消失的大事、告警或故障通过大事工单进行处理;而对于多次消失、深层次、临时恢复的告警大事,可通过问题管理进行解决,以便于协调优势资源攻关和彻底解决。通过层次化、标准化、科学化的管理,量化的评估每个技术人员的工作力量,削减了故障对业务的影响,避开消失责任不明晰,响应不准时的问题,提高客户和用资源的使用更加合理。

(4).实施严谨、高效的变更审批流程

为基础设施的变更供应快速的电子通道,削减变更过程中消失管理失控的风险和不必要的人为干扰,缩短审批时间,提高变更实施的效率。严谨的变更管理确保在变更实施过程中使用标准化的方法和流程,尽快和有效地实施变更,从而把由于变更所导致的大事对IT服务的影响减小到最低,同时改善了公司的日常运作。它包括一套完整的变更管理功能,包括变更的发起、审批、影响评估、派发实施等功能。以工单的形式在各部门和责任人之间流转。

(5).IT资产配置完善管理

为企业建立完善的配置基线,为企业建立一套详实的配置管理数据库,小到主机内存、设备端口,大到网络结构、部门或公司的建制,从有形的资产到无形的应用系统、人力资源等都能以电子方式精确     记录并长期保存。同时,资产配置管理与服务的大事、问题和变更流程相关联。如变更流程审批完成之后增减的资产配置信息,将自动在资产配置管理数据库中实现同步更新。

对IT运维实施有效管理,不仅能够解放IT人员提高其工作效率,而且也是对企业业务部门的有力支持。最终,盼望笔者的阅历和案例对伴侣们加强IT运维管理有所关心。

扩展阅读:如何做好IT运维管理

近段时间,由于公司部门人员调整,压缩人力成本,IT部门首当其中,原来人手就紧急,现在还压缩人员编制,想来这运维的工作接下来怎么做?如何去做?如何做到运维工作高效快捷!!!

许多企业在聘请过程中,由于运维人员的要求相对高点,涉及的技术层面和理解范围也有点广,其次,许多企业都实施了许多IT系统,使到IT运行越来越简单,也越来越难管理。人力成本普遍偏高,同时,IT运维成本过高的另一个缘由是IT运维大部分都是被动式维护,不能自动化预警维护,依靠手工流程来管理,不但使到运维效率不高,而且人力成本更是花费惊人,IT运维人员成本偏高。

这些账目使得一些企业老板不得不考虑对部门人员精简压缩,原来10个人做的时期就给7个人做了,5个人做的事情就给3个人做了,这样的做法是否能真正做到有效的维护和管理。

现在大多数IT运维过程中,IT员工大多数只是处在被动低效率手工救火的状态,只有当大事已经发生并已造成业务影响时才能发觉和着手处理。这种被动“救火”会导致:①.IT运维人员终日劳碌,IT运维人员日常大部分时间和精力是处理一些简洁重复的问题;②IT运维本身质量很难提高;③再加上故障预警机制的不完善,往往是故障发生后或报警后才会进行处理,不但事倍功半而且故障还经常会消失恶性连锁反应;④IT部门和业务部门对IT运维的服务满足度都不高。

运维人员每天扮演者“救火员”的身份,但同时也没有得到相关部门的确定,每次月度考核,总是差,这个是为什么列?有伴侣可能会说,设备的问题,咱们能有什么方法,机器宕机了,我们又不没有准时处理,是的,问题是准时处理了,但是时间过去了,现在是一个高效率的时代,你只要慢别人半拍,那么你就有可能失去这个市场,这个道理最近在看一个电视剧《大时代》体验到的,虽然带有夸张的颜色,但是个人觉的并不夸张,你的运维系统总是问题不断,影响到客户的体验和使用,一次两次别人可以理解你,常常这样你拥有的客户就会失去,由于每个行业的竞争都很激烈。

然后咱们在谈谈运维系统的主要管理内容:据我个人所知,运维层面管理主要包括:硬件层面:服务器、网络设备(路由器、交换机、防火墙)

软件层面:操作系统的实时运行状况监控、应用软件的实施和维护(ERP、CRM、OA)等数据应用类管理:数据库、中间件(ftp同步传输)、邮件系统、web网站、域控AD等存储/容灾管理:业务支撑系统数据备份、存储设备的管理和备份以及运行环境的性能监控虚拟化平台管理:hyper-v、esx等

信息平安:不仅仅是通信与运营层面的平安、病毒防护、入侵等

这些都是运维人员在被动的状况下实施操作的,在半自动化的运维层面下,许多始料未及的问题就简单暴露出来,然后抓紧将问题抹杀在摇篮中。这样高度集中的办事效率能事半功倍么,只会是差强人意。运维管理面临的这些问题,是否能有效的杜绝?

现在许多厂商提出了IT运维自动化,比如H3C的iMC2.0数据中心管理解决方案、卡西亚的IT系统管理平台等,这些IT运维自动化不但可以有效解决企业信息化快速进展所带来的困扰,减轻运维工作的负担,还能关心企业IT基架运维实现最佳的管理状况,让运维人员随时把握企业系统的运行状况,能对突发状况作出主动,快速的反应,能为企业设备及海量的数据供应最平安有力的保障。

IT运维自动化虽然便利了维护和管理,也是将来的一种进展趋势,但是安装部署和实施也是需要时间的,购买软件的成本价格也不菲,这个价格成本也是许多企业老板不敢轻易去尝试的,所以好多事情真的不能想当然,产品当然很好,但是不是全部人能用的起。当然,不管多么棒的自动化的管理和维护

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论