




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机房环境监控意义一、监控管理对可用性管理的意义根据ITIL的定义,所谓的“可用性”指的是:“一个配置项或IT服务根据需要履行协定职能的能力。可用性取决于可靠性、可维护性、可服务用性、性能和安全。可用性通常以百分比计算。这种计算通常基于协定服务时间和宕机时间”。高可用性IT管理是指:是指通过对IT架构及运维管理、基础设施及管理、灾备建设及运维、安全及管理等高可用性关键要素的改进与优化,提升IT系统的可用性,从而更好地保障业务持续运营和创新的过程。在衡量可用性方面,具体又分为MTTR/MTBF/MTBSI等三个不同的指标(如下图)。从下图可见,无论是MTBSI还是MTTR,均有一个重要的组成部分“Detecttime(侦测时间)”。可见“能否通过有效的监控管理,及时、有效地发现数据中心中各管理对象的故障”,已构成数据中心高可用性一个充分条件。所以说,集中监控管理就像是高可用性管理的一双眼睛,有了它整个数据中心的组件情况才能一目了然,高可用性的目标才具备实现的管理基础。二、监控管理对数据中心运营的作用数据中心的管理对象主要包括基础设施与IT基础架构两大部分。其中基础设施包括供配电、UPS、空调、消防、安保、环境监测等机房系统;基础架构包括网络设备、主机设备、存储设备等IT设备。集中监控的目标就是要能够通过管理与技术的应用,对基础设施与IT基础架构的运行情况进行监视,实现故障与异常的实时发现与通知;此外还可以通过对监控数据搜集与整理,为容量管理、事件管理、问题管理、符合性管理提供分析的基础,最终实现数据中心高可用性的目标。1.事件管理与可用性管理随着技术的发展,有许多第三方监控工具开始出现,这些工具可以实现跨设备、跨平台、跨系统的集中数据采集,同时也能针对不同的监控对象设置相应的阀值,最终还可以实现统一的展现与告警。这些工具的出现,使得IT管理人员可以以一种更快速、更准确的方式发现被管理的组件所出现的故障。从而为故障的修复,以及服务的恢复争取了宝贵的时间,提升了整个基础架构的可用性。2.容量管理监控管理还会利用监控工具的性能采集功能,对一些关键应用的关键性能点进行监控,取得这些关键点的性能数据,用来评估IT系统的容量。当发现IT组件目前的性能与原来的容量计划存在偏差后,可以及时对这些组织的性能进行扩容,减少因性能不足而导致业务中断的可能性。3.安全管理与符合性管理监控管理可以利用目前的一些安全监控工具,去检查组件的安全情况与运行中对合规要求的符合情况。如GDS目前的一些合作伙伴,其利用一些安全软件,对防火墙、防病毒与入侵检查设备进行实时日志采集与安全分析,同时比对公司的安全策略或一些安全标准,帮助数据中心管理人员对目前数据中心运营中安全问题进行快速定位与问题分析。三、监控管理面临的挑战1.采集层的集中化从目前市场上的工具来看,还没有哪个监控工具可以支持业界全线的IT产品,尤其是存储与光传输设备这一块。另外,不同客户对监控的深度也要求迥异,有些客户可能仅需要监控到网络、设备与系统层面,有些则需要对其数据库、中间件甚至是应用进行监控,这也为监控采集层的集中带来不少的难度。最后,不同客户对成本与安全要求的不同,进一步提升了监控工具在采集层集中的难度。2.处理层的集中化目前许多设备的监控往往只能反映出某一台设备的可用性,却不能完整的展现出整体的应用结构以及互相之间的影响关系,一旦一台核心的交换机发生故障后,管理员会发现,突然之间,满世界都是各种各样的告警,头昏眼花,疲于奔命,却不知道到底该如何解决。因此,如何能进行事件关联,协助管理员能从各个孤立的事件中迅速定位,这是对监控管理的另一项挑战。3.展现层的集中化随着监控内容的增加,目前数据中心运营人员面临的另外一个问题是如何能让监控室的人员可以在众多监控终端中迅速地发现系统报警,毕竟无法要求负责监控的人员7X24小时地盯着监控屏幕。所以监控终端的报警方式集中化,甚至是监控工具展现层的集中化就成为了监控管理目前所面临的一项挑战。4.监控工具与管理的集中监控管理的目的并不是监控工具本身,而是通过人工或技术的手段可以及时发现基础设施与基础架构上的问题,并按照既定的要求,将发现的问题按照既定管理流程与工具,调动相应的技术、管理人员介入,最终有效地解决数据中心中可能出现的事件、容量与可用性等问题。因此,如何让数据中心工作人员清楚在监控工具中报出问题后,应如何执行后续管理流程,避免错报、漏报,成为监控管理的一项重要挑战。四、监控管理发展的趋势1.业务监控数据中心提供的是信息服务,也可以说是业务服务,独立的对一台设备进行监控已经不能满足未来的需求。对于管理人员来说,更关心的是数据中心提供的一个业务、一个服务是否能够正常的运行,因此,未来的监控解决方案,需要更多的从业务及服务的层面出发,将独立的物理设备,与业务紧密关联,形成业务设备视图,每个设备的可用性,都能够反映到业务的可用性上。2.虚拟化云监控虚拟化是未来数据中心的趋势,但监控工具很难区分其监控的服务器是一台物理机,还是一台虚拟机,也不可能知道硬件系统会对服务器可用性存在潜在影响,而虚拟化平台的可用性直接影响到运行在其之上的虚拟服务器的可用性。监控软件处理的应该是主服务器硬件出现的问题,但是如果主服务器处于危险之中,那么任何在主机上运行的虚拟机也面临同样的问题,因此,虚拟化云环境的高可用性方案也会是未来的趋势之一。3.影响分析模型业务监控及虚拟化环境的基础在于不同的设备间能够建立清晰的管理,形成设备与设备的关系网,这就需要建立CMDB(配置管理数据库),它清晰的描述了每一台设备的信息属性,以及设备之间的关系。通过建立CMDB信息库,形成业务的影响模型,例如,以下是对一个在线交易系统进行影响建模:在这个交易系统的影响模型中,例如“存储”发生故障,直接反应出的是服务不可用,同时“在线交易系统”、“数据库服务器”、“在线交易系统”皆为不可用状态,根据被依赖关系进行分析,可以很直接的定位到故障原因,从而避免了逐个系统的进行故障分析。小结回顾监控管理发展的过程,其本身也是伴随着业务对IT的依赖程度以及IT本身的复杂程度的发展而发展。以前一个机房没几台设备,而且停机不停机不会带来什么影响,所以就可以安排几个工程师定期去做一些物理巡检就能解决问题了。但是,几百台、上千台设备的数据中心已比比皆是,加上许多业务已经要求IT是7x24小时永不间断,如出现停机损失相当巨大。因此,监控管理已成为IT管理中的重
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源汽车维修保养智能化服务报告
- 2025年新能源汽车动力电池回收利用与循环经济研究报告
- 2025年电动汽车电池热管理系统热失控风险防控报告
- 2025年低空经济「旅游观光」无人机航拍与直播报告
- 2025年新能源汽车电池管理系统与车载电子集成设计报告
- Unit 7 Whats the highest mountain in the world Section A (3a-3c)教学设计-人教版八年级英语下册
- 巴西2025低空经济农业植保无人机产业国际化发展策略报告
- 2025年航空维修技术标准与国际合作报告
- 2025年新能源汽车自动驾驶技术保险理赔效率提升策略报告
- 低空智联网2025年产业发展前景与市场空间报告
- 山东省名校考试联盟2026届高三上学期10月阶段性检测数学试卷(含答案)
- 基于IPv9技术的商务港交易平台构建:设计、实现与展望
- 江浙皖高中(县中)发展共同体2025-2026学年高三上学期10月联考技术试题(含答案)
- 2026年国网山东省电力公司高校毕业生提前批招聘(约450人)考试参考试题及答案解析
- 电动牵引车司机安全培训课件
- 2025年全国应急管理普法知识竞赛试题库及答案
- 2025秋季安徽合肥市建投集团招聘20人笔试备考题库及答案解析
- 创意笔筒产品设计与制作方案
- 人保新员工岗前考试试题及答案解析
- 2025公务员考试《常识》高分题库完美版附答案详解
- 装修直播培训课课件
评论
0/150
提交评论