智慧IT运维管理平台实施方案_第1页
智慧IT运维管理平台实施方案_第2页
智慧IT运维管理平台实施方案_第3页
智慧IT运维管理平台实施方案_第4页
智慧IT运维管理平台实施方案_第5页
已阅读5页,还剩477页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智慧IT运维管理平台实施方案2 5 6 6 7 7 7 7 8 8 8 9 32.2功能设计方案 2.2.1资产配置管理库(CMDB) 2.2.2集中监控管理(监控中心) 2.2.3操作审计管理(操作中心) 2.2.4运维服务流程(流程中心) 2.2.5运维统计分析(度量中心) 2.2.6运维管理门户 218 3.1.2变更管理 3.2组织管理(人员及组织架构,保障措施等) 3.2.1项目组织架构 3.2.2岗位职责 3.2.3项目人员组成 3.3.1实施部署计划 3.3.2进度控制方法 3.4资源需用计划 4 3.5.1项目沟通 3.5.2沟通方式 252 257 258 5(1)体系及制度建设协助用户建立公司信息化建设的运维管理体系,基于云南财政信(2)设备及网络监控快速响应和处置;(3)业务系统监控实现公司业务系统运维管理的主动化和体系化(4)标准化运维服务速定位、解决用户提交的问题;6(5)厅内信息化事务管理科技信息处人员编制偏少,需要通过实现部分日常服务工作(6)呼叫中心建设1.2对项目的解读与理解水平。树立面向业务服务的IT服务管理理念,实行集中统一的IT服务管理模式,由分散管理规范标准的IT服务管理流程,由职能管理向流程管理转变;应用先进、实用、高效的IT服务理转变。因此项目的核心需求包括:统资源监控平台,主动、及时地发现问题,解决被动服务的局面。通过统一事件处理平台,收集全部的监控和状态信息,建立集中的告警分析处理机制和故障预警机制,提供自动化的事件处理能力,当故障产生时,可以快速定位故障,很快发现问题根源并找到相应的解决方案,从而缩短故障解决时间,减少维护成本。另外,通过可灵活设置各事件的关联和互动关系,按照应用系统进行划分处理,建立“五位一体”的综合监控平台。利用IT系统集中监控管理平台综合监控管理系统全面主动反映信息系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,利用各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况、性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据;也为员工的绩效考核提供电子依据。通过IT系统集中监控管理平台展示系统对业务核心数据进行分析和实时监控,丰富、科学、美观的展示IT资源运行情况、性能状况、服务工单情况等,使领导、管理者、技术人员能迅速了解自己关心的问题。对于IT运行的故障处理过程中,能够通过直观的运行展现,进行快速指挥调度。参照ITIL规范,树立面向业务服务的IT服务理念,进一步理顺信息战信息中心内部各组关系,明确职责分工。梳理当前的服务目录和服务级别协议,规范提供服务的内容。建立集中的8服务台,统一管理IT服务资源。建立服务台、事件管理、问题管理、变更管理、配置管理等IT服务管理流程,初步实现面向流程的运维和服务管理模式,使运维人员具备更高的工作效率。根据对本项目的需求的理解,项目建设的主要问题、重点及难点主要包括:面向网络及数据中心的各类IT资源实现统一监控,以资源配置信息、监控指标信息、告警信息等相关运维管理信息的全面采集、整合、抽取,并按照特定规则进行格式和内容等方面的处理,并按照特定规则进行格式和内容方面的整合处理,以便形成统一的监控信息、预/告警信息、展示信息。在监控信息的展现方面,采用统一门户来规划展示的框架、风格及内容,通过灵活的可定制界面,实现各种监控和分析的需求,进一步提高监控工作的有效性和一致性;通过引入先进的技术分析手段,建立监控有效性分析评估机制,进一步保障应用系统安全、高效、持续、稳定的运行。在资源层面,将系统、网络、基础设施以及其他IT环境中存在的实体和虚拟资源进行统一、集中的管理,是实现统一运维的基础,在权限控制框架内,运维人员可以快速查询和调取资源的信息,能够快速实现事件、问题和变更的处理工作,极大的增加运维效率,并降低风险。该需求关键要解决配置库管理中所管理的配置项及其关联关系的信息完整性、及时性及正确性,以为运维管理相关工作提供可靠有效的信息依据。为了收集管理各配置项,真实地反映应用项目和IT资源的关联关系,首先要全面详细地9数据库系统、应用中间件、业务应用系统等IT资源和应用系统运维配置信息的采集、维护和和程度,从而将技术和业务有效的结合起来,转变传统的IT监控手段,不仅能及时发现故障,提供IT服务、对服务进行监督和改进、提升服务质量和水平。事件、问题、变更等管理流程的基础上,还需建立运维管理流程的建设除咨询设计外,还需要将设计好的流程落到实处,通过一个敏捷、可灵活定义的运维流程引擎进行运维流程的快速落地和电子化,是保障流程得以成功实施的重要手段。该需求要求运维工作流程可采用客户化定制方式,按照用户的实际工作需要,方便的进行定制生成。因此,运维管理平台需要提供一个专业流程引擎,能够根据管理需要定制出各类流程服务。同时,运维流程引擎还需提供业务目录管理功能,通过业务目录可设置各业务的默认责任人、责任组和关联的工作流程,在流程处理过程中通过业务目录的选择自动进行责任人、责任组和处理工作流的设置,最终实现业务和责任人绑定的目的。服务质量的把控是IT服务管理的目标之一,如何来衡量、监督并促进服务质量不断提升,是本次项目需要考虑的重要需求。该需求需要进一步理清运维服务工作的内容,明确服务时效性、服务方式、服务质量的服务标准。在本次业务服务管理系统建设中,将通过服务目录梳理省厅所提供的服务,并能够按照工作目标和需求规范这些服务(如服务的时效性、质量等),通过服务协议来约束和监督服务交付的质量,从而为规范服务行为、解决服务争议提供有效手段。主要表现为监督每项服务的执行情况,以保障每一服务都能够在规定时效内得到有效处理,进而提升客户满意度。如何对运维工作的好坏进行评估和分析,如何对事件、问题、变更等情况进行统计和趋势分析,如何从大量繁杂的数据中找到价值,从而找出当前IT环境中可能存在的隐患的需要改进之处,是管理层面重点关注的内容,也是IT服务管理平台需要实现的功能。该需要主要为解决目前运维信息的利用程度不高,信息价值挖掘应用不足的情况。通过简单易用的报表设计其,使用户采取所见即所得的方式即可建立或调整统计分析报表,满足运维分析和运维规划支撑要求。针对此需求,平台需支持灵活的报表定制功能,提供拖拽式的、所见即所得的、Excel风格的全中文、可视化报表设计器,能根据实际和用户要求自定义数据和参数,能对各类资源的运行状况、性能数据、故障维护数据等自动生成相应的周期性报表或定制报表,并能够结合系统权限管理将报告授权给不同的人,用户登录系统后只能查看自身权限范围内的统计报表。报表平台需灵活、易使用,采用类Excel的操作界面,简单易用,只需通过简单的鼠标拖放,便可利用精巧的数据绑定功能,完成报表模板制作,并支持HTML、PDF、EXCEL、WORD各种样式呈现。1.3.7统一的运维服务门户统一运维服务门户要求整合现有的运维服务资源,构建统一的人机交互界面,统一对外提供服务。我们知道,运维服务的最终目标是实现“以客户为中心”的优质服务。因此,需要建立统一的门户,以用统一的窗口向用户提供全方位、一体化的服务,进而提升客户体验。统一服务门户的建设关键在于运维服务的“可视化”方面:其一,需通过门户与用户保持良好的沟通交互,使服务更加便捷、透明;其二,需要通过统一服务门户来规范整合服务运作的各方面,使推出的服务在用户感受等方面具有一致性和统一性。用户也可根据需要定制个人页面,收藏或预订信息及报表,方便用户操作,提升用户体验。考虑到目前用户已存在部门运维管理系统,出于利旧和保护投资的原则,这些系统将继续使用,这就带来一个问题,运维人员如何才能够高效的在多个系统之间来回切换?本需求主要为解决目前运维工作人员需牢记各工作平台(运维相关工作)的入口,往返于多个平台处理工作任务的现状。IT服务管理平台通过整合、优化现有各运维相关平台的功能,使其成为个人运维工作的唯一平台。个人工作台是个人办公的“桌面”,平台提供所有工作的入口,通过个人工作台可完成所有待办事项,查看所有已办事项或权限范围内的运维相关工作。平台提供个人工作台定制功能,用户通过简单的拖拽即可根据需要定义个人桌面,并可预定、收藏个人关注的相关信息。1.3.9完善、严格的权限和认证管理IT服务平台的建设涉及多个部门、多类资源、多个系统,如何保障在整合人员、资源和系统的过程中,确保人员、资源和系统能够严格按照行政权限操作,加强资源和系统的安全性,需要有一套完善而严格的权限和认证机制。本需求主要为解决平台的统一用户管理、统一授权及统一认证,满足本次统一IT服务平台项目建设的统一要求。通过自然人、角色、权限和授权机制,确保每个用户登陆后只能在权限范围内进行查看和操作;通过域管理能够根据行政架构的划分,将人员、资源、流程等信息划分为多个管理域,既在省厅层面实现统一运维,又充分考虑各部门的差异化,实现个性的运维管理;通过完善而严格的用户权限管理,能够确保平台以及相关信息的安全性。IT服务管理平台的建设,除了需要贴合实际管理需要、功能完善等需求外,还剩下最后一个问题,现有运维系统的数据如何利用?未来平台如何扩展?是否有一个灵活、高效的接口体系来实现和其他系统的对接以及未来管理功能、管理范围和管理性能的扩展?一的IT服务管理平台。2.1总体设计方案BroadviewIT运维管理平台在产品设计时遵守以下总体设计技术路线:◆产品具有清晰的层次化和模块化结构,平台采用了分层、模块化的设计技术,模块与模块、层与层之间松散耦合,保证产品自身管理和维护的便利性,任何一个模块的维护和更新以及新模块的追加都不影响其它模块。◆产品具有良好的扩展性和伸缩性,同时可对外开放二次开发接口,可适应实际业务系统的不断调整和优化。◆产品具有良好的开放性,通过系统完善的接口体系与良好的扩展框架,能融合第三方的产品,并可针对用户提供定制化开发。◆产品提供高并发、大数据等高效的数据处理功能,用户界面展示流畅,并且Ajax、FLEX、HTML5等先进技术,提升客户使用体验。◆产品具有高可用性,高冗余功能,能够通过系统集群方式保障系统健康稳定运行。◆产品满足多浏览器的适应性要求,满足IE9、IE10、谷歌两大内核的各版本浏览器下正常使用的要求。◆产品支持虚拟化环境部署,只要配置相同,则可获得相同的技术性能。◆产品布署时不会对其它在线系统的运行造成影响,且监控功能的自身故障不能影响在◆在实现全部功能的基础上,产品能提供7×24小时的高效稳定运行,确保至少3个月以上无需进行较大规模维护和重启,每年故障次数不超过3次,每次故障修复时间不超过4小时。为用户的信息化建设提供长期的支撑,保证用户IT运维管理的不断发展需要。平台可以总结为:“一库四中心”,形成“以CMDB为核心,‘监、管、控’一体化运维管理”。罹确带立运维管理门户罹确带立运维管理门户流程中心(运维管理流程)监控中心(集中监控管理)统事件平台性能指标库统性邸管理IT基础环境知识库服务目录变史江理问阳管理服务清求江理事件江理服分台次产生命周期项目霄理资源分折性能分析告整分析运维管理规范与制度短信下台邮什素度量中心(运维统计分折)资产配置管理库(CMDB)朱成操作中心曼作审计仟笑计划配置建模配H应用附图1.系统架构图□集控中心(集中监控管理)类专业监控工具实现IT资源的监控,同时提供集中的监控告警管理及统一监控可视化展示。□操作中心(操作审计管理)口资源配置管理库(CMDB)□流程中心(服务流程管理)程,围绕服务台建立事件管理、问题管理、□度量中心(运维统计分析)口运维管理门户2.2功能设计方案2.2.1资产配置管理库(CMDB)配置管理涵盖所有的IT资源,包括各种软件、硬件资产内最强大、最好用的CMDB管理软件,管理平台本质上是以CMDB为核心的融合架构,这也是国内大多数运维软件厂商的功能薄弱环节配置管理库是衔接技术与管理的关键数据整合层。配置管理库模型库、中间件、应用软件及银行业务系统等软制解调器、安全网关、无线AP等;息防护系统、加密机等;■其他设备,包括:办公设备等;配置库业务建模CMDB提供动态的、面向对象的配置模型构建功能,并内置了遵循通用标准DMTF的数据模型最佳实践,对国内运维管理思路有极强的适应性,在电信、金融、证券、能源、政府、平安城市等领域有广泛的应用。系统提供动态的配置模型构建,基于面向对象技术,实现资产配置模型的灵活构建,能够根据用户的实际环境,构建贴合实际管理需要的配置管理模型,满足用户的实际管理需求。配置库建模包括配置类型建模、配置关系建模、字典目录管理和配置表单管理四个部分,对于构建完成的配置模型,支持导出和导入管理,方便配置模型的保存和恢复。配置项建模,功能上完全符合招标文件要求:◆支持配置项类型的灵活添加、修改和删除。◆配置项属性可灵活添加、修改和删除。◆配置项属性支持整型、日期、字符串、富文本、附件、用户、数据字典、配置对象等常用数据类型。◆内置配置项模型易于理解、易于使用、维护和扩展。◆配置项间存在继承关系,子类自动继承父类的属性。◆内置配置项常用关系,同时可以增加关系类型。◆关联关系具有方向性。◆配置项的标识符和名称可根据表达式规则自动生成。◆配置项模型支持导出和导入。配置项是配置管理数据的基础组成部分,他们是整个IT环境的基本组成元素,是IT运维管理最基础也是最核心的数据。CMDB提供面向对象的配置类管理,可以通过WEB界面直接进行配置项及其类型的动态建模,包括配置项的继承关系,维护类的属性,定义属性的参数,设置查询条件。同时,提供了良好的扩展性,必要时可按需调整缺省的类库,如根据基类或父类进行派生,或独立构建新的配置项类。13个6芽温名平限方之厘期现夏三82为了保证配置信息的收集尽可能全面,配置项属性定义支持多种常见的数据类型,如短/长文本、整型、图片、字典、浮点型、带格式文本、引用、附件、用户、口令等,可以满足不同配置项属性信息的管理需求.WTer8下T6系统还支持配置项属性进行默认值设定和校验设定,在用户对配置项信息进行编辑或者手工录入时,系统将自动检查相关信息是否符合校验规范,对不符合规范的信息将自动提醒。匠堆一算化平台M0三匠堆一算化平台K*日三平三平0罩i附图5.数据校验对于部分需要计算的配置属性,系统还提供了建模表达式,配置项的标识符和名称可根据表达式规则自动生成,方便管理。同时为了方便管理,增加可视性,系统还支持对配置项图标进行定义,用户可以根据配置项所代表的物理实体或者管理习惯,来定义每个配置项的图标,使配置项一眼看去即可知道是什么类型的配置项。运维运维一体化平台urF油留L中-整言家计理此外,为了方便用户管理,减少配置管理数据库的建设周期,系统还内置了符合云环境、面向用户项目管理的配置管理模型,该模型在我公司长期ITSM和配置管理项目的基础上,结合当前云计算、虚拟化和大集中的技术趋势,充分考虑用户实际的管理环境和管理需求,有助于本次项目的建设和落地,有助于用户人员的快速理解和使用,同时还具备良好的扩展特性,支持快速扩展建模。运雄一体化平台短可工出注展河232171m向斯五D12047”口响13期三情(1210I随形口:28:“2-□网明121.口ism配置关系是配置管理的核心其描述了配置项之间的相互关联关系,包括物理和逻辑关系,如果说配置项是IT环境的基本组成元素,那么配置关系则将这些元素链接起来,配置项和配置关系结合,能够完整的、真实的描述一个IT环境,将复杂、异构的IT环境按照不同纬度展现在运维人员面前。系统同样也支持配置关系的动态建模,一种关系可以属于多类配置项,同类配置项也可以并将配置关系也作为配置项的一种进行管理,支持配置关系的可视化编辑。运堆一簿化平台运堆一簿化平台N关系模型建立后,便于用户通过相应关系展开追踪,如通过某个业务系统找到相应的应用软件和计算机设备,进而定位其数据库和前置负载均衡器的配置信息。CMDB内置的关系本着易用、好用,化繁为简的原则,内置了基本配置关系类型,满足大多数IT基础架构的关联描述,同时,也可以如下图在基本配置关系类型基础上又扩展监控等新的配置关系。新建关系模式关系类型:源配置项类型:默认关系名称:目标配置项类型:组成具有虚拟化上联下联交互关联部署使用依赖CMDB模型预置了各类配置项的录入表单和展现表单等帮助用户提高管理效率。定义符合实际管理需要的配置录入和展现表单,在未定义时可自动使用父类的表单。EH四然办-71E通过表单设计功能,用户可以针对每一类资源分别进行录入和展现表单的设计,能够将定义好的配置属性灵活拖拽到表单上进行布局,包括列表、分页、分组折叠等布局组件,以实配置表单不仅在管理需要上满足实际要求,在管理习惯上也能够符合用户特点。此外,系统还支持配置项和运维流程、其他配置项以及历史版本进行关联,用户可以直接在表单上查看上述信息。运维一饰化平台二关6:下顺供207u涂计私要附图11.配置项关系、版本信息和关联工单配置项表单设计的功能,包括:◆支持拖拽的方式进行配置项编辑和展现表单的设计。◆支持每类配置项可分别定义展现和编辑表单,在未定义时可自动使用父类的表单。◆表单设计支持灵活的布局,提供列表、分页、分组折叠等布局组件。◆提供手动录入配置项功能,支持配置项的复制功能。◆可以在配置项表单有相应的拖拽设计,可以设计查看相关流程,关联的其他配置项。配置项维护管理是保证配置数据真实、准确,确保配置数据能够为其他管理系统技工数据支撑并产生管理价值的保障手段。系统提供浏览直观、操作简便的配置维护管理界面,运维人员能够直接在图形化界面上对配置信息进行添加、修改等操作,对配置信息的全生命周期进行管理和跟踪,如在配置信息证实入库前需要进行审核只有通过审核的信息才可以证实入库对于配置变更进行跟踪和记录,每一次变更信息都将形成一个新的版本进行保存任何对于配置项的变更都会进行审计和比对,以保证配置数据的正确性。配置项维护管理主要包括配置项的智能提示、浏览查询、权限管理、信息质量管理、历史跟踪管理、导入导出管理等。我方CMDB提供了配置自动发现工具,能够自动完成数据的采集,完成CMDB的快速建设。自动发现的原理是采用各类IT基础架构支持典型特性进行区分,使用的协议包括SNMP、配置发现配置发现配置发现引擎配置发现计算机配置发现脚本IT基础架构服务器Cisco.配置导出附图12.配置项自动发现工具系统可配置策略进行发现,用户不需要为被监测的服务器安装额外的AGENT软件,也不需要对网络设备进行流量镜像配置。在用户提供IT基础架构帐户信息的情况下,可发现详细Wt附图13.配置项自动发现过程产品基于强引擎、弱脚本的设计理念开发,基于本身提供的各种发现协议与引擎支持,用户也可随时编写发现包与发现脚本,扩充发现能力,便于满足不断更新换代的IT基础环境发现要求。系统同时支持协议参数的配置维护,支持基于新的协议进行配置项的自动发现。6是否发现配置项类型发现协议参数☑网络设备☑区数据库区中间件附图14.配置项自动发现过程系统支持将自动发现工具发现的配置项支持导出到CMDB中,完成CMDB数据采集。④共[68]个配置质,已处理[161个,处理武明□1□234□56□78□9附图15.配置项通过自动发现模块导入数据到CMDB为了方便使用和维护,系统支持配置项信息的EXECL格式导入和导出功能,可以根据管理需要,选定所需的配置项进行导出;同时也可以将编辑好的EXECL文件直接导入到系统中,实现配置信息的批量导入。运维一体化平台C.Rinm:预715B二47审然户u选≌易1圆warerray+中平合广附图16.配置项信息的导入导出同时,针对配置项查询结果和统计报表,系统同样支持Excel、Word、PDF、Image等格式文件的导出。A3精美属T习时附图17.报表导出配置项关系和影响分析系统基于配置管理的关系管理,依靠资源关系定位,可以自动快速地确定、分析并展示信息事件、变更对业务或资源的影响范围和程度,从而将技术和业务有效的结合起来,转变传统的IT监控手段,不仅能及时发现故障,更能够快速分析故障的影响范围和程度,从而保障重要业务稳定运行。当故障产生时,点击即可展现该故障业务分析界面,通过图形化界面直观展现该故障影响的配置和业务系统,实现业务影响模拟分析。如型”基金销体门户”当前量如型”基金销体门户”当前量示为不可用,并品现严重告发现HTTP支付前端发生了严重故障re片a481懈偏22解302社附图18.影响模拟分析系统能够根据故障源、故障源和配置项的关系以及当前配置项状态等因素,展现发生故障的配置项的健康状态;支持通过颜色变化、箭头来表示受影响的资源以及影响关系。影响分析的核心是资源关系模型,即将业务和配置管理形成关联,在建立业务依赖模型时,调用配置项信息,直观展现各配置项之间关联关系,引用配置管理中各配置项关系,为业务影响分析算法提供依据。此外,配置项影响分析还具有:◆自动生成并布局提供配置项关系的可视化浏览和编辑界面。◆可以以指定的配置项为中心逐层查看。◆进行可视化浏览时,可以设定浏览的层次和关联关系过滤条件。◆点击关系图中的配置项,可以快速预览配置项信息。◆支持配置项关系的可视化编辑,通过拖放配置项和连线的方式建立配置项关系。够自动跟踪、记录、更新,产生该配置的新版本信息,并将原始版本的配置信息,系统还支持版本之间的对比功能,帮助运维◆支持配置项归档功能,可审计每个配置项的归档版本历史。◆可对每次变更的属性信息进行完整记录。◆可以对指定的2个版本进行比对,了解每个版本的变化信息。网附图19.版本比较这逗奥以aroedvicwCDS5集中心行管理平台三;第:4-1-21tQNGTExmM:o,即人:种?月14,2014果附图20.变更历史CMDB提供了集编辑和展现为一体的WEB化的CI浏览器,全面直观地查看配置项关系,通过在视图上利用关系类型、显示层次、切换布局、快速钻取等实用功能来帮助构图和定位,完成配置项变更分析、业务影响视图分析等功能。为了方便查看,系统提供基于类型继承关系树导航的方式来组织和管理数据,允许用户从不同管理视角来组织数据,为维护人员建立配置浏览和维护树状导航;也可以按照日常管理习惯进行配置管理导航设置,并可按权限提供配置的查看、添加、修改、删除、查询、导出等操作,分担配置项维护职责,从而实现配置管理的协作,例如:既可以按设备类型分类来展现,也可按照设备地理位置来分区展现。建制艳态养II2245C二C此严流和响++6aa0aadmrI停料Ra:冷砖0冲5积K冲5积i健W系统将权限分为功能权限和资源权限,实现对配置项更加细颗粒度的管控:◆导航节点可进行授权,没有权限的用户无法查看相应的导航节点。◆对于不同的权限查看配置项的页面也可不相同。◆可以按配置项类型进行授权。口资源权限系统资源权限是指对具体哪些资源进行管理。资产库图□磁带库图□网络连接存储NAS田□网盘图□计算机设备图□操作系统田□数据库图□中间件图□负载均衡白□服务器□创健□查看□修改□砌除□审核□创健□查看□修改□刑除□审核□创健□查看□修改□除□审核□创健□查看□修改□味□审核□仓健□查香□修改□余□审核创健□查看□修改□除□审核创健□查看□修改□除□审核创健□查看□修改□除□审核□创建□查看□修改□□审核□创健□查看□修改□除□审核□仓腱□查吞□修改□砌□审核□功能权限R配项导航附图23.资源功能权限系统支持和流程进行关联,一方面可以直接从配置项发起相关流程工单,如事工单、有哪些变更等。具体来说,功能包括:◆在进行配置项管理时可直接创建工单流程,工单流程自动与配置项建立关系。◆在修改配置项时可直接创建变更工单流程,发起变更审核流程。◆浏览配置项时可查看到与其关联的所有工单流程信息。运维一漳化平白光产阳盟公辽Y注.P5地正:131”为严附图24.配置项发起工单配置项关系1VM-RDC.PROJDATACENTER_2事件工单incident附图25.配置项与工单关联2.2.2集中监控管理(监控中心)系统主要通过SNMP(V1、V2/V2C、V3)、ICMP、NetBIOS、ARP、Traceroute、能够实现对网络、安全设备的基本状态信息、实◆提供跨厂商、跨类型的设备管理机制,包括路由器、交换机、防火墙、负载均衡等网络设备;◆从各类可管理设备中收集安全事件、警告,差错和日志并将各类含义相同的信息统一标准入库,可以直接发送到其他功能模块中;指指严垂世(arty)澳息竹在化处本:代连间(agentTine)方法◆能够自动识别和展示各网络设备背板图,反映设备类型、端口使用状况和下联节点信最后女生时间5B异霓,目标工CM不闻达(在5000二内》。☑端口性宅发业异富,旗口(3速率场出出天道。荡口12tit1tert2下然发现未登记的设备s-5C(12168.0126/000C290发段来置记的责备12,160.0.125(12未登记设务.发现未登记的食备380A3A-234(122168.0.132/未警记设备.次tQ未登记的长备42318791851012(未童记设备.发现未登记的备02(190.次现未量记的食备rUM(192.168.0185/00厂298列表◆支持SNMP/TELNET等方式获取网络设备配置信息,支持手动和自动上传恢复;◆支持设备配置管理备份策略,可自定义每月、每周、每天等人工备份,并支持备份文件的查询,删除,对比;降选E道百+刘itat大/.…『置l土附图28.配置备份管理◆能够生成监控统计报告,提供每小时、每天、每月以及自定义时间段内的设备性能趋势图;录附图29.告警统计报表◆提供Ping、Tracert、Telnet、MibENMF擅口181附图30.内置MIB浏览器目标地址:1执行HetBIOSRemoteHachineNaneTaMACAddress=00-1A-4D-63-95附图31.内置NBTSTAT命令发送时间所用时间(ms)发送包数收到包数丢包宰()101工附图32.内置PING命令发起IP目标IP0执行需要参数需要参数值超时时间值超时时间5请求包大小确定附图33.RemotePing目标IP:取消目标地址:.en执行关闭◆系统支持网络设备巡检功能。协议的设备,支持广泛的网络设备厂商及类型,包括对Cisco、Huawei、Juniper、H3C、F5BIG-IP、Netscreen、SonicWALL、HDS、NetApp、北电、中兴、博达、迈普、神州数码、墙、ArrayNetworks等厂系统可自动发现以下信息:◆第二层、第三层网络设备;◆网络协议,包括:TCP/IP、Ethernet、FDDI、ATM、帧中继、令牌环等;◆设备状态信息(如:板卡、端口、接口、IP、MAC);◆设备之间的物理和逻辑关系;◆设备连接信息(如:电缆、中继、网络连接和VLAN)附图36.网络拓扑网络拓扑监控能够自动发现网络设备间的拓扑连接展现设备节点和链路的实时运行信息,四±建n附图37.物理拓扑物理拓扑图支持手工添加、删除自定义链路和设备,支持全屏展示、支持鹰眼定位,还可以对网络进行展开和收缩、自动布局、打印、导出图片等,帮助管理人员快速管理。附图38.拓扑图编辑同时,系统还支持拓扑自定义功能,用户能够根据需要定制子网络,能够为单个子网制定拓扑图,也可以根据行政管理划分定制不同的子网拓扑,方便管理。系统支持使用ctrl键或者框选同时选中多个设备,可仅对选中的设备进行分组拓扑构建。网络拓扑图生成后,管理人员可以直接在拓扑上查看设备和链路详细信息,鼠标悬停在需要查看的设备上,即可查看设备的详细信息,包括设备名、设备型号、IP地址、CPU利用率、网络接口连接,链路的速率、丢包率、错包率情况等;支持颜色变化表示设备不同的运行状态,支持线路粗细表示带宽的不同,帮助管理人员快速了解网络运行情况。仑络改仑络改柔i71M附图41.设备信息查看此外,系统还支持对设备的自定义描述,并能根据IP或者mac地址等对设备进行搜索。在日常管理中,机房中设备的物理位置监控往往与网络拓扑脱节。针对这一问题,综合监控管理平台将机柜物理位置的监控与网络拓扑图进行整合,当鼠标悬浮在图标上,显示当前机房物理位置信息,可以在监控报警后辅助管理员在第一时间知道机器或设备的物理位置,方便处理。资源类型基本信息责任人所在位置设备名称性能信息内存负荷-内存使用率15.0毫秒状态信息打开端口速率趋势页面附图42.位置显示系统支持对主流厂商全系列网络设备的背板图,实现设备的真实面板管理,并可直接在背板图上查看各模块和端口的工作状态,并能够进行相关操作和管理,例如端口的开启及关闭操作,对与暂不支持的设备,也可以很方便的通过定制来实现真实面板管理。附图43.设备真实面板除此之外还可支持如下功能:◆能准确和完整的自动拓扑出整个网络结构,包括路由、交换、防火墙和主机系统之间的物理连接链路;能够进行IP层的子网发现,展现路由、交换、服务器、主机和子网的逻辑关系;网络扩容时应具备快速扩展发现功能;◆支持拓扑视图中查看设备实时信息,提供设备名称、设备IP、设备端口数、CPU、内存等设备信息显示,支持设备告警状态显示,包括设备间的连接带宽和实时流量等;◆支持多种形式的拓扑展示,提供物理拓扑、网络拓扑和自定义拓扑等拓扑图;拓扑视图能够与监控管理功能模块关联同步,并能支持通过多种颜色来区分设备、线路运行状态和性能负载,并提供颜色区间定义;◆拓扑视图与配置管理和设备管理、监控功能关联,可在拓扑视图中点击打开对应设备的详细监控页面,可以直接看到该设备的性能状态、可用性状态以及配置变更项和问题事件等;◆支持多级管理功能,能实现不同拓扑、告警事件、网络性能等数据信息的多级传递与呈现;◆支持拓扑图中网络设备的搜索,提供MAC地址和IP地址定位,通过MAC地址或者IP地址找到计算机连接的网络交换机的端口;.3网络性能监控系统主要通过SNMP(V1、V2/N2C、V3)、ICMP、NetBIOS、ARP、Traceroute、◆支持对现市场上主流以及常见厂商设备的监控,至少包括路由器、二层交换机、三层◆支持简单网络管理协议SNMPv1、v2、v3轮询监控;支持ICMP、TELNET和TRACEROUTE协议;支持SYSLOG方式监控设备日志;◆具备可用性监控管理功能,支持网络设备、网络接口、网络链路可用性状态监控,提供可用性统计分析报表;◆支持网络设备的配置变更管理,当设备硬件模块发生变化或配置文件发生变化时,将产生告警信息,并支持设置基线和分组;◆支持设备实时分析功能,图形化展现当前网络设备运行指标和参数信息;可以实时监控网络接口的总流量、出入流量,出入包流量、总广播包、实实时rce时郎雲:30分钟时s小时6小时1.2小时15分钟0分辞1小时附图44.网络实时性能监控间深度:95明网络设备可监控项包含但不限于下所列指标,支持图形界面的动态展示。监测项网络设备监测网络链路监测等网络协议监测◆包括STP、VTP、OSPF、BGP协议。.4网络故障监控BaedvewCD5集中起行平台正a四4m里R6配保3们通青,7r需明G田以的r的.0.ut4vllle.tu.1主机设备监控管理.1.1服务硬件监控器的监控通过IPMI协议实现,IPMI是智能型平台管理接口(IntelligentPl而且更为重要的是IPMI是一个开放的免穿M2名移小小小小都原大☑附图46.服务器温度监控.1.2服务器操作系统监控系统支持实现对MicrosoftWindows2003、MicrosoftWindows2008等win作系统,SunSolaris、IBMAIX、本Linux操作系统的监控。系统采用snmp协议、CLI(Telnet/SSH/WMI等)或安装agent的方式对被管对象进行监控,监控的内容包括:◆磁盘监控:◆内存监控:

监控可用SWAP容量,空间使用百分比;◆网卡监控:

监控网络接口IP地址、接口状态,传输率;◆进程监控:

监控进程CPU时间,CPU使用率,内存百分比,占用内存Heap大小,占用虚拟内存大小;

进程名,进程ID,进程用户ID,Nice值,父进程ID,进程指令行,开始时间,开始客户端名;

进程读/写字符数,进程规模监控,占用堆栈大小,等待CPU时间,等待锁时间;

监控处于不存在、活动、正在运行、停止、睡眠、等待状态的进程等。处理器监控:

每分钟CPU平均繁忙百分比,IdleCPU百分比;

CPU状态包括CPUID、Online、Offline状态◆用户监控:用户状态监控:监控登录名,Idle时间。◆日志监控:日志监控:监控系统日志,过滤其中关键错误信息,并告警。◆主机重要文件监测:监测主机系统中指定的文件大小。等。◆系统服务监测:监测主机系统中指定服务的运行状态◆主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、终端名称单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。Mtt间不E:5办都去附图47.HP-UX监控视图◆主机基本信息采集:主机的基本信息,包括:CPU数目、机器型号、系统名称、系统版本、IP地址、内存大小、总线程数目、磁盘名称等。◆磁盘监控:

监控文件系统占用磁盘空间大小,文件系统剩余空间,剩余空间百分比;

监控磁盘分区信息,分区映射等。内存监控:每秒;◆网卡监控:

监控网络接口IP地址、接口状态、DNS名、系统名,监控IPv4/IPv6地址,以及IPv6地址链接本地地址;

监控每分钟平均发送,接收包率,平均错误率,平均冲突率等,网段监控:监控一个网段上的数据利用率和传输状态3、监控使用IP协议的数据流量和碎片统计信息,控一个TCP/IP连接上的字节和信息包的发送◆进程监控:

监控进程CPU时间,CPU使用率,内存百分比等;

监控特定进程信息,如进程运行的总时间,线程数量,该进程对实际或者虚拟内存的使用情况等;

进程读/写字符数,进程规模监控,占用堆栈大小,等待CPU时间,等待锁时间;

监控处于不存在、活动、正在运行、停止、睡眠、等待状态的进程等。处理器监控

每分钟监控处理器的I/O状态。包括I/O读写每秒;◆日志监控:

监控写入应用日志,DNS服务器日志,安全日志和系统日志的信息,过滤其中关键字段并告警;

监控当前日志空间使用率,最大日志空间,老旧日志删除时间等。◆主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、终端名称◆主机端口速率监测:监测主机系统中指定端口的入速率、出◆主机重要文件监测:监测主机系统中指定的文件大小。童务直中心I里aZ童务直中心:出山:出山二救*I二二G超n本+阳drt阳drt1五l3R55时间89海◎NWa9中!H内勿座扫i%4*课元勇…用它N³910.2数据库监控管理件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数针对数据库,能实现包括但不限于以下功能:◆支持对Oracle9i/10g/11g等版本;◆监控当前ServerParameter参数内容,如SGA、PGA、Processe、Sessions等关键指标;◆基础监测:表空间使用率、连接会话数;◆高级队列监测:ready消息数、错误的消息数、消息平均访问时间、消息总数;可用空间、归档目的地可用空间百分比、归档档模式、例程名、并行状态、位长、DB版本、DB名称、主机名、实例状态;◆检查点监测:发生检查点数、完成检查点数;空间使用信息,超过阈值后进行预警;◆全表扫描配置:RSRATIO值、LTSCANRATIO值;◆资源锁定监测:监控锁信息,锁定时长;相关的数据文件,UNDO表空间空间使用信息,超过阀值后进行预警;◆碎片监测:FSFI值;◆监控用户状态:监控单个用户的安全状况,连接时间、数据流量;◆监控当前活动进程信息,当前会话列表信息,每一会话的I/O流量,监控跟踪文件及ALERT文件错误信息;◆进程资源消耗监测:可用PGA百分比、可用PGA、已分配PGA、已使用PGA;◆命中率监测:共享区字典缓存区命中率、多次解析(重装)的条目调用数、递归-用户调用比率、递归调用速率;◆Rman备份监测:增量备份大小、全备份大小;◆回滚段:大小命中率、等待率、等待次数、活动事务数、翻转次数、扩展次数、一致更改率、收缩次数、用户回滚率;提交次数、占用游标数、扫描次数;◆转存空间监测:转储空间使用率;◆表空间监测:未使用Extent数量读时间、最大Extent数量、已使用率、已使用量、未表空间类型、当前Extent数量、下一个Extent大小;进行设置)的表进行监控;◆撤销空间监测状态监测:快照太旧错误计数、无空间计数;位务立德中心始TTi螺EPLxPw值2站8大.71NFHu课相×零Nrsnm18%N320◆位8J:1H白9*1T1梁男之肿例中5*wE1时回热!亡期面it!0WA11iw彬8m"27◆支持对SQLServer2000/2005/2008/2012等版本;◆基本信息阻塞进程数、处理器名称、Windows版本、处理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间;◆缓冲区监控:缓存区管理统计,缓存明细;◆锁的监控:闭锁明细、连接统计、锁明细;◆文件监测:路径、增长方式、容量、文件组、数据库、大小;最近1小时会适最近24小时量近1小时您正查看:资源监测>数据库>MSSQL>数据库MSSQL_MsS正常运行时间天●停机时间秒最后监测时间响应时间16毫秒处理器数目8主机名数据库数目会话数目启动时间阻壅进程数敷据库大小(MB)数据大小(MMB)索引大小(MB)未使用大小(MB)未分配大小(MB)保留大小(MB)会话ID状态用户主机程序内存(KB)(KB)CPU时间(ms)(ms)◆基础监测:数据库名称、版本、数据库状态;◆负载监测:缓存查询数;◆数据库大小监测:数据库大小;◆数据库的会话情况,连接数。系统支持监测IBMDB28.x/9.x等版本的可用性、连接时间、活动代理数、数据库状态、◆基础监测:最后一次备份时间、数据库状态、数据库激活时间、当前连接数、连接总次数;◆缓冲池信息监测:各缓冲读写次数、命中率;◆锁监测:死锁数、锁等待率、锁升级率;◆排序信息监测:应用排序数、排序溢出百分比;使用率、预取大小、扩展数据块大小;BrocdvswBrocdvswCD55集中运行营理平台夏中限8热左聘现b一r2.2时间名◆基础监测:回滚数、死锁数、写缓存命中率、读缓存命中率、数据库连接数;◆检查点监测:检查点速率、检查点等待速率;◆DbSpace监测:数据空间使用率;◆磁盘读写监测:页写速率、页读速率、物理磁盘写速率、物理磁盘读速率◆锁监测:锁请求速率、锁超时率、锁等待率、死锁率;◆日志读写监测:物理日志页面写速率、物理日志写速率、逻辑日志页面写速率、逻辑◆共享内存监测:块写速率、缓冲区写命中率、缓冲刷新◆排序监测:内存排序速率、磁盘排序速率;实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP、IIS、.net等常见通用服务态和参数深入分析服务响应速度变化的技术原因和规律从根本上解决服务响应性能的问题:◆支持对常见的WEB应用、邮件服务、DNS、FTP等应用服务运行情况的监控;据处理量、运行时间、作业数等;◆HTTP监测:监测服务状态、校验页面内容;求数;◆HTTPS监测:监测服务状态、校验页面内容;◆POP3监测:监测服务运行状态、◆SMTP监测:监测服务运行状态、响应时间等;◆DNS监测:监测服务运行状态、域名解析成功与否等;+z>1xMXCse2款-28#7幽远曲*3Ccan211K-·0P他族-2100”:-·AG18A821602:252-厘4附图52.标准邮件服务详细监控视图Broedwew005S黑中芯行然恐平白可非K7.愁一rT419218822T7-R-世NK⁷70851921600,252上e9e0,KK*附图53.DNS服务详细监控视图BoacvicwCO55第丰运行篮羽平台D22abtrT11rr网·附图54.FTP服务详细监控视图产品还支持对Websphere.WebLogic、MQSeries、Tomcat、Tuxedo、Resin、TongWeb、◆支持对Tomcat、WebLogic、Websphere、Resin、MQ等主流中间件的监控和分析。◆支持监测Websphere6/7等版本的可用性、事务明细、活动时间、服务响应时间、◆系统支持监测消息中间件MQ的队列管理器(名称、状态等)、队列名、队列路径、队列深度、队列长度、队列类型、队列状态、通道(名其中具体的监测项包括:◆系统信息采集:监测中间件基本信息,包括:操作系统、操作系统版本、当前可用堆情况、Error等级等。◆JDBC链接池监测:监测指定JDBC连接池资源连接情况。◆线程池监测:监测指定线程类的线程平均数、空闲线程平均数以及线程吞吐量。◆EJB监测:监测指定EJB激活次数、钝化次数、缓存个数、事务提交次数、事务回滚◆WEB应用监测:监测指定Web应用中Session的当前个数、最大值以及累积个数。◆JMS队列深度监测:监测中间件中JMS消息队列活动情况。◆MQ通道情况监测:监测MQ的通道情况,包括:每秒接收字节、每秒发送字节、通◆MQ队列深度监测:监测MQ服务的消息队列的队列深度。◆TongWeb数据连接池监控:监测国产中塔正老考:>流源8s>9地性5Bck>塔正老考:>流源8s>9地性5Bck>CG保保解有个个)科的H读511a监的误妙5务比应理程油识导砂GHr⁹比洲蜜e14wesennoinerteiee_rar_ent0w画用m十)0806网附图55.Weblogic监控蛙融三段P.2杂..4口ssLo信4信4仁ee.44穿福都◎r附图56.Websphere监控系统能够对主流虚拟机(如:VMware、Citrix、Hyper-V等)的运行状态进行监控,监测虚拟主机以及每个虚拟机是否运行正常(即是否死机),管理人员能够根据具体的虚拟主机及主机下每个虚拟机情况,设置相应的监测频率和监测周期,自动对虚拟主机及主机下每个虚拟机是否正常运行的状态进行监测,并将检测结果保存至监控管理数据库。系统广泛支持国内外主流厂家的虚拟机,能够对这些虚拟机进行集中监控管理,实时展现虚拟主机和虚拟主机下各虚拟机的运行性能,帮助管理人员了解和评估虚拟机当前运行状态。系统支持定义监控策略设置,能够针对不同的虚拟主机以及主机下各虚拟机灵活设置或调整监控频率、周期、方式和监控指标等。针对虚拟机系统,系统能够实现以下方面的深度监测:◆基本信息采集:虚拟机的操作系统类型、虚拟机的总体状态、vCenter中的物理机、虚拟机、Cluster、Datastore等物理/逻辑对象、虚拟机的电源状态、虚拟机的配置文件路径、虚拟机名称、主机的基本信息或状态等;◆虚拟机CPU监测:虚拟机可使用的CPU数量、虚拟机的CPU频率、虚拟机的CPU使用率;◆集群信息采集:通过vCenter/SystemCenter等获取虚拟机和虚拟化集群的基本配置信息;◆虚拟机关系发现:在操作系统上安装虚拟化管理工具的基础上,自动发现虚拟机和操作系统、虚拟机和集群之间的配置关系;◆虚拟机内存监测:虚拟机的内存使用率、虚拟机可已使用的内存量;◆虚拟机磁盘监测:存储置备大小、已分配使用率、未共享大小、已分配大小、虚拟机名称;71wnr0soWwywnEem:5WwMW里温水952*9数Kml路1钱找41●2m62床220021FEDLE来-附图57.虚拟机监控一览ErosdviewErosdviewC0康中运行管理平台书黑蒸*?+附图58.虚拟机配置信息监控实现对主流存储设备(磁盘阵列、磁带库)的监控,例如:EMC、源状态、控制器状态(包括控制器IP地址);监控存储器的磁盘,包括磁盘驱动器状态、物理下去中出当酷需9所南作务,果中可以而出下去中出当酷需9所南作务,果中可以而出E的当菌运竹该态。击可以们添器A方式数设置监熟方式想口会洗应不决饮左忙息配%沿灵执计物☑具思ET作正常豆8棵势运行正幸于斋生8工作正常于青四强1彩会男P附图59.存储监控界面存储监控的方式主要有以下几种:◆CLI方式:命令行接口(CommandLineInterface,简称CLI)方式是指通过Telnet/SSH等协议访问远程设备或者调用本◆SNMP方式:由被管理设备/软件提供SnmpAgenAgent会根据请求的信息标号(OID)返回请求数据项的内容。业务应用监控应用服务监控,对各个应用系统的服务进行监视,可以实时查看服务运行的状态,对较为重要的服务进行重点监控,当出现异常时能够帮助管理员定位异常出现的位置和可能的原因;并且管理员可以控制各个应用服务的启动和停止。对公司现有的业务系统开发接口,支持各业务系统根据自身的监控需要反馈异常信息,并统一设定异常预警信息的格式,由业务系统监控管理模块将异常信息分类推送到异常告警平台,通过网页、邮件、短信等多种形式通知相关运维人员。应用性能监控(APM)APM采用最新流行的NOSQL架构,如图1所示。通过协议分析、指标运算和阈值处理三大引擎的处理,实时生成业务系统各环节的吞吐量、平均响应时间、并发用户数、错误数等业务指标,计算应用性能指数,形成指标库。在上层展现上,通过业务运行视图、业务交易视图、最终用户体验等多种方式,全方位可视化展现业务系统性能。协议分析引擎wervicesORACLEDB2.统计报表指标运算引擎阈值处理引擎数据存储层.1WEB应用终端用户体验用户使用WEB应用都是一种自助行为,不断优化设计最终用户体验,是互联网应用一个永恒的主题。APM能够为该类优化提供依据。平均响应时间是衡量最终用户体验的重要指标之一,APM以此为依据形成应用性能指数。通常来说,吞吐量和平均响应时间往往存在正相关,系统以分钟频次自动跟踪记录应用系统访问量、平均响应时间及应用性能指数。同样,系统也实时跟踪关键交易的访问情况。你能够即时监测“下单”的平均响应时间、访问次数、成功率。系统采用先进的时间轴拖拉技术,可以快速对一个月数据进行回放。业界化长第世.1.2浏览器体验跟踪随着智能手机、平板的大力发展,现在通过移动互联网访问的用户越来越多。APM可以ccos12015年6月5日业务仪表吸业务交品真四4.1.3页面体验跟踪2015年6月3日2015年6月3日量战用户体验管理配量24小时平均响应时间分布圈hin2抵819#/249.mpor!体验幅况页面位置量、错误数来优化渠道体验的方法。2015年6月5日地约钟地约钟体验斑况谈配漆真剪体验斑况谈配漆真剪APM提供了一套全新的方法,从最终用户体验出发,应用先进的应用透视工具,通过衡量系统组件的性能和可用性,帮助确定在达到峰值使用率时可能出现的资源瓶颈,并进行快速故障隔离。.1.1应用性能实时监控运行基线是业务系统APM关键指标数据的基准线,综合反映业务系统在一定时间内运行常态。系统可提供不同时间周期的基线,包括日基线、周基线、月基线等。运行基线可用于应用运维监控动态变化的情况、问题预警、问题分析等。梦19628集群应用完整交付链需要感知业务交易过程中的各个环节。服务路

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论