版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1企业IT监控与流程管理解决方案目 录背景介绍监控管理解决方案监控管理内容12监控管理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍5根据IBA三层理念划分3网络层业务层网元层服务状态(可用度)业务量响应时间错误率网络进程端口队列日志主机网络设备数据库中间件监控管理技术架构4多种数据采集方式Ultra-NMS Probe(针对网络管理和业务管理数据)系统监控模块(针对操作系统、数据库、中间件等)针对各种不同业务系统的二次定制开发,接口方式包括日志、WebService等管理数据的统一整合与处理监控管理数据结构的一致化统一配置管理数据库统一故障、性能和配置管理指标体系统一数据呈现统
2、一的运维管理门户统一数据报表系统统一用户认证鉴权网元层监控管理5网络服务器数据库中间件存储交换机UnixOracleTomcatSun StorEdge T3路由器LinuxSybaseWebsphereEMC Symmetrix安全设备Win-NTSQL ServerWeblogicHP SureStore Disk Array XPWin-2000InformixTuxedoIBM Enterprise Storage ServerWin-2008DB2 UDBMcDATA Directors监控管理专题介绍网络设备监控:由Ultra-NMS Probe采集模块通过SNMP方式采集。支持H
3、uawei、中兴、Alcatel、Cisco、Juniper、Nortel、F5、Radware、3COM厂商的网络设备和防火墙的监控;监控内容:对网络设备、网络接口、网络服务等的监控与管理;监控手段:状态轮询、SNMP Trap、Syslog、SNMP MIB数据采集、响应测试等。存储设备监控:支持对主流的IBM、HP、EMC、SUN、HDS、DELL等存储设备的监控;监控手段:如设备带有存储管理软件,则Ultra-NMS通过与存储软件集成实现监控;如设备不带存储管理软件的话,则一般通过SNMP集成实现接口。监控管理专题介绍-网络拓扑监控管理专题介绍-网络告警预警Syslog解析内存利用率配
4、置文件改变Title in hereCPU利用率Title in here接口状态Title in here带宽使用情况监控管理专题介绍-配置管理Probe远程登录远程配置操作配置文件上传下载、归档和比对监控管理专题介绍链路管理针对网络链路、链路集、链路组的管理维护系统,提供资源管理、告警管理和性能管理六个功能模块:链路资源、当前告警、历史告警、性能趋势、性能统计、统计排名监控管理专题介绍链路管理监控管理专题介绍 主机监控:开放式系统:采用BMC BPM For Server监控代理;采用Ultra-Monitor for OS无代理方式监控对象AIX、HP-UX、Solaris、SCO UN
5、IX、Windows、Linux操作系统等监控方式通过BMC BPM For Server监控代理实现采集;BMC BPM For Server再与Ultra-NMS集成进行数据处理与配置/性能/告警展现。监控内容服务器配置信息:对服务器的配置信息进行采集,且这些信息是按照KBP+KBPID+KPI的方式组织的。资源占用情况(性能指标):CPU、内存、Kernel、SWAP、文件系统、IPC、网卡等,占用率、空闲率等指标。进程监控:进程CPU时间占用情况、进程内存占用情况、同名进程数、进程状态等,对采用了IPC技术的进程还需要监控其共享内存、信号量和消息队列。日志文件监控:监控主机的系统/应用
6、日志,通过日志监控KM定义匹配方式生成告警。功能实现监控预警提示-系统级预警文件系统 状态逻辑磁盘利用率系统错误事件Title in here文件系统利用率Title in here应 用错误事件Title in here内 存利用率功能实现监控预警提示-系统级预警双机状态日志监控Title in here进程状态模拟登录监控管理专题介绍 数据库软件:采用BMC BPM For Database监控代理。采用Ultra-Monitor for DB无代理方监控对象可实现对Oracle、DB2、MySql、Sql Server、Sybase、Informix等数据库的监控监控方式通过BMC BP
7、M For DataBase监控代理实现Oracle、DB2、Sql Server、Sybase、Informix采集;BMC BPM For DataBase再与Ultra-NMS集成进行数据处理与配置/性能/告警展现;Ultra-NMS通过JDBC方式实现对MySql数据库的监控。监控内容对各类数据库的可用性、容量、性能、磁盘IO、数据量、表空间进行全面监控。 监控管理专题介绍 中间件:采用BMC BPM For Middleware监控代理。采用Ultra-Monitor for Middleware无代理方式监控对象中间件监控:J2EE中间件:WebLogic和Websphere等;交
8、易中间件:Tuxedo等;传输中间件:Websphere MQ等;其他中间件:WebMethods、TongLink等。商用平台软件监控:Lotus Domino;Web服务器:MS IIS、Apache、JBoss、Tomcat等;SAP管理;Oracle E-Business Suite管理功能实现监控预警提示-应用级预警InformixSqlServerDB2OracleWebLogicWebSphere监控管理专题介绍-经验指标主机window/Unix数据库中间件网络设备CPU内存文件系统双机状态WebsphereTuxedoWeblogicOracleInformixDb2Syba
9、seSqlServer CPU、内在 接口输入、输出带宽利用率接口输入、输出丢包率接口输入、输出错包率初始值:其他金融机构项目经验值本地化:贴近实际运行状态及IT资源现状进行调整个性化:在通用指标基础上进行个性调整及指标扩展预警目 录背景介绍监控管理解决方案监控管理内容12监控管理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍5部署方式20部署方式单一中心、单一采集单一中心、分布采集混合部署方式分布式数据采集的优势监控管理数据采集负载的分担,提升解决方案的扩展能力跨防火墙的数据交换,减少对于现网安全策略的影响采集模块数据预处理,减少对网络带宽的占用根据上证通的网络及管理现状,建议
10、采用第二种“单一中心、分布采集”的部署方式。一方面 节省成本,保障系统的安全性,另一方面符合“两地三中心”的管理需求,同时也满足未来的发展。本期项目部署架构21 采用分布式部署方式 采用一个管理中心集中管理 两地三中心的方式,建议采用三台采集机 建议监控服务器与数据库服务器互为备份提升监控管理高度22我们将充分考虑对网元层、网络层、业务层的关键指标进行监控,对业务应用监控采用简单的二次开发,包括第三方开发接口、日志接口、监控代理等方式,从业务应用获取体现业务运行状况的关键KPI指标, 并进行后续的数据处理和展现。业务监控系统监控监控对象包括了上证通主机、网络设备、数据库、中间件、存储等 绘制主
11、机、网络设备的物理连接拓扑实时上送硬件设备的告警、性能信息监控业务的可用性(进程)、业务性能、系统运行状况等展现业务综合分析报表。项目建设团队建议23实施工程师研发工程师运维产品安装部署监控代理产品安装配置告警策略配置拓扑视图定制基础数据配置技术培训系统测试及上线报表定制开发业务监控定制开发第三方系统集成接口定制开发项目经理需求调研项目整体管控目 录背景介绍监控管理解决方案监控管理内容12监控管理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍5集中监控范围约定25监控管理功能要点26 拓扑管理资源管理采用类的方式对资源进行管理,可通过自动发现建立资源信息,并可自由添加资源属性和维
12、度。设备自动发现可实现对设备的自动识别,自动分类,减少配置时间,并提高准确性监控展现的最佳方式,可展现出不同的拓扑图。 配置管理性能管理核心功能,采用KBP+KBPID+KPI的体系,实时展现所关注的关键性能指标。故障管理核心功能,可对各类故障进行处理,并以丰富的通知方式告知管理员。可实现对设备的远程操作,对配置修改进行跟踪,对比。逻辑架构27网络主机SNMP节点服务自动设别设备厂商建立设备物理拓扑向导式发现界面快速采集资源基本信息帮助网络管理员完成大部分的配置初始数据 28设备自动发现配置资源数据库IP地址设备名称Mac地址CPU配置内存配置设备连接关系资源管理29建立针对IT资源的资源管理
13、,包括资源对象、资源维度管理等能力。用户可以扩展新的资源类别,可以扩展资源的属性。提升资源管理能力提升设备维护能力在设备维护期间,屏蔽因工程维护造成的告警,减轻监控工作压力。对于设备保修期即将到期的设备,将发出续保告警,避免了过保造成的损失。提升资源数据服务能力能根据资源实体间关系,将告警信息进行关联,准确定位到故障根源。能为性能管理、拓扑展现等功能提供相关资源数据服务。对获取的资源数据进行集中的处理,提供给集中监控平台、运维管理门户和数据报表系统,并提供监控管理相关的资源类建模功能。该模块是整个监控管理平台的基础模块,告警、性能和配置操作管理都基于资源类及其挂接的指标体系进行构架。 拓扑管理
14、30拓扑展示是监控系统展现IT系统情况的最佳方式。Ultra-NMS拓扑视图能够以直观、统一、真实的方式展现整个IT系统的运行状况,包括物理拓扑图和业务逻辑拓扑图。系统支持多视图导航、查看拓扑对象的故障、性能、配置信息、拓扑图编辑与修改、查找/定位/拓扑缩放/鸟瞰。监控管理平台功能拓扑管理-金融行业案例图监控管理平台功能拓扑管理-运营商案例图- 32 - 功能实现拓扑功能应用性能拓扑Ultra-NMS提供性能工作区功能,即将多个被管理对象的多个性能指标按照一定的业务逻辑进行组织和呈现。从而使用户能够在同一个管理界面中一目了然的查看所有与其管理职责相关的性能指标。在性能工作区的图形界面中,能够为
15、不同的业务创建不同的工作区,在其中组织和定义与之相关的不同的管理对象的各个性能指标,并且以不同的形式展示,例如仪表盘、温度计、红绿灯、水平柱状图、垂直柱状图等等。性能工作区不仅能够以直观的图形方式实时展现性能状态,而且能够以红、黄、绿不同的颜色显示性能告警,并且可以直接查看实时性能和历史性能。功能实现拓扑功能性能动态拓扑功能实现拓扑功能业务影响拓扑功能实现拓扑功能业务影响拓扑故障管理37故障管理是监控系统的管理核心功能。它将IT系统中各种设备或管理系统产生的事件作为原始事件,按照预定义的事件规则,经过过滤、分类、分级、转换等处理环节,形成有效的预警或故障告警信息,按预定的方式通知管理人员或自动
16、响应,对生成的告警提供升级、自动或手工消除等管理手段。38故障管理39故障管理警告告警:需要关注的事件 次要告警:没有影响生产,没有网络中断,没有造成宕机,但是需要快速处理的问题等重要告警:造成网络设备中断或者宕机,但没有 影响重要的生产系统;设备、服务等的达到临界警界等一般事故严重告警:发生生产事故,导致重要的生产系统不可用;或网络中断导致某一重要区域不可用;设备、服务等的使用达到极限警界等采取中文声音通报的方式,通知系统管理员进行处理和恢复。采取声音报警的方式,通知系统管理员及各处室相关的负责人进行处理和恢复采取声音和邮件的方式通知系统管理员及各处室负责人进行处理和恢复采取声音、邮件、短信
17、的方式通知系统管理员、各处室负责人、相关领导生成工单,提供与流程平台的接口,对重要告警和严重告警生成工单。故障管理40性能管理41对获取的性能数据进行集中的处理,提供给集中监控控制台、运维管理门户和数据报表系统。提供的功能包括:性能门限告警、性能数据汇总、性能指标计算、网络流量管理、实时性能查询和性能门限管理等。 网管系统能力 设备是否超负荷运转对于设备性能数据将首先判断是否超过性能阀值,如果满足告警生成条件,则生成性能超门限类的告警信息,转入告警处理流程,并通过各种方式提示用户。 当前时刻关键设备状况重要时刻、重大场景下,提供各种展现方式,密切关注当前时刻关键设备的运行状态。 历史性能 可以
18、通过报表的方式,分析某段历史时间内各个设备的运行状况, 对设备未来运行的趋势做出清晰的判断。 关键KPI查看当前周期关键设备的关键性能指标,通过图形方式进行展示,如曲线图、仪表盘等。性能管理42性能管理43配置管理44远程配置操作配置命令模板配置文件上传下载、归档和比对报表展现45能够转化成Excel、XML、PDF等格式提供灵活的报表订阅功能报表采用门户技术,并且默认支持把报 表内容发布到统一的门户界面报表将面向所监控系统的管理数据,包括性能数据、告警数据、资源数据等,提供查询、统计和考核等功能,对数据进行深入分析和符合上证通需求的个性化展现。通过Web方式进行访问统一采用Flash风格支持
19、多种维度的组合查询具备报表灵活定制功能能将报表结果以列表、图形方式直方图、曲线图、饼图等输出能够转化成Excel、XML、PDF等格式业务监控46全面监控业务的状态信息,并提供丰富的接口,实现业务告警关联分析,以最快的速度准确定位引起业务故障的网元层、网络层设备,同时能实现业务数据流的监控和模拟。目 录背景介绍监控管理解决方案监控管理内容12监控管理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍5IT服务管理(ITSM)的含义文化 组织结构工具进行有效而合理的整合,以提供高质量的IT服务。12流程 34IT服务管理是一种以流程为导向、以客户为中心的方法。它通过整合IT服务与企业业
20、务,提高了企业的IT服务提供和服务支持的能力和水平。ITSM的解决理念传统的IT管理转 变ITSM技术导向流程导向 “救火队”预防为主被动主动用户客户集中式,企业自己完成分布式,外包孤立的,分散的集成的,企业范围内的“一次性的”,混乱的可重复的, 职责明确的非正式的流程正式的最佳实践从IT部门内部考虑从业务的角度考虑具体的运营面向服务的IT组织,不管是企业内部的还是外部的,都是IT服务提供者,其主要工作就是提供低成本、高质量的IT服务。IT服务的质量和成本则需从IT服务的客户(购买IT服务的)和用户(使用IT服务的)方加以判断。ITSM也是一种IT管理,但与传统的IT管理不同,它是一种以服务为
21、中心的IT管理。ITSM的“三大目标”:以客户为中心1高质量、低成本的服务3服务可计量2标准的IT运维日常处理流程建立一套标准、规范的运维管理体系 监控管理平台 流程管理平台51监控工具问题,询问沟通,变通方法服务台告警事件配置数据库变更计划会议纪要变更统计变更回顾审计报告配置项问题变更配置统计/报告审计报告问题统计趋势分析问题报告问题回顾已知错误审计报告问题管理流程服务报告事件统计审计报告业务部门或用户变更请求事件管理流程变更管理流程事件配置管理流程日常运作管理使用故障,请求Ultra-ITSM遵循ITIL核心思想发布管理流程配置项版本计划移交登记版本发布升级反馈质量审批几个核心流程带来的价
22、值 ITIL最佳实践 问题管理 建立有效的问题管理流程,规范流程相关活动,丰富知识库内容配置管理 通过配置管理流程,建立跨处室的基础数据共享机制,为工作运转效率的提高和管理能力的提升提供基础事件管理 系统建立服务台和权责明确的服务目录规范日常事件、故障处理流程,加强事件流程的执行效率 变更管理 为建立有效的变更管理流程,达到控制的目的,满足SOX审查效 率 控 制 规 范 共 享 考核管理提升运维管理水平组织结构(Organization)岗位(Position)人员(Person) 工作项(WorkEntry)岗位KPI由多个工作项KPI组成考核KPI每个岗位都必须有对应考核KPI设定一个岗
23、位是为了完成某些相关联的工作项每个人总是在特定的岗位上组织是由各种岗位构成的考核的四个方面: 对服务水平考核,面向企业战略 对服务过程考核,面向效率 对岗位考核,面向部门战略 对人员考核,面向演进优化定岗定责Ultra-ITSM 技术架构展现层:面对相应部门的值班人员、维护人员、管理人员、支持人员等的功能平台,展现的方式包括:web、邮件、短信等。业务层:基于ITIL标准的服务流程,为用户提供相关业务应用功能,系统以ITIL的服务支持及日常管理流程为主。解析层:“流程平台+流程设计器”的组合,Ultra-BPMS和流程引擎Ultra-Process Designer的结合。Ultra-BPMS
24、流程引擎提供流程流转平台支持,Ultra-Process Designer使得用户对运维流程的深度扩展成为可能。数据层:为整个系统提供对各类数据的存储管理功能,存储的数据信息包括与网管系统的统一配置管理数据库、运维工单数据、系统管理信息等。多种动作多种状态符合中国用户操作习惯十七种动作:“建、派、抄、协、交、审、领、退、驳、追、转、办、催、知、复、闭、废”十一个状态:“开始、草稿、待审批、审批中、待处理、处理中、已完成、作废、归档神州泰岳流程平台亮点介绍多样化的业务规则良好的扩展性人性化设计理念丰富的通知手段便捷的设计界面,所见即所得的设计风格本地化程度高,纯中文的操作界面,非常适合中国用户的
25、操作习惯面向对象的设计,松散的耦合性,良好的开放性,能和各种系统方便的对接工单信息查看、流程设计配置等方面方便用户使用,支持热部署,提高工作效率内置丰富的流程规则、环节规则、界面规则,快速设计新的流程提供短信、邮件等通知方式界面设计流程设计友好的操作界面流程平台产品符合工作流管理联盟的WFMC规范。 产品特性符合不同规模企业用户的要求系统是B/S架构,开发人员和用户都可方便的在浏览器中进行配置和二次开发,而且修改的结果可以直接部署、直接升效,无需重启服务。真正实现了0编码开发。 能够灵活的定义流程,符合国内的特殊流程需求;能够灵活的定义表单,支持各种表单元素的定制。 系统除具有方便的配置功能外
26、,预留了大量的二次开发接口,可以方便的进行功能扩展。比如各种规则解析、条件、业务功能等。 监控和流程之间双向自动接口流程咨询和梳理是关键 业务咨询和流程梳理是服务流程平台建设的一个重要环节,工作量往往占了总体工作量的40%-50%,同时需要用户的大力支持和全员配合。运维服务管理简洁的表单设计提供表单项的配置功能,通过表单项配置,按照系统内置的模板,以特定的排版方式生成表单页面,支持的表单项类型有:普通输入文本框、下拉选择框、单选、多选、时间日期、大文本框、联动选择框等。 流程自定义目 录背景介绍监控管理解决方案监控管理内容12监控管理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍
27、5提供灵活的报表订阅功能支持把报表内容发布到统一的门户界面中集中展示统计分析报表我们在本项目中推荐的神州泰岳自主开发的报表产品面向所监控系统的管理数据,包括性能数据、告警数据、资源数据等,分别提供了查询、统计和考核等功能,对数据进行深入分析和符合用户需求的个性化展现。通过Web方式进行访问统一采用Flash风格支持多种维度的组合查询提供丰富的报表模板,具备报表灵活定制功能能将报表结果以列表、图形方式直方图、曲线图、饼图等输出能够转化成Excel、XML、PDF等格式报表简介-性能报表报表简介-告警报表报表简介-容量规划报表报表简介-考核类报表目 录背景介绍监控管理解决方案监控管理内容12监控管
28、理实现方式监控管理功能服务流程解决方案3统一报表管理4案例介绍570 监控及维护管理体系监控范围涵盖总部及36个分公司IT设备,设备类型包括:网络设备类型:CISCO、华为、锐捷;1100台各类服务器的监控管理,包含SCO Unix、AIX、HP-UX、Windows、Linux操作系统368套数据库Informix、DB2 、SQL Server、Oracle200套Tuxedo、50套Weblogic、10套Domino等商业通用软件的管理 服务管理体系 基于ITIL标准建立全国统一服务台,建立服务支持流程,包括事件管理、问题管理、配置管理、变更管理四大流程;根据人寿实际业务需求,基于流程
29、引擎定制开发业务管理流程,包括上报审批、日常运营、保单转移、代服务管理四大类流程。 运维门户体系 基于泰岳公共产品套件(Ultra-UIP、Ultra-PASM)实现监控管理平台、服务管理平台系统的统一登录、界面集成、综合报表呈现。中国人寿IT运维服务管理平台1统一的展示门户2业务逻辑拓扑视图3业务应用告警4应用性能基线5性能集中展示6应用数据分析统计监控效果展示(部分)72上海分公司深圳分公司北京总部上海分公司自2007年开始建设集中监控系统,2009年2月下旬启动监控系统改造工程,至2009年8月投入试运行。项目建设过程包括对项目需求的分析和确认,项目实施方案及计划的评审,各个功能点的测试
30、及上线,以及投入试运行之后对一些日常运维中遇到问题的跟踪解决。至12月4日程序变更上线之后,集中监控系统需求中涉及的功能点都已实现,相关的测试也已经得到各个系统管理员及值班工程师的认可和确认监控范围包括“生产网”、“办公网”、“Prop外联网”、“公网”、“管控网”、”开发测试网“六个组成部分,监控的功能点涵盖主机(AS400、AIX等)、网络、AWS、EMC、环境、应用类监控(AS400_DB2应用监控、每日交易量等)主机类监控完成54台Windows主机的监控完成18台AIX主机的监控完成6台AS400主机的监控(2台为三地OA服务器/4台开发测试/1台生产)管控网两台虚拟机及24台环境设备及3584磁带库的监控办公网9台监控通断性的设备开发测试网11台监控通断性的设备外联网9台监控通断性的设备公网17台监控通断性的设备生产网对AWS及ECC、加密机等的监控网络类监控共90台,管控网7台网络设备;外联网17台网络设备;公网共18台网络设备接入监控系统;生
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年工业元宇宙概念下的商标视觉表达
- 黑龙江省哈尔滨市第三中学2025-2026学年度下学期高二学年期中考试 地理答案
- 心脏破裂专题学习
- 白内障术前心理护理与沟通
- PL技术基础应用 4
- 气管切开患者的团队合作护理
- 特殊患者群体护理安全挑战
- 甲状腺疾病护理中的职业安全
- 胫骨横向骨搬运术
- 新生儿回流灌肠
- 2025年劳动保障监察大队招聘考试真题(附答案)
- 2026年高中历史教师招聘试题及答案
- 2025年《青铜葵花》(曹文轩)阅读测试题和答案
- (完整版)气体灭火系统安装施工方案
- (正式版)T∕CPCPA 0017-2026 托育机构婴幼儿回应性照护服务规范
- 家族修谱工作制度
- T/CEC 211-2019 火电工程脚手架安全管理导则
- 国家事业单位招聘2024商务部投资促进事务局招聘13人笔试历年参考题库典型考点附带答案详解
- 财务科内部管理制度
- 2025年国有企业招聘招商专业人才20人笔试历年备考题库附带答案详解
- 教师招聘考试时事政治2026卷及答案
评论
0/150
提交评论