IT自动化技术的研究与实施2012-06-25_第1页
IT自动化技术的研究与实施2012-06-25_第2页
IT自动化技术的研究与实施2012-06-25_第3页
IT自动化技术的研究与实施2012-06-25_第4页
IT自动化技术的研究与实施2012-06-25_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IT自动化技术的研究与实施信息系统部 赵永刚2012.6摘 要随着IT建设的不断深入和发展,IT运维管理工作的复杂度和难度也大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业需要专业化、标准化和流程化的手段,来实现运维工作的自动化管理,尽管目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在哪里,即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。本文对北京公司系统维护中心承担的日常运维作业任务进行了详细分析,根据北京公司具

2、有设备数量多、涉及业务系统多、支撑的业务复杂、周期性强、对任务结果核查要求快速、问题处理时限短等特点,在符合北京公司的安全前提下,通过IT自动化的建设,有针对性地提升维护作业任务内容的规范化与执行过程的自动化,从而实现日常运维作业的电子化,减少人员登录系统的频繁操作,还能将异常情况直接呈现在管理员面前,达到高效维护IT设备的目的。目 录1引言12业务场景分析12.1维护作业计划12.2告警智能预处理52.3软件自动装载53技术架构设计73.1总体说明73.2接口描述93.3与周边系统协作流程104数据模型设计205系统功能实现215.1基础功能215.2维护作业计划265.3告警智能预处理30

3、5.4软件自动装载316总结341 引言随着中国移动北京公司IT建设的不断深入和发展,IT系统的运行维护已经成为了IT部门普遍关注和不堪重负的问题。国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。因此,如何提高IT运维管理效率,降低运维成本是时下IT界和CIO最热门的话题之一。现在随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,

4、企业开始需要运用专业化、标准化和流程化的手段,来实现运维工作的自动化管理。因为通过自动化监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然。例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过自动化诊断能最大限度地减少维修时间,提高服务质量。因此, 对于越来越复杂的IT运维来说,将纯粹的人工操作变为一定程度的自动化管理是一个重要发展趋势。企业需要专业化、标准化和流程化的手段,来实现运维工作的自动化管理,尽管目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法

5、判断问题的根源在哪里,即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。2 业务场景分析2.1 维护作业计划维护作业计划系统的主要目的是通过规范化的流程和灵活的任务制定策略,以确保周期性、重复性的工作任务合理规划、确保执行、及时完成,并严格控制作业执行质量。通过实现对现有设备的健康维护工作的规范化,从而压制设备和业务系统的故障率。在制定维护作业计划的同时,可以通过智能运维平台自动化调度巡检任务,实现对批量、重复的维护作业工作的自动化操作,从而降大大降低人力投入,并提高执行效率。运维人员每天要求对主机设备进行巡检,巡检内容

6、包括:cpu、内存、文件系统、IO等内容。例如客服系统日常维护作业计划中,对小机的日常巡检需要做的操作如下表所示:维护作业计划实例表小型机日常维护作业计划维护项目操作命令参考指标检查操作系统错误日志vi/var/adm/syslog/syslog.log无“WARNNING”、“ERROR”检查包日志pkg1.log和pkg2.logvi/etc/cmcluster/icdpkg/tl.log无“WARNNING”、“ERROR”检查启动日志vi /var/adm/rc.log无“WARNNING”、“ERROR”检查内存vmstat 2 10 或 topFree memory大于100MBp

7、i、po为零检查CPUsar 2 10 或topIdle大于30%wio小于30%urs大于2×sys检查I/Osar -d 2 10BUSY应小于90%KB_READKB_WRITE小于10MB检查swap区Swapinfo atm检查硬盘空间bdf呼叫中心所用各逻辑卷%used小于90%维护作业计划总体流程示意图如下:附图1. 维护作业计划总体流程示意图通过维护作业计划系统完成主机设备自动巡检的具体步骤如下:1. 维护作业计划制定维护作业计划管理员通过作业计划管理系统制定一个针对客服系统小机设备进行巡检的维护作业任务单。在工单中写明要求接受巡检主机的设备目录及巡检指标,并制定每天

8、的巡检开始时间和结束时间等必要信息2. 设备巡检操作维护作业计划执行人确认工单后,依据维护作业任务单的内容,开始巡检工作。根据不同设备类型的巡检要求,在自动巡检操作界面,选择或创建巡检脚本,并填写对应的基线信息,如性能基线,配置基线等。如果巡检中发现问题,可以通过智能运维平台完成修复操作。3. 巡检结果通知与确认巡检任务结束后,巡检任务执行人向作业计划系统回执巡检任务单完成。同时巡检任务结束后要利用通知功能将巡检结果向相关负责人员通报。最终由负责人完成对本次巡检任务的确认。4. 定制巡检报表与巡检报告巡检报表和巡检报告用来客观反映运维人员的巡检工作情况。运维人员根据工作需要定制巡检报表和巡检报

9、告样式与内容,并将其发送给相关人员。5. 维护作业的自动化在主机设备自动巡检描述的场景中,可以将具备固化可能的巡检的任务固化,由智能运维平台统一调度执行,从而实现巡检的自动化和违规结果的自动修复,构建闭合的维护作业计划。维护作业的自动化可以提自动巡检的效率,降低人力投入成本,同时降低人为操作的失误风险,进一步确保巡检操作的规范性。下图为维护作业计划总体流程与维护作业计划示意图:附图2. 维护作业计划的自动化流程示意图维护作业的自动化实现场景如下:1. 创建自动巡检任务维护作业计划执行人在接到巡检任务单后,经过判断和总结,确定可以将对客户系统小机设备的该巡检任务加以固化,并利用智能运维平台的集成

10、调度功能实现自动化的脚本调度。并在自动化流程的必要节点中,设定逻辑判断依据、传递参数内容的以及设定基线比对规则。从而完成符合维护作业计划要求的自动化巡检任务定制。创建自动修复任务制定对巡检结果的逻辑判断,根据判断结果调度自动修复脚本或触发修复工具,同时根据自动通知策略自动发起通知。自动巡检任务和修复任务与维护作业计划模板进行关联通过智能运维平台的自动化流程控制器,将自动巡检任务和自动修复任务与维护作业计划模板相关联,确保维护作业计划任务下发时自动触发智能巡检,巡检结束后根据结果判断是否 调度修复任务。2. 维护作业计划自动实施巡检任务将随着每天作业计划任务单的下发而自动实施,实施结束后有智能运

11、维平台调度作业计划管理更新自动更新作业计划任务工单状态。最终实现维护作业计划的自动实施2.2 告警智能预处理告警智能预处理功能,主要是借助智能运维平台的自动化技术,实现对可固化的事故解决方法进行自动化的执行,从而提高该类故障解决效率,降低人力投入成本和人为失误概率。下面对告警智能处理的过程进行详细描述,该过程主要涉及到事件管理、知识库以及智能运维平台的自动化流程控制器。具体场景如下:l 告警诊断通过事件管理流程对故障进行诊断。事件管理流程创建了一张内容关于某业务系统服务器磁盘空间已满的事件单,分配给事件解决人员处理解决。事件解决人受理发现是由于某进程崩溃后在root文件系统下产生了较大core

12、dump文件,导致该文件系统被写满。事件解决人清空coredump文件后,系统恢复正常。l 关联知识库的知识条目事件解决人经过验证和总结发现该事件处理过程可以固化,便在智能运维平台中创建清空coredump文件的自动化动作。并借助自动化流程控制器,将该自动化处理动作与知识库相关联。主动发起知识流程,将该类事件的解决方案列入知识入库申请。审批通过后,该知识及即生效。l 自动实施知识条目中的处理任务今后出现同类故障,事件处理人可以在知识库引用该知识,并由知识条目自动出发清空coredump文件的动作进行处理。从而实现该类告警的智能处理。2.3 软件自动装载软件自动装载的目的是实现对批量设备或制定设

13、备进行自动化的应用部署、软件或补丁的版本检查以及基于策略的自动更新或者卸载。软件自动装载可以有效的规避操作失误风险,提升应用发布效率。软件装载功能支持的软件包括:网络和服务器的操作系统、数据库、中间件、应用软件、补丁等。软件自动装载的业务场景包括:安装审查、软件自动分发、软件部署、安装后回滚等四个。l 安装审查在软件或补丁自动部署之前,应该将预先对被安装设进行安装备检,审查过程中将自动排查重复安装或其它异常情况;同时检查和安装的作业自动关联。l 软件自动分发审查通过后,智能运维平台自动触发软件分发功能,基于分发策略对预备安装该软件的设备(或一批设备)进行统一介质分发。l 软件部署操作人员制定工

14、作软件安装部署时间(可立即安装也和定时安装)并在在智能运维平台操作界面填写软件安装必要的参数,然后启动软件部署动作。l 安装回滚如果某些设备的安装失败或错安装者需要卸载,可以指定设备执行回滚操作,执行后该设备自动回滚到没安装之前的状态。3 技术架构设计3.1 总体说明附图3. 智能运维平台技术架构u 协议适配层即南向接口。该层主要实现统一采集接口,不同采集组件实现松耦合。u 综合指令服务引擎为其他模块提供基础功能服务:网元连接的资源信息管理、脚本模板管理、云任务管理、任务管理、调度管理、告警处理等。u 自动巡检完成日常巡检的主要功能:网络设备、主机、数据库、中间件、业务应用的巡检功能,并提供巡

15、检报告、巡检报表、检阅等功能。u 自动化流程控制器巡检元任务所采集的数据均为各自独立,没有相互关系。此模块提供将不同命令组合起逻辑关系,完成一个控制流程,给用户解决实际的工作的所遇到的问题能够真正提高用户的生产效率。并为知识库提供服务,来实现知识的积累及复用,达到知识库的共享及知识的固化作用,详细请参考智能预处理节。附图4. 自动化流程控制器配置界面示意图提供图形化界面,通过鼠标的拖拉拽操作完成流程模板编辑,以方便执行自动化流程作业,提高用户的生产效率。u 配置变更审计主要提供两大功能:1. 提供采集信息与资源管理平台的基准信息对比,不一致时产生告警。2. 配置文件对比,通过两步操作完成此功能

16、。用户选择某次巡检结果,作为下次对比基准。可以提供手工输入基准值。使用本次巡检结果,与基准对比,不一致时产生告警。告警内容中给出对比的差异。u 软件装载完成软件装载、卸载、升级、回退、检查等功能的独立模块。可制定操作流程模板、计划;为简化操作,最好提供模板复制功能。u 北向接口服务即北向接口。完成智能维护平台与外围系统协作时,对外提供服务的各种接口:² 向运维管理中心的发送事件工单(告警)接口;² 运维管理中心派发维护作业计划接口;² 向资源管理系统查询配置信息接口。² 向运维管理中心、知识库等外围系统提供执行作业任务接口。详细信息请看下节接口描述。3.

17、2 接口描述表格1. 智能运维平台与外围系统接口接口源系统目标系统接口描述和信息项1智能运维平台资源管理系统查询资源配置信息:资源ID,资源名称,资源属性信息;更新资源配置信息:资源ID,资源属性ID,资源属性值;2智能运维平台运维管理中心派发事件工单:告警ID,告警标题,告警类型,告警级别,告警内容,工单ID;运维管理中心智能运维平台执行巡检作业任务:任务ID,执行参数;制定巡检作业计划:任务ID,时间周期,时间频率3知识库智能运维平台查询任务信息:任务ID,任务名称,任务描述,任务类别,参数说明;执行任务:任务ID,执行参数;4智能运维平台基线测量查询基线:元任务ID,上基线,下基线,上容

18、忍线,下容忍线;配置基线:元任务ID,上基线,下基线,上容忍线,下容忍线;5智能运维平台堡垒主机telnet6智能运维平台PASM权限认证信息3.3 与周边系统协作流程3.3.1 智能预处理对告警根据事先定制好的告警处理知识库进行相应处理,对已有告警进行确认,以降低误告警率,对可以自动化维护的告警进行预处理并进行相应的数据采集并分析对其进行设备告警指标优化,减少用户的维护量,提高告警质量,对不同告警进行多步骤流程化分析。附图5. 知识库操作向导调用智能运维平台执行自动化任务还可以通过对故障处理,总结、积累到知识库中。并通过知识库增加一个操作向导,固化对故障诊断、处理的经验。附图6. 智能预处理

19、数据流图其中,2是一个人工的过程,并没有数据中【运维管理中心】和【知识库】之间传输。3.3.2 软件装载附图7. 软件装载流程图由【运维管理中心】发起一次软件装载任务,下发给【智能运维平台】;由【软件装载】模块负责执行此任务。登录到【网元】后,从【软件包ftp服务器】下载软件包;执行安装步骤;将安装是否成功的信息发送给【运维管理中心】。附图8. 软件装载数据流图3.3.3 配置变更审计附图9. 配置变更审计发送不一致告警流程图由【配置变更审计】模块的巡检调度,发起一次巡检任务。首先,从【网元】上采集配置信息;然后,从【资源管理平台】取得此配置信息的基准值;对比两个值,不一致时产生告警,向【运维

20、管理中心】派发事件工单。附图10. 配置变更审计发送配置不一致告警工单数据流图3.3.4 派发告警工单流程附图11. 派发告警工单数据流图【自动巡检】执行巡检任务,如与异常或产生告警,通过【北向接口服务】向【运维管理中心】派发事件工单。3.3.5 制定、执行巡检作业计划附图12. 巡检作业计划制定数据流图【运维管理中心】通过【北向接口服务】下发“巡检作业任务”,执行结果通过【北向接口服务】传回【运维管理中心】。3.3.6 自动变更附图13. 自动变更数据流图【运维管理中心】向【智能运维平台】下发变更网元配置信息的任务,【智能运维平台】负责修改网元上的配置;【运维管理中心】确认此修改成功后,修改

21、【资源管理平台】中的配置信息。3.3.7 与周边模块的关系附图14. 智能运维平台与外围系统关系图软件装载所使用的软件安装包存放在【文件服务器】上,在执行软件装载时,智能运维平台将软件安装包从【文件服务器】下载,传输到被管主机,执行安装动作。【智能运维平台】执行采集命令(登录网元上操作),是通过【堡垒主机】建立的通道完成的,执行权限通过【4A】系统控制。智能运维平台通过【中国移动业务支撑网络运营管理系统】内的【权限管理】模块完成用户操作权限控制。【知识库】的操作向导,需调用【智能运维平台】中【自动化流程控制器】提供的服务完成智能预处理。【运维管理中心】通过【智能运维平台】北向接口提供的服务完成

22、巡检作业计划、部署、执行。【智能运维平台】在完成配置变更审计功能时,需取得【资源管理平台】的配置信息,作为比对的基准值。4 数据模型设计智能运维平台数据模型如下:附图15. 智能运维平台数据模型节点:是一种抽象概念,包含【开始】、【条件】、【循环】、【分支】、【合并】、【结束】节点,模板也是一种节点。服务:也是一种抽象概念,包含【巡检作业服务】、【自动化流程服务】。模板:包含有【指令】、【脚本解析】、【告警基线】。元任务:一个【模板】和一个【资源】的组合。任务:一组【元任务】的组合。调度:一个【任务】与一个时间周期的组合。时间周期有日、周、月、节假日、一次性。资源:网络、主机等,也可以是数据库

23、、中间件和业务应用系统。指令:采集配置项,巡检作业使用的操作指令,可以是shell命令、数据库SQL语句、SNMP的GET指令、JMX的一个对象、等。解析脚本:使用脚本解析引擎对指令执行结果格式化的配置脚本。告警基线:告警对比使用的静态阈值或动态阈值。5 系统功能实现5.1 基础功能5.1.1 资源管理巡检作业中使用的资源,如管理其登录的用户名、密码、IP地址、管理方式、厂商、版本、型号等信息的维护功能。【主要功能】u 系统有丰富的资源组织模式,资源管理方式多样性可以适应不同用户对资源的个性化组织。同时资源维度的可任意扩展性使得系统可以对不同的资源维度进行个性化配置。并以列表的形式展现巡检系统

24、中所有维度的信息。对维度信息可以执行添加、删除、编辑的操作。u 可以通过excel文件方式进行批量资源导入,减轻了用户资源导入的工作量。简化了系统资源配置流程。u 智能运维平台能发现各种资产信息和配置信息,包括:² 硬件:CPU,处理器速度,处理器/架构,BIOS,描述信息,MAC地址,制造商,型号, 磁盘,存储卡等等。² 操作系统:DNS名称,IP地址,开放的TCP端口,操作系统类型,网络设定,软件补丁,系统名称,用户,用户组,注册表,COM+, 安全设定,服务等等。² 软件:可以发现注册到系统中的MSI,RPM,LPAR,Depot等标准软件包信息,同时,发现

25、功能内置的应用签名,还可以发现和标识常用的企业应用软件,如DB2, Websphere, Apache, Tomcat,SSH,LDAP,Oracle,SAP等等, 用户可以通过扩展应用签名标注和发现自行开发的应用。下图所示为采集的Oracle的相关配置和数据表结构信息:附图16. Oracle配置信息管理示例² 配置信息:智能运维平台,可以与统一资源库进行数据交互,通过对统一资源库的数据读取,可以获取在应用或操作系统的配置文件(如hosts, security, serviecs, route, web.xml, init.ora)中的配置项信息,如下图所示的截图为智能运维平台所收

26、集并解析的数据配置项信息:附图17. 主机配置文件信息管理示例² 用命令或脚本自定义采集:智能运维平台还可以将命令行或脚本输出通过语法文件对象化,并转化为配置项供用户浏览,下图为指令采集软件配置文件的脚本:附图18. 通过指令采集的配置文件信息5.1.2 模板管理主要对运维管理中频繁使用到的比对基线、操作脚本、存储过程进行规范化的管理,以实现各种部署操作高效、安全执行。模板创建后要通过测试、专家评审才能固化在系统中使用。模板管理模块可以将经过验证、审核的模板进行归档。【主要功能】u 脚本模板管理:支持脚本增加、删除、修改、查询功能;具有测试功能,支持执行脚本及查看执行结果功能;支持模

27、板批量导入。如下图所示:附图19. 脚本模板示例图u 基线模板管理:支持性能基线模板和配置基线模板的增加、删除、修改、查询功能;支持通用审计规范模板的导入如SOX、PCI等;5.1.3 控制权限管理控制权限管理实现对IT运维人员的集中操作权限控制,其中包括操作脚本权限和操作资源权限,操作管理的身份需到统一认证平台进行认证,本模块可以做到基于角色的权限分配。【主要功能】u 操作脚本权限,对于控制操作中定义好的各种脚本,可以设定某个操作员或者角色对该脚本是否具有编辑、执行权限。脚本操作授权如下图所示:u 操作资源权限,对于被管设备(包括网络和主机),可以设置操作员是否可见的权限。附图20. 基于角

28、色的操作资源权限控制u 模板操作使用权限5.1.4 操作日志管理日志管理主要实现对系统维护过程、操作过程、任务进程执行过程的日志记录和管理,可以对操作的每一步处理过程日志进行追踪查询。【主要功能】u 操作日志查询:可以按照不同操作员、执行的操作、被管对象、操作时间、操作结果等进行查询统计;u 支持对脚本及存储过程的上传、审批、运行等操作进行日志记录。u 支持操作执行结果审核,定期生成审核报告。5.1.5 自动化流程控制器自动化操作控制器主要用于复杂的任务调度和系统间的整合,将多种标准操作组合起来完成一个具体的管理任务。目的是协调调度运维工作中各个环节,通过自动化的流程控制器的可将多种服务、工具

29、、脚本组装执行,以实现各种配置变更操作、日常检查的自动化执行、以及跨系统的流程化调度。【主要功能】u 图形化的操作流程设计:支持拖拉拽的方式,完成操作流程的组装,具备流程嵌套功能,支持逻辑判断、for循环、流程分支、以及逻辑选择等多种流程流转动作。如下图所示:附图21. 自动化流程控制器流程设计界面u 自动化的集成与调度功能主要包括对智能运维平台内部模块调度和对平台外部模块的调度:² 平台内部调度:可以协调调度平台内部的巡检脚本、操作处理脚本、合规审计模块、软件装载模块、虚拟机管理模块等,通过对内部功能的组装实现智能运维平台的集成调度整合自动化。² 平台外部调度:提供多种接

30、口适配器,如WebService、Telnet等,可以快速简单的实现与运维中心的事件管理、变更管理、作业计划管理等模块的集成调度。基于事件驱动的作业调度、灵活定时作业调度,构建闭环的事件管理流程和变更管理流程。5.2 维护作业计划自动巡检是将日常运维管理中所定义的日常巡检操作任务通过工具自动化进行,例如记录和检查设备的配置参数和运行状态。这些任务都是标准化的操作,可以通过定义和执行巡检规则来实现。通过定时自动执行这些操作序列(巡检任务)实现无人值守的自动化巡检,并生成相应巡检报告。自动巡检主要包括巡检作业计划定制、巡检作业部署、巡检作业执行、巡检作业报告等功能,提升巡检作业的效率、准确性和全面

31、性。5.2.1 巡检作业计划制定对巡检作业的执行进行计划制定、参数配置、脚本检查等。【主要功能】u 管理员可以定义巡检作业,可以添加、修改、删除巡检作业。u 巡检作业中定义巡检规则,包括巡检对象、巡检操作、结果检查、时间间隔等参数。u 检查的对象可以是配置文件、运行参数、运行状态、安全设置等。智能运维平台所提供的细粒度配置项和强大智能判读逻辑,以致一般的检查规则无需编写任何脚本,通过直观的表达逻辑组合即可完成检查设置。如下图所示附图22. 巡检规则编辑示例图u 巡检操作可以是脚本,也可以是其它命令。u 定义自动巡检任务,和任务调度策略。管理员可以随时执行巡检,也可以定义计划表来自动执行巡检。计

32、划表包含日、周、月、节假日、一次性调度。调度样式如下图所示附图23. 智能运维平台的普通调度界面附图24. 节假日调度界面巡检执行中5.2.2 巡检作业部署对制定好的巡检作业进行部署。【主要功能】u 巡检作业可以部署到一个配置项上,也可以部署到一组配置项上。配置项可以是网络、主机等,也可以是数据库、中间件和业务应用系统。u 巡检作业本身可以分组存放,可以单独部署,也可以成组部署。5.2.3 巡检操作巡检过程中,提供巡检控制界面,例如填写巡检参数,修改巡检脚本。巡检结束后展现和通报巡检结果,并提供基于巡检结果的操作,如故障修复等。具备巡检告警确认功能。【主要功能】u 提供巡检操作界面,可以灵活填

33、写巡检参数、修改脚本。u 当巡检发现问题时,可以自动向告警管理发送告警信息。u 提清晰地巡检结果展示界面,管理员可以利用在平台建立的配置基线,即将上一次的配置检查结果保存为基线,巡检结果可以和配置基线进行对比,并以醒目的方式标出变化情况。如下图所示附图25. 审计结果展示示例图附图26. 配置基线比对示例u 管理员可定义自动修复的操作,当巡检发现问题时,管理员可以根据需要选择自动修复或是手工修复。5.2.4 巡检作业报告对巡检作业执行状况进行汇总,形成巡检报告。【主要功能】u 巡检结果可以生成报告,支持导出到多种格式,包括PDF、Excel、CSV等。u 提供邮件方式自动发送订阅报表的功能,巡

34、检结果报告可以自动发送到指定的邮箱里。5.2.5 巡检作业报表对巡检作业中所有执行结果的统计。展现巡检系统中所有巡检结果的作业概况。以表格形式展示所有巡检任务当日的执行情况,并可钻取到巡检任务执行结果报表和巡检元任务执行结果报表。【主要功能】u 展现某维度当日作业结果的作业概况。以标签的形式对巡检结果进行筛选,按巡检汇聚类别分:日作业结果、周作业结果、月作业结果、节假日作业结果、一次性作业结果。并可钻取到按小时汇聚的作业概括。u 对巡检系统中资源、作业、巡检项、设备、业务系统、参数、作业结果的统计。5.3 告警智能预处理对告警根据事先定制好的告警处理知识库进行相应处理,对已有告警进行确认,以降

35、低误告警率,对可以自动化维护的告警进行预处理并进行相应的数据采集并分析对其进行设备告警指标优化,减少用户的维护量,提高告警质量,对不同告警进行多步骤流程化分析。故障处理任务固化是告警智能预处理的基础,可以将诊断管理中的各种操作,包括诊断信息的收集、诊断逻辑、自动修复操作等固化下来,重复使用,提高运维效率。一般常见的网络故障和系统故障都有固定的处理方式,在各种设备的维护手册上都可以查到。每一步都可以转化为详细的执行脚本,通过固化,可以重复使用故障恢复操作。【主要功能】u 警智能预处理支持所有故障操作和修复操作的固化,对任意的操作序列都可以内置到诊断过程中,诊断管理支持常见连接方法,例如,ftp,

36、ssh,telnet等,固化时管理员只需重点关注操作命令即可,相关的连接等辅助操作均由系统自动完成。u 警智能预处理支持图形化方式设计故障处理和诊断的过程,住要是通过智能运维平台的自动化流程控制器设计调度流程,并在调度流程中实现对相关脚本和工具的调度来执行每一步操作。u 警智能预处理中的操作流程可以全自动执行,也可以设置交互,在执行过程中由管理员输入必要的信息,根据管理员的信息或者判断,往下执行。u 警智能预处理可以与运维中心中事件和问题的解决方案固化成的知识相集成,当故障管理判断新的故障和以前的事件相同时,可以引用知识库的中的知识,并有知识自动调用这些解决方案修复故障。5.4 软件自动装载主要实现软件分发与部署,接收发布包(主要描述被管对象上应该安装什么软件、补丁、配置信息,以及安装顺序、安装和卸载脚本等信息)并实现发布包的分发、部署和结果检查。部署控制是维护控制的一种典型应用,大部分功能参照维护控制章节建设,较个性功能结合本省情况自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论