运维管理统一标准_第1页
运维管理统一标准_第2页
运维管理统一标准_第3页
运维管理统一标准_第4页
运维管理统一标准_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维管理标准概述运维是管理关键和关键部分,也是内容最多、最繁杂部分,关键用于运维部门内部日常运行管理,包含对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:第一、设备管理:对网络设备、服务器设备、操作系统运行情况进行监控,对多种应用支持软件如数据库、中间件、群件和多种通用或特定服务监控管理,如邮件系统、DNS、Web等监控和管理;第二、数据/存放/容灾管理:对系统和业务数据进行统一存放、备份和恢复;第三、业务管理:包含对企业本身关键业务系统运行情况监控和管理第四、目录/内容管理:该部分关键对于企业需要统一公布或因人定制内容管理和对公共信息管理;第五、资源资产管理:管理企业中各IT系统资源资产情况,这些资源资产能够是物理存在,也能够是逻辑存在,并能够和企业财务部门进行数据交互;第六、信息安全管理:该部分包含了很多方面内容,现在信息安全管理关键依据国际标准是ISO17799,该标准涵盖了信息安全管理十大控制方面,如企业安全组织方法、资产分类和控制、人员安全、物理和环境安全、通信和运行安全、访问控制、业务连续性管理等;第七、日常工作管理:该部分关键用于规范和明确运维人员岗位职责和工作安排、提供绩效考评量化依据、提供处理经验和知识积累和共享手段。

总则为加强企业各个项目后期系统运维管理,确保系统能够平稳、可靠地运行,愈加好地为用户提供管理服务,特制订本要求。实施预防性维护为主、故障性维护为辅运行维护管理标准,预防性维护和故障性维护全部应遵照事先设计好程序进行。完善运维管理体系,建立健全运维规范,提升运维管理效率,并不停提升运维质量。本要求适用全部进入运维步骤项目。运维人员应依据授权,处理本要求中所包含业务事项。

主机、服务器及数据库系统运维管理依据应用需求,主机、服务器及数据库系统配置和安装、和系统资源使用等由企业项目实施部统一计划。应指定专员作为系统管理员(系统工程师)和数据库管理员,对系统运行、管理、维护和安全负责,并根据相关要求负责系统和数据备份和恢复。系统/数据库管理员应定时对系统进行监控和定时健康性检验,分析系统运行和资源使用情况,并进行必需优化、调整和修正,立即消除隐患。如系统设置发生改变,或重新安装系统,或安装了新软件,应在以后15个工作日内对系统进行亲密跟踪。立即处理处理系统运行过程中出现异常问题和软硬件故障,并采取必需方法,最大程度地保护好系统资源和数据资源。对于重大软硬件系统故障,应立即通知部门领导,协调服务商,使系统立即得以恢复运行;对于应用系统引发系统异常或故障,应立即通知相关人员,并协同处理处理。每三个月应对系统主机/服务器/数据库进行一次停运维护,其操作必需严格根据操作规程进行。其它非正常性停运(故障引发除外),应提出书面申请,并经部门领导同意后方可进行。同时做好对应准备工作,最大程度地降低对业务操作带来影响。含有系统操作或管理权限人员调离工作岗位或离职,应立即从系统中删除该用户;如该人员掌握超级用户口令,应立即更换口令。

软件系统运维管理避免在用户工作时间进行软件版本升级工作,以免因为人为失误造成业务中止。软件系统安装、升级等操作应保留完整实施统计。对软件系统进行升级、更新补丁,应首优异行相关测试,并在确定无误后实施。对软件系统进行升级、更新补丁,或进行系统重新安装等操作,应在实施前对原有系统及数据进行备份。变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留。软件进行版本升级时,对于不影响业务升级工作,须以书面形式具体将计划、方案、方法等报上级主管部门立案;对于影响业务升级工作,必需提前两周向上级通信主管部门以书面形式提出申请具体汇报计划、方案、方法等,经同意后方可实施。维护人员应定时跟踪所使用系统软件升级情况和升级后新功效,必需时提出升级提议。

数据库运维管理对于数据库变更必需有统计,能够回滚。无用表和字段要立即清理。从数据库删除数据一定要先备份再删除。定时对数据库数据进行自动备份,方便在故障发生后立即恢复最新数据。定时检验备份实施情况,确保备份操作正确实施。指定专员定时进行备份数据恢复性试验。1、严格操作标准:在系统上进行可能影响系统运行参数设置、更改和维护等操作时,须有2人以上在场进行监护和确定,并作好具体操作统计;2、提前沟通确定标准:软件进行版本升级时,对于不影响业务升级工作,必需提前和用户方进行沟通,避免操作中人为失误造成业务中止;对于影响业务升级工作,须提前和用户方进行确定,达成一致后方可实施。3、遵守保密标准:对被运维系统单位网络、主机、系统软件、应用软件等密码、关键参数、业务数据等负有保密责任,不得随意复制和传输。

巡检管理定时了解设备运转情况,做好系统日常运行基础数据统计,做到有问题早发觉、早处理,避免隐患,确保设备完好率,确保系统运行质量。对硬件设备进行定时巡检,是确保系统稳定运行关键方法,巡检工作包含例行巡检、节假日和关键事件前巡检

维护人员应依据工作计划,对维护设备定时进行预防性巡视检验,巡查过程中应认真负责,立即发觉问题,关键注意处于恶劣环境下、存在潜在质量故障设备,巡查要认真做统计。

巡检过程中发觉告警应立即进入处理步骤,判定为故障要立即进入故障处理步骤

全部巡检全部应有具体统计,包含时间、巡检情况和责任人,并应在巡检纪录卡上签字。

网络管理规范关键业务步骤对以下业务系统步骤监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障发生率。1、单位内部关键业务步骤。2、网络吞吐量大业务步骤。3、对系统造成大压力,频繁使用数据库业务步骤4、同其它系统集成业务步骤,这些集成会提升应用失败风险。用户体验同系统性能指标相关联

将网络中全部网络基础架构全部进行集中监测,包含对数据库服务器、应用服务器、路由器、交换机、防火墙监控,搜集网络运行信息,将性能数据同单位内部用户体验相结合来分析网络性能情况,诊疗系统瓶颈。

建立网络运行基准指标并观察趋势

长久监测并经过对网络运行观察,分析网络性能改变和流量等指标运行趋势;立即发觉网络偏离系统基准模型时异常情况,分析故障,达成预警目标,预防更严重问题发生。设计报警策略,避免警报泛滥

配置报警依据是依据信息服务管理网网络运维管理目标,报警设置标准:1、对影响网络和业务关键指标设置报警;2、消除误报和反复报警;3、报警应该以多个方法立即发送给对应责任人。创建自动化、规范化事件处理程序

信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化处理问题程序,快速处理多种潜在故障而且分配到对应责任人,提升工作效率。另外可将工程师长久积累知识和工作经验系统化和固化,达成快速定位故障目标。

网络服务质量SLA量化管理提升网络服务质量设置量化指标,将其作为整个网络运维管理团体整体目标。信息服务管理网网络性能管理总体目标包含网络和设备、业务可用性、网络吞吐量、带宽使用百分比、网络延时、CPU和MEMORY负载,对于不一样网络指标还要依据网络上下级连接关系分解到每一个子指标,作为对网络故障诊疗和性能管理依据。

制订网络升级和改善策略网络升级和改善应该以对现有网络和系统性能数据测量为前提,以对网络整体运行现实状况及趋势分析为依据。经过对单一网络系统和整体网络系统性能数据比较、单一网络组件和其它网络组件数据比较、系统负载量最大时性能数据和通常负载时性能数据比较等,判定是否需要对系统局部或整体进行升级,发觉网络系统性能瓶颈,提出网络系统改善方法。日常规范天天两次进行业务系统、网络运行情况、业务流量及对外服务器服务情况监控巡查;根据要求时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)根据要求时段查看路由、防火墙等关键系统运行情况,包含网络流量、带宽占用率等,关键检测关键设施,并统计;处理产品组网络问题应做完整、具体统计,快速响应,立即确定原因,主动组织处理,同时统计处理问题操作过程,问题处理后应立即回复;对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、关键和汇聚层等关键网络运维调试,做好汇报申请并统计。故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施布署,更新维护录入知识库。处理多种网络故障,并作统计,保障网络正常运行。碰到不能处理问题时,通知相关人员或立即汇报,并统计;工作人员要有强烈安全意识,巡查时应注意发觉多种可能安全隐患并立即排除。请示汇报制度

为加强相关信息处理和反馈管理,有效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论