运行控制工作手册.doc_第1页
运行控制工作手册.doc_第2页
运行控制工作手册.doc_第3页
运行控制工作手册.doc_第4页
运行控制工作手册.doc_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运行维护中心业务手册 运行控制篇目录1、运行控制岗位工作职责2、运行控制工作细则2-1主机、系统、网络及通讯变更流程及规范2-2系统故障汇报流程2-3服务器到货安装流程2-4电子文档管理流程2-5 运行控制值班规范2-6 主机、系统、网络及通讯初始化安装规范2-7主机、系统、网络及通讯性能监控 2-8主机系统日常管理规范 2-9应用日常管理规范(包括中间件)2-10数据库日常管理规范2-11日志管理规范2-12主机、系统、应用及网络帐户管理规范2-13备份管理规范 2-14主机、系统、网络及通讯应急恢复规范2-15性能优化2-16介质管理规定2-17 主机、系统及应用交接标准2-18 事件(故障)分级标准1 运行控制岗位工作职责1-1运行控制工作职责IT基础设施建设。承担各类IT基础设施的建设。IT运行资源管理。负责维护和管理相关IT资源,包括各类计算机、网络、安全、通讯及附属设备,各类系统、应用软件和各类机房及配套设施等。运行维护体系建设。建立运行维护管理体系,制定规章制度,规范管理工作,拟定系统运行标准。制定运行维护计划和预算。拟定、组织实施年度系统运行维护计划,并负责相关费用的管理工作。完善系统运行。建立并不断完善系统运行维护管理架构,组织系统运行维护日常管理工作。工作巡检。负责系统运行维护管理工作定期、不定期检查考核并组织改进。升级管理。负责所有应用系统的技术升级改造工作。业务管理。负责办理系统应用的各类业务。服务提供商管理。负责管理与系统运行相关的软、硬件供应商,拟制所需技术支持服务合同及执行。测试。各类系统的投产前测试。1-2运行控制岗位架构1-3运行控制主要岗位工作职责1-3-1运行控制经理制度和流程:拟定中心机房、应用系统、网络、通讯系统(含地空通讯)维护管理流程和制度并执行。运行控制:集中管控国航信息系统故障的处理过程。系统网络管理:组织实施对中心机房、应用系统、核心网络和通讯系统的管理。IT资源监控:组织制定国航主机系统、网络、通讯系统的监控策略并部署实施,主动发现故障隐患。应急预案:组织编制和验证主机系统、网络、通讯系统的应急恢复预案以保证业务系统的连续性。远程维护:组织对国内外远端用户的PC机实行远程维护。调查处理用户投诉:调查处理用户投诉以提高服务质量。协调内外关系:协调相关部门共同处理疑难问题,保证处理效率。1-3-2运行控制副经理组织落实本部门的生产工作:组织、协调运行控制的24小时值班工作,保证正常的生产秩序。故障处理流程:制定、完善故障处理流程并负责监督执行以保障所负责IT资源的可用性。日常监控管理:实时掌握国航网络、系统运行情况,向运行控制经理报告。知识库管理:组织编写故障报告,总结、分析故障原因,积累知识库。工作纪律检查:根据制度和流程的要求,检查各种运行维护记录和值班日志,发现问题及时纠正,保证运行维护记录和值班日志的准确和完整。1-3-3运行控制高级工程师组织拟定并完善系统、网络和通讯系统管理方案:根据不同系统的特点及维护级别,负责组织拟定并完善系统、网络和通讯系统管理方案;建立系统、网络和通讯系统的健康模型,制定系统和网络预警监控策略和故障处理操作流程;以保证各个系统的管理与维护的规范化、标准化。定位主机系统、网络、通讯系统的缺陷,对系统、网络架构和源程序提出优化修改建议:运用相关的专业知识和经验,分析现有系统存在的不足,对系统、网络架构和源程序提出优化修改建议;主机系统 网络及通讯系统的性能优化:通过调整主机系统、网络及通讯系统参数,优化应用与主机、数据库、网络的参数匹配;制定并验证系统网络及通讯的备份、恢复预案:为防止IT资源运行时出现严重的异常情况,制定和验证主机系统、网络、通讯系统的应急恢复预案以保证业务系统的连续性。组织填充和丰富知识库的知识条目:根据维护流程的要求,将各种故障及其他有关问题的解决办法,进行分类整理后,归纳提取加工后形成知识填充知识库中。以便经验共享。1-3-4运行控制工程师负责IT系统资源的管理和维护:负责国航生产系统主机、数据库、应用(含中间件)、网络及有线无线通讯系统的日常管理与维护。负责对主机系统、网络和通讯系统进行安装和设置并进行初始化:根据项目的进度要求和系统安装指导规范,对主机系统、网络和通讯系统进行安装和设置。负责主机系统 网络及通讯系统的性能监控:对这些系统的关键性能指标进行定时监控,分析性能趋势,合理利用各种资源。承担运行维护值班,处理突发事件:承担7X24小时运行值班,按照系统维护手册和故障处理操作流程监控系统及网络通讯资源的状况,处理故障,包括使用系统应急恢复预案等手段处理突发事件。实施对系统、网络的变更:根据系统维护的变更流程,主机系统、网络通讯系统等维护对象实施有计划的变更操作。1-3-5运行控制助理工程师承担对IT系统资源的管理和维护:配合运行控制工程师承担国航生产系统主机、数据库、应用(含中间件)、网络及有线无线通讯系统的日常管理与维护。根据信息安全的要求下发相关的安全策略和补丁。参与对主机系统、网络和通讯系统进行安装和设置并进行初始化:根据项目的进度要求和系统安装指导规范,对主机系统、网络和通讯系统进行安装和设置。负责主机系统 网络及通讯系统的实时监控:利用相应的监控工具对主机系统、应用、数据库、网络、通讯系统实行监控,确保提前发现问题,提前预警,主动消除不安全隐患。承担运行维护值班,处理突发事件:参与7X24小时运行值班,按照系统维护手册和故障处理操作流程监控系统及网络通讯资源的状况,处理故障,包括使用系统应急恢复预案等手段处理突发事件。参与实施对系统、网络的变更:根据系统维护的变更流程,主机系统、网络通讯系统等维护对象实施有计划的变更操作。完成对系统、数据、网络配置的备份:根据不同系统的的维护要求,按照相应的备份手册对系统、数据等系统进行定时备份,或根据实际需要完成一些临时备份,并保证备份数据的完整、有效、准确、及时。参与远程维护工作:与运行控制维护员共同承担远端故障的远程维护工作。1-3-6初级维护员承担7X24小时运行维护值班,处理突发事件:承担7X24小时运行值班,负责填写值班记录工作;按照系统维护手册和故障处理操作流程监控系统及网络通讯资源的状况,处理故障,包括使用系统应急恢复预案等手段处理突发事件。服务受理:负责受理、记录、处理和跟踪客户的各项故障报修和服务请求(故障和业务申报)。故障处理:故障的初步判断和分类;故障单的填写和分派。集中监控:利用相应的监控工具对主机系统、应用、数据库、网络、通讯系统实行监控,确保提前发现问题,提前预警,主动消除不安全隐患。远程维护客户的远端设备:与运行控制助理工程师共同承担远端故障的远程维护工作。故障解决确认:电话回访客户,确认故障和服务请求处理结果。2 运行控制工作细则2-1主机、系统、网络及通讯变更流程及规范2-1-1总则为了加强信息管理部生产环境的管理和控制,减少生产变更处理差错,特制定本管理规定。2-1-2范围国航信息管理部本部在生产运行中,对生产系统和生产环境进行的变动,均需经过变更管理流程。各分部应参照本规定制定相应管理规定。本规定所涉及的信息管理部生产变更管理工作主要通过帮助台系统实现;帮助台系统不能工作或在系统未推广区域需要手工纸面操作时,使用附件中的表格按规定流程执行。2-1-3术语和定义l 变更的定义:是指在维护过程中对系统或服务所作的各种改变,包括增补、移除和其他修改。定期做的维护性工作不含在内; l 变更管理:是指对基础架构或服务的任一方面的变更进行控制的管理流程,该流程旨在将有关变更对服务产生的冲突和偏离减小到最低程度。2-1-4变更管理的组织机构和职能l 运行维护中心是信息管理部的变更管理部门,受理信息管理部内部员工提出的对生产系统和生产环境进行变动的申请; l 变更审批人员,包括申请人上级、经理、各部门高级经理、运行维护中心高级经理、部领导;l 职责和权利:统一受理信息管理部员工提出的各类生产变更申请;负责对提交的变更单的必要项进行审核,并执行提交、催办、退回、关闭任务;检查各级员工提交的变更申请内容是否完整和符合标准;并对其进行初步评价,如果存在不清楚、不合法、不切合实际的或不必要的变更请求,可以退回变更申请单,并向变更申请人说明原因;催办变更的实施;变更实施完毕后负责对变更的实施结果进行确认;l 变更实施负责人是在整个变更过程中承担主要实施工作的人员,负责整个变更实施工作的组织和协调;l 参与实施人根据变更实施负责人的统一安排做好相关的变更工作;l 信息管理部领导负责跟踪、监督和检查变更的状况。2-1-5变更的种类按照紧急程度变更分为一般变更和紧急变更;为了便于变更类别的区分与操作,信息管理部将目前的变更进行如下分类:l 一般变更:除紧急变更以外的变更。此类变更在变更申请提出后的3个工作日以后执行;l 紧急变更:为解决在生产环中境突发的事件、问题而进行的变更。此类变更在申请提出后的3个工作日以内执行。变更实施的时间要尽量避开业务高峰期和特殊日期。一般情况下,变更要安排在20:00至次日7:00期间实施;l 按照变更可能产生的影响和风险分为普通变更和重大变更。重大变更需要信息管理部领导对变更的实施方案进行审批。2-1-6其他情况l 在变更实施过程中,若因某种原因导致变更失败,必须由运行维护中心领导或信息管理部领导决定是否启动回退方案;l 在变更实施过程中,如果需要启动新的变更或因变更计划不周需要调整变更内容,必须按照变更类别报请相应领导审批。2-1-7 变更流程图2-1-8变更处理具体流程2-1-8-1变更的申请:l 变更申请部门:信息管理部各部门。l 变更的申请人:信息管理部涉及变更业务的员工。l 变更申请人通过帮助台提交变更申请;帮助台系统不能工作需要手工纸面操作时,按规定填写变更流程控制表。l 在变更提交前,由指定的实施人负责组织制定“变更实施计划及回退方案”。l 如果不能从帮助台系统中找出合适的变更类型,可以先咨询ECC管理员。待确认无匹配变更类型后,可以先使用其它类别中的未定义变更。ECC管理员则需要召集相关技术负责人讨论变更审批与实施的各项任务,并确定新的变更类型。帮助台系统不能工作时根据变更的风险和影响程度填写变更流程控制表,确认变更流程。2-1-8-2变更的审批l 变更申请单首先提交给申请人上级经理级管理人员审批。上级经理级管理人员负责审核变更申请是否成立,变更是否可行。如果变更不清晰或不必要可以回退给变更申请人。l 如果遇到重大的变更需要由运行维护中心领导或信息管理部领导对变更方案进行审批。l 在变更通过审批后,由申请人上级负责人指定变更实施负责人。2-1-8-3变更的实施l 变更方案批准后,必须在变更实施前将变更可能产生的变化和影响通知可能受影响的用户;l 变更实施负责人按照审批、确认后的“变更实施计划及回退方案”组织实施变更。参与变更实施部门人员,根据变更实施负责人的计划安排配合实施变更;向变更实施负责人员汇报实施结果。2-1-8-4变更的反馈和汇总l 变更实施完成后,变更实施负责人在在帮助台中填写“变更结果”,向上级经理反馈变更实施情况。帮助台系统不能工作需要手工纸面操作时填写变更流程控制表;l 申请人上级根据变更结果负责在帮助台中填写“变更反馈意见”,帮助台系统不能工作需要手工纸面操作时填写变更流程控制表;l ECC管理员负责确认变更是否规范,归档变更资料(含:实施文档和各种技术资料)。l 事件处理过程中需实施变更时可作为事件处理的一部分进行紧急变更。国航信息系统生产环境变更流程控制表1. 变更申请部分(申请人填写)申请编号申请日期变更紧急程度紧急变更 一般变更 重大变更 注:紧急变更指三天内需要实施的变更申请人期望答复日期变更类型主机系统 应用系统 数据库 网络 存储 中间件其他 _部门变更理由变更概述及描述2.变更评估部分(申请人填写)是否有风险是 否风险描述是否影响用户使用是 否影响描述变更方案是否完备是 否 说明:回退方案是否完备是 否说明:变更方案是否进行了测试是 否 说明:回退方案是否进行了测试是 否说明:3.变更审核部分(有风险变更在方案审核会议通过后才能进入中心或部门审批)经理级审批人审批意见审批日期研发中心审批人审批意见审批日期运维中心审批人审批意见审批日期管理部审批人(重大变更)审批意见审批日期变更实施人变更实施日期方案审核会议情况(有风险变更)协调配合情况与用户确认停机情况实施情况5变更结果部分(变更申请人或申请人上级填写)变更结果审核人变更结果审核日期变更实施结果 成功 失败 取消 变更报告是否完备是 否4变更实施部分(变更实施负责人填写)2-1-9 国航信息系统生产环境变更流程控制表2-2系统故障汇报流程2-2-1系统故障汇报流程图A故障产生B.一线汇报故障G.信息管理部部领导D.运行控制经理C.故障处理F.运行维护中心高级经理E.相关责任领导其他部门负责的问题2-2-2流程图说明l 故障产生:故障产生分为两种情况。第一是用户打电话到一线报故障,第二是一线人员巡检时发现的故障。l 一线汇报故障:一线人员发现故障后立刻对依照系统故障快速处理手册排除系统故障,当一级系统发生故障时立刻通知责任领导,二级以下(含二级)系统发生故障后30分钟内无法恢复生产或需通知责任领导,即运行控制经理或项目责任领导。l 故障处理:一线人员依照系统故障快速处理手册排故。l 运行控制经理:运行控制经理在接到一线的故障通知后,与相关故障处理人员联系了解故障情况。视情向维护中心领导汇报故障情况、以及故障处理进展。对于情况严重、影响范围大、故障无法排除需要启动应急预案等情况需立刻通知运行维护中心领导。l 相关责任领导:当接到其他部门负责的问题时,一线人员要通知其责任领导,即系统的负责领导(原则上至少是信息管理部任职的经理或经理以上级别领导)。相关责任领导在接到故障通知后,应与故障处理人员联系了解处理情况。视情向维护中心领导汇报故障情况、以及故障处理进展。对于情况严重、影响范围大、故障无法排除需要启动应急预案等情况需立刻通知运行维护中心领导。l 运行维护中心高级经理:运行维护中心高级经理在接到责任领导汇报后需要根据故障的影响决定是否需要上报信息管理部领导。l 信息管理部部领导2-2-3流程补充说明:l 网络责任领导赵科杰(张民备份)。l 故障的追踪机制。一二级系统及网络故障每三十分钟追踪一次。系统故障向处理该故障工程师询问处理情况,网络故障向赵科杰询问(张民备份)处理情况。l 客户端故障的追踪:到用户现场处理的故障不需要追踪,如果90分钟内未能解决立刻汇报。未到用户现场解决的故障每三十分钟追踪一次,由故障受理点提供故障处理的即时情况。l 反馈机制:故障发生后,由中心机房每三十分钟与用户联系通报故障处理情况。2-3服务器到货安装流程2-3-1设备进入机房通知项目工作计划中包含硬件设备进入信息管理部中心机房相关工作内容的,项目组应及时通知运行维护中心,由运行维护中心提前准备设备的配电、位置等必需条件,此通知需在设备预计到货日一个月前提出。并于设备到货前一周通知运行维护中心进行设备到货安装准备,运行维护中心将安排人员协助项目组完成设备的验货、机房上架、电源连接、KVM连接、网络连接、服务器配置、安装系统操作。通知内容包括设备所属项目名称,设备具体用途,设备型号、规格,电源功耗,设备到货日期,设备到货安装涉及的工作内容和项目计划安排、以及后期对设备再次调整的计划安排。2-3-2硬件设备到货安装流程l 项目组通知运行维护中心计划增加硬件设备规格及数量;l 运行维护中心根据项目组提供信息,确定设备到货后摆放位置并联系物业进行电源布线;l 项目组提供给运行维护中心相关信息,包含具体到货时间,硬件详细信息、连接需要和相关计划;l 运行维护中心根据项目提供信息安排人员,准备设备上架所需配件和工具,协调相关部门准备设备加电、连接条件;l 项目组、信息安全与运行维护中心共同研讨服务器安装规划;l 根据实际需要项目组向网络申请IP地址;l 硬件设备到货时项目组安排专人进行验货,并办理与供货商的收货手续;l 项目组配合运行维护中心完成设备上架;并连接KVM显示设备;l 项目组与运行维护中心共同进行设备的加电测试;l 网络技术人员完成网络连接;l 运行根据前期确定的安装规划实施系统配置及操作系统安装;l 运行维护中心对操作系统进行补丁更新和防病毒程序安装及病毒代码更新;l 信息安全技术人员查看系统安全状态;l 项目组、信息安全与运行维护中心共同核查系统安装状态;l 运行维护中心进行操作系统备份;l 提交系统安装报告;2-3-3职责分工l 项目组1. 提供设备到货安装前所需的详细信息;2. 提供设备的使用计划安排;3. 负责设备的验货及办理与供货商的收货手续;4. 负责申请网络IP地址;5. 配合运行维护中心完成设备加电测试工作;6. 确定责任人配合运行维护中心完成设备的安装工作;7. 组织制订设备安装规划并提供相关信息(系统分区、操作系统版本、补丁要求等);8. 提供操作系统安装介质及相关认证序列号;9. 确认安装结果;l 运行维护中心1. 根据需求,确定机房位置并协调物业准备电源连接条件;2. 参与制订系统安装规划;3. 办理设备进入机房的相关手续;4. 配合项目组进行硬件设备检验工作;5. 设备上架及加电测试;6. KVM连接;7. 系统配置、操作系统安装及系统备份;8. 存储设备接入;9. 安全策略实施;10. 提交安装报告;l 技术支持1. 参与制订系统安装规划,并提供系统安全策略;2. 根据项目需要分配网络IP;3. 网络连接;4. 安全策略验证;2-3-4设备安装责任确认书设备安装责任确认书为了保障信息管理部中心机房安全、稳定、优质的运行,维护各个系统的安全性,设备在进入机房安装前都需要签署设备安装责任确认书。签署此责任书表明签署方已明确硬件设备到货安装流程(要求)的内容,并同意遵照执行。签署方进入机房安装设备时应严格按照机房管理规定进行,保持机房环境卫生,保证相关系统设备的安全。责任书在签署之日起生效,此日期前与本责任确认书有冲突内容以本责任确认书为准。设备类型:设备所属项目组:申请人签名:申请部门领导签名:日期:日期:2-3-5 设备安装申请单申请人联系电话申请人部门申请时间设备到货时间供货方设备所属项目验收责任人设备类型设备安装时间设备型号规格:序号型号功耗外型尺寸项目应用接入存储操作系统需求123456789101112131415申请部门领导意见: 签名: 日期:机房环境责任人意见: 签名: 日期:机房管理责任人意见: 签名: 日期:2-4电子文档管理流程2-4-1 总则国航现有生产系统数量庞大,文档繁多,为加强运行控制生产系统的电子文档管理工作,特建立电子文档ftp服务器,制定电子文档管理流程。电子文档管理主要涉及生产系统相关电子文档的更新、导入等操作。运行控制电子文档包括运行规范、系统维护、应急预案、系统检查、系统报告、应急演练、月度分析会、会议纪要等。2-4-2 文档目录一级目录二级目录三级目录四级目录运行控制运行规范系统维护应用维护数据库维护帐户管理组织架构系统维护系统名称1系统架构管理员手册快速处理系统监控备份策略帐户目录用户手册系统名称2系统架构管理员手册快速处理系统监控备份策略帐户目录用户手册应急预案系统名称1应急预案系统名称2应急预案系统检查系统名称1健康检查月度检查系统名称2健康检查月度检查系统报告故障报告(以时间界定)分析报告帐户审计系统用户应急演练年度方案计划演习报告月度分析会会议纪要2-4-3电子文档管理流程2-4-3-1流程图 2-4-3-2流程说明l 管理员提交电子文档的更新、录入等需求给各组的组长;l 组长将提交上来的电子文档交给文档审核人员审核;l 文档审核人员对提交上来的文档进行审核,如果合格,将文档提交给电子文档管理员,如果不合格,退回给管理员重新填写;l 电子文档管理员对审核通过的文档进行确认,确认合格后,上传到电子文档ftp服务器上,如果不合格,退回给各组组长重新组织审核;l 电子文档更新、录入等操作完成后,电子文档管理员需通知管理员完成并向直属领导汇报实施情况。实施结束后电子文档管理员需记录电子文档更新、录入等操作的完成情况。2-5运行控制值班规范2-5-1 岗位要求l 着装整齐,符合信息管理部员工着装要求,不着便装;l 按时上、下班,不迟到、不早退,不脱岗;l 对工人认真负责,及时响应用户的报修,维护记录清晰、完整;l 对用户服务热情,用语规范,事件处理周到;l 有责任心,能够认真负责地完成本岗位各项工作。2-5-2值班前准备l 每天按时交接班,当天值班人员负责检查相关工具、软件完整性;l 检查休息室及席位卫生状况是否整洁,每天下班班组负责休息室卫生清洁,上班班组负责机房及席位卫生清洁工作,每周三,当班人员进行机房及休息室大扫除;l 下班人员将未处理的完的工作在ECC中交接给接班人员,并在下班时将个人账户从ECC系统签出,当天值班人员上班后立刻登录ECC系统,进入工作状态;l 完成交接班,下班人员需将本班所发生的重要事件以及接到的各项通知向接班人员交待清楚,并将未解决事件转予接班人员,接班人员根据检查情况填写交接班记录;l 值班人员在上岗前要检查耳机,系统监控程序,ECC系统个人账户状态,并准备好纸、笔、值班日志进行工作状态。2-5-3日常工作内容2-5-3-1系统日常检查根据ECC系统事件提示,按时完成生产系统状态检查,包括:l 检查系统主机的运行环境和硬件状态l 检查操作系统的CPU使用率、内存使用率、磁盘使用率和系统日志。l 检查数据库的运行状态、表空间使用率、备份状态和数据库日志。l 检查应用的运行状态、备份状态和应用日志。l 检查数据导入情况,以及数据处理结果。l 检查机房环境。l 监控接口机运行状态。2-5-3-2巡检内容l 早接班同志需要进入机房内检查各个主机硬件状态,检查各主机应用面板,各项信息提示,观察硬盘、内存等有无报警;l 由系统管理员制定各系统巡检内容,检查各系统资源的使用情况,按ECC检查内容填写巡检报告;2-5-4故障处理流程2-5-4-1故障处理流程图2-5-4-2 处理流程说明l 接到用户报故或巡检中发现故障应立即建立事件单进行故障分析;l 一线技术人员根据对应的一线快速处理手册进行故障排除;l 当一线人员按一线快速处理手册无法解决时,应将事件升级,转派给相应的二线人员;l 做好事件追踪,时刻观察已经转出的事件单的进展情况,并向故障用户说明;l 待故障解决后,立即与用户确认,确实恢复后填写故障记录并关闭事件单;l 以远程方式处理国航海外、国内营业部应用系统故障。2-5-4-1处理故障注意事项l 机房值班员受理用户报修需遵照运行控制帮助台电话接听标准用语执行;l 值班员接听报修电话的同时在ECC系统中建立事件单,项目内容填写准确,概述简洁明了,故障描述清晰;l 一线处理故障以最快恢复应用为标准,值班员反映要快速,应用恢复后立刻通知报修用户;l 一线遇到无法解决事件时,应立刻升级事件,将事件单转给相应的二线技术人员,并电话通知二线人员处理事件;l 一线值班员要关注事件的进展情况,了解事件处理情况并将进展通报给报修用户;l 故障结束后,关闭事件单,对报故障用户进行电话回访,询问故障解决情况;发生重大事件或维护工作中需进行重要操作时,一线值班员需立刻通知直属领导。2-6主机、系统、网络及通讯初始化安装规范2-6-1总 则为规范国航各类系统的主机、系统、网络及通讯初始化安装,以国航股份现有相关管理规定为依据,制定本规范。2-6-2范围本规定在国航股份内部发布,适用于国航股份各类主机、系统、网络及通讯初始化安装.2-6-3初始化安装规范初始化安装应符合以下的规则:l 明确各磁盘文件系统的分布原则;l 具有安装介质的详细信息;l 包括所安装软件的版本信息。2-6-4安装准备l 检查场地,确定服务器位置、配电、网络连接、存储连接,协调相关人员完成;l 核对设备清单;l 阅读设备的随机文档;l 制定安装规划:对于2块硬盘的关键服务器必须做RAID1,首选硬件级别的RAID 1。2-6-5系统初始化安装l 换页空间设置不小于物理内存;l 系统分区至少分别保证10G以上(对于硬盘空间有限的,可以考虑只分出一个至两个分区);l 除非有特别需要,操作系统均采用完全安装方式,设置管理员密码,要求按照账户管理规定执行;l 安装系统的全部补丁;l 操作系统安装完成以后,根据需要启动所需的服务,如telnet,ftp等,根据需要停止不需要的服务;l 建立普通登陆账号(密码要求同上)提供用户使用,不得将管理员账号直接提供给用户使用,各系统/设备帐户管理级别划分应至少包括两级(系统管理员帐户和普通帐户);l 验证安装是否成功。2-6-6后续工作l 提交安装手册;安装手册中应包括:系统安装过程、系统分区实际划分情况、系统配置信息、系统用户信息、安装中出现的问题及解决方法。2-7主机、系统、网络及通讯性能监控 2-7-1总 则为保障国航各类系统的稳定运行,监控各系统的资源使用情况,以国航股份现有相关管理规定为依据,制定本规范。2-7-2范围本规定在国航股份内部发布,适用于国航股份各类系统/设备的性能监控。2-7-3 性能监控规范2-7-3-1性能监控应包括以下的内容:l CPU主频速率及使用率百分比;l 内存空间容量及使用率百分比;l 换页空间容量及使用百分比。l 硬盘容量及使用百分比。2-7-3-2监控时间应根据系统重要性实行分级管理,分为一级系统、二级系统、三级系统,应严格执行监控规范:l 一级系统:指与生产密切相关,保障公司直接效益或航班飞行安全的系统。l 二级系统:指辅助生产相关系统,如运价系统等。l 三级系统:指与生产无关的系统,如代理上网系统。2-7-3-3制定资源使用率上下限:l 当系统资源使用率上下差值达到50%,并且最大使用率达到80%,视为服务器资源使用已达到上限,系统资源已达到极限。l 当系统资源使用率上下差值低于20%,并且最大使用率低于20%,视为服务器资源未充分利用,系统资源属于低利用率。l 当系统资源使用率总是处于20%到80%之间时,视为服务器资源充分利用,资源利用率属于良好使用。2-7-4细则l 根据系统重要性,应每天至少监控两次系统资源使用情况并做记录;l 系统管理员每月对系统进行全面检查,填写系统月检查单并进行归档;l 系统管理员应对资源使用异常的系统进行分析并上报;l 系统管理员每季度应分析统计出的性能表,根据系统级别将所维护的服务器的运行状态进行分类,并将达到资源上限和未充分利用资源的服务器重点列出;系统管理员应将性能表统一存档。2-8 主机系统日常管理规范 2-8-1总则为保证国航主机系统的正常运行,保证国航生产系统的规范管理,根据系统管理的工作内容特制定此管理规范。该规范适用于国航信息管理部系统管理员对应用系统的日常管理。2-8-2目的为了提高系统维护工作的水平,保证系统维护工作的质量,从而保证系统运行的安全与稳定。2-8-3范围本规范分为六大模块,分别为主机系统的性能管理、容量管理、配置管理、安全管理、系统的备份与恢复管理及故障管理。2-8-3-1主机系统的性能管理:定时监控主机系统性能,包括:2-8-3-1-1主机系统性能l 检查主机系统硬件状态;l 检查主机系统CPU使用率;l 检查主机系统内存使用率;l 检查主机系统磁盘I/O情况; l 检查主机系统硬盘或文件系统使用率;l 检查系统日志;l 检查系统防病毒软件状态;l 检查应用关键进程。2-8-3-1-2主机系统定期巡检l 进行日常检查的所有工作;l 检查系统补丁状态;l 定期修改系统密码;l 定期清理硬盘或文件系统。2-8-3-1-3主机系统停机维护l 定期对主机系统进行停机维护及双机切换测试; 2-8-3-2系统的容量管理:根据连续的监控记录追踪主机系统的月使用情况,包括:l CPU 的月平均使用率l 内存的月平均使用状况l 磁盘I/O的月平均使用情况l 硬盘空间的使用情况及增长速度l UNIX操作系统,其文件系统的空间增长速度及空间使用情况依据应用的需要或主机资源实际使用情况及时提出升级或者更新方案2-8-3-3 主机系统的安全管理l 加强对操作系统用户及账号的管理,建立用户档案l 跟踪微软及主机厂商最新系统漏洞及补丁发布公告,及时为系统打补丁或根据应用要求进行升级l 加强对病毒的监控及对杀毒软件病毒代码的升级l 定期修改账号密码2-8-3-4系统的配置管理:l 建立各主机系统的配置档案并及时更新维护l 为主机系统升级提供硬件升级方案l 建立、管理和维护系统最终软件库、配件库和耗材库2-8-3-5主机系统的备份与恢复管理:l 制定和更新主机系统备份方案l 制定和更新主机系统恢复预案l 定期进行系统备份,保证一台主机至少有一个系统全备份l 根据应用的要求定期备份应用程序及数据l 操作系统改变后重新备份操作系统l 定期进行恢复测试,保证备份的可用性2-8-3-6主机系统故障管理l 编写并更新主机系统故障处理手册l 分析故障原因、提交解决方案l 根据故障解决方案及时解决故障l 故障解决后进行总结并提交总结报告2-9应用(包括中间件)日常管理规范2-9-1总则为了保障应用软件的正常运行,最大限度减小应用故障时间,特制定此维护规范。2-9-2应用软件运行维护指导规范2-9-2-1应用软件的日常检查和定期巡检:2-9-2-1-1应用软件的日常检查,包括:l 检查应用软件的运行环境,软件进程资源使用状态;l 检查应用软件运行状态及应用相关的日志;l 检查数据库的运行状况、表空间使用率、备份状况和数据库日志;2-9-2-1-2对应用软件的定期巡检与维护:l 除日常检查的内容外,还应包括n 数据库、中间件及应用软件的配置信息,确认n 用户使用状态;l 提交应用软件巡l 检报告、评估报告、性能分析;l 定期对应用程序进行维护。2-9-2-1-3应用软件的备份、升级与变更l 制定应用、中间件的详细备份策略;l 定时监控备份作业的状态;l 定期进行恢复测试;l 软件的升级与变更要严格遵守国航ECC变更管理规定并且提供完备的回退方案与测试报告,明确变更的责任人、实施人、确认人。2-9-2-1-4应用软件的问题管理:l 根据日常故障的处理记录,每周例会分析总结,对重复出现的故障加以归类总结提交知识,对重复出现两次以上并且未知原因恢复的故障提交故障报告并抄送相关领导,转技术支持解决;l 对于巡检及总结出的潜在风险或性能、安全、优化等问题,提交解决方法,并且转技术支持提供方案指导后,由管理员总结后,提交相关领导,根据实际召集相关项目组裁定是否实施。2-9-2-1-5应用软件的配置管理:l 建立应用、中间件的配置档案,如果同时负责多个应用,要将多个系统尽量合并到一份文档中以备快速查询;l 建立健全应用维护需要的各种文档并及时更新定期更新配置档案。2-9-2-1-6 应用软件的安全管理:l 了解应用、中间件的用户数量、分布及用途;l 定期检查更新应用、中间件的补丁(走变更流程做好测试方可打补丁,采用最小化原则选择补丁)l 密码的管理要符合运行维护中心账户管理规定(细则),必要时可采取AB角管理员只拿部分密码的制度,注意定期与不定期修改密码,并且检查已有帐户。l 详细记录对应用系统的各项修改。2-9-2-1-7 应用软件故障处理流程要求:l 对应用软件进行维护操作前应准备实施方案,并填写变更申请单,经运行维护中心领导审批通过后按实施方案进行操作。制订实施方案时如遇到任何问题可召集运行维护中心技术支持进行研讨,制订的方案要求考虑周到且方案确实可行。做好详细的修改记录,以备查阅和审计。l 方案实施完成后要上交工作报告,详细说明方案实施情况及最终结果;l 故障处理以快速恢复生产为原则。2-10 数据库日常管理规范 2-10-1总则为规范国航信息系统内部数据库的实施和运维,保障生产系统数据库的安全可靠不间断的运行,制订本规范。2-10-2范围本规范在国航股份信息管理部范围内发布,适用于国航股份信息管理部各类系统的数据库管理。2-10-3 数据库管理员工作内容l 数据库安装和启停l 数据库日志跟踪l 数据库定期清理(临时文件与log日志等)l 数据库性能检测、修改配置(包括配置参数修改和表空间扩充等)l 管理用户和安全性(包括从数据库中删除过时的用户,创建新用户和密码管理等)l 数据库故障处理与结果跟踪l 失效对象检查与处理l 触发器和存储过程的修改l 后台数据库表和视图的检查l 新系统的测试环境搭建2-10-4数据库管理员工作细则:l 运行维护中心数据库管理员在应用测试实施阶段与应用开发中心数据库管理员配合完成上线实施前的数据库功能及压力测试,以保证将来移交的数据库系统的可靠稳定;l 对于已经上线并投入生产的系统数据库移植,数据库管理员需要配合项目组实施数据库移植工作;l 数据库补丁的安装需要严格控制,只有对应用、性能或数据库安全产生重大影响的bug才允许进行补丁更新,更新bug要严格遵守升级制度并留存文档记录;l 数据库管理员要监控数据库运行中各个表空间增长、数据文件增长、数据增长,对于异常增长要及时进行响应处理。监控日志文件、Trace文件有无错误信息,对数据库错误进行响应处理。对数据库的CPU、内存占用进行监控,发现并处理各种隐患;l 数据库管理员根据数据量和实际需要制定出系统的备份策略,并定期做恢复测试,以保证备份可用;l 当数据库或数据出现问题时,数据库管理员根据具体的恢复需要,对数据库或数据进行必要的恢复;l 数据库管理员根据数据库运行情况,提出优化建议;l 数据库管理员要不断的改进维护策略,使日常的管理更加自动化、标准化、文档化; l 数据库的变更要遵守国航ECC变更管理规定的要求;l 每月做一次趋势分析,并跟踪应用的变更情况,以防止用户激增等情况对数据库产生重大影响;l 数据库管理员应不断完善应急恢复预案并定期测试应急恢复预案的可行性;l 定期检查数据库中的各类用户,以保证数据库的安全性;l 数据库管理员严禁非授权操作数据库中业务数据。2-11日志管理规范2-11-1 总则为规范国航信息系统内部日志的管理,检测未经授权的信息处理活动,记录信息安全事件,制订本规范。2-11-2范围本规范在国航股份信息管理部范围内发布,适用于国航股份信息管理部各类系统的日志管理。2-11-3 日志的分类日志的分类包括:操作系统日志、应用系统日志、数据库日志、网络设备日志和安全设备日志。每一类日志记录中都必须记录以下内容:事件发生的日期和时间、事件描述,操作者信息,成功和失败操作。2-11-3-1操作系统日志应至少记录以下信息:l 操作系统的启动关闭信息;l 用户登录信息;l 特殊权限使用;l 系统运行状态信息(包括报警、故障信息);l 主机系统配置变更信息。2-11-3-2应用系统日志应至少记录以下信息:l 应用系统的启动关闭信息;l 重要模块(如日志模块)的启动关闭信息;l 用户的登录信息;l 用户的关键操作信息(如修改密码);l 应用系统运行状态信息(包括报警、故障信息);l 重要配置参数的变更信息。2-11-3-3数据库日志应至少记录以下信息:l 数据库系统的启动关闭信息;l 用户的登录信息;l 数据库运行状态信息(包括报警、故障信息)。2-11-3-4网络设备日志应至少记录以下信息l 设备的启动关闭信息;l 用户登录信息;l 端口变化信息;l 设备运行状态信息(包括报警、故障信息)。2-11-3-5安全设备日志应至少记录以下信息l 设备的启动关闭信息;l 用户登录信息;l 端口变化信息;l 安全事件信息;l 设备运行状态信息(包括报警、故障信息)。2-11-4日志管理细则l 管理员应确保各自管理的系统开启时钟同步服务功能,并每天检查时间同步是否正常并予以记录;l 管理员应对各自管理的系统/设备设置合适的日志策略,以确保日志内容至少可以保存一周;l 系统管理员的操作活动也必须被记入日志,不得停用日志或删除日志服务;l 系统管理员每天对所管理的系统产生的相关日志进行检查,对日志中的错误或可疑项应予以记录,如部门内部无法分析判断错误或可疑项,应提交至信息安全部门进行分析处理,处理结果应补充记录到日志检查记录中;l 日志文件应加以保护,以防止未授权的访问篡改 (如设置日志文件访问控制权限、使用统一日志服务器);l 信息安全部门应定期对各系统的日志检查记录等进行审计。2-12主机、系统、应用及网络帐户管理规范2-12-1总则为保障中国国际航空股份有限公司(以下简称“国航股份”)各类系统的帐户安全,以国航股份信息系统安全管理要求、IT运行维护服务说明书和ISO27001:2005 信息技术 安全技术 信息安全管理体系要求为依据,制定本规范。2-12-2范围本规定在国航股份内部发布,适用于国航股份各类系统、应用的帐户管理。2-12-3帐户申请2-12-3-1用户依照IT运行维护服务说明书操作流程,从国航内网下载系统的相关申请单,正确填写后由部门经理以上负责人签字并加盖单位公章传真至信息管理部,传真号2-12-3-2申请单使用权限填写要求属实,信息管理部负责申请单最终审核,如与实际情况不符将被要求重新提交申请;2-12-3-3审核并通过的申请由信息管理部统一协调安装客户端。2-12-4帐户登陆2-12-4-1用户在第一次登录系统时要修改帐户初始密码,并将各人信息补充完整;2-12-4-2修改后的密码应符合各系统密码管理的要求,密码长度不小于8位,采用字母、数字、大小写区分进行组合;2-12-4-3对于没有在规定时间内修改初始密码的用户,信息管理部有权停止该帐户的使用。2-12-5帐户管理2-12-5-1用户要每季度定期修改密码,保证帐户使用安全;2-12-5-2用户发生岗位调整,请根据新岗位职责及时填写用户“权限变更申请单”进行帐户变更;2-12-5-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论