运维工作规划_第1页
运维工作规划_第2页
运维工作规划_第3页
运维工作规划_第4页
运维工作规划_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、运维工作简介系统简介、服务器数量与用途二、运维管理范围与职责管理范围本平台内所有架构,运维部负责公司业务系统运行维护工作。职责保障公司游戏服务器的正常运行、网络的畅通。严格岗位制度、明确工作职责,规范工作流程。工作规范化,制度化,加强文档管理力度。三、组织结构根据运维工作的范围和性质,下设三个小组:系统维护组应用维护组技术值班组四、服务维护系统维护检查安全日志检查系统日志检查应用日志记录并核对各系统磁盘容量记录并核对各磁盘文件数量记录并核对系统账户记录并核对系统服务记录并核对系统进程CPU内存PID线程数查询系统更新应用维护检查各应用程序状态记录并核对各应用程序配置记录并核对应用系统文件记录并

2、核对应用系统文件MD5测试各应用系统功能记录并核对各应用系统CPU内存PID线程数检查应用程序更新网络维护检查服务器连接数量检查上行下行带宽记录值检查网络损耗峰值检查并记录各服务通信端口检查并记录通信延迟分析带宽负荷分析访问量硬件维护检测并记录各硬件温度检查驱动状态检查各硬件状态数据库维护检查备份文件核对备份时间核对备份内容查询并记录锁定查询并记录SQL效率对比数据内容交接班进行日志数据库备份实时检查日志数据库五、服务器实时监控磁盘文件增减监控通信效率监控服务器使用率监控服务器性能监控网络上行下行带宽监控数据库操作监控硬件温度监控六、工作内容设备管理:对网络设备、服务器设备、操作系统运行状况进

3、行监控和管理。应用/服务管理:对各种应用支持软件如数据库、中继、CDN以及各种通信或特定 服务的监控管理,如DNS、Web等的监控与管理。数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复。数据管理:包含对公司自身核心数据系统的运行情况的监控与管理,对于数据的管 理,主要关注该数据系统的消耗与增长。内部系统管理:该部分主要对于本公司需要统一发布或因人定制的内容管理和对 公共信息的管理,如客服系统、推广系统。资产管理:管理本公司服务系统的资产情况,是逻辑存在的,并能够与本公司财务部 门进行数据核对。信息安全管理:目前信息安全管理主要依据的是企业安全组织方式、资产控制、人 员安全、物理

4、与环境安全、通信与运营安全、访问控制、数据连续性管理等。日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供 运维日志报表、提供解决经验与知识的积累与共享手段。应急预案一、预警机制预警级别警报内容预警级别介绍一级预警网络流量升高系统资源升高数据备份出现异常热备份出现异常监控软件出现故障一级预警表示系统出现故障,但不影响运维系统的正常运转。二级预警超过系统资源超过网络资源网络中断或网络异常防御资源内的攻击操作系统出现异常应用系统出现异常数据库相关异常二级预警表示系统出 现故障,影响运维系 统的正常运转,但运 维工程师可以在短时 间内进行故障排除。三级预警超过防御资源的攻击硬件

5、物理损坏三级预警表示系统出 现故障,影响运维系操作系统出现不可恢复性故障数据库无法正常使用统的正常运转,运维 工程师不能在短时间 内进行故障排除。四级预警ISP IDC机房故障受到不可抗力或自然灾害的破坏。四级预警表示系统出 现故障,运维系统中 断,运维工程师无法 排除。二、预警上报处理流程运维过程中出现重要故障或紧急情况时,按以下规定流程进行处理及汇报。在遇到 故障时,及时汇报上级领导并采取措施及时解决,具体汇报流程如下:一级预警当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析 故障原因。运维工程师在排查出故障后,立即着手解决。在故障排除后,通知组长并对所发生故障的设备

6、进行事后跟踪。在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。二级预警当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析 故障原因。运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技 术人员到现场,应立即拨打技术工程师联系电话,请求立即到现场进行故障排除。立即报告运维中心主管人员,主管人员应通过电话或当面把故障报告给相关技术 部门。在故障排除后,运维工程师应对故障原因及解决办法进行详细说明。三级预警当通过监控或得知系统出现故障时,首先在最短的时间查看故障点状态,并分析 故障原因。运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要相关技 术人员到现场,应立即拨打技术工程师或第三方技术部门联系电话,请求立即协调 进行故障排除。立即报告给运维中心主管人员,主管人员应通过电话或当面把故障报告给相关领 导部门,在故障完全排查清楚后以书面形式递交“故障报告单”。在故障排除后,运维工程师应对故障原因及解决办法进行详细

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论