版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
系统运维培训手册版权归属密级内部公开作者版本V1.0状态草稿时间2016.09.21发布文件标识无修订修改内容IT系统运维流程和详细步骤日期:2016年09月21日TOC\o"1-5"\h\z\o"CurrentDocument"一、导言 4目的 4范围 4\o"CurrentDocument"版本信息 4\o"CurrentDocument"系统概述 4\o"CurrentDocument"二、系统运维体系框架 4\o"CurrentDocument"运维团队人员划分 4\o"CurrentDocument"岗位人员分配 6\o"CurrentDocument"三、基础建设管理 7\o"CurrentDocument"系统架构 7\o"CurrentDocument"服务器资产管理 7\o"CurrentDocument"信息统计管理 9\o"CurrentDocument"信息资产记录 9\o"CurrentDocument"帐号密码管理 9\o"CurrentDocument"四、部署 9\o"CurrentDocument"基本原则 9\o"CurrentDocument"存储设备 10\o"CurrentDocument"数据库部署 10\o"CurrentDocument"操作系统 10\o"CurrentDocument"公司软件 11\o"CurrentDocument"五、监控 11\o"CurrentDocument"基础监控 11\o"CurrentDocument"DOCKE监控 11\o"CurrentDocument"听云监控 11\o"CurrentDocument"六、故障与排障 12\o"CurrentDocument"故障等级 12\o"CurrentDocument"报障流程 13\o"CurrentDocument"排障流程 13\o"CurrentDocument"突发事件应急策略 13\o"CurrentDocument"行为规范 14\o"CurrentDocument"七、升级 14\o"CurrentDocument"硬件升级 14\o"CurrentDocument"硬件升级规范 14\o"CurrentDocument"软件升级 15\o"CurrentDocument"软件采购申请规定 15\o"CurrentDocument"软件验收 15\o"CurrentDocument"软件使用 15\o"CurrentDocument"八、经费管理 16新增项目流程 16新增人员流程 16、导言目的该文档的目的是描述彩生活IT系统用户使用说明,其主要内容包括:运行环境安装与配置操作说明本文档的预期的读者是:运营人员、测试人员、研发人员等范围该文档定义了系统提交产品的使用说明,主要描述了产品的操作流程,以及配置说明。版本信息下表展示【系统运维培训手册】版本更新记录修改编号修改日期修改后版本修改内容012016.09.21V1.0基础框架说明系统概述《系统运维培训手册》旨在服务于彩生活IT运维部门,有效管理IT系统、满足集团IT设备管控需求,提高集团IT运维智能化。:、系统运维体系框架2.1运维团队人员划分岗位名称岗位职责
产品经理拟订部门阶段工作计划,协调部门内部工作,实施部门员工管理与业绩考核,提出部门员工配置与奖罚意见,指导并督促部门员工工作,保证正常工作进度。根据工作量合理安排部门人员分工,并进行督促指导、检查与考核。协调运维工作中公司与业主之间的良好关系,提高服务满意度。加强工作质量的管理力度,组织人员对负责路线进行事前控制和实时检查,对检查中发现的问题及时采取措施。协调处理系统运行中出现的系统、技术问题,采取有效负责处理方法,防止不良事故的发生。定期组织部门人员进行培训、会议及学习,提高业务水平。完成公司领导交办的其他工作任务。系统工程师.负责服务器的搭建、维护等工作。.各项服务器的日常管理、维护、保养、检查及日志的监控与分析。.负责集团各项应用系统运行部署、网络设备调试、服务器管理等工作。.负责各类应用系统的故障分析及错误排除。.负责集团信息化硬件项目建设,包括需求调研、产品选型、实施、培训和技术支持工作。网络工程师.负责中心机房网络设备、环境、运作状况的维护、保养、检查;视频、电话会议系统管理与维护。.视频监控系统管理与维护。.防火墙、路由器、数据交换机、光端机、UPS的状态监控,以及性能优化,配置修改,保证外网对公司官网的访问以及公司内部网络的正常;维护公司VPN线路,保证邮件等系统的正常访问;sdh专线、光连路的监控、测试、故障申报与解决。.公司Internet域名、二级邮件域名、DNS指向等互联网业务申请、分理和维护。.负责集团网络工程的规划、督导、项目实施及技术支持。技术支持.负责协助部门领导完成IT相关项目计划和实施。.负责项目实施过程中岗位培训、应用指导、项目日常管理。.负责跟踪项目进度,协调各部门成员之间的合作。.及时向项目主管汇报项目的进展情况和实施、应用过程中出现的问题。.客观公正地对项目成员、操作人员的工作进行组织、监督和管理。.项目总结以及项目文档的编写,为项目提供有针对性的解决方案,并采取各种实际措施,推动解决方案的落实。.协助本地网络、相关办公设备维护及视频、电话会议开通。.完成部门领导安排的其他工作。运维客服.邮件、RTX、OA等信息化系统技术支持工作。.记录集团内部申报的IT故障,并转交相关责任人进行处理,对故障处理结果进行跟踪及反馈。.负责邮件、RTX、OA应用系统后台维护管理工作,根据各单位需要进行办公系统的开通、撤销、组织架构调整等相关工作,并实时进行记录。.对邮件密保使用情况进行管理,对涉密人员进行密保绑定及特殊情况的处理,保障邮件系统安全运行。2.2岗位人员分配三、基础建设管理系统架构服务器资产管理服务器资产定义1.服务器资产资产主要包括员工正常应用所配备的服务器及配套软件,为服务器环境所购置的网络设备、配件,包括资产性支出固定资产部分及费用支出非固定资产部分。服务器资产分类资产类别类别细分说明主管部门硬件类终端设备主机、显示器、研究院网络设备路由器、交换机、防火墙、HUB、机柜等研究院服务器邮件、DM服务器,应用系统服务器等研究院耗材类配件硬盘、内存、网卡、显卡,主板、CPU等研究院耗材键盘、鼠标、U盘、光驱、网线、电源线、插线板等研究院软件类终端使用操作系统、办公软件、辅助软件、云服务器及相应部专用软件研究院服务器使用操作系统软件与服务器应用软件等研究院综合使用网络管理软件与财务应用软件等办公辅助软件研究院硬件类资产管理IT资产硬件类属于资产性支出的固定资产部分。在IT资产硬件类管理过程中,不同阶段会出现资产的入库验收、管理、使用申请、借用、转移、报废等操作。以上所有操作都必须严格遵守相关操作规程方可执行。.硬件类入库验收规定硬件类入库验收是指运维部门接收到采购申请单采购的服务器等IT硬件类资产后,办理资产入库前对相关资产进行的资产清点、外观检查等查点和核实的过程。在资产入库验收时如发现所验货物与装箱单等不符或设备外形出现严重变形,主管部门负责人有责任将验收结果反馈给采购部门,由采购部门负责处理退货或更换等事宜。主管部门在取得相关IT资产并验收完之后使用之前依其类别和科目予以分类粘贴资产编号标签。所有经过验收后入库的资产均由运维部门负责保管,如出现由于保管不利而造成的资产遗失、人为损坏等情况,运维部门将承担主要责任。运维部门在办理完入库验收工作后,必须对所有入库资产进行登记,填写验收、使用、更换、报废登记表。.硬件类资产使用申请规定根据业务需要,在oa上填写资产申请表申请。.硬件类资产的借用规定除主管部门外,任何人都无权出借硬件类资产或安排出借硬件类资产事宜。主管部门的硬件类资产登记台帐应反映出借用部分,保证使用权和其它权限的清晰明确。.闲置硬件类资产的回收与发放规定闲置类硬件资产回收后,主管部门将根据评估其性能等,并记录闲置类资产台帐中,根据以后的需求情况进行再次发放和调控,投入再使用。.硬件类资产报废规范本制度规定办公IT硬件资产的报废采用两种方式,即主动报废方式和被动报废方式。被动报废方式是指当硬件类资产受到严重损伤且简单维修无法恢复使用时,其价值明显减少的情况下应提交申请报废。此外这种报废还包括已经满折旧年限且无法维持正常工作的硬件类资产部分。被动报废方式是通常意义上的报废方式,相关报废规定如下:1)主管部门按照规定提交相关报废申请,由财务部安排报废,并由财务作相应的会计处理。2)报废的发起人为主管部门,员工无权申请报废。3)报废时主管部门必须填写报废申请单,同时在报废登记表中进行登记,反映已经报废的那部分资产。4)报废的编号不重新使用。主动报废方式是指硬件类资产由于使用时间的增长,作为办公平台所能提供的性能、效率、可靠性和稳定等已经很难满足事务所办公的最低端业务的需要时,由主管部门根据资产本身的性能指标分析并结合受益人的意见,提请对硬件类资产的报废。主动报废方式是从办公效率和新业务需求等角度去主动地做适当的淘汰。主要操作规范参照被动报废方式的相关规范。3.3信息统计管理信息资产记录(一)硬件设备型号、数量、版本等信息统计记录(二)软件产品型号、版本和补丁等信息统计记录(三)网络结构、网络路由、网络IP地址统计记录(四)综合布线系统结构图的绘制(五)其它附属设备的统计记录帐号密码管理(一)服务器和数据库的管理账号密码,由系统管理员和数据库管理员设定并持有,实行定期修改制度,最长有效期不超过90天。(二)更换服务器与数据库密码时必须报行政封存,以防遗失密码。如发现密码及口令有泄密迹象,管理员要立刻报告主管领导,严查泄露源头,同时更换密码。(三)密码需要按照以下规则设定,即由大写字母,小写字母,数字,和字符组成;最低位数为10位;不能与以往的密码重复。(四)建议借助密码生成器按照密码设定规则,生成密码。四、部署4.1基本原则利用虚拟容器技术的“一次装载到处部署”的特性,实现统一特性的服务节点规模部署,而节点间彼此独立。存储设备例如raid磁盘阵列,san存储系统、磁盘阵列、等存储设备。存储设备部署,主要由系统运维工程师负责。基本步骤如下.现场备件安装配合厂商(供应商)进行现场备件安装。.补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。.升级服务对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。.问题管理系统对遇到的问题进行汇总和发布。形成技术文档。.系统优化监控管理对设备进行系统的优化监控,对存储交换机设备状态、端口状态、传输速度监控、对监控备份服务进程、备份情况(起止时间、是否成功、出错告警)监控、对监控记录磁盘阵列、磁带库等存储硬件故障提示和告警等监控,对存储的性能(如高速缓存、光纤通道等)进行监控。并及时解决故障问题、数据库部署.数据库选型对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境,降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张.数据库软件安装。进行数据库环境部署,数据库空间的规划管理,设定自动备份机制等。完成部署文档。.检查数据库系统是否需要应用最新的补丁集进行数据库补丁升级,完成服务器运行文档。.数据库系统优化分析用户的应用类型和用户行为、监控数据库性能、评价并修改数据库的参数设置、评价并调整数据库的数据分布、评价应用对硬件和系统的使用情况,并提出建议。提供完整的性能调整报告和解决方法4.3操作系统.操作系统选型根据应用的运行环境,进行最优的系统选型。.部署操作系统,并连通网络。完成部署文档.检查操作系统是否需要应用最新的补丁集,.登记操作记录表4.4公司软件五、监控5.1基础监控从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维监控。.设备基础性能检测:cpu、内存使用情况监测;.设备日志查看;.设备snmp状态;.测试Ping,tracert等工具的连通性;.网络安全策略应用是否正常;.Internet带宽流量的实时监测;.网络拓扑链路状态监测;.异常网络数据包流量;.Dos、ddos等网络攻击情况监测;.Internet线路的误码率、丢包率监测;docker监控听云监控听云Server是服务端应用性能解决方案。通过在服务端应用中植入探针,可以对应用代码、关系型数据库、NoSQL、外部服务、服务器进行监控,帮助用户即时获取相关性能数据并进行智能分析,在代码层面上定位错误发生、性能下降的原因。听云运行架构图
巨实用户视龟巨实用户视龟听云监控流程.向研究院领导提出申请需将应用部署上听云监测问题的专业公司,首先需向研究院领导提出申请,申请之前请准备好应用项目的相关信息,包括:应用名称、开发语言、部署的机房名称或者服务器资产托管供应商、部署服务器、服务器相关配置、申请使用时间(期限)、应用类型等信息,形成.txt文档上传到附件。(使用case:42645)记录.领导审批研究院领导会根据专业公司提供的应用项目信息进行审核。.落实三部署工作如果领导审批同意部署将进入部署工作。.登录应用,使用应用、产生数据。.测试成功产生数据后反馈给项目。.运维人员监看数据变化,出报告,协助解决问题。六、故障与排障故障等级故障级别响应时间故障解决时间I级:属于紧急问题;其具体现象为:系统崩溃导致业务停止、数据丢失。10分钟,30分钟内提交故障处理方案3小时以内II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。10分钟,30分钟内提交故障处理方案6小时以内
IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。10分钟,2小时内提交故障处理方案24小时以内12小时以内III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。10分钟,30分钟内10分钟,30分钟内提交故障处理方案发现故障故障现象项目负责人运维人员,导流机房间题联系机房处理使用相应方法保存业苗正常事故报告报障基本流程发现故障故障现象项目负责人运维人员,导流机房间题联系机房处理使用相应方法保存业苗正常事故报告排障流程突发事件应急策略1、值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。2、正常情况下,要求值班人员在10分钟内进行事件确认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。3、在处理过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 船闸及升船机运管员安全技能知识考核试卷含答案
- 人造板饰面工安全生产基础知识考核试卷含答案
- 风电机组机械装调工岗前设备巡检考核试卷含答案
- 制粉工班组评比能力考核试卷含答案
- 海洋水文气象观测员安全综合知识考核试卷含答案
- 贵金属首饰与宝玉石检测员安全意识能力考核试卷含答案
- 水生植物疫病检疫员安全强化测试考核试卷含答案
- 木门窗工安全生产规范水平考核试卷含答案
- 己内酰胺装置操作工QC管理模拟考核试卷含答案
- 飞机环控救生内饰系统装调工岗前强化考核试卷含答案
- 江苏省高职单招《职测》考试题库(附答案)
- 液体复苏策略的“精准化”与“个体化”融合
- 2025年自治区体育局直属单位自治区体育科研中心(自治区反兴奋剂中心)面向社会工作人员(5人)笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 建筑国企合规管理培训
- 药物临床试验与生物统计方法
- 2025年30道逻辑思考题及答案合编
- 成都交子金融控股集团有限公司招聘笔试题库2025
- 职业技能培训教案编写指南
- 2022危险性较大的分部分项工程专项施工方案编制与管理指南
- 建筑工程抗震设计技术要点
- 同济大学《机械设计基础训练》2024-2025学年第一学期期末试卷
评论
0/150
提交评论