系统运维培训手册_第1页
系统运维培训手册_第2页
系统运维培训手册_第3页
系统运维培训手册_第4页
系统运维培训手册_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

系统运维培训手册

版权归属密级内部公开

作者版本V1.0

状态草稿0时间2023.09.21

公布文献标识无

修订

修改内容IT系统运维流程和详细环节

日期:2023年09月21日

目录

一、导言........................................................................

1.1目口勺.........................................................................5

1.2范围........................................................................5

1.3版本信息....................................................................5

1.4系统概述....................................................................5

二、系统运维体系框架..............................6

2.1运维团体人员划分............................................................6

2.2岗位人员分派................................................................7

三、基础建设管理..................................8

3.1系统架构.....................................................................8

3.2服务器资产管理..............................................................8

3.3信息记录管理...............................................................II

3.3.1信息资产记录.............................................................II

3.3.2帐号密码管理............................................................11

四、布署.........................................................12

4.1基本原则....................................................................12

4.1存储设备....................................................................12

4.2数据库布署.................................................................13

4.3操作系统...................................................................14

4.4企业软件...................................................................14

五、监控..........................................14

5.1基础监控....................................................................14

5.2DOCKER监控................................................................15

5.3听云监控....................................................................15

六、故障与排障..................................................................16

6.1故障等级....................................................................16

6.2报障流程....................................................................17

6.3排障流程....................................................................17

突发事件应急方略......................................................................................................................................17

6.3.2行为规范..............................................................................................................................................18

七、升级........................................................................18

7.1硬件升级....................................................................18

7.1.1硬件升级规范...................................................................................................................................18

7.2软件升级...................................................................19

软件采购申请规定......................................................................................................................................19

一、导言

1.1目的

该文档的目的是描述彩生活IT系统顾客使用阐明,其重要内容包括:

•运行环境

•安装与配置

•操作阐明

本文档的预期的读者是:

•运行人员、测试人员、研发人员等

1.2范围

该义档定义了系统提交产品的使用阐明,重要描述了产品的操作流程,以及配置阐明。

1.3版本信息

下表展示【系统运维培训手册】版本更新记录

修改编号修改日期修改后版本修改内容

012023.09.21V1.0基础框架阐明

1.4系统概述

《系统运维培训手册》意在服务于彩生活IT运维部门,有效管理IT系统、满足集团IT设

备管控需求,提高集团IT运维智能化。

二、系统运维体系框架

2.1运维团体人员划分

词位名称岗位职责

拟订部门阶段工作计划,

协调部门内部工作,

实行部门员工管理与业绩考核,

提出部门员工配置与奖罚意见,指导并督促部门员工工作,保证正常工作

进度。

根据工作量合理安排部门人员分工,并进行督促指导、检查与考核。

产品经理协调运维工作中企业与业主之间的良好关系,提高服务满意度。

加强工作质量的管理力度,组织人员对负责路线进行事前控制和实时检查,

对检查中发现的问题及时采用措施。

协调处理系统运行中出现的系统、技术问题,采用有效负责处理措施,防

止不良事故时发生。

定期组织部门人员进行培训、会议及学习,提高业务水平。

完毕企业领导交办II勺其他工作任务。

1.负责服务器的搭建、维护等工作。

2.各项服务器的平常管理、维护、保养、检查及日志的监控与分析。

3.负责集团各项应用系统运行布署、网络设备调试、服务器管理等工作。

系统工程师

4.负责各类应用系统日勺故障分析及错误排除。

5.负责集团信息化硬件项目建设,包括需求调研、产品选型、实行、培训

和技术支持工作。

1.负责中心机房网络设备、环境、运作状况的维护、保养、检查;视频、会

议系统管理与维护。

2.视频监控系统管理与维护。

3.防火墙、路由器、数据互换机、光端机、UPS的状态监控,以及性能优

化,配置修改,保证外网对企业官网的访问以及企业内部网络H勺正常;维

网络工程师

护企业VPN线路,保证邮件等系统的正常访问;sdh专线、光连路H勺监控、

测试、故障申报与处理。

4.企业Inlemet域名、二级邮件域名、DNS指向等互联网业务申请、分理

和维护。

5.负责集团网络工程日勺规划、督导、项目实行及技术支持。

1.负责协助部门领导完毕IT有关项目计划和实行。

技术支持

2.负责项目实行过程中岗位培训、应用指导、项目平常管理。

3.负责跟踪项目进度,协调各部门组员之间的合作。

4.及时向项目主管汇报项目的进展状况和实行、应用过程中出现的问题。

5.客观公正地对项目组员、操作人员的J工作进行组织、监督和管理。

6.项目总结以及项目文档的编写,为项目提供有针对性的处理方案,并采

用多种实际措施,推进处理方案的贯彻。

7.协助当地网络、有关办公设备维护及视频、会议开通。

8.完毕部门领导安排11勺其他工作。

1.邮件、RTX、0A等信息化系统技术支持工作。

2.记录集团内部申报H勺IT故障,并转交有关负责人进行处理,对故障处理

成果进行跟踪及反馈。

运维客服3.负责邮件、RTX、0A应用系统后台维护管理工作,根据各单位需要进行

办公系统的开通、撤销、组织架构调整等有关工作,并实时进行记录。

4.对邮件密保使用状况进行管理,对涉密人员进行密保绑定及特殊状况的

处理,保障邮件系统安全运行。

2.2岗位人员分派

xwa♦”则

三、基础建设管理

3.1系统架构

接入■身元或掘・务

服务发现饮件资产

HTTP,HTTPS.一

QMQTTAMQ

----------^»oSQ0一

彩动ES用ISP>—(RD6)

REST消

口;

WebffifB

服外路由中

心.□

o「

-

IREST-

-

-

-

-

-

-

-

3.2服务器资产管理

3.2.1服务器资产定义

I.服务器资产资产重要包括员工正常应用所配置的服务器及配套软件,为服务器环境所购置

日勺网络设备、配件,包括资产性支出固定资产部分及费用支出非固定资产部分。

3.2.2服务器资产分类

资产类别类别细分说明主管部门

终端设备主机、显示屏、研究院

硬件类网络设备路由器、互换机、防火墙、HUB、机柜等研究院

服务器配件、DM服务器,应用系统服务器等研究院

品件硬盘、内存、网卡、显卡,主板、CPU等研究院

耗材类

耗材键盘、鼠标、U盘、光驱、网线、电源线、插线板等研究院

终端使用换作系统、办公软件、辅助软件、云报务器及对应部专用研究院

软件类物件

服务器使用接作系统软件与服务器应用软件等研究院

综合使用网络管理软件与财务应用软件等办公辅助软件研究院

3.2.3硬件类资产管理

IT资产硬件类属于资产性支出11勺固定资产部分。在IT资产硬件类管理过程中,不同

样阶段会出现资产的入库验收、管理、使用申请、借用、转移、报废等操作。以上所

有操作都必须严格遵守有关操作规程方可执行。

1.硬件类入库验收规定

硬件类入库验收是指运维部门接受到采购申请单采购H勺服务器等IT硬件类资产

后,办理资产入库前对布•关资产进行的资产清点、外观检查等查点和核算日勺过程。

在资产入库验收时如发现所验货品与装箱单等不符或设备外形出现严重变形,主管部门

负责人有责任将验收成果反馈给采购部门,由采购部门负责处理退货或更换等事宜。

主管部门在获得有关IT资产并验收完之后使用之前依其类别和科目予以分类粘贴

资产编号标签。

所有通过验收后入库的资产均由运维部门负责保管,如出现由于保管不利而导致口勺

资产遗失、人为损坏等状况,运维部门将承担重要责任。

运维部门在办理完入库验收工作后,必须对所有入库资产进行登记,填写验收、使

用、更换、报废登记表。

2.硬件类资产使用申请规定

根据业务需要,在。a上填写资产申请表申请。

3.硬件类资产的借用规定

除主管部门外,任何人都无权出借硬件类资产或安排出借硬件类资产事宜。

主管部门的硬件类资产登记台帐应反应出借用部分,保证使用权和其他权限的清晰

明确。

4.闲置硬件类资产的回收与发放规定

闲置类硬件资产回收后,主管部门将根据评估其性能等,并记录闲置类资产台帐中,

根据后来的J需求状况进行再次发放和调控,投入再使用。

5.硬件类资产报废规范

本制度规定办公IT硬件资产的报废采用两种方式,即积极报废方式和被动报废方

式。

被动报废方式是指当硬件类资产受到严重损伤且简朴维修无法恢复使用时,其价值

明显减少的状况下应提交申请报废。此外这种报废还包括已经满折旧年限且无法维持正

常工作的硬件类资产部分。被动报废方式是一般意义上的报废方式,有关报废规定如下:

1)主管部门按照规定提交有关报废申请,由财务部安排报废,并由财务作对应的会计

处理。

2)报废的发起人为主管部门,员工无权申请报废。

3)报废时主管部门必须填写报废申请单,同步在报废登记表中进行登记,反应已经报

废的那部分资产。

4)报废U勺编号不重新使用。

积极报废方式是指硬件类资产由于使用时间的增长,作为办公平台所能提供的性能、

效率、可靠性和稳定等已经很难满足事务所办公的最低端业务的需要时,由主管部门根

据资产自身U勺性能指标分析并结合受益人的意见,提请对硬件类资产的报废。

积极报废方式是从办公效率和新业务需求等箱度去积极地做合适的淘汰。重要操

作规范参照被动报废方式的有关规范。

3.3信息记录管理

3.3.1信息资产记录

(-)硬件设备型号、数量、版本等信息记录记录

(二)软件产品型号、版本和补丁等信息记录记录

(三)网络构造、网络路由、网络IP地址记录记录

(四)综合布线系统构造图的绘制

(五)其他附属设备的记录记录

3.3.2帐号密码管理

(一)服务器和数据库的管理账号密码,由系统管理员和数据库管理员设定并持有,实行定

期修改制度,最长有效期不超过90天。

(二)更换服务器与数据库密码时必须报行政封存,以防遗失密码。如发现密码及口令有

泄密迹象,管理员要立即汇报主管领导,严查泄露源头,同步更换密码。

(三)密码需要按照如下规则设定,即由大写字母,小写字母,数字,和字符构成;最低位

数为10位;不能与以往的密码反复。

(四)提议借助密码生成器按照密码设定规则,生成密码。

四、布署

4.1基本原则

运用虚拟容器技术的“一次装载到处布署”的特性,实现统一特性的服务节点规模布署,

而节点间彼此独

4.1存储设备

例如raid磁盘阵列,san存储系统、磁盘阵列、等存储设备。存储设备布署,重要由系统运

维工程师负责。基本环节如下

1.现场备件安装

配合厂商(供应商)进行现场备件安装。

2.补丁服务

消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理

的平衡。

3•升级服务

对系统进行软件或硬件的升级,以改善、完善既有系统或消除既有系统口勺漏洞。

4.问题管理系统

对碰到的问题进行汇总和公布。形成技术文档。

5.系统优化监控管理

对设备进行系统日勺优化监控,对存储互换机设备状态、端II状态、传播速度监控、

对监控备份服务进程、备份状况(起止时间、与否成功、出错告警)监控、

对监控记录磁盘阵列、磁带库等存储硬件故障提醒和告警等监控,对存储口勺性能(如高速

缓存、光纤通道等)进行监控。并及时处理故障问题、

4.2数据库布署

1.数据库选型

对系统日勺配置及运作框架提出提议,以协助您得到一种更坚强可靠的运作环境,减少系

统潜在的风险,包括数据丢失、安全漏洞、系统瓦解、性能减少及资源紧张

2.数据库软件安装。

进行数据库环境布署,数据库空间的I规划管理,设定自动备份机制等。完毕布署文档。

3.检查数据库系统与否需要应用最新的补丁集

进行数据库补J.升级,完毕服务器运行文档。

4.数据库系统优化

分析顾客的应用类型和顾客行为、监控数据库性能、评价并修改数据库日勺参数设置

、评价并调整数据库的数据分布、评价应用对硬件和系统的I使用状况,并提出提议。

提供完整的I性能调整汇报和处理措施

4.3操作系统

1.操作系统选型

根据应用H勺运行环境,进行最优H勺系统选型。

2.布署操作系统,并连通网络。完毕布署文档

3.检查操作系统与否需要应用最新的补丁集,

4.登记操作登记表

4.4企业软件

五、监控

5.1基础监控

从网络的连通性、网络的性能、网络H勺监控管理三个方面实现对网络系统H勺运维监控。

1.设备基础性能检测:cpu、内存使用状况监测:

2.设备日志查看:

3.设备snmp状态;

4.测试Ping,tracert等工具口勺连通性;

5.网络安全方略应用与否正常;

6.Internet带宽流量的实时监测;

7.网络拓扑链路状态监测;

8.异常网络数据包流量;

9.Dos、ddos等网络袭击状况监测;

10.Internet线路的误码率、丢包率监测;

5.2docker监控

5.3听云监控

听云Server是服务端应用性能处理方案。通过在服务端应用中植入探针,可以对应用代码、

关系型数据库、NoSQL.

外部服务、服务器进行监控,协助顾客即时获取有关性能数据并进行智能分析,在代码层面

上定位错误发生、性能下降的原因。

听云运行架构图

CDN

听云监控流程

I.向研究院领导提出申请需将应用布署上听云监测问题的专业企业,首先需向研究院领导

提出申请,申请之前请准备好应用项目H勺有关信息,包括:应用名称、开发语言、布署的机

房名称或者服务器资产托管供应商、布署服务器、服务器有关配置、申请使用时间(期限)、

应用类型等信息,形成.txl文档上传到附件。(使用case:42645)记录

2.领导审批研究院领导会根据专业企业提供H勺应用项目信息进行审核。

3.贯彻三布署工作假如领导审批同意布署将进入布署工作。

4.登录应用,使用应用、产生数据。

5.测试成功产生数据后反馈给项目。

6.运维人员监看数据变化,出汇报,协助处理问题。

六、故障与排障

6.1故障等级

故障级别响应时间故障处理时间

I级:属于紧急问题;其详细现象为:系统10分伊,30分钟内

3小时以内

瓦解导致业务停止、数据丢失。提交故障处理方案

II级:属于严重问题;其详细现象为:出现

10分仰,30分钟内

部分部件失效、系统性能下降但能正常运行,6小时以内

提交故障处理方案

不影响正常业务运作。

III级:属于较严重问题;其详细现象为:出

10分伊,30分钟内

现系统报错或警告,但业务系统能继续运行12小时以内

提交故障处理方案

且性能不受影响。

IV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论