门户网站运维投标方案(技术方案)_第1页
门户网站运维投标方案(技术方案)_第2页
门户网站运维投标方案(技术方案)_第3页
门户网站运维投标方案(技术方案)_第4页
门户网站运维投标方案(技术方案)_第5页
已阅读5页,还剩210页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

门户网站运维投标方案

目录

第一章项目整体服务设想..................................6

第一节项目概述......................................6

一、运维总体原则...................................6

二、运维服务目标...................................7

第二节运维服务设想..................................7

一、运维服务总则...................................7

二、运维服务计划...................................8

三、运维服务体系..................................10

第二章运维服务方案....................................26

第一节运维协作环境.................................26

第二节运维服务内容..................................26

一、网站内容保障服务..............................26

二、日常巡检服务..................................27

三、网站安全服务..................................30

四、技术支持......................................78

五、其它.........................................80

第三节运维服务交接..................................90

一、制定工作交接计划..............................90

二、启动交接.....................................90

1

三、文档、流程、系统交接............................90

四、运维对象调查及其内容再识别......................91

五、交接工作总结会..................................91

第四节运维保障服务方案...............................91

一、系统安全性保障服务..............................91

二、系统稳定性保障服务..............................98

三、系统故障处理保障服务...........................105

四、系统突发事件处理保障服务.......................106

五、内容发布响应保障服务...........................116

六、网站运维文档保障服务...........................117

七、响应时间保障服务...............................130

八、日常工作管理保障服务...........................146

第五节售后服务保障方案..............................149

一、售后服务组织机构...............................149

二、售后服务规范...................................150

三、售后服务方式及内容.............................152

四、售后服务流程及跟踪.............................154

五、售后服务保障措施...............................157

六、售后服务承诺...................................161

第三章项目应急方案....................................162

第一节应急总预案....................................162

一、应急预案编制...................................162

2

二、救援流程.......................................165

三、消防培训演练...................................166

四、常用急救常识培训...............................168

五、应急人员安排...................................172

六、应急指挥安排...................................174

七、其他应急培训演练...............................181

第二节意外触电应急预案..............................188

一、应急措施.......................................188

二、预防措施......................................193

第三节设备故障应急预案..............................196

一、准备工作.......................................196

二、意外事件处理...................................197

第四节火灾应急预案..................................197

一、制定预案目的...................................197

二、管理主体及职责.................................198

三、内部火警分级...................................198

四、火情报警.......................................199

五、火警处理程序...................................199

第四章运维团队组织方案.................................202

第一节组织计划......................................202

一、组建团队......................................202

二、工作岗位设置...................................205

3

三、组织机构....................................207

四、人员安排....................................210

第二节团队建设.....................................212

一、人员培训和发展...............................212

二、培训的必要性.................................213

三、培训对象.....................................214

四、培训计划.....................................214

五、培训方式与内容...............................215

4

简介

本方案为门户网站运维项目,全文采用宋体四号字体,共215页。

本文档为WORD格式,清晰无水印、可直接编辑。

第一章为项目整体服务设想:阐述项目概述,运维服务设想。

第二章运维服务方案:阐述运维协作环境,运维服务内容,运维

服务交接,运维保障服务方案,售后服务保障方案。

第三章项目应急方案:包括应急总预案,意外触电应急预案,设

备故障应急预案,火灾应急预案。

第四章运维团队组织方案:提出组织计划,团队建设。

特别提醒:请在编制时依据项目实际情况,调整内容。

5

第一章项目整体服务设想

第一节项目概述

一、运维总体原则

1.整体性原则

我们将综合考虑XXX目前所有门户网站相关应用系统的现状,提

出整体的运行维护策略,有效保障系统运行中各环节的不间断运行,

并综合使用不同层次的技术手段,为应用系统和系统依托的基础环境

提供全方位的监控管理和服务。

2.有效性原则

将充分利用各种现代技术手段,选择一款功能丰富、技术先进的

系统运维监控软件,结合科学合理的运行管理机制,对系统的稳定可

靠运行提供有效的保障。

3.可靠性原则

对维护工作中后续应用系统模块的开发设计中,应采用成熟可靠

的技术和产品,同时配合完善的项目控制规范和质量保证体系,保证

互联网站的升级维护中的严格的质量控制,保证系统开发和运行的安

全可靠。

4.反馈性原则

实现运维中发现、需要解决的问题要及时反馈给信息系统的开发

商进行完善,利于优化机构、岗位设置,利于业务流程的改进。

5.防范预警原则

运维系统中应包含各种预案,争取实现在故障、问题出现时有章

6

可循,在紧急状态有应急措施,提高运维效率,将故障代价减小到最

小。

二、运维服务目标

按照网站管理处要求,完成与XXX网站运维相关的日常工作。

第二节运维服务设想

一、运维服务总则

1.安全性

(1)XXX门户网站及内容管理平台应用的安全性

确保网站能够正常访问。确保网站群动态应用正常,并能够提供

正常的服务。

(2)XXX门户网站及内容管理平台数据的安全性

确保数据库中的信息跟网站发布的信息一致。确保数据库数据正

确,不被非法破坏,并且及时做好数据库和网站数据的备份,当意外

发生时,网站能够及时、完全恢复。未经许可,不得将网站数据泄漏

给其他个人或组织。由专人负责,保证数据的安全。

2.稳定性

(1)不间断服务

提供7*24不间断服务,专人值守,监控网站。意外情况下,及

时通知信息中心相关负责人,并做好各项应急准备。定期向信息中心

相关负责人汇报网站运营情况。

(2)访问响应时间

7

监控网站群访问速度,如访问响应时间过长,及时查找原因,并

向信息中心相关负责人汇报。监控网站群动态应用,对影响应用性能

方面因素及时预警,并提出相应解决方案,及时汇报给信息中心相关

负责人。

二、运维服务计划

为了对此次维护服务项目提供良好的管理监控,并对项目中各管

理组织之间的持续运作建立恰当联系,我们把整个项目执行分为三个

阶段:

1.启动阶段

(1)项目前期的准备工作,包括服务管理制度流程的建立、人

员的到位,运维体系中各种因素的交接。

(2)我方将在签订合同后的5个工作日内,提供详细的项目实

施工作计划(包括:项目组成员、运维服务的内容、进度安排、应急

预案等)。

2.正常服务阶段

正常的执行资产管理和运营维护。

3.收尾阶段

项目的总结移交并达到有序的结束。

(1)启动阶段和运维体系的导入

在此阶段中,主要执行前期的准备工作,为尽快向客户提供高质

量的服务打好基础。

8

该阶段主要工作如下:

1)成立维护服务项目组,确定客户与XXX公司的职责分配。

2)相关人员提前到位,提供维护服务的准备工作。

3)召开项目启动会议,明确工作范围,制定启动阶段计划。

4)项目管理、运营维护等规章制度流程的确定。

5)服务工具的安装、运维体系管理文件的草拟。

6)与客户方人员一起讨论有关的工作计划和需求。

7)系统维护服务实施方案的出台和审核。

8)原来的服务商对XXX公司的知识、档案转移,XXX公司进行

签收,确保服务的无缝连接。

9)对客户的系统信息进行摸底大调查,建立和更新配置管理数

据库。

10)对现有系统进行分析,得出改进报告,提交用户。

(2)正常服务阶段

项目启动后,新的运维服务体系可以实现完成所有设备维护后,

即进入正常的服务阶段。在正常服务阶段,所有的工作将按照制定的

计划进行,并提供服务级别的承诺。具体的工作如下:

1)服务管理体系和流程的改进。

2)正常的维护管理。

3)风险评估。

(3)收尾阶段

此阶段开始于合同结束前1个月(如合同继续延期续签,则本阶

9

段工作主要以总结为主)。这个阶段的主要工作是和客户充分沟通,

移交服务期的工作,争取继续合作的可能。并从此项目的服务实施过

程中积极总结经验,以促进提高在未来的项目中的工作绩效。

1)收集服务期中各部分的服务文档资料。

2)汇总、装订,提交用户并存档。

3)项目评估、总结。

4)向甲方或甲方指定的其他组织进行档案和知识转移,人员培

训,确保系统的稳定运行。

三、运维服务体系

1.IT服务体系的建立

XXX公司作为国内积极参与政府信息化建设的大型企业之一,长

期以来积累了丰富的技术支持和运维服务经验,始终视服务为企业生

存与发展的生命线,优秀的服务理念成为我们在激烈市场竞争中所体

现的鲜明特色。

(1)IT服务体系整体结构

只有高效、稳定、个性化的本地化服务模式才能满足用户随时随

地的服务需求。也只有迅速的维护响应才能真正保证用户的利益不受

损害。因此我们在自身服务体系的基础上,针对XXX政府门户网站内

容管理平台运维项目,特定IT服务体系,由响应体系、维护体系和

质量监督体系构成。

1)客户需求

10

在服务协议规定范围内的任何服务请求,包括咨询、问题申报、

投诉等。

2)响应体系

第一时间受理客户的需求,以最快的速度解决问题,保障客户系

统尽快恢复正常。

3)维护体系

对客户系统进行主动式服务,发现并解决系统隐患,优化系统性

能,并提出合理的改进和升级建议。

4)质量监督体系

为保障服务的质量制定相关的服务协议,通过满意度调查等方式

评估服务的提供是否正常。

IT服务体系最终都可以通过本次项目建设的ITIL运维体系落

实,响应体系对应ITIL运维体系的“事件管理”,维护体系对应ITIL

运维体系的“问题管理”,质量监督体系则通过“运维管理”来实现。

(2)响应体系

响应体系包含服务台和突发事件管理,主要任务是受理客户的服

务需求,尽快恢复客户系统的正常运行。

客户有问题可以通过热线电话、Email与服务台联系,服务台负

责接听技术服务电话、受理客户问题,进行记录,分类并转给相应的

工程师处理。二线工程师负责处理服务台分配的事件或问题,当二线

工程师需要技术支持时,可以从公司总部或第三方获得技术支持和实

验室环境支持。

11

服务请求时

故障级别响应方式、时间

一级故障7×24服务台接到服务请求后,即刻响应,服

务人员工作时间内马上到达现场,非工

作时间1小时内到达,进行现场服务。

二级故障7×24服务台接到服务请求后,对于电话未解

决故障,15分钟内再次回应,提供电话

技术支持,工作时间内服务人员1小时

到达现场。

三级故障7×24服务台接到服务请求后,30分钟内再次

回应,提供电话技术支持,工作时间内

服务人员2小时到达现场,或与用户协

(3)质量监督体系

为保障向客户提供的服务准时高效,质量监督体系是必需的。运

维团队和客户将按照合同的要求,共同制定服务协议书中的各项服务

水平要求,以监督保障所提供的服务质量。

质量监督体系的主要工具是满意度调查,衡量的标准即双方认可

的服务水平要求。

满意度调查制度及时了解客户对我们事件处理情况的重要手段。

也是我们不断改进、完善服务的渠道。

服务满意度调查制度同响应体系事件的调查制度一样,技术服务

12

中心将协同客户一起定期对提供的服务进行全面的满意度调查,以此

来提高服务的质量。

满意度调查结果与服务工程师的当期绩效考核挂钩,作为工程师

个人业绩评价的参考数据之一。

2.IT运维体系的建立

ITIL提供了一个概念化、模块化的优秀框架,与其说是解决方

案,不如说它更像理论。它提出了建立IT服务管理体系时要考虑哪

些流程,提到了应该做哪些,好处在哪儿,但并不详细介绍怎样去做,

因此它本身不具备实际操作可能性。

我们在长期的运维项目中积累的丰富的经验,根据XXX门户网站

的实际情况,对ITIL进行适当选取、适应和扩展:

(1)导入ITIL是一个长期过程,运维初期,以"系统日常运行

和支持"为主,重点解决服务支持(ServiceSupport)流程,对发生

的问题进行维护和处理。在运维后期,运维的服务支持流程步入正轨

后,再关注运维服务的长期计划和改进,考虑服务提供

(ServiceDelivery)。

(2)针对XXX门户网站,运维的主要任务是解决发生的问题,

对IT基础架构进行基本的配置管理,因此主要实现"服务台”、“事

件管理”、“问题管理”和“配置管理”,至于变更管理在实际运维

中,暂时没有系统工具支持,放在后期再规范流程,并用信息系统化

实现。

(3)由于初期运维工作内容多,系统繁杂,人员少,为提高运

13

维人员解决问题的能力和效率,运维体系扩展加设“知识库”,以提

高运维技术的积累、传承、利用。

经过对ITIL体系进行适当选取、适应和扩展,从适合XXX门户

网站,适合运维团队完成任务目标为主,我们制定了个性化的运维体

系。

个性化的XXX门户网站运维体系设置“服务台”统一接受各种故

障受理,包括最终用户直接电话或邮件传来的求助信息和运维监控软

件过来的自动报警信息,然后服务台问题分析并归类,力求初步解决

用户或系统的故障。不能在线解决的需求问题,启动“事件管理”和

"问题管理"流程,运维人员按照既定的流程,在"知识库”和“配

置管理"的支持下,解决故障,并把积累的经验知识归入知识库。问

题解决后,运维体系反馈于IT系统,促使其更好更稳定运行,并促

进其优化和完善。

其中,"知识库”和“配置管理"可以依托运维监控工具实现信

息化作业,而“服务台”、“事件管理”和“问题管理”则仍然依照

对应的制度人工操作,暂时没有信息化系统辅助运行,可以考虑在后

期建设运维平台时优先实现。

所有的事件都应该基于影响度、紧急度和优先级进行分类分级,

并提供相应的解决方案和临时方案。

表1:系统运维故障级别定义

故障级别服务请求时间响应方式、时间

一级故障7×24服务台接到服务请求后,即刻响应,服

14

务人员工作时间内马上到达现场,非工

作时间1小时内到达,进行现场服务。

二级故障7×24服务台接到服务请求后,对于电话未解

决故障,15分钟内再次回应,提供电话

技术支持,工作时间内服务人员1小时

到达现场。

三级故障7×24服务台接到服务请求后,30分钟内再次

回应,提供电话技术支持,工作时间内

服务人员2小时到达现场,或与用户协

注:故障级别描述:

一级故障是指系统发生严重故障,业务发生中断,或虽然业务未

中断但已经无法保证及时、正确的情况,对用户业务的运行有严重影

响。

二级故障是指对于系统发生的非严重故障,业务并未中断,业务

仍然及时、正确的情况,但性能有所下降。

三级故障是指系统发生轻微的故障,系统有警告信息等,对系统

没有较大影响的故障。

3.系统运维制度建设

在信息化运维中,制度建设是一道必要的保障。信息化不能一蹴

而就,在信息化发展到一定阶段,建设重点应该要从系统实施转向以

应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除

15

了技术的保障以外,制度保障越显得重要。

对于IT运维团队来说,可从以下几个方面来进行IT运维制度化:

(1)转变运维观念,树立规范化意识。树立只有建立制度化的

IT运维意识,才能在日常繁杂琐碎的工作中有效的区分任务的优先

级,将有限的资源投入到最能满足“客户”需要的工作中。

为保证运维工作,把运维工作和制度化紧紧地捆绑到一起。运维

工作很琐碎,关键在于规范而不是创新。只有各级运维技术人员一丝

不苟、老老实实按规范做,才能够把事情做好。

(2)建立事件处理流程,强化规范执行力度。首先需要建立故

障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立

运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种

事件的规范化处理指南,减少运维操作的随意性,在很大程度上降低

故障发生的概率。

同时,建立IT运维制度非常重要,但是有了制度还要有人去执

行,要强化执行制度比建立制度更重要的观念和意识。

4.运维管理机制建设

“三分建设,七分管理”,XXX公司采用多重管理制度,并加强

沟通机制,力求完善建设ITSM中的服务监督体系。

(1)升级管理机制

升级管理是突发事件管理的重要组成部分。“事件跟踪”将记录

从受理用户问题到派单过程中相关人员所做的处理和建议,保证信息

的正确传递,记录内容将作为我们向用户提供服务及分析和衡量服务

16

水准的依据。

我们将通过服务系统监控事件的全过程,直至服务结束。当出现

的问题在承诺时间内无法有效解决时,“事件跟踪”会自动启用逐级

上报升级管理流程,该流程旨在能真正起到督促问题快速有效解决的

作用。我们将和用户一起共同制定出适合XXX业务需求的升级流程并

指定相应的人员来监督流程的实施。

(2)报告系统

我们将按XXX信息中心要求定期提供标准报告。

1)突发事件管理报告

确保用户的电话被接受、解决并记录,服务范畴之外的问题也会

转至第三方。突发事件管理着眼于解决问题的快速,解决问题的高质

量,确保用户的满意度并达到承诺的服务级别。突发事件的出现和解

决方法将体现在定期的服务报告中。

2)问题管理报告

我们将对重复发生的,主要的突发事件进行问题管理,诊断问题

的真正原因。问题管理着眼于获得系统的高可靠,避免问题的再度发

生,赢得用户高满意度,达到承诺的服务级别。经常出现及主要的问

题,及相应的解决方法将体现在定期的服务报告中。

报告内容包含重点问题分析、潜在服务隐患、优化建议等信息。

(3)月、季度总结机制

我们每月、每季与XXX信息中心召开总结会,共同讨论前一月或

季度的服务执行情况。会议时间建议在该月、季度结束后、下一周或

17

每月10日之前,具体时间可以与XXX信息中心协商确定。会前双方

应沟通和确定议程并在会前提供必要的报表和报告。

会议主要回顾从上次会议结束到本次会议前一天,我们所提供的

服务的绩效,同时讨论和达成为改善服务必须采取的改进措施和行动

步骤。

(4)客户满意度调查系统

以目前的客户满意度调查表格为蓝本,与客户协商适用于客户的

调查选项、格式和方法。下表仅供参考,以和用户协商后的调查表为

准。

表:运行维护满意度调查表

开始时间结束时间

对主机设备使用□好口较好□一般口差

评价原因:

对网络设备使用□好口较好□一般口差

评价原因:

对运维服务人员□好口较好□一般口差

评价原因:

对整体工作评价好口较好□一般口差

原因:

评价人(签字):日期:年月日

(5)事件信息发布通知

对于机房的服务事件,例如:设备维护、线路维护、网络故障或

18

主机故障等,运维管理中心通知客户方,内容包括:

1)事件内容。

2)事件类型(一般、紧急)。

3)发生的时间段。

4)影响范围(部分、全部)。

5)客户应采取措施(如需要的话)。

(6)投诉管理

1)XXX用户可以书面或口头形式对运维商提供服务的服务质量

进行投诉。投诉的受理和处理部门由双方事先约定。

2)XXX用户可以书面或口头形式对运维商的各部门/各级员工进

行投诉。

3)运维商设立投诉专线受理甲方投诉。

4)运维商在受理XXX用户投诉后的8个工作小时内向投诉方提

供一份书面形式的投诉处理情况报告。

5.项目沟通机制建设

(1)内部团队沟通

1)在每个角色组或在特定系统工作的所有角色中每天或定期举

行简短的会议,提供关键的或时间紧迫的系统和业务问题方面的更新

和所需行动的更新。

2)客户可以根据需要浏览的相关信息和分阶段的操作统计数据,

如正常运行时间、客户访问次数、行为趋势、开放问题等等。

3)在为从发布到生产所作的最后准备工作中与开发和部署组队

19

一起举行的由开发组主持的会议。这一签收表示所有的开发组都已准

备就绪。

4)实施阶段可以承担产品或系统的运行支持工作了,要分发和

阅读(例如e-mail的格式编写)定期状态报告,提交给IT管理层,

以及针对操作的关键绩效指标方面的业务内容(例如,依照服务级别

协议的量度、服务台日志统计、项目目标实现进展等等)。

(2)外部客户沟通

同其他任何项目一样,有效沟通是事关本项目最终能否成功的非

常关键的一个环节。鉴于项目本身的建设内容和牵涉到关系的复杂程

度,沟通管理自然显得尤为重要,为此,必须从项目的干系人以及他

们之间的工作关系和社会关系出发,详细分析项目所需的各种沟通环

节,对其中最主要的沟通环节制定计划进行专门的管理,避免项目因

为信息沟通不足而陷入困境或造成不必要的损失。

沟通分为三个层面即:执行层面,主要是各干系单位的工作人员

就一些具体工作中涉及的配合问题进行沟通和交流。管理层面,主要

是各干系单位的在本项目及其子项目的项目经理及监理单位,沟通的

内容主要是有关项目执行中的重要事项、活动和决定。决策层面,主

要包括业主领导、开发商领导、运维商领导等,沟通的内容主要是对

项目进展过程中间碰到的重大问题的协调、重大事项的决定、重大事

件的见证等。

为了实现充分沟通的目的,将主要设立如下沟通手段。

1)会议或交谈

20

按需要组织会议进行沟通,或直接找相关的人进行讨论,注意记

录沟通和讨论结果。每次正式会议都要形成会议纪要,由项目组文秘

作会议纪要,并分发到有关人员手中。

2)工作联系单

联系单将处理项目执行过程中重要事项的决定、变更或者项目问

题报告的多点沟通的一种正式的形式,一般在其他辅助手段沟通无效

的情况下采用。联系单上须明确所联系事项的内容概要、紧急程度及

其解决请求。在出具的联系单中,一般情况下主送业主或监理单位,

抄送其他相关单位,并要求有关单位及时回复或者解决。在接到需我

们解决或回复的联系单后,我们也会在第一时间给出答复或者采取行

动。

项目实施期间所有收发的工作联系单都代表着项目执行过程中

的重要活动的书面依据,都将作为项目执行过程中的档案进行整理存

档,在项目终验时移交给业主。

3)电话或电话会议

通过电话的方式进行信息沟通。对比较重要的事情,需要包括实

施地点以外的人员,则需要利用电话会议的方式进行讨论,沟通。实

践证明,电话是点到点沟通的最普遍和最常用的形式。

需要声明的是,对于项目中一些重大问题,仅仅通过电话沟通仍

然是不够的,在电话确认以后,仍然需要以备忘录、联系单的形式落

实到纸面,作为对这些问题的最后确认。

4)书面报告、备忘录和传真

21

书面报告、备忘录和传真是点对点沟通的相对比较正式的手段,

主要考虑用于对项目过程中的一些重要事件或方案的描述、质询等。

5)电子邮件

作为现代办公的一种常用手段,电子邮件系统也将成为项目组内

部以及项目组外部沟通的一种非常重要而且高效的沟通手段,应该视

为同书面报告和传真具有同等的严肃性。

6.运维保障机制建设

选择了一个合适的运维商,只是运维项目开始的关键一步,如何

确实保障项目走向成功呢?我们认为需要针对XXX门户网站运维项

目成立专门机构,专人专职,专款专用。

(1)机构保障

建议双方联合成立运维领导小组,增强沟通协调,加强运维组织

建设,建立稳定的运维团队。

在XXX政府门户网站内容管理平台运维项目启动阶段,我们就高

度重视,并组织人员组建了筹备机构,由丰富经验的资深咨询人员及

熟悉政府网站运维的工作人员共同组成工作小组,广泛研究国内外信

息化系统运维经验,深入调研分析,“尽我所能”,无私奉献我们在

大型项目建设及运维经验。

我们在承担此项目后,将成立独立的部门,采用专职部门、专人

专职、专款专用等措施来保障该部门不同于公司其他的项目组织。

(2)人员保障

1)运维优秀人员

22

本次项目,我们将按照XXX要求专门组建运维团队,使运维团队

具备娴熟的技术和广泛的专业知识,系统运维人员具备高超的技能和

丰富的经验。

2)核心人员备选

我们聚集了国内优秀的IT人员、管理人员,对于进驻XXX运维

部核心人员,建立备份替补机制,备份替补人员随时可以进入XXX开

始工作。

3)凝聚人才的企业文化

我们一贯的企业文化,凝聚了大批优秀人才,使整体团队能保持

工作激情,传承知识,从而创造一个高效、团结、和谐的工作环境。

我们所有工作人员在企业文化的洗礼下,具有良好的职业素质和

道德品质,面对具有历史使命的工作任务,不会讲任何条件,作为战

略合作伙伴,坚决服从XXX信息中心领导,服务好XXX政府门户网站

内容管理云服务平台!

4)规范管理规避人员流动风险

通过建立规范的软件开发管理、项目管理、IT服务管理、运维

管理等管理体系,和科学的咨询方法等诸多知识体系,保障运维工作

的开展,弱化个人能力对整个运维项目的影响,把人员流失造成的风

险降低到最低。

根据我们以往的经验可以证明,我们有能力使人员流失的风险在

可控范围内。

5)人员调动须经同意

23

本次项目的所有人员调离,都要和XXX信息中心协商,经XXX信

息中心同意后方可进行。

(3)培训和技术保障

加强对运维人员的培训,提高技术保障能力,成功有效地实施和

运营服务管理流程。除此之外,培训还有以下几个方面的作用:

1)促使所有相关人员清楚和理解ITIL计划和有关术语。

2)为相关人员提供讨论的平台。

3)为发现和减少可能的问题和不正确的实施方法提供了平台和

知识。

4)帮助发现缺乏的技能并采取相应改进措施。

5)提供大量的培训流程所需的资源。

(4)积极参与XXX信息化建设

我们运维团队在完成运维任务的同时,将积极参与XXX的信息化

项目建设,促进系统统筹规划,集中管理,利于运维交接,便于维护。

1)参与统一规划管理

根据ITIL体系外围工作要求,IT运维还要结合“IT规划管理”

和“IT基础架构”的工作,因此我们将积极参与XXX信息中心的信

息化建设规划,通过统筹规划,设立信息化战略目标,制定信息化建

设规范,解决系统结构不一、开发混乱、成本居高、维护困难、信息

孤岛林立、难以集中管理的局面。ITIL体系反馈于IT系统,促进互

联网站更好的完善和发展,同时也使运维更加轻松容易。

2)参与其他系统建设

24

另外,IT运维还要结合“业务管理”和“应用管理”的工作,

我们将把业务目标作为运维部门的战略目标,协调技术和业务发展之

间的关系,积极参与业务部门的需求分析、业务系统的开发建设、系

统的测试上线等工作。

25

第二章运维服务方案

第一节运维协作环境

为了保证网站运维的质量及响应时间,XXX信息中心向XXX公司

针对本项目组建的运维团队提供以下协作环境:

一、提供给服务商现有的网站运维相关资料、技术相关权限。提

供运维项目基本设备、技术资料及相关原厂服务。

二、提供临时驻场工位4至5个、网络接入端口、接入方式、内

外网接入设备等,提供相应技术接口协助驻场人员及相关人员工作。

三、提供驻场人员服务期间入场权限、准入许可。包括入场权限、

系统准入权限、机房准入权限、网络接入权限、相应管理制度。

四、提供招标方购买的第三方服务,协调第三方服务人员配合服

务商进行系统故障恢复。

第二节运维服务内容

一、网站内容保障服务

XXX公司应遵照现行的XXX网站内容管理系列制度及工作流程完

成以下工作:

1.按照XXX网站内容管理规范,完善和改进XXX网站主站及XXX

机关各子网站建设和管理工作。进行XXX网站的日常内容采集、加工、

上传、分发、管理。完成年度内不少于一次的网站改版工作。

2.XXX英文版网站内容维护,包括网站内容翻译、互动留言收集

整理翻译、英文信息发布等。

26

3.公众互动板块各栏目的维护。

4.XXX网站内容管理系统用户管理。

5.实施《网站业务工作单》中指定的工作内容。

6.XX网站整体版面优化、结构调整的建议、策划和实施。

7.国家重大节日、重大会议、重大事件期间的24小时编辑响应

服务。

8.视频信息的数据发布工作。

9.制作XXX网站工作简报(每月)。

二、日常巡检服务

现场日常巡检服务是XXX公司对XXX数据库设备进行全面检查的

服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可

能地发现存在的隐患,保障设备稳定运行。同时,XXX公司将有针对

性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营

风险。

1.日常巡检安排

公司安排定期(每月/每天/上午下午各一次)例行巡检和预防性

维护,内容包括:

(1)设备运行物理状态(每月/次)。

(2)电源稳定性和线路检查(每天/次)。

(3)系统性能检查(每月/次)。

(4)逻辑卷检查(每月/次)。

27

(5)内存交换区检查(每月/次)。

(6)系统硬件诊断(每月/次)。

(7)数据安全存储检查(每天/次)。

(8)数据备份状况(每天/次)。

(9)系统错误报告的分析、记录和清理(每天/次)。

(10)及时更换损坏的或有潜在故障的部件(每月/次)。

(11)设备物理检查(包括机体、风扇、风道及过滤器等)与清

洁(每月/次)。

(12)针对巡检工作应提交完善的巡检报告,并且存档、编辑成

册,每月月初提交,以便日后清查。

(13)XXX网站数据库的巡检工作,XXX网站数据库日常监控,每

日至少2次,分上下午分别进行。

2.出具巡检报告

(1)提供故障报告等触发性报告。

1)日常巡检报告等日常报告。

2)周报、月报、季报、半年报、年报等总结性报告。

(2)报告内容包括:检查内容、操作步骤、检查结果、操作人、

操作时间、意见与建议等。

3.硬件巡检列表(在用)

数量

序号设备型号设备用途

(台)

1

28

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

4.虚拟机巡检列表(在用)

序号

1

2

29

3

4

5

6

7

8

9

10

11

12

13

14

三、网站安全服务

1.概述

(1)XXX网站7X24小时网站监控服务。

(2)网站安全性检查。

(3)按照XXX网站技术规范和安全管理规范,对网站应用软件、

中间件以及数据库进行日常安全性检查。

(4)网站服务器以及网络安全性检查

(5)按照XXX网站技术规范和安全管理规范,定期对服务器操

作系统进行安全性检查以及进行系统杀毒。负责XXX内网论坛

30

(discuz)安全。负责网页防篡改软件(IGuard)安全。

(6)数据库备份及备份验证

按照XXX网站技术规范和安全管理规范,对网站数据库进行定期

备份以及备份恢复验证,保证数据的安全性、准确性、完整性和可用

性。XXX网站数据备份及数据恢复,根据网站情况目前均采用本机进

行数据备份及恢复。

2.XXX网站7X24小时网站监控服务

(1)监控原则

1)我们将对系统进行7*24不间断监控。

2)监控岗保证一直有人值守。

3)每日分别于上、下午对服务器进行巡检,并于当天提交运维

监控报告。

(2)监控方案

1)网站访问监控

在网站访问监控功能中,系统监控内容包括网站名称、网址、监

控类型、最后检测时间、响应时间及本日产生的上传下载流量等。点

击“查看”后可查看更详细的网址监控项目,包括响应时间、连接数、

网络流量,以及浏览用户在网站提交的纠错内容等。

①响应时间

A.每间隔指定时间Ping指定的网址,并从返回的值中计算指定

网站的响应时间。

B.监控详情:点击菜单"网站访问监控"-"网站访问监控详情",

31

系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中

显示该网址的响应时间。

C.数据采集:系统按照在"监控网址管理"中的设置,按指定间

隔Ping出该网址的响应时间,并将数据保存至监控数据库中。

②连接数

每间隔指定时间,取得指定网站的连接数。

A.监控详情:点击菜单“网站访问监控"-"网站访问监控详情”,

系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中

显示该网址的当前连接数量。

B.数据采集:系统按照在"监控网址管理"中的设置,按指定间

隔测试该网址的当前连接数量,并将数据保存至监控数据库中。

③网络流量

每间隔指定时间,取得并统计指定网站的网络流量,上传和下载

流量分别显示。

A.监控详情:点击菜单"网站访问监控"-"网站访问监控详情",

系统在列表中显示每个已经添加并指定需要监控的网址,并在列表中

显示该网址的累计网络流量。

B.数据采集:系统按照在“监控网址管理”中的设置,按指定间

隔测试该网址的累计网络流量,并将数据保存至监控数据库中。

④网站页面纠错

在特定(或全部)页面嵌入脚本,当浏览的用户发现页面内容有

误时提交后,管理员可以从此功能中发现有误的内容并根据实际情况

32

修正。

A.监控详情:点击菜单"网站访问监控"一“网站内容纠错”,

系统在列表中按日期显示每个页面链接及提交的错误内容,以供管理

员参考并更正。

B.数据采集:当浏览的用户发现页面内容有误时,可以通过选中

内容然后按一个快捷键(如Ctrl+Enter)提交,页面直接保存相关

信息至数据表中。

⑤统计分析

针对网站监控中的各项指标进行统计分析,统计的条件包括时间

范围、网址及指标值范围等。

A.监控情况统计表:统计指定时段内,网站各项监控指标的监控

值。

B.监控预警趋势表:统计指定时段内,网站监控指标的统计值及

趋势走向,同时以表格和图表形式展示。

C.监控预警统计表:统计指定时段内,全部(或指定)网站中,

已经产生的(邮件或短信)预警的次数。

⑥监控网站管理

添加需要监控的网站,从网址或IP确定需要监控的网站页面。

可以选择哪些设备需要发送告警信息。预警级别分为两级,预警级别

(蓝色)及告警级别(红色),达到告警级别后系统将按设置发送邮

件或短信对管理员进行提醒。

可以更改每个网址的序号,在网址访问监控界面列表显示时,以

33

序号为顺序升序显示。勾选"是否监控"并保存后,系统开始以指定

的频率读取相关的监控数值并保存。

2)设备监控

在设备监控界面中,列表显示了全部设备的最近一次监控情况,

包括设备名称、IP、最后检测时间、各项监控数值及设备状态是否正

常等。可以在左上方选择不同的分组以关注不同分组的设备,也可以

勾选右上方的“仅显示异常服务器”以迅速找到运行异常的设备。

①Ping返回时间

每隔一段时间,首先Ping设备判断设备是否能正常连接,以及

连接所需的时长等,较长的返回时间或无响应通常表示设备可能已经

发生故障。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的Ping返回时间。

B.数据采集:系统按照在"监控设备管理"中的设置,按指定间

隔读取该计算机设备的监控数值,并将数据保存至监控数据库中。

②CPU使用率查询

每隔一段时间,检测目标计算机上CPU的使用率情况。CPU使用

率反映的是当前CPU的繁忙程度。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的CPU使用率情况。

34

B.数据采集:系统按照在“监控设备管理”中的设置,按指定间

隔读取该计算机设备的CPU使用率,并将数据保存至监控数据库中。

③CPU负载

每隔一段时间,检测目标计算机上CPU的负载情况。CPU负载指

某段时间内占用CPU时间的进程和等待CPU时间的进程数,这里等待

CPU时间的进程是指等待被唤醒的进程,不包括处于wait状态进程。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的CPU负载情况。

B.数据采集:系统按照在"监控设备管理"中的设置,按指定间

隔读取该计算机设备的CPU负载,并将数据保存到监控数据库中。

④内存使用率

每隔一段时间,检测目标计算机上内存情况。内存使用率指已经

使用的物理内存与全部物理内存的比率。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的内存使用率情况。

B.数据采集:系统按照在“监控设备管理”中的设置,按指定间

隔读取该计算机设备的内存使用率,并将数据保存到监控数据库中。

⑤磁盘空间使用率

每隔指定时间,检测目标计算机上磁盘空间使用率情况。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

35

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的磁盘使用率情况。

B.数据采集:系统按照在"监控设备管理"中的设置,按指定间

隔读取该计算机设备的磁盘使用率,并将数据保存到监控数据库中。

⑥网络流量

间隔指定时间,检测目标计算机上网络流量情况,包括网络上传

流量与网络下载流量。流量可简略反映计算机的网络传输流量是否在

正常范围内。

A.监控详情:点击菜单“设备监控"一"设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并在列表

显示该计算机设备的网络上传下载流量。

B.数据采集:系统按照在"监控设备管理"中的设置,按指定间

隔读取该计算机设备的网络流量,并将数据保存至监控数据库中。

⑦系统进程数

每隔一段时间,检测目标计算机上系统进程数量。系统进程数量

表示当前监控的计算机在运行中的进程,进程越多,通常占用的CPU

及内存资源也越多。

A.监控详情:点击菜单“设备监控”一“设备监控详情”,系统

在列表中显示每台已经添加并指定需要监控的计算机设备,并显示该

计算机设备的系统进程数量。

B.数据采集:系统按照在"监控设备管理"中的设置,按指定间

隔读取该计算机设备的,并将数据保存至监控数据库中。

36

⑧统计分析

针对设备监控中的各项指标进行统计分析,统计的条件包括时间

范围、设备名称及指标值范围等。

A.监控情况统计表:统计指定时段内,设备各项监控指标的监控

值。

B.监控指标趋势表:统计指定时段内,设备监控指标的统计值及

趋势走向,同时以表格和图表形式展示。

C.监控预警统计表:统计指定时段内,全部(或指定)设备中,

已经产生的(邮件或短信)预警的次数。

⑨监控设备管理

A.添加需要监控的设备,从IP及端口唯一指定需要监控的设备,

并加以描述。可以选择哪些设备需要发送告警信息。预警级别分为两

级,预警级别(蓝色)及告警级别(红色,达到告警级别后系统将按

设置发送邮件或短信对管理员进行提醒。

B.可以更改每个网址的序号,在网址访问监控界面列表显示时,

以序号为顺序升序显示。

C.在列表中可以设置每个设备的分组信息,如“外网服务器”、

“内网服务器"或"网络设备”,以查看监控情况时能迅速查看及判

断设备监控情况。

D.勾选“是否监控”并保存后,系统开始以指定的频率读取相关

的监控数值并保存。

3)应用服务监控

37

①监控指定应用服务(如Apache、WebSphere及Tomcat等)的

运行情况,并对无法连接的应用服务,以及监控指标超过指定阈值的

情况进行邮件或短信告警。

②对于WebSphere的监控,很可能无法取得相关的监控项目值,

在这种情况下可能需要通过TivoliPerformanceViewer工具来获得

监控项目和数据。

4)数据库监控

监控指定数据库实例的运行情况,并对无法连接的数据库,以及

监控指标超过指定阈值的情况进行邮件或短信告警。

(3)日常检查监测表格

网站日常监测表格

监测时间:XX年XX月XX日记录人:XX

服务器正常

服务器监测项目检测方法实测情结果备注

IP功能范围况

IE浏览XXXXXX.正常

iguard服

XXX.47psaux|grepiguard2正常

务进程

XXX.48WEB服

Apache进

XXX.49务器psaux|grephttpd1-30正常

XXX.50

CPU及系

top0-2正常

统负载

38

服务器服务器监测项目检测方法正常实测情结果备

IP功能范围况

空闲

硬盘占用df-h正常

20%

5M-4

内存占用free正常

G

1--5分

系统时间date正常

more/usr/local/ig

Iguard篡uard/syncserver/l

正常

改日志ogs/syncd.logIgre

pwarnalert.log

lastlastlogmore/v

用户登录10网

ar/log/messages|正常

情况段

grepfailure

XXX88.19:

IE浏览正常

9080/wcm/

XXX8.1公众参CPU及系Top

0-2正常

9与平台统负载

df-h空闲

硬盘占用正常

20%

39

服务器服务器监测项目检测方法正常实测情结果备

IP功能范围况注

psaux|greporacle1-50

数据库进

psaux|grepLISTE正常

NER

psaux|grepWebS50-20

WEBAPP

pherepsaux|grep0正常

进程

tomcat

more/opt/WebSp

AppErrolohere/AppServer/I

正常

gogs/server1/Syste

mErr.log

more/opt/W

AppOebSphere/AppSer正

utlogver/logs/server1/常

SystemOut.log

more/home/XXX/

TomcaterrXXXwas/XXXwas4

正常

log0/logs/error/was

40errorlog.txt

OracleERmore/home/oracl

正常

Rloge/admin/WWW/

40

服务器服务器监测项目检测方法正常实测情结果备

IP功能范围况

bdump/alertW

WW.log

netstat-ntlp

(XXXWCM-JAVA

端口监听运行

正常

情况正常

80809080LISTENE

R:1521)

lastlastlogmore/v

用户登录10网

ar/log/messages|正常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论