服务器及软件维护服务项目整体实施方案_第1页
服务器及软件维护服务项目整体实施方案_第2页
服务器及软件维护服务项目整体实施方案_第3页
服务器及软件维护服务项目整体实施方案_第4页
服务器及软件维护服务项目整体实施方案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节项目整体维护服务设想 2一、提供专业维护服务 2二、建立设备配置管理 2三、加强问题事件管理 3四、完善服务管理体系 3五、做好应急预案 3第二节运维流程及服务方式 4一、服务方式 4二、运维流程 6三、突发事件应急流程 7第三节服务器设备维护服务方案 9一、维护服务保障方案概述 10二、服务方案设计原则 12三、保修服务内容及标准 13四、服务实施细则 16五、服务保障措施 42六、应急预案 45第四节项目实施承诺及协议 47一、项目实施承诺书 47二、项目进度承诺书 48三、维护服务承诺书 49四、服务器及软件维护保密协议书 50第一节项目整体维护服务设想一、提供专业维护服务针对本次服务器及软件维护服务,我公司会为客户提供专业维护服务:1.通过日常维护,保证机房服务器及软件维护范围内设备系统的正常运行;2.当服务器及软件一旦发生故障时,能及时进行响应,对故障进行诊断、分析,尽快解决系统故障,将故障影响降低到最低程度;3.定期对维护机房服务器设备做清洁、保养维护,从而延长此类设备的使用寿命,最大限度地降低运维成本;4.制定紧急应急措施,做好预防性维护;二、建立设备配置管理加强资产的巡检和普查,委派专职的配置管理员,收集服务器设备运行系统、硬件、软件、文档、线路、系统环境等信息,建立了各种配置项间的关联关系。通过该配置管理数据库,获得目前基础设施状态的准确信息。规范配置信息的识别、管理,使得关键的配置信息准确地记录在管理数据库中,确保配置信息记录与实际环境的一致性。按日、周、月、年对设备基本信息、性能数据、故障信息、安全信息、服务信息进行统计分析,为决策提供支持。三、加强问题事件管理问题管理流程的目标就是通过一系列规范的环节,找到问题的根源,并形成解决方案。从问题的检测与记录开始,经过对问题的分类和分派、调查和诊断,直到问题的最终关闭。各环节连续清晰,环节角色分工明确,从而实现在发现问题后,能够迅速地找到问题的根源,形成解决方案,为最终解决问题打下基础。问题管理也是形成运维人员自身知识库的重要环节,是服务质量持续提高的一个有力保障,此项目中需加大问题管理流程建设的力度,日常维护服务中注重问题管理流程的落实。四、完善服务管理体系完善的服务管理体系是维护服务工作重要的指导,规范了维护工作的流程、操作管理制度、人员考核制度,确保和提高设备的使用率,保证服务器及软件维护服务工作快速有效。五、做好应急预案应对突发事件,做好应急预案是项目维护问题管理及持续性管理的重要内容。评估重要资产面临的风险,需要主动做好突发事件的前期预防和预警,制定应急预案,采取相应措施,最大减少事件影响及带来的损失。第二节运维流程及服务方式一、服务方式随着企业信息化的高度发展,IT基础构架已经成为支撑企业业务正常运行的重要因素,稳定、安全的IT业务系统甚至成为企业的核心竞争力之一。硬件故障、数据丢失、宕机、负载过高或闲置、病毒、人为操作失误等IT系统问题直接影响企业业务系统的正常运行。我司基于多余年的IT服务经验,我们总结提炼出涵盖主流IT设备厂商从主机、存储、网络到软件系统等全线IT基础构架的维护服务产品,为客户的业务提供跨厂商的技术支持,以专业的工程师队伍和规范的业务流程为客户及时解决系统故障、恢复业务系统运行,降低系统故障率,提高IT系统可用性,并帮助客户提高自身的IT管理能力。综合服务能力强,涵盖了HP、IBM、SUN、CISCO等主流厂商从服务器、存储到网络设备等得全线IT基础构架设备,单一服务接口简化多品牌管理、我们能够满足用户对不同层次的服务和不同种类产品的需求,为用户提供一站式服务。针对此次维护服务,内容主要有:(一)硬件保修服务本服务是对续保客户提供的一种保障性增值服务,即对维护服务期内的产品硬件在产品正常使用过程中可能发生的故障(人为不当操作、设备运行环境、不可抗力因素等造成的产品毁损情形除外)提供终身维护维修服务。硬件保修服务作为设备最基本、最重要的服务之一,为产品的长期稳定运行增加了一个重要的安全筹码,有利于延长了产品的生命周期,有利于更好的保障客户网络安全。维护服务期内,正常使用下发生故障由我司负责保修。服务器损坏的部件或配件为厂商的正规产品。(二)远程技术支持服务远程技术支持服务是指我公司技术工程师通过电话、网络等方式为最终用户提供排除故障、更改配置、调整网络结构等技术支持服务。最终用户提出技术服务请求,我司技术工程师通过电话、网络等远程支持服务为最终用户提供的技术服务。(三)现场技术支持服务现场技术支持服务是指我司技术工程师为最终用户提供排除故障、更改配置、调整网络结构、软件版本升级、安全值守、售后培训等技术支持服务。最终用户提出技术服务请求,我司技术工程师通过电话、网络等远程支持服务不能解决最终用户提供的技术服务请求时,我司技术工程师为最终用户提供现场技术支持的服务,原则上在半个小时内响应,两小时到现场,八小时解决问题。(四)电话回访服务我司设有专职电话回访人员。电话回访人员每季度不少于3次通过电话向最终用户的设备维护、使用人员了解相关设备运行情况,并记录贵单位维护、使用人员反映的问题或意见及时反馈给我司技术经理,以便能及时响应相关服务请求,解决有关问题。我司建有完善的技术服务规范,严格要求所有相关服务的人员必须提供优质规范的服务,每次技术服务后,我司安排有专门人员对技术服务人员的服务质量等情况进行回访调查,通过对技术服务质量的监督和收集客户单位对我们服务的善意的意见和建议,以期确保和进一步提升为客户单位提供的服务质量。(五)现场巡检服务我司不定期指派技术工程师到达最终用户设备使用现场,对设备进行现场巡检,了解最终用户单位的设备运行状况,及时发现问题、解决问题,并为最终用户提供此次现场巡检的巡检报告。同时,还可据最终用户的需要,采用先进的网络监测与分析工具对系统进行诊断,提出系统优化建议与措施。二、运维流程我公司除培训服务外,为本项目提供两种服务方式:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。(一)技术人员现场值守运行维护服务的基本操作流程如下图所示:(二)定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:三、突发事件应急流程在日常运维中可能会出现突发事件,一旦出现如下问题我公司将遵循应急流程处理突发事件。突发事件的来源,可能来自三个途径,第一巡检维护过程中发现、第二设备运行发生告警、业务部门反馈,一旦发生驻点工程师第一时间告知客户,并将具体的情况一同告知,以最快速度联系公司相关技术专家和公司相关高层领导,与专家进行充分沟通初步定位故障,并将故障定级,同时告知客户,如遇到驻点工程师无法解决的故障时,公司内相关领域技术专家会以最快速度赶到事故现场进行故障处理,直至问题解决,在问题解决之后。由技术专家和驻点工程师共同完事件问题报告,将事故的发生原因,处理的方式,以及如何避免再次发生的方法进行详细记录,录入客户的运维管理文件中,同时由公司技术专家完成将此案例录入公司内部知识案例库,作为以后借鉴依据,当事故处理完毕后,由驻点工程师或技术专家将结果告知客户和公司相关领导。第三节服务器设备维护服务方案建立高效、可靠、专业的服务支撑体系则是企业实现上述发展战略的重要保证。IT规划、管理、实施、维护是一项技术复杂、成本高昂、变化频繁、人员素质要求高的系统工程,企业自己操作虽然可靠,但存在如下问题:信息技术的广泛性、复杂性决定了企业不可能配备技术很全面的专业人员从事企业自身的IT工作;企业自身网络的狭隘性难以留住一流的IT技术人才,造成实际运维人员专业化程度不够,有可能影响企业IT工作的科学性、系统性、经济性;企业对自身IT工作人员的专业工作管理很难做到专业IT服务公司对其技术工程师的严格、系统的管理程度;由于上述原因导致的企业对IT的投入在很大程度上未能得到应有的回报,累计效率损失严重,不能实现对核心业务的有力支援和保障。由此可见,引进外脑、引进高度专业化的IT外包服务,实是企业轻松的、切实可行的解决之道。不仅能够解决上述的问题,还有如下优点:服务行为的公司化。外包服务商的外派人员的所有行为代表公司,企业若对其服务不满意可要求立即更换,且对其工作中的差错所造成的损失能够获得相应的补偿;强大的配套支持能力。除企业要求外包服务商提供的相关服务外,专业外包服务商本身所具有的专业队伍、供货渠道、行业经验、业务体系等能为企业带来更多的潜在利益;灵活的外包服务方式可为企业度身定制最佳性价比的特色服务,即可以按时定价、也可以按次定价;即能够整体外包、也可以切块外包。专业外包服务公司的特点:严格、规范的外包服务管理高水准、多层次的专业服务工程师队伍丰富的外包服务经验及时、准确的服务质量监控体系非常完整的配套业务体系,客户可获得更多的附加价值一、维护服务保障方案概述(一)本地化服务及响应方式1.响应没有次数限制:服务接受方的软件、硬件系统出现故障,或设备运行过程中有技术疑问需要技术咨询时,可在所选定的服务级别时效内拨打由服务提供方提供的服务热线电话。服务提供方应立即处理客户的电话请求,提供远程技术支持与诊断,直至客户得到满意的结果;2.7×24级别电话支持响应时效:一年365天全天候服务支持,30分钟内响应客户服务诉请。3.工程师现场响应时间:故障级别服务指标P1级故障P2级故障P3级故障P4级故障(非故障)业务恢复时间2小时4小时12小时-当远程无法确诊或远程无法指导客户恢复业务时,将安排工程师赶往现场协助诊断抵达现场时间7*242小时内到达用户现场,紧急时刻1小时到达现场0.5小时内响应(二)7*24小时硬件保修当系统硬件发生故障时(合同期内),我司维护工程师应以最快速度赶到故障现场进行故障检测、维护,及时更换故障部件恢复系统正常运行。如果故障在短时间内无法排除,我公司会向贵单位提供替代整机,如我公司解决不了的问题会与产品制造商联系缩短故障排除时间。在做硬件维护前我公司会制定详细可行的计划,确保贵单位的数据安全和业务运行的可靠稳定连续。(三)7*24小时系统软件维护1.维护范围:基于检测和分析,将及时获取原厂发布的版本更新或者补丁程序等,如果适合贵单位的情况,会及时做好升级举措。但在升级和打补丁之前,要对必要的系统数据做好备份,防止异常情况发生。通常情况下,该项工作在每次的巡检结束后,通过分析给出明确结论,确定是否需要升级软件;在发现异常时,根据故障分析判断是否升级软件(1)对使用过程中遇到的疑难问题进行支持(2)对系统性能优化提供建议及支持(3)对系统安全、网络配置提供建议及支持(4)现场进行疑难问题解决(5)现场进行性能优化(6)现场进行系统配置(7)及时通知客户新的系统更新信息(8)提供相应系统并进行更新安装(9)提供新版本系统安装服务(10)配合测试新版本系统(11)系统板卡,设备的微代码升级(12)提供新技术、新方法、技术经验及技术动向。(13)协助客户制定出具备可操作性的主机设备故障应急方案并协助演练。(14)免费咨询服务二、服务方案设计原则本方案主要针对贵单位的服务器主机及配件,相关的操作系统设计合理科学地维护策略。方案的设计遵循以下原则:(一)业务为中心:本项目的最终目标是保证业务系统的安全和可靠运行。包括计算机系统的可靠运行和业务数据的安全保证,我们将动用一切有效的措施手段,力求业务系统万无一失,我们的目标是:“非正常性停机时间为零”。(二)重在措施:注重预防。我们将在传统的被动式服务的基础上提供主动式的服务,和客户一起做好系统的监控维护工作。采取以预防为主的策略,把故障隐患消灭在萌芽中。服务组织。服务组织管理和流程管理是项目成功的关键。我们将在责任工程师(项目经理)的统一调度下,指挥技术、应用、商务及服务监督人员,在售前、服务实施、售后的各个环节紧密与客户方配合。(三)追求最佳性价比:服务的级别意味着客户的成本,我们在保障高标准服务的前提下,努力通过精心组织、精心实施来降低客户的成本,同时为客户提供更多的增值服务。三、保修服务内容及标准本方案针对贵单位上IBM服务器及相关的硬件设备及操作系统保修服务以及数据库协助保修服务、协助应用软件升级、应用软件的备份等服务内容。主要服务项目如下:(一)故障排除在规定时限内排除故障恢复系统运行,包括故障定位、部件更换、数据恢复的全部工作,不再另外收取任何费用。(二)定期巡检定期对系统进行预防性维护,包括检查系统状态、设备清洁、系统备份,以及与客户工程师的技术交流。(三)培训我们将免费提供针对项目的技术培训和技术交流。包括:1.现场培训:主要在巡检及项目实施过程中进行,由我公司工程师结合实际情况,对工程设备的安装调试、使用和维护进行详细的讲解,达到客户相关人员能够自主使用和维护系统设备的目标。2.专业技术培训:通过培训使相关技术人员能有效管理IBM服务器、监控、日常操作维护,对集群环境、AIX环境、系统性能优化等特别予以关注。我公司将免费提供培训师资、教材及搭建培训软硬件环境。培训的具体地点及安排由我公司和用户协商而定。参考课程如下:(1)系统及网络管理(2)集群高可用方案(3)故障定位与系统运维常见问题(四)增值服务1.咨询服务:解答客户在系统使用中的问题。可通过电话解答客户非保修设备使用中的技术问题。一般情况下,指导客户解决问题,特殊情况下,可到客户现场指导并解决问题,这样可以有效地提高客户的系统管理水平,降低系统的人为故障率。定期发送有关资料,使客户及时跟踪掌握相关IT新技术及新产品,互相交流系统使用及维护方面的经验。协助客户建立健全规范的管理制度和系统使用维护的技术流程及规范。建立系统的配置档案和升级维护档案,定期提交系统维护及管理报告。(1)系统升级、扩充为客户提供系统升级、扩充、改造、迁移等服务。结合客户的实际情况,为客户详细制订切实可行的技术方案和合理的费用计划,并可提供现场的实施工作。如客户需要搬迁设备,我们可以为客户制订安全周密的搬迁计划,并负责实施,保证客户设备搬迁后的正常运转,省去了客户自行搬迁所带来的烦恼。(2)协调工作协调原厂商(包括软硬件)的维护和维修工作。定期召开例会,双方交流,向客户方领导汇报工作并听取领导及技术人员的意见和建议。2.服务工作时间提供7×24电话受理服务请求或帮助客户解决技术问题。3.响应时间接到问题报告后0.5小时内提供电话支持服务。2小时内到达用户现场,紧急时刻1小时到达现场。4.故障恢复时间接到报修后8小时之内系统恢复正常;如需要进行备件更换,两小时内完成现场备件更换。非系统崩溃的情况,非系统崩溃的情况。接到问题报告后0.5小时内提供电话支持服务;乙方工程师按合同约定的频度到甲方单位进行巡检并出具巡检报告。5.保密条款我公司将严格遵循保密协议,凡涉及客户的机型配置、IP地址、软件等信息不得向第三方泄露,维护过程中如需涉及客户系统的数据信息,必须先通过客户方认可,维护工作的数据信息(无论是打印或介质上的数据信息)不得带离客户工作现场,如有更换或损坏硬盘盘片,均交回技术处理。四、服务实施细则(一)前期工作在保修合同生效前,我公司将派出硬件工程师和系统软件工程师前往客户现场,对现场相关网络设备进行测试,并对运行情况做好文档记录。然后对设备进行必要的清洁、保养和维护,使设备处于良好的运行状态。施工交底依据合同明确服务标准、工作流程、联系方式;建立设备档案详细记录设备型号、出厂编号、版本号、场地环境检查,包括供电装置、电源电压、接地和室内湿度、温度、温变梯度、空气洁净度、防雷措施等进行检查,对问题隐患提出改进建议;(二)故障预防建议系统工程师通过预防性检查对系统硬件进行检测和诊断,对系统中潜在的硬件故障采取预防措施。如果某些部件出现无法恢复的故障,系统工程师将尽快予以修理更换。维护期内提供定期巡检服务。系统工程师定期巡检的目的在于通过巡检及时发现和纠正可能出现的硬件和系统问题,从而在最大程度上为设备的连续稳定运行提供保证,巡检内容主要包括:1.服务器主机系统的运行状态;2.网络设备的运行状态;3.外部设备(包括磁盘阵列)运行情况;4.所有连接接口,CABLE,电源等可能容易导致设备出现问题的敏感部件;5.检查系统Errorlog;6.协助用户机房技术人员解决和分析日常设备运行中出现的未解决问题。(三)故障排除保修合同生效后,系统发生故障后每次服务流程如下:1.报修系统发生故障,客户可在第一时间内与我公司项目经理(责任工程师)取得联系,说明客户单位、故障机型,尽可能说明故障现象以及可能的故障原因。客户也可与我公司服务中心直接联系,服务中心调度长在第一时间内与我公司项目经理取得联系,服务中心的SMS系统会全程跟踪本次服务。2.响应我公司项目经理会立即在响应时间(本项目为0.5小时)与客户现场工程师取得联系,取得详细的故障信息,做出相应的判断,在电话中与客户工程师互动交流,首先排除因系统参数设定、使用中的软性故障,如果未能排除故障则服务工程师立即准备赴现场服务。3.现场服务服务工程师携带相应备件赴用户现场进行维修。首先进行现场诊断,分析锁定故障部件,更换部件或调整参数,数据恢复,直至系统恢复正常运行。每次现场服务完成后,由我公司工程师填写《现场工作日志》,由客户方代表确认并签署意见后交公司存档。如第一次现场服务不能解决故障,则立即启动应急预案。4.第三方配合我公司承诺:只要是我公司所保的系统发生故障,我们的服务工程师必须在第一时间内赶赴客户现场。不论是系统硬件、操作系统故障,还是非我公司承担的网络、应用程序故障,或者系统升级改造、系统迁移等,我公司服务工程师将积极配合客户完成系统维护工作,绝不会因扯皮推卸责任而损害客户利益。(四)巡检1.巡查内容定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题,从而在最大程度上为系统的连续稳定运行提供保证,巡检工作主要包括:(1)主机系统的运行状态,对系统CPU、内存、I/O状态、进程等检查;(2)外部设备运行状态,对磁盘阵列、磁带机、外置光驱、维护终端等的状态、设置进行检查;对风扇、后备电池、磁盘、磁带、键盘等敏感部件进行重点检查,如有故障征兆则进行先期更换;(3)连接件检查,对连接插头、电缆、电源插座等进行检查;(4)环境检查,包括电源电压、接地和室内温度、湿度、空气洁净度等;(5)清洁保养,清除机箱、滤清器内的灰尘与异物;(6)系统优化,协助客户对OS进行系统性能调整和系统优化,提高系统效率;进行相关的安全(7)性进程检查;(8)技术交流,双方技术人员分析和解决日常运行中出现的未解决问题;(9)工作报告,在对系统进行全面的检查后,给出详细的报告,根据检查结果给出相应建议和改进方案。2.巡查周期我公司技术服务有限公司为贵单位提供乙方应提供7×24全天技术支持服务,并根据甲方的需要提供现场支持服务。具体服务时间由甲方需求决定,服务响应时间按本招标文件第四点要求施行。(1)确保本次保修范围内所有硬件设备的正常运行。(2)确保本次保修范围内服务器设备操作系统的正常运行。(3)及时提供操作系统升级和故障硬件更换。(4)提供特殊时段(如:结账日、春节、劳动节、国庆节、年终、系统停机维护、数据集中及用户认为必需的重要时段)的服务,以及产品安装、系统变更和迁移等的现场支持服务。(5)我司应提供7×24全天技术支持服务,并根据招标方的需要提供现场支持服务。具体服务时间由招标方需求决定,服务响应时间按本招标文件第四点要求施行。(6)每月一次例行巡检即预防性维护并提供例行巡检报告;(7)每月一次的系统运行性能诊断并提供性能分析报告;(8)每次硬件故障处理后提供硬件处理和备件更换报告;(9)每季度一次健康性检查,全面检查硬件系统的工作状态、对硬件系统的运行环境进行评估、现场解答有关硬件技术方面的问题、磁盘系统CACHE使用率、硬件可用率、故障分布和维修类型状况,并交付硬件系统健康检查报告书,针对设备的运行状况,提出设备的配置和参数设定等方面优化建议;(10)我司在服务年度期满前十五天应通知招标方,并完成年度现场维护,提供年度服务总结报告,方便贵单位控制和管理。3.巡检制度报告表格(1)机房巡检项目1)范围本规定适用于网络设备机房。2)目的为了更加有效地对网络信息系统进行管理,及时查找、发现网络及信息系统设备隐患,排除故障,根据相关规定实际情况,制定本管理制度。(2)检查项目要求:1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。2)服务器:检查服务器是否宕机,服务器(磁盘阵列)硬盘等指示是否正常。3)机房环境:检查机房空调工作状态,机房温度。(3)情况记录各检查项目如无异常情况,在正常或异常栏中打“√”,如有异常情况,做好详细情况说明并及时上报技术主管。设备CPU利用率情况检查编号:SXKR-001检查项目:设备CPU利用率情况检查检查命令:检查期待结果:CPU利用率平均值〈50%;最大值〈70%备注:检查范例:检查结果:□正常□不正常设备memory利用状况检查编号:SXKR-002检查项目:设备memory利用状况检查检查命令:检查期待结果:备注:检查范例:检查结果:□正常□不正常设备系统模块运行状况检查编号:SXKR-003检查项目:设备模块运行状况检查检查命令:检查期待结果:备注:检查范例:检查结果:□正常□不正常设备电源及风扇检查编号:SXKR-0004检查项目:设备系统电源及风扇检查检查命令:检查期待结果:电源及风扇运行正常备注:检查范例:检查结果:□正常□不正常设备运行温度检查编号:SXKR-005检查项目:设备运行检查检查命令:检查期待结果:设备内部各部分工作温度小于45摄氏度检查范例:检查结果:□正常□不正常设备系统LOG日志检查编号:SXKR-006检查项目:设备系统LOG日志检查检查命令:备注:检查范例:有无异常日志:□有□没有4.最终巡检报告(1)机房健康巡检报告检查时间_____年__月____日____:____检查人______________1)机房环境为保证机房内各个应用系统的设备正常稳定地运行,良好的机房环境是非常必要的,我公司针对本次项目主要从机房空调系统、UPS供配电系统,作为重点运维内容,同时对机房内的其他指标项进行检测如机房内温度、湿度、消防系统、新风系统等。机房空调系统的运维内容主要遵循如下表单进行巡检:检查项结论情况摘要检查项结论情况摘要温度□正常□异常℃湿度□正常□异常%痕迹□正常□异常清洁□正常□异常异响□有□无异味□有□无注:痕迹检查地面、墙壁、天花是否有裂痕、水渍,机房内是否有鼠患、蚁患、蟑螂活动的痕迹,正常室温:20~25℃。机房空调巡检报告用户单位名称:设备名:设备型号:产品序列号:系统检查项目检查时间:检查时间:空调1控制温度℃℃控制湿度%%当前温度℃℃当前湿度%%业务机房当前温度℃℃当前湿度%%监控室/ups当前温度℃℃当前湿度%%当前运行空调检查空调是否有排水不出产生积水、漏水现象()1号机在用()2号机在用()1号机在用()2号机在用()无积水、漏水现象()无积水、漏水现象()有积水、漏水现象()有积水、漏水现象目前存在的问题:改进措施或建议:巡检结论:客户签字:工程师签字:日期:年月日日期:年月日备注:我公司巡检人员每周会严格按照机房空调巡检报告具体要求对客户的空调系统检测,为保证空调系统的工作正常,每年不低于2次的全面巡检,对故障配件进行检修,在日常维护中及时清理及更换过滤网和加湿罐等耗材,定期清理机房空调的室外机,检修内各供水管路及排水管路,杜绝漏水,保证管路畅通。在设备出现故障后,保证在48小时内恢复正常。2)机房UPS系统的运维内容主要遵循如下表单进行巡检:UPS巡检报告设备型号:产品序列号:信息显示检查检查量测量值显示值检查量测量值显示值1输入电压Vab输入电流Ia2输入电压Vbc输入电流Ib3输入电压Vca输入电流Ic4输出电压Vab输出电流Ia5输出电压Vbc输出电流Ib6输出电压Vcb输出电流Ic7输入频率Hz输出频率Hz8输出功率kW输出视在功率9电池电压Vdc电池电流Id当前UPS运行状态□市电逆变□旁路□电池逆变□故障停机□单机□并机旁路或电池逆变的原因:内部检查:(检查时可能断电,用户需断开负载)是否合格处理概要1检视输入/输出端子、螺栓、螺帽紧固性2检视所有主控板电气连接是否安全可靠3检查器件、电缆等损坏、老化情况4检查风扇及风道状况5检查机柜、电池架等结构件腐蚀、形变与连接紧固情况6检查机内变压器、散热器等散热环境和通道状况7检测所有滤波电容外观、紧固和泄露情况8清扫可达空间和无源空间9视检整流器和逆变器驱动板是否过热或烧焦10视检整流器充电器晶体二极管是否老化11视检直流电容/交流电容是否老化12检查所有保险丝是否正常功能测试(如果必须进行以下测试,经客户同意后按照操作流程进行)1市电逆变/旁路转换功能正常□异常□2实际负荷下电池放电和充电等电池管理功能正常□异常□3UPS逆变同步,并机均流正常□异常□4报警功能和历史故障信息记录,并清除历史记录正常□异常□处理概要:其他问题或建议:电池检测报告□有□无巡检人签名:用户签名:日期日期备注:我公司巡检人员每周会严格按照UPS巡检报告具体要求对客户的UPS供配电系统进行检测,根据具体的检测结果对UPS设备进行合理维修,为保证UPS设备的正常运行,每年至少进行一次全面巡检,巡检时检查蓄电池使用情况,在客户授权的情况下进行充放电,当UPS设备发生故障时,应在72小时内恢复正常运行。3)服务器检查项操作提示/正常值结论情况摘要整体检查硬件故障查看服务器设备故障灯□正常□异常如发生故障,此处详细说明现象与解决方法补丁是否有新补丁需要测试安装□是□否如有未装补丁,请详细登记补丁名称与对应服务器名称防病毒病毒库是否升级为最新□是□否病毒库日期文件服务器系统事件无错误事件与不明登录事件□正常□异常日志文件设置以及运行正常,数据量正常□正常□异常磁盘卷组无处于失效状态的逻辑卷□正常□异常功能域用户正常登录□正常□异常文件服务器正常访问□正常□异常文件功能正常□正常□异常数据备份最近备份时间:年月日□正常□异常域服务检查系统日志文件无错误信息□正常□异常运算系统服务器系统事件无错误事件与不明登录事件□正常□异常日志文件设置以及运行正常,数据量正常□正常□异常磁盘卷组无处于失效状态的逻辑卷□正常□异常功能业务正常□正常□异常服务业务正常启动□正常□异常数据备份最近备份时间:年月日□正常□异常日志文件设置以及运行正常,数据量正常□正常□异常磁盘卷组无处于失效状态的逻辑卷□正常□异常功能远程登录正常工作□正常□异常数据库正常工作□正常□异常数据备份最近备份时间:年月日□正常□异常(2)服务器巡检报告此次检查备注信息:客户名称联系人联系电话Email地址主机型号:序列号:主机名:IP地址:子网掩码:缺省路由:配置CPU内存主板硬盘网卡I/O板显卡电源存储阵列磁带库硬件显示器□正常□不正常键盘/鼠标□正常□不正常光驱□正常□不正常板卡□正常□不正常磁带机□正常□不正常线缆□正常□不正常电源□正常□不正常风扇□正常□不正常系统系统指示灯状态前面板指示灯□正常□不正常电源指示灯□正常□不正常磁盘指示灯□正常□不正常系统控制板指示灯(CPU/MEM,I/O等)□正常□不正常系统日志信息IML日志□正常□不正常操作系统日志□正常□不正常交换区使用率TOP或任务管理器查看使用率%□正常□不正常磁盘分区使用率Windows系统Unix系统用命令df-kC:/使用率%□正常□不正常D:/usr使用率%E:/var使用率%□正常□不正常其他分区□正常□不正常操作系统版本/核心patch版本高可用性软件版本数据库软件版本存储软件版本备份软件版本备注:日期:XXXX年X月X日 报告编号:客户签字:工程师签字:网络设备的运维内容主要包含交换机、防火墙以及负载均衡等相关设备输出文档按照如下:网络安全设备巡检报告用户单位名称:设备名:设备型号:产品序列号:检测项目检测方式说明检查结果巡检周期正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□正常□异常□附件:产品清单品牌规格型号数量序列号位置服务时间HPIBM(五)备份与恢复策略随着信息技术的广泛应用,计算机系统的可靠性对生产系统的影响越来越大。作为IT服务的提供者,我们将仔细、全面地考虑并且制订备份与恢复策略。操作系统备份以系统卷为主,必须建立完整的系统备份档案,保证系统宕机时能及时恢复系统原有状态,包括此系统下运行的所有相关软件的配置。双机热备份软件应按应用系统的实际配置情况制定相关的数据备份计划,如卷组备份、卷备份、文件系统备份、文件备份等。应用系统的数据备份应由应用部门根据应用的实际情况列出所有相关数据的连接关系,以便制定出一份详细的数据备份计划,为数据恢复提供一份完整的依据。我公司系统工程师将为用户制定一份完整的系统备份方案,在日常维护的过程中有义务协助用户做好系统的数据备份工作,并提供相关的技术支持,用户备份的介质将存放在用户处,以便故障的恢复。当用户系统出现故障之后,我公司的系统工程师将在用户的故障现场,开始进行故障的排除工作。需要用备份数据做系统恢复时,用户方需提供完整的数据备份。系统工程师还将对用户提供系统升级和安装补丁的工作。(六)项目实施计划我公司技术服务有限公司根据实际服务要求、各种资源状况、系统运行状况和其他现实因素,要求项目组长必须要全面规划出一个符合实际的整个工作进度计划。(七)工作结果与工作报告1.现场服务报告到达时间,工作内容,工作结果,遗留问题,客户评价等。每次工作完成后提交。2.巡检报告系统状态检测评估,系统备份记录,系统管理建议。报告每月提交一次。3.健康报告硬件系统的工作状态检查、评估、磁盘系统CACHE使用率、硬件可用率、故障分布和维修类型状况,设备的配置和参数设定优化建议。报告每季度提交一次。4.总结报告包括年度保修工作统计,保修工作记录,更换部件统计,联席工作会议记录,系统管理建议,最终系统状态检测评估记录。项目结束后一周内提交。五、服务保障措施行话常讲:说得好不如干得好,干得好就要看得见。保修服务具有不可感知性、差异性等特点,就是说服务得好坏只有到项目结束时才能得出评价,而且不同人的评价结果会有一定的差异,所以光凭事前承诺和事后惩罚约束不一定就能选择合适的服务提供商。我公司在多年IT服务的经验基础上基本形成了科学量化的、规范化、可视化的服务体系。(一)备件保障考虑到本项目具有系统安全性要求高、所保机型技术水准高等特点,为了做好本项目的服务,首要因素是必须具备有效的备件保障,我们将与贵单位项目经理共同分析所保系统的运行状况,圈定系统的薄弱环节,共同商议备件部署计划,包括型号、数量、保存地点、检查方式、调整周期等。(二)组织及人员保障制定了与服务有关的一系列管理办法、标准的作业流程和规范化的技术规范,并在不断地加以修改和完善。公司专门为客户设立了服务热线,设有专人值守负责接待客户的来电来访,使客户的需求能够得到及时有效的响应。在较长节日前,公司将及时提醒客户检查、备份系统,并提供节日期间我公司值守安排计划。我公司多名技术人员专业从事服务业务,主攻专业涉及主机、网络、数据库、应用及客户资源管理等,数名资深高级工程师有着十多年丰富的实践经验,具有高超的技术水平和服务水平。公司定期对服务工程师进行各种新产品、新技术和服务技巧等内容的培训,以提高技术人员的技术水平和服务水平。针对本项目将专门成立贵单位项目组,人员及分工如下:1.项目经理:专职负责所保设备故障维修与日常维护,是客户与我公司公司保修工作的唯一界面。通过项目经理客户可以解决技术、商务等一切问题。凡涉密系统的保修业务,我公司将选派政治可靠、技艺高超、认真负责的工程师担当项目经理。2.服务专员:负责与客户的联系和回访,帮助责任工程师协调和解决保修过程中出现的商务事务工作。3.服务工程师:在项目经理的领导下执行故障维修与日常维护。4.后备工程师:我公司将对用户的设备及使用情况进行分析,计划调配工程师,当项目经理无法迅速到达客户现场或不能在第一时间内排除故障的情况下,由后备工程师出任增援现场服务。5.服务总监:定期对服务质量和完成情况进行监督,受理甲方的业务投诉,由公司主管副总经承当。(三)全条款在维护工作前,我公司服务工程师须提前24小时(紧急故障处理除外)向贵单位项目主管提出书面的维护申请。内容包括维护的目的、操作工程师、操作步骤、涉及系统硬件变更、涉及系统软件变更、预计操作所需时间、申请操作所需时间等内容。待得到贵单位项目主管书面批复后维护工作方能开始,且所有操作必须有贵单位方代表在场。如维护工作需要使用移动介质,则必须事先在贵单位本地进行病毒检查,经客户方确认方可使用。维护操作必须事先做好操作方案并制定应急方案,必须严格掌握控制操作时间。所有操作必须两人以上在场,其中一人主持操作一人确认详细记录,所有操作记录须存档并长期保留。(四)巡检通过巡能够及时发现并排除故障隐患,有效保证客户系统的正常运行。定期的系统和数据备份可以快速恢复业务应用,一旦系统故障可以把损失的风险降到最小。经常化、制度化的巡检可以保持双方技术人员的活跃接触,有更多的机会交流在系统使用及系统维护方面的经验,有利于提高系统维护的效率。我公司每一个月例行巡检一次。(五)服务监督客户可随时拨打公司热线,对公司的服务提出批评和建议,公司将热情接待每一位客户,认真听取客户的意见,并将处理结果及时反馈给客户。我公司设有专门的服务监督机构,由主管服务的副总经理全面负责。服务监督机构不定期以各种方式向客户征询对公司服务的意见和建议,并送交服务相关部门,及时反馈给客户。对内部,服务监督机构定期对公司整体的服务质量进行评定,提出改进建议。同时对服务工程师的服务质量、技术水平等进行综合评定,将评定结果提交相关部门作为评定工程师工作业绩的重要依据。六、应急预案行话讲:人算不如天算。从科学的角度来讲即使再严密的服务措施也可能遇到不测事件,我们本着高度负责任的态度,针对具体项目设计组织相应的应急预案,在技术、备件、人员、资金等多方面,用具体措施来保障对客户的服务承诺。应急情况一般是指:项目经理或本地服务工程师无法及时抵达服务现场因突发事件并发而造成不能提供有效备件第一次现场服务故障未排除系统宕机且未能确定故障原因以下情况虽然不属于我公司责任范围但我公司有义务尽全力予以配合:因地震、雷击、战争等不可抗拒力造成系统损坏因供电系统、火灾造成系统损坏我们将事先与贵单位项目经理共同讨论制定紧急预案,在紧急情况发生时启动紧急预案。同时公司将迅速派出高层管理人员赶赴客户现场,会同客户方领导协商,调度指挥各方面有效资源完成保修工作。针对不同情况我们将单独或同时采取以下几种应急措施:(一)备机替换当业务系统不能在约定时间内恢复正常时,我公司将从我公司把替代系统运往客户现场,替换故障系统来运行业务程序,保障客户业务系统在最短的时间内恢复运行。替代系统是同型号同档次机型,特殊情况下不排除起用相似机型,原则是首先保证业务系统的正常运行。当故障系统修复后再替换回替代系统。(二)紧急调用工程师我们有庞大的服务工程师及技术顾问队伍,如有需要我公司可以快速调动后备工程师紧急赶赴客户现场完成保修工作。当第一次现场服务无法排除故障时,调用更高技术水平或更加专业的工程师紧急赶赴现场协助项目经理(三)紧急调用备件当本地无法提供有效备件时,我们将从中心备件库从其他备件渠道紧急调用备件,并在最短的时间内用最快的方式发至客户现场。(四)紧急调用第三方资源我们与许多原厂商及业界同行建立有紧密的商务合作关系,紧急情况下我们可以调用第三方后备厂商资源,包括备件、技术资源、技术工程师等。(五)远程诊断紧急情况下我们可利用Internet或电话拨号进行远程诊断和故障排除工作,通过技术服务中心的主服务器或模拟系统直接确认问题而加快故障的排除过程。第四节项目实施承诺及协议一、项目实施承诺书为切实防范和杜绝服务器及软件维护中的各种不安全因素,贯彻“安全第一,预防为主”综合治理的方针,树立“安全在心中,生命在手中”的安全理念,做到“不伤害自己,不伤害别人,不被别人伤害”,“变要我安全,为我要安全和我会安全”,我单位特做如下承诺:(一)保证在维护工作现场进出口醒目处设立维护工作安全(警示)标志。(二)制定维护工作安全管理机构和安全管理责任制,配备项目建设项目专兼职安全员,并认真落实各项维护工作安全管理规定。(三)所有作业人员都要经过安全教育和技术操作培训,须有相应的技术资质证书。(四)服务器及软件维护作业中安全管理的重点场所,重点部位等处都要设立醒目的警示标志。(五)服务器及软件维护作业需要的各种辅助材料(设备)要有产品合格证书,辅助设备的安装、使用要符合安全管理规定,并严格执行安全操作规程。(六)确保安全资金投入,满足安全生产条件。定期组织从业人员参加安全生产教育和培训,提高其安全意识,保证从业人员熟悉相关的安全生产规章制度和安全操作规程,掌握本岗位的安全操作技能,提高防范突发事件的应急处置能力。为从业人员提供符合国家标准或行业标准的劳动防护用品,并督促其按规定佩戴、使用。依法参加工伤保险,为从业人员缴纳保险费。(七)落实操作岗位应急措施,依法制定生产安全事故

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论