云计算中心运维SLA设计标准_第1页
云计算中心运维SLA设计标准_第2页
云计算中心运维SLA设计标准_第3页
云计算中心运维SLA设计标准_第4页
云计算中心运维SLA设计标准_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、云计算中心运维SLA设计标准目录 HYPERLINK l _bookmark0 概述3 HYPERLINK l _bookmark1 目的3 HYPERLINK l _bookmark2 适用范围3 HYPERLINK l _bookmark3 实现方法3 HYPERLINK l _bookmark4 内部服务台服务可用性 SLA 保障手段3 HYPERLINK l _bookmark5 内部服务台 SLA 时间保障措施3 HYPERLINK l _bookmark6 技术中心 SLA 最新标准与赔偿3 HYPERLINK l _bookmark7 技术中心 SLA 服务标准制定4 HYPER

2、LINK l _bookmark8 合约 SLA 说明4 HYPERLINK l _bookmark9 SLA 服务满足业务的测算方法:4 HYPERLINK l _bookmark10 SLA 响应效率的实现-工单系统 SLA5 HYPERLINK l _bookmark11 SLA 响应流程6 HYPERLINK l _bookmark12 SLA 的正式发布6 HYPERLINK l _bookmark13 SLA 的持续优化7 HYPERLINK l _bookmark14 优化发起7 HYPERLINK l _bookmark15 SLA 优化的数据来源7 HYPERLINK l _

3、bookmark16 改进措施7 HYPERLINK l _bookmark17 改进追踪8目的 云计算 SLA 服务等级协议(简称:SLA,全称:service level agreement)旨在及时响应客户的需求,持续提高客户满意度,量化的保证服务质量 技术中心通过 SLA 承诺为客户提供一份基于运维服务可用性的指标保障 技术中心通过 SLA 来约束故障的响应时间与恢复时间适用范围 适用跟云计算所有签订 MSP 协议的客户实现方法 客户合约:2018 年起合约中需要明确约定服务可用性时间的 SLA 保证 内部工单系统:工单系统中要有基于 SLA 的跟踪与警报,运维工程师要基于 SLA 响

4、应客户优先级事件内部服务台服务可用性 SLA 保障手段 工单系统:客户随时登录云计算工单系统提交工单请求: HYPERLINK 邮件:MSP 重要客户随时可通过邮件方式向 L2C 的项目邮件组或项目经理提出请求L2C 统一支持邮箱: 电话:热线电话和项目经理专属大客户电话可随时响应客户请求客服电话:010-2987*24 小时技术支持热线:400-332内部服务台 SLA 时间保障措施 一线运维 7*24 on call 响应,值班表以最新的运维服务台日常支持排班为准 法定节假日部署安排服务热线值班人员,编制运维服务重大节日值班表。 运维人员必须严格遵守公司各项规章制度及各种规范,出现问题必须

5、准确、及时地向项目经理进行上报。 紧急资源协调:非工作时间出现问题需要其它资源协助的,由 PM 统一负责协调各方资源技术中心 SLA 最新标准与赔偿 客户合约 SLA 链接参考:2018 云计算 SLA 标准 SLA 的赔偿默认为承诺服务 miss 时间的 2 倍,最终以与客户商定为准技术中心 SLA 服务标准制定合约 SLA 说明 技术中心按照 P1-P4 做 SLA 不同响应和解决时间约束 P1-P4 定义了故障的严重级别,如下表所示编号服务优先级响应时间解决时间1P1 (24*7)30 分钟4 小时2P2 (24*7)1 小时6 小时3P3(5*8)2 小时2 个工作日4P4(5*8)4

6、 小时3 个工作日 除特别要求外,技术中心通常针对客户生产业务系统需要提供 7*24 小时运维服务,针对客户非生产业务系统可提供 5*8 小时运维服务。编号优先级事件定义1P1(注:仅适用于生产环境)该事件导致工作完全中断,并影响主要的业务流程或广泛的最终客户群,如整个公司、业务部门或外部客户,且没有可 用的解决方案。2P2(注:仅适用于生产环境)该事件会导致系统运行受严重影响,业务功能严重退化,影 响范围大于 80%,或者关键客户受到影响。3P3(注:适用于生产与测试环境)系统的效率受影响,操作性能受损,但系统仍然可以运作4P4(注:适用于生产与测试环境)该事件对正常的业务流程几乎没有影响,

7、可以按预定的方式 处理。注 1:云计算承诺针对 MSP 托管用户每月提供 90.99%的服务可用性。(即已交付上线生产环境的服务,云计算承诺对该服务的即时维护响应每月可使用时间超过 39308 分钟)*43200 分钟(每月总时间)*90.99%= 39308(分钟)*需要第三方支持的服务以第三方提供商承诺的响应与解决时间为准注 2:AWS 基础设施服务,以 AWS 承诺的 SLA 为准,并由 AWS 对其基础设施 SLA 负全责。* AWS 中国区 SLA 参考链接, HYPERLINK /en/legal/sla/ https:/SLA 服务满足业务的测算方法: 技术中心根据真实服务中的客

8、户特征,评估服务可用性 SLA:L2C 服务的商业客户通常工作时间为工作日 12 小时,每月约 60*4240 小时商业客户非工作时间的维护窗口平均约每天 3 小时,30 天为 90 小时总计为:240*60+90*60=19800 小时19800/43200*100%=45.83%云计算承诺提供的服务可用性 SLA 为*43200 分钟(每月总时间)*90.99%= 39308(分钟),满足客户需求 云计算 SLA 原则上要求响应时间接近或高于 AWS Support 的 SLA 平均响应时间P1P2 对应企业级支持,时间响应接近一致。针对生产系统的重大异常,有明确的项目经理跟进,参考故障管

9、理流程系统受损对应 P1-P3,云计算约定为 50%:半年 1 次发起人:技术服务部 Leader 项目触发:客户满意度低于 4.5SLA 当月成功率小于 50%发起人:项目经理、工程师为了提升客户满意度,云计算根据每个月/季度的巡检报告,定期跟客户开例会讨论具体的改进措施, 比如。SLA 优化的数据来源 客户满意度中对响应时间、解决时间的反馈意见 工单系统导出项目的 SAL 数据对比 SLA 周期月份的“SLA 成功率“根据满意度调查结果,针对无法满足客户需求的工单进行分解处理改进措施 针对 Miss“第一响应”(非工单录入 miss):增加项目支持的响应人员,在项目组中添加报警人,缩短故障的响应时间按需提升一线工程师夜间响应人数复查排班表主动对客户提供 Miss 服务补偿 针对 Miss“解决时间”:增加二线接入频率缩短故障升级时间完善故障排查手册增加内部技能培训增加外部培训主动对客户提供 Mi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论