SRE 运维工程师考试试卷及答案_第1页
SRE 运维工程师考试试卷及答案_第2页
SRE 运维工程师考试试卷及答案_第3页
SRE 运维工程师考试试卷及答案_第4页
SRE 运维工程师考试试卷及答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SRE运维工程师考试试卷及答案一、填空题(10题,每题1分)1.SRE核心职责之一是平衡________与业务迭代速度。2.SLI常见类型包括延迟、吞吐量、________和错误率。3.Prometheus存储时间序列数据的核心是________。4.Kubernetes调度核心组件是________。5.混沌工程开源工具举1例:________。6.CDN主要作用是________静态资源加载速度。7.日志收集工具举1例(除ELK):________。8.灾备主要类型有主动-被动和________。9.容器编排工具除K8s外举1例:________。10.基于时间窗口的告警阈值称为________阈值。二、单项选择题(10题,每题2分)1.SLO的定义是?A.服务承诺最高可靠性B.可测量性能指标C.服务可靠性目标D.故障恢复时间2.Prometheus默认端口是?A.8080B.9090C.6379D.21813.Pod默认重启策略是?A.AlwaysB.OnFailureC.NeverD.RestartOnError4.混沌工程核心目标是?A.提高性能B.发现潜在故障C.降本D.简化架构5.ELK栈中“E”是?A.ElasticsearchB.LogstashC.KibanaD.Filebeat6.故障处理第一步是?A.定位根因B.故障确认C.修复D.复盘7.云原生监控常用工具是?A.NagiosB.ZabbixC.Grafana+PrometheusD.Cacti8.容器隔离核心技术是?A.虚拟化B.Namespace+CgroupsC.沙箱D.镜像9.属于SLA内容的是?A.月不可用≤1小时B.响应≤200msC.吞吐量1000QPSD.错误率≤0.1%10.灰度发布目的是?A.全量上线B.验证新功能C.降负载D.提安全三、多项选择题(10题,每题2分,多选少选不得分)1.SRE核心实践包括?A.SLO管理B.混沌工程C.容量规划D.故障复盘2.SLI常见类型有?A.延迟B.吞吐量C.可用性D.资源利用率3.K8s服务发现组件是?A.kube-proxyB.CoreDNSC.IngressD.kubelet4.混沌工程原则包括?A.假设驱动B.最小影响C.自动化D.无侵入5.日志管理关键环节是?A.收集B.存储C.分析D.告警6.灾备评估指标是?A.RTOB.RPOC.MTTRD.MTBF7.监控系统组成部分是?A.采集B.存储C.告警规则D.可视化8.容器编排优势是?A.自动扩缩容B.服务自愈C.资源高效D.环境一致9.容量规划步骤是?A.需求分析B.资源评估C.预测扩容D.效果验证10.CDN优势是?A.降源站负载B.提访问速度C.提可靠性D.减跨域延迟四、判断题(10题,每题2分,√/×)1.SRE不参与代码开发。()2.SLO是用户最低可靠性承诺。()3.Prometheus仅支持Pull采集。()4.Deployment管理无状态应用。()5.混沌工程必须在生产环境实施。()6.Logstash负责日志存储。()7.SLA是可测量性能指标。()8.容器资源利用率低于虚拟机。()9.灰度发布是全量上线。()10.RTO越小恢复越快。()五、简答题(4题,每题5分)1.简述SRE与传统运维的核心区别。2.解释SLI、SLO、SLA及三者关系。3.简述混沌工程实施步骤。4.简述Pod生命周期主要阶段。六、讨论题(2题,每题5分)1.如何平衡系统可靠性与业务迭代速度?2.云原生环境下如何设计有效监控告警体系?---答案部分一、填空题答案1.系统可靠性2.可用性3.TSDB(时间序列数据库)4.kube-scheduler5.ChaosMonkey(或Chaosblade、LitmusChaos)6.提升7.Fluentd(或FluentBit、Filebeat)8.主动-主动9.DockerSwarm(或Mesos)10.滑动窗口二、单项选择题答案1.C2.B3.A4.B5.A6.B7.C8.B9.A10.B三、多项选择题答案1.ABCD2.ABCD3.ABC4.ABCD5.ABCD6.AB7.ABCD8.ABCD9.ABCD10.ABCD四、判断题答案1.×2.×3.×4.√5.×6.×7.×8.×9.×10.√五、简答题答案1.核心区别:①SRE结合开发技能,传统运维侧重维护;②SRE以SLO平衡可靠性与迭代,传统运维被动响应故障;③SRE主动用混沌工程预防故障,传统运维多事后修复;④SRE将运维自动化(如InfraasCode),减少人工干预。2.定义与关系:-SLI:可测量的服务性能指标(如延迟、错误率);-SLO:一段时间内服务需达到的SLI目标(如99.9%可用性);-SLA:与用户约定的服务承诺(含惩罚条款);-关系:SLI衡量SLO是否达标,SLO是SLA的基础。3.实施步骤:①定义假设(如“依赖故障不影响核心业务”);②选择实验场景(如模拟数据库故障);③最小化影响(仅非核心集群);④自动化执行;⑤监控分析结果;⑥复盘优化。4.Pod生命周期:①Pending(等待调度);②Running(运行中);③Completed(容器正常退出);④Failed(重启失败);⑤Unknown(状态未知);⑥Terminating(优雅终止)。六、讨论题答案1.平衡方法:①量化SLO(如核心业务99.9%可用性),明确可靠性边界;②用灰度/蓝绿部署逐步验证新功能;③自动化故障注入(混沌工程)提前发现风险;④将运维代码化,减少迭代阻碍;⑤定期复盘,根据业务优先级调整SLO。2.监控告警设计:①分层监控(基

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论