版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SRE工程师考试试卷及答案一、填空题(共10题,每题1分)1.SRE核心目标是平衡________和开发效率。2.SLI中“L”代表英文单词________。3.监控三要素是数据采集、________和告警。4.服务可用性常用________(百分比)量化。5.混沌工程需在________环境做故障注入。6.SLO是基于用户体验的________目标。7.故障恢复黄金信号含延迟、流量、错误和________。8.容量规划核心是预测未来________需求。9.RTO指________时间。10.Prometheus基于________模型存储数据。二、单项选择题(共10题,每题2分)1.不属于SLI常见类型的是?A.可用性SLIB.延迟SLIC.成本SLID.错误SLI2.SLO与SLA的区别是?A.SLO内部目标,SLA对外承诺B.SLA内部目标,SLO对外承诺C.均对外承诺D.均内部目标3.混沌工程主要目的是?A.破坏生产B.验证系统韧性C.降开发速度D.减监控成本4.RTO正确定义是?A.故障到恢复时间B.故障到发现时间C.数据丢失最大时间D.服务不可用最大时间5.Prometheus默认存储格式是?A.JSONB.时序数据库C.SQLD.CSV6.容量规划“安全余量”作用是?A.应对突发流量B.增加成本C.降性能D.减监控7.SRE日常职责是?A.写业务代码B.监控系统健康度C.设计UID.测试业务功能8.99.9%可用性每年约多少分钟不可用?A.5256B.526C.5.26D.0.5269.故障注入不包括?A.模拟网络延迟B.模拟服务器宕机C.模拟数据丢失D.模拟用户登录10.SRE常用监控告警工具是?A.JenkinsB.GrafanaC.GitLabD.Docker三、多项选择题(共10题,每题2分,多选/少选不得分)1.SRE核心职责含?A.监控可用性B.容量规划C.故障管理D.业务需求分析2.监控黄金信号含?A.延迟B.流量C.错误D.饱和度3.SLI常见类型含?A.可用性SLIB.延迟SLIC.错误SLID.饱和度SLI4.混沌工程实施步骤含?A.定义稳态假设B.注入故障C.验证行为D.清理环境5.容量规划输入因素含?A.历史流量B.业务增长预测C.资源使用率D.用户反馈6.故障管理关键指标含?A.RTOB.RPOC.MTTRD.MTBF7.SRE常用工具含?A.PrometheusB.GrafanaC.ChaosMonkeyD.Kubernetes8.SLO设计原则含?A.基于用户体验B.可量化C.可实现D.对外公开9.系统韧性体现含?A.自动恢复B.自动扩容C.自动备份D.手动修复10.监控数据采集方式含?A.拉取B.推送C.日志采集D.手动录入四、判断题(共10题,每题2分,对/错)1.SRE核心是让系统永远不出故障。()2.SLA是SRE内部可靠性目标。()3.混沌工程必须在生产环境进行。()4.RPO是数据恢复最大时间窗口。()5.Prometheus仅采集PromQL数据。()6.容量规划无需考虑业务增长。()7.故障注入不会影响用户体验。()8.黄金信号“饱和度”指资源使用比例。()9.SRE需参与代码审查。()10.监控告警可完全替代人工排查。()五、简答题(共4题,每题5分)1.简述SLI、SLO、SLA的关系。2.简述混沌工程实施注意事项。3.简述容量规划基本流程。4.简述MTTR(平均恢复时间)优化方法。六、讨论题(共2题,每题5分)1.如何平衡系统可用性与开发效率?2.云原生环境下如何设计有效监控体系?---答案部分一、填空题答案1.系统可用性2.Level3.分析4.可用性百分比5.类生产(或生产,注:优先类生产)6.可靠性7.饱和度8.资源(如CPU/内存)9.恢复目标(RecoveryTimeObjective)10.时序(TimeSeries)二、单项选择题答案1.C2.A3.B4.A5.B6.A7.B8.B9.D10.B三、多项选择题答案1.ABC2.ABCD3.ABCD4.ABCD5.ABC6.ABCD7.ABCD8.ABC9.ABC10.ABC四、判断题答案1.错2.错3.错4.对5.错6.错7.错8.对9.对10.错五、简答题答案1.SLI、SLO、SLA关系:SLI是衡量服务可靠性的具体指标(如可用性、延迟);SLO是基于SLI设定的内部可靠性目标(如99.9%可用性);SLA是对外承诺的可靠性标准(通常不低于SLO,含违约条款)。三者递进:SLI是测量工具,SLO是内部目标,SLA是对外承诺,SRE通过监控SLI达标情况确保SLO实现,进而满足SLA。2.混沌工程注意事项:①优先类生产/非核心环境实验,避免影响用户;②定义明确稳态假设(如“99%请求成功”);③控制故障范围(单节点、非核心服务);④实时监控+及时回滚异常;⑤实验后复盘优化;⑥获相关方授权。核心是“可控、安全、有价值”。3.容量规划流程:①收集历史数据(流量、资源使用率、故障);②分析业务增长趋势(用户/订单预测);③评估当前资源容量(CPU/内存/存储);④计算未来需求(含安全余量、突发流量);⑤制定扩容/缩容方案(自动扩缩容、资源预留);⑥监控效果+定期迭代。4.MTTR优化方法:①故障分级(P0/P1)+明确响应流程;②完善监控告警(准确、低噪声);③准备故障预案(恢复步骤、回滚流程);④定期故障演练;⑤事后复盘(根因分析+系统优化);⑥自动化恢复(自动重启、流量切换)。六、讨论题答案1.平衡可用性与开发效率:①设定合理SLO(不盲目追求100%可用性,避免过度约束);②自动化运维(CI/CD、自动扩缩容,减少人工干预);③混沌工程左移(开发/测试阶段注入故障,不影响生产);④共享责任(开发考虑可靠性,SRE理解业务);⑤实时监控反馈(及时调整目标)。核心是“适度约束+自动化+协作”。2.云原生监控体系设计:①多维度采集(metrics+logs+traces,如Prometh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冠脉严重钙化病变的规范化处理策略(临床完整版)
- T∕AOPA 0102-2025 无人驾驶航空器中小型机场围界巡查技术规范
- 专题十二:热学 近代物理(原卷版)
- 专题二、力与曲线运动阶段检测卷(培优教师版)
- 贵州省贵阳市、六盘水市、黔南州2026年下学期高三化学试题期末考试试卷含解析
- 社区医疗绿色转诊的效率与健康公平
- 26年多组学检测指导精准用药决策
- 2026届湖北省襄阳、孝感市高三下学期第三次质检考试化学试题含解析
- 2025~2026学年湖南长沙市师大附中双语实验学校七年级下学期英语入学学情自测
- 2025~2026学年江西赣州市南康区八年级上学期期末质量检测英语试卷
- 《公路波纹钢结构涵洞标准图集》(征求意见稿)
- 企业并购的机遇与挑战分析
- 射线检测专业知识考试题库(含答案)
- 2024年全国统一高考数学试卷(理科)甲卷含答案
- 湖北省襄阳市2023-2024学年小升初语文试卷(含答案)
- 黑龙江省建筑工程施工质量验收标准(建筑地面工程)
- 第八课 良师相伴 亦师亦友
- 2023年南京市中考历史试题及答案
- 《公共政策评估》课件
- 350种中药饮片功能主治
- 蓄电池安装施工方案方案
评论
0/150
提交评论