版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
运维值班工程师测试题(2025年)测试卷及答案1.单选题(每题2分,共20分)1.1在Linux系统中,查看当前内核版本的命令是A.unamer B.cat/etc/issue C.lsb_releasea D.dmesg|grepLinux答案:A1.2某Nginx日志出现大量“499”状态码,最可能的原因是A.后端PHPFPM崩溃 B.客户端主动断开连接 C.磁盘只读 D.证书过期答案:B1.3Kubernetes中,用于暴露Pod随机端口到节点本身的字段是A.hostPort B.nodePort C.targetPort D.containerPort答案:A1.4在MySQL8.0中,对InnoDB表执行“ALTERTABLE…ALGORITHM=INPLACE”时,下列哪种情况会拒绝执行并回退到COPY算法A.新增普通索引 B.修改列数据类型 C.删除外键 D.重命名列答案:B1.5某Zabbix触发器表达式为{web:net.tcp.port[80].max(3)}=0,其含义为A.最近3次检查中80端口均不通则报警 B.任意一次不通即报警 C.连续3分钟不通报警 D.3次检查平均值小于1报警答案:A1.6在PromQL中,计算“5分钟平均CPU使用率”的正确写法是A.avg_over_time(cpu_usage_user[5m]) B.rate(cpu_usage_user[5m]) C.avg(cpu_usage_user) D.increase(cpu_usage_user[5m])答案:A1.7下列哪条命令可将EXT4文件系统在线扩容至剩余全部空间A.resize2fs/dev/sda1 B.xfs_growfs/dev/sda1 C.tune2fsr0/dev/sda1 D.e2fsckf/dev/sda1答案:A1.8在Ansibleplaybook中,将变量foo设置为“主机名+序号”应使用A.foo:"{{inventory_hostname}}{{play_hosts.index(inventory_hostname)}}"B.foo:"{{ansible_hostname}}{{groups['all'].index(inventory_hostname)}}"C.foo:"{{ansible_nodename}}{{playbook_dir}}"D.foo:"{{inventory_hostname}}{{ansible_run_id}}"答案:B1.9当Linux系统出现“softlockup”时,内核首先尝试A.向NMIwatchdog发送中断 B.调用panic C.杀掉占用CPU最高进程 D.写入/var/log/kmsg答案:A1.10在BGP协议中,Local_Pref属性用于A.影响本AS出口选路 B.影响对AS入口选路 C.跨AS传递 D.作为MED替代值答案:A2.多选题(每题3分,共15分;少选得1分,错选0分)2.1以下哪些TCP标志位出现即表明连接异常需要排查A.RST B.FIN C.SYN D.PSH E.URG答案:A、C2.2关于Linuxcgroupv2,正确的有A.支持内存高水位线回收 B.支持IO权重控制 C.支持嵌套限额 D.默认挂载/sys/fs/cgroup/unified E.与systemd不兼容答案:A、B、C、D2.3下列哪些操作会触发KubernetesPod驱逐(Eviction)A.节点内存Pressure B.镜像文件系统Pressure C.PodQoS为BestEffort且节点磁盘Pressure D.手动kubectldrain E.修改Podlabel答案:A、B、C、D2.4关于Zookeeper集群“脑裂”,有效的预防措施包括A.设置quorum为n/2+1 B.使用奇数台机器 C.开启autopurging D.跨机房部署时设置observer E.关闭JVMGC日志答案:A、B、D2.5以下哪些工具可直接分析JVM堆外内存A.jemalloc+jeprof B.asyncprofiler C.jmaphisto D.NMT(NativeMemoryTracking) E.jstatgc答案:A、B、D3.填空题(每空2分,共20分)3.1在Linux系统中,查看PCIe设备是否支持ACS的sysfs路径为/sys/bus/pci/devices/0000:xx:xx.x/________。答案:acs_ctl3.2MySQL8.0执行“SELECT…FORUPDATESKIPLOCKED”时,被跳过的行锁标记位为________。答案:LOCK_SKIP_LOCKED3.3使用tcpdump抓取所有目标端口为443且SYN标志置位的包,命令为tcpdumpiany________。答案:'tcp[tcpflags]&(tcpsyn)!=0andport443'3.4在Kubernetes中,PodSecurityPolicy被废弃后的替代资源是________。答案:PodSecurityStandards(或PodSecurityAdmissionController)3.5将CentOS7默认网卡命名规则改回eth0,需在grub内核参数增加________。答案:net.ifnames=0biosdevname=03.6在Prometheus中,若某指标名称为node_cpu_seconds_total,其类型应为________。答案:counter3.7使用LVS的FULLNAT模式时,需加载的内核模块为________。答案:ip_vs_fullnat3.8在GitLabCI中,控制job仅在tag推送时运行的关键字为________。答案:only:[tags]3.9在Bash中,将变量$var中所有非数字字符删除的表达式为${var//________/}。答案:[![:digit:]]3.10当Linux系统使用systemdresolved,清空DNS缓存的命令为________。答案:systemdresolveflushcaches4.判断改错题(每题2分,共10分;先判断对错,若错则给出正确表述)4.1在EXT4文件系统中,inode编号从0开始。答案:错,正确:inode编号从1开始,0保留表示NULL。4.2使用rsync同步时,–deletedelay比–deletebefore更安全,因为它在传输完成后再删除。答案:对。4.3Kubernetes的ConfigMap大小上限为2MiB,不可调整。答案:错,正确:1.27版本后可通过–maxconfigmapsize参数放宽到1GiB。4.4Linux的OOMKiller总是优先杀掉占用物理内存最大的进程。答案:错,正确:根据oom_score综合物理内存、运行时间、nice值等计算。4.5在BGP中,MED值越大越优先。答案:错,正确:MED越小越优先。5.简答题(封闭型,每题5分,共15分)5.1描述Linux系统“loadaverage”三个数值分别代表什么,并说明当16核CPU出现负载30时是否一定需要扩容。答案:三个数值为1、5、15分钟内的可运行队列与不可中断睡眠进程平均数;30负载在16核上超线程后理论余量=30/32≈0.94,若业务RT无抖动则无需扩容,需结合CPU利用率、运行队列长度、业务SLA综合判断。5.2列举Kubernetes中Pod处于“Pending”状态的四种常见原因。答案:1.无节点满足调度约束(nodeSelector/affinity);2.镜像拉取失败;3.资源不足(CPU/Memory/GPU);4.PVC未绑定;5.网络插件未就绪(任意答对4条即满分)。5.3说明MySQL半同步复制中“after_commit”与“after_sync”两种模式的差异及故障场景影响。答案:after_commit在存储引擎commit后等待ACK,若主库崩溃已提交事务可能未传到从库导致主从不一致;after_sync在binlogsync后等待ACK,主库崩溃时未ACK事务对客户端不可见,保证无数据丢失,但延迟更高。6.简答题(开放型,每题10分,共20分)6.1某电商大促凌晨0点突发订单接口P99延迟从200ms升至2s,监控显示CPUidle70%、内存利用率50%、磁盘await1ms、网络重传率0.1%,请给出排查思路与至少五项可落地的检查命令或工具。答案:1.链路追踪:使用Jaeger/SkyWalking查看Span,定位慢方法;2.应用层:arthastrace、profiler火焰图查看热点;3.系统层:perftopp`pgrepjava`查看是否大量系统调用;4.连接池:dstattn1查看ESTABLISHED是否暴涨;5.数据库:ptquerydigest分析慢查询,showprocesslist查看锁等待;6.缓存:redislatencyhhost,查看是否缓存击穿;7.JVM:jstatgc查看是否FullGC;8.网络:tcpdumpianywfile.pcap抓包分析TLS握手耗时;9.容器:kubectltoppod查看是否throttle;10.限流:检查Sentinel/QPS限流规则是否误触发。(答出任意5项并给出命令即满分,需体现分层思路)6.2公司计划将线下IDC裸机业务全量迁移至云上Kubernetes,要求零停机、可回滚、数据不丢,请设计迁移方案,包括前置检查、流量切换、数据同步、回滚策略、验收指标。答案:1.前置:使用Velero/vela做应用画像,检查有状态服务,确认PVC支持云盘快照;2.数据:采用双主同步(MySQLrow+GTID)、MongoDBshard、RedisCluster水平扩容;3.流量:线下Nginx+ConsulDNS权重逐步下调,云上Ingress+SLB权重上调,使用Header染色灰度;4.切换:基于DNSTTL30s,分三批次每批10%、50%、100%,每批次保持30min观察;5.回滚:保留线下环境48h,数据库双向同步,若错误率>1%或订单下降>5%立即切回;6.验收:P99延迟≤原环境110%、成功率≥99.9%、Pod重启次数<2、监控无Critical告警、账单成本≤预算105%。(方案完整、风险可控、指标量化即满分)7.计算题(共20分)7.1某Kafka集群共6broker,副本因子3,min.insync.replicas=2,单分区峰值入流量5MB/s,出流量15MB/s,消息平均大小1KB,请计算:(1)单分区峰值吞吐量多少消息/s?(2)若要求整体吞吐600MB/s入流量,需多少分区?(3)在10Gb/s网络下,是否会出现网卡瓶颈?(给出计算过程)答案:(1)5MB/s÷1KB=5000msg/s(2)600MB/s÷5MB/s=120分区(3)单broker峰值入+出=5×120/6+15×120/6=100+300=400MB/s=3.2Gb/s<10Gb/s,无瓶颈(每问4分,单位换算错误扣1分)7.2某Prometheus监控节点产生2000条时间序列,采样间隔15s,保留30天,每条样本平均占用2Byte,计算所需磁盘空间(不考虑压缩、WAL、索引,仅算block)。答案:样本数=2000×(30×24×3600)/15=2000×172800=345600000空间=345600000×2Byte=691200000Byte≈659MiB(公式正确2分,结果正确2分,单位换算正确2分)8.综合案例分析(共30分)背景:某视频直播平台使用CDN+源站架构,源站部署在阿里云ECS(16vCPU32GiB),运行Nginx+Lua+Go服务,数据库为PolarDBMySQL8.0(16核64GiB),缓存为Redis6.2Cluster(8master×2GiB)。故障现象:每周五20:00开始,用户反馈“首帧等待”指标从500ms升至3s,持续2小时后恢复;期间错误率0.2%,CPU、内存、带宽、连接池均正常,仅Redis“instantaneous_input_kbps”从200Mb/s飙升至1.2Gb/s,同时出现“OOMcommandnotallowed”报错。任务:(1)给出根因假设(6分);(2)设计验证实验(6分);(3)给出至少两种长期解决方案并对比优劣(10分);(4)列出监控与告警补强项(8分)。答案:(1)根因:周五活动导致热点主播集中推流,Lua脚本未做本地缓存,直接回源Redis,使用GET+DEL逻辑,导致缓存击穿+雪崩,RedisCluster部分节点内存占满触发OOM拒绝命令。(2)实验:a.在灰度机房注释DEL逻辑,观察首帧指标;b.使用redisclibigkeys扫描大key;c.在压测环境模拟2000并发,对比开启/关闭DEL的Redisinput带宽;d.打开Redisslowlog,查看是否存在keys等危险命令。(3)方案:A.本地缓存:Nginxshareddict缓存1s,优势简单、延迟最低,劣势一致性弱;B.异步回源:Kafka解耦,Go服务消费后批量写Redis并设置随机TTL,优势削峰填谷,劣势架构重;C.Redis扩容:横向扩容到16master,单节点内存4GiB,优势快速,劣势成本+50%;D.限流:Sentinel热点参数限流,优势精准,劣势需改代码。(答出任意两种并对比即满分)(4)监控补强:Redis内存分片粒度监控:used_memory_peak_per_node热点key监控:redis_exporterkeyspace_hits/maxmemory本地缓存命中率:prometheus+luametrics首帧SLA:CDN日志+SLS实时告警,阈值>1s持续5min即page活动排期自动扩容:周五17:00自动触发Terraform弹性Redisscaleout,活动结束后scalein告警通道:钉钉+OnCall轮值,SLS告警合并5min窗口(答出4项以上且可落地即满分)9.脚本编程题(共20分)题目:编写一个Python3脚本,实现:1.读取/etc/hosts,找出出现次数>1的IP;2.对重复IP,按字母顺序合并其对应主机名,用逗号分隔;3.生成新文件/etc/hosts.dedup,格式:IP主机名A,主机名B;4.原子替换原文件;5.输出被合并的行数。要求:使用pathlib、logging、argparse,支持–dryrun,捕获所有异常。答案:```python!/usr/bin/envpython3importargparse,logging,tempfile,shutil,sysfrompathlibimportPathfromcollectionsimportdefaultdictlog=logging.getLogger("hosts_dedup")defmain():parser=argparse.ArgumentParser()parser.add_argument("dryrun",action="store_true")args=parser.parse_args()hosts=Path("/etc/hosts")dedup=Path("/etc/hosts.dedup")try:lines=hosts.read_text().splitlines()exceptExceptionase:log.error(f"readfailed:{e}")sys.exit(2)mapping=defaultdict(list)forlineinlines:line=line.strip()ifnotlineorline.startswith(""):continueparts=line.split()iflen(parts)<2:continueip,names=parts[0],parts[1:]mapping[ip].extend(names)merged=0out_lines=[]forip,namesinmapping.items():uniq=sorted(set(names))iflen(uniq)>1:merged+=1out_lines.append(f"{ip}{''.join(uniq)}")out_text="\n".join(out_lines)+"\n"ifargs.dry_run:print(out_text)print(f"wouldmerge{merged}lines")returnwithtempfile.NamedTemporaryFile(mode="w"
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025 七年级生物下册 维生素 B12 与红细胞生成课件
- 守护数字青春:2026高中网络安全开学第一课
- 科学护眼:告别眼疲劳守护清晰视界
- 山南地区药学(相关专业知识)主管药师考试试题及答案解析(2026年)
- 2025年疾控食品安全面试题库及答案
- 2025年荣昌事业单位好考不考试及答案
- 2025年淄博市中医院面试题库及答案
- 2025年生物医学工程师面试题库及答案
- 2025年大冶市事业编考试笔试及答案
- 全民国防教育日“国防教育”知识竞赛试题与答案
- 2026年山东旅游职业学院综合评价招生素质测试面试模拟题及答案(二)
- 2025年海南工商职业学院单招综合素质考试题库附答案解析
- 2026中国邮政集团有限公司江门市分公司招聘备考题库及一套答案详解
- 杠铃深蹲课件
- (人教A版)选择性必修一高二数学上册 全册综合测试卷-基础篇(原卷版)
- 矿山大型设备防腐施工方案
- 幼儿园食堂开学安全培训课件
- 淋浴房技术知识培训课件
- 人教版(2024)七年级上册英语Unit1-7各单元语法专项练习题(含答案)
- 《基于JSP的图书销售系统设计与实现》9500字(论文)
- 智能 检测与监测 技术-智能建造技术专01课件讲解
评论
0/150
提交评论