版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年人工智能质量管控基础考试题库及解析一、单项选择题(每题2分,共20分)1.在人工智能质量管控体系中,下列哪项最能直接反映模型“可解释性”的量化指标?A.F1-scoreB.SHAP值全局一致性C.AUC-ROCD.训练集准确率2.当使用对抗样本检测作为质量门控环节时,其核心评价指标是:A.对抗扰动的L∞范数上限B.模型参数量C.训练耗时D.测试集交叉熵损失3.在持续集成流水线中,对深度学习模型进行“模型漂移”监控,通常采用的统计量不包括:A.PopulationStabilityIndex(PSI)B.Jensen-Shannon散度C.特征重要度排序的Kendallτ系数D.权重矩阵的Frobenius范数4.针对文本生成类AI,下列哪项技术最适合在质量门控阶段自动发现“幻觉”事实错误?A.BLEUB.BERTScoreC.知识图谱对齐+实体链接验证D.ROUGE-L5.联邦学习场景下,参与方上传的模型梯度若需满足(ε,δ)-差分隐私,则质量管控侧必须验证:A.梯度范数是否小于裁剪阈值CB.噪声尺度σ与隐私预算ε的关系满足σ≥2C√(2ln(1.25/δ))/εC.本地epoch数是否大于10D.学习率是否单调递减6.在计算机视觉质检系统中,若出现“良品过杀”现象,优先调整:A.置信度阈值向上B.置信度阈值向下C.增大BatchSizeD.减小学习率7.对于时序异常检测模型,采用“动态阈值”而非固定阈值的主要质量收益是:A.降低延迟B.提升对季节性波动的鲁棒性C.减少GPU显存占用D.加快推理速度8.在A/B测试阶段,发现实验组模型在95%置信水平下显著优于对照组,但后续线上效果回退,最可能违反的质量假设是:A.独立同分布B.特征无多重共线性C.损失函数凸性D.梯度有界9.对大规模推荐模型进行“公平性”审计时,若定义“机会均等”指标,需比较:A.不同敏感组的真正率TPRB.不同敏感组的假正率FPRC.不同敏感组的预测均值D.不同敏感组的AUC10.在质量管控文档化要求中,ISO/IEC23053:2022提出的“AI系统生命周期”阶段不包括:A.需求定义B.数据获取C.模型蒸馏D.退役与处置二、多项选择题(每题3分,共15分;多选少选均不得分)11.以下哪些做法可有效降低NLP模型在性别职业关联上的刻板印象风险?A.反事实数据增强C.词向量去偏D.后处理阈值调整E.增加训练步长12.在医疗影像AI的临床部署质量门控中,必须提交的验证报告包含:A.多中心外部验证集结果B.影像采集协议版本C.模型可解释性可视化样例D.医生使用培训记录E.服务器机房温湿度日志13.关于模型压缩后的质量保持,下列说法正确的是:A.知识蒸馏通常提升小模型在分布外数据上的鲁棒性B.剪枝后需重新校准BatchNorm的runningmean/varC.INT8量化若采用对称量化,则权重零点z=0D.权重共享可降低峰值显存但可能增加推理延迟E.低秩分解适合RNN却不适于Transformer14.以下哪些指标可直接用于监控“数据质量”下降?A.特征缺失率B.特征取值分布的KS统计量C.特征间皮尔逊相关系数矩阵的F范数变化D.训练损失E.标签噪声率估计15.在强化学习策略的质量评估中,为了验证策略在真实环境的“安全约束”满足度,可采用:A.约束策略优化(CPO)B.安全层(SafetyLayer)C.蒙特卡洛树搜索+约束回溯D.随机网络蒸馏(RND)E.优势估计器GAE三、判断题(每题1分,共10分;正确打“√”,错误打“×”)16.模型卡片(ModelCard)中必须披露训练数据的地理分布信息。17.在联邦学习中,SecureAggregation协议可以完全消除模型投毒攻击。18.对于回归模型,使用MAPE作为指标时,若真实值含0,则指标一定失效。19.采用EarlyStopping的模型,其训练集损失一定高于验证集损失。20.在图像分类任务中,Mixup数据增强可以同时提升鲁棒性与校准度。21.若某深度学习模型通过TensorRTFP16量化,则其权重位宽一定是16bit。22.对BERT模型进行动态量化后,推理阶段Embedding层仍保持FP32精度。23.在质量审计中,若发现模型存在“可预见的误用”,责任方无需在文档中说明。24.使用Shapley值计算特征重要度时,其计算复杂度随特征维度指数增长。25.在AutoML流水线中,加入“数据漂移检测”节点会降低最终模型在i.i.d.测试集上的准确率。四、填空题(每空2分,共20分)26.在模型监控阶段,若某特征x的PSI值连续7天大于________,则触发数据漂移告警。27.对于二分类模型,若正负样本比为1:99,采用Macro-F1相比Weighted-F1更能反映________类的性能。28.在差分隐私的MomentsAccountant方法中,隐私预算ε随训练步数T呈________增长。29.对3×3卷积核进行WinogradF(4×4,3×3)变换后,乘法次数从9降至________。30.使用LabelSmoothing时,若原始标签为1,平滑参数ε=0.1,则目标分布变为________。31.在模型可解释性中,IntegratedGradients需对输入x沿直线路径从________点到x积分。32.对于Transformer,注意力矩阵A的稀疏化若采用Top-k选择,则k过大会导致________问题。33.在质量门控脚本中,若要求模型推理延迟P99<30ms,则使用的统计量是________百分位数。34.联邦学习客户端上传的模型梯度若采用________压缩,可在理论上保证收敛且通信量降50%。35.当采用TTA(TestTimeAugmentation)时,最终预测为多次增强预测的________融合。五、简答题(每题8分,共24分)36.简述“概念漂移”与“数据漂移”的区别,并给出在推荐系统场景中各一个检测方法。37.说明在医疗AI软件中如何设计“人机协同”质量回环,确保模型更新不降低临床安全性。38.列举三种模型“校准度”评价指标,并说明在置信度阈值动态调整场景下如何选择最优指标。六、计算题(共11分)39.某图像分类模型在测试集上结果如下:|类别|TP|FP|FN|TN||A|80|20|30|270||B|60|40|10|290|(1)计算Macro-averageF1(保留3位小数)。(5分)(2)若将类别A的置信度阈值从0.5提升到0.7,导致TP减少5,FP减少15,FN增加5,TN增加15,求新的类别A的F1,并说明阈值提升对Macro-F1的影响方向(无需重算B类)。(6分)七、案例分析题(共20分)40.某电商平台的“智能客服”意图分类模型上线后,用户投诉“答非所问”比例从1%升至3%。质量团队怀疑是近30天促销活动导致用户问法变化。现有数据:a)近30天日志100万条,已标注5万条;b)旧模型在旧测试集Acc=95%,在新日志上Acc=88%;c)新日志与旧训练集之间的JS散度=0.042;d)意图类别共128类,其中“优惠券咨询”类占比由5%升至20%。请回答:(1)给出一条可落地的数据漂移监控规则(含指标、阈值、动作)。(6分)(2)设计一个“增量学习+回滚”策略,确保模型更新后线上Acc不低于93%,要求说明触发条件、数据采样比例、验证方法。(8分)(3)若需对外出具质量报告,列出三项必须量化披露的风险指标,并说明如何计算。(6分)卷后答案与解析一、单项选择题1.B解析:SHAP值全局一致性直接度量特征对输出的贡献可解释性。2.A解析:对抗扰动上限是检测能否被攻击的量化指标。3.D解析:Frobenius范数反映权重变化,不直接度量漂移。4.C解析:知识图谱对齐可核查事实。5.B解析:差分隐私高斯机制公式。6.A解析:提高阈值减少误报,降低过杀。7.B解析:动态阈值适应季节性。8.A解析:线上分布与实验不一致违反i.i.d.。9.A解析:机会均等要求TPR相等。10.C解析:蒸馏非生命周期阶段。二、多项选择题11.ABCD解析:增加步长反而放大偏见。12.ABCD解析:温湿度日志非强制。13.BC解析:A不一定,D可能增延迟,E错误。14.ABCE解析:训练损失不直接反映数据质量。15.ABC解析:RND用于探索,GAE用于方差缩减。三、判断题16√17×18√19×20√21×22√23×24√25×四、填空题26.0.2527.少数28.O(√T)29.430.[0.1,0.9]31.基线(或“零”)32.内存与计算开销增大33.9934.Top-k或量化35.平均或投票五、简答题36.概念漂移指P(y|X)变化,数据漂移指P(X)变化。推荐系统可用“用户行为序列聚类中心偏移”检测概念漂移;用“特征分布KS统计量”检测数据漂移。37.设计三重回环:1.医生实时反馈入口;2.每周抽样200例由专家标注,计算F1与严重漏诊率;3.若F1下降>2%或漏诊率>0.5%,触发自动回滚;更新前在影子环境运行72小时,验证安全性指标无显著劣化。38.指标:ECE(ExpectedCalibrationError)、MCE(MaximumCalibrationError)、可靠性曲线斜率偏差。动态阈值场景选ECE,因其整体衡量全局校准,适合阈值滑动窗口。六、计算题39.(1)类别A:P=80/(80+20)=0.800,R=80/(80+30)=0.727,F1=2PR/(P+R)=0.762类别B:P=60/(60+40)=0.600,R=60/(60+10)=0.857,F1=0.706Macro-F1=(0.762+0.706)/2=0.734(2)新A:TP=75,FP=5,FN=35,P=75/80=0.9375,R=75/110=0.682,F1=2×0.9375×0.682/(0.9375+0.682)=0.790新Macro-F1=(0.790+0.706)/2=0.748,比原0.734提高,故阈值提升使Macro-F1上升。七、案例分析题40.(1)规则:每日计算128类意图的JS散度,与旧训练集比较,若连续3天JS>0.04且“优惠券咨询”占比变化>10%,自动触发数据漂移告警,并启动增量标注任务,采样比例=漂移量×0.5。(2)策略:触发:连续3天线上Acc<93%或JS>0.04。采样:对漂移大的类
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 领导听取人才工作制度
- 领导牵头督办工作制度
- 风险排查防控工作制度
- 高铁女乘务员工作制度
- 黑龙江省五项工作制度
- 湛江市麻章区2025-2026学年第二学期三年级语文第八单元测试卷(部编版含答案)
- 忻州市河曲县2025-2026学年第二学期五年级语文第八单元测试卷(部编版含答案)
- 巢湖市巢湖区2025-2026学年第二学期三年级语文第七单元测试卷(部编版含答案)
- 中-卫-市中宁县2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 工艺蜡染工安全教育水平考核试卷含答案
- 邮政网点负责人风控合规述职报告
- 中考语文真题专题复习 综合性学习(第02期)(解析版)
- 《对话式作文写法》课件
- DB11-T 2006-2022 既有建筑加固改造工程勘察技术标准
- ct增强检查留置针护理
- 公司反恐安全手册模板
- 管道应力分析报告
- 大学生就业指导-求职材料准备与面试技巧课件
- 2024年山东省三支一扶考试真题
- 纺织行业的纺织品生产技术培训资料
- 高二年级第一次月考质量分析化学
评论
0/150
提交评论