版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年人工智能训练师认证考题含答案一、单项选择题(每题2分,共20分)1.在深度学习中,若某卷积层输出特征图尺寸为64×64,通道数128,批大小32,则该层激活值所占显存约为(假设单精度浮点)A.32MB B.64MB C.128MB D.256MB2.使用Adam优化器时,下列超参数对初始学习率最敏感的是A.β₁ B.β₂ C.ε D.weightdecay3.在联邦学习场景下,为防御“模型投毒”攻击,下列策略最有效的是A.增加本地epoch B.梯度裁剪+异常检测 C.降低学习率 D.使用SGD替代Adam4.当训练数据呈现长尾分布时,以下哪种采样方式最能提升尾部类别召回率A.随机过采样 B.类别均衡采样 C.困难样本挖掘 D.混合采样(过采样+欠采样)5.在Transformer中,若将注意力头数从8减至4,其余不变,则计算量FLOPs约A.减半 B.不变 C.变为1/4 D.变为2倍6.对生成对抗网络,下列损失函数组合最容易出现模式崩塌的是A.WGAN-GP B.LSGAN C.vanillaGAN D.SNGAN7.在模型蒸馏中,若教师模型输出logits为z_T,学生为z_S,温度参数τ=4,则蒸馏损失一般写作A.KL(softmax(z_T/τ)‖softmax(z_S/τ)) B.MSE(z_T,z_S) C.CE(softmax(z_T),softmax(z_S)) D.KL(softmax(z_S)‖softmax(z_T))8.使用混合精度训练时,LossScaling的主要目的是A.加速收敛 B.防止梯度下溢 C.减少显存占用 D.提高精度9.在AutoML框架中,基于“一次训练多路复用”理念的加速策略是A.网络剪枝 B.权重共享 C.知识蒸馏 D.量化10.当部署边缘端INT8模型时,若校准集分布与测试集差异大,最可能出现的量化误差是A.权重量化误差 B.激活量化误差 C.偏置量化误差 D.反量化误差二、多项选择题(每题3分,共15分;多选少选均不得分)11.下列操作可直接减少Transformer推理延迟的有A.KV-Cache复用 B.动态批处理 C.使用RoPE位置编码 D.层间并行12.关于数据增强,以下说法正确的有A.MixUp通过线性插值扩充决策边界 B.CutMix可提升目标检测鲁棒性 C.AutoAugment搜索空间包含颜色变换 D.TrivialAugment无需验证集即可自动搜索13.在联邦学习系统安全分析中,可量化的隐私泄露指标有A.成员推理准确率 B.属性推理F1 C.模型逆向重建误差 D.梯度范数14.下列属于“无数据量化”技术的关键步骤A.生成合成样本 B.知识蒸馏微调 C.校准激活范围 D.使用GAN逆向15.对于多任务学习,以下策略可缓解梯度冲突A.GradNorm B.PCGrad C.UncertaintyWeighting D.MGDA三、判断题(每题1分,共10分;正确打“√”,错误打“×”)16.在PyTorch中,nn.DataParallel可实现多机多卡训练。17.ReLU激活函数在负半轴梯度恒为零,因此一定导致神经元死亡。18.使用LayerNorm的模型在BatchSize=1时仍可稳定训练。19.对CNN而言,空洞卷积可在不增加参数量的前提下扩大感受野。20.在强化学习PPO算法中,clip参数ε越大,策略更新越保守。21.模型剪枝中的“权重回放”技术可恢复因剪枝造成的精度损失。22.在DiffusionModel中,DDIM采样轨迹确定,可加速生成。23.使用TensorRT时,INT8校准表可跨硬件平台直接复用。24.在推荐系统冷启动场景,利用元学习可快速适应新用户。25.对于VisionTransformer,位置编码去除后模型仍能保持平移不变性。四、填空题(每空2分,共20分)26.给定卷积核尺寸k=5,输入通道C_in=3,输出通道C_out=64,偏置启用,则该层参数量为______。27.若某模型训练集交叉熵为0.01,验证集为0.8,则最可能的异常是______。28.在PyTorch中,将模型参数迁移至GPU的代码语句为model.______()。29.使用cosine退火学习率调度时,初始lr=0.1,T_max=100,则第50个epoch的lr为______(保留4位小数)。30.当BatchNorm的momentum设为0.1时,每次更新running_mean的权重为______。31.在目标检测评价指标mAP@0.5中,0.5指______阈值。32.若LSTM的输入维度为128,隐藏维度256,则单个门控的参数量为______。33.使用Horovod分布式训练时,所有梯度聚合默认采用______算法。34.在知识蒸馏中,若τ→∞,则softmax输出趋近于______分布。35.当使用LAMB优化器时,其自适应学习率与______范数成正比。五、计算与推导题(共20分)36.(8分)某Transformer编码层包含多头注意力与FFN,输入序列长度n=512,隐层维度d=1024,头数h=16,FFN中间维度4d。(1)计算该层自注意力部分的FLOPs(乘加分别计)。(2)若采用稀疏注意力模式,将复杂度从O(n²d)降至O(nkd),k=32,求FLOPs降低比例。37.(6分)给定二分类任务,正负样本比1:99,模型在验证集上得到下表:阈值TPFPTNFN0.3902009780100.58050993020(1)计算阈值0.3时的F1分数。(2)若希望召回率≥0.85,应选择哪个阈值?38.(6分)假设卷积层权重服从N(0,σ²),采用Xavier初始化,则σ应为多少?若输入通道C_in=64,输出通道C_out=128,卷积核3×3,求σ的具体值(保留4位小数)。六、综合设计题(15分)39.某工业质检场景需检测手机玻璃盖板12类缺陷,单张图像4096×3072像素,缺陷最小尺寸6×6像素,训练集2万张,验证集2千张,无公开预训练模型。(1)设计一套数据预处理与增强流程,需解决类别不平衡、小目标、光照变化三大难题,给出具体参数与理由。(2)选择基础网络并说明理由,给出多尺度特征融合方案,要求推理速度≤50ms(单卡RTX3060)。(3)提出一种“无数据”量化方案,使得模型在边缘端INT8运行,精度下降≤1%mAP@0.5,描述校准数据生成、量化粒度、误差补偿三步骤。卷后答案与解析一、单项选择题1.B 解析:64×64×128×32×4B≈64MB。2.A β₁控制一阶动量,对初始步长影响最大。3.B 梯度裁剪+异常检测可削弱恶意更新。4.B 类别均衡采样直接提升尾部出现概率。5.B 注意力头数减半,但d_k加倍,FLOPs不变。6.C vanillaGAN无梯度惩罚易崩塌。7.A 蒸馏损失用KL,温度τ一致。8.B 防止fp16下溢。9.B 权重共享让多架构复用同一超网。10.B 激活分布漂移导致量化尺度失配。二、多项选择题11.ABD C仅改变编码方式,不减延迟。12.ABCD TrivialAugment无需验证集。13.ABC 梯度范数仅反映幅度,不直接度量泄露。14.ACD B需真实数据,不属于“无数据”。15.ABCD 均为梯度修正策略。三、判断题16.× DataParallel仅单机多卡。17.× 负半轴零梯度不一定死亡,可由后续更新激活。18.√ LayerNorm与batch无关。19.√ 空洞卷积扩大感受野,参数量不变。20.× ε越大越激进。21.√ 权重回放通过重训练恢复精度。22.√ DDIM为确定性采样。23.× 校准表与硬件相关,不可跨平台。24.√ 元学习快速适应新分布。25.× ViT无卷积,需位置编码保持位置信息。四、填空题26.(5×5×3+1)×64=4800+64=486427.过拟合28.to('cuda')29.0.0530.0.131.IoU32.(128+256)×256=9856033.AllReduce34.均匀35.参数五、计算与推导题36.(1)自注意力FLOPs=4n²d+2n²d=6n²d=6×512²×1024=1.61×10⁹(2)原复杂度6n²d,稀疏后6nkd,降低比例=1−k/n=1−32/512=93.75%37.(1)Precision=90/(90+200)=0.3103,Recall=90/(90+10)=0.9,F1=2×0.3103×0.9/(0.3103+0.9)=0.4615(2)阈值0.3时召回0.9≥0.85,满足要求。38.Xavier:σ=√(2/(C_in+C_out)·k²)=√(2/(64+128)·9)=√(18/192)=√0.09375=0.3062六、综合设计题(要点示例)(1)预处理:随机裁剪2048×1532并缩放到1024×768;光照:随机亮度±20%、对比度0.8–1.2;小目标:Mosaic+随机粘贴6×6缺陷20次/图;类别均衡:过采样尾部至最大类80%,并引入Focal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年跨境电商中的自动化仓储创新实践
- 康复训练案例分析
- 肠道梗阻急诊处理流程
- 2026江苏南京大学SZXZ2026-009生物医学工程学院科研人员招聘备考题库【名校卷】附答案详解
- 2026四川自贡自流井区人力资源服务中心就业见习岗位招募1人备考题库含答案详解(a卷)
- 2026太平洋证券有限责任公司招聘5人备考题库及参考答案详解【培优a卷】
- 2026云南昆明巫家坝建设发展有限责任公司校园招聘15人备考题库附答案详解【综合题】
- 北京2016年司法考试《卷二》真题
- 康复医学科脑卒中患者步态训练计划
- 2026四川遂宁市就业服务管理局面向社会招聘1名编外人员备考题库附完整答案详解【名师系列】
- 《西式烹饪工艺》课件-2.7蛋黄酱、油醋汁
- 民用建筑外门窗应用技术标准
- HACCP计划年度评审报告
- 校园活动应急预案模板策划
- 2023年华南师范大学教师招聘考试历年真题库
- 课本剧《刘姥姥进大观园》剧本
- 长春版小学一年级语文上册写字表虚宫格写法教学提纲教学课件
- 湖南国际会展中心项目屋盖张弦梁施工技术交流
- 【教案】伴性遗传第1课时教学设计2022-2023学年高一下学期生物人教版必修2
- DL-T 807-2019 火力发电厂水处理用 201×7 强碱性阴离子交换树脂报废技术导则
- 语言学纲要(新)课件
评论
0/150
提交评论