2026年人工智能训练师(四级)专业技能易错试题_第1页
2026年人工智能训练师(四级)专业技能易错试题_第2页
2026年人工智能训练师(四级)专业技能易错试题_第3页
2026年人工智能训练师(四级)专业技能易错试题_第4页
2026年人工智能训练师(四级)专业技能易错试题_第5页
已阅读5页,还剩11页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年人工智能训练师(四级)专业技能易错试题1.单选题(每题1分,共30分)1.1在PyTorch中,若模型在训练阶段出现loss为NaN,下列排查顺序最合理的是A.检查学习率→检查数据归一化→检查激活函数→检查梯度裁剪B.检查数据归一化→检查学习率→检查激活函数→检查梯度裁剪C.检查激活函数→检查学习率→检查数据归一化→检查梯度裁剪D.检查梯度裁剪→检查激活函数→检查学习率→检查数据归一化1.2使用Adam优化器时,若β₁=0.9,β₂=0.999,则第t步的修正后学习率与未修正学习率α的关系为A.=B.=C.=D.=1.3在目标检测任务中,若采用YOLOv5的anchor-free分支,其中心点回归损失通常采用A.SmoothL1B.GIoUC.DIoUD.CIoU1.4当使用混合精度训练时,LossScaling系数初始值通常设为A.128B.256C.512D.动态自适应1.5在Transformer中,若d_model=512,n_head=8,则每个head的维度为A.64B.512C.4096D.81.6若训练集样本量N=1×10⁵,采用5-fold交叉验证,每次验证集期望样本量为A.2×10⁴B.1×10⁴C.5×10⁴D.8×10⁴1.7在联邦学习场景下,FedAvg算法中本地epoch数E与通信轮数T的关系,下列说法正确的是A.E越大,T一定越小B.E越大,T一定越大C.E与T无确定单调关系,需考虑数据Non-IID程度D.E与T的关系仅由客户端数量决定1.8使用Kaiming初始化时,若卷积层激活函数为ReLU,则权重方差应为A.B.C.D.1.9在BERT微调中,若下游任务为单句分类,则[CLS]向量经过的下游网络结构通常为A.Linear→Tanh→LinearB.LinearC.Linear→Dropout→LinearD.Dropout→Linear→Softmax1.10当采用EarlyStopping时,若patience=5,monitor='val_loss',mode='min',则训练将在连续多少轮验证损失不下降后终止A.5B.6C.4D.101.11在图像分割任务中,若使用DiceLoss,其公式为A.1B.1C.D.11.12若采用余弦退火学习率调度,初始学习率,最小学习率,总周期T,则第t步学习率为A.=B.=C.=D.=1.13在强化学习PPO中,clip参数ϵ通常取值范围A.0.01~0.05B.0.1~0.3C.0.5~0.9D.1.0~2.01.14当使用Horovod进行分布式训练时,若采用梯度压缩,则压缩算法通常基于A.Top-k稀疏化B.16位浮点量化C.8位整数量化D.随机旋转量化1.15在文本生成任务中,若采用Top-p采样,p=0.9,则含义为A.保留概率累计0.9的最小词集合B.保留概率最大的前90%词C.保留概率最大的前9个词D.保留概率累计0.9的最大词集合1.16若模型参数量为1.2×10⁹,采用FP16存储,则显存占用约为A.2.4GBB.4.8GBC.1.2GBD.9.6GB1.17在语音合成Tacotron2中,停止token的预测损失通常采用A.BCEWithLogitsLossB.MSELossC.CrossEntropyLossD.HingeLoss1.18当使用知识蒸馏时,若教师模型输出为softmax(logits/T),则学生模型训练时温度T应A.与教师一致B.固定为1C.动态下降D.随机采样1.19在CTR预估中,若采用DeepFM,则FM部分与Deep部分共享A.特征embeddingB.激活函数C.损失函数D.优化器1.20若采用GroupNormalization,则统计量计算维度为A.(N,C,H,W)B.(N,C)C.(C,H,W)D.(N,H,W)1.21在图像增强中,若采用RandAugment,则搜索空间由哪两个参数决定A.n,mB.magnitude,probabilityC.num_layers,magnitudeD.temperature,alpha1.22当使用混合专家模型MoE时,若top-k=2,则每次激活的专家数量为A.2B.1C.全部D.随机1.23在图神经网络中,若采用GCN,则邻接矩阵需添加自环,其原因为A.避免过平滑B.保持节点自身特征C.降低计算量D.增加非线性1.24若采用FocalLoss,则当γ=0时,退化为A.CrossEntropyB.BCEC.DiceD.Hinge1.25在模型剪枝中,若采用magnitudepruning,则剪枝阈值通常按A.绝对值从小到大排序取百分位B.绝对值从大到小排序取百分位C.梯度绝对值排序D.随机1.26当使用AUC作为评价指标时,若正负样本比例=1:99,则AUC可能A.接近0.5B.接近1C.接近0D.无法确定1.27在视频理解中,若采用SlowFast网络,则Slow路径的时序采样率为A.α=4B.α=8C.α=16D.α=11.28若采用AutoAugment,则策略搜索算法为A.强化学习B.遗传算法C.贝叶斯优化D.网格搜索1.29在模型部署中,若采用TensorRT,则INT8校准所需样本量通常为A.100B.500C.1000D.100001.30当使用梯度累积时,若accumulate=4,batch_size=8,则等效batch_size为A.32B.8C.4D.22.多选题(每题2分,共20分;多选少选均不得分)2.1下列哪些操作可能导致模型训练阶段显存占用突然增加A.开启torch.cuda.amp.autocastB.忘记withtorch.no_grad()进行验证C.采用gradientcheckpointingD.将loss.backward(retain_graph=True)2.2在NLP任务中,下列哪些trick可有效缓解OOV问题A.BytePairEncodingB.SubwordRegularizationC.字符级卷积D.增大vocab_size至1e72.3关于LabelSmoothing,下列说法正确的是A.可缓解过拟合B.会提高训练集准确率C.交叉熵损失下界不再为0D.对多分类与二分类均适用2.4在目标检测中,若出现大量漏检,可能原因包括A.NMS阈值过大B.置信度阈值过高C.anchor尺寸与目标不匹配D.训练数据标注缺失2.5下列哪些方法可在不增加参数量的前提下提升模型推理速度A.权重量化至INT8B.知识蒸馏C.结构化剪枝D.动态推理图2.6在推荐系统冷启动阶段,可采用的策略有A.利用用户注册信息B.基于内容特征C.元学习快速适应D.随机探索ε-greedy2.7当使用Swish激活函数时,相较于ReLU,其特点包括A.处处可导B.负半轴非零C.需要更多显存D.无额外超参数2.8在语音增强中,若采用频谱掩码方法,则掩码类型包括A.IdealBinaryMaskB.IdealRatioMaskC.ComplexIdealRatioMaskD.WienerFilterMask2.9下列哪些指标可直接用于回归任务A.MAPEB.R²C.AUCD.RMSE2.10在联邦学习中,若客户端数据为Non-IID,可缓解的方法有A.FedProxB.SCAFFOLDC.FedNovaD.增加本地epoch3.判断题(每题1分,共10分;正确打“√”,错误打“×”)3.1使用LayerNormalization时,训练与推理阶段统计量均来自当前样本。3.2在Mixup训练中,标签同样采用线性插值。3.3采用梯度裁剪后,模型一定不会出现梯度爆炸。4.计算题(共20分)4.1某模型采用Adam优化器,初始学习率α=1×,β₁=0.9,β₂=0.999,ε=1×10⁻⁸。第t步梯度平方的指数移动平均更新公式为=+(1−)4.2某分类任务采用FocalLoss,γ=2,α=0.25。若模型对正样本预测概率p=0.97,求该样本损失值(保留4位小数)。(5分)4.3某卷积层输入尺寸为(N,C_in,H,W)=(8,64,112,112),输出通道C_out=128,卷积核k=3×3,padding=1,stride=2,groups=1,bias=False。求该层FLOPs。(5分)4.4某推荐系统采用矩阵分解,用户矩阵U∈ℝ^{m×k},物品矩阵V∈ℝ^{n×k},正则化系数λ=0.01。若采用交替最小二乘,更新U时需求解U=R,其中R为评分矩阵。已知k=64,n=5×10⁴,求5.简答题(每题10分,共20分)5.1描述在8卡GPU环境下,采用DDP训练时,梯度同步发生在前向还是后向?并解释All-Reduce操作与梯度累积同时存在时的实现细节。5.2当使用知识蒸馏训练小模型时,若教师模型为集成3个Large模型,学生模型为Tiny,请给出一种“逐步蒸馏”策略,使得学生模型在有限计算资源下最大限度吸收教师知识,并说明如何监控过拟合。卷后答案与解析1.单选题1.1B1.2A1.3D1.4B1.5A1.6A1.7C1.8A1.9C1.10B1.11A1.12A1.13B1.14A1.15D1.16B1.17A1.18A1.19A1.20C1.21A1.22A1.23B1.24A1.25B1.26A1.27B1.28A1.29B1.30A2.多选题2.1BD2.2ABC2.3ACD2.4BCD2.5ACD2.6ABCD2.7ABD2.8ABC2.9ABD2.10ABC3.判断题3.1√3.2√3.3×(梯度裁剪只能缓解,无法绝对避免)4.计算题4.1=4.2FL=-α(1-p)^γlog(p)=-0.25×(0.03)^2×log(0.97)=0.00074.3FLOPs=2×C_in×C_out×k²×H_out×W_out×N=2×64×128×9×56×56×8=3.76×10⁹4.4V尺寸k×k=64×64,元素数4096,FP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论