2026年人工智能训练师职业技能考试综合题库_第1页
2026年人工智能训练师职业技能考试综合题库_第2页
2026年人工智能训练师职业技能考试综合题库_第3页
2026年人工智能训练师职业技能考试综合题库_第4页
2026年人工智能训练师职业技能考试综合题库_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年人工智能训练师职业技能考试综合题库一、单项选择题(每题1分,共30分)1.在深度学习中,若某卷积层输出特征图尺寸为64×64,卷积核大小为5×5,步长为2,填充为1,则该层输入特征图尺寸为A.128×128  B.130×130  C.132×132  D.134×1342.使用Adam优化器时,若一阶动量系数β₁=0.9,二阶动量系数β₂=0.999,则初始学习率通常建议设置为A.0.0001  B.0.001  C.0.01  D.0.13.在联邦学习场景下,为防止模型更新泄露用户隐私,最常用且无需可信第三方的防御机制是A.同态加密  B.差分隐私  C.安全多方计算  D.梯度压缩4.当训练数据极度不平衡时,下列评价指标中最容易给出“虚高”结果的是A.F1-score  B.AUC-ROC  C.准确率  D.平均精度均值(mAP)5.在Transformer中,缩放点积注意力机制引入缩放因子√dₖ的主要目的是A.降低计算量  B.抑制梯度消失  C.缓解softmax饱和区  D.增强位置编码6.若某模型在ImageNet上Top-1准确率为76.3%,将其蒸馏至轻量网络后,若温度T=4,蒸馏损失权重α=0.7,则下列说法正确的是A.温度越高,软标签越尖锐  B.α越大,越关注真实标签  C.蒸馏后学生网络容量必须大于教师  D.蒸馏过程无需数据增强7.在强化学习中,若采用PPO算法,clip参数ε通常取0.2,其含义为A.策略更新步长上限  B.值函数误差上限  C.优势函数截断阈值  D.熵正则系数8.当使用混合精度训练时,下列操作顺序正确的是A.前向→Loss缩放→反向→梯度unscaling→优化器更新B.前向→反向→Loss缩放→梯度unscaling→优化器更新C.Loss缩放→前向→反向→梯度unscaling→优化器更新D.前向→反向→优化器更新→Loss缩放→梯度unscaling9.在目标检测任务中,若YOLOv8的anchor-free机制改用anchor-based,最可能导致A.正负样本分配策略失效  B.NMS后处理速度提升  C.小目标召回率下降  D.损失函数无需修改10.若某BERT-base模型参数量为110M,采用INT8量化后,理论上模型体积约为A.27.5MB  B.55MB  C.110MB  D.220MB11.在AutoML框架中,基于贝叶斯优化的超参搜索比随机搜索更高效,其核心原因是A.利用先验分布建模目标函数  B.并行度更高  C.支持离散空间  D.无需验证集12.当训练GAN时,若判别器损失快速趋近于0,而生成器损失震荡,应优先尝试A.增大生成器学习率  B.给判别器输入加噪声  C.减少批大小  D.增加生成器层数13.在语音合成Tacotron2中,停止token预测使用Sigmoid激活,其训练标签通常设置为A.每帧均0,末帧为1  B.每帧均1,末帧为0  C.末帧前5帧开始线性升至1  D.末帧后5帧开始线性降至014.若某推荐系统采用双塔结构,用户塔输出维度为256,物品塔输出维度为256,则线上召回时计算相似度可采用A.余弦+ANN  B.点积+精确排序  C.欧氏距离+暴力扫描  D.曼哈顿距离+PQ15.在图神经网络中,GraphSAGE采用邻居采样策略的主要好处是A.降低内存并支持小批量  B.增强过平滑  C.提高特征维度  D.消除自环16.当使用K-fold交叉验证时,若K值过大,可能导致A.方差降低  B.偏差增大  C.训练时间缩短  D.评估方差增大17.在模型可解释性方法中,IntegratedGradients相对于GradientInput的优点是17.在模型可解释性方法中,IntegratedGradients相对于GradientInput的优点是A.满足敏感性公理  B.计算量更小  C.无需基准输入  D.适用于离散变量18.若某LSTM网络输入维度为512,隐藏维度为1024,则单个时间步的参数量为A.512×1024  B.4×(512+1024)×1024  C.2×512×1024  D.1024×102419.在MLOps流水线中,若触发“数据漂移”警报,下一步最合理的操作是A.立即回滚模型  B.重新标注全部数据  C.启动自动重训练  D.关闭监控20.当使用Horovod做分布式训练时,若采用梯度累积,则下列说法正确的是A.allreduce需在每次前向后立即执行  B.累积步数越大,有效批大小越小  C.累积完成后再执行allreduce  D.无需修改学习率21.在VisionTransformer中,位置编码采用二维sin-cos,其维度与下列哪项一致A.隐藏维度  B.patch数量  C.注意力头数  D.层数22.若某模型在测试集上AUC=0.81,随机将50%标签翻转后AUC=0.50,则说明A.模型完全失效  B.标签噪声对AUC无影响  C.AUC对标签翻转单调  D.原模型具备一定判别力23.在文本生成任务中,若重复惩罚系数设为1.5,则对已生成token的概率影响为A.除以1.5  B.乘以1.5  C.开1.5次方  D.取1.5次幂后归一化24.当使用DeepSpeedZeRO-3时,下列哪项被分区到所有GPUA.优化器状态  B.梯度  C.模型参数  D.激活值25.在知识蒸馏中,若教师模型为集成3个不同随机初始化的网络,则学生模型受益最大的情况是A.教师输出平均logits  B.教师输出投票标签  C.学生与教师同架构  D.温度T=126.若某模型采用GroupNorm,组数G=32,当批大小为1时,相比BatchNorm优势是A.仍可获得稳定统计量  B.计算量更低  C.无需学习缩放参数  D.与批大小无关27.在强化学习DQN中,若采用DoubleDQN,则目标Q值计算为A.maxQ(s',a')  B.Q(s',argmaxQ(s',a'))  C.maxQ(s',argmaxQ(s,a))  D.meanQ(s',a')28.当使用RandAugment时,若N=2,M=9,则单张图片最大增强操作次数为A.2  B.9  C.18  D.随机29.在模型压缩技术中,知识蒸馏属于A.参数剪枝  B.低秩分解  C.知识迁移  D.量化感知训练30.若某自动驾驶感知模型在夜间场景mAP下降30%,最合理的域适应策略是A.增加白天数据  B.采用GAN做风格迁移  C.降低置信度阈值  D.冻结BN层二、多项选择题(每题2分,共20分;多选少选均不得分)31.下列方法中,可用于缓解图神经网络过平滑的有A.残差连接  B.跳跃知识网络  C.DropEdge  D.增加隐藏维度32.关于LabelSmoothing,下列说法正确的有A.可提升模型校准度  B.会略微降低训练集准确率  C.对多标签分类无效  D.等价于添加KL散度正则33.当使用PyTorchLightning时,下列哪些操作由框架自动完成A.分布式采样  B.检查点保存  C.日志可视化  D.混合精度缩放34.在语音识别Conformer中,包含的模块有A.多头自注意力  B.卷积增强模块  C.MacaronFFN  D.相对位置编码35.下列属于无监督聚类评估指标的有A.SilhouetteScore  B.Calinski-HarabaszIndex  C.Davies-BouldinIndex  D.AdjustedRandIndex36.当使用TensorRT加速时,下列层可能被融合的有A.Conv+BN+ReLU  B.MatMul+Add  C.Softmax+CrossEntropy  D.LSTM+Dropout37.在医疗影像分割中,若前景像素占比<1%,则损失函数可优先考虑A.DiceLoss  B.FocalLoss  C.WCE  D.MSE38.下列操作可能导致模型出现“数据泄露”的有A.先整体标准化再划分训练测试  B.交叉验证中使用未来数据做特征  C.用测试集调参  D.样本重复39.当使用KubeflowPipelines时,组件间数据传递可支持A.PVC  B.S3  C.GCS  D.NFS40.在NLP数据增强中,基于上下文嵌入的替换方法有A.EDA  B.BERT-embedding替换  C.MixUp  D.Back-translation三、判断题(每题1分,共10分;正确打“√”,错误打“×”)41.使用ReLU激活的深层网络一定不会发生梯度爆炸。42.在联邦学习中,SecureAggregation可防止中央服务器看到单个用户梯度。43.当批大小增加k倍时,线性缩放学习率规则对所有优化器均适用。44.VisionTransformer去掉位置编码后仍能达到原始精度。45.混合精度训练必然导致模型精度下降。46.在目标检测中,mAP@0.5一定高于mAP@0.75。47.采用EarlyStopping可防止模型过拟合。48.对于k-NN算法,k值越大模型偏差越大。49.自监督预训练无需任何人工标签。50.在GPT-3中,参数量的增加与下游任务性能呈线性关系。四、填空题(每空2分,共20分)51.若某卷积输出尺寸公式为O=⌊(I−K+2P)/S⌋+1,则当I=224,K=7,P=3,S=4时,O=________。52.在Transformer中,若隐藏维度d=768,注意力头数h=12,则每个头的维度为________。53.若某模型参数量为1.2×10⁹,采用FP16存储,则理论内存占用为________GB(保留两位小数)。54.在强化学习中,若折扣因子γ=0.99,则100步后的奖励衰减系数为________(保留四位小数)。55.若某推荐系统日活1000万,平均曝光100条/人,则日志量每日约________条(科学计数法,保留两位有效数字)。56.当使用RandAugment时,若M=10,则单操作强度最大值为________。57.在知识蒸馏中,若温度T=3,则softmax输出概率比T=1时更________(尖锐/平滑)。58.若某GAN采用WGAN-GP,梯度惩罚系数λ=10,则优化目标为原始损失+λ·________。59.在BERT预训练中,NSP任务的正样本比例为________%。60.当使用DeepSpeedZeRO-2时,优化器状态被分区到________数量级。五、计算与推导题(共30分)61.(8分)已知某分类任务中,类别数为5,采用LabelSmoothingε=0.1。(1)写出平滑后单样本目标分布向量;(2)若模型输出logitsz=[3,1,0,2,4],温度T=1,求平滑后的交叉熵损失(给出公式与数值结果,ln取自然对数)。62.(10分)在目标检测任务中,给定预测框P=(0.1,0.2,0.5,0.6),真实框G=(0.15,0.25,0.55,0.65)。(1)计算IoU;(2)采用GIoU损失,求最终损失值(公式:GIoU=IoU−|C−U|/|C|,其中C为最小闭包框)。63.(12分)在强化学习策略梯度中,已知轨迹τ:(s₁,a₁,r₁=1),(s₂,a₂,r₂=2),(s₃,a₃,r₃=3),折扣因子γ=0.9,基线b=1.5。(1)计算折扣回报G₁,G₂,G₃;(2)写出带基线的策略梯度目标函数;(3)若∇logπ(a₁|s₁)=0.2,求该样本对参数的更新方向(假设学习率α=0.1)。六、综合设计题(共40分)64.(20分)某城市希望构建实时交通违法检测系统,需识别闯红灯、逆行、压实线三类事件。(1)给出数据收集与标注方案,需涵盖数据多样性、隐私合规、标注粒度;(2)设计模型架构,要求边缘端延迟<100ms,单卡GTX1660,说明Backbone、Neck、Head选型及压缩策略;(3)给出训练策略,包括损失函数、样本不平衡处理、难例挖掘;(4)给出上线后监控指标与漂移应对方案。65.(20分)某电商搜索系统需支持多语言(中/英/泰)混合查询,要求零样本迁移至泰语。(1)设计预训练任务,需利用单语+平行语料;(2)说明如何构建查询-商品语义双塔,包括负采样、温度、归一化;(3)给出泰语冷启动评估方案,指标至少3项;(4)若发现泰语CTR下降15%,给出诊断与迭代流程。七、答案与解析一、单项选择题1.B 2.B 3.B 4.C 5.C 6.A 7.A 8.C 9.A 10.A11.A 12.B 13.C 14.A 15.A 16.D 17.A 18.B 19.C 20.C21.A 22.D 23.A 24.C 25.A 26.A 27.B 28.A 29.C 30.B二、多项选择题31.ABC 32.ABD 33.ABD 34.ABCD 35.ABC36.ABC 37.ABC 38.ABCD 39.ABCD 40.BD三、判断题41×42√43×44×45×46×47√48√49√50×四、填空题51.56 52.64 53.2.40 54.0.3660 55.1.0×10⁹56.10 57.平滑 58.(‖∇ₓD(x̂)‖₂−1)² 59.50 60.GPU五、计算与推导题61.(1)目标向量t=[0.9,0.025,0.025,0.025,0.025](2)先求softmax:p_i=exp(z_i)/∑exp(z_j),得p≈[0.474,0.064,0.024,0.117,0.321]交叉熵L=−∑t_ilnp_i≈0.1×ln0.474+…≈1.6862.(1)交集面积=0.35×0.4=0.14,并集面积=0.45×0.45−0.14=0.0625,IoU=0.14/(0.14+0.0625)=0.691(2)最小闭包C面积=0.5×0.5=0.25,GIoU=0.691−(0.25−0.2025)/0.25=0.691−0.19=0.5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论