版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025技能考试人工智能训练师三级题库练习附答案一、单项选择题(每题1分,共30分)1.在PyTorch中,若希望冻结某一层参数使其不参与反向传播,应使用下列哪一行代码?A.layer.requires_grad=FalseB.layer.trainable=FalseC.layer.eval()D.torch.no_grad()答案:A2.当使用Keras的ImageDataGenerator进行在线增强时,若设置brightness_range=[0.5,1.5],则下列哪项描述正确?A.亮度变化范围是±50%B.亮度变化范围是±150%C.亮度变化范围是0.5到1.5倍D.亮度变化范围是0.5到+1.5倍答案:C3.在Transformer中,位置编码使用正弦与余弦函数的主要目的是:A.降低计算量B.使位置编码可外推到更长序列C.增加非线性D.替代注意力机制答案:B4.使用混合精度训练时,下列哪项操作可有效防止梯度下溢?A.动态损失缩放B.权重衰减C.梯度裁剪D.学习率预热答案:A5.在联邦学习场景下,客户端上传的参数通常为:A.原始训练数据B.模型权重梯度或权重差分C.完整模型文件D.损失函数值答案:B6.当目标检测模型出现大量漏检且置信度普遍偏低时,优先调整:A.NMS阈值B.置信度阈值C.正样本IoU阈值D.锚框数量答案:C7.在BERT微调中,若下游任务为中文短文本相似度计算,最合理的前处理是:A.按字切分并保留[CLS]与[SEP]B.按词切分并去除停用词C.按字切分并去除标点D.按词切分并保留[UNK]答案:A8.使用ONNX导出模型时,若出现“Dynamicaxesmismatch”错误,最可能的原因是:A.输入张量未指定动态维度B.权重数据类型为float16C.模型包含控制流算子D.图优化等级过高答案:A9.在深度强化学习中,优先经验回放(PER)的关键改进是:A.使用双网络结构B.按TD误差加权采样C.增加噪声网络D.采用n步回报答案:B10.当使用TensorRT加速时,若某算子不支持,最优雅的降级方案是:A.直接回退到CPUB.使用Plugin层自定义实现C.降低batchsizeD.关闭FP16模式答案:B11.在图像分割任务中,DiceLoss相较于交叉熵的优势在于:A.对类别不平衡更鲁棒B.计算速度更快C.可直接优化像素精度D.无需softmax答案:A12.若学习率调度器采用cosineannealingwithwarmrestarts,则重启后学习率:A.立即回到最大值B.线性增长到最大值C.保持谷底不变D.随机重置答案:A13.在模型蒸馏中,温度系数T增大时,softmax输出分布:A.更尖锐B.更平滑C.不变D.先尖锐后平滑答案:B14.使用Horovod进行多机训练时,若出现hang,应首先检查:A.网卡拓扑与NCCL_SOCKET_IFNAMEB.数据管道是否复用C.学习率是否过大D.是否启用混合精度答案:A15.在语音合成Tacotron2中,停止token的作用是:A.控制音高B.决定何时结束生成C.调节语速D.对齐文本与音素答案:B16.当使用EarlyStopping(monitor='val_loss',patience=5,restore_best_weights=True)时,若第10轮val_loss最小,则最终权重来自:A.第5轮B.第10轮C.最后一轮D.第15轮答案:B17.在目标检测YOLOv5中,若设置img640且矩形输入,letterbox的默认填充颜色是:A.黑色(114,114,114)B.灰色(128,128,128)C.白色(255,255,255)D.随机颜色答案:A18.使用Adam优化器时,若梯度稀疏,推荐调整哪一超参数?A.epsB.betasC.weight_decayD.amsgrad答案:A19.在CTR预估DeepFM中,FM部分与Deep部分共享的是:A.嵌入向量B.激活函数C.损失函数D.批归一化答案:A20.当使用DALI加速数据加载时,若CPU解码成为瓶颈,应:A.将decode_device设为'mixed'B.增大num_threadsC.关闭nvJPEGD.降低图像分辨率答案:A21.在知识图谱嵌入TransH中,关系向量被约束在:A.超平面B.单位球C.正象限D.复数空间答案:A22.若模型权重文件为fp16,但推理设备不支持fp16,最佳转换策略是:A.动态量化至int8B.强制转fp32C.使用半精度浮点模拟D.重新训练fp32模型答案:B23.在文本生成任务中,重复惩罚(repetitionpenalty)大于1时,对已生成token的概率:A.提升B.降低C.不变D.先提升后降低答案:B24.使用PyTorchLightning时,若要在多卡训练时手动同步指标,应调用:A.self.log(sync_dist=True)B.torch.distributed.barrier()C.all_gather()D.torch.cuda.synchronize()答案:A25.在模型压缩通道剪枝中,若采用L1范数衡量通道重要性,则剪掉:A.绝对值和最小的通道B.绝对值和最大的通道C.方差最小的通道D.均值最大的通道答案:A26.当使用WandB做实验管理时,若代码意外中断,已上传的指标:A.自动丢失B.保存在离线缓存C.实时同步不丢失D.需手动恢复答案:C27.在图像分类数据增强中,RandAugment的搜索空间包含:A.14种变换与10种强度B.10种变换与14种强度C.30种策略D.100个子策略答案:A28.使用DeepSpeedZero3时,优化器状态被分割到:A.所有GPUB.单个GPUC.CPUD.NVMe答案:A29.在语音识别Wav2Vec2.0中,对比损失使用的负样本来自:A.同一句子的其他时间步B.不同句子的所有时间步C.同一句子的未来步D.同一句子的过去步答案:B30.若使用ONNXRuntime在ARM端推理,最佳执行提供器是:A.CPUExecutionProviderB.CUDAExecutionProviderC.NNAPIExecutionProviderD.TensorrtExecutionProvider答案:C二、多项选择题(每题2分,共20分)31.下列哪些操作可有效缓解模型过拟合?A.MixupB.StochasticDepthC.LabelSmoothingD.增大batchsize答案:A、B、C32.在PyTorch中,以下哪些函数可实现梯度裁剪?A.torch.nn.utils.clip_grad_norm_B.torch.nn.utils.clip_grad_value_C.torch.autograd.gradD.torch.optim.lr_scheduler答案:A、B33.使用TensorBoard时,可可视化的内容包括:A.模型计算图B.PR曲线C.权重直方图D.源代码diff答案:A、B、C34.在目标检测评估中,COCOAPI提供的指标有:A.AP@0.5B.AP@0.5:0.95C.AR@1D.mIoU答案:A、B、C35.以下哪些属于自监督预训练任务?A.BERT的MaskedLMB.SimCLR的对比学习C.GPT的自回归语言模型D.图像旋转预测答案:A、B、D36.当使用混合精度训练时,需同时调用:A.autocastB.GradScalerC.torch.cuda.ampD.torch.jit答案:A、B、C37.在推荐系统冷启动场景,可采用的策略有:A.利用用户注册信息做特征B.使用探索利用bandit算法C.引入知识图谱侧信息D.直接删除冷启动用户答案:A、B、C38.以下哪些算子在ONNX中属于序列相关?A.LSTMB.GRUC.AttentionD.Conv答案:A、B、C39.在模型服务TritonInferenceServer中,可配置的调度策略有:A.DynamicBatcherB.SequenceBatcherC.EnsembleSchedulerD.RoundRobin答案:A、B、C40.使用Kfold交叉验证时,为防信息泄漏,应:A.每折内部做标准化B.每折内部做特征选择C.全局做标准化后划分D.全局做特征选择后划分答案:A、B三、判断题(每题1分,共10分)41.在Transformer中,点积注意力除以√d_k是为了防止梯度消失。答案:正确42.使用ReLU激活函数时,必然出现神经元死亡现象。答案:错误43.在联邦学习中,FedAvg的本地更新步数越多,通信轮次一定越少。答案:错误44.知识蒸馏中,学生模型参数量必须小于教师模型。答案:错误45.在图像分割评价中,Dice系数与IoU可相互转换。答案:正确46.使用梯度累积时,等效batchsize等于物理batchsize乘以累积步数。答案:正确47.在BERT中,[MASK]标记在微调阶段仍须保留。答案:错误48.使用混合精度训练时,损失缩放系数过大可能导致梯度溢出。答案:错误49.在YOLOv5中,Mosaic增强默认概率为1.0。答案:正确50.当使用DeepSpeed时,ZeROOffload可将优化器状态卸载至CPU。答案:正确四、填空题(每题2分,共20分)51.在PyTorch中,若需将模型保存为TorchScript,应调用________方法。答案:torch.jit.trace或torch.jit.script52.Transformer论文中,基础模型维度d_model=________。答案:51253.在COCO数据集上,目标检测大、中、小目标的面积阈值分别为________、________、________像素。答案:960²、32²~96²、0²~32²54.使用Adam优化器时,默认学习率通常设为________。答案:1e355.在SimCLR中,默认温度系数τ=________。答案:0.156.当使用ONNXRuntimeC++API时,创建会话的对象类名为________。答案:Ort::Session57.在知识蒸馏中,若温度T→∞,softmax输出趋近于________分布。答案:均匀58.在GPT3175B模型中,参数量的数量级为________亿。答案:175059.使用Horovod时,跨节点通信默认后端为________。答案:NCCL60.在图像增强Albumentations库中,随机擦除变换名为________。答案:CoarseDropout五、简答题(每题10分,共30分)61.描述混合精度训练中动态损失缩放(DynamicLossScaling)的完整流程,并给出PyTorch代码片段。答案:步骤:1)初始缩放因子scale=2^16;2)前向计算前将损失乘以scale;3)反向传播得到缩放后的梯度;4)检查梯度是否溢出(含inf或nan);5)若无溢出,梯度除以scale并更新权重,且scale乘2^0.001;6)若溢出,跳过权重更新,scale除以2;7)重复直至训练结束。代码:```pythonfromtorch.cuda.ampimportautocast,GradScalerscaler=GradScaler()forx,yinloader:optimizer.zero_grad()
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年计算机知识题库500道含答案【突破训练】
- 金融投资顾问岗位面试题及答案解析
- 2026年初级管理会计之专业知识考试题库300道含答案(考试直接用)
- 企业房屋租赁合同集合15篇
- 公司人事文员工作总结(集合10篇)
- 中队长竞选演讲稿(15篇)
- 成人氧气吸入疗法护理
- 中工院织造学讲义10织机传动
- 游戏化视角下的小学编程教学策略探究与应用教学研究课题报告
- 河北省税务局遴选面试题及答案
- 建筑设计防火规范-实施指南
- CJ/T 511-2017铸铁检查井盖
- 智能采血管理系统功能需求
- 【基于PLC的自动卷缆机结构控制的系统设计10000字(论文)】
- 资产移交使用协议书
- GB/T 45481-2025硅橡胶混炼胶医疗导管用
- GB/T 32468-2025铜铝复合板带箔
- 山西交控集团招聘笔试内容
- 大窑校本教材合唱的魅力
- 《建筑测绘》课件
- 《健康体检报告解读》课件
评论
0/150
提交评论