人工智能训练师(五级)理论考试卷含答案

上传人：1*** IP属地：四川上传时间：2026-03-27 格式：DOCX 页数：18 大小：43.72KB 积分：12 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人工智能训练师(五级)理论考试卷含答案一、单项选择题（每题1分，共30分。每题只有一个正确答案，请将正确选项的字母填在括号内）1.在监督学习框架下，训练集的标签信息主要用于（）A.降维B.特征选择C.损失计算与参数更新D.数据增强2.下列关于梯度下降法的描述，正确的是（）A.学习率越大收敛越稳定B.批量梯度下降每次迭代仅使用一个样本C.随机梯度下降具有天然噪声，有助于逃离局部极小D.Adam优化器不能调节学习率3.在卷积神经网络中，若输入特征图为32×32×64，采用64个3×3卷积核，步长为1，same填充，则输出特征图的尺寸为（）A.30×30×64B.32×32×64C.64×64×64D.32×32×1284.下列激活函数中，在x=0处不可导的是（）A.SigmoidB.TanhC.ReLUD.LeakyReLU5.在Python中，使用NumPy将形状为(784,1)的数组转为(28,28)的矩阵，正确语句是（）A.arr.reshape(28,28)B.arr.resize(28,28)C.arr.transpose()D.arr.flatten()6.当模型在训练集准确率持续上升，但在验证集准确率震荡下降，最可能的原因是（）A.欠拟合B.过拟合C.梯度消失D.梯度爆炸7.在NLP任务中，Word2Vec的Skip-gram模型目标是（）A.根据上下文预测中心词B.根据中心词预测上下文C.最大化句子似然D.最小化交叉熵8.下列关于数据归一化的说法，错误的是（）A.可加速模型收敛B.对基于树的模型同样必要C.可将特征缩放到0~1区间D.可减小不同量纲带来的偏差9.在K折交叉验证中，若K=5，数据集大小为10000，则每次验证集大小为（）A.5000B.2000C.1000D.800010.使用早停（EarlyStopping）策略时，通常监控的指标是（）A.训练损失B.验证损失C.训练准确率D.参数L2范数11.在PyTorch中，将模型设为评估模式的语句是（）A.model.train()B.model.eval()C.model.test()D.model.validate()12.下列关于Dropout的说法，正确的是（）A.推理阶段仍需随机失活神经元B.可视为集成学习的近似C.只能用于全连接层D.会显著增加训练时间13.若某二分类任务的正负样本比例为1:99，宜采用的评价指标是（）A.准确率B.精确率C.F1-scoreD.AUC-ROC14.在目标检测任务中，IoU的计算公式为（）A.交集/并集B.并集/交集C.交集/预测框D.并集/真实框15.当使用预训练模型进行迁移学习时，冻结底层权重的主要目的是（）A.增加参数量B.保留低层通用特征C.提高学习率D.减少推理时间16.在生成对抗网络中，生成器G的目标函数为（）A.最小化log(D(G(z)))B.最大化log(1−D(G(z)))C.最小化log(1−D(G(z)))D.最大化log(D(x))17.下列关于BERT的说法，错误的是（）A.采用双向Transformer编码器B.预训练任务包含MLM与NSPC.微调时需重新训练词嵌入D.可用于文本分类、问答等下游任务18.在模型部署阶段，TensorRT的主要作用是（）A.数据标注B.模型压缩与加速C.自动调参D.可视化19.若某深度学习模型权重呈NaN，最可能的原因是（）A.学习率过小B.梯度爆炸C.批归一化失效D.权重衰减过大20.在联邦学习框架下，参数聚合常用的算法是（）A.FedAvgB.SGDC.AdamD.RMSprop21.下列关于模型可解释性的方法，属于事后解释的是（）A.决策树B.LIMEC.线性回归D.规则列表22.在图像分割任务中，Dice系数的取值范围是（）A.[0,1]B.[-1,1]C.[0,+∞)D.(-∞,+∞)23.当使用混合精度训练时，需特别关注的潜在问题是（）A.权重下溢B.梯度溢出C.数据缺失D.批大小过大24.在强化学习中，Q-learning的更新公式为（）A.Q(s,a)←Q(s,a)+α[r+γmaxQ(s′,a′)−Q(s,a)]B.Q(s,a)←r+γmaxQ(s′,a′)C.Q(s,a)←αrD.Q(s,a)←log(r)25.下列关于AutoML的说法，正确的是（）A.完全无需人工干预B.可自动搜索网络结构C.仅适用于图像任务D.无法调整超参数26.在模型蒸馏中，学生模型主要学习教师模型的（）A.参数值B.输出软分布C.损失函数D.优化器状态27.当使用LSTM处理长序列时，遗忘门的作用为（）A.增加细胞状态B.重置细胞状态C.控制细胞状态丢弃比例D.输出隐藏状态28.在数据增强中，MixUp方法的核心操作是（）A.随机裁剪B.随机擦除C.线性插值生成新样本D.颜色抖动29.下列关于模型版本管理工具的说法，错误的是（）A.MLflow可记录参数与指标B.DVC可管理大型数据文件C.GitLFS无法追踪模型权重D.Weights&Biases支持可视化30.在边缘计算场景部署模型时，首要考虑的限制因素是（）A.显存与功耗B.批大小C.学习率D.优化器类型二、多项选择题（每题2分，共20分。每题有两个或两个以上正确答案，请将所有正确选项的字母填在括号内，漏选、错选均不得分）31.下列措施中，有助于缓解过拟合的有（）A.增加训练数据B.使用DropoutC.减小网络深度D.提前终止训练32.关于BatchNormalization的作用，正确的有（）A.缓解内部协变量偏移B.可使用较大学习率C.轻微正则化效果D.仅能在卷积层使用33.在模型压缩技术中，属于参数级压缩的方法有（）A.剪枝B.量化C.知识蒸馏D.权值共享34.下列评价指标中，适用于多分类任务的有（）A.Macro-F1B.Micro-F1C.AUC-ROCD.Cohen’sKappa35.在PyTorch中，以下哪些操作会阻断梯度回传（）A.tensor.detach()B.withtorch.no_grad():C.loss.backward()D.tensor.data36.关于Transformer的自注意力机制，正确的有（）A.可并行计算B.捕获长距离依赖C.计算复杂度与序列长度呈线性关系D.使用缩放点积37.在目标检测模型YOLOv5中，下列属于其Head部分输出内容的有（）A.边界框坐标B.目标置信度C.类别概率D.锚框尺寸38.下列关于模型公平性的指标，属于群体公平性的有（）A.人口统计均等B.机会均等C.个体公平性D.校准性39.在数据标注质量控制中，可采用的策略有（）A.多人标注一致性检验B.标注员培训C.随机抽查D.自动标注替代人工40.下列关于深度学习框架对比的说法，正确的有（）A.TensorFlow2.x默认动态图B.PyTorch支持动态图C.PaddlePaddle不支持移动端部署D.MindSpore支持图算融合三、判断题（每题1分，共10分。正确请填“√”，错误填“×”）41.ReLU激活函数在负数区间梯度为0，易导致神经元“死亡”。（）42.增加批大小一定会提升模型泛化性能。（）43.在模型评估阶段，测试集可用于调参。（）44.使用学习率预热可缓解训练初期不稳定问题。（）45.梯度裁剪主要用于解决梯度消失问题。（）46.在图像分类任务中，混淆矩阵对角线元素表示正确预测数量。（）47.知识蒸馏中，温度参数T越大，软分布越尖锐。（）48.联邦学习可保证各参与方原始数据不出本地。（）49.模型可解释性越高，其性能必然越好。（）50.在边缘端部署INT8量化模型，推理速度通常快于FP32。（）四、填空题（每空2分，共20分）51.若某全连接层输入维度为512，输出维度为256，则该层参数量为________。52.在Python中，使用NumPy计算两个向量的余弦相似度，可调用函数________。53.当使用交叉熵损失时，若预测概率为0，需做________处理避免log(0)。54.在卷积神经网络中，感受野是指________。55.若某模型在测试集上的TP=80，FP=20，FN=30，则召回率为________。56.在Transformer中，位置编码使用________函数生成正弦与余弦信号。57.模型蒸馏损失通常由________损失与软损失加权求和组成。58.在强化学习中，探索与利用的平衡常采用________算法。59.使用ONNX导出模型时，需调用torch.onnx.export并指定________参数为模型输入样例。60.在模型监控阶段，若数据漂移超过阈值，应触发________流程。五、简答题（每题10分，共30分）61.简述批量归一化（BatchNormalization）的计算流程，并说明其在训练与推理阶段的差异。62.说明模型剪枝的三类典型方法，并分析各自的优缺点。63.给出联邦学习在跨机构医疗影像分析中的实施步骤，并指出潜在风险与缓解方案。六、计算题（每题10分，共20分）64.已知某二分类任务的正负样本数分别为800与200，模型预测结果如下：TP=720，FP=80，TN=120，FN=80。(1)计算精确率、召回率、F1-score；(2)若将分类阈值从0.5下调至0.3，TP增加40，FP增加60，其余不变，求新的F1-score，并比较结果。65.给定一个3×3输入矩阵X=[与卷积核K=[步长为1，无填充。(1)计算输出特征图；(2)若采用最大池化，池化核2×2，步长2，求池化后结果。七、综合分析题（20分）66.某电商公司拟基于用户评论进行情感分析，数据包含200万条中文评论，类别为正面、负面、中性。公司要求模型在边缘设备（ARMCortex-A53，1GBRAM）上实时推理，延迟<100ms，准确率>90%。请从数据、模型、训练、部署四个维度提出完整技术方案，并说明如何评估与持续优化。【答案与解析】一、单项选择题1.C2.C3.B4.C5.A6.B7.B8.B9.B10.B11.B12.B13.D14.A15.B16.C17.C18.B19.B20.A21.B22.A23.B24.A25.B26.B27.C28.C29.C30.A二、多项选择题31.ABCD32.ABC33.ABD34.ABD35.AB36.ABD37.ABC38.AB39.ABC40.ABD三、判断题41.√42.×43.×44.√45.×46.√47.×48.√49.×50.√四、填空题51.131328（512×256+256）52.numpy.dot/numpy.linalg.norm53.加epsilon平滑54.输出特征图上一点对应输入图像的区域大小55.0.727（80/(80+30)）56.sin/cos57.硬（ground-truth）58.ε-greedy或UCB59.args60.模型重训练或增量更新五、简答题（要点示例）61.流程：①计算批均值μ；②计算批方差σ²；③归一化得x̂；④缩放平移得y=γx̂+β。训练阶段μ、σ²来自当前批；推理阶段使用移动平均的μ、σ²，且无需更新。62.方法：①权重剪枝（非结构化）——简单但需稀疏库支持；②通道剪枝（结构化）——硬件友好但可能掉点；③梯度/敏感度剪枝——精度高但计算复杂。63.步骤：①数据标准化脱敏；②同态加密或差分隐私；③本地训练；④梯度聚合；⑤全局更新；⑥迭代至收敛。风险：梯度泄露、非独立同分布、通信开销。缓解：安全聚合、个性化层、模型压缩、自适应聚合。六、计算题64.(1)精确率=720/(720+80)=0.9；召回率=720/(720+80)=0.9；F1=2×0.9×0.9/(0.9+0.9)=0.9。(2)新TP=760，FP=140，FN=40；精确率=760/900=0.844；召回率=760/800=0.95；F1=2×0.

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能训练师(五级)理论考试卷含答案

文档简介

温馨提示

最新文档

评论

相关文档