版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年大学计算机技术(人工智能基础)试题及答案一、单项选择题(每题2分,共20分)1.在深度学习中,若将ReLU激活函数全部替换为Sigmoid,下列最可能发生的训练现象是A.梯度消失加剧,深层网络几乎无法更新B.训练速度显著加快,因Sigmoid导数恒大于0.1C.损失曲面变得更为平滑,易跳出局部极小D.权重初始化方差可缩小10倍而保持相同收敛速度答案:A解析:Sigmoid在饱和区导数趋近0,反向传播时梯度呈指数级衰减,深层网络底层几乎得不到有效梯度;ReLU在正半轴导数恒为1,可缓解该问题。2.在Transformer的自注意力机制中,若将缩放因子√d_k去除,且d_k=64,当点积结果绝对值普遍大于30时,Softmax输出最接近A.均匀分布B.极端onehot分布C.高斯分布D.双峰分布答案:B解析:点积值过大会使Softmax指数饱和,最大分量趋近1,其余趋近0,形成极端onehot。3.联邦学习场景下,客户端上传本地模型梯度而非参数,主要目的是A.降低服务器显存占用B.避免不同客户端参数空间不一致C.减少通信量并提升隐私安全D.使服务器可直接计算全局损失答案:C解析:梯度通常稀疏且可量化压缩,通信开销小;同时不暴露原始数据与参数绝对值,隐私性更好。4.在AlphaGoZero的自我对弈中,若将MCTS模拟次数从1600降至100,且神经网络评估不变,最可能出现的棋力变化是A.棋力线性下降约3/4B.棋力轻微下降,但残局胜率显著降低C.棋力几乎不变,因网络已足够强D.棋力反而提升,因探索噪声减少答案:B解析:模拟次数减少主要削弱搜索深度与广度,中盘复杂局面易出错;残局因分支少,搜索不足导致胜率估算误差放大。5.若将BatchNorm层从ResNet50中全部移除,并用GroupNorm(32组)替代,在ImageNet训练相同epoch后,Top1准确率最可能A.提升1.5%B.下降0.3%以内C.下降超过2%D.无法收敛答案:B解析:GroupNorm在小batch下稳定,但ImageNet大batch训练时BatchNorm的均值方差估计更准,替换后轻微下降。6.在DQN中,若经验回放池大小从1M降至10K,且batchsize保持32,训练10M帧后,平均Q值估计最可能A.高估且方差增大B.低估且方差减小C.无偏但方差增大D.无偏且方差减小答案:A解析:池变小导致样本重复率高,相关性强,网络过拟合近期策略,出现系统性高估。7.使用BERTbase进行中文命名实体识别时,若将WordPiece最大词长限制从200降至50,且句子长度>50,则F1值最可能A.下降0.5%以内B.下降1%~2%C.下降超过3%D.几乎不变答案:B解析:截断导致尾部上下文丢失,实体边界判断受影响;中文实体常位于句尾,下降明显。8.在卷积神经网络中,若将3×3卷积全部替换为5×5深度可分离卷积,参数量的变化倍率约为A.0.4B.0.6C.1.0D.1.5答案:A解析:5×5深度卷积参数为5×5=25,点后1×1卷积参数不变;原3×3普通卷积参数9×C_in×C_out。整体参数量约减少至0.4倍。9.在生成对抗网络中,若判别器损失快速收敛至0,生成器损失震荡上升,表明A.生成器梯度消失,模式崩溃B.判别器过拟合,生成器无法获得有效梯度C.生成器过强,需减小学习率D.判别器容量不足,需加深网络答案:B解析:判别器完美区分真假,输出饱和,导数趋零,生成器梯度信号消失。10.在AutoML的神经网络架构搜索中,采用DARTS连续松弛后,若架构权重α与网络权重w联合优化,最可能出现的次生问题是A.梯度爆炸导致α迅速onehotB.w与α优化速度不匹配,出现“过拟合”架构C.搜索时间线性增加10倍D.显存占用下降50%答案:B解析:w收敛快于α,训练损失下降但验证损失上升,搜索到的架构在验证集表现差。二、多项选择题(每题3分,共15分)11.下列方法可直接缓解图神经网络中“过度平滑”问题的有A.残差连接B.注意力加权邻居C.增加网络深度至100层D.随机dropedgeE.每层使用不同可学习权重答案:A、B、D解析:残差与注意力保留局部信息;DropEdge随机去边降低平滑;单纯加深或共享权重反而加剧平滑。12.关于对比学习SimCLR,以下说法正确的有A.数据增强组合越强,线性评估准确率一定越高B.投影头去掉后,线性评估准确率下降C.温度系数τ越小,同类样本相似度梯度越大D.batchsize增大可缓解假阴性E.负样本对来自同一图像的不同增强答案:B、C、D解析:A过强增强可能破坏语义;E负样本来自不同图像;τ减小放大梯度;大batch提供更多负样本。13.在强化学习PPO算法中,下列操作可提升样本效率的有A.使用GAE(λ)估计优势函数B.将clip范围从0.2提至0.5C.采用价值函数裁剪D.增加并行环境数E.使用熵正则化答案:A、C、D、E解析:clip范围扩大反而降低稳定性;其余均有效。14.关于VisionTransformer,下列结论在实验中被验证的有A.去掉位置编码后,分类准确率下降超过5%B.使用16×16patch优于32×32patchC.在ImageNet预训练后,冻结patchembedding仅微调MLPhead,Top1可提升1%D.深层attentionmap出现局部化现象E.增加head数量可降低训练时间答案:A、B、D解析:C冻结后反而下降;E增加head增加计算;小patch提供更多token,性能更好;深层关注局部边缘。15.下列技术可用于防御对抗样本攻击的有A.输入随机化B.对抗训练C.梯度掩蔽D.像素值截断E.模型集成答案:A、B、E解析:C梯度掩蔽可欺骗评估但非真正防御;D截断对范数攻击无效。三、填空题(每空2分,共20分)16.在LSTM中,遗忘门向量f_t计算公式为f_t=σ(W_f·[h_(t1),x_t]+b_f),其中σ表示________函数,输出值域为________。答案:sigmoid,(0,1)17.若卷积输入尺寸为112×112,核大小5×5,stride2,padding2,则输出特征图尺寸为________。答案:56×5618.在BERT预训练中,MaskedLM的掩码比例设为________%,NextSentencePrediction的正例比例约为________%。答案:15,5019.若某深度网络使用He初始化,卷积层输出通道数为128,核大小3×3,则该层权重初始方差为________。答案:2/(3×3×128)=2/1152≈0.00173620.在DQN中,目标网络参数每C步硬更新一次,若C=1000,学习率为0.00025,则目标网络相当于做了________次指数移动平均,衰减系数约为________。答案:1000,0.99921.若GraphSAGE采用均值聚合,邻居特征为{[1,2],[3,4],[5,6]},则聚合结果为________。答案:[3,4]22.在StyleGAN2中,映射网络将latentz∈R^512映射到中间latentw∈R^512,其深度为________层,每层使用________激活。答案:8,EqualizedLR+LeakyReLU23.若FocalLoss中γ=2,某样本预测概率为0.1,则其交叉熵损失权重被缩放为________倍。答案:(10.1)^2=0.8124.在知识蒸馏中,温度T=4时,softmax输出q_i=exp(z_i/T)/∑_jexp(z_j/T),当T→∞,分布趋近于________分布。答案:均匀25.若使用混合精度训练,lossscaling因子为128,在反向传播中发现梯度溢出,则下一次迭代应将该因子调整为________。答案:64四、简答题(每题8分,共24分)26.描述Transformer中“缩放点积注意力”与“加性注意力”在计算复杂度与显存占用上的差异,并说明为何Transformer选择前者。答案:缩放点积注意力计算复杂度O(n²d),显存O(n²),加性注意力需额外可学习参数W_a,计算复杂度O(n²d+n²d_a),显存亦更高。点积注意力无额外参数,且矩阵乘法高度优化,GPU并行效率远高于加性注意力中的前馈网络,故选择前者。27.解释为什么“权重衰减”在Adam优化器中常被实现为L2正则,而非直接对参数做θ=θλθ。答案:Adam引入一阶二阶动量,直接θ=θλθ会改变动量历史,使等效衰减系数随时间变化;将L2正则加入损失,则梯度含λθ项,Adam对其自适应缩放,保持与SGD+momentum相似的隐式调度,实验更稳定。28.对比“模型剪枝”与“知识蒸馏”在压缩流程、性能损失与部署友好度三方面的差异。答案:剪枝通过移除冗余权重或通道,需再训练恢复精度,压缩比高,性能损失可<1%,但需稀疏库支持;蒸馏训练小模型模仿大模型,无需特殊硬件,部署友好,但压缩比受限于小模型容量,性能损失通常1%~3%。五、综合设计题(21分)29.某城市需在边缘摄像头部署实时行人重识别(ReID)系统,要求单摄像头端延迟<30ms,带宽<100kbps,服务器端可复用多摄像头特征进行检索。设计一套端云协同方案,包含:(1)端侧模型架构与量化策略;(2)特征压缩与传输协议;(3)云侧检索引擎与更新机制;(4)隐私合规措施。答案:(1)端侧采用OSNetAIN,宽度乘子0.5,输入256×128,输出128维float16特征;使用QAT整数量化至INT8,激活用KL散度校准,权重用MSE校准,延迟降至22ms。(2)特征采用PQ编码,128维分8子空间,每子空间256码字,压缩后16字节;再用LZ4二次压缩,平均14字节;协议基于MQTToverTLS1.3,每包含camera_id、timestamp、feature、hash,带宽约70
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 十八项医疗核心制度25版课件
- 车间安全员培训科目课件
- 2026年智能重金属在线分析仪项目可行性研究报告
- 2026年数字化碳管理系统项目营销方案
- 2026年方形电机项目可行性研究报告
- 2026年个人税务咨询协议
- 市级政府公益性岗位政策的实践与探索-以临汾市为例
- 土石方工程变更管理
- 车间三违培训课件
- 广东省韶关市2025学年八年级上学期期末考试英语试题附答案
- 清华大学教师教学档案袋制度
- 公租房完整租赁合同范本
- GB/T 3098.5-2025紧固件机械性能第5部分:自攻螺钉
- 水电站压力管道课件
- 铁总建设201857号 中国铁路总公司 关于做好高速铁路开通达标评定工作的通知
- 孟州市浩轩塑业有限公司年产200吨塑料包装袋项目环评报告
- 卫生院消防安全演练方案篇
- 电焊机操作JSA分析表
- 落地式钢管脚手架工程搭拆施工方案
- 养老院健康档案模板
- 新竞争环境下的企业发展战略(培训讲座课件PPT)
评论
0/150
提交评论