版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025中学生人工智能知识应用竞赛试卷及参考答案一、单项选择(每题2分,共20分)1.在卷积神经网络中,若输入图像尺寸为224×224×3,使用32个5×5的卷积核,步长为1,零填充为2,则输出特征图的宽为A.220 B.222 C.224 D.226答案:C解析:输出宽=(输入宽+2×填充−核宽)/步长+1=(224+4−5)/1+1=224。2.下列Python代码片段中,哪一行会导致模型在GPU上训练时显存持续增长?A.`loss.backward()`B.`optimizer.zero_grad()`C.`withtorch.no_grad():y=model(x)`D.`loss=loss+0.x.sum()`答案:D解析:D项在计算图中引入恒等附加节点,导致反向传播时缓存不释放,显存泄漏。3.在StableDiffusion中,文本引导生成图像的关键组件是A.VAE解码器 B.UNet噪声预测网络 C.CLIP文本编码器 D.DDIM调度器答案:C解析:CLIP将提示词映射到共享语义空间,为UNet提供条件向量。4.联邦学习场景下,客户端上传的梯度被恶意替换为全零向量,这种攻击称为A.模型投毒 B.梯度泄露 C.拜占庭攻击 D.成员推理答案:C解析:拜占庭攻击指任意错误/恶意参数破坏聚合,全零梯度即典型实例。5.在Transformer自注意力中,Q与K^T相乘后除以√d_k的主要目的是A.加速计算 B.防止梯度消失 C.抑制softmax饱和 D.增强稀疏性答案:C解析:防止点积过大使softmax进入饱和区,梯度趋零。6.使用LoRA微调LLM时,若原矩阵W∈R^(1024×4096),秩r=16,则新增参数量为A.65536 B.131072 C.262144 D.524288答案:B解析:LoRA新增A∈R^(1024×16)、B∈R^(16×4096),共1024×16+16×4096=131072。7.在NVIDIAJetsonOrinNano上部署YOLOv8时,若INT8量化后mAP下降0.8%,最可能原因是A.校准数据集不足 B.BatchNorm折叠失败 C.未使用TensorRT D.未开启DLP答案:A解析:校准集过小导致激活值范围估计偏差,INT8缩放因子失准。8.下列哪种数据增强策略对提升MNIST手写数字鲁棒性最无效?A.随机旋转±30° B.CutMix C.高斯噪声σ=0.1 D.随机擦除答案:B解析:CutMix将图像块拼接,对背景简单的MNIST引入无关干扰,收益最低。9.在深度强化学习中,使用DoubleDQN主要是为了缓解A.环境非平稳 B.过估计偏差 C.样本相关性 D.稀疏奖励答案:B解析:DoubleDQN解耦动作选择与评估,减少Q值过估计。10.若将BERTbase的激活函数从GELU替换为ReLU,模型参数量A.增加 B.减少 C.不变 D.先减后增答案:C解析:激活函数无参数,仅计算方式改变。二、不定项选择(每题3分,共15分,多选少选均不得分)11.关于DiffusionModel的DDPM,下列说法正确的是A.前向过程为马尔可夫链 B.反向过程参数共享 C.损失函数含L2重建项 D.需要训练判别器答案:A、B、C解析:DDPM无需判别器,损失为预测噪声的L2。12.在边缘计算场景部署TinyML模型时,必须考虑A.Flash占用 B.RAM峰值 C.中断延迟 D.浮点单元功耗答案:A、B、C、D解析:四项均直接影响MCU级设备稳定性。13.下列哪些操作可有效降低大模型推理时PPL(困惑度)A.动态NTKRoPE缩放 B.使用温度采样t=1.5 C.引入重复惩罚1.2 D.KVCache压缩答案:A、C、D解析:温度>1增加随机性,反而升高PPL。14.关于VisionTransformer的PositionEmbedding,正确的有A.一维可学习向量 B.二维相对编码 C.去掉后模型仍可变输入分辨率 D.使用正弦余弦版本可外推答案:A、B、D解析:C错误,去掉后无法处理不同分辨率。15.在联邦学习中,SecureAggregation方案基于A.Shamir秘密共享 B.同态加密 C.差分隐私 D.双掩码协议答案:A、B、D解析:差分隐私用于输出扰动,非聚合阶段。三、填空题(每空2分,共20分)16.在PyTorch中,若模型已`.cuda()`,需将输入张量也调用__________方法才能在同设备计算。答案:`.cuda()`或`.to('cuda')`解析:设备不一致会抛RuntimeError。17.ResNet的残差块使用__________卷积完成降采样,以避免信息丢失。答案:1×1(或“逐点”)解析:1×1卷积调整通道并控制步长。18.Transformer中,自注意力的时间复杂度为__________。答案:O(n²d)解析:n为序列长度,d为特征维度。19.INT8量化的缩放因子s计算公式为__________。答案:s=(q_max−q_min)/(r_max−r_min)解析:r为浮点范围,q为量化范围。20.在DDIM采样中,若设置η=0,则退化为__________过程。答案:确定性(或“非随机”)解析:η控制随机噪声注入量。21.LoRA的低秩矩阵分解表示为W'=W+__________。答案:BA解析:B∈R^(d×r),A∈R^(r×k)。22.使用混合精度训练时,LossScaling的初始值通常设为__________。答案:2^16解析:防止梯度下溢。23.在目标检测中,若IoU阈值从0.5提升到0.75,mAP一般会__________(上升/下降)。答案:下降解析:更高阈值减少正样本。24.CLIP的对比学习损失函数称为__________损失。答案:InfoNCE解析:多分类交叉熵的变体。25.在GPT的自回归生成中,__________采样策略既能保持多样性又能避免重复。答案:Topp(核采样)解析:动态截断累积概率。四、判断改错(每题2分,共10分,先判对错,若错则划线改正)26.MobileNetV3large的激活函数仅为ReLU6。答案:错。改为:ReLU6、Hswish、HardSigmoid混合。27.使用梯度裁剪clip_norm=1.0会改变优化器学习率。答案:错。裁剪仅缩放梯度向量,不改变学习率。28.Transformer的DecoderMask为下三角矩阵,防止看到未来信息。答案:对。29.KnowledgeDistillation中,教师模型输出logits温度τ越高,软标签越尖锐。答案:错。τ越高分布越平滑。30.在联邦学习中,FedAvg的本地epoch越多,全局模型收敛越慢。答案:对。五、简答题(每题6分,共18分)31.描述FlashAttention如何通过分块降低显存占用,并给出时间复杂度。答案:FlashAttention将注意力矩阵按块计算,避免实例化完整的n×n矩阵;通过在线softmax更新,每块O(d)缓存。时间复杂度仍为O(n²d),但显存从O(n²)降至O(n+d)。32.解释QLoRA中的4bitNormalFloat量化格式,并说明为何比INT4更适合LLM。答案:NormalFloat对权重按零点对称、离群值稀疏分布建模,先归一化再量化,减少量化误差;对LLM权重近似高斯分布更有效,比均匀INT4平均降低0.3–0.9的PPL。33.给出在JetsonNano上部署YOLOv5s的完整TensorRT优化流程(含命令)。答案:1)导出ONNX:`pythonexport.pyweightsyolov5s.ptincludeonnxdynamic`2)构建引擎:`trtexeconnx=yolov5s.onnxsaveEngine=yolov5s.trtfp16workspace=1024`3)推理:`pythontrt_inference.pyengineyolov5s.trtinputdata/images`解析:trtexec自动完成图优化、层融合、内核自动调优。六、综合应用题(共17分)34.某中学科创小组需在树莓派4B(4GBRAM)上实现实时手势识别,帧率≥15FPS,识别5种手势。给定训练集2万张192×192RGB图像。要求:(1)设计轻量级网络结构,画出模块图并注明参数量(4分);(2)给出训练阶段的数据增强与优化策略(3分);(3)给出INT8量化与异构部署细节,含树莓派CPU+NNAPI调用代码片段(6分);(4)若实际测试发现“剪刀”类召回率仅72%,提出两项改进并说明理由(4分)。答案:(1)网络:GhostNetV2瓶颈叠加SE,首层3×3Convstride=2,随后3个stage(通道244896),每层Ghost模块+DFC注意力,全局平均池化+5维FC。参数量≈0.55M。图:Input→Conv→Stage1(Ghostbottleneck×2)→Stage2(Ghost×3)→Stage3(Ghost×4)→GAP→FC→Softmax。(2)增强:随机裁剪±10%、颜色抖动brightness=0.2、Cutout16×16、MixUpα=0.2;优化:AdamWlr=3e4cosine退火、EMA权重平均、LabelSmoothingε=0.1。(3)量化:```pythonimporttflite_erpreterastfliteinterpreter=tflite.Interpreter(model_path='gesture_int8.tflite',experimental_delegates=[tflite.load_delegate('libedgetpu.so.1')])interpreter.allocate_tensors()input_details=interpreter.get_input_details()output_details=interpreter.get_output_details()预处理img=cv2.resize(frame,(192,192)).astype(np.uint8)interpreter.set_tensor(input_details[0]['index'],img[np.newaxis,...])interpreter.invoke()pred=interpreter.get_tensor(output_details[0]['index'])```生成int8模型:`tflite_convertsaved_model_dir=exportoutput_file=gesture_int8.tflitepost_training_quantizerepresentative_dataset=rep_data.npz`rep_data为100张校准图。(4)改进:a)增加困难样本:对“剪刀”做在线硬挖掘,提升召回;b)引入细粒度数据增强:手指关节关键点遮挡模拟,提高鲁棒性。七、编程与计算题(共35分)35.(10分)给定一维向量x=[2,5,3,7,1],用Numpy实现不带循环的Softmax及交叉熵损失,当标签y=3(即第4类)时,求loss值(保留3位小数)。答案:```pythonimportnumpyasnpx=np.array([2,5,3,7,1])logits=xx.max()防溢出prob=np.exp(logits)/np.exp(logits).sum()loss=np.log(prob[3])print(round(loss,3))输出0.367```36.(12分)在PyTorch中实现一个带因果掩码的1D自注意力模块,输入形状(B,L,d),输出同形,要求仅使用矩阵乘法与三角掩码,禁止调用nn.MultiheadAttention。答案:```pythonimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFclassCausalSelfAttention(nn.Module):def__init__(self,d,n_heads=8):super().__init__()assertd%n_heads==0self.d,self.nh=d,n_headsself.dh=d//n_headsself.qkv=nn.Linear(d,3d)j=nn.Linear(d,d)defforward(self,x):B,L,_=x.shapeqkv=self.qkv(x).view(B,L,3,self.nh,self.dh).transpose(1,3)q,k,v=qkv.unbind(2)scores=(q@k.transpose(2,1))/(self.dh0.5)mask=torch.triu(torch.ones(L,L,device=x.device),diagonal=1).bool()scores.masked_fill_(mask,float('inf'))attn=F.softmax(scores,dim=1)out=(attn@v)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年烟台市青年干部人才“菁英计划”选聘(山东建筑大学)笔试备考试题及答案解析
- 2026重庆市万州区大周镇人民政府招聘非全日制公益性岗位1人笔试参考题库及答案解析
- 中国科学院西北高原生物研究所2026年海内外人才招聘(青海)笔试参考题库及答案解析
- 2026年河北定州市叮咛店中心卫生院公开招聘劳动合同制工作人员4名笔试备考题库及答案解析
- 2026甘肃嘉峪关市地震局招聘公益性岗位1人笔试模拟试题及答案解析
- 2026广东茂名市信宜市选聘市外教师21人笔试备考题库及答案解析
- 2026年中国科学院海西研究院泉州装备制造研究中心所创新平台业务主管招聘备考题库及一套完整答案详解
- 2026年厦门市公安局思明分局招聘警务辅助人员备考题库及答案详解参考
- 2026年台州市自然资源和规划局黄岩分局公开招聘编制外工作人员备考题库及完整答案详解1套
- 天津港集团公司招聘笔试题库2026
- 商住楼项目总体规划方案
- 纪念册后记的格式范文
- 2024版装修公司软装合同范本
- 加压站清水池建设工程勘察设计招标文件
- 工会制度汇编
- 2023年医务科工作计划-1
- 乒乓球社团活动记录
- 地基与基础分项工程质量验收记录
- 一文多用作文课公开课课件
- 水运工程施工课程设计指导书
- 惊恐障碍诊治课件
评论
0/150
提交评论