下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
深度学习工程师考试试卷及答案填空题(共10题,每题1分)1.最早的线性二分类模型是______。2.ReLU激活函数在x≥0时的表达式是______。3.分类任务常用的损失函数是______交叉熵损失。4.基础优化器是______梯度下降(SGD)。5.L2正则化也称为______正则化。6.CNN提取特征的核心层是______层。7.池化层的主要作用是______特征维度。8.处理序列数据的循环网络是______。9.基于自注意力的模型是______。10.训练集好但测试集差的现象是______。答案1.感知器2.f(x)=x3.交叉熵4.随机5.权重衰减6.卷积7.降维8.RNN9.Transformer10.过拟合单项选择题(共10题,每题2分)1.不会出现梯度消失的激活函数是?A.SigmoidB.TanhC.ReLUD.Softmax2.3×3卷积核(16入→32出)的参数数量是?A.3×3×16×32B.3×3×16×32+32C.3×3×16+32D.3×3×323.LSTM中保留历史信息的门是?A.输入门B.遗忘门C.输出门D.更新门4.Transformer的核心是?A.循环连接B.自注意力C.池化层D.全连接层5.不能防过拟合的方法是?A.DropoutB.增数据C.增模型复杂度D.早停6.BN通常放在哪层后?A.激活层B.全连接前C.卷积层D.输出层7.GAN判别器的目标是?A.生成真实数据B.区分真假数据C.最小化生成误差D.最大化相似度8.BERT基于的预训练任务是?A.MLMB.文本分类C.目标检测D.图像生成9.属于视觉Transformer的是?A.ResNetB.VGGC.ViTD.LSTM10.SGD比BGD的优势是?A.收敛稳定B.训练更快C.精度更高D.无需学习率答案1.C2.B3.B4.B5.C6.C7.B8.A9.C10.B多项选择题(共10题,每题2分,多选/少选/错选不得分)1.正则化方法包括?A.L1B.L2C.DropoutD.早停2.CNN的组成部分有?A.卷积层B.池化层C.全连接层D.激活层3.RNN变种有?A.LSTMB.GRUC.双向RNND.Transformer4.Transformer核心组件是?A.自注意力B.前馈网络C.残差连接D.层归一化5.常用优化器有?A.SGDB.AdamC.AdagradD.RMSProp6.损失函数包括?A.交叉熵B.MSEC.MAED.KL散度7.GAN的组成是?A.生成器B.判别器C.编码器D.解码器8.预训练模型有?A.BERTB.GPTC.ResNetD.ViT9.解决过拟合的方法是?A.增数据B.正则化C.早停D.简化模型10.主流框架有?A.TensorFlowB.PyTorchC.MXNetD.Caffe答案1.ABCD2.ABCD3.ABC4.ABCD5.ABCD6.ABCD7.AB8.ABCD9.ABCD10.ABCD判断题(共10题,每题2分,对√/错×)1.感知器无法解决异或问题。()2.ReLU不会出现梯度消失。()3.卷积具有平移不变性。()4.LSTM解决了RNN梯度消失。()5.Transformer无需循环结构。()6.Dropout测试时不丢弃神经元。()7.BN训练/测试用不同均值方差。()8.GAN生成器与判别器交替训练。()9.BERT是双向编码器。()10.ViT用注意力代替卷积。()答案1.√2.√3.√4.√5.√6.×7.√8.√9.√10.√简答题(共4题,每题5分,答案200字左右)1.简述ReLU的优缺点。答案:ReLU优点:①计算简单(x≥0时f(x)=x),训练快;②缓解梯度消失(正区间梯度为1);③稀疏性(x<0时输出0,减少计算)。缺点:①死亡神经元(x恒<0时无法更新);②输出非零中心化,可能导致训练不稳定。2.卷积层的核心作用是什么?答案:卷积层是CNN特征提取核心,通过可学习卷积核与输入做卷积,提取局部特征(边缘、纹理等)。特性:局部连接(仅关注局部区域)、权值共享(同一核参数用于所有位置)、平移不变性(特征不受位置偏移影响),能高效提取层次化特征(从低级边缘到高级语义)。3.LSTM遗忘门的功能是什么?答案:遗忘门决定保留多少细胞状态(历史信息)。输入为当前x_t和前一隐藏态h_{t-1},输出0~1向量:1代表完全保留该维度历史,0代表完全丢弃,中间值按比例保留。解决RNN长期依赖问题,选择性遗忘无关信息、保留重要信息。4.过拟合的原因及解决方法?答案:原因:①模型复杂度过高(拟合噪声);②训练数据不足;③训练时间过长。解决方法:①增数据(数据增强);②正则化(L1/L2、Dropout);③早停(监控验证集);④简化模型(减参数/层数);⑤数据增强(图像旋转、翻转等)。讨论题(共2题,每题5分,答案200字左右)1.比较SGD、Adam、Adagrad的适用场景。答案:①SGD:单样本更新,速度快,适合大数据/简单分布,但收敛不稳定,需调学习率;②Adagrad:自适应学习率,对稀疏数据友好(如NLP低频词),但学习率单调递减,收敛慢;③Adam:结合Momentum和RMSProp,收敛快且稳定,适合大多数任务(图像、NLP),但小数据集/极端稀疏数据下不如Adagrad。2.Transformer比RNN处理长序列的优势?答案:RNN存在梯度消失/爆炸,无法捕获长期依赖;Transformer通过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冀教版四年级下册小学英语全册单元测试卷(含听力音频文件)
- 初中地理87道地理大题答题术语
- 六年级上册倒数的认识的教学设计
- 辽宁省丹东第九中学2026届中考英语模拟试题含答案
- 保温施工方案 (一)
- 2026届广东省湛江市市级名校中考三模英语试题含答案
- 保安个人工作总结15篇
- 企业复工复产疫情防控工作方案汇报7篇
- 2026 学龄前自闭症早期干预情绪课件
- 2026届漳州三检数学试题+答案
- AAV血友病基因治疗应用
- (一模)2026年深圳市高三年级第一次调研考试数学试卷(含官方答案及解析)
- AI助力网格员信息统计与上报
- 静脉治疗血管解剖知识
- 2025年中职学前教育笔试题目及答案
- 2025年医疗机构临床路径管理实施指南
- 2025届山东省Flawless联考高三下学期选考科目考试(四)物理试题(解析版)
- 超市消防安全培训材料课件
- 2026年考研数学一真题
- 退工登记情况表
- 2025年生理知识竞赛复习题库及答案(共100题)
评论
0/150
提交评论