下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1题下列选项中哪一项是在实践中训练神经网络的有效激活函数(元素非线性)Af(x)=-min(2,x)Bf(x)=0.9x+1Cf(x)=min(x,0.1x)Df(x)=min(x,0.1x),x>=1;f(x)=max(x,0.1x),x<1正确答案:AC第2题您正在构建一个用于识别黄瓜(y=1)与西瓜(y=0)的二进制分类器。对于输出层,您建议使用哪一个激活函数?AReLUBLeakyReLUCsigmoidDTanh第3题如果使用的学习率太大,会导致A网络收敛的快B网络收敛的慢C网络无法收敛D不确定第4题神经元计算什么?A神经元计算激活函数后,再计算线性函数(z=Wx+b)B神经元计算一个线性函数(z=Wx+b),然后接一个激活函数C神经元计算一个函数g,它线性地缩放输入x(Wx+b)D神经元先计算所有特征的平均值,然后将激活函数应用于输出第5题对于隐藏单元,tanh激活通常比sigmoid激活函数更有效,因为其输出的平均值接近于零,因此它可以更好地将数据集中到下一层。第6题为什么最好的mini-batch的大小通常不是1也不是m,而是介于两者之间?A如果mini-batch的大小是1,那么在你取得进展前,你需要遍历整个训练集B如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集C如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处D如果mini-batch的大小是m,就会变成随机梯度下降,而这样做经常会比mini-batch慢正确答案:BC第7题关于训练样本的描述中,正确的说法是哪个?A如果模型性能不佳,可增加样本个数进行优化B样本越多,模型调练越快,性能越好C增加数据可以减少模型方差D样本越少,模型的方差越大第8题深度学习算法的三要素是指以下哪些方面?A数据B优化算法C学习准则D模型正确答案:BCD第9题激活函数通常具有以下哪些性质?A计算简单B单调性C非线性D可微性正确答案:ABCD第1题考虑以下两个随机数组a和b:
a=np.random.randn(4,3)#a.shape=(4,3)b=np.random.randn(3,2)#b.shape=(3,2)c=a*b
c的维度是什么?Ac.shape=(4,3)Bc.shape=(3,3)Cc.shape=(4,2)D计算不成立因为这两个矩阵维度不匹配第2题考虑以下两个随机数组a和b:
a=np.random.randn(2,3)#a.shape=(2,3)b=np.random.randn(2,1)#b.shape=(2,1)c=a+b
c的维度是什么?Ac.shape=(3,2)Bc.shape=(2,1)Cc.shape=(2,3)D计算不成立因为这两个矩阵维度不匹配第3题下面哪些情况可能导致神经网络训练失败?A梯度消失B梯度爆炸C激活单元死亡D鞍点正确答案:ABCD第4题关于深度学习编程框架的这些陈述中,哪一个是正确的?A即使一个项目目前是开源的,项目的良好管理有助于确保它即使在长期内仍然保持开放,而不是仅仅为了一个公司而关闭或修改B通过编程框架,您可以使用比低级语言(如Python)更少的代码来编写深度学习算法C深度学习编程框架的运行需要基于云的机器正确答案:AB课后习题第1题有关BP神经网络的说法,错误的是哪个?A训练时新样本的加入对已经学习的结果没什么影响B易陷入局部极小值C隐层节点的选取缺乏理论指导D训练次数多,学习效率低,收敛速度慢第2题以下不属于超参的是哪个因素?Amini-batch的样本数B学习步长(率)和动量因子C激活函数D输出编码形式第3题你已经为所有隐藏的单位建立了一个使用tanh激活的网络。使用np.random.randn(…,…)*1000将权重初始化为相对较大的值。会发生什么?A没关系。只要随机初始化权重,梯度下降不受权重大小的影响B这将导致tanh的输入也非常大,从而导致梯度也变大。因此,你必须将学习率设置得非常小,以防止发散;这将减慢学习速度C这将导致tanh的输入也非常大,导致单元被“高度激活”。与权重从小值开始相比,加快了学习速度D这将导致tanh的输入也非常大,从而导致梯度接近于零。因此,优化算法将变得缓慢第4题如果增加神经网络的宽度,精确度会增加到一个阈值,然后开始降低。造成这一现象的原因可能是A只有一部分核被用于预测B当核数量增加,神经网络的预测能力降低C当核数量增加,其相关性增加,导致过拟合D以上都不对第5题神经网络的前面的层通常比更深层计算更复杂的特性。第6题神经网络的更深层通常比前面的层计算更复杂的特征。第7题在前向传播期间,在层L的前向传播函数中,您需要知道层L中的激活函数(Sigmoid,tanh,ReLU等)是什么。在反向传播期间,相应的反向传播函数也需要知道第L层的激活函数是什么,因为梯度是根据它来计算的。课后作业第1题下列哪些技术可以用来减少过拟合?ADataaugmentationBDropoutCBatchNormalizationD使用Adam代替SGD正确答案:ABC第2题为什么要对输入x进行归一化?A让参数初始化更快B让代价函数更快地优化C更容易做数据可视化D有助减少数据尺度对训练的影响第3题如果神经网络方差很高,下列哪个尝试是可能解决问题的?A添加正则项B获取更多测试数据C增加每个隐藏层的神经元数量D用更深的神经网络第4题什么是权重衰减?A正则化技术导致梯度下降在每次迭代时权重收缩B在训练过程中逐渐降低学习率的过程C如果神经网络是在噪声数据下训练的,那么神经网络的权值会逐渐损坏D通过对权重值设置上限来避免梯度消失的技术第5题下列方法中,可以用于特征降维的方法包括A主成分分析B线性判别分析C自编码器D矩阵奇异值分解正确答案:ABCD第6题当增大正则化的超参数a时会发生什么?A权重变小(接近0)B重量变大(远离0)C2倍的a导致2倍的权重D每次迭代,梯度下降采取更大的步距(与a成正比)第7题关于Adam算法,下列哪一个陈述是错误的?AAdam结合了Rmsprop和动量的优点BAdam中的学习率超参数α通常需要调整C我们经常使用超参数的“默认”值DAdam应该用于批梯度计算,而不是用于mini-batch第8题每个超参数如果设置得不好,都会对训练产生巨大的负面影响,因此所有的超参数都要调整好。第9题找到好的超参数的值是非常耗时的,所以通常情况下你应该在项目开始时做一次,并尝试找到非常好的超参数,这样你就不必再次重新调整它们。课后作业第1题你有一个15x15x8的输入,并使用“pad=2”进行填充,填充后的尺寸是多少?A17x17x10B19x19x8C19x19x12D17x17x8第2题假设输入是一个300*300的RGB图像,并且没有使用卷积网络。如果第一个隐藏层有100个神经元,每个神经元都完全连接到输入,那么这个隐藏层有多少个参数(包括偏置参数)?A9000000B9000001C27000001D27000100第3题假设输入是300×300彩色(RGB)图像,并且使用卷积层和100个过滤器,每个过滤器都是5×5的大小,请问这个隐藏层有多少个参数(包括偏置参数)?A2501B2600C7500D7600第4题因为池化层没有参数,因此不会影响反向传播运算。第5题卷积神经网络具有参数共享的特性,减少了参数的总和,从而减少了过拟合。第6题卷积神经网络具有参数共享的特性,允许将梯度下降的参数初始化为0,从而使连接更稀疏。第7题为了训练人脸识别系统的参数,使用包含了10万个不同的人的10万张图片的数据集进行训练是合理的。课后作业第1题下列哪个神经网络结构会发生权重共享A卷积神经网络B循环神经网络C全连接神经网络D选项A和B第2题下列关于GRU说法正确的是?AGRU有遗忘门、更新门两种门控结构BGRU中重置门有助于捕捉时间序列里长期的依赖关系CGRU中更新门有助于捕捉时间序列里长期的依赖关系DGRU中遗忘门有助于捕捉时间序列里长期的依赖关系第3题LSTM单元中控制当前时间步输入的结构是?A遗忘门B输入门C输出门D记忆细胞第4题下列关于RNN的说法错误的是?AGRU、LSTM都能捕捉时间序列中时间步距离较大的依赖关系。B双向循环神经网络在文本任务里能做到同时考虑上文和下文与当前词之间的依赖。CLSTM和GRU能一定程度缓解梯度消失与梯度爆炸的问题。D深层循环网络能有效抽取更高层更抽象的信息,层数越深效果越好。第5题你正在训练一个RNN网络,你发现你的权重与激活值都是“NaN”,下列选项中,哪一个是导致这个问题的最有可能的原因?A梯度消失B梯度爆炸CReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了DSigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了第6题循环神经网络(RNN)由于其固有的时序性质,存在难以进行并行化训练的问题。第7题根据过去几天的平均气温预测未来一天的平均气温可以使用循环神经
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 超市门店防控工作制度
- 跑外业务员工作制度
- 车辆货物装载工作制度
- 转运护理工作制度范本
- 辅导机构工资工作制度
- 输血科质控工作制度
- 运动会各部门工作制度
- 远程快递安全工作制度
- 通报老干部工作制度
- 道路交通调解工作制度
- 2026广东东莞市塘厦镇招聘专职网格员7人考试参考试题及答案解析
- 幼儿园年检自查报告
- 国家层面“十五五”产业规划与布局:产业研究专题系列报告之一规划篇
- 血液透析中心静脉导管临床实践指南
- 水利监理教育培训制度
- 机场鸟击防范生态调研报告
- 沥青混凝土销售培训课件
- 2026年《必背60题》京东TET管培生综合方向高频面试题包含详细解答
- 2026年二级建造师之二建建筑工程实务考试题库500道附完整答案(必刷)
- 儿童节气诗歌朗诵方案设计
- 2025年10月自考15040习概论试题及答案
评论
0/150
提交评论