版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
注:不含主观题第1题多选题(2分)下列哪种方法可以用来减小过拟合?A更多的训练数据BL1正则化CL2正则化D减小模型的复杂度正确答案:ABCD第2题单选题(1分)有N个样本,一般用于训练,一般用于测试。若增大N值,则训练误差和测试误差之间的差距会如何变化?A增大B减小第3题单选题(1分)如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?A测试样本误差始终为零B测试样本误差不可能为零C以上答案都不对第4题单选题(1分)为了观察测试Y与X之间的线性关系,X是连续变量,使用下列哪种图形比较适合?A散点图B柱形图C直方图D以上都不对第5题单选题(1分)一般来说,下列哪种方法常用来预测连续独立变量?A线性回归B逻辑回顾C线性回归和逻辑回归都行D以上说法都不对第6题判断题(1分)个人健康和年龄的相关系数是-1.09。第7题多选题(2分)下面三张图展示了对同一训练样本,使用不同的模型拟合的效果(蓝色曲线)。那么,我们可以得出哪些结论?A第1个模型的训练误差大于第2个、第3个模型B最好的模型是第3个,因为它的训练误差最小C第2个模型最为“健壮”,因为它对未知样本的拟合效果最好D第3个模型发生了过拟合正确答案:ACD第8题判断题(1分)两个变量相关,它们的相关系数r可能为0。这句话是否正确?第9题单选题(1分)关于“回归(Regression)”和“相关(Correlation)”,下列说法正确的是?注意:x是自变量,y是因变量。A回归和相关在x和y之间都是互为对称的B回归和相关在x和y之间都是非对称的C回归在x和y之间是非对称的,相关在x和y之间是互为对称的D回归在x和y之间是对称的,相关在x和y之间是非对称的第10题多选题(2分)观察样本次数如何影响过拟合(多选)?注意:所有情况的参数都保持一致。A观察次数少,容易发生过拟合B观察次数少,不容易发生过拟合C观察次数多,容易发生过拟合D观察次数多,不容易发生过拟合正确答案:AD第11题判断题(1分)"监督式学习中存在过拟合,而对于非监督式学习来说,没有过拟合",这句话是否正确?第12题多选题(2分)我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于0.5,则预测为负类。那么,如果将阈值0.5提高,例如0.6,大于或等于0.6的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化?A准确率(Precision)增加或者不变B准确率(Precision)减小C召回率(Recall)减小或者不变D召回率(Recall)增大正确答案:AC第13题判断题(1分)增加模型的复杂度,总能减小训练样本误差。这句话是否正确?第14题单选题(1分)如果一个经过训练的机器学习模型在测试集上达到100%的准确率,这是否意味着该模型将在另外一个新的测试集上也能得到100%的准确率呢?A是的,因为这个模型泛化能力已经很好了,可以应用于任何数据B不行,因为还有一些模型不确定的东西,例如噪声第15题判断题(1分)如果两个变量相关,那么它们一定是线性关系吗?本章习题第1题判断题(1分)
“增加卷积核的尺寸,一定能提高卷积神经网络的性能。”这句话是否正确?第2题单选题(1分)假设在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7×7,具有零填充且步幅为1。该层的输入图片的维度是224×224×3。那么该层输出的维度是多少?A217x217x3B217x217x8C218x218x5D220x220x7第3题单选题(1分)假定你在神经网络中的隐藏层中使用**函数X。在特定神经元给定任意输入,你会得到输出-0.01。X可能是以下哪一个**函数?AReLUBtanh
CSigmoidD以上都有可能第4题单选题(1分)k-NN最近邻方法在什么情况下效果较好?A样本较多但典型性不好
B样本较少但典型性好
C样本呈团状分布
D样本呈链状分布
第5题单选题(1分)下列关于极大似然估计(MaximumLikelihoodEstimate,MLE),说法正确的是?AMLE可能并不存在BMLE总是存在C如果MLE存在,那么它的解可能不是唯一的D如果MLE存在,那么它的解一定是唯一的第6题单选题(1分)假如使用逻辑回归对样本进行分类,得到训练样本的准确率和测试样本的准确率。现在,在数据中增加一个新的特征,其它特征保持不变。然后重新训练测试。则下列说法正确的是?A训练样本准确率一定会降低B训练样本准确率一定增加或保持不变C测试样本准确率一定会降低D测试样本准确率一定增加或保持不变第7题单选题(1分)假设使用逻辑回归进行n多类别分类,使用
One-vs-rest分类法。下列说法正确的是?A对于n类别,需要训练n个模型B对于n类别,需要训练n-1个模型C对于n类别,只需要训练1个模型D以上说法都不对第8题单选题(1分)如果一个SVM模型出现欠拟合,那么下列哪种方法能解决这一问题?A增大惩罚参数C的值B减小惩罚参数C的值C减小核系数(gamma参数)第9题单选题(1分)如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型,下列哪种做法是正确的?A增加树的深度B增加学习率C减小树的深度D减少树的数量第10题多选题(2分)关于神经网络,下列说法正确的是?A增加网络层数,可能会增加测试集分类错误率B增加网络层数,一定会增加训练集分类错误率C减少网络层数,可能会减少测试集分类错误率D减少网络层数,一定会减少训练集分类错误率正确答案:AC第11题判断题(1分)在训练完SVM之后,我们可以只保留支持向量,而舍去所有非支持向量。仍然不会影响模型分类能力。这句话是否正确?第12题多选题(2分)下列哪些算法可以用来够造神经网络?AkNNB线性回归C逻辑回归正确答案:BC第13题判断题(1分)逻辑回归常用来预测连续独立变量。这句话是否正确?第14题判断题(1分)决策树学习是一种逼近离散值目标函数的方法,学习到的函数被表示为一棵决策树。这句话是否正确?第15题判断题(1分)超参数选择不当,会对模型有较大的负面影响,所以在参数调整策略方面,所有超参数都同等重要。这句话是否正确?本章习题第1题单选题(1分)K-Means算法无法聚以下哪种形状的样本?A圆形分布B螺旋分布C带状分布D凸多边形分布第2题单选题(1分)关于L1、L2正则化下列说法正确的是?AL2正则化能防止过拟合,提升模型的泛化能力,但L1做不到这点BL2正则化技术又称为LassoRegularizationCL1正则化得到的解更加稀疏DL2
正则化得到的解更加稀疏第3题单选题(1分)假设一个公司的薪资水平中位数是,排名第35,000,排名第2521,000和。如果某人的薪水是53,000。如果某人的薪水是1,那么它可以被看成是异常值(Outlier)吗?A可以B不可以C需要更多的信息才能判断D以上说法都不对第4题单选题(1分)点击率预测是一个正负样本不平衡问题(例如99%的没有点击,只有1%点击)。假如在这个非平衡的数据集上建立一个模型,得到训练样本的正确率是99%,则下列说法正确的是?A模型正确率很高,不需要优化模型了B模型正确率并不高,应该建立更好的模型C无法对模型做出好坏评价D以上说法都不对第5题判断题(1分)直观上看,我们希望“物以类聚”,即聚类的结果“簇内相似度”高,且“簇间”相似度低。第6题判断题(1分)聚类和分类的区别在于用于聚类的训练样本的类标记是未知的。第7题判断题(1分)查全率越高,意味着模型漏掉的样本越少,当假阴性的成本很高时,查全率指标有助于衡量模型的好坏。第8题判断题(1分)列表、元组和字符串都支持双向索引,有效索引的范围为[-L,L],L为列表、元组或字符串的长度。第9题判断题(1分)在各类机器学习算法中,过拟合和欠拟合都是可以彻底避免的。第10题单选题(1分)下列哪一项能反映出X和Y之间的强相关性?A相关系数为0.9B对于无效假设β=0的p值为0.0001C对于无效假设β=0的t值为30D以上说法都不对第11题单选题(1分)向量X=[1,2,3,4,-9,0]的L1范数为?A1B19C6D√111第12题单选题(1分)以下哪些方法不可以直接来对文本分类?AK-MeansB决策树C支持向量机DkNN第13题多选题(2分)线性回归中,我们可以使用正规方程(NormalEquation)来求解系数。下列关于正规方程说法正确的是?A不需要选择学习因子B当特征数目很多的时候,运算速度会很慢C不需要迭代训练正确答案:ABC第14题多选题(2分)如果Y是X(X1,X2,...,Xn)的线性函数:Y=β0+β1X1+β2X2+···+βnXn,则下列说法正确的是?A如果变量Xi改变一个微小变量
ΔXi,其它变量不变。那么Y会相应改变
βiΔXi。Bβi是固定的,不管Xi如何变化CXi对Y的影响是相互独立的,且X对Y的总的影响为各自分量Xi之和正确答案:ABC第15题单选题(1分)下面两张图展示了两个拟合回归线(A和B),原始数据是随机产生的。现在,我想要计算A和B各自的残差之和。注意:两种图中的坐标尺度一样。AA比B高BA比B小CA与B相同D以上说法都不对本章习题第1题单选题(1分)在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?A多项式阶数B更新权重w时,使用的是矩阵求逆还是梯度下降C使用常数项第2题单选题(1分)在一个线性回归问题中,我们使用R平方(R-Squared)来判断拟合度。此时,如果增加一个特征,模型不变,则下面说法正确的是?A如果R-Squared增加,则这个特征有意义B如果R-Squared减小,则这个特征没有意义C仅看R-Squared单一变量,无法确定这个特征是否有意义。D以上说法都不对第3题单选题(1分)下列关于线性回归分析中的残差(Residuals)说法正确的是?A残差均值总是为零B残差均值总是小于零C残差均值总是大于零D以上说法都不对第4题多选题(2分)下列哪些假设是我们推导线性回归参数时遵循的?AX与Y有线性关系(多项式关系)B模型误差在统计学上是独立的C误差一般服从0均值和固定标准差的正态分布DX是非随机且测量没有误差的正确答案:ABCD第5题单选题(1分)假如你在训练一个线性回归模型,有下面两句话:1.如果数据量较少,容易发生过拟合。2.如果假设空间较小,容易发生过拟合。关于这两句话,下列说法正确的是?A1和2都错误B1正确,2错误C1错误,2正确D1和2都正确第6题单选题(1分)构建一个最简单的线性回归模型需要几个系数(只有一个特征)?A1个B2个C3个D4个第7题单选题(1分)在一个简单的线性回归模型中(只有一个变量),如果将输入变量改变一个单位(增加或减少),那么输出将改变多少?A一个单位B不变C截距D回归模型的尺度因子第8题单选题(1分)如果使用线性回归模型,下列说法正确的是?A检查异常值是很重要的,因为线性回归对离群效应很敏感B线性回归分析要求所有变量特征都必须具有正态分布C线性回归假设数据中基本没有多重共线性D以上说法都不对第9题判断题(1分)回归中利用最小二乘法主要通过最小化误差的平方来寻找一个数据匹配的最佳函数。第10题判断题(1分)k近邻算法的核心是k值和距离度量的选取。第11题判断题(1分)假如现在有个神经网络,**函数是ReLU,若使用线性**函数代替ReLU,该神经网络可以表征XNOR函数。第12题判断题(1分)如果使用线性回归模型,线性回归分析要求所有变量特征都必须具有正态分布。第13题判断题(1分)增加树的深度时,使用决策树法训练大量数据集能够节约时间。第14题单选题(1分)如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?A测试样本误差始终为零B测试样本误差不可能为零C以上答案都不对第15题单选题(1分)下列关于异方差(Heteroskedasticity)说法正确的是?A线性回归具有不同的误差项B线性回归具有相同的误差项C线性回归误差项为零D以上说法都不对本章习题第1题单选题(1分)下列说法错误的是?A当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解B进行PCA降维时,需要计算协方差矩阵C沿负梯度的方向一定是最优的方向D利用拉格朗日函数能解带约束的优化问题第2题多选题(2分)下列方法中,可以用于特征降维的方法包括?A主成分分析PCA
B线性判别分析LDA
CAutoEncoder
D矩阵奇异值分解SVD
正确答案:ABCD第3题判断题(1分)
“对于PCA处理后的特征,其朴素贝叶斯特征相互独立的假设一定成立,因为所有主成分都是正交的,所以不相关”。这句话是否正确?第4题多选题(2分)下列关于PCA说法正确的是?A在使用PCA之前,我们必须标准化数据B应该选择具有最大方差的主成分C应该选择具有最小方差的主成分D可以使用PCA在低维空间中可视化数据正确答案:ABD第5题单选题(1分)下列哪些不特别适合用来对高维数据进行降维?A主成分分析法B聚类分析C小波分析法D线性判别法第6题判断题(1分)判断:PCA可用于在较小维度上投影和可视化数据。第7题判断题(1分)判断:降维算法是减少构建模型所需计算时间的方法之一。第8题判断题(1分)判断:PCA属于确定性算法。第9题判断题(1分)梯度下降,就是沿着函数的梯度(导数)方向更新自变量,使得函数的取值越来越小,直至达到全局最小或者局部最小。第10题单选题(1分)下列哪一种偏移,是我们在最小二乘直线拟合的情况下使用的?图中横坐标是输入X,纵坐标是输出Y。A垂直偏移(verticaloffsets)B垂向偏移(perpendicularoffsets)C两种偏移都可以D以上说法都不对第11题多选题(2分)假如我们利用Y是X的3阶多项式产生一些数据(3阶多项式能很好地拟合数据)。那么,下列说法正确的是?A简单的线性回归容易造成高偏差(bias)、低方差(variance)B简单的线性回归容易造成低偏差(bias)、高方差(variance)C3阶多项式拟合会造成低偏差(bias)、高方差(variance)D3阶多项式拟合具备低偏差(bias)、低方差(variance)正确答案:AD第12题单选题(1分)假如我们使用Lasso回归来拟合数据集,该数据集输入特征有100个(X1,X2,...,X100)。现在,我们把其中一个特征值扩大10倍(例如是特征X1),然后用相同的正则化参数对Lasso回归进行修正。A特征X1很可能被排除在模型之外B特征X1很可能还包含在模型之中C无法确定特征X1是否被舍弃D以上说法都不对第13题单选题(1分)关于特征选择,下列对Ridge回归和Lasso回归说法正确的是?ARidge回归适用于特征选择BLasso回归适用于特征选择C两个都适用于特征选择D以上说法都不对第14题多选题(2分)如果在线性回归模型中增加一个特征变量,下列可能发生的是?AR-squared增大,AdjustR-squared增大BR-squared增大,AdjustR-squared减小CR-squared减小,AdjustR-squared减小DR-squared减小,AdjustR-squared增大正确答案:AB第15题多选题(2分)下列哪些指标可以用来评估线性回归模型?AR-SquaredBAdjustedR-SquaredCFStatisticsDRMSE/MSE/MAE正确答案:ABCD本章习题第1题单选题(1分)评估完模型之后,发现模型存在高偏差(highbias),应该如何解决?A减少模型的特征数量B增加模型的特征数量C增加样本数量D以上说法都正确第2题多选题(2分)我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型?A对训练集随机采样,在随机采样的数据上建立模型B尝试使用在线机器学习算法C使用PCA算法减少特征维度正确答案:ABC第3题单选题(1分)SVM中的核技巧(Kernaltrick)的作用包括以下哪项?A特征升维B特征降维C防止过拟合第4题单选题(1分)关于Logistic回归和SVM不正确的是()。ALogistic回归目标函数是最小化后验概率BLogistic回归可以用于预测事件发生概率的大小CSVM目标是结构风险最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川成都市简阳市禾丰镇便民服务和智慧蓉城运行中心招聘综治巡防队员5人备考题库带答案详解(培优)
- 2026年甘肃省兰州市城关区文璟学校春季学期教师招聘备考题库及1套参考答案详解
- 2026四川内江市威远隆创实业有限公司招聘高铁辅助员1人备考题库带答案详解(模拟题)
- 2026广东广州番禺区南村镇红郡幼儿园招聘4人备考题库含答案详解(b卷)
- 2026中国农业大学人才招聘备考题库附答案详解(a卷)
- 2026北京首都体育学院人才引进10人备考题库(第一批)附答案详解(培优b卷)
- 2026四川乐山市犍为县第一批就业见习岗位及招募见习人员58人备考题库带答案详解(精练)
- 2026上海市盲童学校招聘9人备考题库含答案详解(满分必刷)
- 2026上半年贵州事业单位联考贵州财经大学招聘4人备考题库附答案详解(培优a卷)
- 2025年广东农工商职业技术学院马克思主义基本原理概论期末考试模拟题含答案解析(夺冠)
- 燃气锅炉房应急预案
- 2026年高考政治一轮复习:统编版必修4《哲学与文化》知识点考点提纲
- 乡镇医院器械管理办法
- 吟诵课件教学课件
- 物料编码规则培训
- 2025-2030中国视频压缩编码芯片行业运营格局及投资趋势预测报告
- 关节脱位院前急救
- 2025年中国家用智能扩香器行业市场全景分析及前景机遇研判报告
- 高中数学北师大版讲义(必修二)第01讲1.1周期变化7种常见考法归类(学生版+解析)
- 审计人员述职报告
- 汽轮机ETS保护传动试验操作指导书
评论
0/150
提交评论