2025年人工智能与机器学习课程考试卷及答案

上传人：1*** IP属地：四川上传时间：2026-06-29 格式：DOCX 页数：17 大小：27.58KB 积分：12 举报 版权申诉

已阅读5页，还剩12页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2025年人工智能与机器学习课程考试卷及答案一、单项选择题（每题2分，共20分）1.在监督学习中，若目标变量为连续型数值，且数据存在显著异方差性（方差随特征值增大而增大），最适合选择的损失函数是（）。A.均方误差（MSE）B.平均绝对误差（MAE）C.均方对数误差（MSLE）D.分位数损失（QuantileLoss）2.以下关于过拟合的描述中，错误的是（）。A.增加训练数据量可缓解过拟合B.L1正则化通过惩罚权重的绝对值和抑制过拟合C.早停法（EarlyStopping）的本质是限制模型训练的迭代次数D.随机失活（Dropout）在测试阶段需要调整输出神经元的激活值3.对于卷积神经网络（CNN），当输入图像尺寸为224×224×3（H×W×C），使用5×5卷积核、步长2、padding=2，输出特征图的尺寸为（）。A.112×112×3B.112×112×N（N为卷积核数量）C.113×113×3D.113×113×N4.在自然语言处理（NLP）中，以下哪项技术最依赖“上下文信息的长距离依赖建模”？（）A.词袋模型（Bag-of-Words）B.TF-IDFC.Transformer的自注意力机制D.n-gram模型5.强化学习中，策略梯度（PolicyGradient）方法直接优化的目标是（）。A.状态值函数V(s)B.动作值函数Q(s,a)C.策略π(a|s)的期望累积奖励D.环境的转移概率P(s'|s,a)6.以下关于无监督学习的说法，正确的是（）。A.K-means的聚类结果受初始质心选择影响较小B.主成分分析（PCA）的目标是最大化数据在投影方向上的方差C.高斯混合模型（GMM）假设各簇数据服从独立的伯努利分布D.自编码器（Autoencoder）的输出层与输入层神经元数量一定相同7.在梯度下降优化中，若学习率设置过大，最可能出现的现象是（）。A.模型收敛速度变慢B.损失函数在最小值附近震荡甚至发散C.模型陷入局部极小值D.训练数据的拟合效果显著下降8.对于二分类问题，若正负样本比例为1:99（极不平衡），且模型将所有样本预测为负类，此时准确率（Accuracy）和F1-score分别为（）。A.99%，0B.99%，0.99C.1%，0D.1%，0.029.以下哪项不是Transformer模型中位置编码（PositionalEncoding）的作用？（）A.为序列中的每个位置添加绝对位置信息B.允许模型捕捉词与词之间的相对位置关系C.替代循环神经网络（RNN）的顺序处理能力D.增强模型对长序列的记忆能力10.在迁移学习中，若源域与目标域的任务相同但数据分布差异较大（如源域是自然图像，目标域是医学影像），最适合的迁移策略是（）。A.直接使用源域预训练模型的输出层参数B.冻结源域模型的底层特征提取层，微调顶层分类层C.对源域模型进行全参数微调D.仅使用源域模型的输入层参数二、填空题（每空1分，共20分）1.逻辑回归模型的决策函数形式为__________，其本质是通过__________函数将线性回归的输出映射到[0,1]区间。2.支持向量机（SVM）的核心思想是寻找__________最大的分类超平面，对于非线性可分问题，需通过__________将数据映射到高维空间。3.循环神经网络（RNN）的长期依赖问题是指模型难以捕捉__________的依赖关系，门控循环单元（GRU）通过__________和__________两个门控机制缓解该问题。4.提供对抗网络（GAN）由__________和__________两部分组成，其训练目标是最小化__________损失。5.评估分类模型时，精确率（Precision）定义为__________，召回率（Recall）定义为__________；当需要同时关注两者时，常用__________作为综合指标。6.随机森林（RandomForest）通过__________和__________两种随机化策略增强模型的泛化能力，其基学习器通常为__________。7.在深度学习中，批量归一化（BatchNormalization）的主要作用是__________，其计算时需对每个批次的__________和__________进行归一化。三、简答题（每题8分，共40分）1.简述梯度下降（GradientDescent）、随机梯度下降（SGD）和小批量梯度下降（Mini-batchGD）的区别，并分析各自的优缺点。2.解释为什么深度神经网络需要非线性激活函数，若全部使用线性激活函数会导致什么问题？3.对比K-means聚类与DBSCAN聚类的核心差异，说明DBSCAN在处理非凸形状簇和噪声数据时的优势。4.什么是注意力机制（AttentionMechanism）？请结合Query-Key-Value框架，说明自注意力（Self-Attention）的计算过程。5.列举三种常见的模型正则化方法（除L1/L2正则化外），并分别说明其抑制过拟合的原理。四、计算题（每题10分，共30分）1.某二分类任务中，真实标签为y=[1,0,1,0]，模型预测概率为p=[0.8,0.3,0.6,0.4]。计算：（1）交叉熵损失（单个样本平均）；（2）若将阈值设为0.5，计算混淆矩阵及F1-score。2.假设有一个简单神经网络：输入层2个神经元（x₁,x₂），隐藏层2个神经元（h₁,h₂），输出层1个神经元（y）。激活函数均为sigmoid，损失函数为均方误差（MSE）。已知输入x=[2,3]，隐藏层权重W¹=[[0.1,0.2],[0.3,0.4]]（W¹的第i行对应h_i的输入权重），输出层权重W²=[0.5,0.6]，真实标签t=1。计算：（1）隐藏层神经元h₁、h₂的激活值；（2）输出层的预测值y；（3）输出层权重W²的梯度∂L/∂W²（L为损失函数）。3.给定数据集：样本A（2,3）、B（4,1）、C（5,2）、D（1,4）、E（3,5），使用K-means算法（k=2），初始质心为μ₁=(2,3)（对应A）、μ₂=(4,1)（对应B）。计算第一次迭代后的质心位置（需写出样本分配和质心更新步骤）。五、综合题（每题15分，共30分）1.设计一个基于深度学习的图像分类模型（如识别猫/狗），需包含以下内容：（1）数据预处理步骤（至少3项）；（2）模型架构设计（需说明各层类型及作用）；（3）训练策略（优化器、学习率调整、正则化方法选择及理由）；（4）评估指标选择及原因。2.某电商平台希望优化商品推荐系统，当前使用协同过滤（CF）方法但效果不佳（如冷启动问题、推荐多样性不足）。请结合机器学习技术提出改进方案，要求：（1）分析协同过滤的局限性；（2）提出融合内容信息的混合推荐模型（需说明模型结构及关键模块）；（3）设计实验验证改进效果（需包括数据集划分、对比模型、评估指标）。答案一、单项选择题1.C2.C3.B4.C5.C6.B7.B8.A9.D10.B二、填空题1.y=2.间隔（Margin）；核函数（KernelFunction）3.长距离（长时间步）；更新门（UpdateGate）；重置门（ResetGate）4.提供器（Generator）；判别器（Discriminator）；对抗（Adversarial）5.真阳性/(真阳性+假阳性)；真阳性/(真阳性+假阴性)；F1-score6.样本随机采样（Bootstrap）；特征随机选择；决策树（CART）7.缓解内部协变量偏移（InternalCovariateShift）；均值；方差三、简答题1.区别：梯度下降使用全部训练数据计算梯度，随机梯度下降使用单个样本，小批量梯度下降使用部分样本（如32-256）。优点：GD梯度计算准确，收敛稳定；SGD计算效率高，易跳出局部极小；Mini-batch平衡计算效率与梯度稳定性。缺点：GD计算成本高（数据量大时）；SGD梯度波动大，收敛不平稳；Mini-batch依赖批量大小选择。2.原因：若全用线性激活函数，多层网络等价于单层线性模型（线性组合的线性组合仍是线性），无法拟合非线性关系。问题：模型表达能力受限，无法学习复杂特征，仅能处理线性可分问题。3.核心差异：K-means基于距离划分簇（假设簇为球状），需预先指定k值；DBSCAN基于密度（核心点、边界点、噪声点），自动识别簇形状和数量。优势：DBSCAN通过密度阈值（ε邻域、最小样本数MinPts）可捕捉任意形状簇，噪声点被标记为“离群点”，无需假设簇的几何形状。4.注意力机制：让模型在处理序列时动态关注关键信息。自注意力计算：（1）对输入序列提供Q（Query）、K（Key）、V（Value）矩阵（通常由输入线性变换得到）；（2）计算Q与K的点积相似度，得到注意力分数；（3）通过Softmax归一化分数，得到各位置的注意力权重；（4）权重与V加权求和，得到上下文向量。5.（1）Dropout：随机失活部分神经元，迫使模型学习冗余特征，降低对特定神经元的依赖；（2）数据增强（DataAugmentation）：通过旋转、翻转等提供新数据，增加训练集多样性，避免过拟合单一模式；（3）早停法（EarlyStopping）：在验证集损失不再下降时停止训练，防止模型过度拟合训练数据。四、计算题1.（1）交叉熵损失：单个样本损失：−[−[−[−[平均损失：(0.223（2）阈值0.5时，预测标签为[1,0,1,0]，真实标签[1,0,1,0]。混淆矩阵：真阳性（TP）=2，真阴性（TN）=2，假阳性（FP）=0，假阴性（FN）=0；F1-score=2×(TP/(TP+FP))×(TP/(TP+FN))/[(TP/(TP+FP))+(TP/(TP+FN))]=2×1×1/(1+1)=12.（1）h₁的输入：0.1×2+h₂的输入：0.3×2+（2）输出层输入：0.5×（3）损失L=0.5×(y-t)²=0.5×(0.703-1)²≈0.5×0.088≈0.044；梯度∂L/∂W²=(y-t)×y×(1-y)×[h₁,h₂]=(0.703-1)×0.703×(1-0.703)×[0.689,0.858]≈(-0.297)×0.703×0.297×[0.689,0.858]≈(-0.297×0.209)×[0.689,0.858]≈-0.062×[0.689,0.858]≈[-0.043,-0.053]3.第一次迭代：（1）计算各样本到μ₁、μ₂的欧氏距离：A到μ₁：0，到μ₂：√[(4-2)²+(1-3)²]=√8≈2.828→分配给μ₁；B到μ₁：√[(2-4)²+(3-1)²]=√8≈2.828，到μ₂：0→分配给μ₂；C到μ₁：√[(2-5)²+(3-2)²]=√10≈3.162，到μ₂：√[(4-5)²+(1-2)²]=√2≈1.414→分配给μ₂；D到μ₁：√[(2-1)²+(3-4)²]=√2≈1.414，到μ₂：√[(4-1)²+(1-4)²]=√18≈4.242→分配给μ₁；E到μ₁：√[(2-3)²+(3-5)²]=√5≈2.236，到μ₂：√[(4-3)²+(1-5)²]=√17≈4.123→分配给μ₁；（2）更新质心：μ₁簇样本：A、D、E→坐标分别为(2,3)、(1,4)、(3,5)；新μ₁=((2+1+3)/3,(3+4+5)/3)=(6/3,12/3)=(2,4)；μ₂簇样本：B、C→坐标(4,1)、(5,2)；新μ₂=((4+5)/2,(1+2)/2)=(4.5,1.5)；五、综合题1.（1）数据预处理：归一化：将像素值从[0,255]缩放到[0,1]或标准化（减均值除方差），稳定训练；数据增强：随机水平翻转、旋转（±15°）、裁剪（保持长宽比），增加样本多样性；类别平衡：若猫狗样本不平衡，使用过采样（SMOTE）或调整类别权重，避免模型偏向多数类。（2）模型架构：输入层：224×224×3（RGB图像）；卷积块：3×3卷积（64核）+ReLU+最大池化（2×2，步长2）→提取边缘、纹理等低级特征；残差块（ResBlock）：堆叠3个残差单元（1×1降维→3×3卷积→1×1升维），缓解梯度消失，学习深层特征；全局平均池化（GAP）：将特征图压缩为1×1×N，减少参数；全连接层：256神经元+Dropout（0.5）+ReLU→融合高级特征；输出层：1神经元+sigmoid→二分类概率。（3）训练策略：优化器：Adam（自适应学习率，收敛快）；学习率调整：初始学习率1e-3，使用余弦退火（CosineAnnealing），后期降低学习率以精细调整；正则化：Dropout（0.5）抑制过拟合，L2正则化（权重衰减1e-4）惩罚大权重，增强泛化。（4）评估指标：准确率（Accuracy）：整体分类正确比例，简单直观；F1-score

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2025年人工智能与机器学习课程考试卷及答案

文档简介

温馨提示

最新文档

评论

2025年人工智能与机器学习课程考试卷及答案

文档简介

温馨提示

最新文档

评论

相关文档