版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年人工智能与机器学习基础考试题及答案一、单项选择题(每题2分,共20分)1.以下哪项属于监督学习任务?A.客户分群(聚类)B.图像风格迁移(无监督)C.垃圾邮件分类(有标签)D.异常检测(无监督)答案:C2.逻辑回归模型中,常用的损失函数是?A.均方误差(MSE)B.交叉熵损失(CrossEntropy)C.hingeloss(支持向量机)D.绝对误差(MAE)答案:B3.神经网络中,ReLU激活函数的表达式是?A.\(f(x)=\frac{1}{1+e^{x}}\)(Sigmoid)B.\(f(x)=\max(0,x)\)C.\(f(x)=\tanh(x)\)(双曲正切)D.\(f(x)=x\)(线性)答案:B4.为防止过拟合,以下哪种方法不属于正则化?A.增加训练数据量(数据增强)B.L2正则化(权重衰减)C.早停法(EarlyStopping)D.随机失活(Dropout)答案:A(数据增强是缓解过拟合的方法,但不属于正则化技术)5.梯度下降优化过程中,“鞍点”指的是?A.损失函数的全局最小值点B.损失函数的局部最小值点C.梯度为零但非极值的点(导数为零但非最小/最大)D.梯度爆炸的临界点答案:C6.以下哪种优化器结合了动量(Momentum)和自适应学习率(AdaptiveLearningRate)?A.SGD(仅动量可选)B.Adagrad(自适应学习率)C.Adam(动量+自适应)D.RMSprop(自适应)答案:C7.卷积神经网络(CNN)中,池化层的主要作用是?A.增加特征图的深度(卷积层)B.减少空间维度(降维,平移不变性)C.引入非线性(激活函数)D.防止梯度消失(残差连接)答案:B8.特征工程中,对“用户年龄”(连续型变量)进行分箱(Binning)处理的主要目的是?A.增加特征维度(可能减少)B.捕捉非线性关系(离散化后可捕捉分段关系)C.消除量纲影响(标准化)D.提高计算效率(可能降低)答案:B9.评估分类模型性能时,若关注“在预测为正类的样本中,实际为正类的比例”,应选择以下哪个指标?A.准确率(Accuracy)B.召回率(Recall,TP/(TP+FN))C.精确率(Precision,TP/(TP+FP))D.F1分数(调和平均)答案:C10.自然语言处理(NLP)中,词嵌入(WordEmbedding)的核心目标是?A.将文本转换为等长向量(词袋模型)B.捕捉词语的语义相关性(低维连续向量)C.去除停用词(预处理)D.实现文本分类(下游任务)答案:B二、填空题(每空2分,共20分)1.决策树中,ID3算法使用__________作为划分准则,C4.5算法使用__________。(信息增益;信息增益比)2.梯度下降的数学更新公式为:\(\theta_{t+1}=\theta_t\eta\cdot\nabla_{\theta}L(\theta_t)\),其中\(\eta\)表示__________。(学习率)3.交叉熵损失函数对二分类任务的表达式为:\(L=\frac{1}{N}\sum_{i=1}^N[y_i\log\hat{y}_i+(1y_i)\log(1\hat{y}_i)]\),其中\(y_i\)是__________,\(\hat{y}_i\)是__________。(真实标签;预测概率)4.L2正则化通过在损失函数中添加__________项来限制模型复杂度,数学形式为__________。(权重平方和;\(\frac{\lambda}{2}\|\theta\|^2_2\))5.循环神经网络(RNN)的隐藏状态更新公式为:\(h_t=\tanh(W_{hh}h_{t1}+W_{xh}x_t+b_h)\),其中\(W_{hh}\)表示__________。(隐藏层到隐藏层的权重矩阵)三、简答题(每题6分,共30分)1.简述监督学习与无监督学习的核心区别,并各举一例。答案:监督学习使用带标签的训练数据(输入x与目标y),目标是学习输入到输出的映射(如房价预测,标签为实际价格);无监督学习使用无标签数据,目标是发现数据内在结构(如客户分群,无预先定义的分组标签)。2.解释过拟合的定义、常见原因及至少两种解决方法。答案:过拟合指模型在训练集上表现很好,但在新数据(测试集)上泛化能力差。原因包括模型复杂度过高(参数过多)、训练数据量不足、噪声干扰。解决方法:正则化(L1/L2、Dropout)、增加数据量(数据增强)、早停法(提前终止训练)、简化模型(减少层数/神经元)。3.比较梯度下降(GD)与随机梯度下降(SGD)的优缺点。答案:GD使用全部训练数据计算梯度,更新稳定但计算成本高(尤其大数据集);SGD每次仅用一个样本计算梯度,更新速度快但噪声大(可能震荡)。折中的是小批量梯度下降(MinibatchGD),兼顾效率与稳定性。4.说明激活函数ReLU(RectifiedLinearUnit)的优缺点。答案:优点:计算简单(仅取max(0,x))、避免梯度消失(x>0时梯度为1)、加速训练;缺点:x<0时梯度为0(“死亡ReLU”问题,神经元无法更新)、输出均值不为0(可能影响后续层训练)。5.描述支持向量机(SVM)中核函数的作用,并列举两种常用核函数。答案:核函数将低维线性不可分数据映射到高维空间,使其线性可分。常用核函数:线性核(\(K(x,z)=x^Tz\))、多项式核(\(K(x,z)=(x^Tz+c)^d\))、径向基核(RBF,\(K(x,z)=\exp(\gamma\|xz\|^2)\))。四、计算题(每题8分,共24分)1.给定线性回归模型\(\hat{y}=w_0+w_1x\),训练数据为\((x_1=1,y_1=3)\)、\((x_2=2,y_2=5)\)、\((x_3=3,y_3=7)\),初始参数\(w_0=0,w_1=0\),学习率\(\eta=0.1\)。使用均方误差(MSE)损失,计算第一次梯度下降更新后的\(w_0\)和\(w_1\)。解:MSE损失函数:\(L=\frac{1}{3}\sum_{i=1}^3(y_i\hat{y}_i)^2=\frac{1}{3}\sum_{i=1}^3(y_iw_0w_1x_i)^2\)梯度计算:\(\frac{\partialL}{\partialw_0}=\frac{2}{3}\sum_{i=1}^3(w_0+w_1x_iy_i)\)\(\frac{\partialL}{\partialw_1}=\frac{2}{3}\sum_{i=1}^3(w_0+w_1x_iy_i)x_i\)初始参数\(w_0=0,w_1=0\),代入数据:\(\frac{\partialL}{\partialw_0}=\frac{2}{3}[(0+03)+(0+05)+(0+07)]=\frac{2}{3}(15)=10\)\(\frac{\partialL}{\partialw_1}=\frac{2}{3}[(0+03)1+(0+05)2+(0+07)3]=\frac{2}{3}(31021)=\frac{2}{3}(34)\approx22.67\)更新参数:\(w_0^{new}=00.1(10)=1\)\(w_1^{new}=00.1(22.67)\approx2.27\)答案:\(w_0=1\),\(w_1≈2.27\)2.逻辑回归模型中,输入特征\(x=[2,1]\),权重\(w=[1,2]\),偏置\(b=0.5\)。计算该样本属于正类(y=1)的概率。解:线性组合:\(z=w^Tx+b=12+2(1)+0.5=22+0.5=0.5\)Sigmoid函数:\(\sigma(z)=\frac{1}{1+e^{z}}=\frac{1}{1+e^{0.5}}\approx0.622\)答案:约62.2%3.给定数据集如下,计算特征“天气”(取值:晴、雨)对目标“是否出行”(是、否)的信息增益(InformationGain)。|天气|是否出行|||||晴|是||晴|是||雨|否||雨|否||晴|是||雨|否|解:总样本数N=6,其中“是”的样本数=3,“否”=3。原始熵:\(H(D)=\frac{3}{6}\log_2\frac{3}{6}\frac{3}{6}\log_2\frac{3}{6}=0.5(1)0.5(1)=1\)按“天气”划分:晴的样本数=3(全部“是”):熵\(H(D_1)=\frac{3}{3}\log_2\frac{3}{3}0=0\)雨的样本数=3(全部“否”):熵\(H(D_2)=0\frac{3}{3}\log_2\frac{3}{3}=0\)条件熵:\(H(D|天气)=\frac{3}{6}H(D_1)+\frac{3}{6}H(D_2)=0.50+0.50=0\)信息增益:\(IG=H(D)H(D|天气)=10=1\)答案:1五、综合题(共26分)1.(10分)设计一个基于机器学习的房价预测系统,要求描述完整流程(包括数据预处理、特征工程、模型选择、训练与评估)。答案:(1)数据收集:获取包含房屋特征(面积、房间数、楼层、周边设施等)和对应售价的历史数据。(2)数据预处理:缺失值处理:对少量缺失值用均值/中位数填充,大量缺失的特征直接删除。异常值检测:通过箱线图或Zscore识别并修正/剔除异常样本(如“面积=10㎡但售价=1000万”)。数据划分:按7:2:1比例划分为训练集、验证集、测试集。(3)特征工程:连续特征:对“面积”进行标准化(Zscore)消除量纲;对“房龄”进行分箱(如05年、510年)捕捉非线性关系。类别特征:对“学区”进行独热编码(OneHotEncoding);对“装修程度”(高/中/低)进行有序编码(OrdinalEncoding)。特征组合:构造“面积×楼层”“房间数/面积”等交叉特征,反映空间利用率。(4)模型选择与训练:基线模型:线性回归(简单快速,作为基准)。复杂模型:梯度提升树(XGBoost/LightGBM,擅长处理结构化数据)、神经网络(MLP,捕捉高阶非线性关系)。超参数调优:使用网格搜索或随机搜索,在验证集上优化学习率、树的深度(XGBoost)或隐藏层大小(神经网络)。(5)评估与优化:评估指标:均方根误差(RMSE)、平均绝对误差(MAE)。模型优化:分析特征重要性(如XGBoost的FeatureImportance),删除冗余特征;尝试集成学习(如Stacking,结合线性回归和XGBoost的预测结果)。2.(16分)假设你正在训练一个深度神经网络,训练过程中出现以下现象:训练损失持续下降,但验证损失先下降后上升。分析可能原因,并提出至少四种调优策略。答案:现象分析:训练损失下降说明模型在拟合训练数据,但验证损失上升表明模型出现了过拟合(模型在训练集上过度学习噪声或细节,无法泛化到新数据)。调优策略:(1)正则化:添加L2正则化(权重衰减),在损失函数中加入\(\lambda\|\theta\|^2_2\),限制权重大小,防止模型过于复杂。应用Dropout层(如在隐藏层设置50%的丢弃率),随机失活部分神经元,强制模型学习鲁棒特征。(2)数据增强:若为图像数据,通过旋转、翻转、缩放等操作增加训练数据多样性;若为文本数据,进行同义词替换、回译等扰动,缓解数据不足导致的过拟合。(3)早停法(EarlyStopping):在训练过程中监控验证损失,当验证损失连续N轮(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年市政安全培训试题及答案
- 手工雕塑行业深度研究报告
- 三菱上悬挂胶套行业深度研究报告
- 2026年农业设备项目深度研究分析报告
- 2026年中国防水卷材布行业市场前景预测及投资价值评估分析报告
- 系统高可用性设计与实现方案
- 玉柴安特优发动机喷漆线项目环境影响报告表
- 建筑垃圾消纳场绿色施工与低碳排放技术方案
- 以物抵债的合同范本
- 临时股权转让协议书
- 2025年文学常识高考真题及答案
- 双方办厂合作协议合同
- 2025至2030全球及中国花生行业项目调研及市场前景预测评估报告
- 2025年教师职称考试(语文)复习题及答案(小学)(吕梁)
- 小学消防安全课件演示
- 万达装修施工方案设计
- 2026年南宁市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(培优a卷)
- 2025年英语专业专升本模拟试卷真题(含答案)
- 2025年10月18日湖北省直遴选笔试真题及解析(市直卷)
- 2025年江苏(统招专升本)英语考试试题及答案
- 语言经济效应评估模型-洞察与解读
评论
0/150
提交评论