版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年人工智能基础课程考试卷及答案一、单项选择题(每题2分,共20分)1.以下哪项属于监督学习任务?A.客户分群(聚类)B.房价预测(回归)C.异常检测D.主成分分析(降维)2.关于ReLU激活函数,以下描述错误的是?A.缓解梯度消失问题B.在输入为负时输出0C.计算复杂度低D.输出范围为(-∞,+∞)3.自然语言处理(NLP)中,Word2Vec的核心目标是?A.生成语法正确的句子B.将词语映射到低维连续向量空间C.识别文本中的实体名称D.计算两个句子的相似度4.在决策树算法中,信息增益的计算基于以下哪个指标?A.基尼系数(GiniImpurity)B.交叉熵损失C.信息熵(Entropy)D.均方误差(MSE)5.强化学习(RL)中,“奖励(Reward)”的主要作用是?A.定义智能体的策略(Policy)B.指导智能体学习最优行为C.存储历史状态-动作对D.计算状态价值函数6.以下哪种技术是Transformer模型的核心机制?A.循环神经网络(RNN)B.注意力机制(Attention)C.卷积操作(Convolution)D.批量归一化(BatchNorm)7.过拟合(Overfitting)的典型表现是?A.训练集和测试集误差均很高B.训练集误差低,测试集误差高C.训练集误差高,测试集误差低D.训练集和测试集误差均很低8.计算机视觉(CV)中,FasterR-CNN的主要改进是?A.引入区域提议网络(RPN)B.使用更深的卷积层C.采用多尺度特征融合D.优化非极大值抑制(NMS)9.以下哪项不属于机器学习的三要素?A.模型(Model)B.数据(Data)C.策略(Strategy)D.算法(Algorithm)10.在生成对抗网络(GAN)中,生成器(Generator)的目标是?A.区分真实数据和生成数据B.最小化真实数据与生成数据的差异C.最大化判别器(Discriminator)的错误率D.学习数据的真实分布二、填空题(每题2分,共20分)1.机器学习中,将数据划分为训练集、验证集和测试集的主要目的是__________。2.神经网络中,反向传播(Backpropagation)的核心是通过__________计算梯度。3.Transformer模型中的“自注意力(Self-Attention)”机制允许模型在处理序列时__________。4.支持向量机(SVM)的最优超平面是使__________最大的分隔面。5.卷积神经网络(CNN)中,池化层(Pooling)的主要作用是__________。6.自然语言处理中的“词袋模型(Bag-of-Words)”忽略了词语的__________信息。7.强化学习中的“马尔可夫决策过程(MDP)”由状态、动作、转移概率、奖励和__________组成。8.欠拟合(Underfitting)通常通过__________模型复杂度(如增加层数或特征)来缓解。9.决策树剪枝的目的是__________,避免过拟合。10.生成式模型(如VAE)与判别式模型的根本区别在于前者__________。三、简答题(每题8分,共40分)1.请比较支持向量机(SVM)与逻辑回归(LogisticRegression)的异同。2.解释注意力机制(Attention)如何解决循环神经网络(RNN)在长序列任务中的“长距离依赖”问题。3.随机梯度下降(SGD)与批量梯度下降(BatchGD)各有什么优缺点?4.什么是迁移学习(TransferLearning)?请举例说明其典型应用场景。5.人工智能伦理中,“算法公平性”需要关注哪些核心问题?四、计算题(每题10分,共20分)1.假设某二分类任务中,真实标签为[1,0,1,1,0],模型预测概率为[0.8,0.3,0.6,0.4,0.7](阈值为0.5时,概率≥0.5预测为1,否则为0)。计算该模型的准确率(Accuracy)、精确率(Precision)和召回率(Recall)。2.一个全连接神经网络输入层有3个神经元,隐藏层有4个神经元,输出层有2个神经元。假设输入向量为[2,-1,3],隐藏层权重矩阵为3×4(元素为0.1,-0.2,0.3,0.4;0.5,0.6,-0.7,0.8;-0.9,1.0,1.1,-1.2],偏置为[0.1,-0.1,0.2,-0.2]。计算隐藏层的输出(激活函数使用ReLU)。五、综合题(20分)假设你需要设计一个基于深度学习的图像分类模型,用于识别宠物狗的品种(如金毛、柯基、哈士奇等)。请回答以下问题:(1)简述模型的整体架构(需包含输入层、特征提取层、分类层的设计);(2)说明数据预处理的关键步骤(如数据增强、标准化等);(3)列举至少3个评估模型性能的指标,并解释其含义;(4)若模型在训练集上准确率很高(98%),但测试集准确率较低(75%),可能的原因是什么?如何解决?答案一、单项选择题1.B2.D3.B4.C5.B6.B7.B8.A9.B10.D二、填空题1.评估模型的泛化能力2.链式法则(反向传播误差)3.动态关注序列中不同位置的信息4.正负样本到超平面的间隔(Margin)5.降低特征维度,增强平移不变性6.顺序(或上下文/位置)7.折扣因子(γ)8.增加9.减少决策树的复杂度10.学习数据的联合概率分布(P(X,Y)),而判别式模型学习条件概率分布(P(Y|X))三、简答题1.相同点:均为监督学习中的分类模型;目标均为找到一个分隔超平面;可通过正则化防止过拟合。不同点:-SVM基于最大间隔优化,关注边界样本(支持向量);逻辑回归基于似然函数最大化,关注所有样本的概率拟合。-SVM输出类别标签(硬分类),逻辑回归输出概率(软分类)。-SVM通过核函数处理非线性问题,逻辑回归需手动构造非线性特征。2.RNN在处理长序列时,梯度会随着时间步长的增加而消失(梯度消失),导致模型无法捕捉远距离的依赖关系。注意力机制通过计算序列中每个位置与其他位置的相关性(注意力权重),直接建立任意两个位置的联系,避免了信息传递的路径长度限制。例如,在翻译“我来自中国,那里的首都是北京”时,“北京”可直接关联到“中国”,无需通过中间所有词传递信息。3.随机梯度下降(SGD):-优点:每次仅用1个样本更新参数,计算速度快;引入随机性,可能跳出局部最优。-缺点:参数更新波动大,收敛不稳定;可能错过全局最优。批量梯度下降(BatchGD):-优点:利用全部样本计算梯度,方向更准确,收敛稳定;适用于小数据集。-缺点:计算复杂度高(O(n)),内存需求大;对大规模数据不友好。4.迁移学习是指将从一个任务(源领域)学习到的知识迁移到另一个相关任务(目标领域),解决目标领域数据不足的问题。应用场景:-医疗影像诊断:用大量自然图像预训练的CNN模型(如ResNet)迁移到肺部CT图像分类(目标领域数据少)。-低资源语言翻译:利用英语-法语翻译模型的知识,迁移到英语-斯瓦希里语翻译(斯瓦希里语数据少)。5.算法公平性需关注:-群体公平:模型对不同性别、种族等群体的错误率是否均衡(如招聘算法不应对某一群体歧视)。-个体公平:相似个体是否被模型相似对待(如同信用水平的用户获得相似的贷款额度)。-数据偏见:训练数据是否包含历史歧视(如犯罪预测数据中某种族被过度标记)。-可解释性:模型决策是否可追溯,避免“黑箱”导致的不公平。四、计算题1.步骤:-预测标签(阈值0.5):[1,0,1,0,0](原预测概率:0.8≥0.5→1;0.3<0.5→0;0.6≥0.5→1;0.4<0.5→0;0.7≥0.5→0?不,0.7≥0.5应为1?原预测概率第五个是0.7,所以预测标签应为[1,0,1,0,1]。修正后:真实标签:[1,0,1,1,0]预测标签:[1,0,1,0,1]-混淆矩阵:TP(真正例)=真实1且预测1→样本1(1,1)、样本3(1,1)→TP=2FN(假负例)=真实1且预测0→样本4(1,0)→FN=1FP(假正例)=真实0且预测1→样本5(0,1)→FP=1TN(真负例)=真实0且预测0→样本2(0,0)→TN=1-准确率=(TP+TN)/(TP+TN+FP+FN)=(2+1)/(2+1+1+1)=3/5=60%精确率=TP/(TP+FP)=2/(2+1)=66.67%召回率=TP/(TP+FN)=2/(2+1)=66.67%(注:原预测概率第五个为0.7,预测标签应为1,因此修正后计算结果如上。)2.计算隐藏层输入:输入向量X=[2,-1,3]权重矩阵W(3×4):第一行:0.1,-0.2,0.3,0.4第二行:0.5,0.6,-0.7,0.8第三行:-0.9,1.0,1.1,-1.2偏置b=[0.1,-0.1,0.2,-0.2]隐藏层输入Z=X·W+b(矩阵乘法):Z₁=2×0.1+(-1)×0.5+3×(-0.9)+0.1=0.2-0.5-2.7+0.1=-2.9Z₂=2×(-0.2)+(-1)×0.6+3×1.0+(-0.1)=-0.4-0.6+3.0-0.1=1.9Z₃=2×0.3+(-1)×(-0.7)+3×1.1+0.2=0.6+0.7+3.3+0.2=4.8Z₄=2×0.4+(-1)×0.8+3×(-1.2)+(-0.2)=0.8-0.8-3.6-0.2=-3.8ReLU激活后输出:a₁=max(0,-2.9)=0a₂=max(0,1.9)=1.9a₃=max(0,4.8)=4.8a₄=max(0,-3.8)=0因此,隐藏层输出为[0,1.9,4.8,0]五、综合题(1)模型架构:-输入层:接收224×224×3的彩色图像(标准化为0-1或归一化到均值0、方差1)。-特征提取层:采用ResNet-50作为骨干网络(预训练于ImageNet),通过卷积层(Conv2D)、批量归一化(BatchNorm)、残差块(ResidualBlock)提取多尺度特征(如C3、C4、C5层)。-分类层:对提取的全局特征(通过全局平均池化GAP)连接全连接层(FC),最后接Softmax激活函数输出10类(假设目标为10种狗品种)的概率分布。(2)数据预处理:-数据增强:训练集使用随机翻转(水平/垂直)、旋转(±15°)、缩放(0.8-1.2倍)、亮度/对比度调整(±20%),提升模型泛化能力。-标准化:所有图像缩放至224×224,像素值除以255(归一化到0-1),或使用ImageNet的均值[0.485,0.456,0.406]和标准差[0.229,0.224,0.225]进行Z-score标准化。-类别平衡:若某品种样本过少,通过过采样(复制少数类样本)或合成样本(如GAN生成)平衡类别分布。(3)评估指标:-准确率(Accuracy):正确分类的样本数占总样本数的比例(整体性能)。-精确率(Precision):某品种被正确预测的比例(关注误报率)。-F1分数(F1-score):精确率与召回率的调和平均(平衡两者的综合指标)。-mAP(平均精度均值):多类别任务中各品种精确率的平均值(适用于更细粒度评估)。(4)可能原因及解决:-原因:过拟合(模型记住了训练集的噪声或特
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年苏州百年职业学院中单招职业技能考试题库及答案详解一套
- 2026年安徽中医药高等专科学校单招职业适应性测试题库及参考答案详解一套
- 2026年南阳科技职业学院单招职业倾向性测试题库带答案详解
- 2026年广西国际商务职业技术学院单招职业技能测试题库带答案详解
- 2026年湖南水利水电职业技术学院单招职业技能测试题库带答案详解
- 2026年青岛职业技术学院单招职业倾向性测试题库参考答案详解
- 2026年嘉兴职业技术学院单招职业技能考试题库及答案详解1套
- 2026年山西省运城市单招职业适应性考试题库及参考答案详解一套
- 2026年青岛远洋船员职业学院单招职业倾向性测试题库带答案详解
- 2026年闽江师范高等专科学校单招职业技能考试题库参考答案详解
- 心搏骤停护理常规
- 如何培养孩子深度专注
- 2024年餐饮店长年度工作总结
- 护理8S管理汇报
- 产前筛查标本采集与管理制度
- 2025劳动合同书(上海市人力资源和社会保障局监制)
- 门诊护士长工作总结汇报
- 药膳餐厅创新创业计划书
- erp沙盘模拟实训报告采购总监
- 污水消毒知识培训课件
- 横纹肌溶解症的护理
评论
0/150
提交评论