2026年自考02355人工智能导论试题及答案

上传人：1*** IP属地：四川上传时间：2026-04-01 格式：DOCX 页数：14 大小：36.54KB 积分：12 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2026年自考02355人工智能导论试题及答案一、单项选择题（每小题2分，共30分）1.1956年达特茅斯会议首次提出“人工智能”这一术语，下列哪位学者未被列入会议发起人名单？A.JohnMcCarthy B.MarvinMinsky C.AllenNewell D.GeoffreyHinton答案：D解析：GeoffreyHinton生于1947年，1956年尚未进入学术界。2.在搜索算法中，若启发函数h(n)满足h(n)≤h(n)（h为真实代价），则称该启发函数具有2.在搜索算法中，若启发函数h(n)满足h(n)≤h(n)（h为真实代价），则称该启发函数具有A.可采纳性 B.一致性 C.单调性 D.完备性答案：A3.下列哪种知识表示方法最擅长刻画“类-子类”的层次关系？A.语义网络 B.产生式系统 C.一阶谓词逻辑 D.框架表示答案：A4.在卷积神经网络中，若输入特征图为32×32×64，采用128个5×5卷积核，步长为1，same填充，则输出特征图的深度为A.32 B.64 C.128 D.5答案：C5.强化学习中，Q-learning的更新公式不包含下列哪一项？A.学习率α B.折扣因子γ C.即时奖励r D.策略函数π(a|s)答案：D6.若某决策树采用信息增益作为划分标准，则其本质上是基于A.Gini系数 B.熵的减少量 C.方差减少量 D.误分类率答案：B7.在遗传算法中，若交叉概率Pc=0.9，变异概率Pm=0.01，则下列说法正确的是A.每代必有90%个体发生交叉 B.每代必有1%基因位点被变异C.交叉与变异操作互不相关 D.适应度函数值必随代数单调递增答案：C8.下列关于AlphaGoZero的描述，错误的是A.完全摒弃人类棋谱 B.使用蒙特卡洛树搜索C.采用残差网络作为骨干 D.价值网络与策略网络分离训练答案：D解析：AlphaGoZero使用共享权重的双头网络，同时输出策略与价值。9.在自然语言处理中，Word2Vec的Skip-gram模型目标函数为A.最大化中心词预测上下文概率 B.最小化交叉熵C.最大化句子似然 D.最小化负采样对比损失答案：A10.若某支持向量机采用RBF核，其决策边界在原始空间中的几何形状通常为A.超平面 B.超球面 C.非线性曲面 D.分段线性答案：C11.下列哪项技术最常用于缓解深度网络的梯度消失问题？A.L2正则化 B.Dropout C.批归一化 D.早停答案：C12.在命题逻辑中，公式(P∨Q)∧¬P⇒Q是A.重言式 B.可满足式 C.矛盾式 D.无效式答案：A13.若某贝叶斯网络节点X的父节点集合为{Y,Z}，则其条件概率表规模与下列哪项成正比？A.|Y|+|Z| B.|X|·|Y|·|Z| C.|X|^{|Y|·|Z|} D.|X|·|Y|·|Z|答案：B14.在机器人路径规划中，A算法与Dijkstra算法相比，主要优势是14.在机器人路径规划中，A算法与Dijkstra算法相比，主要优势是A.时间复杂度更低 B.空间开销更小 C.利用启发信息减少扩展节点 D.保证找到最优解答案：C15.若某深度强化学习智能体在Atari游戏中出现“Q值过度估计”现象，可优先尝试A.提高学习率 B.采用DoubleDQN C.增大回放容量 D.降低折扣因子答案：B二、填空题（每空2分，共20分）16.在CNN中，若采用步长为2的3×3最大池化，则特征图宽高变为原来的________。答案：1/217.一阶谓词逻辑表达式∀x(Student(x)→∃y(Book(y)∧Own(x,y)))的语义是：________。答案：每个学生都拥有至少一本书。18.若某遗传算法个体采用二进制编码，长度为L，则搜索空间大小为________。答案：2^L19.在LSTM中，控制信息遗忘的门控信号由________函数输出。答案：Sigmoid20.若某高斯混合模型含K个成分，则参数集应包含K个均值向量、K个协方差矩阵以及________个权重系数。答案：K−1（权重和为1的约束）21.强化学习中，状态-动作值函数Qπ(s,a)的贝尔曼方程为Qπ(s,a)=E[r_{t+1}+γQπ(s_{t+1},a_{t+1})]，其中期望对________分布取样。答案：策略π与状态转移p22.若某深度网络使用ReLU激活，则其在负半轴的梯度为________。答案：023.在命题逻辑归结推理中，若子句集含有互补文字L与¬L，则可得到________子句。答案：空（□）24.信息论中，随机变量X与Y的互信息I(X;Y)可表示为H(X)−________。答案：H(X|Y)25.若某卷积层输出特征图尺寸为8×8×256，经全局平均池化后，输出维度为________。答案：256三、判断改错题（每小题2分，共10分）26.深度信念网络（DBN）由多层自编码器堆叠而成。答案：错误，改为“由多层受限玻尔兹曼机（RBM）堆叠而成”。27.在ID3算法中，连续属性必须先进行离散化，否则无法计算信息增益。答案：正确28.若某马尔可夫决策过程的状态空间有限且策略平稳，则值迭代一定能在有限步内收敛到最优值函数。答案：正确29.卷积神经网络中的权值共享机制显著增加了模型参数总量。答案：错误，改为“显著减少了模型参数总量”。30.自然语言处理中，BERT采用自回归语言模型目标进行预训练。答案：错误，改为“采用掩码语言模型（MLM）目标，属于自编码范式”。四、简答题（每小题8分，共24分）31.简述蒙特卡洛树搜索（MCTS）的四个核心步骤，并说明UCT公式的作用。答案：(1)选择（Selection）：从根节点出发，利用UCT策略递归选择子节点，直到到达未完全扩展节点。(2)扩展（Expansion）：若该节点非终止，随机或按策略添加一个未访问子节点。(3)模拟（Simulation）：从新节点开始，用快速rollout策略运行到终止状态，得到回报R。(4)回溯（Backpropagation）：将R沿路径反向更新，修正节点访问次数与累计回报。UCT公式：UCT(其中c为探索常数，平衡探索与利用，确保收敛到最优策略。32.说明批归一化（BatchNormalization）在训练与推断阶段的不同行为，并给出规范化公式。答案：训练阶段：对当前mini-batch统计量μ规范化：i再线性变换：y推断阶段：使用滑动平均得到的总体统计量μ,σ，不再依赖batch，确保输出确定。33.给出支持向量机原始优化问题与对偶优化问题，并解释KKT条件在SVM中的作用。答案：原始问题：mis.t. y_i(\mathbf{w}^T\mathbf{x}_i+b)\ge1-\xi_i,\;\xi_i\ge0对偶问题：mas.t. 0≤α_i≤C, ∑α_iy_i=0KKT条件保证原始与对偶解等价，且α_i>0对应的样本即为支持向量，决定超平面。五、计算与综合题（共46分）34.（10分）考虑下图搜索问题，A为起点，G为目标，边上数字为代价，启发函数值标注在括号内。A(7)─2─B(4)─3─C(2)─1─G(0)│ │5 2│ │D(6)─2─E(3)采用A算法，给出扩展节点的顺序，并标注每个节点的f=g+h值。采用A算法，给出扩展节点的顺序，并标注每个节点的f=g+h值。答案：扩展顺序：A(f=0+7=7)→B(2+4=6)→C(5+2=7)→G(6+0=6)D、E虽被生成，但f值高于已发现的最优路径，未被扩展。最优路径：A→B→C→G，总代价6。35.（12分）给定训练集：x₁=(1,2),y₁=+1x₂=(2,1),y₂=+1x₃=(3,3),y₃=−1使用线性SVM（硬间隔），求最优超平面方程w^Tx+b=0，并计算间隔宽度。答案：支持向量为x₁,x₃。设w=(w₁,w₂)，由w^Tx₁+b=+1w^Tx₃+b=−1解得：w₁+w₂+b=1；3w₁+3w₂+b=−1相减得2w₁+2w₂=−2⇒w₁+w₂=−1，代入得b=2再令w₂=−1−w₁，由间隔最大化等价于最小化‖w‖²，解得w₁=1,w₂=−2故w=(1,−2),b=2超平面：x₁−2x₂+2=0间隔宽度：236.（12分）某隐马尔可夫模型参数如下：状态集合{S₁,S₂}，观测集合{O₁,O₂}初始概率π=[0.6,0.4]转移矩阵A=[[0.7,0.3],[0.4,0.6]]发射矩阵B=[[0.5,0.5],[0.2,0.8]]给定观测序列O={O₁,O₂,O₁}，用前向算法计算P(O|λ)。答案：初始化：α₁(1)=π₁B₁(O₁)=0.6×0.5=0.3α₁(2)=0.4×0.2=0.08递推t=2：α₂(1)=[α₁(1)A₁₁+α₁(2)A₂₁]B₁(O₂)=[0.3×0.7+0.08×0.4]×0.5=0.121α₂(2)=[0.3×0.3+0.08×0.6]×0.8=0.1104t=3：α₃(1)=[0.121×0.7+0.1104×0.4]×0.5=0.06443α₃(2)=[0.121×0.3+0.1104×0.6]×0.2=0.015516P(O|λ)=α₃(1)+α₃(2)=0.079946≈0.079937.（12分）设计一个最小神经网络实现二变量异或XOR。要求：给出网络结构（层数、每层节点、激活函数）、权值与偏置，并验证输入(1,0)时的输出。答案：结构：输入层2节点→隐藏层2节点（ReLU）→输出层1节点（Sigmoid）权值：W₁=[[1,−1],[−1,1]],b₁=[0,0]W₂=[[1],[1]],b₂=[−0.5]验证(1,0)：隐藏层z=ReLU(W₁^Tx+b₁)=ReLU([1,−1]^T)=([1,0])输出o=Sigmoid(1×1+1×0−0.5)=Sigmoid(0.5)=0.622≈1（>0.5视为1），符合XOR。六、应用设计题（20分）38.某市计划部署智能红绿灯系统，利用强化学习优化路口通行效率。(1)给出状态空间、动作空间、奖励函数设计；（6分）(2)说明为何传统Q-table方法不适用，并提出深度强化学习方案（网络结构、训练技巧）；（8分）(3)列举两种仿真平台，并比较其优劣。（6分）答案：(1)状态：各进口道车辆数、平均速度、排队长度、相位剩余时间、行人请求，共连续/离散混合30维。动作：离散5选项（保持、切换至下一相位、延长绿灯5s、缩短5s、触发全红）。奖励：−(总延误+停车次数×3+行人等待×2)/100，每10s更新一次。(2)状态空间高维连续，Q-table爆炸。采用DoubleDQNwit

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2026年自考02355人工智能导论试题及答案

文档简介

温馨提示

最新文档

评论

2026年自考02355人工智能导论试题及答案

文档简介

温馨提示

最新文档

评论

相关文档