雨课堂学堂在线学堂云《人工智能导论》单元测试考核答案_第1页
雨课堂学堂在线学堂云《人工智能导论》单元测试考核答案_第2页
雨课堂学堂在线学堂云《人工智能导论》单元测试考核答案_第3页
雨课堂学堂在线学堂云《人工智能导论》单元测试考核答案_第4页
雨课堂学堂在线学堂云《人工智能导论》单元测试考核答案_第5页
免费预览已结束,剩余5页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

注:不含主观题第1题判断题(20分)对于一个边损耗非负的有限图,采用广度优先树搜索可以得到最优解,并且对每条边加上一个相同的非负损耗c>0之后,最优路径保持不变。()第2题单选题(20分)在下图八数码问题中,需要通过移动将杂乱的8个方块按照右侧的顺序进行排列,那么该问题的状态空间的大小是()A9B8C9*9D9!第3题单选题(20分)在下列图搜索问题中,S为起始节点,G1、G2、G3均为目标节点,则采用一致代价找到的解是()AG1BG2CG3D均不可能第4题多选题(20分)以下无信息搜索算法中,同时具有完备性和最优性的有()。A深度优先搜索B广度优先搜索C迭代加深搜索D一致代价搜索正确答案:BCD第5题多选题(20分)对于有限状态图上的搜索问题,以下说法正确的有()。A深度优先图搜索(BFS)可以保证找到解(如果存在至少一解)B一致代价搜索(UCS)不一定总能找到最优解C存在广度优先树搜索有解而深度优先树搜索无解的案例D存在深度优先树搜索有解而广度优先树搜索无解的案例正确答案:ABC第二章测试题第1题判断题(20分)假如一个搜索问题(有限状态)至少有一个解,则当A*图搜索算法配备任意可采纳的启发式函数时,一定能保证找到一解。()第2题判断题(20分)当路径损耗非负时,一致代价搜索是A*算法的一种特例,其启发式函数既是可采纳的,又是一致的。()第3题填空题(20分)在下图所示的图搜索问题中,哪些节点的启发式函数值是不可采纳的____正确答案::["SBT"]第4题多选题(20分)在如下图的八数码问题中,如果A格与B格相邻且B为空,则A可以移动至B。以下可以作为八数码问题的一致启发式函数的有()。A不在目标位置的数码总数B各数码到目标位置的曼哈顿距离总和C数码1、2、3、4移动到正确位置的步数D都不正确正确答案:ABC第5题单选题(20分)在上述八数码问题中,有两种启发式函数,其中h1()为不在目标位置的数码总数,h2()为各数码到目标位置的曼哈顿距离总和,则h3()=max(h1(),h2()),具有以下什么性质()。A可采纳的B一致的CA和B都满足DA和B都不满足第三章测试题第1题判断题(20分)对抗博弈是一种零和游戏。()第2题判断题(20分)极大极小值搜索算法相比于深度优先,更接近广度优先搜索算法。()第3题判断题(20分)alpha-beta剪枝中,儿子节点的扩展顺序遵循效用值递减对MIN节点的值计算更高效。()第4题单选题(20分)在期望最大搜索中,可能涉及什么类型的节点?()。AMAX节点。B随机节点。C以上两种都无。D以上两种都有。第5题多选题(20分)alpha-beta剪枝中,哪些说法是正确的()。A对于MAX节点来说,当前效用值大于beta时可以进行剪枝。Balpha在MIN节点上更新。Calpha在MAX节点上更新。D中间节点的极大极小值在执行完剪枝算法后可能是错误的。正确答案:ACD第四章测试题第1题判断题(20分)约束满足问题关注动作路径。()第2题判断题(20分)约束满足问题的解是满足所有约束的一组变量赋值。()第3题判断题(20分)任何N元约束满足问题都可以转化为二元约束满足问题。()第4题单选题(20分)关于约束满足问题,说法错误的是()。A对于任何类型的变量都可以通过枚举的方式展现所有变量赋值情况。B一元约束仅涉及一个变量。C变量赋值往往伴随与倾向性相关的评价。D交通排班可以构建成一个约束满足问题。第5题多选题(20分)关于约束满足问题的回溯搜索算法,以下说法正确的是()。A应选择剩余赋值选择最少的变量进行赋值。B应选择剩余赋值选择最多的变量进行赋值。C赋值时,应选择最多限制的取值。D赋值时,应选择最少限制的取值。正确答案:AD第五章测试题第1题判断题(10分)假设马尔可夫决策问题()的状态是有限的,则对于,如果我们只改变奖励函数R,最优策略会保持不变。()第2题判断题(10分)假设马尔可夫决策问题()的状态是有限的,若衰减因子满足,则值迭代一定会收敛。()第3题判断题(10分)假设马尔可夫决策问题()的状态是有限的,通过值迭代找到的策略优于通过策略迭代找到的策略。()第4题判断题(10分)如果两个MDP之间的唯一差异是衰减因子的值,那么它们一定拥有相同的最优策略。()第5题判断题(10分)当在一个MDP中只执行有限数量的步骤时,最优策略是平稳的。平稳的策略是指在给定状态下采取相同操作的策略,与智能体处于该状态的时间无关。()第6题填空题(16分)处于奖励水平的吃豆人游戏。吃豆人正处在一个5*1的格子世界中,如下图所示:

这些单元格从左到右分别编号为1,2,3,4,5。在格子1-4中,吃豆人可以采取的动作是向右移动(R)或飞出(F)奖励水平。其中,执行动作R会确定性地移动到右边的格子中并吃掉其中的豆子,而执行动作F会确定性地移动到终止状态并结束游戏。在格子5中,吃豆人只能执行动作F。吃豆人吃一个豆子奖励为10,飞出奖励水平的奖励为20。吃豆人的初始状态为最左边的格子1。我们把它看成一个MDP,其中的状态是吃豆人所在的格子。衰减因子为

。考虑以下三种策略:假设衰减因子

,计算:________________正确答案::["20"]正确答案::["50"]正确答案::["60"]正确答案::["60"]第7题填空题(30分)基于上一题题干,现考虑

可取任意值。

a.是否存在一个

使得

严格优于

?是否存在____(是/否)若是:写出

区间________若否:上述区间为0,0。b.是否存在一个

使得

严格优于

?是否存在____(是/否)若是:写出

区间________若否:上述区间为0,0。

c.是否存在一个

使得

严格优于

?是否存在____(是/否)若是:写出

区间________若否:上述区间为0,0。正确答案::["是"]正确答案::["0"]正确答案::["0.5","1/2"]正确答案::["否"]正确答案::["0"]正确答案::["0"]正确答案::["是"]正确答案::["0.5","1/2"]正确答案::["1"]第六章测试题第1题判断题(10分)时序差分算法是一种在线学习的方法。()第2题单选题(15分)F-learning可以看作Q-learning的一种健忘选择,,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于固定的值:()A具有确定性的状态转移时B具有随机性的状态转移时C相应的Q-learning收敛时F-learning也会收敛D从不第3题单选题(15分)F-learning可以看作Q-learning的一种健忘选择,,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于最优q值:()A具有确定性的状态转移时B具有随机性的状态转移时C相应的Q-learning收敛时F-learning也会收敛D从不第4题单选题(15分)F-learning可以看作Q-learning的一种健忘选择,,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于随机策略的q值:()A具有确定性的状态转移时B具有随机性的状态转移时C相应的Q-learning收敛时F-learning也会收敛D从不第5题第6题第七章测试题第1题多选题(20分)使用强化学习状态的泛化表示的好处有()A减少内存的消耗B复杂的计算获得更精确的表示C可以采样更多的样本D可以减少采样正确答案:AD第2题单选题(20分)在强化学习值函数近似中,蒙特卡洛方法对梯度计算是()ABCD第3题单选题(20分)在强化学习值函数近似中,时间差分方法对梯度计算是()ABCD第4题判断题(20分)在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习()第5题判断题(20分)强化学习中有有模型的方法和无模型的方法第八章测试题第1题单选题(10分)随机变量X的概率分布如下图,则x等于()。A0.1B0.2C0.3D0.4第2题单选题(10分)贝叶斯网络中,节点的含义是什么A概率值B独立性C随机变量D变量关系第3题单选题(10分)在下面的贝叶斯网络中,不给定Cavity和给定Cavity的情况下,Toothache和Catch的独立性分别是A独立,不独立B独立,独立C不独立,不独立D不独立,独立第4题填空题(10分)已知随机变量T和W的联合概率分布表如下,则____,____。正确答案::["则P(T=hot)={0.7}"]正确答案::["P(W=sun)={0.3}"]第5题填空题(10分)已知男女比例可以看成各占一半,男子中由5%患色盲症,女子中0.25%患色盲症,随机抽取一患有色盲症的人,其是男子的概率是____。正确答案::["{95%}"]第6题填空题(10分)如果x,y在z的条件下相互独立,则(P(x,y|z)=____。正确答案::["P(x|z)*{P(y|z)}"]第7题多选题(10分)在下面的贝叶斯网络中,正确的选项有()。AP(-cavity,catch,-toothache)=P(-cavity)P(catch|(-cavity)P(-toothache)|-cavity)BP(-cavity,catch,-toothache)=P(-cavity)P(catch)P(-toothache)CP(cavity,catch,-toothache)=P(cavity)P(catch|-cavity)P(toothache)|cavity)DP(cavity,-catch,-toothache)=P(cavity)P(-catch|(cavity)P(-toothache)|cavity)正确答案:AD第8题填空题(7分)某衣帽厂有甲、乙、丙三个工作间生产同一种衣服,已知各个工作间的产量分别占全厂产量的25%、35%、40%,甲、乙、丙工作间的次品率为5%、4%、2%,现在从衣帽厂中检查出一个次品,是由甲工作间生产的概率是多少。设A、B、C为甲、乙、丙生产的商品,D表示次品P(A)=25%,P(B)=35%,P(C)=40%

P(D|A)=____P(D|B)=____P(D|C)=____P(A|D)=____正确答案::["0.05","5%"]正确答案::["0.04","4%"]正确答案::["0.02","2%"]正确答案::["0.37","0.362"]第九章测试题第1题多选题(10分)下面属于精确推理的方法是()A似然加权法B拒绝采样法C变量消元法D枚举推理法正确答案:CD第2题多选题(10分)特征因子包括哪几种()A联合分布B单条件分布C多条件分布D选定联合分布正确答案:ABCD第3题判断题(10分)似然加权法是重要性采样的特殊情况,可能会生成不符合证据变量的样本()第4题判断题(10分)贝叶斯网络中精确推理的复杂度依赖于网络结构和网络规模()第5题填空题(10分)A,B,C,D是四个随机变量,A的值域是{a1,a2},B的值域是{b1,b2,b3},C的值域是{c1,c2,c3,c4,c5},D的值域是{d1,d2,d3,d4,d5,d6,d7}给定因子P(A|C)和P(B!A,C),在逐点相乘后,产生因子的维度是____,元素个数为____。正确答案::["{3}"]正确答案::["{30}"]第6题填空题(10分)A,B,C,D是四个随机变量,A的值域是{a1,a2},B的值域是{b1,b2,b3},C的值域是{c1,c2,c3,c4,c5},D的值域是{d1,d2,d3,d4,d5,d6,d7}给定因子P(A|B),P(B!C),和P(C),对C变量消元,产生新的因子维度是____,元素个数为____。正确答案::["{1}"]正确答案::["{3}"]第7题填空题(10分)A,B,C,D是四个随机变量,A的值域是{a1,a2},B的值域是{b1,b2,b3},C的值域是{c1,c2,c3,c4,c5},D的值域是{d1,d2,d3,d4,d5,d6,d7}给定因子P(A|C)和P(B!A,C),对A进行变量消元,产生新的因子维度是____,元素个数为____正确答案

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论