人工智能(AI)-13-14章作业参考答案.doc_第1页
人工智能(AI)-13-14章作业参考答案.doc_第2页
人工智能(AI)-13-14章作业参考答案.doc_第3页
人工智能(AI)-13-14章作业参考答案.doc_第4页
人工智能(AI)-13-14章作业参考答案.doc_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

不确定知识处理13.1 根据基本原理证明:。参考解答:此处“基本原理”是指条件概率的定义,以及逻辑“与”的定义。因此认为给定了成立,则A必定为真是不足以完成证明的。应从上述两个定义出发,由,且满足交换律和结合率,则有:得证。13.6 给定如图13.3所示的全联合分布,计算下列式子:0.1080.0120.0720.0080.0160.0640.1440.576a.b.c.d.参考解答:本习题的主要目的在于熟练掌握一个基本的机理,即任何对该领域内的问题的答案都可以通过全联合概率分布的某些项相加得到。此外,通过练习可以理解变量符号和(即课本中的粗体P)、大写和小写开头(如和)的具体含义和区别。a. 即询问为真的概率.b. 即询问随即变量的概率值向量(即该随即变量取不同的值的概率)。对于,有两个值,按照的顺序给出。通过以下4项相加得到,因此有:c. 即询问在给定为真的条件下,的概率值向量。d. 即问在给定或为真的条件下,的概率值向量。首先计算 然后计算 13.7 证明公式(13.8)中的独立性的3种形式是等价的,即两个命题和之间的独立性可以写作: 或者或者参考解答:由第1个式子,两边乘上得 由乘法法则有因此可得第3个式子所以第1个式子蕴涵第3个式子;通过和上述过程相反的处理,同样是应用乘法法则,在第3式两边同除以,即可证明当不为零时,有第3式蕴涵第1式(而当为零时,条件概率无定义)。所以得证第1式与第3式等价。同理按照以上方法,在过程中以代替,即可证明第2式和第3式等价。因此,得证三个式子等价。13.8 在一年一度的体检之后,医生告诉你一个好消息和坏消息。坏消息是你在一种严重疾病的测试结果呈阳性,而这个测试的准确率为99%(即当确实患这种病时,测试结果呈阳性的概率为0.99,同时也是未患这种疾病时测试结果为阴性的概率)。好消息是,这是一种很罕见的病,在你这个年龄段大约10000人中才有1例。为什么“这种病很罕见”对于你而言是一个好消息?你确实患有这种病的概率是多少?参考解答:由题意我们得到以下信息以及观察。病人所关心的是,即测试结果为阳性,患病的概率多大?大概来说,“这种病很罕见”是一个好消息,原因在于与是成比例的,因此低的先验概率将意味着有个很低的值。大约来看,如果10,000人进行测试,将会有1人确实患有该疾病,而且极有可能其测试为阳性,然而在其余没有患病的人里面,却会有1%(大约100人)的测试结果为阳性,因此将大约为1/100。精确的计算,依据贝叶斯定理有:其中的意义在于,当一种疾病很罕见,其概率远小于测试准确率时,则测试结果呈阳性并不意味着得病的可能性。对测试阳性的错误解读会认为得病的可能性很大,其实不然。和以上思路类似的有另外一个例子:医生说当一个婴儿仰卧着的时候,如果它的头更多转向右侧,则是习惯用右手;如果更多时候转向左侧的话,则是一个左撇子。宝宝小明在躺着的时候,小脑袋更多时候是转向左侧;且已知有90%的人习惯用右手。那么当以上所述的测试准确率为90%的时候,宝宝小明习惯用右手的概率是多少?如果测试准确率为80%,那它习惯右手的概率又是多少呢?按照同样的推理过程,可以得到当测试准确率为90%时,宝宝小明习惯用右手的概率为50%;如果测试准确率为80%的话,它习惯右手的概率为69%。13.11 假设给你一只装有个无偏差硬币的袋子,并且告诉你其中个硬币是正常的,一面是正面一面是反面。不过剩余1枚硬币是伪造的,它的两面都是正面。a. 假设你把手伸进口袋均匀随即地取出一枚硬币,把它抛出去,并发现硬币落地后正面朝上。那么你拿到伪币的(条件)概率是多少?b. 假设你不停地抛这枚硬币,拿到它之后一共抛了次而且看到次正面朝上。那么现在你拿到伪币的条件概率是多少?c.假设你希望通过把取出的硬币抛掷次的方法来确定它是不是伪造的。如果次抛掷后都是正面朝上,那么决策过程返回(伪造),否则返回(正常)。这个过程发生错误的(无条件)概率是多少?参考解答:a.一种典型的“计数”方法为如下的过程:取一个硬币会有种不同的取法(有多少个硬币就有多少种取法),一次抛掷有2种结果(尽管对于假币无法区分其抛掷结果的不同),因此共有个原子事件。当然其中只有次是假币,即有次结果为正面。所以在抛掷结果为正面的条件下,假币的概率为。上述“计数”的解题方法常常会在事件变得复杂时陷入混乱。所以最好使用以下公式:b. 此时有个原子事件,其中次取的是假币,及有次抛掷结果为正面。因此在次正面的条件下,假币的概率为。注意当增加时,结果会向1逼近。例如时,。以公式描述如下:c.过程发生错误当且仅当一枚真币被选中且抛掷次都为正面。其概率如下: 13.15 假设你时雅典一次夜间出租车肇事逃逸的交通事故的目击者。雅典所有的出租车都是蓝色或者绿色的。而你发誓所看见的肇事出租车时蓝色的。大量的实验表明,在昏暗的灯光条件下,对于蓝色和绿色的区分的可靠度为75%。有可能据此计算出肇事出租车最可能是什么颜色的吗?(提示:请仔细区分命题“肇事车是蓝色的”和命题“肇事车看起来是蓝色的”。现在,如果已经雅典的出租车10辆有9辆是绿色的呢?参考解答:题意所述问题相关方面可由两个随机变量:令表示“的士是蓝色的”,表示“的士看起来是蓝色的”。则有关颜色的判断的可靠性有: 我们是要求出在看起来是蓝色的情况下,的士确实为蓝色的概率: 因此如若没有关于蓝色的士的先验概率的信息,是无法求出上式所述概率。例如,如果知道所有的士都是蓝色的,即,则显然有;另一方面,如果在缺乏信息的情况下,往往认为各种可能是机会均等的,即认为的士为绿色或蓝色的概率是均等的,有,则。通常会知道一些相关的差异信息(例如题目给出绿色和蓝色的士为9:1,即),则有: 所以 13.18 文本分类是在文档所包含的文本基础上,把给定的文档分配到固定类别集合中某一个类别。这个任务常常用到朴素贝叶斯模型。在这些模型中,查询变量是文档类别,“结果”变量是语言中每个词是否出现。我们假设文档中的词的出现都是独立的,其出现频率由文档类别确定。a.准确地解释当给定一组类别已经确定的文档作为“训练数据”时,这样的模型时如何构造的。b.准确解释如何对新文档进行分类c.这里独立性假设合理吗?请讨论。参考解答:本题提出的问题是课本第23章相关内容的一个预览版,不过更直接的说,本题是为了理解掌握从完整的数据中如何对条件概率进行估计。a.模型由先验概率和条件概率构成,其中的为真,当且仅当所查询的文档包含有词汇表里的第个单词。对于每一个文档类别,表示基于文档的部分片段估计其属于文档类别。类似的,表示文档类别属于类的,其中包含有单词。b.利用朴素贝叶斯模型的条件独立来计算新文档的类别概率分布: c.这样的独立性假设其实是完全有违实际的。例如,一个词组“artificial intelligence”其在给定的某个文档类别中出现的概率其实大于上述模型所得出的两个词“artificial”和“intelligence”的出现概率的乘积。比如“artificial intelligence”在计算机学科学术类型的文档中大约100篇会出现5次,即“artificial intelligence”的概率大约为0.05;而贝叶斯朴素模型给出的概率却是“artificial”的概率0.05和“intelligence”的概率0.05的乘积,即0.025;所以说基于条件独立性假设的朴素贝叶斯模型给出的估计是与实际不相符的。这意味着对于词组(单词的组合)来说,其真是的概率大多是比模型给出的估计要高;当词组越长(即组成词组的单词数越多)时,模型得到的结果会越坏。2 附加题:你被聘任构建一个质量监控系统,对组装线上传送过来的汽车发动机进行质量检测,给出检测结果:bad或ok。系统决策的依据假设仅基于对三个布尔随机变量的观察:发动机运转时可能有摇摆(wobbly, 由运动传感器检测),可能发出异常的隆隆声(rumbly, 由声音传感器检测),又可能过热(hot, 由温度传感器检测)。每一个传感器会给出一个布尔型的观察结果:true或false。上述问题领域如下进行描述:Cause(原因):Evidence(证据):你经过推理分析,认为贝叶斯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论