《贝叶斯网络简介》PPT课件_第1页
《贝叶斯网络简介》PPT课件_第2页
《贝叶斯网络简介》PPT课件_第3页
《贝叶斯网络简介》PPT课件_第4页
《贝叶斯网络简介》PPT课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021/4/11贝叶斯网络简介贝叶斯网络简介Introduction to Bayesian Networks 2021/4/12基本框架基本框架 贝叶斯网络:贝叶斯网络: 概率论概率论 图论图论2021/4/13基本思路基本思路 贝叶斯网络是为了处理人工智能研究中贝叶斯网络是为了处理人工智能研究中的不确定性的不确定性(uncertainty)问题而发展起来问题而发展起来的的. 贝叶斯网络是将概率统计应用于复杂领贝叶斯网络是将概率统计应用于复杂领域进行不确定性推理和数据分析的工具域进行不确定性推理和数据分析的工具。 BN是一种系统地描述随即变量之间关系是一种系统地描述随即变量之间关系的工具。

2、建立的工具。建立BN的目的主要是进行概率的目的主要是进行概率推理推理(probabilistic inference)。 用概率论处理不确定性的主要优点是保用概率论处理不确定性的主要优点是保证推理结果的正确性。证推理结果的正确性。2021/4/14几个重要原理几个重要原理 链规则链规则(chain rule) 贝叶斯定理贝叶斯定理(Bayes theorem) 利用变量间条件独立性利用变量间条件独立性),.,|().|()(),.,(2112121nnnXXXXPXXPXPXXXP2021/4/15 What are they? Bayesian nets are a network-base

3、d framework for representing and analyzing models involving uncertainty What are they used for? Intelligent decision aids, data fusion, feature recognition, intelligent diagnostic aids, automated free text understanding, data mining Where did they come from? Cross fertilization of ideas between the

4、artificial intelligence, decision analysis, and statistic communities2021/4/16贝叶斯网络的几个主要问题贝叶斯网络的几个主要问题F贝叶斯网络概率推理贝叶斯网络概率推理(Probabilistic Inference)F结构学习结构学习 (structure learning)F参数学习参数学习 (Parameter learning)F分类分类 (classification)FF 隐变量及隐结构学习隐变量及隐结构学习 (Hidden variables and hidden structure learning)20

5、21/4/17一个简单贝叶斯网络例子一个简单贝叶斯网络例子2021/4/18一个简单贝叶斯网络例子一个简单贝叶斯网络例子 计算过程:计算过程: (1) P(y1|x1)=0.9 P(z1|x1)=P(z1|y1,x1)P(y1|x1)+P(z1|y2,x1)P(y2|x1) =P(z1|y1)P(y1|x1)+P(z1|y2)P(y2|x1) =0.7*0.9+0.4*0.1=0.67 P(w1|x1)=P(w1|z1,x1)P(z1|x1)+P(w1|z2,x1)P(z2|x1) =P(w1|z1)P(z1|x1)+P(w1|z2)P(z2|x1) =0.5*0.67+0.6*0.33=0.

6、533 该计算利用向下概率传播及链式规则。该计算利用向下概率传播及链式规则。2021/4/19一个简单贝叶斯网络例子一个简单贝叶斯网络例子计算过程:计算过程:(2) P(y1)=P(y1|x1)P(x1)+P(y1|x2)P(x2)=0.9*0.4+0.8*0.6=0.84P(z1)=P(z1|y1)P(y1)+P(z1|y2)P(y2)=0.7*0.84+0.4*0.16=0.652P(w1)=P(w1|z1)P(z1)+P(w1|z2)P(z2)=0.5*0.652+0.6*0.348=0.5348P(w1|y1)=P(w1|z1)P(z1|y1)+P(w1|z2)P(z2|y1)=0.5

7、*0.7+0.6*0.3=0.53P(w1|y2)=P(w1|z1)P(z1|y2)+P(w1|z2)P(z2|y2) =0.5*0.4+0.6*0.6=0.56P(w1|x1)=P(w1|y1)P(y1|x1)+P(w1|y2)P(y2|x1) =0.53*0.9+0.56*0.1=0.533 该计算利用向上概率传播及贝叶斯定理。该计算利用向上概率传播及贝叶斯定理。 2021/4/110为什么要用贝叶斯网络进行概率推理?为什么要用贝叶斯网络进行概率推理? 理论上,进行概率推理所需要的只是一个联合概率分理论上,进行概率推理所需要的只是一个联合概率分布。但是联合概率分布的复杂度相对于变量个数成指

8、布。但是联合概率分布的复杂度相对于变量个数成指数增长,所以当变量众多时不可行。数增长,所以当变量众多时不可行。 贝叶斯网络的提出就是要解决这个问题。贝叶斯网络的提出就是要解决这个问题。它把复杂的它把复杂的联合概率分布分解成一系列相对简单的模块,从而大联合概率分布分解成一系列相对简单的模块,从而大大降低知识获取和概率推理的复杂度,使得可以把概大降低知识获取和概率推理的复杂度,使得可以把概率论应用于大型问题。率论应用于大型问题。 统计学、系统工程、信息论以及模式识别等学科中贝统计学、系统工程、信息论以及模式识别等学科中贝叶斯网络特里的多元概率模型:朴素贝叶斯模型,隐叶斯网络特里的多元概率模型:朴素

9、贝叶斯模型,隐类模型,混合模型,隐马尔科夫模型,卡尔曼滤波器类模型,混合模型,隐马尔科夫模型,卡尔曼滤波器等。等。 动态贝叶斯网络主要用于对多维离散时间序列的监控动态贝叶斯网络主要用于对多维离散时间序列的监控和预测。和预测。 多层隐类模型,能够揭示观测变量背后的隐结构。多层隐类模型,能够揭示观测变量背后的隐结构。2021/4/111概率论基础贝叶斯网络所依赖的一个核心贝叶斯网络所依赖的一个核心概念是条件独立概念是条件独立: Conditional Independence2021/4/112基本概念基本概念2021/4/113例子例子P(C, S,R,W) = P(C)P(S|C)P(R|S,

10、C)P(W|S,R,C) chain rule = P(C)P(S|C)P(R|C)P(W|S,R,C) since = P(C)P(S|C)P(R|C)P(W|S,R) since 2021/4/114贝叶斯网络应用l 医疗诊断,医疗诊断,l 工业,工业,l 金融分析,金融分析,l 计算机(微软计算机(微软Windows,Office),),l 模式识别:分类,语义理解模式识别:分类,语义理解l 军事(目标识别,多目标跟踪,战争身份识别军事(目标识别,多目标跟踪,战争身份识别等),等),l 生态学,生态学,l 生物信息学(贝叶斯网络在基因连锁分析中应生物信息学(贝叶斯网络在基因连锁分析中应用

11、),用),l 编码学,编码学,l 分类聚类,分类聚类,l 时序数据和动态模型时序数据和动态模型2021/4/115图分割与变量独立图分割与变量独立图分割,有向分割(图分割,有向分割(d-separate,d-分割)分割)变量变量X和和Y通过第三个变量通过第三个变量Z间接相连的三种情况:间接相连的三种情况:阻塞阻塞(block)设设Z为一节点集合,为一节点集合,X和和Y是不在是不在Z中的两个节点。考虑中的两个节点。考虑X和和Y之间的一条通之间的一条通路。如果满足下面条件之一,则称被路。如果满足下面条件之一,则称被Z所阻塞:所阻塞:1有一个在有一个在Z中的顺连节点;中的顺连节点;2有一个在有一个在

12、Z中的分连节点中的分连节点3 有一个汇连节点有一个汇连节点W,它和它的后代节点均不在,它和它的后代节点均不在Z中。中。2021/4/116图分割与变量独立图分割与变量独立 如果如果X和和Y之间的所有通路都被之间的所有通路都被Z阻塞,则说阻塞,则说Z有向分有向分割割(directed separate)X和和Y,简称,简称d-separate,d-分割。分割。那么那么X和和Y在给定在给定Z时条件独立。时条件独立。 定理(整体马尔科夫性)定理(整体马尔科夫性)设设X和和Y为贝叶斯网为贝叶斯网N中的两中的两个变量,个变量,Z为为N中一个不包含中一个不包含X和和Y的节点集合。如果的节点集合。如果Z d

13、-分割分割X和和Y,那么,那么X和和Y在给定在给定Z时条件独立,即时条件独立,即 d-分割是图论的概念,而条件独立是概率论的概念,分割是图论的概念,而条件独立是概率论的概念,所以定理揭示了贝叶斯网络图论侧面和概率论侧面之所以定理揭示了贝叶斯网络图论侧面和概率论侧面之间的关系。间的关系。2021/4/117马尔科夫边界与端正图马尔科夫边界与端正图马尔科夫边界:条件独立性马尔科夫边界:条件独立性 在贝叶斯网络中,一个节点在贝叶斯网络中,一个节点X的马尔科夫边界的马尔科夫边界(Markov boundary)包括其父节点、子节点、以及子节点的父节包括其父节点、子节点、以及子节点的父节点。点。 端正图

14、端正图(Moral graph): 团树传播算法团树传播算法-junction tree 设设G为一有向无环图,如果将为一有向无环图,如果将G中每个节点的不同父节中每个节点的不同父节点结合,即在他们之间加一条边,然后去掉所有边的点结合,即在他们之间加一条边,然后去掉所有边的方向,所得到的无向图成为方向,所得到的无向图成为G的端正图。的端正图。2021/4/118贝叶斯网络推理贝叶斯网络推理(Inference)贝叶斯网络可以利用变量间的条件独立对联合分贝叶斯网络可以利用变量间的条件独立对联合分布进行分解,降低参数个数。布进行分解,降低参数个数。 推理推理(inference)是通过计算来回答查

15、询的过程是通过计算来回答查询的过程 计算后验概率分布:计算后验概率分布:P(Q|E=e)2021/4/119贝叶斯网络推理贝叶斯网络推理(Inference)1 变量消元算法变量消元算法(Variable elimination) 利用概率分解降低推理复杂度。利用概率分解降低推理复杂度。 使得运算局部化。消元过程实质上就是一个边缘化的过程。使得运算局部化。消元过程实质上就是一个边缘化的过程。 最优消元顺序:最大势搜索,最小缺边搜索最优消元顺序:最大势搜索,最小缺边搜索2021/4/120贝叶斯网络推理贝叶斯网络推理(Inference)2. 团树传播算法l利用步骤共享来加快推理的算法。l团树(

16、clique tree)是一种无向树,其中每一个节点代表一个变量集合,称为团(clique)。团树必须满足变量连通性,即包含同一变量的所有团所导出的子图必须是连通的。 2021/4/121 用团树组织变量消元的算法。计算共享用团树组织变量消元的算法。计算共享 团树传播算法基本步骤:团树传播算法基本步骤: 将贝叶斯网络转化为团树将贝叶斯网络转化为团树 团树初始化团树初始化 在团树中选一个团作为枢纽在团树中选一个团作为枢纽 全局概率传播:全局概率传播:CollectMessage; DistributeMessage 边缘化,归一化边缘化,归一化2021/4/122 团树传播算法示例团树传播算法示

17、例 (TLR是枢纽节点)是枢纽节点) FF变量消元和团树传播算法都是精确推理算法。变量消元和团树传播算法都是精确推理算法。2021/4/123贝叶斯网络推理贝叶斯网络推理(Inference)3 . 近似推理近似推理(1) 随机抽样算法:顺序抽样法,随机抽样算法:顺序抽样法,MCMC抽样抽样 是一类应用于数值积分和统计物理中的近似计是一类应用于数值积分和统计物理中的近似计算方法。基本思想是从某个概率分布随机抽样算方法。基本思想是从某个概率分布随机抽样,生成一组样本,然后从样本出发近似计算感,生成一组样本,然后从样本出发近似计算感兴趣的量。兴趣的量。 随机抽样算法理论基础是随机抽样算法理论基础是

18、大数定律大数定律。 2021/4/124MCMC算法算法吉布斯抽样吉布斯抽样(Gibbs sampling)。它首先随机生。它首先随机生成一个与证据成一个与证据E=e相一致的样本相一致的样本s1作为起始样本。此后,作为起始样本。此后,每个样本每个样本si的产生都依赖于前一个样本的产生都依赖于前一个样本si-1,且且si与与si-1最多最多只有一个非证据变量的取值不同,记改变量为只有一个非证据变量的取值不同,记改变量为X。 X的取值可以从非证据变量中随机选取,也可以按某个固的取值可以从非证据变量中随机选取,也可以按某个固定顺序轮流决定。定顺序轮流决定。 在在si中,中,X的值通过随机抽样决定,抽

19、样分布是:的值通过随机抽样决定,抽样分布是: 当样本数当样本数 时,马氏链理论保证了算法返回的结果收时,马氏链理论保证了算法返回的结果收敛于真正的后验概率。吉布斯抽样的缺点是收敛速度慢,敛于真正的后验概率。吉布斯抽样的缺点是收敛速度慢,因为马氏链往往需要花很长时间才能真正达到平稳分布。因为马氏链往往需要花很长时间才能真正达到平稳分布。 (2) 变分法。变分法。2021/4/125贝叶斯网络学习贝叶斯网络学习1. 结构学习:发现变量之间的图关系结构学习:发现变量之间的图关系 ,2 .参数学习:决定变量之间互相关联的量化关系。参数学习:决定变量之间互相关联的量化关系。 2021/4/126贝叶斯网

20、络结构学习贝叶斯网络结构学习l 选择具有最大后验概率的结构选择具有最大后验概率的结构 。l 基于评分函数基于评分函数(scoring function):BIC, MDL, AIC等等 拉普拉斯近似拉普拉斯近似(Laplace approximation):对拉普拉斯近似简化,得对拉普拉斯近似简化,得BIC:BICBIC既不依赖于先验也不依赖于参数坐标系统既不依赖于先验也不依赖于参数坐标系统 第一项度量参数模型预测数据的优良程度,第二项用于惩罚模型复杂度第一项度量参数模型预测数据的优良程度,第二项用于惩罚模型复杂度 2021/4/127结构学习算法结构学习算法算法:算法:u K2: 通过为每个

21、结点寻找父结点集合来学习贝叶斯网络结构。它不断通过为每个结点寻找父结点集合来学习贝叶斯网络结构。它不断往父结点集中添加结点,并选择能最大化数据和结构的联合概率往父结点集中添加结点,并选择能最大化数据和结构的联合概率的结点集。的结点集。 u HillClimbing (operators: edge addition, edge deletion, edge reversion) 从一个无边结构开始,在每一步,它添加能最大化从一个无边结构开始,在每一步,它添加能最大化BIC的边。算的边。算法在通过添加边不能再提高结构得分时停止。法在通过添加边不能再提高结构得分时停止。u 缺值数据结构学习:缺值数

22、据结构学习:Structural EM SEM不是每次迭代都同时优化模型结构和参数,而是先固定模型不是每次迭代都同时优化模型结构和参数,而是先固定模型结构进行数次参数优化后,再进行一次结构加参数优化,如此交结构进行数次参数优化后,再进行一次结构加参数优化,如此交替进行。替进行。 目的:减小计算复杂度。目的:减小计算复杂度。 2021/4/1282021/4/1292021/4/130贝叶斯网络参数学习贝叶斯网络参数学习u最大似然估计最大似然估计 完全基于数据,不需要先验概率:完全基于数据,不需要先验概率: u贝叶斯估计贝叶斯估计 假定在考虑数据之前,网络参数服从某个先验分布。假定在考虑数据之前

23、,网络参数服从某个先验分布。先验的主观概率先验的主观概率,它的影响随着数据量的增大而减小。它的影响随着数据量的增大而减小。 2021/4/131贝叶斯网络参数学习贝叶斯网络参数学习u缺值数据最大似然估计:缺值数据最大似然估计:EM算法算法 (迭代算法)(迭代算法) 1 基于基于 对数据进行修补,使之完整对数据进行修补,使之完整 (E-step) 2 基于修补后的完整数据计算的最大似然估计基于修补后的完整数据计算的最大似然估计 (M-Step)EM算法是收敛的。算法是收敛的。2021/4/132隐结构模型学习隐结构模型学习l 隐变量是取值未被观察到的变量。通过数据分析:隐变量是取值未被观察到的变

24、量。通过数据分析: 1 隐变量的个数隐变量的个数 2 隐结构隐结构 3 隐变量的势隐变量的势 4 模型参数模型参数l 方法:基于评分函数的爬山法方法:基于评分函数的爬山法 G是一个隐变量模型,是一个隐变量模型,D是一组数据。是一组数据。 是是G的参数的某一个最大似然估计,的参数的某一个最大似然估计, 是是G的有效维数。的有效维数。 u隐变量势学习爬山算法隐变量势学习爬山算法u隐结构学习双重爬山算法隐结构学习双重爬山算法2021/4/133贝叶斯网络用于分类和因果关系分析贝叶斯网络用于分类和因果关系分析(1) Nave Bayesian networks(2) Tree augment Baye

25、sian networks, et al.(3) PC (Spirtes et al.,2000) , IC(Pearl,2000) algorithm2021/4/134动态贝叶斯网络动态贝叶斯网络DBN: Dynamic Bayesian networks Dealing with time In many systems, data arrives sequentially Dynamic Bayes nets (DBNs) can be used to model such time-series (sequence) data Special cases of DBNs include State-space models Hidden Markov models (HMMs)2021/4/135Software ToolsuMicrosofts MSBNXuBNT Kevin Murphy. BayesNet Toolbox for Matlab (BNT). http:/www.cs.ubc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论