




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第7讲贝叶斯决策论 文志强计算机与通信学院 2 主要内容 引言贝叶斯决策论 连续特征最小误差率分类分类器 判别函数及判定面正态密度 资料来自 RichardO Duda 李宏东等译 模式分类 机械工业出版社 2003 3 7 1引言 1 贝叶斯决策论的概念贝叶斯决策论 利用概率的不同分类决策与相应的决策代价之间的定量折中 假设 决策问题可以用概率的形式来描述 并假设所有有关的概率结构均已知 2 鱼类分类的例子 鲈鱼 鲑鱼 续 4 鲑鱼 鲈鱼 5 使用长度作为特征 鲑鱼 鲈鱼 6 使用光泽度作为特征 鲑鱼 鲈鱼 7 判别边界 决策理论的任务是 使总体代价函数最小 鲈鱼 鲑鱼 8 使用光泽度和宽度特征的散布图 鲈鱼 鲑鱼 9 复杂模型 10 最优折中 Centerprobleminpatternrecognition 11 3 几个概念如果用w表示类别状态 那么当w w1时是鲈鱼 当w w2时是鲑鱼 可由概率来描述特性的随机变量 先验概率 P w1 表示鲈鱼的先验概率 P w2 表示鲑鱼的先验概率 满足P w1 P w2 1 类条件概率密度 假设x是一连续随机变量 其分布取决于类别的状态 表示成p x w 的形式 也称状态条件密度 12 图7 1假定的类条件概率密度函数图 显示了模式处于类别wi时的观测某个特定特征值x的概率密度 如果x代表鱼的长度 那么这两条曲线可描述两种鱼的长度区别 概率函数已归一化 因此每条曲线下的面积为1 13 假设已知先验概率P wj 也知道条件概率密度p x wj 且j 1 2 通过观察和测量 发现某个特征 一条鱼的光泽度 为x 则联合概率密度可写成p wj x P wj x p x p x wj P wj 于是可得贝叶斯公式 P wj x p x wj P wj p x 在两类问题下 贝叶斯公式可用非正式的英语表示成 其中 p x wj 称为wj关于x的似然函数 证据因子p x 可看成一个标量因子 14 图7 2在先验概率P w1 2 3 P w2 1 3及图7 1给出的类条件概率密度的条件下的后验概率图 15 4 决策规则 最小化误差概率条件下的贝叶斯决策规则决策规则 如果某个观测值x使得P w1 x 比P w2 x 大 则判断类别是w1 反之 则判断w2 误差概率 4 平均误差 4 式可写成 可得到完全等价的判断规则 16 7 2贝叶斯决策论 连续特征 推广 允许使用多于一个特征允许多于两种类别状态的情形允许有其他行为而不是仅仅判断类别通过引入一个更一般的损失函数来替代误差概率注 损失函数 精确地阐述了每种行为所付出的代价大小 并且用于将概率转换为一种判决 17 令 w1 wc 表示有限个c个类别集 1 a 表示有限的a种可能采取的行为集 风险函数 i wj 描述类别状态为wj时采取行动 i的风险 特征向量x表示一个d维随机变量 令p x wj 表示x的状态条件概率密度函数 则后验概率可表示成 证据因子已知 18 如果观测到某个特定模式x并且采取行为 i 如果真实的类别为wj 通过定义将有损失 i wj 则相应损失为 称为条件风险 可以通过选择最小化条件风险的行为来使预期的损失最小化 贝叶斯决策过程实际上提供了一个总风险的优化过程 总风险为 19 两类分类问题 ij i wj 表示当前实际类别为wj时误判为wi所引起的损失 条件风险为 如果 也表述为 如果 则判定为w1 20 利用贝叶斯规则 则等价于 如果 则判定为w1 另一种表达方式为 如果下式成立 则判定为w1 似然比 称为 21 7 3最小误差率分类 如果采取行为 i 而实际类别为wj 那么在i j的情况下判定是正确的 如果i j 则产生误判 如果要避免误判 自然要寻找一种判决规则使误判概率最小化 对称损失函数或0 1损失函数 条件风险 相当于平均误差概率 为了最小化平均误差概率 需要选取i使得后验概率P wi x 最大 也即基于最小误差概率 有 22 图7 3图7 1所示的分布的似然函数比p x w1 p x w2 如果引入一个0 1损失或分类损失 那么判决边界将由 a决定 23 7 4分类器 判别函数及判定面 7 4 1多类情况常用的判别函数为gi x i 1 c的形式 如果对于所有的j i 有gi x gj x 则此分类器将这个特征向量x判为wi分类器可视为一个网络或机器 图7 5 24 图7 5一个包含d个输入c个判决函数gi x 的一般的统计模式分类器的体系结构 接下来的步骤是确定哪个判别函数值最大 并相应的对输入作分类 箭头表示信息流的方向 25 具有一般风险的情况下 让gi x R i x 在最小误差概率情况下 让gi x P wi x 在最小误差概率情况下 一些常用选择 26 图7 6在这个二维的两类问题的分类器中 概率密度为高斯分布 判决边界由两个双曲线构成 因此判决区域R2并非是简单的连通的 椭圆轮廓线标记出1 e乘以概率密度的峰值 27 7 4 2两类情况 二类分类器判别函数如果则判为w1 否则判为w2 常用的个g x 函数如下 28 7 5正态密度 f x 的数学期望 29 7 5 1单变量密度函数 单变量正态密度函数 期望值 方差 记为 30 图7 7单变量正态分布大约有95 的区域在 x 2 范围内 如图所示 此分布的峰值为 31 7 5 2多元密度函数 d维多元正态密度的形式 其中 记为 协方差矩阵 32 图7 8特征空间中的一个线性变换将一个任意正态分布变换成另一个正态分布 正态分布的性质 服从正态分布的随机变量的线性组合还是一个正态分布 白化变换 直线投影 33 图7 9从一个以均值 为中心的云团内的二维高斯分布中取出的样本 椭圆显示了等概率密度的高斯分布轨迹 多元正态密度完全由d d d 1 2个参数确定 从一正态分布中所抽取的样本点趋向于落在一个单一的云团或聚类中 等密度点的轨迹为一超椭圆体 这些椭圆体的主轴由 的本征向量给出 本征值决定这些长轴的长度 34 称为从x到 的Mahalanobis距离或马氏距离 等密度分布的边界是一些到的恒定马氏距离的超椭圆体 且这些超椭圆体的体积决定了均值附近的样本的离散程度 与Mahalanobis距离r对应的超椭圆体的体积为 其中Vd是一个d维单位超球体的体积 35 7 6正态分布的判别函数 可获得 下面分几种特殊情况来讨论 最小误差概率分类可通过使用判决函数获得 36 情况1 省略无关常数后 可得简单的判别函数 表示欧几里德范数 二次型展开可得 和 37 可得等价的线性判别函数 wi0称为第i个方向的阈值或偏置 38 超平面此方程可写成 图7 10如果两种分布的协方差矩阵相等并且与单位阵成比例 那么它们成d维球状分布 其判决边界是一个d 1维归一化超平面 垂直于两个中心的连线 在这些一维 二维 三维的例子中 是假设在P w1 P w2 的情况下来显示p x wi 和判决边界的 其中 39 情况2 可简化为 将二次型展开 可得线性判别函数 40 边界面方程为 判决边界是超平面 41 图7 11随着先验概率的改变 判决边界也随之改变 对于差别较大的离散先验概率而言 判决边界不会落于这些一维 二维及三维球状高斯分布的中心点之间 42 图7 12相等但非对称的高斯分布的概率密度及判决区域 判决超平面未必和均值连线垂直正交 43 情况3 去掉常量后 判别函数为二次型 其中 在两类问题中 对应的判定面是超二次曲面 44 图7 13在方差不相等的一维高斯分布情况下 可能产生并非单连通的判决区域 如P w1 P w2 时这里所示的情况 判决区域不连通的情形 45 图7 14任意高斯分布导致一般超二次曲面的贝叶斯判决边界 反之 给定任意超二次曲面 就能求出两个高斯分布 其贝叶斯判决边界就是超二次曲面 它们的方差由常概率密度的围线表示 二维的例子 46 图7 15任意的三维高斯分布产生二维的超二次曲面的贝叶斯判决边界 甚
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 动物苗定价方案(3篇)
- 心理补偿方案文案(3篇)
- 办公行政费用管理制度
- 学校篮球训练管理制度
- 公司隐患上报管理制度
- 小学卫生健康管理制度
- 诉讼审计方案(3篇)
- 再次实施闭环管理制度
- 医院非法集资管理制度
- DB62T 4482-2021 果园防雹网设计及架设技术规程
- 2024年东南亚铝合金窗型材市场深度研究及预测报告
- 延期租地期限协议书
- 《啊,船长,我的船长哟》教案
- DL-T-1692-2017安全工器具柜技术条件
- 期末测试(试题)-2023-2024学年人教PEP版英语五年级下册
- 2024年资料员考试题库及完整答案【各地真题】
- JBT 1306-2024 电动单梁起重机(正式版)
- 2024年上海市中考语文备考之文言诗文主旨汇编
- 2023-2024学年江苏省常州市新北区外国语学校七下英语期末综合测试试题含答案
- 2024年工程居间合同电子版(5篇)
- 2024年庆阳市交通投资建设集团有限公司招聘笔试冲刺题(带答案解析)
评论
0/150
提交评论