




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十四章贝叶斯决策 第一节贝叶斯决策定义第二节先验分布第三节Bayes定理与后验概率分布第四节后验决策及其优良性第五节最佳决策方案第六节最佳样本容量 第一节贝叶斯决策定义 一 什么是贝叶斯决策贝叶斯决策就是在不完全情报下 对部分未知的状态用主观概率估计 然后用贝叶斯公式对发生概率进行修正 最后再利用期望值和修正概率做出最优决策 其基本思想是 1 确定类条件概率密度参数表达式和先验概率 2 利用贝叶斯公式转换成后验概率 3 根据后验概率大小进行决策分类 二 贝叶斯概率应用的一个例子HIV血检的例子 设想在广东省东莞市的一家医院 一个地产商接受了 血液检验 结果是阳性 他非常的紧张 问医生 血检的灵敏度如何 医生回答说 非常灵敏 而且误诊率 就是假阳性 也很低 才5 听完这句话 病人当即晕倒 假如他懂一点 理论的话 一定要先问 中国现在大约有百分之几的 患者 医生可能说 计中国可能大约有千分之一 或艾滋病患者 假设东莞市有20万人检测了血样 那我门可以从下表中我们看出在10180个血检为阳性的人中只有1 9 的人真正患有HIV 1 9 就是后验概率 可以由以下 公式直接算出 p H T p H p T H p T H p H p T H p H 0 001 0 95 0 001 0 95 0 05 0 999 1 9 三 贝叶斯决策应用的一个例子延续上面那个例子 有了对疾病的估计 接下来就要利用贝叶斯决策选择治疗方案 首先我们要定义一个效益函数u d 什么是效益呢 在实际环境中 有太多的因素可以成为效益的组成部分 譬如延长多少年的寿命或者是减少疼痛的程度 也可用损失函数来衡量 譬如吃药后的负作用等等 假如对每一种治疗方案和疾病的状况我们都可以定义一个量化的效益或损失 那我们就可以得到每种治疗方案的期望效益或损失 对以上的例子 定义以下的效益函数u d A 0 100 给一个没病的人吃药 显然损失很大 u d A 1 10000 给有病的人吃药 好处多多 u d B 0 0 给没病的人不加治疗 没好处没坏处 u d B 1 10000 给有病的人不治疗 有一定的坏处 A表示给该血检人治疗 B表示不给血检人治疗 1表示该血检人为HIV阳性 0表示该血检人为HIV阴性 由上例子可以得出p 1 y 98 p 0 y 2 1 9 四舍五入 y表示确实为血检阳性 1表示HIV阳性就可以算出期望的效益E d A 100 98 10000 2 102E d B 0 0 98 10000 2 200很明显他应该选择治疗 第二节先验分布 作决策时 最先确定的各种自然状态的概率 一般称为先验概率分布 它是在做任何实验或调查以前就确定了的 若根据试验或调查所获得的情报 对先前确定的先验概率分布加以修正 而得到关于自然状态的新的概率分布 则称之为后验分布 客观的先验分布 根据经验获得的某些客观的情报或证据 对自然状态的先验概率的估计或指定 例如 我们可以用某一段时间内每批产品所包含的不合格品的数目 来估计该产品不合格率的概率分布 先验分布 主观的先验分布 如果缺乏有关自然状态的客观情报 决策者小心分析自然状态的各种情况 评估各种自然状态出现的可能性大小 然后主观地指定先验概率分布 例如判断利率的变化 可以根据过去观察到的经济状况与利率之间的关系 来推测利率上升 不变或下降的概率 第三节Bayes定理与后验概率分布 一 补充信息 决策者通过调查而获得的信息 利用Bayes定理将补充信息和先验分布结合起来 便产生了一种综合信息 即后验分布 第三节Bayes定理与后验概率分布 二 Bayes定理 设自然状态 有k种 分别用 1 2 k表示 P i 表示自然状态 i发生的先验概率分布 用x表示调查结果 P x i 表示在状态 i条件下 调查结果刚好为x的概率 通过调查得到结果x 这样的结果包含有关于自然状态 的信息 利用这些信息可对自然状态 i i 1 2 3 k 发生的概率重新认识 并加以修正 修正后的概率为 i 1 2 k这就是Bayes公式 一般来讲 这时对各种自然状态 1 2 k发生的概率作出的估计P 1 x P 2 x P k x 比先验概率分布更为准确 我们称P i x 为 i发生的后验概率 三 例子例1某自动生产设备在生产过程中可能正常也可能不正常 正常时产品的合格率为80 不正常时产品的合格率为30 从某时刻生产的产品种抽取一件进行检验 要求我们根据这些产品的情况来判断设备是否正常 该问题的自然状态有两种 即设备正常和设备不正常 分别用 1和 2表示 假设我们对该设备以往的生产情况一无所知 那么判断设备是否正常的可能性相等 即先验概率为 P 1 0 5P 2 0 5由于两者的概率相等 实际上无法判断出设备究竟是否正常 但如果我们从某时刻的产品中抽取一件产品 若发现为合格品 即抽样的结果为x 合格品 这就得到了一种补充的信息 容易算出 P 合格品 1 0 8P 合格品 2 0 3 利用Bayes公式得 P 1 合格品 0 73P 2 合格品 0 27即抽得一件产品为合格品后算得设备为正常的概率是0 73 设备不正常的概率是0 27 故应判断此时设备正常 即 1 若从某时刻生产的产品中抽取到的一件产品为不合格品 同样利用Bayes公式算得 P 1 不合格品 0 22P 2 不合格品 0 78故应判断此时设备不正常 即 2 四 例子的扩展如果从某时刻生产的产品种连续抽取两件产品 并检查它们是否合格 然后再判断设备此时是否正常 抽样结果 我们用x 合 合 表示两件产品都合格 x 合 不 表示第一件合格 第二件不合格 x 不 合 表示第一件不合格 第二件合格 x 不 不 表示两件都不合格 计算结果如下 P 1 合 合 0 877P 2 合 合 0 123P 1 合 不 0 432P 2 合 不 0 568P 1 不 不 0 075P 2 不 不 0 925P 1 不 合 0 432P 2 不 合 0 568根据这些后验概率 合理的判断应该是 若两件产品都合格 判断设备此时正常 若第一件合格 第二件不合格 应判断此时设备不正常 若两件产品都不合格 判断设备此时不正常 若第一件不合格 第二件合格 判断此时设备不正常 另外 全概率公式 第四节后验决策及其优良性 一 概念先验决策 建立在先验概率分布的基础上而作出的决策 后验决策 利用后验概率分布作出的决策 理论证明 任何后验补充情报信息都不会给决策者带来坏处 由于后验概率分布是由先验分布经过补充一些情报后而产生的 所以基于后验概率分布而作出的后验决策总是优于先验决策 假定某一决策问题的自然状态 为 1 2 n 他们的先验概率分布为 P 1 P 2 P n 可以采取的行动 为 1 2 m 损失函数为R 令补充情报值为x 如在上节所述的例子中 我们通过抽出一件产品来补充情报信息 若抽出的产品为合格品 则x 合 若抽出两件产品来补充情报信息 则x可能等于 合 合 不 不 合 不 或 不 合 根据情报值x 我们采取某个行动 x x 可能为 1 2 或 m 称 x 为一个决策方案 对某一决策方案 x 在任一状态 i下 当情报值x确定后 它所对应的行动 x 也就确定了 从而行动 x 的损失值R i x 也就随之确定了 对于一个好的决策方案 应要求R i x 较小 但是 评价一个决策方案的好坏 不能只看一次情报所取的值 而应当用各情报值下的平均效果来衡量 因此 在状态 i下 决策方案的好坏应以R i x 对情报值x的数学期望的大小为标准 即 P i Ex i R i x 称P i 为在状态 i下 决策方案 x 的风险值 风险值表示在固定状态 i下 当出现各种不同情报值时按决策方案采取行动的平均损失 在不同状态下 同一决策方案的风险值不一样 一个决策方案的好坏 应综合反应其在各种不同状态下的风险值 即我们应当用来衡量一个决策方案的好坏 称B 为决策方案 x 的贝叶斯风险 它反映这一决策方案的平均损失 二 例子例如 在上节所述的例子中 如果设备正常 而判断为不正常 会损失1500元 判断为正常 损失为0 若设备不正常 而判断为正常会损失2000元 判断为不正常则损失0 我们来求各种决策方案的风险值和贝叶斯风险 用 1表示 判断设备正常 2表示 判断设备不正常 该决策问题的损失矩阵为 先研究抽取一件产品进行检验的情况 这时共有四个决策方案可供选择 1x 合 2x 合 1 x 2 x 2x 不 1x 不 1x 合 2x 合 3 x 4 x 1x 不 2x 不 我们知道P 1 1 2P 2 1 2P x 合 1 0 8P x 不 1 0 2P x 合 2 0 3P x 不 2 0 7对于决策方案 1 x R 1 1 合 R 1 1 0R 1 1 不 R 1 2 1500R 2 1 合 R 2 1 2000R 2 1 不 R 2 2 0于是 1 x 的风险值为 P 1 1 Ex 1 R 1 1 x R 1 1 合 P x 合 1 R 1 1 不 P x 不 1 0 0 8 1500 0 2 300 元 P 2 1 Ex 2 R 2 1 x R 2 1 合 P x 合 2 R 2 1 不 P x 不 2 2000 0 3 0 0 7 600 元 所以决策方案 1 x 的贝叶斯风险为 B 1 P 1 1 P 1 P 2 1 P 2 300 1 2 600 1 2 450 元 用同样的方法 我们可以求得决策方案 2 x 的贝叶斯风险 B 2 1300 元 对于决策方案 3 x R 1 3 合 R 1 1 0R 1 3 不 R 1 1 0R 2 3 合 R 2 1 2000R 2 3 不 R 2 1 2000于是 3 x 的风险值为 P 1 3 Ex 1 R 1 3 x 0 0 8 0 0 2 0 元 P 2 3 Ex 2 R 2 3 x 2000 0 3 2000 0 7 2000 元 其贝叶斯风险为 B 3 P 1 3 P 1 P 2 3 P 2 0 1 2 2000 1 2 1000 元 用同样的方法可求得决策方案 4 x 的贝叶斯风险为 B 4 750 元 因此 我们若用贝叶斯风险衡量 方案 1 x 优于其他三种决策方案 三 例子的扩展如果抽取两件产品来补充情报信息 这时决策方案共有八个 分别记为 1 2 3 4 5 6 7 8 各个决策方案的风险值和贝叶斯风险见下表 因为x 合 不 与x 不 合 给决策问题补充的情报信息完全一致 因此采取的行动也应相同 表中两者合记为x 1合 1不 下面以 4 为例说明表的计算过程 2x 合 合 4 x 1x 不 不 1x 1合 1不 所以 1500 x 合 合 R 1 4 x 0 x 不 不 0 x 1合 1不 容易证明P 合 合 1 0 64P 不 不 1 0 04P 1合 1不 1 P 不 合 1 P 合 不 1 0 16 0 16 0 32 所以用同样的方法可求得P 2 4 1820 元 得 4 的贝叶斯风险为 B 4 960 0 5 1820 0 5 1390 元 用贝叶斯风险的大小来衡量 决策方案 5 x 1x 合 合 5 x 2x 不 不 1合 1不 的贝叶斯风险最小 故它优于其他的七个决策方案 四 小结贝叶斯原则是贝叶斯风险最小的决策方案为最佳决策方案 补充情报价值 不作情报补充作决策时的平均损失与作情报补充后作决策的平均损失的差 完全情报价值与补充情报价值的关系 定理1 任何补充情报的价值都是非负的 且不超过完全情报的价值 为了简便 我们设情报值只有K种 分别记为x1 x2 xk 若我们取得情报xi 按决策方案 x 采取行动 xi 那么在状态 j时的损失值为R j xi 而这时 j发生的概率为后验概率P j x xi 故各种状态下的平均损失为 我们称为后验损失 又利用全概率公式则P x xi 表示在各种自然状态下情报值为xi的平均概率 定理2 记B 为决策方案 x 的贝叶斯风险 则定理2为我们计算贝叶斯风险提供了另外一种方法 用这个计算公式容易求出最佳决策方案 第五节最佳决策方案 对任何一个决策问题进行求解最佳决策方案 都有两种基本方法 正序分析和反序分析 反序分析所需的计算量少且容易掌握 而且理论上可以证明 反序分析方法求得的最佳决策方案 和正序分析求得的最佳决策方案是一致的 所以反序分析比较常用 一 反序分析 过程 在抽样之前 针对所有可能出现的抽样结局 抽样方法与样本容量均事先拟定 分别计算各自然状态的后验概率 利用这些概率求出各行动方案的后验损失值 然后比较这些后验损失的大小 选择各种抽样结果下的最佳行动方案 综合成最佳决策方案 例3 某公司的产品每1000件装成一箱运交顾客 每箱的不合格品率可分为5 以下 5 到15 之间 以及15 以上三种情况 为了计算简便 这三种状态分别表示为 1 0 05 2 0 10 3 0 15 按照以往的经验 公司的决策者推测 为这三种值的概率分别为0 60 0 30 0 10 即先验概率分布为 P 0 05 0 60P 0 10 0 30P 0 15 0 10 该公司的每箱产品在运交顾客之前 面临这样的决策问题 或是检验箱中每件产品 或是不作任何检验 假如整箱检验 每一件的检验费用为0 1元 于是一箱的检验费用为100元 记这种检验方案为 1 假如整箱都不作检验 顾客买到不合格品时必须准予更换 每更换的一件所需的费用总和为1 25元 这种整箱都不检验的行动方案记为 2 为了更好地对上述问题作出决策 决策者决定从每箱中抽出2件产品检验 并通过这两件产品提供的情报作出最佳决策方案 方法如下 设抽出的两件产品为z1 z2 并规定当第i件产品检验结果为不合格时 记zi 1 否则zi 0 另外设抽样总的结果为 x z1 z2X的值刚好为抽出的两件产品中的不合格品数目 它是一个随机变数 在抽样试验前 我们就能知道 x可能有0 1 2三种结果 x的概率分布时超几何分布 此处可认为x近似服从二项分布 在实际进行抽样试验前 决策者先做下面分析 假定抽样后观察到的不合格品数为0 即x 0 则可计算各状态 1 2 3的后验概率 及每一种可能行动方案 1 2的后验损失 计算格式及结果如表14 5所示 表中数值显示行动 1的后验损失为100元 而行动 2的后验损失为90 75元 故出现x 0的抽样结果时 最佳行动方案为 2 表14 5不合格品为0件 即x 0 时后验损失表 假设抽样结果为x 1 作计算列入表14 6中可得最佳行动方案为 1 最后假设抽样结果为x 2 计算结果列入表14 7中得最佳行动方案为 1 综合这些结论即得最佳决策方案为 1x 1 2 x 2x 0 表14 6不合格品为1件 即x 1 时后验损失表 表14 7不合格品为2件 即x 2 时后验损失表 下面用决策树来表示反序决策过程 仍以例3为例 得到如下决策树 在决策树中 在各种状态变量下 所抽取的两件产品中没有一件不合格品的概率P可由全概率公式计算如下 P P x 0 P x 0 0 05 P 0 05 P x 0 0 10 P 0 10 P x 0 0 15 P 0 15 用二项分布近似计算 P x 0 0 05 0 95 2 0 90
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 政府资助申请书
- 房屋租金评估申请书
- 高校专升本申请书
- 健身教练申请书的草稿
- 2025合同样例兼职翻译合同范本
- 申请书弹性坐班
- 2025武汉商铺出租合同范本
- 2025年三级安全教育考试试题电焊工(附答案)
- 书记辞职申请书
- 2025八肯中村老旧棚区改造升级项目施工合同
- 耳部解剖及急慢性中耳炎课件
- 工程项目投资与融资讲义 课件
- 食品质量安全抽检数据分析模型优质资料
- 盘扣支模架工程监理细则
- 承插型盘扣式钢管进场验收记录表
- 军事训练教学法模板课件
- 常见的无脊椎动物(PPT课件)
- 物流设施与设备ppt课件(完整版)
- 交通运输安全管理整套教学课件
- 安检员X射线机培训-共86页课件
- (作业辅导)福建师范大学2022年8月课程考试《小学班队原理与班主任工作》作业考核试题
评论
0/150
提交评论