




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、14.5 极小极大分析法 在博弈过程中,任何一方都希望自己取得胜利。因此,当某一方当前有多个行动方案可供选择时,他总是挑选对自己最为有利而对对方最为不利的那个行动。24.5.1 静态估值静态估值 根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分。 此时估算出来的得分称为静态估值静态估值。3例例1:一字棋游戏。:一字棋游戏。 设有如图所求的九个空格,由a,b二个对弈,轮到谁走棋就往空格上放一只自己的棋子,谁先使自已的棋子构成“三子成一线”谁就取得了胜利 。设a的棋子用来表示,b的棋子用来表示。 根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分_-静
2、态估值静态估值(decide which one is better)4估价函数定义:设棋局为p,估价函数为e(p).若p是胜负未定的棋局,则e(p)= e(+p)- e(-p) 其中 e(+p)表示棋局p上有可能使成为三子一线的数目。e(-p) 表示棋局p上有可能使成为三子一线的数目。5e(p) = 6 4 = 2e(-p) 表示棋局p上有可能使成为三子一线的数目。6 根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分_-静态估值静态估值(decide where next black one will go)例例2:5 chesspiece game 4.5.2 极小
3、极大分析法基本思想极小极大分析法基本思想(1)站在站在x方方 设博弈的双方中一方为x,另一方为y,站在站在x方方立场上为其寻找一个最优行动方案。(2)向前搜索向前搜索若干步 为了找到当前的最优行动方案,需对各个可能的方案所产生的后果进行比较。 考虑每一方案实施后对方可能采取的所有行动,并计算计算每一方案每一方案可能的得可能的得分分。为比较不同方案的优劣比较不同方案的优劣,需向前搜索向前搜索若干步。8example 3274-114 根据估价函数估价函数,估算当前博弈树节点的得分。7分是最好的格局。在众多的可能格局中,如何达到最好的?9 (3)倒推值倒推值-极小极大分析法极小极大分析法 当端节点
4、的估值计算出来后,再推算出父节推算出父节点的得分点的得分,这样计算出的父节点的得分称为倒推倒推值值 。对对“或或”节点节点,选其子节点中一个最大最大的得分作为父节点的得分;对对“与与”节点节点,选其子节点中一个最小最小的得分作为父节点的得分;1032274-1-1114-2-2643532example 411极小极大分析法-当前最好的行动行动方案对对“或或”节点节点,选其子节点中一个最大最大的得分作为父节点的得分,这是为了使自己在可供选择的方案中选一个对自己最有利的方案;对对“与与”节点节点,选其子节点中一个最小最小的得分作为父节点的得分,这是为了立足于最坏的情况。 估价函数是估价函数是站在
5、站在x方方立场上估计分数, 当格局对对方有利时,估价估价函数给出的函数给出的估计分值分值 小小(对对x方方而言而言). 如果一个行动方案能获得较大的倒推值,则它就是当前最好的行动行动方案。1232274-1-1114-2-2643532example 5当前最好的行动行动方案分别是?13所有可能的格局example 6站在x方方向前搜索 根据估价函数估价函数,估算当前博弈树节点的得分。当前最好的行动行动方案是?1423232274-1-1224-2-264353446-56-51863268213343example 6当前最好的行动行动方案是?15例例7:一字棋游戏。:一字棋游戏。 设有如图
6、所求的九个空格,由a,b二个对弈,轮到谁走棋就往空格上放一只自己的棋子,谁先使自已的棋子构成“三子成一线”谁就取得了胜利 。设a的棋子用来表示,b的棋子用来表示。16估价函数定义:设棋局为p,估价函数为e(p).(1) 若p是a必胜的棋局,则e(p)=+. (2) 若p是b必胜的棋局,则e(p)= .(3) 若p是胜负未定的棋局,则e(p)= e(+p)- e(-p) 其中 e(+p)表示棋局p上有可能使成为三子一线的数目。e(-p) 表示棋局p上有可能使成为三子一线的数目。17e(p) = 6 4 = 2e(-p) 表示棋局p上有可能使成为三子一线的数目。18 假定:1. a先走棋,站在a的
7、立场上。2. 博弈树每次仅扩展两层3. 具有对称性的两个棋局算作一个棋局。 图中节点旁的数字分别表示相应节点的静态估值或倒推值。 由图可以看出,对于a来说最好的一步棋是s3,因为 s3比s1和s2有较大的倒推值。 在a走s3这一步棋后,b的最优选择是s4,因为这一步棋的静态估值较小,对a不利。 不管b选择s4 或s5,a都要再次运用极小极大分析法产生深度为2的博弈树,以决定下一步应该如何走棋,其过程与上面类似。 图如下页19一字棋极小极大搜索s0s1s2s3s4s520双方博弈4步后的当前格局summary 双方博弈过程中出现过的格局 初始格局max-min help one side to to take action.212232274-1-1224-2-264353446-56-543example 8当前最好的行动
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年贡嘎辅警考试题库(附答案)
- 初中开学典礼暨“超少年·国防志-青春向国旗少年有担当”主题升旗仪式主持稿
- 2025年高端会计人才考试题库(附答案)
- 麻风竞赛答题库及答案
- 东湖学院食堂管理办法
- 襄阳市绿化管理办法
- 网络交易管理办法
- 街巷硬化养护管理办法
- 个人信息泄露管理办法
- 专职队员绩效管理办法
- 2025-2030年积木产业市场深度调研及发展趋势与投资战略研究报告
- DB4403T 508-2024《生产经营单位锂离子电池存储使用安全规范》
- 2025届云南省红河州英语七下期末学业质量监测模拟试题含答案
- 静脉输液安全试题及答案
- 基于“筋膜”理论治疗百日咳痉咳期
- 艺术品版权授权协议范本6篇
- T/CECS 10021-2019照明用LED驱动电源技术要求
- T/CCS 060-2023智能化煤矿运维组织架构管理规范
- 小红书运营合伙协议书
- 呼吸与危重症医学科
- 2025年储能电池热管理技术在船舶动力系统中的应用研究报告
评论
0/150
提交评论