1、14.5 极小极大分析法 在博弈过程中,任何一方都希望自己取得胜利。因此,当某一方当前有多个行动方案可供选择时,他总是挑选对自己最为有利而对对方最为不利的那个行动。24.5.1 静态估值静态估值 根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分。此时估算出来的得分称为静态估值静态估值。3例例1:一字棋游戏。:一字棋游戏。设有如图所求的九个空格,由A,B二个对弈,轮到谁走棋就往空格上放一只自己的棋子,谁先使自已的棋子构成“三子成一线”谁就取得了胜利。设A的棋子用来表示,B的棋子用来表示。根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分_-静态估值静
2、态估值(decide which one is better)4估价函数定义:设棋局为P,估价函数为e(P).若P是胜负未定的棋局,则e(P)=e(+P)-e(-P)其中 e(+P)表示棋局P上有可能使成为三子一线的数目。e(-P)表示棋局P上有可能使成为三子一线的数目。5e(P)=6 4=2e(-P)表示棋局P上有可能使成为三子一线的数目。6 根据问题的特性信息定义一个估价函数估价函数,用来估算当前博弈树节点的得分_-静态估值静态估值(decide where next black one will go)例例2:5 chesspiece game 4.5.2 极小极大分析法基本思想极小极大
3、分析法基本思想 站在站在X方方 设博弈的双方中一方为X,另一方为Y,站在站在X方方立场上为其寻找一个最优行动方案。(2)向前搜索向前搜索若干步 为了找到当前的最优行动方案,需对各个可能的方案所产生的后果进行比较。考虑每一方案实施后对方可能采取的所有行动,并计算计算每一方案每一方案可能的得可能的得分分。为比较不同方案的优劣比较不同方案的优劣,需向前搜索向前搜索若干步。8Example 3274-114 根据估价函数估价函数,估算当前博弈树节点的得分。7分是最好的格局。在众多的可能格局中,如何达到最好的?9(3)倒推值倒推值-极小极大分析法极小极大分析法 当端节点的估值计算出来后,再推算出父节推算
4、出父节点的得分点的得分,这样计算出的父节点的得分称为倒推倒推值值。对对“或或”节点节点,选其子节点中一个最大最大的得分作为父节点的得分;对对“与与”节点节点,选其子节点中一个最小最小的得分作为父节点的得分;1032274-1-1114-2-2643532Example 411极小极大分析法-当前最好的行动行动方案对对“或或”节点节点,选其子节点中一个最大最大的得分作为父节点的得分,这是为了使自己在可供选择的方案中选一个对自己最有利的方案;对对“与与”节点节点,选其子节点中一个最小最小的得分作为父节点的得分,这是为了立足于最坏的情况。估价函数是估价函数是站在站在X方方立场上估计分数,当格局对对方
5、有利时,估价估价函数给出的函数给出的估计分值分值 小小(对对X方方而言而言).如果一个行动方案能获得较大的倒推值,则它就是当前最好的行动行动方案。1232274-1-1114-2-2643532Example 5当前最好的行动行动方案分别是?13所有可能的格局Example 6站在X方方向前搜索 根据估价函数估价函数,估算当前博弈树节点的得分。当前最好的行动行动方案是?1423232274-1-1224-2-264353446-56-51863268213343Example 6当前最好的行动行动方案是?15例例7:一字棋游戏。:一字棋游戏。设有如图所求的九个空格,由A,B二个对弈,轮到谁走棋
6、就往空格上放一只自己的棋子,谁先使自已的棋子构成“三子成一线”谁就取得了胜利。设A的棋子用来表示,B的棋子用来表示。16估价函数定义:设棋局为P,估价函数为e(P).若P是A必胜的棋局,则e(P)=+.若P是B必胜的棋局,则e(P)=.若P是胜负未定的棋局,则e(P)=e(+P)-e(-P)其中 e(+P)表示棋局P上有可能使成为三子一线的数目。e(-P)表示棋局P上有可能使成为三子一线的数目。17e(P)=6 4=2e(-P)表示棋局P上有可能使成为三子一线的数目。18 假定:A先走棋,站在A的立场上。博弈树每次仅扩展两层 具有对称性的两个棋局算作一个棋局。图中节点旁的数字分别表示相应节点的
7、静态估值或倒推值。由图可以看出,对于A来说最好的一步棋是S3,因为 S3比S1和S2有较大的倒推值。在A走S3这一步棋后,B的最优选择是S4,因为这一步棋的静态估值较小,对A不利。不管B选择S4 或S5,A都要再次运用极小极大分析法产生深度为2的博弈树,以决定下一步应该如何走棋,其过程与上面类似。图如下页19一字棋极小极大搜索S0S1S2S3S4S520双方博弈4步后的当前格局Summary 双方博弈过程中出现过的格局 初始格局Max-Min help one side to to take action.212232274-1-1224-2-264353446-56-543Example 8当前最好的行动行动方案46-5-56-564IF B走当前方案双方再博弈4步后的格局.22 0S01345211 21 11 211当前格局S0格局S1S5是A方5种选择B分别应对格局S1S5S4 倒推值最大A方最佳方案S4Example 9