zoukankan      html  css  js  c++  java
  • 博弈论

    博弈的王道——『Sprague-Grundy函数和Sprague-Grundy定理』

    SG函数:

    ​ 首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

    ​ 对于任意状态 x (玩家当前面临的石子个数), 定义 SG(x) = mex(S),其中 S 是 x 后继状态的SG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。 这样 集合S 的终态必然是空集,所以SG函数的终态为 SG(x) = 0,当且仅当 x 为必败点P时。

    结论:

    *1.当SG[x] = 0时,x为必败状态。*

    *2.当SG[x] > 0时,x为必胜状态。*

    【实例】取石子问题

    有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?

    SG[0]=0,f[]={1,3,4},

    x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;

    x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;

    x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;

    x=4 时,可以取走4- f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;

    x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;

    下面以x = 5时做样例分析:

    当玩家面对还有5个石子的状态时,他可取{1,3,4}个石子,那么5的后继状态集合就是{4,2,1}。

    那么mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3 ,可得出SG[5] = 3 > 0,为必胜态。

    以此类推.....

    x 0 1 2 3 4 5 6 7 8....

    SG[x] 0 1 0 1 2 3 2 0 1....

    由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:

    1、使用 数组f []将 可改变当前状态 的方式记录下来。

    2、然后我们使用 另一个数组S[] 将当前状态x 的后继状态标记。

    3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。

    4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。

    SG 定理就是:SG(G)=SG(G1)SG(G2)...^SG(Gn)。也就是说,原游戏的SG函数值是它的所有子游戏的SG函数值的异或。

    解题模型:

    1.把原游戏分解成多个独立的子游戏,则原游戏的SG函数值是它的所有子游戏的SG函数值的异或。

    即SG(G)=SG(G1)SG(G2)...^Sg(Gn)。

    2.分别考虑每一个子游戏,计算其SG值。

    SG值的计算方法:(重点)

    a.可选步数为1~m的连续整数,直接取模即可,SG(x) = x % (m+1)(Bash game)。

    b.可选步数为任意步,SG(x) = x(Nim game)。

    c.可选步数为一系列不连续的数,用模板计算。

     // i.打表模板
    
    int f[N],SG[MAXN],S[MAXN];//f[] - 可改变当前状态 的方式   S[] - 当前状态的后继状态集合
    //打表
    void getSG(int n) {
    	int i,j;
    	memset(SG,0,sizeof(SG));
    	for(i = 1; i <= n; i++) { 
    		memset(S,0,sizeof(S));
    		for(j = 0; f[j] <= i && j <= N; j++)
    			S[SG[i-f[j]]] = 1;//S[]数组来保存当前状态的后继状态集合
    		for(j = 0;; j++) if(!S[j]) {//模拟mex运算
    				SG[i] = j;
    				break;
    			}
    	}
    }
    

    3.若SG(G)=SG(G1)SG(G2)...^SG(Gn) > 0,局势为N,先手必胜,反之局势为P,先手必败。

    普遍优先使用打表法,只用在打表无法使用的时候再使用深搜。

  • 相关阅读:
    Thymeleaf 基本表达式
    html中<radio>单选按钮控件标签用法解析及如何设置默认选中
    <%@ page contentType="text/html; charset=utf-8" language="java"%>每一个字符的含义
    El表达式的关系运算符
    Centos7.6安装Docker安装
    linux必须熟练掌握的基础命令
    CentOS7.x编译安装zabbix4.0
    编译装php7.2 && nginx-1.14
    CentOS7.x安装MySQL5.7.25
    CentOS7.x安装kickstart
  • 原文地址:https://www.cnblogs.com/bangdexuanyuan/p/13416296.html
Copyright © 2011-2022 走看看