博弈的王道——『Sprague-Grundy函数和Sprague-Grundy定理』
SG函数:
首先定义mex(minimal excludant)运算,这是施加于一个集合的运算,表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。
对于任意状态 x (玩家当前面临的石子个数), 定义 SG(x) = mex(S),其中 S 是 x 后继状态的SG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c),那么SG(x) = mex{SG(a),SG(b),SG(c)}。 这样 集合S 的终态必然是空集,所以SG函数的终态为 SG(x) = 0,当且仅当 x 为必败点P时。
结论:
*1.当SG[x] = 0时,x为必败状态。*
*2.当SG[x] > 0时,x为必胜状态。*
【实例】取石子问题
有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f[]={1,3,4},
x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4- f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
下面以x = 5时做样例分析:
当玩家面对还有5个石子的状态时,他可取{1,3,4}个石子,那么5的后继状态集合就是{4,2,1}。
那么mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3 ,可得出SG[5] = 3 > 0,为必胜态。
以此类推.....
x 0 1 2 3 4 5 6 7 8....
SG[x] 0 1 0 1 2 3 2 0 1....
由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:
1、使用 数组f []将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组S[] 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。
SG 定理就是:SG(G)=SG(G1)SG(G2)...^SG(Gn)。也就是说,原游戏的SG函数值是它的所有子游戏的SG函数值的异或。
解题模型:
1.把原游戏分解成多个独立的子游戏,则原游戏的SG函数值是它的所有子游戏的SG函数值的异或。
即SG(G)=SG(G1)SG(G2)...^Sg(Gn)。
2.分别考虑每一个子游戏,计算其SG值。
SG值的计算方法:(重点)
a.可选步数为1~m的连续整数,直接取模即可,SG(x) = x % (m+1)(Bash game)。
b.可选步数为任意步,SG(x) = x(Nim game)。
c.可选步数为一系列不连续的数,用模板计算。
// i.打表模板
int f[N],SG[MAXN],S[MAXN];//f[] - 可改变当前状态 的方式 S[] - 当前状态的后继状态集合
//打表
void getSG(int n) {
int i,j;
memset(SG,0,sizeof(SG));
for(i = 1; i <= n; i++) {
memset(S,0,sizeof(S));
for(j = 0; f[j] <= i && j <= N; j++)
S[SG[i-f[j]]] = 1;//S[]数组来保存当前状态的后继状态集合
for(j = 0;; j++) if(!S[j]) {//模拟mex运算
SG[i] = j;
break;
}
}
}
3.若SG(G)=SG(G1)SG(G2)...^SG(Gn) > 0,局势为N,先手必胜,反之局势为P,先手必败。
普遍优先使用打表法,只用在打表无法使用的时候再使用深搜。