博弈论

zoukankan html css js c++ java

博弈论
博弈的王道——『Sprague-Grundy函数和Sprague-Grundy定理』

SG函数：

首先定义mex(minimal excludant)运算，这是施加于一个集合的运算，表示最小的不属于这个集合的非负整数。例如mex{0,1,2,4}=3、mex{2,3,5}=0、mex{}=0。

对于任意状态 x (玩家当前面临的石子个数)，定义 SG(x) = mex(S),其中 S 是 x 后继状态的SG函数值的集合。如 x 有三个后继状态分别为 SG(a),SG(b),SG(c)，那么SG(x) = mex{SG(a),SG(b),SG(c)}。这样集合S 的终态必然是空集，所以SG函数的终态为 SG(x) = 0,当且仅当 x 为必败点P时。

结论：

*1.当SG[x] = 0时，x为必败状态。*

*2.当SG[x] > 0时，x为必胜状态。*

【实例】取石子问题

有1堆n个的石子，每次只能取{ 1, 3, 4 }个石子，先取完石子者胜利，那么各个数的SG值为多少？

SG[0]=0，f[]={1,3,4},

x=1 时，可以取走1 - f{1}个石子，剩余{0}个，所以 SG[1] = mex{ SG[0] }= mex{0} = 1;

x=2 时，可以取走2 - f{1}个石子，剩余{1}个，所以 SG[2] = mex{ SG[1] }= mex{1} = 0;

x=3 时，可以取走3 - f{1,3}个石子，剩余{2,0}个，所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;

x=4 时，可以取走4- f{1,3,4}个石子，剩余{3,1,0}个，所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;

x=5 时，可以取走5 - f{1,3,4}个石子，剩余{4,2,1}个，所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;

下面以x = 5时做样例分析:

当玩家面对还有5个石子的状态时，他可取{1，3，4}个石子，那么5的后继状态集合就是{4，2，1}。

那么mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3 ，可得出SG[5] = 3 > 0,为必胜态。

以此类推.....

x 0 1 2 3 4 5 6 7 8....

SG[x] 0 1 0 1 2 3 2 0 1....

由上述实例我们就可以得到SG函数值求解步骤，那么计算1~n的SG函数值步骤如下：

1、使用数组f []将可改变当前状态的方式记录下来。

2、然后我们使用另一个数组S[] 将当前状态x 的后继状态标记。

3、最后模拟mex运算，也就是我们在标记值中搜索未被标记值的最小值，将其赋值给SG(x)。

4、我们不断的重复 2 - 3 的步骤，就完成了计算1~n 的函数值。

SG 定理就是：SG(G)=SG(G1)^SG(G2)...^SG(Gn)。也就是说，原游戏的SG函数值是它的所有子游戏的SG函数值的异或。

解题模型：

1.把原游戏分解成多个独立的子游戏，则原游戏的SG函数值是它的所有子游戏的SG函数值的异或。

即SG(G)=SG(G1)^SG(G2)...^Sg(Gn)。

2.分别考虑每一个子游戏，计算其SG值。

SG值的计算方法：（重点）

a.可选步数为1~m的连续整数，直接取模即可，SG(x) = x % (m+1)（Bash game）。

b.可选步数为任意步，SG(x) = x（Nim game）。

c.可选步数为一系列不连续的数，用模板计算。
```
 // i.打表模板

int f[N],SG[MAXN],S[MAXN];//f[] - 可改变当前状态 的方式   S[] - 当前状态的后继状态集合
//打表
void getSG(int n) {
	int i,j;
	memset(SG,0,sizeof(SG));
	for(i = 1; i <= n; i++) { 
		memset(S,0,sizeof(S));
		for(j = 0; f[j] <= i && j <= N; j++)
			S[SG[i-f[j]]] = 1;//S[]数组来保存当前状态的后继状态集合
		for(j = 0;; j++) if(!S[j]) {//模拟mex运算
				SG[i] = j;
				break;
			}
	}
}
```
3.若SG(G)=SG(G1)^SG(G2)...^SG(Gn) > 0,局势为N，先手必胜，反之局势为P，先手必败。

普遍优先使用打表法，只用在打表无法使用的时候再使用深搜。
查看全文

相关阅读:
将方法作为方法的参数
 远程桌面无响应解决方案(转)
QQ通信机制（转）
电脑管家禁止程序修改文档后如何恢复权限
 SQL Sever——远程过程调用失败（0x800706be）
JavaScript学习笔记之JavaScript调用C#编写的COM组件
 kendoUI 免费部分开发部分经验。
mongoDB连接信息及生成对应的collection生成代码
 写个匹配某段html dom代码某属性的正则匹配方法
 微信获取用户支付共享地址

原文地址：https://www.cnblogs.com/bangdexuanyuan/p/13416296.html

博弈的王道——『Sprague-Grundy函数和Sprague-Grundy定理』