读书笔记: 博弈论导论

zoukankan html css js c++ java

读书笔记: 博弈论导论
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈序贯理性

在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

子博弈精炼(subgame perfection)

序贯理性就是要求玩家总是选择最佳反应。
子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。
- 在均衡路径上(on the equilibrium path), 不在均衡路径上(off the equilibrium path)
  (sigma^* = (sigma_1^*, cdots, sigma_n^*))是一个不完整信息博弈的贝叶斯纳什均衡。
  我们说一个信息集在均衡路径上(on the equilibrium path)，如果给定的(sigma^*)和类型分布，这个信息集有正可能性到达。
  我们说一个信息集不在均衡路径上(off the equilibrium path)，如果给定的(sigma^*)和类型分布，这个信息集被到达的可能性为0。
- 信念体系
  一个信念体系(mu),在一个扩展形式博弈中，给每个信息集的每个决策点(decision node)都分配了一个概率。
[mu(x) in [0, 1] \ sum_{x in h} mu(x) = 1, forall h in H ]
- 贝叶斯规则(Bayes' Rule)
  (Pr {A|B } = frac{Pr {A land B } }{Pr {A land B } + Pr {lnot A land B }})
精炼贝叶斯均衡(perfect Bayesian equilibrium)的四个需求：
- 需求 15.1
  每个玩家在每个信息集上，都将有一个意义明确的信念（关于他的位置）。也就是说博弈将有一个信念体系。
- 需求 15.2
  (sigma^* = (sigma_1^*, cdots, sigma_n^*))是一个不完整信息博弈的贝叶斯纳什均衡，我们要求在所有信息集上，在均衡路径上的信念符合贝叶斯规则。
- 需求 15.3
  对于不在均衡路径上的信息集，其信念值可以是任何值。
- 需求 15.4
  给定玩家的信念，玩家的策略必须是序贯理性。也就是说在每一个信息集上，玩家将选择信念对应的最佳反应。
- 精炼贝叶斯均衡(perfect Bayesian equilibrium)
  如果满足需求15.1 ~ 15.4，一个贝叶斯纳什均衡(sigma^* = (sigma_1^*, cdots, sigma_n^*))和一个信念体系(mu^*)构成一个精炼贝叶斯均衡。
精炼贝叶斯均衡也是贝叶斯纳什均衡和子博弈精炼均衡。

推论 15.1
一个（可能是混合的）策略组合(sigma^* = (sigma_1^*, cdots, sigma_n^*))是一个贝叶斯博弈(Gamma)的贝叶斯纳什均衡，
如果策略组合(sigma^*)能使所有的信息集都有具有可能性到达，
则策略组合(sigma^*)和(从这个策略组合(sigma^*)和类型的概率分布获得的)信仰系统(mu^*)一起，
就构成了一个精炼贝叶斯均衡(perfect Bayesian equilibrium)。

序贯均衡(Sequential Equilibrium)
- 一致的策略组合和信念体系
  一个策略组合(sigma^* = (sigma_1^*, cdots, sigma_n^*))和一个信念体系(mu^*)是一致的，
  如果存在一系列的非退化的混合策略组合({ sigma^k }_{k=1}^{infty})和一系列(根据贝叶斯规则获得的)信任({ mu^k }_{k=1}^{infty})，
  有(lim_{k o infty} (sigma^k, mu^k) = (sigma^*, mu^*))。
解释：

这里的意思是：策略组合和信念体系可以互相迭代求解（也可以理解为一个序贯均衡的求解方式）
策略应该简单地最大化每个信息集的预期收益。
那些在策略中得到正概率的信息集合的合理信念，应该是信息集合节点上的条件概率分布（根据贝叶斯规则）。
- 序贯均衡(Sequential Equilibrium)
  一个策略组合(sigma^* = (sigma_1^*, cdots, sigma_n^*))和一个信念体系(mu^*)是一个序贯均衡，
  如果((sigma^*, mu^*))是一个一致的精炼贝叶斯均衡。
解释：

序贯均衡是一个精炼贝叶斯均衡。
而一个精炼贝叶斯均衡的策略组合和信念体系是一致的（根据一致性推导所得），这个精炼贝叶斯均衡才是一个序贯均衡。

序贯均衡由于难以应用，较少被使用。

参照
查看全文

相关阅读:
无锁数据结构（Lock-Free Data Structures）
Grouping Sets:CUBE和ROLLUP从句
 SQL Server里Grouping Sets的威力
 第18/24周乐观并发控制（Optimistic Concurrency）
SQL Server里PIVOT运算符的”红颜祸水“
数据库收缩：NOTRUNCATE与TRUNCATEONLY
在SQL Server里为什么我们需要更新锁
 SQL Server里的自旋锁介绍
 SQL Server里的闩锁介绍
 配置内存中OLTP文件组提高性能

原文地址：https://www.cnblogs.com/steven-yang/p/8393486.html

读书笔记: 博弈论导论

读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性

在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information)

子博弈精炼(subgame perfection)

序贯均衡(Sequential Equilibrium)

参照

读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈序贯理性