读书笔记: 博弈论导论

zoukankan html css js c++ java

读书笔记: 博弈论导论
读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈理性和公共知识

理性和公共知识

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

纯策略中的优势(dominance)
- 数学表达: 除了玩家i以外所有玩家的策略集合
[S equiv S_1 imes S_2 imes cdots S_n \ S_{-i} equiv S_1 imes S_2 imes cdots imes S_{i-1} imes S_{i+1} imes cdots S_n \ s = (s_1, s_2, cdots, s_n) \ s_{-i} = (s_1, s_2, cdots, s_{i-1}, s_{i+1}, cdots, s_n) \ s = (s_i, s_{-i}) ]
(S): 所有人的所有策略组合。
(S_{-i}): 除了玩家(i)以外，所有人的所有策略组合。
(s): 所有人的一种策略组合。
(s_{-i}): 除了玩家(i)以外，所有人的一种策略组合。
引进(S_{-i})和(s_{-i})是为了
1. 通过看玩家i以外的所有玩家的策略，来考虑玩家i的策略。
2. 或者专门看玩家i策略。
劣势（被支配）策略(Dominated Strategies)
- 定义 4.1：严格劣势于
  对于玩家i，策略(s'_i)严格劣势于(s_i)，则：
[v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), forall s_{-i} in S_{-i} ]
断言 4.1

一个理性玩家不会选择一个严格劣势策略。

优势策略(Dominant Strategies)
- 定义 4.2：严格优势策略(strictly dominant strategy)
  策略(s_i in S_i)是一个严格优势策略，如果玩家i的任何其它策略都严格劣势于(s_i)。
[v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), forall s'_i in S_i, s'_i eq s_i, and forall s_{-i} in S_{-i} ]
- 定义 4.3：严格优势策略均衡(strictly dominant strategy equilibrium)
  策略组合(s^D in S_i)是一个严格优势策略均衡，如果其中每一个玩家i的策略都是严格优势策略。
[s_i equiv s_i^D, forall i in N ]
推论 4.1

如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D)，则(s^D)是唯一的严格优势策略均衡。

断言 4.2

如果有的话，玩家一定会选择优势策略。

策略，策略集合，策略组合和策略均衡
- 策略(strategy)
  (s_i)是玩家的一个策略。
- 策略集合(strategy set)
  (S_i)是玩家的所有策略集合。(s_i in S_i)
  (S)是所有玩家的所有策略的组合的集合。
- 策略组合(strategy profile)
  (s)是N个玩家的一种策略组合。(s = (s_1, s_2, cdots, s_n), s in S)
- 策略均衡(strategy equilibrium)
  (s)是任何一种导致合理结果的策略组合。
方法：严格劣势策略的迭代消除

博弈论方法就是一个寻找均衡的过程。
方法名：IESDS(Iterated Elimination of Strictly Dominated Strategies)
基本逻辑：

一个理性玩家不会选择一个严格劣势策略。
如果有的话，玩家一定会选择优势策略。
过程：略
- 迭代消除均衡(Iterated elimination equilibrium)
  严格劣势策略的迭代消除(IESDS)过程中幸存下来的博弈组合(s^{ES})。
推论 4.2

如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))，(s^*)是一个严格优势策略均衡，则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

信念(Beliefs)，最佳响应(Best Response)和可合理化(Rationalizability)

在已经学习的两个方法严格优势策略和严格劣势策略的迭代消除(IESDS)之外的情况下，如果玩家i的一个策略(s_i)不是一个严格劣势策略，那就意味着在一定条件下（对手的某些策略下），策略(s_i)是一个合理的响应。
- 最佳响应(best response)
  玩家i的策略(s_i in S_i)是对手策略(s_{-i} in S_{-i})的最佳响应，则:
[v_i(s_i, s_{-i}) geq v_i(s'_i, s_{-i}), forall s'_i in S_i ]
- 信念(belief)
  一个玩家i的信念就是一个他对手们的可能策略组合(s_{-i} in S_{-i})。
- 最佳响应对应(best-response correspondence)
  最佳响应对应(BR_i(s_{-i}))，是玩家i，在他的对手们的策略组合(s_{-i})上的所有可能最佳响应的集合。
  (BR_i(s_{-i}))可以认为是一个函数，其结果是一个集合。
- 不是一个最佳响应(never a best response)
  玩家i，对于他的对手们的策略组合(s_{-i})的最佳响应集合(BR_i(s_{-i}))，如果(s_{-i})不是在信任集合里，则(s_i in BR_i(s_{-i}))都不是最佳响应。
总结

方法
- 严格优势策略
- 严格劣势策略的迭代消除(IESDS)
- 去掉不可信的策略组合（或者保留可信的策略组合）。
推论 4.1

如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D)，则(s^D)是唯一的严格优势策略均衡。

推论 4.2

如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))，(s^*)是一个严格优势策略博弈，则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

推论 4.3

对于玩家i，一个严格劣势策略(s_i)，不可能是任何(s_{-i} in S_{-i})的最佳响应。

推论 4.4

在一个有限普通形式的博弈中，(s^*)是一个严格优势策略，或者是一个唯一的严格劣势策略的迭代消除(IESDS)均衡，
则s_i^*是一个对于任何(s_{-i} in S_{-i})的最佳响应。

断言 4.1

一个理性玩家不会选择一个严格劣势策略。

断言

如果有的话，玩家一定会选择优势策略。

断言 4.2

一个理性玩家，在认为他的对手选择策略(s_{-i} in S_{-i})时，总会选择(s_{-i})的最想响应。

断言

一个理性玩家只会选择(他对手们的策略组合的)最佳响应。

参照
- Game Theory An Introduction (by Steven Tadelis)
查看全文

相关阅读:
BLOB
cesium 检测视图改变的代码
 有关Nodejs的一些插件介绍
 线程基础知识
 进程和线程概念对比
 C#对象与XMl文件之间的相互转换（转）
简介C#读取XML的方式（转）
关于c# Debug和Release的区别（转）
c++堆和栈（转）
浅谈C#堆栈与托管堆的工作方式（转）

原文地址：https://www.cnblogs.com/steven-yang/p/8088030.html

读书笔记: 博弈论导论

读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识

理性和公共知识

纯策略中的优势(dominance)

劣势（被支配）策略(Dominated Strategies)

优势策略(Dominant Strategies)

策略，策略集合，策略组合和策略均衡

方法：严格劣势策略的迭代消除

信念(Beliefs)，最佳响应(Best Response)和可合理化(Rationalizability)

总结

参照

读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈理性和公共知识