读书笔记: 博弈论导论

zoukankan html css js c++ java

读书笔记: 博弈论导论
读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈预备知识

预备知识

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

知识点
- 静态完全信息博弈(static games of complete information)
  第一步：每个玩家同时并且独立的选择一个行动，（每个玩家都不知道别人的选择情况）
  第二步：根据所有玩家选择的行动，收益被分布到每个玩家。
- 完全信息博弈(Games of Complete Information)
  一个完全信息博弈要求：下面四部分是博弈中所有玩家的公共知识。
  
  所有玩家的所有可能的行动
  
  所有可能的结果
  
  所有玩家的各种行动组合产生什么样的结果
  
  每个玩家对结果的倾向
- 公共知识(common knowledge)
  一个公共知识是一个事件E，并且 (1) 每个人都知道, (2) 每个人都知道每个人都知道，像这样无限循环下去。
普通形式博弈
- 普通形式博弈(normal-form game)有下面三个特征：
  
  一组玩家
  
  每个玩家有一套行动
  
  一套收益函数：每个玩家的行动组合都有一个收益值。
- 策略(strategy)
  打算完成一个特定目标的行动计划。
- 纯策略(pure strategy)
  玩家i的一个纯策略是一个确定性的（意味着没有随机性）行动计划。
  (S_i)用来表示玩家i的所有纯策略。
- 所有玩家的纯策略组合(a profile of pure strategies)
  (s = (s_i, s_2, cdots, s_n), s_i in S_i ext{ for all } i = 1,2,cdots, n)
  代表在一个博弈中所有n的玩家的一组选择的纯策略组合。
- 普通形式博弈(normal-form game)的数学表达
  
  一个有限的玩家集合, (N = {1, 2, cdots, n})
  
  每个玩家的纯策略集合的组合, ({S_1, S_2, cdots, S_n})
  
  一套收益函数, ({v_1, v_2, cdots, v_n})，对于每个玩家，每一种所有玩家选择的策略组合，都有一个收益值。
  $v_i: S_1 imes S_2 imes cdots imes S_n ext{ for each } i in N $
- 普通形式博弈(normal-form game)的数学表达例子：囚徒困境(The Prisoner's Dilemma)
Players:(N = {1,2})
Strategy sets: (S_i = {M, F} for i in N)
Payoffs: Let (v_i(s_1, s_2)) be the payoff to player i if player 1 choose (s_1) and player 2 chooses (s_2)
We can then write payoff are
(v_1(M, M) = v_2(M, M) = -2)
(v_1(F, F) = v_2(F, F) = -4)
(v_1(F, M) = v_2(F, M) = -5)
(v_1(M, F) = v_2(M, F) = -1)
M: mum 沉默; F:fink 告密

2人有限博弈的矩阵表达
- 例子：囚徒困境(The Prisoner's Dilemma)
Player 2

M F

Player 1 M -2, -2 -5, -1

F -1, -5 -4, -4

方案设想(solution concept)
- 方案设想(solution concept)
  方案设想(solution concept)是一个分析博弈的方法，用于限定出所有可能的合理结果。
  一个方案设想将导致一个预言或者处方。
- 均衡(equilibrium)
  任何一种可以产生方案设想预言的策略组合。
  也就是可以任何一种导致合理结果的策略组合。
如果用因果关系来说明，均衡是（可以导致合理结果的）因，方案设想是（可以导致合理结果的）分析方法，因果关系的公共知识。
从权衡方面来说：方案设想就是一个权衡。均衡的权衡的结果。
- 方案设想的假设条件
  
  玩家是理性的
  
  玩家是智力的
  
  公共知识：“玩家是理性的”和“玩家是智力的”是所有玩家的公共知识。
  
  自我执行：方案设想的均衡必须是自我执行的。（每个玩家都会采用一种均衡结果）
- 方案设想的评估
  
  存在性(Existence: How often does it apply?)
  
  唯一性(Uniqueness: How much does it restrict behavior?)
  
  不变性(Invariance: How sensitive is it to small changes?)
- 帕累托优势(pareto dominate)
  策略组合s帕累托优势于策略组合s'，其前提条件：对于每个玩家，在策略组合s中的收益都大于等于在策略组合s‘中的收益，并且至少有一个玩家，在策略组合s中的收益大于在策略组合s‘中的收益。
[v_i(s) geq v_i(s'), forall i in N \ v_i(s) > v_i(s'), exists i in N ]
参照
- Game Theory An Introduction (by Steven Tadelis)
- 读书笔记: 博弈论导论 - 01 - 单人决策问题
- 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
查看全文

相关阅读:
# 学号 2017-2018-20172309 《程序设计与数据结构》第十一周学习总结
 学号 2017-2018-20172309 《程序设计与数据结构》实验四报告
 # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
 学号 2017-2018-20172309 《程序设计与数据结构》第10周学习总结
 2017-2018-20172309 『Java程序设计』课程结对编程练习_四则运算_第三周
 20172308 实验三《Java面向对象程序设计》实验报告
 20172308《程序设计与数据结构》第十周学习总结
 20172308《程序设计与数据结构》第九周学习总结
 2017-2018-2 1723 『Java程序设计』课程结对编程练习_四则运算第二周
 20172308《程序设计与数据结构》第八周学习总结

原文地址：https://www.cnblogs.com/steven-yang/p/8075913.html

		Player 2
		M	F
Player 1	M	-2, -2	-5, -1
	F	-1, -5	-4, -4

读书笔记: 博弈论导论

读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识

预备知识

知识点

普通形式博弈

2人有限博弈的矩阵表达

方案设想(solution concept)

参照

读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈预备知识