读书笔记: 博弈论导论

zoukankan html css js c++ java

读书笔记: 博弈论导论
读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈多阶段博弈

多阶段博弈(Multistage Games)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

多阶段博弈
- 多阶段博弈
  多阶段博弈是一个有限个数的普通形式阶段博弈(stage-game)的队列。每个阶段博弈(stage-game)是一个独立的、非完美信息的完整博弈。
  这些阶段博弈的玩家都相同。每个博弈都属于一段截然不同的时期(distinct period)。
- 多阶段博弈:收益 - 折扣累计和收益(discounted sum payoff)
[v_i = v_i^1 + delta^1 v_i^2 + delta^2 v_i^3 + cdots + delta^{T-1} v_i^T = sum_{t=1}^T delta^{t-1} v_i^t \ where \ delta ext{: discount rate} ]
- 多阶段博弈:策略
  “如果在博弈1，博弈2，。。。博弈t-1中发生了这些，我会在博弈 t 中采取行动a。”
- 多阶段博弈:条件纯策略队列(conditional pure strategies list)
  第t个阶段的策略（的参数）是之前的发生的事件。
[S_i = {s_i^1, s_i^2(h_1), cdots, s_i^t(h_{t-1}), cdots, s_i^T(h_{T-1})} \ where \ h_{t-1} ext{ : a particular outcome that occurred up to period t, not including period t. or information set} \ s_i^t(h_{t-1}) ext { : an action for player i from the } t ext {th stage-game.} \ h_{t-1} = ((a_1^1, cdots, a_n^1), cdots, (a_1^{t-1}, cdots, a_n^{t-1})) ]
- 多阶段博弈:混合策略(mixed strategy)
[sigma_i = {sigma_i^1, sigma_i^2(h_1), cdots, sigma_i^t(h_{t-1}), cdots, sigma_i^T(h_{T-1})} \ where \ h_{t-1} ext{ : a particular outcome that occurred up to period t, not including period t. or information set} \ sigma_i^t(h_{t-1}) ext { : an randomization over player i's actions from the } t ext {th stage-game.} \ ]
推论9.1

在一个T阶段的多阶段博弈中，(sigma^{t*})是第t个阶段的一个纳什均衡。
则在这个多阶段博弈中存在一个子博弈精炼均衡，其均衡路径一致于(sigma^{1*}, sigma^{2*}, cdots, sigma^{T*})产生的路径。

推论9.2

在一个由阶段博弈(G_1, G_2, cdots, G_T)T组成的多阶段博弈中，(sigma^*)是一个纳什均衡，
则在期间T(最后一个)的阶段博弈中，(sigma^*)的约束一定是这个阶段博弈的纳什均衡。

最后一个博弈不存在依赖性。
后面的博弈如果有多个纳什均衡，则可能会影响前面阶段的博弈结果。（胡萝卜大棒理论）

推论9.3

在一个由有限个阶段博弈组成的多阶段博弈中，每个阶段博弈都有一个唯一的纳什均衡，
则这个多阶段博弈有一个唯一的子博弈精炼均衡。

单阶段偏差原理(The One-Stage Deviation Principle)

单阶段偏差原理用来简化有多个阶段博弈的计算过程。
- 单阶段不可改善的策略(one-stage un-improvable strategy)
  一个策略是单阶段不可改善的，如果不存在(h_i, a in A_i(h_i))
[v_i(sigma_i^{a,h_i}, h_i) > v_i(sigma_i, h_i) \ where \ sigma_i^{a,h_i} ext{: is identical to } sigma_i ext{ everywhere except at } h_i. $$。 **定理：9.1** > 一个单阶段不可改善的策略一定是最优的。 ## 参照 - Game Theory An Introduction (by Steven Tadelis) - [读书笔记: 博弈论导论 - 01 - 单人决策问题](http://www.cnblogs.com/steven-yang/p/8075901.html) - [读书笔记: 博弈论导论 - 02 - 引入不确定性和时间](http://www.cnblogs.com/steven-yang/p/8075907.html) - [读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈预备知识](http://www.cnblogs.com/steven-yang/p/8075913.html) - [读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈理性和公共知识](http://www.cnblogs.com/steven-yang/p/8088030.html) - [读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈纳什均衡](http://www.cnblogs.com/steven-yang/p/8110191.html) - [读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈混合的策略](http://www.cnblogs.com/steven-yang/p/8118418.html) - [读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈预备知识](http://www.cnblogs.com/steven-yang/p/8177451.html) - [读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈可信性和序贯理性](http://www.cnblogs.com/steven-yang/p/8183803.html)]
查看全文

相关阅读:
Highcharts 连续的堆积面积图
 jQuery--each遍历使用方法
 C# 常用小技巧
 JSON对象遍历方法
 T-SQL生成X个不重复的Y位长度的随机数
 SQLServer如何快速生成100万条不重复的随机8位数字
 ftp和http断点续传及下载的Delphi实现
 Delphi与Windows 7下的用户账户控制(UAC)机制
 Win7/Win10下的进程操作
 运行Delphi 2007 IDE提示无法打开"EditorLineEnds.ttr"文件

原文地址：https://www.cnblogs.com/steven-yang/p/8195547.html

读书笔记: 博弈论导论

读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈

多阶段博弈(Multistage Games)

多阶段博弈

单阶段偏差原理(The One-Stage Deviation Principle)

读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈多阶段博弈