zoukankan      html  css  js  c++  java
  • 读书笔记: 博弈论导论

    读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识

    理性和公共知识

    本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

    纯策略中的优势(dominance)

    • 数学表达: 除了玩家i以外所有玩家的策略集合

    [S equiv S_1 imes S_2 imes cdots S_n \ S_{-i} equiv S_1 imes S_2 imes cdots imes S_{i-1} imes S_{i+1} imes cdots S_n \ s = (s_1, s_2, cdots, s_n) \ s_{-i} = (s_1, s_2, cdots, s_{i-1}, s_{i+1}, cdots, s_n) \ s = (s_i, s_{-i}) ]

    (S): 所有人的所有策略组合。
    (S_{-i}): 除了玩家(i)以外,所有人的所有策略组合。
    (s): 所有人的一种策略组合。
    (s_{-i}): 除了玩家(i)以外,所有人的一种策略组合。
    引进(S_{-i})(s_{-i})是为了

    1. 通过看玩家i以外的所有玩家的策略,来考虑玩家i的策略。
    2. 或者专门看玩家i策略。

    劣势(被支配)策略(Dominated Strategies)

    • 定义 4.1:严格劣势于
      对于玩家i,策略(s'_i)严格劣势于(s_i),则:

    [v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), forall s_{-i} in S_{-i} ]

    断言 4.1

    一个理性玩家不会选择一个严格劣势策略。

    优势策略(Dominant Strategies)

    • 定义 4.2: 严格优势策略(strictly dominant strategy)
      策略(s_i in S_i)是一个严格优势策略,如果玩家i的任何其它策略都严格劣势于(s_i)

    [v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), forall s'_i in S_i, s'_i eq s_i, and forall s_{-i} in S_{-i} ]

    • 定义 4.3: 严格优势策略均衡(strictly dominant strategy equilibrium)
      策略组合(s^D in S_i)是一个严格优势策略均衡,如果其中每一个玩家i的策略都是严格优势策略。

    [s_i equiv s_i^D, forall i in N ]

    推论 4.1

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。

    断言 4.2

    如果有的话,玩家一定会选择优势策略。

    策略,策略集合,策略组合和策略均衡

    • 策略(strategy)
      (s_i)是玩家的一个策略。

    • 策略集合(strategy set)
      (S_i)是玩家的所有策略集合。(s_i in S_i)
      (S)是所有玩家的所有策略的组合的集合。

    • 策略组合(strategy profile)
      (s)是N个玩家的一种策略组合。(s = (s_1, s_2, cdots, s_n), s in S)

    • 策略均衡(strategy equilibrium)
      (s)是任何一种导致合理结果的策略组合。

    方法:严格劣势策略的迭代消除

    博弈论方法就是一个寻找均衡的过程。
    方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
    基本逻辑:

    一个理性玩家不会选择一个严格劣势策略。
    如果有的话,玩家一定会选择优势策略。
    过程:略

    • 迭代消除均衡(Iterated elimination equilibrium)
      严格劣势策略的迭代消除(IESDS)过程中幸存下来的博弈组合(s^{ES})

    推论 4.2

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))(s^*)是一个严格优势策略均衡,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

    信念(Beliefs),最佳响应(Best Response)和可合理化(Rationalizability)

    在已经学习的两个方法严格优势策略和严格劣势策略的迭代消除(IESDS)之外的情况下,如果玩家i的一个策略(s_i)不是一个严格劣势策略,那就意味着在一定条件下(对手的某些策略下),策略(s_i)是一个合理的响应。

    • 最佳响应(best response)
      玩家i的策略(s_i in S_i)是对手策略(s_{-i} in S_{-i})的最佳响应,则:

    [v_i(s_i, s_{-i}) geq v_i(s'_i, s_{-i}), forall s'_i in S_i ]

    • 信念(belief)
      一个玩家i的信念就是一个他对手们的可能策略组合(s_{-i} in S_{-i})

    • 最佳响应对应(best-response correspondence)
      最佳响应对应(BR_i(s_{-i})),是玩家i,在他的对手们的策略组合(s_{-i})上的所有可能最佳响应的集合。
      (BR_i(s_{-i}))可以认为是一个函数,其结果是一个集合。

    • 不是一个最佳响应(never a best response)
      玩家i,对于他的对手们的策略组合(s_{-i})的最佳响应集合(BR_i(s_{-i})),如果(s_{-i})不是在信任集合里,则(s_i in BR_i(s_{-i}))都不是最佳响应。

    总结

    方法

    • 严格优势策略
    • 严格劣势策略的迭代消除(IESDS)
    • 去掉不可信的策略组合(或者保留可信的策略组合)。

    推论 4.1

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。

    推论 4.2

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))(s^*)是一个严格优势策略博弈,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

    推论 4.3

    对于玩家i,一个严格劣势策略(s_i),不可能是任何(s_{-i} in S_{-i})的最佳响应。

    推论 4.4

    在一个有限普通形式的博弈中,(s^*)是一个严格优势策略,或者是一个唯一的严格劣势策略的迭代消除(IESDS)均衡,
    则s_i^*是一个对于任何(s_{-i} in S_{-i})的最佳响应。

    断言 4.1

    一个理性玩家不会选择一个严格劣势策略。

    断言

    如果有的话,玩家一定会选择优势策略。

    断言 4.2

    一个理性玩家,在认为他的对手选择策略(s_{-i} in S_{-i})时,总会选择(s_{-i})的最想响应。

    断言

    一个理性玩家只会选择(他对手们的策略组合的)最佳响应。

    参照

    • Game Theory An Introduction (by Steven Tadelis)
  • 相关阅读:
    How to create jar for Android Library Project
    Very large tabs in eclipse panes on Ubuntu
    64bit Ubuntu, Android AAPT, R.java
    Linux(Ubuntu)下如何安装JDK
    Configure xterm Fonts and Colors for Your Eyeball
    建立、配置和使用Activity——启动其他Activity并返回结果
    建立、配置和使用Activity——使用Bundle在Activity之间交换数据
    建立、配置和使用Activity——启动、关闭Activity
    建立、配置和使用Activity——Activity
    异步任务(AsyncTask)
  • 原文地址:https://www.cnblogs.com/steven-yang/p/8088030.html
Copyright © 2011-2022 走看看