zoukankan      html  css  js  c++  java
  • 读书笔记: 博弈论导论

    读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识

    理性和公共知识

    本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

    纯策略中的优势(dominance)

    • 数学表达: 除了玩家i以外所有玩家的策略集合

    [S equiv S_1 imes S_2 imes cdots S_n \ S_{-i} equiv S_1 imes S_2 imes cdots imes S_{i-1} imes S_{i+1} imes cdots S_n \ s = (s_1, s_2, cdots, s_n) \ s_{-i} = (s_1, s_2, cdots, s_{i-1}, s_{i+1}, cdots, s_n) \ s = (s_i, s_{-i}) ]

    (S): 所有人的所有策略组合。
    (S_{-i}): 除了玩家(i)以外,所有人的所有策略组合。
    (s): 所有人的一种策略组合。
    (s_{-i}): 除了玩家(i)以外,所有人的一种策略组合。
    引进(S_{-i})(s_{-i})是为了

    1. 通过看玩家i以外的所有玩家的策略,来考虑玩家i的策略。
    2. 或者专门看玩家i策略。

    劣势(被支配)策略(Dominated Strategies)

    • 定义 4.1:严格劣势于
      对于玩家i,策略(s'_i)严格劣势于(s_i),则:

    [v_i(s'_i, s_{-i}) < v(s_i, s_{-i}), forall s_{-i} in S_{-i} ]

    断言 4.1

    一个理性玩家不会选择一个严格劣势策略。

    优势策略(Dominant Strategies)

    • 定义 4.2: 严格优势策略(strictly dominant strategy)
      策略(s_i in S_i)是一个严格优势策略,如果玩家i的任何其它策略都严格劣势于(s_i)

    [v_i(s_i, s_{-i}) > v(s'_i, s_{-i}), forall s'_i in S_i, s'_i eq s_i, and forall s_{-i} in S_{-i} ]

    • 定义 4.3: 严格优势策略均衡(strictly dominant strategy equilibrium)
      策略组合(s^D in S_i)是一个严格优势策略均衡,如果其中每一个玩家i的策略都是严格优势策略。

    [s_i equiv s_i^D, forall i in N ]

    推论 4.1

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。

    断言 4.2

    如果有的话,玩家一定会选择优势策略。

    策略,策略集合,策略组合和策略均衡

    • 策略(strategy)
      (s_i)是玩家的一个策略。

    • 策略集合(strategy set)
      (S_i)是玩家的所有策略集合。(s_i in S_i)
      (S)是所有玩家的所有策略的组合的集合。

    • 策略组合(strategy profile)
      (s)是N个玩家的一种策略组合。(s = (s_1, s_2, cdots, s_n), s in S)

    • 策略均衡(strategy equilibrium)
      (s)是任何一种导致合理结果的策略组合。

    方法:严格劣势策略的迭代消除

    博弈论方法就是一个寻找均衡的过程。
    方法名:IESDS(Iterated Elimination of Strictly Dominated Strategies)
    基本逻辑:

    一个理性玩家不会选择一个严格劣势策略。
    如果有的话,玩家一定会选择优势策略。
    过程:略

    • 迭代消除均衡(Iterated elimination equilibrium)
      严格劣势策略的迭代消除(IESDS)过程中幸存下来的博弈组合(s^{ES})

    推论 4.2

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))(s^*)是一个严格优势策略均衡,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

    信念(Beliefs),最佳响应(Best Response)和可合理化(Rationalizability)

    在已经学习的两个方法严格优势策略和严格劣势策略的迭代消除(IESDS)之外的情况下,如果玩家i的一个策略(s_i)不是一个严格劣势策略,那就意味着在一定条件下(对手的某些策略下),策略(s_i)是一个合理的响应。

    • 最佳响应(best response)
      玩家i的策略(s_i in S_i)是对手策略(s_{-i} in S_{-i})的最佳响应,则:

    [v_i(s_i, s_{-i}) geq v_i(s'_i, s_{-i}), forall s'_i in S_i ]

    • 信念(belief)
      一个玩家i的信念就是一个他对手们的可能策略组合(s_{-i} in S_{-i})

    • 最佳响应对应(best-response correspondence)
      最佳响应对应(BR_i(s_{-i})),是玩家i,在他的对手们的策略组合(s_{-i})上的所有可能最佳响应的集合。
      (BR_i(s_{-i}))可以认为是一个函数,其结果是一个集合。

    • 不是一个最佳响应(never a best response)
      玩家i,对于他的对手们的策略组合(s_{-i})的最佳响应集合(BR_i(s_{-i})),如果(s_{-i})不是在信任集合里,则(s_i in BR_i(s_{-i}))都不是最佳响应。

    总结

    方法

    • 严格优势策略
    • 严格劣势策略的迭代消除(IESDS)
    • 去掉不可信的策略组合(或者保留可信的策略组合)。

    推论 4.1

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))有一个严格优势策略均衡(s^D),则(s^D)是唯一的严格优势策略均衡。

    推论 4.2

    如果博弈(Gamma = (N, { S_i }_{i=1}^{N},{ v_i }_{i=1}^{N}))(s^*)是一个严格优势策略博弈,则(S^*)是唯一的严格劣势策略的迭代消除(IESDS)均衡。

    推论 4.3

    对于玩家i,一个严格劣势策略(s_i),不可能是任何(s_{-i} in S_{-i})的最佳响应。

    推论 4.4

    在一个有限普通形式的博弈中,(s^*)是一个严格优势策略,或者是一个唯一的严格劣势策略的迭代消除(IESDS)均衡,
    则s_i^*是一个对于任何(s_{-i} in S_{-i})的最佳响应。

    断言 4.1

    一个理性玩家不会选择一个严格劣势策略。

    断言

    如果有的话,玩家一定会选择优势策略。

    断言 4.2

    一个理性玩家,在认为他的对手选择策略(s_{-i} in S_{-i})时,总会选择(s_{-i})的最想响应。

    断言

    一个理性玩家只会选择(他对手们的策略组合的)最佳响应。

    参照

    • Game Theory An Introduction (by Steven Tadelis)
  • 相关阅读:
    第一次作业
    第四次作业
    第三次作业
    第二次作业
    第一次作业
    第四次作业
    第三次作业
    第二次作业
    第一次作业
    第三次作业
  • 原文地址:https://www.cnblogs.com/steven-yang/p/8088030.html
Copyright © 2011-2022 走看看