zoukankan      html  css  js  c++  java
  • 第一章绪论笔记2

    一、演化博弈理论

    1. 基本概念及常用模型

    • 博弈论主要的研究内容:理性参与者之间由于相互作用所产生的行为与结果。
    • 博弈论的博弈论,又被称为对策论,博弈个体之间的策略选择是互相影响的,个体获得的收益不仅仅取决于自身所采取的策略,还需将其他个体的策略也考虑在内。博弈论重点考察在其他个体
      策略已经确定的前提下,个体如何进行理性的决策,从而使自己获得的利益达到最大化。
    • 纳什均衡:。纳什均衡主要描述的是两个或多个个体之间由于相互作用而产生的一种稳定状态。在该状态下的个体是无法通过改变自身的策略来获取更高的收益。如果将这个稳定状态当成一个
      不动点,那么每个处于该不动点上的博弈参与者都能对其他参与者所选择的策略做出最优反馈。
    • 博弈类型:
    1. 合作博弈:在博弈发生之前,博弈双方提前达成一定的协议,然后再进行实际的博弈活动。这里所谓的协议必须具备一定的约束力,使得博弈双方都能够遵守既定的协议内容。
    2. 非合作博弈:指在博弈发生之前,博弈双方无法达成一定的协议,那么博弈的目标就是让自己能够获得最大的收益。因此,在这种形势下,博弈不容易达到集体理性的结果,也就是个体理性
      和集体理性无法共存。(无法达成协议,容易产生非理性)
    3. 零和博弈:在严格的竞争机制下,博弈的结果是一种非输即赢的局面,也就是如果一个参与者获得收益,那么另一个参与者必定会遭受损失。这里收益与损失的绝对值大小是相等的,也就是双
      方净获利恒为零。显而易见,在这种机制下,博弈的各方是不可能出现合作的现象。(你死我活)
    4. 非零和博弈:所有博弈参与者的收益与损失的总和不一定恒等于零,这与零和博弈的定义是相反的。显然,此时博弈的双方不是完全对立的关系,可以理解为博弈的参与者之间可能存在某种
      特定的共同利益,有一方得到收益,并不意味着另一方要付出同等的损失。
    • 博弈的内容:
    1. 两个或两个以上的博弈参与者,在博弈过程中,每个参与者都可以独立进行决策;(个体)
    2. 博弈策略集是指系统内所有博弈参与者所采用的策略集合,这里的策略分为纯策略和混合策略;(策略)
    3. 博弈活动是在既定的博弈规则下进行,参与者所获得的收益是通过计算收益函数得到;(活动)
    4. 博弈参与者依据自身收益最大化的规则进行下一轮的策略更新。(规则)
    • 经典博弈:
    1. 囚徒困境博弈:囚徒困境博弈既是非零和博弈的一个重要模型,也是一种非合作博弈模型。
      背景:两个嫌疑犯的不同选择会产生以下几种结果:假如双方都选择坦白,那么他们获得的刑期
      相同,都将被判处3年有期徒刑;假如二人均拒不认罪,那么他们只会被判监禁1年;假如其中一个嫌疑犯选择认罪,而另一个嫌疑犯拒不认罪,则认罪的人会被无罪释放,而拒不认罪的人将被
      重判5年有期徒刑。
      结果:对于参与者来说,它的最佳选择就是背叛策略,而与对手选择何种策略无关。最终的纳什均衡状态就是双方都选择背叛策略。在该状态下,每个博弈个体都达到最优状态,所有的个体均
      不会通过私自改变自身的策略来获得额外的收益。而此时,选择合作策略所获得的收益会比选择背叛策略所获得的收益高,从而致使理性个体陷入两难的困境。(一起背叛,共6年。一起合作,
      共2年。一个合作一个背叛,共5年)
    2. 雪堆博弈:雪堆博弈是另一种经典的博弈模型,是囚徒困境博弈的变异。
      背景:在一个暴风雪的夜晚,两个司机在下班回家途中对向行驶,途中遇到一堆积雪挡住了彼此前进的道路,导致两人无法继续通行。只有把这个雪堆尽快铲去,他们才能顺利回家。
      选择:下车铲雪(合作)或者待在车里等待(背叛)。如果二人下车一起动手铲雪,将会让道路以最快速度恢复畅通,各自都能顺利回到家。此时,需要共同付出的劳动消耗代价为c ,而道路
      通畅带给二人的好处各为b ,b>c>0,
    3. 公共品博弈:公共品博弈可以看作是多人版本的囚徒困境博弈。
      背景:假设共有N个参与者,在每一轮博弈中,所有参与者同时决定是否向公共池进行投资。投资的行为视为合作者,不投资的行为即为背叛者。合作者会投入成本 c到公共池,而背叛者不进行投资。
      在一次博弈完成后,公共池内的资金经过运作后会增值,此时总的资金就是公共池内由合作者投入的资金总额乘以一个增益系数r(1<r<N-1),然后不论过去是否投入资金,所有的博弈参与者都
      将获得经过增值后的资金平均分配份额。如果有n个博弈参与者的策略选择为合作,则所有合作者的最终收益为:,而每个背叛者可以获得更多的收益:,显然有
      但是如果参与者不投资也能获得较高的收益,必然会出现搭便车(Free-Rider)的现象。理性的参与者在权衡之下肯定会选择不进行投资。而如果所有的参与者都不投资,那么他们都不会有任何收益。

    二、演化稳定策略

    演化博弈理论的核心概念则是演化稳定策略。如果一个种群的大多数个体所采用的策略,能够有效抵御来自少数突变策略的入侵,并且随着演化的继续,少数的突变者会慢慢从原来的群体中消失,
    从而使得整个群体最终能够获得更高的收益,那么这个大多数的策略就是这里所指的演化稳定策略。ESS可能是纯策略或混合策略。其中,混合策略是由纯策略派生而来,是指个体以一定的几率
    选择纯策略。
    个人理解:稳定策略对自身的响应如果大于突变策略对于稳定策略的收益,稳定策略可以有效抑制突变策略的入侵。

    三、复制动力学(存疑)




    (此公式有错误,应为)

  • 相关阅读:
    Token-Pasting Operator (##) and Stringizing Operator (#)
    记录Debug神经网络的方法
    正则表达式备忘
    概率论备忘
    tensorflow学习
    实现trie树
    数组练习
    递归实现简单实例
    蛇形三角矩阵
    近期工作---Linux下基于Cuckoo沙箱的API适配问题
  • 原文地址:https://www.cnblogs.com/suancai/p/15316175.html
Copyright © 2011-2022 走看看