zoukankan      html  css  js  c++  java
  • 博弈论---3、囚徒困境

    博弈论---3、囚徒困境

    一、总结

    一句话总结:

    1、“囚徒困境”就是满足“背叛诱惑 > 合作报酬” 和 “受骗支付 > 背叛惩罚” 条件的博弈。
    2、解决“囚徒困境”就是让“囚徒困境”的两个条件不成立:也就是让“背叛诱惑<合作报酬”和“受骗支付<背叛惩罚”
    3、生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。

    二、囚徒困境

    博客对应课程的视频位置:3、囚徒困境-范仁义-读书编程笔记
    https://www.fanrenyi.com/video/36/326

    囚徒困境例子

    A和B是犯罪同伙,被隔离审讯。

    如果A和B都坦白罪行,会都被判刑8年;

    如果一人坦白,一人不坦白,坦白的人直接释放,不坦白的重判15年;

    如果两人都不坦白呢,则证据不足,都只判1年。

    这,就是著名的“囚徒困境”。

    ...

    虽然“都不坦白”是最优策略,但“都不坦白”是经不起考验的最优策略:我如果单方选择背叛,将立即获释,诱惑太大;而且就算我守口如瓶,万一他背叛了呢?我会被判15年,风险太高。

    “都坦白”呢?那两人都获刑8年。这时,如果一名囚徒单方决定守口如瓶,他的8年刑期将立刻变为15年,而另一人则被释放。对于守口如瓶的人,这一点好处都没有。

    所以,“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。

    那,这背后的博弈论原理是什么呢?

    囚徒困境

    一个典型的囚徒困境,其实就是满足两个条件的博弈:

    1、背叛诱惑 > 合作报酬

    合作报酬是判刑1年,背叛诱惑却是立即释放。

    2、受骗支付 > 背叛惩罚

    背叛惩罚是判刑8年,受骗支付却是判刑15年。

    这就是“囚徒困境”的基本原理。

    ...

    那,要怎么“破”?

    1、让“合作报酬 > 背叛诱惑”

    我们看看电影里常见的桥段:

    你很讲义气,死不招供,然后就会有人给你带话:大哥说了,你家里的事情不用担心,老人、嫂子、孩子,我们都会照顾好。你出来那一天,还会有一大笔dollar...这就是提高“合作报酬”;

    一个坦白了的人刚被释放出来,坐上自己的汽车,汽车发动的一瞬间,bang!!!就算把你释放出来,也一样没有好果子吃,这就是降低“背叛诱惑”;

    2、让“背叛惩罚 > 受骗支付”

    我们还是看看电影里面的桥段:

    电影里的古惑仔们,大多都很讲义气,崇尚“忠义”,不讲义气会被整个江湖唾弃,这种文化会在一定程度上,增加“背板惩罚”;

    什么?你被人出卖了?大哥除了会给你钱,帮你赡养家人之外,你的仇人就是大哥的仇人。不管他走到天涯海角,你放心,这仇我帮你报了!这,就是降低“受骗支付”。

    小结一下

    “囚徒困境”就是“背叛诱惑 > 合作报酬”,“受骗支付 > 背叛惩罚”。

    怎么破?

    第一,提高合作报酬,降低背叛诱惑;

    第二,提高背叛惩罚,降低受骗支付。

    生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。

    你,学会了么?

    ...

    参考:https://www.toutiao.com/i6493100684932547086/

     
  • 相关阅读:
    四、单片机学习——矩阵键盘实验
    二、单片机学习——独立按键实验
    三、单片机学习——数码管实验(共阳)
    一、单片机学习——流水灯实验
    Cacti监控Linux安装配置snmp服务
    firewalld和iptables区别
    Zabbix图形界面乱码修复为中文显示
    Centos7安装Zabbix 5.0 LTS 版本安装(详细版)
    Ubuntu Server 18.04 网络配置
    linux下开启root用户远程登录,允许无密码登录
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13323084.html
Copyright © 2011-2022 走看看