zoukankan
html css js c++ java
囚徒困境——纳什均衡
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。
用表格概述如下:
甲沉默
甲背叛
乙沉默
二人同服刑1年
乙服刑10年,甲即时获释
乙背叛
甲服刑10年,乙即时获释
二人同服刑8年
如同
博弈论
的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:
非零和博弈
中,帕累托最优和纳什均衡是相冲突的。
查看全文
相关阅读:
Tomcat 部署Solr 5.2.1
使用浮点类型导致计算误差以及判断误差
Interface 接口
ASP.NET 使用JQuery取后台数据并绑定到前台
JavaScript代码应该放哪才最合适?
Java学习笔记五(内部类 )
Java学习笔记四(代码块 )
Java学习笔记三(对象的基本思想一)
Java学习笔记二(基础语法)
Java学习笔记一(基础知识)
原文地址:https://www.cnblogs.com/burellow/p/2537890.html
最新文章
前端练习记录(模仿天猫首页)
HankerRank刷题第三天(string类型)
HankerRank刷题第二天(string类型)
HankerRank刷题第一天(string类型)
scrapy爬虫第一站
构造法
此博客不用 请进 http://edgration.com
[笔记]: 背包问题 2017-06-13 11:49 37人阅读 评论(0) 收藏
[笔记]: dp(动态规划) 2017-06-13 08:09 37人阅读 评论(0) 收藏
[笔记]: 区间dp 2017-06-12 08:13 44人阅读 评论(0) 收藏
热门文章
[vijos 1599]: 货币(记忆化搜索+hash优化) 2017-06-08 16:23 57人阅读 评论(0) 收藏
[笔记]: 记忆化搜索+hash优化&树形dp 2017-06-07 10:44 41人阅读 评论(0) 收藏
[练习]: 树链剖分练习题 2017-06-07 10:39 33人阅读 评论(0) 收藏
[noi2015] 软件包管理器(树链剖分) 2017-06-06 19:01 30人阅读 评论(0) 收藏
[练习]: 并查集&最小生成树练习题 2017-06-06 18:47 45人阅读 评论(0) 收藏
[noip 2010] 关押罪犯(两种解法) 2017-06-06 18:46 33人阅读 评论(0) 收藏
childNodes详解
浏览器盒模型
第一次对自己的以后的技术方向做一个规划
setTimeout的原理及在JavaScript线程执行队列中的位置
Copyright © 2011-2022 走看看