概述
这本书是蒋文华老师写的, 属于博弈论的入门书籍
题图为党岭
读后记
囚徒困境
有一个很经典的囚徒困境
警方同时逮捕了 A, B 两名嫌疑犯,但没有足够证据指控二人有罪。
警察在两个独立的不能互通信息的审讯室分别对 A,B 进行审讯
两人都有两个选择 1 坦白 2 抗拒(沉默不认罪)
规矩简单来说就是: 坦白从宽, 抗拒从严
一个人坦白, 一个人沉默, 则前一个人当场释放, 后一个人需要服刑 5 年
两个人都坦白, 则两个人都需要服刑 3 年
两个人都沉默, 则两个人只需要服刑 0.5年
另外 A, B 不会有道德负担, 他们只为自己的利益考虑

虽然对于 A, B 两者整体有一个最好的结局, 两人都被判 0.5 年
我们这里假设 A 的心理
- 如果 B 沉默, 那对于 A 来说, 自己坦白的收益最高, 可以直接释放;
- 如果 B 坦白, 则对于 A 来说坦白收益最高, 只被判 3 年, 而如果沉默, 会被判 5 年;
我们可以看到, 不管 B 做出何种策略, 对 A 来说, 坦白的收益是最高的.
同理 B 也是一样.
所以我们通常看到的结局就是, AB 都坦白, 然后同时被判 3 年, 这显然和 都沉默的结局 , 都被判 0.5 年有很大的差距.
- 假设嫌疑犯B坦白的概率为 m , 则 沉默的概率为 1-m
- 如果 A 坦白, 则期望为 m * -3 + (1-m) * 0
- 如果 A 沉默, 则期望为 m * -5 + (1-m) * -0.5
- 显然 A 坦白的期望 > A 沉默时的沉默

甚至当我们把条件改成 如果两个人都沉默, 则两个人都直接释放
我们还是假设 A 的心理
- 如果 B 沉默, 那对于 A 来说, 自己坦白和沉默 的收益是一样的, 都是直接释放;
- 如果 B 坦白, 则对于 A 来说坦白收益最高, 只被判 3 年, 而如果沉默, 会被判 5 年;
我们前面提到, AB 无法交流, 对 A 来说, 坦白是最好的选择 (期望最高) ; 同理 B 也是这样的;
我们可以看到 A , B 双方虽然可以获得更好的结局, 但如果他是一个理性人, 则仍然会选择收益更高的选项 - 坦白, 这个对于整体来说不算完美的结局. 在一定条件下, 每个人的自利选择, 却带来了双方最差的结局
理性人:
- 认知的理性, 人是自我利益的判断者
- 行为的理性, 人是自我利益的追求者
即在博弈中, 假设参与者都是理性的, 每一方都能在决策时充分考虑到他当前面临的局势, 也会顾及对方的行动对自己造成的影响与后果, 根据各种推测选择使自己利益最大化地策略
真实世界的囚徒困境
关于真实世界的囚徒困境也很普遍
-
- 一群牧民在一块固定大小的草原放牧, 牧民为了自己的利益尽可以多养牛羊, 最后草场退化, 牧民们失去了牛羊
-
气候变暖
- 虽然气候变暖已经成为了事实, 但各个国家很少能放弃自己的利益, 减少各类温室气体的排放
-
枪打出头鸟
- 在一群人面对威胁或者损失时, 第一个采取行动的决定往往是很难做出的, 因为这种行为虽然能为团体带来利益, 但也意味着行动者将付出惨痛代价
-
多数人的暴政
- 他们先是来抓共产党, 我没有说话, 因为我不是共产党。 他们接着来抓犹太人, 我没有说话, 因为我不是犹太人。 他们又来抓工会会员, 我没有说话, 因为我不是工会会员。他们再来抓天主教徒, 我没有说话, 因为我是新教教徒。 他们最后来抓我, 这时已经没有人还被留着给我说话了。
- 马丁·尼莫拉牧师,波士顿犹太人大屠杀纪念碑铭文,1945年
- 他们先是来抓共产党, 我没有说话, 因为我不是共产党。 他们接着来抓犹太人, 我没有说话, 因为我不是犹太人。 他们又来抓工会会员, 我没有说话, 因为我不是工会会员。他们再来抓天主教徒, 我没有说话, 因为我是新教教徒。 他们最后来抓我, 这时已经没有人还被留着给我说话了。
-
可持续发展
- 可持续发展的代价是什么呢
-
人民公社
- 出工不出力
-
有时我们能预想到一个更好的结局, 但执行起来时, 往往因为每个人的利益问题, 导致了一个更差的结局
破解囚徒困境
看完整本书, 我仍然觉得破解囚徒困境很难, 书中提到了破解的 3 种措施
- 道德教化
- 财产私有
- 温故知新
我的理解如下
-
道德和法律是整个人类社会利益的维护者
- 我很难想象没有法律和道德 + 人的自私自利 会给整个社会带来什么
-
有效的交流沟通, 可以促进人们达成目标一致
- 就像囚徒 A B 一样, 有效的沟通, 可以使得双方的利益最大化
- GRIT 逐步 graduat , 互惠 reciprocat , 主动 initiative 地减少紧张 tension reduction
- 查尔斯·奥斯古德 Osgood 提出的一个和解方式
- GRIT 要求一方在宣布希望调和的意愿之后, 做出一些小的意在降低冲突的行为. 发起调和的一方, 在实施每一个表示调和的行为之前都生命这种希望减少紧张的主张, 并邀请对手进行回报
- 在逐步建立信任的过程中, 到达一个双方更好的结局的平衡点
-
带有一些利他主义
-
在自私的基因这本书中, 也讲到了关于囚徒困境的问题(第12章)
-
吸血蝙蝠的利他主义, 饱食的蝙蝠会捐赠一些给不走运的同伴
-
-
在规则制定时, 尽可能避免产生囚徒困境
-
就像今年诺贝尔经济学奖得主研究的拍卖理论一样
-
有兴趣的可以搜索下
- 频谱拍卖
- 肾脏交换
- 自私路由
-
最后, 引用一段话
为众人抱薪者,不可使其冻毙于风雪。
为大众谋福利者,不可使其孤军奋战。
为自由开路者,不可使其困顿于荆棘。
参考
- 用博弈的思维看世界 - 蒋文华
- 斯坦福算法博弈论二十讲 - Tim Roughgarden
- 频谱拍卖
- https://wiki.mbalib.com/wiki/%E9%A2%91%E8%B0%B1%E6%8B%8D%E5%8D%96
- 肾脏交换
- http://sx349.github.io/2015/06/30/ECON10/