当前位置: » 主页»每月杂志»财经论坛»通证破解囚徒困境难题

通证破解囚徒困境难题

来源: 发表时间: 2019-05-22

Token Solves the Prisoner’s Dilemma 
通证破解囚徒困境难题
■ 陈源 戴剑

人与动物区分的非常重要的一点协作就是大规模协作。协作也是现今商业社会极度缺乏的资源。本文通过分析合作困境,找寻解决方案,并通过现实的案例进行了解析

合作演化的难题

达尔文所著《物种起源》这样说:“动物的任何一种本能都不是专门为了别的生物谋利而形成的,恰恰相反,是为了自身利益,所有的动物都会欺骗和利用对方。”这就是所谓本能和自然规律。由此,推演理性的个体为了实现自身利益的最大化,通常会选择不合作,最终使得合作在与作弊的演化竞争中退居其次。最近的历史畅销书《人类简史》的作者尤瓦尔·赫拉利则认为,人类具有大规模虚构“故事”的能力,并在基于这样的深度认知下,能够进行广泛而深入的协作而不是单打独斗,并且进一步确认正是这个能力才使得人类区别于其它物种,这是关键所在。
合作演化主要的研究模型包括囚徒困境博弈,铲雪堆博弈,公共品博弈。这些模型涵盖了社会复杂系统和生态复杂系统。

囚徒困境博弈
故事模型:两个人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以怀疑他们犯了抢劫罪。囚徒被分离审讯,不允许其互通消息。
此时,如果两人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因抗拒从严而被重判入狱20年;若互相揭发,则因证据确实,二人各判10年监禁。
两个合作者进行博弈后,两者均获得“奖励”; 两个背叛者进行博弈后,两者均获得“惩罚”; 当合作者与背叛者进行博弈后,背叛者获得“诱惑”,而合作者则获得“被骗”。相比之下,两个囚徒都拒供是对他们最好的结果,都供认是最糟糕的结果。但是,这个对两个囚徒都好的结果实际上很难发生。因为每个囚徒都会发现:
如果对方拒供,则自己供认便可立即获得释放,而自己拒供则被判一年,因此,供认是比较好的选择;
如果对方供认,则自己供认便将被判10年,而自己拒供则被判20年,因此,供认是比较好的选择;
因此,无论对方什么策略(供认或者拒供),自己的最优策略都是供认。由于每个囚徒都发现供认是自己最好的选择,因此,最终导致纳什均衡只能在非合作点上。
囚徒困境通常被看作是个人理性和集体理性冲突的经典情形。因为在囚徒困境的局势之下,每个人根据自己的利益做出的决策,但最后的结果却是集体遭殃。现实中的诸多问题和现象都是囚徒困境的翻版。比如:厂商之间的价格战,价格同盟,军备竞赛,公地的悲剧,团队中的偷懒卸责行为,学校教育中的应试教育的问题等。

铲雪堆博弈
“雪堆”博弈模型又称为“鹰鸽”博弈或者“小鸡”博弈,是一种两人对称博弈模型,描述了两个人相遇时是彼此合作共同受益,还是彼此欺骗来相互报复。
故事模型:在一个风雪交加的夜晚,甲、乙两人相向而来,被一个雪堆所阻,假设铲除这个雪堆使道路通畅需要的代价为C,如果道路通畅则带给每个人的好处量化为B。如果甲乙两人一齐动手铲雪,则他们的收益为R=B-C/2;如果只有一人铲雪,虽然两个人都可以回家,但是背叛者逃避了劳动,即不劳而获,它的收益为T=B,而合作者的收益为S=B-C,如果两人都选择不合作,两人都被雪堆挡住而无法回家,他们的收益都为P=0。
在此假设收益参数满足下面的条件:T>R>S>P。
囚徒困境博弈与铲雪堆博弈的根本差别在于这些收益矩阵元大小的顺序不同。对于“囚徒困境”博弈,收益矩阵元的顺序为:
T > R >P > S,
2R >T+S。
在单轮博弈的情况下,无论对手采取何种策略,个体的最佳策略总数作弊。然而,在双方都采取合作的情况下,二者的收益才是最大的。这一现象说明了社会两难问题的本质。而对于“铲雪堆”博弈,收益矩阵元的顺序为:
T > R > S > P,
和囚徒困境博弈不同的是P和S的大小以及顺序变了。此时个体最佳策略取决于对手的选择:当对手合作时则选择作弊,当对手作弊时则选择合作。在实际生活中有很多雪堆模型这样的场景,例如,MBA同学共同完成小组作业;一同做物理、化学等实验;分析政策影响等方面。这样合作在系统中不会消亡,与囚徒困境相比,合作比较容易在雪堆模型中出现。

公共物品博弈
公共品博弈:假设有N个个体构成的一个系统拥有一个公共基金,每一个体可以选择投一个单位的货币量进入公共基金(合作),也可以选择不投资(背叛)。如果有A个合作者,公共基金将在投资的基础上以R的倍数增值,即A*R个单位的货币。所得的货币由N个人平均分配。合作者之前付出了一个单位货币的投资,所以合作者获得的收益为(A*R /N) - 1;而背叛者的收益为A*R/N。显然选择背叛策略的个体获得比合作更多的收益。但如果都选择背叛的话,大家的收益都为0。

  合作演化的解

自20世纪60年代以来,人们为了研究广泛存在的协作行为,学界做了如下的探索。比如亲缘选择,直接互惠、间接互惠、空间互惠,以及群组选择等。我们从下面几个角度分别讨论合作演化的机理。

直接互惠
直接互惠:通俗的理解就是“今天我帮你,明天你帮我”,他指的是两个个体间相互帮助的情景。这个合作的模式需要两个个体有重复博弈的机会。重复博弈的机会越大合作的机会就越大,显正相关性。
依据这个模型设计的一个典型的策略就是“针锋相对”。他是由英国数学家、生物学家Rapoport 提出的,并在Axelrod 锦标赛中夺冠。其策略非常简单:初始博弈的时候个体采取合作策略,然后在接下来的演化中,个体都将重复对手上一步所使用的策略,即针锋相对,或者说以牙还牙。研究结果表明,这种策略能够有效地抑制背叛策略的传播和蔓延。但这种策略也存在一个致命的弊端,即在“颤抖的手”的影响下,针锋相对的策略容易走向相互背叛的极端。如果一方误判,或错误传递了信号、失误等而使得对方认为其背叛,从而采取背叛策略,那么,很可能让双方陷入永远的相互背叛之中。
随后,在这个策略基础上,Nowak等人提出了一种“慷慨的针锋相对”策略。策略的精髓是:即使对手背叛,个体仍以一定的概率对其宽容,而选择继续和对手进行合作。这个策略能够有效应对干扰对针锋相对策略带来的巨大影响。因此,在抑制背叛行为蔓延方面的表现更加出色,比赢留输变策略更加鲁棒。

间接互惠
间接互惠:通俗的理解是“今天我帮助你,明天会有别人来帮助我”。对于个体,这个就是人们追求“声望”、“名声”背后的价值驱动。个体通过帮助别人积累自己的声望,然后声望高的个体能更容易获取别人的帮助。对于公司,可以理解为一定程度上的“商誉”。企业的诚信、品质积累了企业的商誉,为此在资本市场上有议价能力。销售的服务和商品能够卖得更贵,其中就包含了商誉部分。从这点看,间接互惠在一定程度上影响了道德体系与社会范式的演化路径。

空间互惠
空间互惠:空间能够对博弈参与个体形成所谓的团簇效应,在团簇效应下,个体相互帮助的可能性大大提高,能够团结起来共同抵御边界背叛者的入侵。在现实世界中,人类社会或者生物系统中,个体间的交互关系往往有特定空间范围,由于共同的空间而大大促进了合作。比如民族的定义有四个共同,其中一个是共同的地域。可见空间互惠对合作的意义。

囚徒困境下的中美贸易战

中美贸易战的囚徒困境模型
特朗普在2016年选举过程中强调自己当选后将“削减美国的贸易逆差”,但是贸易逆差不降反增至2017年的3752亿美元,我们发现,中美贸易关系显然陷入了经典的“囚徒困境”,即:将双方的经贸政策抽象成为打贸易战(打)与不打贸易战(不打)两个选项。由于双方都各有两种选择,所以理论上可能会出现四种结果。(打、打)(不打、打)(打、不打)(不打、不打)。
上述这种情况变构成了一个由中美两方参与且同时进行决策的简单博弈,可以用一个以二元数组为元素的矩阵,即“博弈矩阵”来描述。
A. 中国选择“不打”的情况
美国选择“打”或“不打”的收益,这样美国会发现,“打”是对他更有利的选择。
B. 在美国选择“打”的情况
中国选择“打”或“不打”两种情况下所获得的收益对比,在美国选择“打”的时候,中国选择“打”(报复)能得到更高收益。
用博弈论视角看中美贸易战,(打、打)是这个博弈的纳什均衡,也是这个博弈最终的走向。然而这种结果显然并不是最优的选择,双方都选择“不打”即合作,这样的模式会因为贸易、比较优势的原因让双方的收益会明显提高。然而,现实很难实现,为此我们看到了中美贸易战的“囚徒困境”。

通过通证模型,解决中美贸易战
囚徒困境难题的本质决策基于个体理性而非集体理性,或者说由于有外部性。那么解决囚徒困境的传统方法有以下几种:
A. 依赖第三方权威,比如上帝、法官、族长、黑社会老大;
B. 把一次性博弈转变为重复性博弈;
C. 把单对单的一次性博弈转变为单对多的一次性博弈。比如,观察美国人为什么诚实,企业为什么需要注重口碑,社会征信机制的价值,中国社会的转型(从熟人社会转型至陌生人);
D. 把单对单的单一博弈转变为单对单的多重博弈。
今天,我们思考如何使用通证解决这个问题。
笔者试着提出一个设计方案:设计一个通证叫“世界币”。挖矿模式为:GDP挖矿,即按照中美各自国家的GDP总额进行挖矿。年末进行分红,规则依据国际贸易的比较优势,增加的GDP按照每个国家在GDP中的占比进行分配。具体如下:
通证:世界币
铸币模式:GDP挖矿
总量:中美两国GDP总量(中国:12万亿美元,美国:20万亿)
利益分配:按照GDP占比切分贸易增加值。

现实中的解决案例
有人提出上述的案例太过理想,毕竟中国使用的是央行发行的人民币,美国使用的是美联储发行的美元。确实如此,目前让中美两国使用一个货币有难度。不过有一个现实的案例,就是欧盟12国的“欧元”。
欧元启动工程浩大,据经济学家计算,仅从欧元发行到投入使用的费用就高达1600亿~1800亿欧元。但是,欧元启动给欧盟带来的利益也是巨大的。
通证:欧元。
发起人:欧元之父,罗伯特·蒙代尔;系美国哥伦比亚大学教授、1999年诺贝尔经济学奖获得者、“最优货币区理论”的奠基人。
口号:“同一个市场,同一个货币”;“One Market, One Money.”
关于欧元,首先是政治效益,欧洲地区经历了两次世界大战,生命财产有极大的损失。同一个市场,同一个货币之后,其战争冲突的可能性极大降低。其次是巨大的经济效益。现由19国组成的欧元区,是个蕴藏着无限商机的巨大市场,其每年内部贸易额就高达1.4万亿美元,约占全球贸易总量的15%。实行统一货币后,不光节省了巨额交易成本,还使人才、资金、技术和资源等得到最佳配置,从而获得最大的经济效益。据初步估算,单一货币会使欧洲内部贸易量很快翻番,甚至会是原来的三倍。欧元区的居民直接感受到的实惠是,欧元便利了消费者选择来自19国的商品,消费者将因此平均节约12%的费用。比如,西班牙的鲑鱼只有平均价格的61%,而丹麦却高达平均价的133%;奶酪在荷兰比在意大利便宜两倍;爱尔兰的土豆比丹麦便宜3.5倍。

综述

协作,大规模协作是区分人与动物非常重要的一点。也是现今商业社会极度缺乏的资源。本文通过分析合作困境,找寻解决方案,并通过现实的案例进行了解析。
特别地提出了通过通证Token的解决思路。通证的精髓是根据贡献分配通证,根据通证进行分润。传统方式的积分能够在一个中心化的主体中实现这个功能,而当前可以使用区块链作为背书,把积分发在区块链上。这样的“积分”,就能够跨越组织内部,更为广泛使用,其流通性大大地增强了;另外,由于区块链是不可篡改且透明的机制,使得这样的“积分”有了更为强大的背书。


合作网站

新浪财经
新浪产权
万方数据
中国知网
中国科技部西南信息中心期刊数据库
金融界网
中山证券
中国资金管理网
价值中国
看看网
新三板资讯网
水工业网
国际财经时报网
ZCOM电子杂志
北京赫云信息技术有限公司

Copyright© IFMBJ.com IFMBJ.com.cn 2000-2009 All rights reserved
图文未经授权, 禁止转载.