注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

SOHO小报的博客

 
 
 

日志

 
 

09年第五期《利益时代与机会主义》—集体黔…  

2009-06-23 09:52:00|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

09年第五期《利益时代与机会主义》—集体黔… - soho小报 - SOHO小报的博客

2009年第五期《利益时代与机会主义》

 

 

_赵汀阳

赵汀阳,中国社科院哲学所研究员

代表作《论可能生活》、《一个或所有问题》、《人之常情》,最新出版《坏世界研究》

 

 

如果一个社会的人们更喜欢投机

一般来说意味着这个社会缺乏足够有效的信任条件

和报应机制,因此背叛多于合作

如何减少冲突增加合作,这是人类社会至今无解的最大难题

 

 

   如果一个社会的人们更喜欢投机,一般来说意味着这个社会缺乏足够有效的信任条件和报应机制,因此背叛多于合作。如何减少冲突增加合作,这是人类社会至今无解的最大难题。

   博弈论家艾克斯罗德(Axelord1980年进行了一个关于合作如何可能的计算机实验,类似电脑游戏。他设计的博弈环境大概是这样:(1)博弈者性格多样,理性或非理性,谨慎或投机,善良或邪恶;(2)博弈回合足够多,多到类似一辈子;(3)博弈几乎可以不择手段,可以设计背信弃义的各种阴险策略。这个实验具有某种仿真性,但与真实生活仍有很大距离,比如,博弈各方被假定为能力相等,而且不可能消灭对手而只能在得分上胜过对手——这是个严重破绽,一会儿再说。

   艾克斯罗德实验是个全体混战的循环赛,第一次实验14个参赛策略由足够精明的各种专家分别设计(都是些有名的经济学家、政治家和心理学家)。每一步的战术可以选择合作背叛(就是害人的意思),双方合作各得3分,双方背叛各得1分,一方背叛而另一方合作则背叛5分而合作0分。背叛的回报很大因此诱惑很大,与真实生活的情况类似。经过混战,比赛结果出人意料,一个具有善良、宽容和公正等优良品质的一报还一报 策略(TFT)以明显优势胜出。TFT策略非常简单:第一步选择合作;从第二步开始就模仿对方上一步的选择。这意味着:首先是善良,从不先手背叛;其次是公正,如果对方背叛就给与回击;然后是宽容,一旦对方改正错误,就马上重新合作。那些不成功的策略都是投机主义者,都太想占便宜,总是背信弃义。艾克斯罗德对这个太过美丽的结果不放心,第二次实验使参赛策略增加到62个,并将第一实验的结果事先公开,尽管第二实验的参赛者都明知TFT的优势,可是大多数人还是宁可设计更复杂更阴险的背信弃义策略,可见大多数人多么希望多占便宜而不惜伤害他人,但第二实验的结果仍是TFT胜出。这个实验被认为或多或少证明了好心有好报,好人笑到最后。

   这个梦想并没有照进现实,人们的真实经验似乎说明小人更得利。如果理论与事实不符,肯定是理论出了问题。在艾克斯罗德实验中好人所以能够笑到最后,其中一个原因是其杀不死假定:每个博弈者可能失败(得分低),但不可能被消灭(杀死)。这个与真实世界不符的规定显然不能正确表达人的命运。艾克斯罗德实验改变了博弈的存在论条件而使实验世界与真实世界不相通。杀不死假定使生死游戏弱化成输赢游戏,博弈不再严重,命运不再严肃。杀不死意味着永远有机会卷土重来,这限制了不择手段竞争的威力,从而造成善良策略必定具有博弈优势的假象。假如取消杀不死假定,把艾克斯罗德实验重新规定为:当博弈者由于选择合作而遭受n次背叛的打击(n0分)就必须退出比赛,相当于被杀死,这就比较接近真实世界了。可以推想,在这个生死博弈中还是会有一些好人最后获得胜利,但也有一些好人会被吃掉。这是个危险的信息,当一些合作者发现这个问题,就会选择不出头、搭便车甚至蜕变成背叛者。坏人更容易占到便宜的信息会使好人退化,这是一个真实难题。

   我们可以设计一个与现实虽然不同但足够仿真的升级版博弈,条件如下:

   (1)每个人都优先考虑自己的利益,包括自己的专有利益(比如私有财产和个人自由)和自己可及的共享利益(比如公共物品和关系情感),并且,在专有利益与可及共享利益之间不存在固定不变的偏好排序,尤其不存在专有利益总是优先于可及共享利益的排序,每个人都将仅仅考虑某种利益,无论是专有的或是共享的,是否是自己可得的最大利益;

   (2)每个人都是理性的。每个人都将按照自己的价值排序去理性地计算得失。不存在所有人通用的价值排序表,并且,没有人能够强迫别人改变价值观。假定某人的偏好是cab,而大多数人的偏好是abc,他将仍然坚持他的偏好排序,这一吾爱吾所爱的利益取舍将被认为是理性的;

   (3)每个人都不是傻瓜,尽管思维能力不等,因此各自独立能够想象的策略水平不等,但都有足够的学习能力;

   (4)每个人各自拥有的初始策略知识不等,但是人类可能选择的策略总量是有限多个的,因此每个人迟早都能学会其他人的全部策略;

   (5)足够多次的连续博弈。

   据此可以修正一个流行错误。在通常的分析模式中,个人利益的最大化仅仅计算到自己的专有利益,而没有把对自己甚至更有利的共享利益计算在内,并且还默认假定专有利益总是优于共享利益。这个分析模式是错误的。人追求最大利益,这没有错,但最大利益未必是专有利益,专有利益也未必都大于共享利益。事实上,每个人的大多数最大利益都只存在于共享关系中而不可能个人独占,一旦试图独占,这种利益就反而消失了,例如家庭、爱情、友谊、合作的巨大利益。因此,人们真正关心的应该是自己可及的利益中的最大利益,而不见得是个人独占的利益。理性计算没有错,但现代理论把需要计算的项目搞错了。

   在我们这个升级版游戏中,冲突同样严重,斗争同样残酷,人性足够贱,贱人足够多,人们见利忘义,而在集体行动时又总想搭便车,如此等等。但有一点需要特别注意,这就是,人人都想成功,人人都能够在博弈过程中学习模仿别人更成功的策略。于是,能力更强的人不断推出更高明的策略使自己利益占优,但领先总是暂时的,高明的策略很快变成公开知识而被大家所模仿,一直到各种成功策略都现身并且被普遍模仿,大家拥有饱和的共同知识或对称知识(对称的知己知彼),这时将出现集体黔驴技穷现象,大家都模仿被证明为最具优势的策略,于是达到普遍的策略均衡,此种成功策略就非常可能转化为稳定制度。

   虽然人人都模仿成功策略,但这不意味着每个成功策略都是好策略。所谓成功的策略是人人不比别人更吃亏或者没有人能够多占别人便宜的策略,因此,一个被普遍模仿的稳定策略有可能是人人受益的好策略,也有可能是人人利益受损的坏策略。因此还必须进一步确定什么是好的普遍策略。最简单又最明显的标准是无报应的普遍可模仿策略:如果一个成功策略被众人普遍模仿而不会形成作法自毙的反身报应,或者说,当一个策略被别人所模仿而不会反过来伤害自身,不会自取其祸、害人反害己,那么,这个成功策略就是经得起普遍模仿的策略,它就通过了普遍模仿的检验。也可以反过来说,假如一个成功策略被普遍模仿,别人的模仿形成以其人之道还治其人之身的效果而导致始作俑者自取其祸,就证明它是个坏策略。能够通得过普遍模仿检验的策略就是好制度的基础,也是普世价值的根据。

  评论这张
 
阅读(5)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017