|
新制度理论简说:政治学法学理论新发展的基础
【学科分类】法律经济学
【关键词】制度 博弈论 社会选择 机制设计 制度变迁
【写作年份】1998年
【正文】
上篇:政治学法学理论新发展的基础 ——新制度理论简介 丁利* Abstract: This paper gives a survey about modern developments in institutional theory. A unified normal framework consists of game theory, social choice and mechanism design. Game theory describes how people will make decisions in an interactive situation and what the outcome will be; Social choice theory gives a rule to determine which social alternative(s) is (are) best from some intuitively reasoned criteria for every individual preference profile. Mechanism design theory, linking game theory and social choice theory, concentrates on how to design a feasible game form, as an institution or contract, to realize or implement the social choice rule by its equilibrium outcome(s) exactly or virtually, because the designer can’t observe or verify the private information of players and can’t impose directly the social outcomes. As a necessary supplement, Institutional evolutionary theory interprets what restricts the boundary of constructive institutions and how institution changes and evolves when people’s knowledge, belief and technology change. Key words: institution, game theory, social choice, mechanism design, institutional evolution. 经济学家永远不能说一个制度比另一个制度更“有效率”, 这一判断超越了他的能力范围。 ——布坎南(Buchanan, 1959, 137-138) 导言 本文无意涉及所有西方法学政治学领域内的新动向,仅按照作者的兴趣,从一个比较合理的关于制度(institution)理论的一般框架所具有的逻辑要素来组织有关的材料。本文试图说明,现代西方社会科学中各种制度理论,是可以用一个统一的框架组织起来的。作者按照自己对制度问题的理解,尝试建立一个模式来处理其中的重要论题,或者说明它们原则上是可以这样处理的。本文在抽象的意义上讨论制度,它可以被解释为不同的对象。作者不求对制度问题的面面俱到的论述,只希望展现这个复杂问题的冰山之一角,即博弈论学者和其他社会科学家是用什么工具如何分析这些问题的,以及得出哪些有价值的结论。这些成果是现代政治学与法学不可忽视的,因为它们构成其今后发展的重要基础。 制度可以说是各种政治法律理论的核心对象。人类社会作为一种高度复杂的自组织结构,在长期的进化过程中发展出一系列制度,用以规范调整人与自然以及人与人之间的关系。政治法律学说反映了人们对此的思考。我们所称的新制度理论,特指二十世纪一批西方法学家,政治学家,经济学家和哲学家用统一的方法(主要是微观经济学,特别是博弈论)对制度问题的探索。 与西方政治法律思想史上的其它阶段不同,当代制度理论发展的一大特征是,各种学说之间的交流和融合。由于使用共同的语言和方法,使得围绕着制度问题的对话和讨论能够得到清晰的表述,对问题的回答和答案之间的分歧也非常显明。这与传统上不同学者或不同学派往往使用不同的概念和方法体系,理论之间不能互相翻译和沟通相比,其好处是显而易见的:第一,合乎“奥卡姆剃刀”(如无必要,勿设实体)和马赫的思维经济原则;第二,正象莱布尼茨所强调的,可以消除理论上不必要的争论或者使争论还原到不同理论前提。 而最近二三十年,社会科学,尤其是法学,政治学和经济学的这种统一性(unity)的表现就在于,它们已经把基础牢固地建立在博弈论(Game theory)以及相关的一系列经济学成果如社会选择和机制设计理论上。博弈论,作为研究“在相互作用相互影响的环境中人们是如何行动”的工具,使得原来学科之间的界限变得模糊,学科的结合越来越紧密。原则上,我们所面对的世界是一个整体世界,所谓的法、道德、经济、政治等概念只不过是我们用以描述世界的符号,所谓法学、政治学、经济学等学科的划分只不过是出于方便的考虑或者归咎于我们对整体的无知而不得已的选择 。 并且,法学是因对象而划分的学科,它自己本身几乎没有特殊的研究方法。易言之,它的大部分研究方法都是从其它学科借鉴来的(当然,这丝毫无损于其论题的崇高)。至于选择经济学作为基础工具,主要原因是历史性的,因为博弈论这门数学分支的发展历史中数理经济学家们是起了关键作用的,并且它主要被应用于经济学及其它社会科学 。今天经博弈论改造过的微观经济学已经被发展为关于“人类行为选择”的学问。另外,微观经济学的核心,本质上就是研究制度问题的。 当然,今天的理论都是在继承传统的基础上发展起来的,新制度理论深深植根于西方政治法律思想的传统中。古希腊古罗马甚至更早年代思想家提出的永恒性的制度问题,如正义,平等,效率等,依然是新制度理论家们思考的焦点;古典自然法学派及其社会契约论思想,边沁的功利主义,实证主义等等也都被吸收进新制度理论的框架里;在方法上,数学工具是毕达哥拉斯和柏拉图时代就强调的,霍布斯和斯宾诺莎等自然法学家也非常重视,马克思在给拉法格的信中也指出其重要性,这在新制度理论中得到了系统的运用。 所谓社会科学,无非是从不同的方面来研究人们的社会行为,即研究如下四类问题:第一,人类社会是如何存在运行的,特别的,在一种制度环境中人们是如何行为的;第二,人类社会应该追求什么样的目标;第三,为了实现这些目标,人类社会可以采取什么样的制度安排;第四,随着知识和技术的进步,人们的行为模式和制度是如何发展演进的。 博弈论(Game theory)、社会选择(Social choice)理论、机制设计(Mechanism design)理论和制度演进(institutional evolution)理论正是现代社会科学家们研究这几类问题的的标准工具。它们之间存在着密切的内在联系。博弈论是研究人们的行为是如何相互影响的,人们是如何在相互作用(interaction)之中作出自己的行为选择和行为决策的。社会选择理论所探讨的是,对于每一种社会经济环境,我们能否以及如何确定一个满足某些价值规范的社会目标集合。如果回答是肯定的,并且接受人们是按照博弈论所刻画的方式行为的,那么,机制设计理论则探究能否以及如何提供一个博弈形式(game form),使得在这个框架下的博弈均衡解是在社会选择目标集合里,也就是说,社会选择函数是可执行(implement)的,或者退而求其次,这种均衡解是无限接近于社会选择目标集合的,也就是说可以近似地执行的。而制度演进理论试图说明,一个社会中的人们是如何从人与自然,人与人的博弈中学习和进化的,是如何运用其知识进行制度建构以规范其生活的,这个过程所体现的特征是什么,以及(特殊地)那些进行制度变革和创新的社会,对更基本的制度设计问题所应采取的态度和对策,等等。 现代社会科学在这四类问题上都有严格而系统的研究,荟萃了众多理论成果。如冯诺意曼开创,纳什(John Nash)、豪尔绍尼(John Harsanyi)、泽尔滕(Reinhard Selton)等人做出经典贡献的博弈论;阿罗(Kenneth Arrow)关于社会选择理论的著名的不可能性定理,森(Amartya Sen)的帕雷托自由不可能性定理,以及豪尔绍尼的功利主义的社会福利函数和罗尔斯的正义论;赫尔维茨(Leonid Hurwicz)和马斯金(Eric S. Maskin)的机制设计理论,格罗夫斯(Theodore Groves)等人关于公共物品提供的研究;莫里斯(J. Mirrlees)、维克里(W. Vickery)、阿克洛夫(G. Akerlof)、斯本塞(M. Spence)、斯蒂格里茨(J. Stiglitz)等人的信息经济学;布坎南(Buchanan,James)研究政治学的公共选择理论及其宪法经济学;宾莫尔(Ken Binmore)用博弈论对社会契约论的新研究;科斯(Ronald Coase)的交易成本理论;哈耶克(F. A. Hayek)关于制度演进的理论;诺斯(Douglas North)关于政治法律制度与经济发展之间关系的制度变迁研究等等 。 博弈论:关于人类行为的描述理论 现代社会科学尤其是数理经济学中,关于人类行为的一般观点,占主导地位的是“理性人”假设以及由此派生出来的博弈论。按照阿罗的说法,理性(rationality)是关于选择的。每一次选择都可以理解为,决策者对自己的各种可能的选择所导致的各种结果都有一个偏好排序(preference ordering),这种偏好排序体现了决策者的效用(utility),在数学上可以表达为决策者最大化他的效用函数。原则上讲,结果的任何要素都可以进入决策者的效用函数。“我们的经济学主体可以是纯粹的利己主义者,纯粹的利他主义者,纯粹的苦行僧,纯粹的伊璧鸠鲁主义者,或者是更有可能的,混合着这些动机的人”(Robbins,1935,p95)。根据数学上的单调性我们可以区分利己主义(egoism),利他主义(altruism)和妒嫉(envy)型的效用函数。迄今为止,绝大多数经济学理论都以利己主义为基础。“经济学的第一原理就是每个人都只受自我利益驱动”(Edgeworth,1881,p16)。利己主义在霍布斯的名著《利维坦》中关于自然状态的描述中有着非常鲜明的刻画。包括霍氏在内的所有自然法学家强调的核心,“自然律是理性所发现的诫条或一般法则。这种诫条或一般法则禁止人们去做损毁自己的生命或剥夺保全自己的手段的事情,并禁止人们不去做自己认为最有利于生命保全的事情”。无独有偶,诺贝尔经济学奖得主布坎南的主要贡献也是在于把理性人假设引入政治学领域,开创了公共选择理论。更进一步,由于人们经常面对的是具有风险和不确定性的局面,著名数学家冯诺意曼和经济学家摩根斯顿在《博弈论和经济行为》一书中建立了冯诺意曼-摩根斯顿型预期效用函数,它成为最正统的效用函数。 博弈论(Game theory)可以说是最近几十年社会科学研究方法的最重要进展。1994年诺贝尔经济学奖授予普林斯顿大学数学家纳什、匈牙利裔美籍经济学家斯坦福大学的豪尔绍尼、德国经济学家泽尔滕,他们三人对博弈论的发展作出了决定性的贡献。作为着力于研究“理性人的互动行为”(Aumann,1985,p35)的一门学科,博弈论几乎可以被运用于经济学和其它社会科学的各个领域。奥曼在权威的《帕尔格雷夫大辞典》中的《博弈论》条中对这门学科的历史,它在八十年代中叶以前的发展成果作了精到的介绍。继博弈论的开创者冯诺依曼和经济学家摩根斯顿的巨著《竞赛论和经济行为》之后,九十年代的几本教科书性质的专著(Fudenberg & Tirole, 1991; Myerson, 1991; Osborne & Rubinstein,1994),加上奥曼和哈特主编的百科全书式的《博弈论及其应用手册》(Aumann & Hart, 1992, 1994),对博弈论作了全面系统甚至可以说是包罗万象的处理。 博弈论首先是一门数学,众多数学家开创了这门学科。二十世纪初的策梅罗(Zermelo),波雷尔(Borel)等人提出了一些零散的成果,甚至现代数理经济学的鼻祖,十九世纪法国人古诺(Cournot)关于寡头垄断的分析里也已经有了后来纳什提出的成为整个博弈论的核心概念的纳什均衡的雏形。博弈论早期的重大贡献是著名数学家约翰冯诺意曼关于二人零和(zero-sum)博弈的最大最小定理。1950年纳什完成其博士论文,并于次年据之修改发表了已经成为经典的《非合作博弈》(Nash, 1951),开创了非合作博弈的新局面,纳什证明了任何策略型博弈都存在纳什均衡,纳什均衡成为最基本最重要的博弈解概念。后来大家发现纳什均衡要求完全信息,而现实中更多的不完全信息博弈依然无法处理。豪尔绍尼(Harsanyi, 1967-8)提供了一个方案(Harsanyi doctrine),把不完全信息博弈转化为贝叶斯博弈,并定义了贝叶斯博弈的纳什均衡解,即贝叶斯-纳什均衡。当代博弈解的研究几乎都是围绕纳什均衡的加强与减弱进行的。 博弈论研究“理性人的互动(interactive)行为”,这意味着两个前提:其一,博弈的结果是由所有人的行动共同决定的;其二,既然每个人都是理性的,会运用他所掌握的所有知识和信息选择效用最大化的行为,那么他选择行动时必须考虑别人同样是理性的。博弈论的近期发展表明,它本质上依赖于两个东西,即在它的模型内,博弈者的知识和技术。博弈者的技术决定了博弈的物理框架,即每个博弈者的策略集合,建立在策略组合上的结算函数等 ;而博弈是如何进行的,即什么样的博弈解是合理的,则由博弈者的知识决定。 毫无疑问纳什均衡是所有非合作博弈解概念中最著名者。所谓纳什均衡,就是这样一个策略组合,在其他人不改变策略的情况下,每一个人都不可能通过改变策略提高自己的所得。如博弈论的经典之一《博弈和决策》的作者卢斯和莱法所指出:“如果我们的非合作理论导致一个策略选择的组合,并且它具有这样的性质,即关于理论的知识不会导致一个人作出一个不同于理论预见到的选择,那么理论剥离出来的策略一定是均衡点” 。这也使得它成为最有吸引力的解概念,因为纳什均衡是满足自我实施(self-enforcement)性质的最低要求。当然,正如奥曼所表明的,并非所有纳什均衡是自我实施的(Aumann, 1990)。 下面我们以著名的“囚徒困境”(Prisoners’ dilemma)来说明什么是纳什均衡。作为博弈论中的一个著名例子,它受到的广泛注意是无出其右的。并且我们从中可以看出个人理性和社会理性是如何发生冲突的。霍布斯认为,所谓自然状态,就是“一切人反对一切人的战争状态”,这在囚徒困境中可以得到部分说明。 囚徒困境假设:甲乙二人因偷窃被抓,检察官向他们指出如图所示的各种情况下的徒刑年数(右边为相应的纯效用结果)。我们可以看到,在这里,每个囚徒都有两种战略:坦白和抵赖。纳什均衡就是两个人都选择坦白(这甚至是占优策略均衡,即每个人的策略对别人的任何策略总是最佳应对)。换句话说,不论对方如何选择,个人最优选择是坦白。因为假设乙抵赖,如果甲不坦白,二人各判2年,如果甲坦白,甲被释放,乙判10年,所以坦白比不坦白要好;反之,假设乙坦白的情况下,如果甲抵赖,甲判10年,乙被释放,如果甲亦坦白,则二人各判5年,所以坦白还是比不坦白要好。所以不论于甲于乙,坦白总比抵赖要好,最终结果是两人都选择坦白,各判5年。其实。如果两个人都抵赖,各判2年,当然比都坦白各判5年要好,但这个帕雷托改进办不到。至于如何在不同的博弈结构里“走出”囚徒困境,大抵要依赖于多次博弈和某种非完全理性,比如“一报还一报”(所谓“己所不欲,勿施于人”)策略。 囚徒乙 坦白抵赖背叛合作 坦白5,5 1,10背叛 -5,-5-1,-10 囚徒甲 抵赖10,12,2 合作 -10,-1-2,-2 另外一个例子是所谓的“特权的灾难”。 甲乙丙 a b c b c a c a b 在一个委员会(如美国参议院中的民主、共和两党与副总统)中,甲(相当于副总统)有特权,即如果乙和丙意见不一致时以他的为准。如上是三个人的真实偏好。这个博弈可以用后面提到的劣策略重复剔除方法解出。由于预见到甲会选择a,而a是对乙最差的,那么乙会选择c,因为b是丙最不喜欢的,并且丙会预见到这点。结果乙和丙都选择了c,博弈的结果是享有特权的甲最不喜欢的c出现。 纳什均衡所要求的理性程度和知识是很强的,那么这些知识来源于什么呢?传统博弈论提供了几种看法,如事前交流(pre-play communication)、自我实现的预言(self-fulfilling prophecies)和焦点(focal points)解释。事前交流解释是说,如果博弈者事前讨论如何玩这个游戏,那么它一定是纳什均衡,要不就会至少有一个人有动力偏离这种玩法;自我实现的预言是说如果大家都知道一个理论预言游戏应该怎么玩,那它一定预言的是纳什均衡;至于焦点解释,则是说,所谓均衡,就是大家都知道的明显的玩法。 由于对范围广泛的博弈来说,纳什均衡的存在要求混合策略,即博弈者以一定的概率随机地选择其行动,因此值得给出必要的解释。对于随机策略均衡可以有几种理解 :第一,理解为行动方案;第二,每个博弈者实际上选择纯策略,随机策略反映了对手对他的信念的不确定性,或者说这是对手对他的猜测(conjecture);第三,展开型博弈中的纯策略;第四,如豪尔绍尼所揭示的,看作一个被扰动的博弈(perturbed game)的纯策略;第五,进化过程中运用相应的纯策略的博弈者在人群中的稳定分布(steady state)。但纯策略的选择必须是随机的,否则对手有可能会改变策略,也就有可能脱离这个均衡。 虽然人们通常认为纳什均衡是非合作博弈最可接受的解概念,但奥曼( Aumann, 1987),伯恩亥姆( Bernheim, 1984)和皮尔斯( Pearce,1984)等人指出,比纳什均衡更弱的概念,如重复优超解(iterated dominance),可合理化解(rationalizability),相关均衡解(correlated equilibrium),也有成为博弈解的很好的理由。博恩海姆(Bernheim, 1986, 1998)对这四个规范型博弈的基本解概念作了公理刻画。他提出四个公理: 最优性(optimization)意味着,每个博弈者都是理性的,所以他会选择一个根据其信念的最优反应,即他不会选择那些被优超的策略。 协调性(consistency)要求每个博弈者都认识到别人是理性的。 独立性(independence)意味着博弈者的信念之间是概率上不相关的。 普遍先验(common prior)要求博弈者的先验信念是一致的。 当满足最优性和协调性时,博弈的解为重复优超解;当加上独立性时,为可合理化解;如果不要独立性而加上普遍先验假设,则为相关均衡解;四个公理都满足时就是纳什均衡解。 展开型博弈描述了一个策略性互动过程的序贯结构的细节。它提供了比规范型博弈更多的信息,因为它确切地刻画了“谁在什么时候知道什么”以及“其结果是什么”等等。直觉上我们自然可以认为展开型博弈是比正规型博弈更广泛的,因为后者是前者中的一个退化或平庸情形,但二者的联系可能更重要。 有的展开型博弈会包括多个纳什均衡解,其中有的包含了不可置信的威胁。针对这种情况,泽尔腾提出了子博弈完美均衡概念。所谓子博弈就是原来博弈从某一历史以后的过程看作一个小的展开型博弈,子博弈完美均衡概念就是这样一个策略组合,每个博弈者在每个轮到他行动的历史点的策略选择总是最优的(给定其他人的策略),不论按照策略组合这段历史是否发生。库恩用逆向递推法(backward induction) 证明,任一完美信息博弈都存在子博弈完美均衡。 逆向递推法其实早被策梅罗用来证明一个定理,那就是象国际象棋、中国象棋、围棋等游戏本质上存在最优下法。另外,斯塔克博格的领导者——追随者模型也是可以用逆向递推法来求解。但这个方法也带来很多直觉上让人难以接收的结论。以下是著名的两个例子。 连锁店悖论(chain-store paradox)一个连锁店经营者(在位者)在很多城市开了分店。在每个城市,如果潜在竞争者不进入,那么他会得到比较高的垄断收入,竞争者得到零。如果竞争者进入,那么在位者可以选择战斗或妥协,战斗的结果是两败俱伤,每人都得到负效用;妥协的结果是在位者得到比垄断收入低的正收入,竞争者得到正收入。显然,在最后一个城市,竞争者进入,在位者妥协是对双方都是最优的,依次类推,在所有城市,结果一样。 蜈蚣博弈(centiped game)。两个人做一个博弈,轮流具有停止博弈的机会。每个人都偏爱如果由他终止博弈的结局胜过下面由对手终止博弈的结局。但如果在这两个阶段都不终止,那么他就会得到更好的结果。这个博弈的子博弈完美纳什均衡(也是对应的策略型博弈的唯一纳什均衡)是,第一个人立即终止博弈。如果博弈的阶段足够多,这个结果是很违背直觉的。他们为什么不多玩几次呢? 与这两个例子类似,著名的囚徒困境在完全信息下有限次进行是“走不出”困境的。因为最后一次博弈背叛是占优策略,倒数第二次仍然如此,依次类推,每次博弈都会选择背叛。 解决这些问题有以下几条途径。一是无穷次博弈,如对囚徒困境,著名的无名氏定理就证明,所有帕累托优超于一次性博弈纳什解的结果都有可能出现,特别是冷酷战略,即以合作开始,但如果发现对手是背叛,那么就惩罚以背叛并至永远,只要贴现足够大,就可以使得合作成为均衡结果。二是有限理性。这又分为几种情况。其一,用比纳什均衡更一般的解概念如“ ”;其二,假设每个博弈者有一定的概率是“非理性”的,比如他总是采取针锋相对策略,如果大家都知道这点,那么在有限次重复的博弈中也会产生合作的结果,著名的“四人帮”模型就证明了这点。这种方法的关键就是“声誉”,博弈者可以通过建立某种声誉来实现较好的结果。连锁店博弈中在位者可以通过对进入者的竞争行为给潜在进入者造成会继续竞争的印象(实际上竞争没有发生,但问题关键是,只要潜在进入者相信他会这么做)。按照奥曼的看法,把这个方法一般化就是,其三,放弃“普遍知识”假设,包括引入对博弈者的推理能力和执行策略的计算复杂性限制,博弈者对博弈进行阶段的不确定,等等。 与第二种方法有关,非完美信息展开型博弈也就被引入来了。如奥斯本和鲁宾斯坦所总结的,非完美信息展开型博弈与前面的博弈的不同之处在于,博弈者可能对过去做出的选择不能完美地了解。在所有的博弈中,博弈者都会对他所不能确知的东西形成一个预期以做出行为选择。但是,与策略型博弈不同的是,这些预期不能仅仅从博弈者的均衡行为得出,因为他可能需要面对的是与均衡行为不协调的情境;也不像贝叶斯博弈,这些预期不能仅仅从均衡行为和关于机遇(自然)的变动的外生信息推论出来;与完美信息展开型博弈情况不同,它们不仅与其他博弈者的未来行动有关,而且与过去发生的事件有关。 由于策略包含博弈者的信息集,而信息集反映了博弈者对博弈历史的知识,所以此时的均衡解概念应该包括博弈者在每个信息集时的关于已经发生历史的信念。如果我们把理性理解为“在某种信念下的最优选择”,那么纳什均衡也就能被相应地定义。 通过对博弈者的信念施加不同的限制条件,特别是在非均衡路径上的信念,有三个文献中经常出现的强弱程度递增的解概念,即富顿博格和泰罗尔的完美贝叶斯均衡(perfect Bayesian equilibrium)、克莱普斯和威尔逊的序贯均衡(sequential equilibrium)、泽尔滕提出的颤抖手完美均衡(trembling-hand perfect equilibrium ) 。 这些解都是纳什均衡的精炼(refinning)(van Damme, 1992),它们在剔除具有不合理行为的纳什均衡方面发挥着重要作用。而在丹密看来,博弈论学者的种种探索努力只不过是受下述目的驱使:“理性决策的理论不应该是自我破坏的预言,以致使那些相信它的人产生偏离(理论预言的行为选择)的激励”。所以理论要提供一个自我实施(self-enforcing)的行为范式(norm of behavior),而这个范式(或协议(agreement))构成一个纳什均衡是自我实施性质的必要条件。因此非合作博弈理论就要分析这几个论题:哪一个协议是自我实施的(均衡定义问题)?如何或者在什么条件下博弈者会达成一个协议(均衡得到问题)?哪个协议可能成为最终结论(均衡筛选问题)? 。 但是,“如果博弈模型是不完全的,那么一个人在不知道模型的不完全性由什么组成,也就是不知道博弈在其中进行的场景的情况下,他就不能区别出哪一个均衡是自我实施的”。而博弈模型的完全性意味着“任何(事先的)承诺可能性,任何关于重复博弈的观点,任何犯错误的可能性,或者任何一起观察到一些随机事件的可能性,都已经被模型刻画在博弈树中了” (Kohlberg & Mertens, 1986, note 3rd)。由此,并认识到前述种种博弈解概念存在的各种缺陷,科尔博格和默顿斯(Kohlberg & Mertens, 1986)提出了一个统一的,集值型(set-valued)解概念——策略稳定集(strategic stable set)。后来默顿斯改进了这篇文章中的定义,证明对每个博弈存在一个均衡点的稳定集满足诸多在博弈结构变化下保持稳定的良好性质。 最后,值得我们关心的一个问题是,纳什均衡或者它的某种推广在什么意义上构成一个博弈的解,这个解在什么程度上恰当解释了博弈者的行为选择。这就是所谓博弈论基础问题。关于纳什均衡作为博弈解用以描述人类行为的合理性,至少在纳什那里有两个解释。其一,“在所讨论的博弈中,对理性地进行博弈的可预期的行为的一个合理预测是什么?通过运用一些原则,如一个合理的预测应该是唯一的,参与人应能充分推理和利用知识,并且对于每一个参与人,关于其他参与人行动的知识将不会导致他的行动偏离这个合理的预期。这样我们就得到上面我们定义的解的概念。在这种解释下,我们需要假定参与人了解整个博弈的结构,从而能各自推导出这个预期。这是一个理性和理想化要求很强的解释”。博弈论里普遍知识(common knowledge)方面的研究就是涉及它的。其二,“大众行为”(mass action)的解释。“在经济或国际政治的一些场合,利益集团不自觉地被卷入到一个非合作的博弈之中,这种不自觉使得这个场合变成了一个非合作博弈。在这种解释下,假定参与人对整个博弈的结构有完全的知识或者有能力进行复杂的推理不是必需的。但是我们假定参与人能对他们的各种纯策略的相对益处积累经验性的信息。我们假定存在一定的参与人群并且这些参与人的“中间分子”运用纯策略有一个稳定的平均频率” 。现在很活跃的进化博弈理论(研究博弈中的学习和进化问题) 可以认为是这个方向上的深化。 社会选择理论 社会选择理论研究一个社会的价值规范问题,其核心在于个人和社会之间的关系,正如1998年诺贝尔经济学奖得主森所说“它处理如何把个人利益,判断和福利的集合转化为社会福利,社会判断和社会选择的加总形式”(Sen, 1987, 382)。 所谓社会选择,在数学上表达为一个建立在所有个人的偏好上的函数(或对应),该函数的性质代表了一定的价值规范,比如公民主权、全体性、匿名性、目标中性、帕雷托最优性、无独裁性等。社会选择最重要的问题是,这些价值规范之间是否是逻辑上协调的。在这个意义上,社会选择领域笼罩在两个不可能性定理的巨大身影之下,即阿罗的不可能性定理和森的帕雷托自由不可能性定理。 众所周知,多数原则是现代社会广泛接受的决策方法。洛克认为“根据自然和理性的法则,大多数具有全体的权力,因而大多数的行为被认为是全体的行为,也当然有决定权了”。但很多在自然法学家那里是想当然正确的东西在社会选择理论中是需要证明的。 正面成果是梅(Robert May)在1952年证明的,即一个社会福利函数是多数投票型的,当且仅当它满足匿名性、目标中性和正反应性。匿名性保证不会出现某一个人的意愿受到特别重视,也就是一人一票没有特权;目标中性指在合法的和技术可行的范围内,所有社会目标都受到同样待遇;正反应性表明,如果原来社会喜欢甲胜过乙,现在有至少一个原来喜欢乙的人转而喜欢甲,那么社会还应喜欢甲。这三条都是直觉上很合理的标准,而多数投票是唯一满足它们的。 但是,早在十八世纪法国思想家孔多赛就提出了著名的“投票悖论”:假设甲乙丙三人,面对ABC三个备选方案,有如图的偏好排序。由于甲乙都认为B好于C,根据少数服从多数原则,社会也应认为B好于C;同样乙丙都认为C好于A,社会也应认为C好于A。所以社会认为B好于A。但是,甲丙都认为A好于B,所以出现矛盾。投票悖论反映了直观上良好的民主机制潜在的不协调。1972年诺贝尔经济学奖的获得者肯尼思·阿罗,在他的《社会选择与个人价值》(Arrow, 1951, 1963.)中,把这个投票悖论形式化为著名的阿罗不可能性定理。在该书中,他运用数学工具把孔多塞的观念严格化和一般化了。阿罗证明,不存在同时满足如下四个基本公理的传递性社会选择函数:1)个人偏好的无限制性,即对一个社会可能存在的所有状态,任何逻辑上可能的个人偏好都不应当先验地被排除;2)弱帕雷托原则 ;3)非相关目标独立性,即关于一对社会目标的社会偏好序不受其它目标偏好序变化的影响;4),社会偏好的非独裁性。 甲乙丙 a b c b c a c a b 帕雷托最优是经济学家和其他社会科学家用来衡量社会效率最常用、最普遍、甚至是唯一的指标,它指的是这样一种“大家都好得不能再好”的状态,即在此状态下,没有一个人可以在不损害他人福利的前提下使自己的福利得以改善;而个人自由原则又是人类不懈的追求,二者都是人们直觉上能够完全接受的标准。但是,森的研究表明,这两个如此诱人的标准却是矛盾的,无法总是同时成立。与阿罗定理不同的是,森的定理非常简单,它建立在三个基本前提假定之上:1),个人偏好的无限制性;2)帕雷托原则;3)最小自由原则,即社会应当赋予至少两个人各自在至少一对社会状态之间有选择权,如果他认为甲比乙好,社会不应干涉而应认同。用森的话说就是,如果你想趴着睡而不想躺着睡,社会应当认可。但是,森证明,对于二人以上的社会,不存在同时满足上述三个条件的社会选择函数(Sen, 1970)。因为,帕雷托最优与最小自由原则结合在一起,会出现与阿罗不可能性定理所揭示的孔多塞投票悖论类似的循环性结果。 定理的意义可以用经缪勒(Danis Muller)修正过的例子(森是它的原始作者)揭示出来。假设一个二人社会由好色的张三与拘谨的李四组成,他们面对着那本有名的《查特莱夫人的情人》。好色的张三希望由李四来读这本书,但相比谁也不读它而言,他宁肯自己来读它;而拘谨的李四则希望最好大家都不读这本书,但相对张三读来说,还不如他自己来读。如此则有下面的矩阵: 张三 不读读 读 a b 李四 不读 c d 如果我们赋予李四选择横行的策略的权利,张三选择纵列的权利。那么,对李四来说,(c,d)好于(a,b);对张三来说,(b,d)好于(a,c)。显然,李四在a和c之间选择c,张三在c和d之间选择d,结果d却帕雷托劣于a。正如缪勒所指出的,上述矩阵类似于博弈论中著名的囚徒困境。 我们面临的是与古希腊神话里那个推石上山的希绪索斯同样的困境。正如俗话说的好,你不能既要马儿跑,又要马儿不吃草。森和阿罗的定理表明,我们并不是总能达到十全十美的境界(我们没法鱼与熊掌兼得),也就是说,我们面临着各种目标和标准之间的折衷(trade-off)。这只是问题的一面,另一面是我们现实里能达到什么样的境界,我们是怎么饶开这些“不可能困境”而避免落入悖论的呢?或者说,如果这些尴尬是避免不了的,那么我们在现实中是如何区分民主与非民主,自由与非自由社会的呢? 这两个定理都是建立在序数偏好上的,一个直觉上很诱人的思路是,如果利用基数偏好提供的更多的信息是否能够走出这些困境。森后期的研究很大一部分集中在这个方面,即如何测度效用,以建立能让人们接受的社会选择规则。鉴于森的重大贡献,他获得了1998年诺贝尔经济学奖。 基数偏好意味着人际间的效用比较。豪尔绍尼和罗尔斯(罗尔斯的理论只 需序数可比较性;豪尔绍尼的理论是基数性可比较的)据此得到了他们的著名结果。社会选择理论研究的很大一部分是围绕着这两个结果展开的(Claude d’Aspremond, 1985)。 豪尔绍尼的功利主义的可加总的社会福利函数,可以看作是边沁主张“最大多数人的最大幸福”的形式化。卢梭曾写道:“公意只考虑到公共的利益,而众意则考虑到个人的利益;众意是个别意志的总合。但是,在众意里去掉其正负相抵消的部分,则减余的部分是公意”。后来以边沁为代表的功利主义者也主张最大多数人的功利的最大化。豪尔绍尼(Harsanyi,1955)建立了一个可加总的社会福利函数,才真正使我们看清楚了什么前提下我们可以接受这种功利主义的观念,最主要的是我们假设每个人都是预期效用最大化行为者,并且假设“一个人有相同的可能性被置于社会的任何具体成员的位置上”(Harsanyi, 1953,435)。在不同前提条件下他实际上得到了两个定理。第一定理是说,社会福利就是个人效用的简单加总;第二定理指出,社会福利函数可以表达为,赋予每个人的效用一定权重,根据这些权重进行加总。定理的前提中包含了社会福利函数和个人效用函数一样都是基数的,并且满足冯诺依曼-摩根斯顿公理或等价的前提。但是功利主义社会选择函数具有词典式个人独裁性质,正如吉沃斯所指出 ,“这个加总原则依赖于一个外生的个人间阶梯,社会偏好总是保证了站在阶梯顶点的人的严格偏好”。 与豪尔绍尼不同的是,罗尔斯正义论不是建立在严格数学论证的基础上 ,甚至包含某些不协调。但无论如何,这是一项重要的贡献。原来人们对公平的理解通常是平均分配(所有社会资源和产品在每个人之间的平均分配)和无妒嫉型分配(即没有人会妒嫉他人的处境),罗尔斯提出了另一个很有吸引力的标准。他认为正义应该满足如下两个原则:其一,每个人都有关于平等的基本自由的最广泛配置(与所有人的类似自由配置相容)的平等权利;其二,社会和经济的不平等要符合两个条件,a)他们应使社会中处境最糟糕的成员相对的预期效用最大(最大最小公平原则)b)并且附以在机会的公正平等条件下职位和地位向所有人开放(Rawls, 1972,p55)。这些原则之间满足词典式排序。在这些原则中,真正引起争议的是最大最小原则。罗尔斯曾罗列了接受这个原则的几点理由:很可信的正常的风险回避(给定初始地位的特殊细节);要求的信息不多;作为一个公共原则较为适宜;承担义务的张力较弱(Rawls, 1974)。与豪尔绍尼类似,假设所有人处在一个“无知之幕”后面的前提起着重要作用。执行这个原则会导向一种极端的“分配正义”,普拉特,杰沃斯,罗伯茨等人分别证明存在一个不可能性结果:罗尔斯型的正义论会导致,存在一个(按照社会处境排序的)阶层,他们的偏好决定了社会偏好。哈耶克也指出:“分配正义原则,除非整个社会都被组织得与其一致,否则就不能执行。这将产生一个在所有重要方面都是自由社会反面的社会,在这种社会里,权威决定了个人要做什么和如何去做”(Hayek, 1960, p100)。 由于森后期的研究与豪尔绍尼和罗尔斯遵循的是同一个思路,我们有必要适当讨论一下个人自由原则。在森看来,个人自由意味着,对于社会中的每一个人都至少在某一选择上有被社会认同的自由,其本意在于给每个人以一定的个人空间,使得他在这个空间内作出的选择能够得到社会的认可。但是,森对自由的定义和刻画存在着一些问题,如果用博弈论的实证语言来描述社会、制度和权利的话,那么,一个社会的存在状态就是个人决策与环境共同作用的结果。这样,自由实际上已经被赋予在博弈框架内,个人的策略范围就是他的自由的界限。或者说,在技术赋予的可能范围内,制度通过对博弈结果的影响限制了博弈者的合理策略集合。基本自由体现在个人对备选策略的选择权上,所以我们总是存在着最小的自由。至于个人自由选择是否总是能够导致帕雷托最优,从囚徒困境给我们的启发看,在一般意义上大部分博弈的结果是非帕雷托最优的 。结合豪尔绍尼和罗尔斯的贡献(仅仅在社会选择意义上,他们的研究都是无可非议的),我们可以提出这样一个问题:能否有一个全知全能而又不怀私心的裁判或中央计划者,或者一个所谓民主的集中的决策程序,通过它确立一个社会目标,这个目标满足帕雷托最优以及更广泛的其他社会选择规则,并且进一步找到一种构造式的可操作可控制的直接实现目标的方法。特殊地说,是否有这样一种可能,既然自由和帕雷托最优如鱼和熊掌不可兼得,那么,通过一个限制或代替个人自由的集中决策程序,就可以直接实现帕雷托最优(这实际上是一个机制设计问题,后面要讨论)。 最后,我们引用森对社会选择理论的总结性评述:“社会选择理论在过去几十年受到极大关注的理由之一是和它处理的领域的重要性联系在一起的(在广泛意义上这个领域刻画了理论的特征)。另一个原因在于,它在把含蓄的思想明确化,保持这些思想含义的一致性和明晰性方面硕果累累。作为一种方法论学科,社会选择理论在澄清早先是模糊的问题上卓有成效。尽管不顾一切地坚持明晰性也有一些限制(有时用于社会选择理论的公理结构的狭窄性确实被视为一种局限),但在分析涉及集体加总的经济,社会和政治问题时,社会选择理论与其它方法论传统相比无疑很有创造性。要对本文所述及的众多文献作出判断,看看它们在澄清含混解释模糊方面的成就即可。也许所谓成功是令人喜忧参半的,但这乃是意料之中的”(Sen, 1987, 389)。 机制设计理论与制度安排 社会选择理论是一种抽象的规范理论,从元理论的角度来看,研究者可以假设他作为一个客观的观察者,了解所有人的偏好,从而能够确定那些帕雷托最优点以及其它一些合理的社会选择目标。但是,在机制设计理论中,机制设计者没有也不可能了解所有信息。假如能够了解和掌握全部信息,那么,机制设计就只是一个简单的优化计算问题,象计划经济那样的直接控制和强制命令就是最好的制度。这样也就不存在什么机制设计问题。问题在于,在信息不完全 的情况下,如何设计出有效的制度。哈耶克认为:“社会理论的整个任务,乃在于这样一种努力,解释整个经济活动的秩序是如何实现的:这个过程运用了大量的知识,但这些知识并不是集中在任何单个人脑中的知识,而仅仅是作为不计其数的不同的个人的分立的知识而存在的。”(Hayek,1967)。 机制设计理论的思想渊源可以追溯到30年代关于社会主义的大论战。米塞斯指出,“自由主义和社会主义,两者都献身于全人类的善,它们之间的区别不在于它们的目标,而在于它们用以达到最终目标的手段”(Mises, 1985)。论战的另一方主将之一兰格的学生,美国数理经济学家利奥.赫维兹在六七十年代创立了机制设计理论,尝试对这些问题作出回答。 机制设计需要解决两个问题:一是信息(information)问题,任何一个机制的设计和执行都需要信息传递,而信息传递是需要花费成本的,因此,对于制度设计者来说,自然是信息空间的维数越小越好。乔丹(Jordan,1982)证明,对于新古典经济环境类,不存在其他经济机制(包括市场社会主义)既能导致资源有效配置,又比竞争市场机制使用了更少的信息,后者是唯一的信息空间最小且有效的经济机制。这就部分证明了哈耶克在30年代大论战中作出的判断。 二是机制的激励(incentive)问题或积极性问题,即在所设计的机制下,使得各个参与者在追求个人利益的同时能够达到设计者所设定的目标。在不同的博弈行为假设下,机制设计理论会有不同的结果。 首先受到关注的是占优策略(dominant strategy)。所谓占优策略,就是一种以不变应万变的策略,不管别人采取什么策略,我的策略总是致胜之道。“做老实人,讲老实话”就是一个占优策略。问题在于,讲真话不满足激励相容约束,在别人都讲真话的时候,可能会有人通过说谎而得到好处。如萨缪尔森在讨论公共物品的提供问题时指出:“对每个人来说这是符合自我利益的,发出错误的信号,在一个给定的集体消费行为中假装只有比真实所得更小的好处”(Samulson,1954,pp 388-9。)。 那么,什么时候或者说在什么样的机制下人们总是愿意讲真话呢?如果对人们的偏好不加限制的话,只有当社会选择的规则是独裁性的时候。此时独裁者有动力显示他的真实偏好,而其他人,讲真话聊胜于无。所以能被占优策略均衡所执行的社会选择规则只能是独裁性的。这就是吉巴德-萨特斯维特的操纵定理,它与阿罗定理是等价的,并对阿罗定理给出另外一种实证解释,即现实中可能观察不到投票循环的发生,而代之以人们策略性地投票。其得名也正源于如果放弃占优策略的要求,那么就会有人通过虚假显示自己的偏好操纵最后结果以使自己得利。 回到投票者悖论的情形。我们可以很容易地看到,如果按照先在c和b之间投票,然后胜者与a做最后比较,并且人们真实地表露自己的偏好,那么胜者会是a。但是,这通常不是考虑到策略性因素的合理结果。乙会认识到如果最后是a和b决斗,由于甲、丙都会投a的票从而社会选择的是他最不喜欢的a,那么他就会在第一轮投c的票,使得最后的决斗在c和a之间进行,这样胜者是他较喜欢的c。 甲乙丙 a b c b c b c a a 但如上面的偏好组合,如果议程如前,则似乎丙通过虚假显示偏好cPaPb从而与前例类同而得益。但是,方案b是唯一的孔多塞胜者(两两比较击败a和c),此时的策略性投票会使得最终胜出方案为b。因为甲可以通过在第一轮投b的票保证不是自己不喜欢的c。 赫维兹的“真实显示偏好”不可能性定理(Hurwitz, 1972)是另一个消极结论。在个人经济环境中,在参与性约束条件下(即导致的配置应是个人理性的),不存在一个有效的分散化的经济机制(包括市场竞争机制),能够导致帕雷托最优配置,并使人们有动力去显示自己的真实信息,也就是说,真实显示偏好和资源的帕雷托最优配置是不可能同时达到的。 在纳什均衡行为假设下,马斯金1977年的文章证明,能被执行的社会选择规则一定是满足单调性的。单调性意味着,如果某一方案在一种环境中是可取的社会选择,而在另一环境中,这个方案使得大家相对于前者是一帕雷托改善,那么在后一环境中,这个方案也应该成为社会选择。马斯金还证明,在博弈参与者三人或三人以上时,单调性加上无否决权条件还是一个充分条件。无否决权就是,如果有一个方案是大家都最喜欢的,而最多一个人例外,那么这个方案应该成为社会的选择。马斯金这篇影响极大的文章二十年后终于发在《经济研究评论》上。后来发现,几乎在贝叶斯均衡,完美均衡等各种行为假设下,单调性都是一个社会选择规则能被执行的必要条件。 圣经中的所罗门王的故事是大家耳熟能详的。但吹毛求疵地说,故事中的假母亲是不够聪明的,如果她和真母亲说同样的话,那所罗门王该怎么办呢?这可以通过一个类似竞标的机制来完美地解决。显然,所罗门王不知道谁是真母亲(计划者不知道博弈者的个人信息,这是几乎所有机制设计问题都坚持的一个假设,否则问题退化为一个简单的优化问题,他可以强迫执行),但他知道真母亲比假母亲赋予孩子更高的价值,真假母亲也都知道这点,并且这是一个普遍知识,即她们都知道每个人都知道这点,她们都知道每个人都知道每个人都知道这点,以至无穷。换言之,她们进行的是完全信息博弈。 这可以通过一个类似竞标的机制来解决(以下相关内容主要取自摩尔的综述文章)。显然,所罗门王不知道谁是真母亲(计划者不知道博弈者的个人信息,这是几乎所有机制设计问题都坚持的一个假设,否则问题退化为一个简单的优化问题,他可以强迫执行),但他知道真母亲比假母亲赋予孩子更高的价值,真假母亲也都知道这点,并且这是一个普遍知识(common knowledge),即她们都知道每个人都知道这点,她们都知道每个人都知道每个人都知道这点,以至无穷。换言之,她们进行的是完全信息博弈。 所罗门王可以向其中任一母亲(姑且称其为安娜)提问孩子是不是她的。如果安娜说不是她的,那么孩子给另一个女人(可称其为贝莎),博弈结束。如果安娜说孩子是她的,那么所罗门王可以接着问贝莎是否反对。如果贝莎不反对,则孩子归安娜,博弈结束。如果贝莎反对,则所罗门就要她提出一个赌注v,并向安娜收取罚金F。然后,让安娜选择是否愿意与贝莎竞争。如果愿意竞争,那么她要交给所罗门王赌注v那么多钱,孩子给她,同时贝莎也要缴纳罚金F;如果不竞争,那么孩子给贝莎,她给所罗门王赌注的钱v。 读者可以很容易地推出,在安娜是真母亲的情形下,她的策略是说孩子是她的,然后贝莎不反对。因为她反对的结果只会导致她白白缴纳罚金,因为安娜为了得到孩子,必然会真实地根据孩子对她的价值选择竞争;在安娜是假母亲的情形下,她的策略是承认孩子不是她的,因为如果她说孩子是她的,贝莎必然会反对,并且贝莎为了得到孩子一定会选择竞争,而安娜只有报出高于孩子对她的真正价值的赌注才会得到孩子,可这就不合乎她的偏好了。 当然,在假母亲具有妒忌型效用函数时,上述机制就无效了。她可以出很多钱得到一个并不物有所值的东西,只因为这样损害了别人。这种损人不利己的行为,相信大家都知道是很让人头痛的(这是我为什么前面说机制设计几乎完美解决这个问题的原因)。相反,如果她再有钱,只要是一个正常的利己主义者,而机制设计者又是依法办事的,那么问题依然好办。 我们想强调的是,任何制度安排和机制设计,都不得不考虑的与信息和激励有关的几个问题。我们要实现某一个目标,首先要使这个目标是在技术可行性(feasible)范围内;其次,我们要使它满足个人理性 (individual rationality)或自愿参与 (voluntary participation ) 约束;第三,它要满足激励相容(incentive compatibility)约束,要使个人自利行为自愿实现制度的目标。孟德斯鸠在《论法的精神》里有一个绝妙的例子。中国通常对抢劫罪的处罚是徒刑,而俄国的处罚则是死刑,结果导致的是,在俄国因抢劫而杀人的案子非常多,因为只有死人才不会指控一个人犯抢劫罪。所以不适当的立法往往与立法的美好愿望南辕北辙。第四,机制的信息维度和计算复杂性应该是有界的、尽量小的。第五,机制应该是稳健的,即不会因为人们犯了小错误而导致大灾难。 我们有必要在此提一下著名的科斯定理。虽然科斯指出“在零交易费用的情况下,资源配置不受法律规定影响的观点也表明:在正交易费用的情况下,法律在决定资源如何利用方面起着极为重要的作用”(科斯,1994,322),但是即使是零交易费用情况下,并非一定能实现帕雷托最优。联系前述森的例子,吉巴德(Gibbard) 和凯莱(Kelley)等人基于一个强烈的契约自由的自由主义传统,主张人们的可让渡的权利(alienable right)即 放弃权利的权利(right to give up right)。在这个故事里,李四可以向张三保证他会看这本书以换取张三的不读它,这样通过自愿的权利转移实现了帕雷托改善。但问题是这个弃权方法也只是在包括此例的一部分问题中有效,在很大一类情形下就没有合适的社会选择结果了。并且它的能否被实施是成问题的,因为,在缺少信息透明度(如没有有效的“法庭”来确认)的情况下显然两个人都有动力违背这个契约。除非我们使交易费用包罗万象。显然,交易费用尚未成为一个可测度的概念,而外在的“法庭确认”以及广义的“制度运行成本”(阿罗)应属交易费用之列。 现在我们回到前面提出的问题,结合机制设计理论的其他成果,我们可以更好地理解它了。完全集中决策体制确立的社会目标即使是合意的,也是难以企及的,在执行中会遇到来自信息和激励两个方面无法解决的困难。 现在我们简要考虑一下更深层的保证制度得以执行的制度问题,即应该提供足够的激励,使制度执行者在追求自我利益的过程中也实现社会整体(作为制度设计者)希望的利益。从机制设计的角度可以把问题具体化为这样一个激励问题,即,人类社会如何选出制度执行者,以及如果他们是自利的,容易利用自己的执行权力损害社会利益时,如何设计一套制度监督约束他们。用委托代理(principle-agent)理论的框架来表述,那就是:我们不具有某种特殊的知识,只好委托一些人代理某些事情。我们凭什么知识筛选识别出宣称自己拥有这种知识的代理人呢?我们又凭什么制度使这些代理人不会利用自己的特殊知识作出损害我们的事情呢?。 既然我们不能改变人们追求自我利益的本性,我们就不能寄希望于我们会幸运地遇到利他主义者这样一种小概率事件。我们的制度必须从这样一种假设出发:如果我们的代理人是个利己主义者,我们如何在他追求自我利益的同时不致损害我们的利益,进而让他的追求个人成功和个人福利的行为最大程度地为社会服务。于是,途径也就很明了:一是我们要尽量保持信息的通畅,使得言论和新闻出版自由成为对执行权力的监督;二是从委托—代理理论可以得到的启示是,我们不仅可以利用事后罢免的“威胁”激励制度执行者在实现自我利益的同时,为委托人的利益服务,而且可以设计一个“代理人市场”,让代理人之间的竞争而不是“联盟”产生自动的激励,这可以认为是西方多党竞争,三权分立理论的一个说明。孟德斯鸠也早就说过:“从事物的性质来说,要防止滥用权力,就必须以权力制约权力”。所以,良好的制度必须赋予人民挑选制度执行者的权力,而在后者不具备才能或假公济私的时候还有罢免他的权力。道理很简单,人民可能不是很具备制度知识,但他们具备鉴别制度执行者行为后果是否对他们有利的知识,并且他们至少具有学习能力,会以“干中学”的方式不断充实他们的制度知识。 机制设计理论的着眼点不仅是要指出种种不可能性的困境,更重要的是要提供具体环境下走出困境的途径。人类创造了很多能够诱导人们显示并测度他们的效用的技术和制度,如拍卖和招标投标制度;也有很多理论在各种环境下设计出了相应的激励机制,如克拉克-格罗夫斯机制;很多局部的效用测度和比较也是可信的。人们有充分的理由否定完全的集中决策,也会明智地让个人决策受到某种集体意志的约束而避免完全的无政府状态。人类社会的现实选择本来就是理性设计和个人自由发挥的结合,二者之间的界限和结合方式是随着知识的积累和技术的进步而不断发展变化的,而不同的界限和结合又直接影响着人们能够得到什么样的知识和技术。这是一个问题不断产生又不断得到解决的复杂过程。而这也使我们自然进入了制度变迁的领域。 下篇:演进社会中的制度设计与实施 马克思有句名言:“哲学家只是用不同的方式解释世界,而重要的在于改造世界”。这个世界的奇妙之处的表现形式之一恰恰就是,如玻尔所说:“在生活的舞台上,我们既是演员,又是观众”。生活在一个非严格决定论的世界里,我们既是行动者,同时又是解释者。能够使我们对世界有所改造的,除了我们的雄心,我们所倚赖的不过是我们解释世界的知识而已。在我们的知识之外,我们把决策选择交给我们骨子里的冒险或谨慎的天性以及自然那不可蠡测的偶然。 所以,我们在本文试图从这样一个看似佯谬的自我相关的角度,以元理论的视角探讨演进社会中的制度设计与实施问题。正因为要取一个元理论的视角,我们最终得出的不是一些具体的结论,而更多的是一般原则。 按照哈耶克(Hayek,1967)的看法,“社会理论的整个任务,乃在于这样一种努力,解释整个经济活动的秩序是如何实现的:这个过程运用了大量的知识,但这些知识并不是集中在任何单个人脑中的知识,而仅仅是作为不计其数的不同的个人的分立的知识而存在的”。在我们看来,把这一问题表述清楚的难度与现实里人们如何解决它的难度差相比拟。 这段话至少隐含着几个意思,一是,在分工和专业化的社会里,掌握分立的知识的个人,是如何传递信息的,或者说是如何仅仅依靠少量的信息就协调起来了;二是,在博弈论所谓的互动社会里,个人理性决策是建立在关于其他人的行为的信念的基础上的,而其他人的行为又是建立在他们关于别人行为的信念的基础上,如此无穷,这样一个自我相关的无穷回归问题是如何得到解决的颇耐人寻味(特别在存在多重均衡的情况,人们在实际博弈中采取什么均衡策略);三是,既然一个人不掌握别人所具备的与他利益相关的决策的知识,他是如何相信别人不会利用其独有的知识做出对他不利的决策。换言之,他是如何了解并确信博弈的支付函数的。 笼统地说,我们可以认为社会是通过制度自我组织起来的。近几十年来,博弈论在知识论和演进论两个发展方向上的成果使我们对均衡,或者人们的行为模式的形成有了新的认识。把博弈论与社会选择、机制设计等领域的成果结合起来,使我们有了分析制度问题的新工具,也对制度的本质有了更深刻的了解。 我们区分关于制度的两个不同层次上的理论,即规范理论和实证理论,并试图探讨它们之间的复杂关系。我们首先给出一个关于主流的机制设计理论及其扩展的粗浅概括,然后通过讨论如何理解均衡与制度,我们尝试说明主流经济学关于制度的一般理论框架在什么意义上可以认为是对现实的合理解释;进一步,我们通过把制度演进转化为知识进步,讨论变革社会制度演进过程的动力学机制,并希望同时表明其外部表现形式的复杂性。 经典机制设计理论及其扩展 正如囚徒困境博弈所揭示的,个人理性的行为有时候会导致社会的集体低效率 。那么超个人的力量的出现,如政府、法庭等所谓制度性组织,在规范意义上正是为了解决诸如此类问题而出现的。 经过赫尔维茨、马斯金等人的工作,制度的规范问题已经转化成这样一种经典表述:如果按照社会选择理论,对于每一种社会经济环境,我们能够确定一个满足某些价值规范的社会目标集合 ;并且我们接受人们在互动的社会中是按照博弈论所刻画的方式行为的观点;那么,机制设计(mechanism design)理论则探究如何提供一个博弈形式(game form),使得这个博弈形式下的均衡解是在社会选择目标集合里,也就是说,社会选择函数是可执行的(implementable),或者退而求其次,这种均衡解无限接近于社会选择目标集合,也就是说可以近似地(virtually)执行 。 从社会选择理论我们知道,如果存在一个社会选择函数(或对应),那么,在任何一种情形下,针对个人偏好组合,我们都有一个或几个社会结局是我们认为合理的。但这是从一个客观观察者或研究者的角度得出的结论。如果社会的设计者(designer)或计划者(planner)、执行者(executive or implementor)、仲裁者(arbitrator),象客观观察者一样,具备对社会的足够知识和信息,那么一个简单的集中的强制性机制(如果是技术上可行的)就会实施任何所谓合理的社会目标。但是,真正有意义的是,设计者或执行者不可能具备这么完全的知识和信息,或者,有些信息是他由于某种原因不能使用的 ,或者信息是可观察的(observable)但不是可确证的(verifiable)。易言之,我们面对的基本问题是不可避免的分散决策(decentralized decision)。这时需要探讨的是,如何使得通过社会选择函数表现的社会目标能够实现。机制设计理论把这个问题转化为,假设设计者知道社会选择函数,而非特定社会状态本身,是合理的社会目标,并且他知道社会的行为模式,即行为主体是如何做出行为选择的以及任何行为选择会导致什么样的结果,那么,我们只需要设计一个制度框架,譬如财产权利、契约法律、投票法律和投票规则以至宪法,使其影响人们的行为选择从而间接实现社会目标。 不能象一个客观观察者一样作为一个限制条件,带来至少两个问题。一是信息(information)问题。如果不考虑具体环境的特殊性,那么仅仅从保证机制正常运行的角度,应该使必要的信息得以顺利流通,而信息流通的一个基本要求是传输它的信号空间(message space),也就是信息得以交流的语言。在一个社会的技术约束下,我们自然希望信号空间的维度(dimension)越小越好。另外,博弈者的有限理性使得他所分析处理的对象应该首先是可计算的(computable),其次,应该是计算复杂性(computational complexity)程度受到限制的。第二个也是我们研究的重点是激励(incentive)问题。正如梅耶森(Myerson, 1985, 229)所总结的:“在社会和经济事务中有两种激励约束限制了人们达到互利协议的能力。首先,当一个人有了他人所没有的不能确证的私人信息时,那他就不会被说服诚实地显示这个信息,除非给予正确的激励。第二,当一个人左右着一个秘密的决策变量而其他人不能控制或监视时,那么他就不会被指挥着选择任何特定决策或行动,除非他被赋予激励这样做。一个社会契约或协调系统,如果给予人们在他们的信息上撒谎或者在行动上欺骗的激励,那它就是不可行的。一个组织必须赋予其成员正确的激励使之分享信息并一致行动。一个人不能被指望提供对己不利的证据或者付出得不到回报的努力”。 我们希望的是,一个机制在存在种种问题时依然能够执行合理社会目标 ,所以我们需要关注的核心问题之一是机制的稳健性。如摩尔(Moore, 1992, 210)指出,很多与显示机制接近的机制都没有在实践中运用,是因为它们缺乏稳健性,“复杂的机制可能在现实的不完美世界里执行得很糟糕,或者因为博弈者的理性中有缺陷,或者是在博弈者的偏好、知识或处境(博弈者能在机制外交流吗?他们可以共谋吗?他们能够影响自然状态的实现吗?)的描述中产生错误”。好的机制应该具有好的容错能力,即不会因为小错误而导致大的损害 。 马斯金和摩尔研究了存在再磋商(renegotiation)情形的执行问题。马斯金和摩尔(Maskin & Moore, 1999)所指出,执行问题的文献大多排除了再磋商的可能性。这是一个主要作为偏离均衡现象而涌现的问题。当博弈者设计一个制度或契约时,他们被假设为关注于保证帕雷托最优的结局,这样一个执行机制的均衡结局在没有再磋商机会的意义上是有效的。但在偏离均衡时,结局可能远非帕雷托最优。事实上,执行理论的文献中,机制有时就通过给予偏离均衡的策略组合一个坏结局作为不鼓励偏离的手段。但是假设博弈者发现他们在一个偏离均衡的位置上,此时他们面对一个无效率结局的前景。如果有另一个他们都喜欢的可能结局他们为什么应该坚守在这儿呢?换种说法,他们为什么不应该简单地撕毁原先的合同然后协商一个新的以实现帕雷托改善呢? 再磋商的发生,既可以理解为博弈者之间不能做出一个有约束力的承诺(commitment),也可以归结为制度执行者的某种能力不足。这就相当于原来的博弈结构没有完全描述整个博弈的场景,需要在某些节点上加上一个再磋商的子博弈。所以在马斯金看来,完全理性的博弈者应该能够承诺不发生再磋商(Maskin & Moore, 1999)。但还有一个再磋商存在的合理理由,那就是,博弈者偶尔会犯错误(特别是很多时候难以区分故意或过失,如果对过失施以严厉惩罚似乎会促使人们为了降低风险而减少互利交易的可能性),此时允许再磋商对社会福利是一种改善。所以在现实社会的许多法律中,再磋商是被允许的。 通过对包括再磋商的博弈机制本身施加三个自然的假设,即再磋商是可预见的、有效率的和个人理性的,马斯金和摩尔(Maskin & Moore, 1999)在附加一些很自然的其它条件下证明了一个与纳什执行类似的定理,一个社会选择规则是再磋商均衡可执行的,当且仅当它满足再磋商单调性。 从其它角度,泰罗尔(Tirole, 1992)总结了存在共谋情形下的组织理论。斯尧斯特罗姆(Sjostrom, 1999)研究了博弈者存在共谋和再磋商情形下的机制设计,而拉方特和马尔迪摩尔特(Laffont & Martimort, 2000)则研究了博弈者共谋和类型相关情形下的机制设计。贝里伽、考尔肯和斯尧斯特罗姆(Baliga, Corchon & Sjostrom, 1997;Baliga & Sjostrom, 1999)等人考虑了“互动执行”,即计划者成为博弈者的情形。通过假设计划者在博弈中的效用函数就是社会目标,他们得出了在不同行为模式(博弈的解概念)下互动执行的充分必要条件。 一个机制要有意义,其最基本的要求机制中的结局函数是可确认的,从而可以给博弈者可预见的结局。这就隐含地使得制度的实施者的作用成为必要(当然,一个最特殊的实施者是“自然”或所有博弈者)。 如赫尔维茨(Hurwicz, 1992)所指出,“一个更严峻的,我们在实践中也都很好地明白的问题是,那些被交付实施或信息处理责任的人与那些被期望作出规制行为的人,可能会以被分别称为共谋、腐败或指派(being co-opted)的方式联合起来。另一个需要考虑的可能性是,那些负有实施责任的人对他们被期望实施的规则和条例冷淡视之”。赫尔维茨提出一个“博弈层次”的框架,第一个博弈的结局空间是下一个博弈的“规则的规则”,如此进行下去,伴随着博弈结局的特殊性的增加,直到最后的博弈实质性的结局(譬如资源配置)才被确定。如果我们相信,第一个博弈具有无可比拟的优先性,那么,这个问题可以转化成,一个社会的所有人和一个或几个(在分权制衡的思路上)特定博弈者之间的最优机制设计。分析这个问题的合适框架是契约理论和委托-代理理论。严格来说,还需要一个机制设计的前博弈使结局函数是可确认的从而使这个博弈成为可实施的。这相当于立宪会议或历史传统等因素所形成的使某个制度能够得到执行的更基本的制度。更确切的说法是,某个表层制度(机制)的可实施性源于更具基本性的制度,后者把前者中的执行者变为一个博弈者,这个基础性博弈的结局决定了前者的结构(策略空间和结局函数)。最终我们可以追溯到一个自我实施(self-enforcing)的制度,这个制度是由所有博弈者的历史赋予的最基本和最稳定的知识和技术水平所决定的。这就进入关于制度演化的实证理论了。 所以,值得指出的一点是,机制设计理论的发展似乎表明,不管什么样的社会目标(社会选择规则),总能找到执行它的机制;而不管机制中对人们的行为模式是如何预设的,总能找到它能执行的所谓最低合理限度的社会目标。特别是,几乎所有社会选择规则,在精炼纳什均衡行为假设下都是可执行的,或者总是可近似执行的。我们似乎处在莱布尼兹的乐观判断中了:“我们所生活的世界是所有可能世界中最好的那个”。 当然,机制设计理论中也有种种“不可能性”定理说明问题不那么简单。但怎么理解看似冲突的不同命题呢?我们在后面将试图给出一个分析此戈尔迪亚斯之结的思路。 作为进化过程中稳定均衡的制度 从研究者的角度看,机制设计理论是存在性的,它只表明,研究者作为一个系统外的客观观察者,可以确信存在一个机制以实现某些目标。研究者自己做了制度设计者的角色,或者说,研究者提出了一个对制度实施者的建议。这样一个建议在现实中是如何得以实现的,本质上是我们在后面所讨论的知识进步的一个特殊部分。现在我们关注的是其实证意义。因为我们作为研究者,首先是要对世界提出解释。而机制设计理论的许多结论,只要进行适当的处理,就可以对历史上和现实中存在的制度作出合理的解释。 问题的关键在于,我们如何理解博弈的均衡解概念。在知识论 背景下的博弈论中,一个博弈的均衡解,通常要求博弈者了解博弈的结构,包括博弈的参与者及其偏好和策略集合,建立在自然状态和策略组合上的结局函数等等,并且这些都是“普遍知识(common knowledge)”,即每个人都知道这些,每个人都知道每个人都知道这些,以至无穷。在这样的条件下,均衡策略包含了两方面的内容,一是每个博弈者的行动方案,二是策略代表了其他博弈者关于他的可能行动的信念。所以,均衡解作为一个自我实施的行动方案组合,也就成为博弈者所在社会的普遍信念。 显然,这个知识论前提加上其它条件(如逻辑全知)的现实性是值得深思的。严格来说,博弈论以及立足于其上的微观经济学,在观念上是假设博弈者象是(as if)理性地行为的。理性预期学派的创始人穆斯在回应对理性预期假设的批评时讲,“鸟不懂空气动力学,但鸟照样飞得很好”,所以我们研究鸟的飞行可以假设鸟象懂得空气动力学一样。 鸟的飞行能力是进化的产物。同样,以均衡作为博弈的解概念,可以把博弈的均衡策略看作是长期学习和进化所形成的稳定状态,至少是局部稳定状态。而制度,由于它是与技术、资源一起决定博弈的结局函数,而制度的被实施和绩效是通过制度要求并预见的社会目标成为均衡策略的结果。所以,我们可以把可观察的制度看作是一个社会进化过程中的局部稳定态。 从进化的角度看,许多形形色色的制度,作为可观察的一种历史或现实存在,就象是冥冥之中有一个设计者的精巧建构。因此,机制设计理论的很多结论,从(局部)稳定的角度看,可以解释很多制度的出现。 机制设计理论的成功使人们考虑能否把它运用于制度变迁问题,即,在规范意义上,如何使一个演进社会的制度设计。但是,要把机制设计理论作为指导实践的规范理论,却并不象表面看来那么简单。因为如前述,从研究者的角度看,机制设计理论是存在性的,它只表明,研究者作为一个系统外的客观观察者,可以确信存在一个机制以实现某些目标。但怎么把系统外的判断转化为系统内的 ?或者说,这样的一个机制在现实中是如何被设计出来并得到实施?任何试图处理此自我相关问题的努力,最终都取决于理论在多大程度上是对现实的“恰当描述”。 当我们说存在的制度就象是精巧设计 出来的时候,我们是一种事后的解释。而试图设计制度是一种事前的努力。显然,只要承认我们是生活在一个非严格决定论的世界里,我们就不能从根本上避免事前与事后的不一致性。另外,我们也已提到,所谓的设计者是研究者,实施者是所有的博弈者,那么理论中设计和实施者的角色就不能简单地理解为现实社会中通常被称为制度的设计和实施的组织或个人。 现有的机制设计理论成果表明,只要我们选择合适的博弈解概念,几乎任意的社会选择规则都是可执行的。但问题恰恰在于:当我们讨论机制设计的时候,是假设逻辑上有无穷多种机制可供选择,一个社会技术上也能够随心所欲地选择制度。但我们从历史中发现,一个社会可选择的制度却是非常有限的。 机制或制度,作为一个博弈形式,其主要内容是策略空间和结局函数。而机制能够得到实施,依赖于这样几个前提:社会选择规则作为制度目标是协调的,制度执行者关于结局函数的承诺是可信的,以及人们有足够的理性来完成这个博弈。在博弈过程中,策略是人们在其信念下的行为选择,而均衡策略则构成一个信念和行为的自我完成(self-fulfill)系统。也就是说,一个人相信别人会按照均衡策略作出行为选择,从而他也就选择了自己的均衡行为,而别人也是这样考虑的,由此均衡得以达到。所以制度及其所要求的行为规范首先应该成为人们的一个“普遍信念(common belief)”。 更重要的是,制度,不管是自我实施的,还是被实施的,如果能够在很长的时间内保持稳定性,必然是意味着,人们在制度提供的博弈形式中的均衡策略也是足够稳健的,人们能够在不同的环境中,不因一时一地的得失而偏离制度所要求的均衡行为模式 ,制度也不会因小概率的偏离行为而形同虚设 。所以,从实证的角度看,我们在大的时间跨度内能够观察到的制度必然具有很强的稳健性,同义反复地说,稳定下来的制度就是长期学习和进化过程中具有结构稳定性的均衡状态。 那么,这种稳定性来源于什么呢?我们所知道的历史上以及将来会发生的制度变迁又如何理解呢?我们可以把制度看作机制设计者利用其知识或技术作出的决策,而决定机制设计者的那种更基本的制度又是其设计者的知识的产物 。所以,我们可以把制度看作是人类社会应对环境不确定性的一种知识。这种处理使我们发现两点:第一,由于制度选择与个人决策之间的相似性,可以把制度作为一种特殊的知识来处理,制度的演进与知识的发展遵循着几乎同样的动力学机制;第二,由于机制设计者必然是社会的一部分,所以要逻辑清晰地分析这个问题,我们必须考虑制度分层 。一个制度的稳定性和合理性原则上是由社会的更基本的制度和实施制度的知识所决定的。 某项制度一旦被选择,也就成为人们的知识或信念的一部分。那些稳定下来的制度以及相关的知识,给生活在制度下的人们以相当强的信念,使他会预期到自己的行为选择的后果,不会轻易选择制度所不允许的行动方式,更难得主动去改变现行制度。这种信念又会由于人们对其已有经验和知识的依赖而得到强化,制度和制度调整下的行为就这样形成一个自增强(self-reinforcing)的“鸡生蛋、蛋生鸡”的循环机制。而这个动力学机制有两个重要特点,即所谓的路径依赖(path-dependent)和锁定(lock-in)效应 。 路径依赖使得最初的随机选择影响了后来的整个过程。在存在多重均衡的情形下,哪一个均衡成为现实本质上是对称破缺的结果。而结构稳定的均衡的性质决定了,由于随机的初始选择而一旦进入一个稳定状态,那么就很难脱离它 。 这就有两点值得强调,一是,由于人们对自然、社会、人生的思维方式以及由知识和技术所决定的生活方式的区别,每种社会的具体制度选择也各有差异,并且这种差异会被逐渐放大,使得不同社会的结构形态和实际运作千姿百态。特别在文明发生之初,所得到和形成的知识模式的差异对此文明有着持久影响,其中一个重要因素是地理环境 。其二是,一个社会的政治、法律和经济制度本身也是人们的社会知识甚至自然知识的体现。我们所观察到的西方社会,其宪政制度之卓有成效,一靠制度设计精巧细致,二靠操作者理性运作,依赖于知识进步与科学昌明的成分是很大的 。并且,好的制度对科技进步反有推动之功,二者互为循环,互相促进。为什么民主宪政制度与近代科学革命之肇始为西方所独专,重要原因在于,此二者有一个重要的共同因素,那就是继承自古希腊的逻辑严密的演绎分析和近代以来形成的经验实证的科学精神 。 对于一个演进社会而言,这种路径依赖和锁定效应,使其制度和制度知识成为一定意义上的局部知识。因为这个社会没有也不能历尽所有逻辑上可能的世界,其主要的知识都是来源于它的历史和它存在运行的“小世界”。这就大大增加了学习其他文明成果、推动社会制度变革的难度和变革过程中的波折。那些微小的变革努力在这种封闭社会中,只会被消弭于无形。社会结构和制度的突变和跃迁,只能取决于其内部的强烈震动或外部的巨大冲击。 社会进化与制度演进的动力学 我们强调制度的稳定性并不是否认发生制度变革的可能性。这里有必要讨论一下哈耶克“合作秩序的扩展”的概念。哈耶克把西方社会与市场经济相关联的一整套制度的发展过程理解为“人类合作的扩展秩序” 。那么,这个扩展着的秩序是如何在传统的基础上扩展的呢?与此相关的是,粗看起来,非西方社会欲学习西方的自由市场和多元民主制度都表现为发展中的不连续,是一种原来某些秩序的中止,哈氏的逻辑似乎很难解释清楚这种学习的可行性。 我们的知识和制度都是长期进化的产物。我们能够生存下来,除了运气或偶然之外,还在于我们知道如何运用知识实现某个目标;并且,随着环境的变化,进化的压力要求我们能够判断并决定(这种判断据以作出的知识是一种元知识)哪些知识是应该丢弃的,哪些是该坚持的,哪些是该学习的。也就是说,我们的知识区分为基本的与派生的,前者是相比较更稳定的,后者附丽于其上但有相对的独立性。在现实里最基本的知识是那些直觉性、本能性的东西 ,是历史赋予我们且经过时间考验而得以保持的稳定知识,它对我们的约束象自然规律一样 。而最基本的制度就是由最基本的知识所决定的“自我实施的制度”。它们赋予表层知识或制度以合理性,因为后者必须与它们相协调。改变那些派生的知识或制度是简单的,而改变相当深层的更基本的东西困难则要大得多,那需要更大的环境变化、更多的时间和学习。一种新思想理论的引入,或者说一种新观念的被接受是一个长期的学习过程,足够长的时间会使它们最终能够跳出传统和习惯的束缚,或者说原来的均衡状态被打破了。 简单地分类,知识进步和制度变迁有两种形式。第一,在原来的知识体系中,某个经验性命题被修正了,它所导致的博弈者的决策选择也随之发生变化。在知识分层中,这种知识是附着于某个基本知识之上的表层知识。它与更基本的知识相协调,但并不是更基本的知识蕴涵着它 。我们所观察到的经验性现象,从统计意义上给我们以信念,使我们相信这种知识下的决策是应对某类局面的最优策略。而当我们观察的经验性现象的有关数据足够多和足够广时,可能会改变关于环境的信念。我们有可能选择另一种知识,只要那种知识与基本知识依然是协调的。相对的,如果一个制度的环境发生了变化,譬如,由于技术的进步,博弈者的策略空间和结局函数也会发生变化,或者制度执行者的知识和技术的变化使其可利用的信息和手段也有了变化,原有制度对博弈结局的调整结果可能已经不在社会目标集合中了。这时,它就有可能被新设计的制度所取代 。 第二,原来知识体系中没有的命题被发现了,博弈者的策略空间也扩大了,所谓创新就是如此。所以,真正的创新本质上应该体现不连续性。创新如果是由过去所完全严格决定的话,那不是创新,我宁愿称之为知识扩散和制度传播。真正的进步必然包含跳跃或跃迁性。创新往往是产生自局部的突变,逐渐生长并推广到全局,而这个扩散过程既有决定论的一面,又会夹杂进随机性。随机性源于,对创新者而言,其创新行为是主观博弈均衡策略行为,这些行为中的哪些在最后成功是事前难以预测的,它们在竞争中会出现分化。决定论源于我们在学习和进化中的简单规则,即马太效应。人类社会的大部分制度也是这样,在基本制度之外,博弈者以试探和学习的方式达成某个协议或承诺,随着他们从遵守行为中获得好处,协议和承诺逐渐形成惯例和规范,甚至在得到基本制度的确认以后会成为法律等强制性的显性制度。 我们强调三个看法。第一,进步意味着从可能性成为现实性,从逻辑上的存在性被推进到构造性。所以,哈耶克所批评的建构主义的“理性狂妄”其问题不在构造性本身,而在于缺少一种从元理论角度自省的清醒态度。构造性制度的边界来源于人类社会知识的局限性,即它受进化过程限制的局部性和受复杂性约束的有界性。 第二,基本知识和基本制度能够赋予表层知识和制度的变化以合理性基础。同时它们的相对稳定又保证了博弈者决策和社会生活的基本结构的稳定性。 第三,人类社会原则上由其知识和技术所决定,鼓励知识创新和技术进步的制度就尤其重要。制度关于个人决策权的安排只能是以两种方式进行。其一是构造性形式,以直接或间接方式保证某些事前可描述状态的可行性(同时否定了相对的状态的可行性);其二是存在性形式,对制度设计者和执行者不能预见的机会不加限制,而给个人留出自由选择的空间。如哈耶克所言,“如果有一些全知全能的人,如果他们不仅知道那些影响我们获得现在想要东西的因素,而且知道我们将来的欲望和需要,那么自由就没有什么地盘了。为了给不可预见和不可确知的事物留有空间自由是不可缺的。所有自由的制度都是对这个基本的无知的事实的适应,以处置机会和可能性而不是确定性” 由于所有的创新都是来源于个人,所以越是实现了个人自由的开放社会就越有创新和发展的动力。这样一个制度的确立,是不可预定的制度演进过程中最值得设计的成分 。 结语 作为研究者的我们与我们的研究对象之间的博弈,可以看作是人类处境的恰当写照。作为博弈者的我们,永远不能摆脱两个基本的限制。一是博弈者的知识的局限性,二是包括博弈者在内的环境即博弈对象的复杂性。二者之间存在着从元理论的角度看永远不能超越的界限。因为,我们实际上是把长期多次的、动态的问题转化成一次性(虽然可能是多阶段)、静态问题 ,把变化着的事物还原为假设不变也就不可再分析的“原子”之间的结构。在这个理论不断回归也不断精致化的过程中,即便能在自己构建的封闭的模型里一览无余,我们依然离外部开放世界无穷复杂的可能性非常遥远。但这就是生活。 参考文献 Masahiko Aoki: The subjective game form and institutional evolution as punctuated equilibrium, Stanford University, Discussion Paper, 1998. W. Brian Arthur: self-reinforcing Mechanisms in Economics”, in Philip W. Anderson, Kenneth J. Arrow , and David Pines (ed.s)The Economy as an Evolving Complex System“, Reading, MA.. Addison—Wesley, 1988. Robert Aumann, What is game theory trying to accomplish?in Kenneth J. Arrow and Seppo Honkapohja (eds.), Frontiers of economics, Basil Blackwell Ltd.,1985. Robert Aumann & Sergiu Hart(ed.): Handbook of game theory with economic applications, vol. I & vol. II, Elsevier Science B. V., 1992, 1994. Sandeep Baliga, Luis C. Corchon & Tomas Sjostrom: The theory of implementation when the planner is a player, JET 77, 15-33, 1997. Sandeep Baliga & Tomas Sjostrom: Decentralization and collusion, JET 83, 196-232, 1998. Ken Binmore: Playing fair: Game theory and the social contract (volume I), MIT, 1994. Ken Binmore: Just playing: Game theory and the social contract (volume II), MIT, 1998. Buchanan,James, M. (1959), Positive economics, welfare economics, and political economics. Journal of law and economics 2 (October): 124-138. Buchanan,J.,M., Stubblebine, W. Craig (1962). Externality, Economic 29 (November): 371-384. 布坎南,《自由、市场与国家》,北京经济学院出版社 Donald E. Campbell & Jerry S. Kelly: Trade-off theory, AER 84(2), 422-426, 1994. Donald E. Campbell & Jerry S. Kelly: The possibility-impossibility boundary in social choice, in Kenneth J. Arrow, Amartya Sen & Kotaro Suzumura(eds.): Social choice re-examined, vol. I, 179-204, Internatioal Economic Association 1996. Luis C. Corchon: The theory of implementation of socially optimal decision in economics. MacMillan Press Ltd., 1996. Claude d’Aspremont: Axioms for social welfare orderings, in Leonid Hurwicz, David Schmeidler, and Hugo Sonneschein (ed.): Social goals and social organization. Camridge University Press. 1985. Eric van Damme (1992): Refinements of Nash equilibrium, in Jean-Jacques Laffont (ed.): Advances in economic theory: Invited papers for the sixth world congress of the econometric society, vol. I, 32-75, Cambridge University Press. Eddie Dekel &Faruk Gul: Rationality and knowledge in game theory, in David M. Kreps & Kenneth F. Wallis(eds.): Advances in economics and econometrics: theory and applications: seventh world congress, vol. I, Cambridge University Press, 1997. Pradeep Dubey: Inefficiency of Nash equilibria, in ,Mathematics of Operations Research vol. 11, no. 1, 1-8, 1986. Edgeworth,F. Y. (1881), Mathematics psychics, London: Kegan Paul. Drew Fudenberg & David Levine: The theory of learning in games. MIT, 1988. Drew Fudenberg & Jean Tirole: Game Theory. MIT Press, 1991. John D. Geanakoplos: Common knowledge, in Robert Aumann & Sergiu Hart(ed.): Handbook of game theory with economic applications, vol. II, Elsevier Science B., 1994. Allan Gibbard: Manipulation of voting schemes: A general result. Econometric 41: 587-602, 1973. John Harsanyi: Cardinal utility in welfare economics and in the theory of risk taking, JPE 61, 434-435, 1953. John Harsanyi: Cardinal welfare, individualistic ethics, and interpersonal comparisons of utility, JPE63, 309-321, 1955. John Harsanyi: Games of incomplete information played by Bayesian players, Management Science 14, 159-182, 320-329, 486-502, 1967-1968. F. A. Hayek: The use of knowledge in society, AER XXXV(4), 519-30, 1945. F. A. Hayek, The constitution of liberty, London: Routledge & Kegan Paul, 1960. Hayek, Studies in Philosophy, Politics, and Economics, Routledge and Paul. 1967. P92. F. A. Hayek, "Law, legislation and liberty: rules and order(I)", The University of Chicago P ress,1973. Hayek, The Fatal Conceit, University of Chicago Press, 1988. Hurwicz: On informational decentralized systems. In R. Radner and C. B. McGuire (eds.): Decision and organization, 297-336. Amsterdam: North-Holland Publishing Co., 1972. Leonid Hurwicz: Implementation and enforcement in institutional modeling, in W. Barnett, M Hinich & N. Schofield (eds.): Political economy: institutions, competition and representation, Cambridge University Press, 1992. Leonid Hurwicz: Toward a framework for analyzing instituions and institutional change, in Samuel Bowles, Herbert Gintis & Bo Gustafsson (eds.): Markets and democracy: participation, accountability and efficiency, Cambridge University Press, 1993. Leonid Hurwicz, David Schmeidler, and Hugo Sonneschein (ed.): Social goals and social organization. Camridge University Press, 1985. J. S. Jordan: The competitive allocation process is informationally efficient uniquely, JET 28, 1-18, 1982. Jean-Jacques Laffont: Incentives in political economy, Oxford University Press, 2000. Eric S. Maskin & John Moore: Implementation and renegotiation, RES 66, 39-56, 1999. Ludwig von Mises, Liberalism in the classical tradition, 3rd ed., San Francisco, CA. Cobden press, 1985 John Moore: Implementation, contracts, and renegotiation in environment with complete information, in Jean-Jacques Laffont (ed.): Advances in economic theory: Invited papers for the sixth world congress of the econometric society, vol. I, 182-282, Cambridge University Press, 1992. 丹尼斯·缪勒《公共选择》,商务印书馆,1991年。 Roger B. Myerson: Bayesian equilibrium and incentive-compatibility: an introduction, in Leonid Hurwicz, David Schmeidler, and Hugo Sonneschein (ed.):, Social goals and social organization. Camridge University Press, 1985. Roger B. Myerson: Game theory: analysis of conflict. Cambridge, Mass.: Harvard University Press, 1991. John F. Nash: Non-cooperative games, Annals of Mathematics 54(2), 286-95, September 1951. Also in : Essays on game theory, E. Elgar, 1996. Douglas C. North: Institution, institution changes and economic performance, Cambridge University Press, 1990. 中译本:道格拉斯· C·诺斯:《制度、制度变迁与经济绩效》,上海三联书店出版,1994年。 Martin J. Osborne & Ariel Rubinstein: A course in game theory, MIT 1994. Thomas R. Palfrey & Sanjay Srivastava: Bayesian implementation, Harwood Academic Publishers, 1993. Robbins, E. S. (1935), An essay on the scope and nature of economics science, 2nd ed., London: Macmillan. A. Samuelson, 1954, The pure theory of public expenditure, Review of economics and statistics 36, pp387-9. M. A. Satterthwaite: Strategy-proofness and Arrow’s conditions: existence and correspondence theorems for voting procedures and social welfare functions, JET 10, 187-217, 1975. Amartya Sen: Impossibility of a Paretian liberal, JPE 78, 152-157, 1970. Amartya Sen: Collective choice and social welfare, Amsterdam: North Holland Press, 1970. Amartya Sen: Social choice theory, in Kenneth J. Arrow & Michael D.Intriligator(eds.): Handbook of mathematical economics, vol. III, North-Holland Publishing Company, 1986. Amartya Sen: Social choice, in John Eatwell, Murray Milgate & Peter Newman(eds.): The New Palgrave: A Dictionary of Economics, vol. 4, The Macmillan Press Limited, 1987. 田国强,“经济机制设计理论和信息经济学”,载于《经济理论与中国经济改革》,上海人民出版社。 Jean Tirole: Collusion and the theory of organization, in Jean-Jacques Laffont (ed.): Advances in economic theory: Invited papers for the sixth world congress of the econometric society, vol. II, 182-282, Cambridge University Press, 1992. John Von Neuman & Oskar Morgenstern: Theory of games and economic behavior, 2nd ed., Princeton University Press, 1947. 中文本:竞赛论和经济行为,王建华、顾炜琳译,科学出版社1957年。 Jorgen W. Weibull: Evolutionary game theory, MIT, 1995. (本文原部分发表于《北大法律评论》2000年第三卷第二辑,这里是一个修改并补充的完整版本。)
|