《博弈论》

下载本书

添加书签

博弈论- 第10部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
轿车委员会正左右为难,但谁也不会单单听信一个政客的话。你有什么建议?
  诀窍在于出租而非出售大奖章。这么一来,没人要为以后的价值付钱。市长就会有一种限制大奖章出租数量的激励,因为假如他出租太多,总租金就会下降,并且很有可能随着大奖章变得一文不值而一直降到零。
  注意,这实际上就是一步一步作出承诺的应用实例。这里的步骤不是大奖章的数目,而是大奖章的有效期。人们愿意在一周或一年之内相信这个市长,而新规定的通过是需要一段时间的。最具风险的是大奖章一年的价值。对市长而言与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章,然后再出售,还不如一次只出售一枚大奖章,从而恢复自己的可信度。要做到这一点,一个简单的方法就是出租,而不是出售。
  改变收益值
  那些碰到〃囚徒困境〃的人有一个共同的反应,即〃应该有一个法律来防止这类事情的发生〃。事实上,摆脱〃囚徒困境〃是政府的一个主要的功能:保证人们无论如何也得做那些对社会有用的事。法律使人们交税,不偷盗,忠实履行与陌生人的合同。这每一件事都可以看作是有许多人参加的大〃囚徒困境〃。没有人愿意纳税,因为它的好处很难看到而代价是直接的。但是如果每一个人都纳税,大家就能生活得更好,即分享学校、道路和其他公共设施的好处。这就是卢梭所说的政府的作用就是保证每一个公民〃被强迫得到自由〃。
  政府所做的正是改变有效的收益值。如果你逃避交税,你就可能被送进监狱。这种前景使得背叛的选择不那么吸引人了。即使半官方也能通过改变对策者的收益值而实施他们的规矩。例如,在〃囚徒困境〃的原始故事中,两个同案犯被逮捕并被分别审讯。如果他们同属一个帮派组织,那么他们知道告密是要受到惩罚的。这将降低背叛同伙的收益值,使得他们都不坦白并由于他们双方保持沉默的合作而得到较轻的徒刑。
  在收益结构上的大变化能够改变相互作用使得情况不再是一个〃囚徒困境〃。如果对背叛的惩罚是如此之大以至于不管对方如何选择,从短期来说合作都是最好的选择的话,那么就不再有困境。可是,收益值的改变没有必要如此激烈才能奏效,即使相当小的一点改变就可以有助于回报的合作的稳定,尽管这相互作用的情况仍然是〃囚徒困境〃。所以,通过改变收益值来促进合作没有必要去消除背叛的短期激励与合作的长期激励之间的紧张关系,而只要使对双方合作的长期激励大于对背叛的短期激励就行。
  教育人们相互关心
  在社会中,一个有效促进〃双赢〃的方法是教育人们关心他人的利益。家长和学校花了很大的努力去教育年轻人关心其他人的幸福。用对策论的术语来说,这意味着这些长辈试图使孩子们形成这样的价值观念,即这些新一代的公民的偏好中,不仅有他们自己个人的利益,还至少在某种程度上结合了他人的利益。毫无疑问,在这样一个关心他人的社会里,即使遇到〃囚徒困境〃,成员之间也容易达成合作。
  利他主义就是描述这样一个现象,一个人的利益效用是与另一个人的福利相联系的。因此利他主义是一个人行为的动机。但是必须认识到,有一些看起来是宽宏大量的行为可能有其他各种原因而不是利他主义。
  例如,慈善行为往往不是出于对不幸者的关心而是为了它所能带来的社会赞赏。在传统和现代社会中赠送礼物可能是交换过程的一部分。它的动机更多的是使受惠者承担某种义务而不在于改善受惠者的福利。
  从生物进化的遗传学观点来看,利他主义能在亲属之间维持。冒着生命危险去抢救下一代的母亲能够增加她的基因拷贝的生存机会。这是遗传亲缘理论的基础。
  人们之间的利他主义也可以通过社会化来维持。但是,这里有一个严重的问题。一个自私者可以从其他人的利他行为中得到好处而不给以任何回报。
  我们都遇见过一些令人讨厌的人,他期望其他人宽宏大量,只考虑自己的需要而不考虑别人的利益。必须把这种人与关心他人的人区别对待,免得被他占便宜。这个道理告诉我们,利他主义的代价可以通过首先对每一个人采用利他行为,然后只对那些有相同的感情的人采取利他行为来控制。但是这很快就使你回到作为合作基础的回报上来。
  教育人们要回报
  〃一报还一报〃可能是个反击自私者占我们便宜的有效的策略。但是,它是一个人或国家要遵循的道德策略吗?当然,答案取决于什么是一个人的道德标准。也许最广泛接受的道德标准是这一金科玉律:己所不欲,勿施于人。在〃囚徒困境〃的情况下,这一金科玉律似乎意味着你应该总是合作,因为合作是你希望从对方得到的。
  这个观点的问题在于:人家打你一巴掌,你还把另一边脸转过去,等于鼓励对方再占你便宜。无条件的合作不仅伤害你自己,而且伤害了这个成功的剥削者接着要遇到的无辜者。无条件合作将会宠坏对方,并为社会留下了改造被宠坏者的负担。这说明回报是比无条件合作更好的道德基础。
  然而,基于回报的策略似乎没有达到道德的高度,至少按照我们的日常的直觉是没有。回报当然不是道德的一个好的基础,但它不只是自私自利者的道德。它确实不仅帮助自己,而且帮助了别人。它是通过使剥削性策略难以生存来帮助别人。一个基于回报的策略能让对方从双方合作中得到奖励,这也是当双方最好时它自己所能得到的同样报酬。
  坚持公平是许多基于回报的规则的基本特征,这从〃一报还一报〃在〃囚徒困境〃竞赛中的表现可以清楚地看到。〃一报还一报〃赢得两轮的竞赛,但是在任何一局中它从来没有得到比对方多的分数它不可能在一局中比对方得分更多,因为它总是让对方先背叛,并且它从来不会比对方的背叛次数多。它的胜利,不是靠比对方做得好,而是靠引导出对方的合作。用这个方式,〃一报还一报〃靠促进双方的利益而不是靠剥削对方的弱点来取得胜利。一个有道德的人也就不过如此了。
  使〃一报还一报〃有点令人不舒服的是它坚持〃以牙还牙〃。这确实只是大致公平的。而且,它的麻烦在于一旦结下仇恨,它就会无休止地继续下去。确实,许多仇恨似乎都有这种性质。例如,世界上很多宗族观念和民族矛盾强烈的地区,家族之间的仇恨有时持续了几十年。一个伤害由另一个伤害来偿还,并且每一次报复都引起了一轮新的报复。这种伤害来回反射直到最初的暴行消失在遥远的过去中。这是〃一报还一报〃的严重的问题。
  一个更好的策略可能是一报还9/10报。这样既能够减弱冲突的振荡,又能提供一个激励使对方不敢尝试无缘无故的背叛。它是一个基于回报的但又比〃一报还一报〃多一点宽容的策略。它也是大致公平的。但是在一个自私自利的没有集权的世界里,它确实不仅促进它自己的福利,而且增加其他人的福利。
  自我控制的特性给你一个额外的激励去把它传授给别人,即使这些人决不会与你打交道。自然,你想把回报教给那些你将打交道的人以便你能建立一个双方都有好处的关系。但你也可以从那些你决不会与他们相遇的采用回报策略的人那里得到你个人的好处,即其他人的回报惩罚了那些试图占人家便宜的人,这有助于控制整个社会。并且,它减少了你将来必须对付的不合作的人的数目。
  启示:一个采用基于回报的策略的社会确实能够自我控制。由于确保了对试图不合作的惩罚,那些不合作的策略就得不到好处。
  改进辨别能力
  从过去的接触中识别对方,并从中发现对方是否可信的能力对合作的持续是必要的。例如,细菌几乎是进化阶梯底层的生物。只有很有限的识别其他生物的能力,所以它们必须通过捷径来识别,即在一个时间内只和一方(寄主)建立关系。在这种方式下,细菌环境的任何变化都可以归咎于对方。鸟类有更强的辨别力,它们可以通过鸣叫声识别邻居。这种识别力使得它们能够与其他若干的鸟建立合作关系或者至少避免过分的冲突。而人类的辨别能力已经发展到了在他们的大脑中有一个专门的部位来识别面孔的程度。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
  然而,即使在人类事务中,合作范围的限制往往是由于不能识别其他人的特征和行为而造成的,这里的困难在于核实,即是否有足够的信息确认对方所真正采取的步骤。并不是每个占便宜者都是光明正大的,这使我们在识别之时碰到了一些困难,但是我们也会承认,人的名声往往是和他的真实个性相符的,经过伪装的侵犯仍然是容易识别的,特别是当它一而再,再而三地施展时。
  识别背叛什么时候发生的能力不是产生成功合作的惟一要求,但它肯定是一个重要的条件。因此,通过改善对策者的基于过去的接触而相互识别的能力和确定以前已经发生过的行为的能力,持续合作的范围可以得到扩展。
  我们已经说明了人们之间的合作能够通过各种技巧来促进。它们包括:未来的影响,改变收益值,教育人们关心他人的福利和教人懂得回报的价值。促进好的结果不仅要告诉对策者:双方合作比双方背叛的所得更多,而且还是一个明确相互作用的特征从而得到一个长期的稳定的合作进化的问题。
  启示:持续合作的范围取决于辨别能力。例如,鸟类可以通过鸣叫声识别邻居,这种识别力使得它们能够与其他鸟建立合作关系至少避免过分的冲突。而人类的辨别能力更强。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
第4章 战争法则:庙算在先
有〃谈笑间,强虏灰飞烟灭〃的指挥大师,但也同样有〃纸上谈兵〃的〃艺术家〃,有没有什么东西可以更可靠地告诉我们,在什么情况下运用某种原则有效,以及为什么有效?其实,在〃艺术〃和〃技术〃之间,我们可以找到清晰的规律。
  战争是艺术还是技术
  翻开历史我们会发现,尽管战争在人类史上(甚至早至史前时代)占有重要地位,人类对战略、战术基本原则的注意力却远不及发明新式武器所投注的心力。的确,过去有2500多年前中国的《孙子兵法》,300多年前的拿破仑定理,直至近代的克劳塞维兹信条,以及口号式的句子如:〃抢占高地〃、〃兵贵神速〃、〃分兵占领〃、〃合围聚歼〃等等,这些在某些战争中的确有用,不过令人惊讶的是,即使是人们普遍信奉的这些原则,都似乎很少有人做过科学系统的分析,也极少公开发表过任何量化的研究。
  我们常常听到〃战争艺术〃这个词,似乎战争也像艺术一样,难以言传,无法用数据衡量。的确,战争的进程离不开指挥官的直觉、灵感甚至运气(中途岛海战中,就是一批误打误撞的美军轰炸机打乱了日本人的计划),但是如果一味指望这些即兴发挥式的东西赢得胜利,恐怕只能是痴人说梦。我们有过〃谈笑间,强虏灰飞烟灭〃的指挥大师,但也同样有过〃纸上谈兵〃的〃艺术家〃,有没有什么东西可以更可靠地告诉我们,在什么情况下运用某种原则有效,以及为什么有效?
  当然,技术的进步也是一个必须考虑的因素。因为一些聪明的指挥官引用了(有时甚至发明了)新式武器,使战略与战术不时会出现一些质的创新:从公元前1000年把马匹带进战斗,到近代火枪、大炮的使用,以及最近的核阻吓战略等。随着电脑时代的来临,许多软件公司致力于发展战地模拟、实战游戏,这些新产品已大量用来训练军事人员。尽管如此,有关战时的决策原则还是凤毛麟角,而通过在战场上尝试错误学会决策要领(〃在战争中学习战争〃)可是要付出可怕代价的。
  其实,战术决策和其他决策一样,都会涉及心智修炼,这也是决策理论的核心所在。如果面对善于思考的对手,这就属于赛局理论的范畴,虽然并不那么明显易辨,但在对手的战略意图和战术动作十分明显的情况下,简单的策略就很有用。
  身为航空、汽车史的先驱,英国工程师蓝彻斯特也是把正规学术训练用于战术研究的学者之一,其理论基础来自于研究第一次世界大战的空中战役。可惜他卓越深入的研究仅有少数现代军官知晓,因为虽然军事院校课程中都曾提到,不过却很少得到重
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架