格格党

手机浏览器扫描二维码访问

第三章 洞察充满不确定性的未知世界的决策方法 最大最小准则(第3页)

夏洛克·福尔摩斯与詹姆斯·莫里亚蒂

在柯南·道尔的著名侦探小说《夏洛克·福尔摩斯探案集》中,有一篇叫作《最后一案》(收录在《夏洛克·福尔摩斯回忆录》中),描写了福尔摩斯被宿敌詹姆斯·莫里亚蒂围追堵截的场景。当时,福尔摩斯几乎被莫里亚蒂所杀。他从维多利亚车站乘坐开往多佛的火车,准备逃往欧洲大陆。在火车即将驶离车站的瞬间,莫里亚蒂出现了,两个人四目相对。福尔摩斯预判了莫里亚蒂准备启用特快专列提前抵达多佛设伏的计划,于是在火车经停的坎特伯雷提前下车。这样一来,福尔摩斯就完美地躲过了莫里亚蒂乘坐的特快专列的奔袭追赶。

福尔摩斯经常利用自己的创造性思维解决问题。但是,这次在坎特伯雷提前下车的做法真的就是最佳选择吗?这是一个值得深思的问题。因为如果莫里亚蒂也看穿了“福尔摩斯想在中途下车”的想法,那福尔摩斯就只能束手就擒了。冯·诺依曼和奥斯卡·摩根斯特恩在《博弈论与经济行为》一书中也提到了这一问题。他们认为从博弈论的角度来看,福尔摩斯的判断(柯南·道尔在小说中描写的情节)是不合适的。他应该选择的策略是“乘车一直坐到多佛”和“在坎特伯雷提前下车”的概率组合。下面,我们来看一下他们的分析,如表3-3所示。

表3-3 下车地点组合的莫里亚蒂的收益值表

他们将福尔摩斯、莫里亚蒂双方较量的战场设定在特定的博弈框架内。

表3-3是从莫里亚蒂的视角出发总结出的损益得失表。无论是莫里亚蒂还是福尔摩斯,都有两种行动方案可以选择,分别是“在多佛下车”和“在坎特伯雷下车”。如果双方在同一车站下车,莫里亚蒂就能实现自己的阴谋,成功拦截并杀害福尔摩斯。因此,在这种情况下,莫里亚蒂的收益值是100,而福尔摩斯则相反,收益值为-100。与之相对,如果莫里亚蒂在坎特伯雷下车,而福尔摩斯在多佛下车,那么福尔摩斯就可以从多佛前往欧洲大陆,从而顺利逃亡。因此,在这种情况下,莫里亚蒂的收益值是-50,而福尔摩斯的收益值是50。此外,如果福尔摩斯在坎特伯雷下车,而莫里亚蒂在多佛下车,那么莫里亚蒂虽然无法抓住福尔摩斯,但是可以阻止他逃往欧洲大陆。因此,从这个角度来看,双方打了个平手,各自的收益值均为0。

如表3-3所示,关于莫里亚蒂的保底值,在多佛下车时为0,在坎特伯雷下车时为-50,因此其最大保底值为0。另一方面,关于福尔摩斯的保底值,在多佛和坎特伯雷下车时均为100,因此最小值为100。由此可见,两者之间的保底值是不一致的,无论采取哪种行动组合,都无法实现博弈均衡。但是,即使面对这种局面,只要能够合理采用概率组合的方式,依然可以实现均衡。关于这一点,或多或少会引起争议,下面,我将试着进行论证。

福尔摩斯究竟应该怎么办?

我们先从结论开始说起。按照最大最小准则,莫里亚蒂应该采用的策略是“按照0.6的概率在多佛下车,按照0.4的概率在坎特伯雷下车”;按照最大最小准则,福尔摩斯应该采用的策略是“按照0.4的概率在多佛下车,按照0.6的概率在坎特伯雷下车”。也就是说,在这一策略下,福尔摩斯应该准备10张纸,在其中的4张纸中写上多佛,在剩余的6张纸中写上坎特伯雷,然后,将这10张纸混合在一起,从中随机抽取1张,作为自己最终的决定,可以说,这是一种均衡的策略。

下面,我们将对这一结论进行分析论证。

为了更加具体直观地进行说明,我们假设莫里亚蒂在多佛下车的概率为0.1,在坎特伯雷下车的概率为0.9。然后,在这一条件下,尝试计算保底值,如表3-4所示。对此,我们只要从福尔摩斯的策略中,选择对于莫里亚蒂而言最差的一组即可。

假设福尔摩斯在多佛下车的概率为p(与之相应,在坎特伯雷下车的概率自然就是1-p),那么,针对四种结果,出现的概率具体如表3-4所示。

表3-4 莫里亚蒂的收益值表

这样一来,莫里亚蒂的收益的期望值(基于概率计算的平均值)就等于概率乘以收益值相加之和:

0.1×p×100+0.1×(1-p)×0+0.9×p×(-50)+0.9×(1-p)×100=90-125p

由此可见,福尔摩斯在多佛下车的概率越大,莫里亚蒂的收益的期望值就越小。也就是说,对于莫里亚蒂而言,福尔摩斯在多佛下车的概率为1时,其承受的损失是最大的,此时的保底值最小,为-35(90-125)。

下面,我们再计算一下莫里亚蒂在多佛下车的概率为0.9,在坎特伯雷下车的概率为0.1(与刚才的情况正好相反)时的期望值:

0.9×p×100+0.9×(1-p)×0+0.1×p×(-50)+0.1×(1-p)×100=10+75p

在这种情况下,福尔摩斯在多佛下车的概率越小,则莫里亚蒂的收益的期望值就越小,因此,当p=0时,保底值最小,为10。

有鉴于此,莫里亚蒂的保底值变化情况,具体如图3-1所示。

图3-1 莫里亚蒂的保底值变化情况

只要观察一下,就会发现莫里亚蒂的保底值是随着在多佛下车的概率而变化的,当概率从0增加至0.6时,保底值也随之增大,当概率大于0.6后,保底值开始持续下降。因此,莫里亚蒂的最大保底值就是在多佛下车的概率为0.6时计算得到的数值。也就是说,莫里亚蒂按照最大最小准则应该采取的策略是“按照0.6的概率在多佛下车,按照0.4的概率在坎特伯雷下车”。

关于福尔摩斯按照最大最小准则应该采取的策略,也可以按照相同的思路来考虑,如图3-2所示。

图3-2 福尔摩斯的保底值变化情况

到此为止,我们对最大最小准则的阐述就告一段落了。正如广大读者读过上文之后所感受到的那样,最大最小准则在不知不觉间影响着人们的日常生活,发挥着重要的作用。此外,关于使用最大最小准则的有效性和合理性,也有着充分的依据支撑。尤其是在深入研究冯·诺依曼和奥斯卡·摩根斯特恩对零和博弈理论分析的基础上,无论是从行为选择的合理性来看,还是从数学必然性的视角来看,这一准则都是正当、合理的。

因此,我衷心希望读者有意识地使用或规避最大最小准则,从而灵活掌握更富战略性的行动指针,在日常生活中处理复杂问题拥有更为可靠的决策依据。

[1]金融衍生品(derivatives)是一种金融合约,其价值取决于一种或多种基础资产或指数,合约的基本种类包括远期、期货、掉期(互换)和期权。

[2]看涨期权(calloption),又称认购期权、买进期权、买方期权、买权、延买期权或“敲进”,是指期权的购买者拥有在期权合约有效期内按执行价格买进一定数量标的物的权利。

[3]奈特氏不确定性(Knightiay)指无法被衡量、不能被计算概率的风险,由经济学家弗兰克·奈特提出。在奈特的成名作《风险、不确定性与利润》中,他为风险与不确定性做出定义,主张风险是能被计算和评估的,而不确定性是无法被预先计算与评估的。此外,他还提出利润是来自不确定性的论点。

[4]约翰·冯·诺依曼(JohnvonNeumann,1903—1957),美籍匈牙利数学家、计算机科学家、物理学家,是20世纪最重要的数学家之一。冯·诺依曼是布达佩斯大学数学博士,现代计算机、博弈论、核武器和生化武器等领域的科学全才之一,被后人称为“现代计算机之父”“博弈论之父”。冯·诺依曼先后执教于柏林大学、汉堡大学、普林斯顿大学、普林斯顿高等研究院,曾担任美国原子能委员会会员、美国国家科学院院士。冯·诺依曼早期以算子理论、共振论、量子理论、集合论等方面的研究闻名,开创了冯·诺依曼代数。第二次世界大战期间,冯·诺依曼参与曼哈顿计划,为第一颗原子弹的研制做出了贡献。1944年,冯·诺依曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》。这是博弈论学科的奠基性著作。冯·诺依曼晚年转向研究自动机理论,著有对人脑和计算机系统进行精确分析的著作《计算机与人脑》(1958年),为研制电子数字计算机提供了基础性的方案。

[5]奥斯卡·摩根斯特恩(enstern,1902—1977),德国-美国经济学家,曾长期在维也纳大学讲授经济学。1938年纳粹德国吞并奥地利后,摩根斯特恩被迫离开奥地利来到美国,1944年加入美国籍。他在普林斯顿大学教经济学,并在那里度过了他的后半生。他热心于将数学应用于经济学,更广义地说,应用于人类的各种战略问题,以便获得最大收益和尽可能地减少损失。他认为这些原理也同样适用于哪怕简单得像抛掷硬币这样的游戏,因而提出了博弈论。

[6]零和博弈(zero-sumgame),又称零和游戏,是博弈论的一个概念,与非零和博弈相对,属非合作博弈。它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。

热门小说推荐
华娱之从演皇帝起家

华娱之从演皇帝起家

如果你能穿越到平行世界,成为龙老大的侄子,那时你是会选择继续日复一日的生活?还是选择光彩夺目的人生?我不知道,但我选择愿得一心人,白头不相离!817592675群号八一七五九二六七五各位书友要是觉得华娱之从演皇帝起家还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...

诸天,从亮剑开始的倒爷

诸天,从亮剑开始的倒爷

作为一个雇佣兵,陈浩穿越了。在亮剑世界李团长,三八大盖太落后了,AK47见过没有?只要你出得起钱,我让你全团一人一把机关枪。几次交易后。李云龙看着独立团的战士一水的AK47,扛着火箭筒,拉着火箭炮,脸上露出了欣慰的笑容。值了,有两个这样的师,我敢打太原。山本一木望着被火箭弹淹没的阵地,整个人都怀疑人生了八格牙路,谁能告诉我,土八路是怎么有那么多大炮的?无限流,多影视世界,主世界融合我是特种兵2战争之王准备的穿梭世界我的团长我的团二炮手永不磨灭的番号...

开局逃荒:拿休书在古代种田养崽

开局逃荒:拿休书在古代种田养崽

(本文无脑无逻辑微夸张介意慎入)池鱼,星际战区最高指挥官,战舰爆炸粉身碎骨。ampampbrampampgt  再一次醒来竟然捡了一个小崽子,既来之则安之,这崽崽就是她儿子了。ampampbrampampgt  带着崽崽跟着一群逃荒的队伍去了一个...

带个系统去抗日

带个系统去抗日

王大号从炮弹深坑被几十号人刨了出来轰隆轰隆的炮火声,哒哒哒机枪扫射声。这是什么地方,我在那队长鬼子进村了叮咚!恭喜宿主穿越到抗日战争时期,完成系统任务会有丰厚奖励,百米射杀一名鬼子,奖励一颗红苹果,完成999个任务,赠送神秘大礼包…这是什么坑爹系统,杀鬼子奖励苹果怎么不送我飞机大炮,什么神秘大礼包也不说清楚,真是坑爹系统啊…队长我抓个鬼子少左给我松开,老子要和他单挑…队长我抓个鬼子大左放开小鬼子,老子要用菜刀和他过过招队长我抓个鬼子少将…他娘的你小子真行,回去赏你半斤地瓜烧…王大号游击队,李云龙独立团,楚云飞三五八团,丁伟新一团,孔杰新二团,被称为平安县城地区抗日五虎部队…李云龙独立团解放县城,没有我王大号游击队弟兄们能成事…云飞兄被小鬼子围困山顶,我王大号得腾出手来救兄弟…孔杰这老小子又吃独食了…丁伟这小子太滑头,竟捡现成武器装备…老李吹牛皮是响当当!孔二愣子,你说我李云龙吹牛皮响当当,有游击队王大胖子能吹…...

每日热搜小说推荐