有很多讲概率和决策相关的书,比如讲人如何在涉及概率的选择中做决策,书中可能有类似这样的试验:

给被试者有两个选项:

  1. 90% 的概率得到 100 元,10% 的概率什么也得不到。
  2. 可以得到 80 元。

根据数学期望,1 比 2 更好(100 * 90% = 90 > 80),但多数人都选择 2,因为 2 是确定的,并且 80 并不比 90 少很多,如果选 1 有可能一无所获而后悔。这种行为是不理性的,并且很容易导致自相矛盾的窘境……

我这里先不讨论类似试验中选哪个好,而是说说概率本身。不是数学中的概率,而是实际生活中的概率。我发现很多人对实际生活中的概率有误解。

从经典的抛硬币说起。假设有一个完美的硬币和一个完美的抛硬币的人,他能在一个完美的地方抛硬币,硬币正面朝上的概率是 50%。先不去管这“完美”是否实际,即使不实际,抛很多次后的统计结果也很可能显示硬币正面朝上的概率很接近 50%。那么我们可以认为在单次的抛硬币过程中,不需要为硬币正面朝上做解释,也就是不需要说“因为……所以这次硬币正面朝上”。投骰子、摸小球等等也是类似的。但我们可以想象到,实际生活中符合该条件的场景并不多,基本只有各种概率游戏、赌博、抽奖等场景。

那么我们看看除了这些场景之外,“概率”这个词还被用在了什么地方。

飞机航行中失事的概率非常低。

不说这个概率具体是多少(可以用历史数据算出来),也不说数值准不准。抛硬币和飞机航行两个场景的一个重要区别是,我们可以不解释为什么某次硬币正面朝上,但不能不解释为什么某航班的飞机失事。航空公司不能在自己的某架飞机失事并因此死几百人之后向大家宣布:飞机失事的概率是 x%,这架飞机失事了,根据历史统计结果,符合这个概率,就像某次抛硬币结果正面朝上符合概率一样,不需要解释,我们也不承担任何责任。

显然无论飞机失事的概率是多少(也无论怎么计算这个概率),一架货真价实的飞机失事了,这件事必然有明确的原因,比如飞机的某零件出了问题,或者飞行员身心出了状况等等。

这说明在抛硬币(结果是正面或者反面朝上)和飞机航行(结果飞机安全抵达或者失事)两个场景中使用的“概率”并不是同样的意思。我们已经清楚概率在抛硬币中的意思了(基本和在数学中的意思差不多),但飞机失事的概率呢?我们说飞机失事的概率是 x%,到底是什么意思?

这个概率的计算方法类似这样:全球(或者某航空公司)在某段时间一共有 m 次航班,其中有 n 次失事,那么失事的概率就是 n/m。看起来好像和在某段时间一共抛了 m 次硬币,其中有 n 次正面朝上,那么正面朝上的概率就是 n/m 一样。

但区别在于抛硬币是重复性试验,我们可以认为每次抛硬币的条件完全一样,或者说可以认为抛很多次硬币是把一个抛硬币事件重复很多次,从而统计出这一个抛硬币事件结果正面朝上的概率。而飞机航行不是重复性试验,每次航行都和其他的不同,比如飞机上的乘客、天气、飞行员、目的地、航行时间等等方面不可能一致,那么就不能将很多次航行当成一次航行重复很多次。按照这样的计算方法算出的结果,也根本不是某飞机在一次航班中失事的概率,而只是在某段时间中失事航班占所有航班的比率,和概率根本没有关系,也完全无法预测出某飞机在未来某次航班中失事的概率(即使用它预测未来某段时间失事航班占所有航班的比率也有些牵强)。

我们看看什么叫未来某次航班飞机失事的概率。比如这次航班有甲和乙两名飞行员,他们通过抛硬币决定谁来驾驶。但甲已经想好了,如果由他驾驶,他就会在途中让飞机失事,可以 100% 成功,而乙没有这样的想法。那么这次航班飞机失事的概率就是 50%,和历史数据基本没有关系。

这个假设太离谱了吗?那么想象一个劫机者通过投骰子的方式从六次航班中选择一个航班,他有把握登上飞机后就让飞机在途中失事,那么其中某一架飞机的失事概率是多少?去查历史数据吗?

因为失事的飞机和没有失事的飞机有本质的不同,飞机失事必然有具体的原因,而这个原因不会被所有飞机共享(即使某型号飞机有缺陷,通常也不会仅仅因为这个缺陷导致失事,还和更重要的其他因素有关),所以通过历史数据来预测未来某飞机在某航班是否会失事并没有足够根据。所谓的飞机失事“概率”也根本不是概率。

如果还是不好理解,可以再想象这样一个场景。下边是在机场的甲乙两人的对话:

甲:[指着一个已经起飞的飞机] 你猜这次航班失事的概率有多少?
乙:根据历史数据计算,是 x%(x很小)。
甲:那我告诉你一件事,我认识在驾驶这架飞机的飞行员,他在一个月之前就计划好了让今天的这次航班失事,他很有把握。你现在再猜猜失事概率呢?
乙:这……如果你没有开玩笑,那失事概率就很大了,接近 100%。
甲:那你还认为之前的 x% 是失事概率吗?
乙:这不一样啊,之前我不知道飞行员的情况,那就是 x%,现在知道了,概率就变了,这叫条件概率。二者不一样很正常。
甲:条件概率?有意思。那我们换一个场景。比如我手里有一个骰子,投一下,结果两点朝上的概率是多少?
乙:1/6。
甲:但忘了告诉你,这个骰子是不均匀的,我自己测试过投一千次大概有五百次都是两点朝上。现在你认为两点朝上的概率是多少?
乙:这……接近 50%。
甲:那我拿着这个骰子,问另一个不知情的人,他说两点朝上的概率是 1/6,你同意吗?
乙:不同意,不管他知不知情,这个骰子两点朝上的概率都不是 1/6,因为它根本不均匀。
甲:这回不用条件概率了?为什么之前的飞机可以用条件概率,我这个骰子就不能用了?
乙:我想想……确实飞机也不能用条件概率,和这个坑人的骰子一样,飞机也是不均匀的,不同飞机的情况不一样,不能根据历史记录算失事概率。
甲:那我告诉你,我说认识飞行员的事情是假的,现在这次航班失事的概率是多少?
乙:我不知道,而且如果没有想搞事情的飞行员,我不认为有人知道它失事的概率。

然后我们再看下其他类似场景,可以说我们在生活中使用概率的场景基本都是这样的。

根据历史数据统计,青少年自杀的概率是 x%,所以一个青少年(比如你的儿子)自杀的概率是 x%?一个人不会无缘无故自杀,必然有具体原因。所以通过历史数据得到的 x% 根本不是自杀的概率(而是某段时间自杀的青少年在所有青少年中的比率),也不能用来预测具体某个青少年自杀的概率。否则自杀的青少年所在的学校就可以这样说:因为青少年自杀的概率是 x%,我们一共有 m 人,n 人自杀了,n/m < x%,所以这些自杀都是正常的,我们没有任何责任。

更要命的是,患一种疾病的 m 人都吃了某种药(没有其他治疗过程),结果其中 n 人恢复了,那么这种药治疗这种病的有效率是 n/m,也就是说对于一个新的该病病人,吃了这种药有 n/m 的概率康复?每个人的身体情况不同,吃了这种药后恢复也有具体原因,所以 n/m 也不是什么什么概率,只是某群人中恢复的人占病人总数的比率,不能用来预测下一个病人康复的概率。注意,不是说这种药治不了这种病,而是说这么算出来的结果根本不是概率。同样地,病人吃了这种药后完全没有效果最后死亡,主治医生不能说:根据历史数据,吃该药后死亡的该病病人占比低于 n/m,所以该病人的死是完全正常的,不需要任何解释,我也不承担任何责任。但实际上,我们的医生很可能这么说(甚至在治疗之前就说,这种病的治愈概率只有 x%,如果没治好不要找我麻烦),大家也会认可,这是大有问题的。

问题出在哪呢?航空公司不会说:乘客们请注意,您登上这家飞机后有 x% 的概率会因为飞机失事而死亡,一旦发生事故,我们概不负责。学校校长也不会说:家长同学没请注意,您或者您的孩子来这里上学后,有 y% 的概率会自杀,一旦发生悲剧,我们概不负责。但医院的医生很可能说:病人和病人家属请注意,您或者您的家属所得的疾病,在我们这里不治身亡的概率是 z%,一旦死亡,我们概不负责。

我不是说医生有义务治好所有病人的责任(也不是说航空公司有义务保障所有飞机都不失事),但如果病人不治身亡,我们需要搞清楚具体原因,而不只是得到了类似这样的一句话:这种病不治身亡的概率是 z%。这纯粹是对“概率”的误用,从而可以逃避具体的问题(比如医生误判的病情,没有及时给病人合理的治疗,但根本不用和病人家属讲这些,只需要说这种病不治身亡的概率是 z%,很遗憾我们尽力了)。

这种误用“概率”的情况非常多,基本上我们生活中看到的“概率”二字,都属于误用。可以想象那些场景,一定概率的事情发生后,我们是否需要知道或者解释其发生的原因,如果需要,那么就是对“概率”的误用。

这会导致怎样的结果?

简单说,基于概率做决策只适用于答题、游戏、赌博、概率相关实验、买彩票等个别场景,而不适用于生活中大部分场景。在大部分场景,我们根本不知道一件事发生的概率(那些根据历史数据得到的根本不是概率),或者说那件事情根本没有什么发生的概率可言(至少没有恒定的概率,而不恒定的概率我们也极难得到,一旦我们通过特殊方式得到那个概率,我们的一举一动也会直接影响到那个概率),怎么根据概率做决策?

忘了这种问题吧:

  1. 90% 的概率得到 100 元,10% 的概率什么也得不到。
  2. 可以得到 80 元。

你选择哪个?

除非你有幸遇到一个做这种实验的心理学家或者经济学家免费送钱,不然这种问题想得再明白也对实际生活没有好处,反倒可能误导了自己。

那么回到这个问题。为什么大部人选期望更低的 2?大家更喜欢确定性,为什么?因为实际生活根本没有“90% 的概率得到……”这种虚无缥缈的事情。不只远古时代没有,现在也没有(别想了,去赌场指望这个赚钱不如守好自己的钱包)。人不需要把精力放在实际生活中根本不存在的事情上,这是非常理性的,而不是什么非理性行为。

但实际生活中,我们遇到的不只是确定的事情。如果要在比较确定和比较不确定的事情中选择,怎么办?

比如经常有人遇到的问题,是选稳定,还是搏一搏?选稳定的话,收获更小(基本没法用数字衡量),风险更小(姑且这么认为,实际上未必,也得不到具体的风险概率)。搏一搏的话,收益更大(同样无法用数字衡量),风险也更大(实际上也未必,也没有具体概率)。

这种事情是根本是算不出期望的,如果费不少劲从某些地方搞来了一堆数字(比如根据历史统计),那也是不可用的,和你这次选择没太大关系。还有一个常见方法是把每个选择的利弊都列出来,然后通过加权的方式各自得到一个分数,然后选择更大的。看起来这种方法很合理,也不用知道概率,很像一个靠谱的方法。但做过这种事情的人就会清楚其中的弊病,简单说这更像一个说服自己做某个选择的方式。如果自己已经知道选哪个了,自然会把那个选项的分数算大(有很多方式,可能不知不觉就在进行了)。如果自己左右为难,那么两边的分数也“左右为难”,直到自己下定主意。如果一个人拿出一个这种表格说我选好了,那么他的表格很可能只是给别人看的,不用仔细分析它然后挑毛病,因为他心里已经有答案了。

作这种选择时,要考虑的是自己能否接受最差的结果,以及自己是否会后悔(其实是前者的弱化)。如果某一个选项的最差结果自己不能接受,无论发生的“概率”有多低(别忘了自己得到的“概率”根本不是实际的概率,看上去的小概率事件也许会 100% 发生在你的身上,只要你选择了这个选项,当然也可能完全不会发生,而你没办法知道),这个选项就不是给你准备的,收益有多高也和你无关。如果选了某个选项后,某个结果会让你后悔,那么也尽量不要选,除非你喜欢后悔的感觉。如果还排除不出结果,那么怎么选也就无所谓了,抛硬币都可以,当然最好还是自己选,不然之后可能会责怪运气。

我不是说不这么选这次就会发生自己无法接受的悲剧,或者一定会后悔,也许迎接自己的是惊喜。但一个人不会只面临一个选择,继续下去迟早会发生你不愿意看到的事情。赌徒是不可能永远赢钱的,也很难在输钱之前就收手,这是一辆无法刹住的车,停下来的唯一方式就是发生车祸,而你作的选择就是是否上车。

那是不是因为飞机有可能失事,就不能坐飞机了?不坐飞机的话,坐火车、汽车或者轮船也可能出事,如果哪也不去,在家也可能出事。如果想确保自己不出事,只有一个办法,就是赶快死亡,然后至少在在这个世界自己就不会出事了。

我说的作选择不是在没有明显风险的情况选交通工具,而是自己面临实际选择的时候。那时我们会意识到这是一个选择,会知道如果选“错”了自己会后悔,甚至无法接受后果。而其他时候,还是把精力放在其他地方好一些(比如把手头的事情做好。当然也可以自己制造一些选择,比如强行认为早晨吃米饭还是面条是一个重大选择,只是不管选什么也很难产生不一样的结果,白白浪费精力)。

平时多找机会做选择,练习选择的能力,等到关键的时候不就更有经验了吗?选择的关键在于信息,如果一个选择没有什么有效的信息(比如在家看书还是出门玩),不管选哪个都差不多,那这种选择做再多也积累不出经验。如果想练习的话,不如想象自己处于一种左右为难的境地会怎么做,那要比在无关紧要的地方做实际选择要有用得多。虽然和真实场景还是很不一样。

同样地,如果自己回忆过去时想“如果当时我……就好了”,但当时完全没有面临选择的感觉,这也完全不是(或者说不用)遗憾,因为那种“如果”并不存在,就像“如果我中了大奖就好了”一样。