拥有统计学家、遗传学和演化生物学家等多个头衔的罗纳德·费希尔(也叫费雪),有个女同事,声称可以品尝出来一杯(英式)奶茶是先倒的茶还是先倒的奶。费希尔不相信就决定检验一番,于是费希尔就提供了八杯奶茶给这位女士(免费)品尝,其中一半是先加茶,另一半先加水,将八杯随机拿给这位淑女。
费希尔假设这位女同事根本品尝不出来,因为八杯都猜中的概率只有1.43%(1/70,别问我怎么知道),他给自己的假设起了个统计术语叫做“零假设”(Null hypothesis),而要验证这位淑女有这种能力的假设就叫做“备选假设”(Alternative hypothesis)。
科学的方法就是首先要否定她品尝不出来的这个零假设,然而再检测实验结果,这叫做“假设检验”(Statistical hypothesis testing),如果备选假设,也就是说这位女士猜中的几率高于随机水平,那么就是说结果具有统计显著性(Statistical significance),从而否定了“零假设”并验证了“备选假设”。费希尔的实验结果显示,这位女士成功地全部猜中了八杯奶茶的次序,其远远大于5%统计显著标准,从而证实了这位女士具有这种判定奶茶先后次序的能力(以及憋尿能力)。
“零假设”现在已经成为科学研究的基础,总结起来大意是说当你观察到一组实验结果时,你不能认为这个结果刚好就符合了你脑子里想着的预测,你得首先说明这不是一个随机发生的情况,只有否定了零假设之后,你的“备选假设”,也就是你期待的解释方案才可能有效,但还需要进一步检验实验结果的显著性水平。
网上能轻松找到关于“零假设”的很多资料,反而大多偏重于太难懂的术语,枯燥无味让人无法理解(没办法,这就是科学),反而最早提出“零假设”的费希尔是用这样一个有趣的“淑女品茶”(Lady tasting tea)例子提出来的,科学研究也可以这么玩。
类比一个最为大众所知的例子,就是我们经常看好莱坞电影里所说的“无罪推定”。也就是说,在没有找到相关证据证明犯罪嫌疑人有罪的情况下,我们只能先承认其无罪,要想给犯罪嫌疑人定罪,检方必须要拿出充足的证据来推翻嫌疑人的清白假定。
“无罪推定”涉及到了谁来提供证据的“举证责任”问题,因为在这里的零假设是无罪的嫌疑人,所以要想推翻这个假设,检方就必须提供证据,比如不在场证明是否有效、目击者证词、作案凶器以及犯罪动机等等。“无罪推定”让犯罪嫌疑人无需自证清白,而是要让怀疑方(检方或原告)拿出证据来。
举个例子,你早上起来发现手机找不到了,你认为可能是外星人偷走了。在证明你的说法合理之前,你需要首先证明它不是被你女/男朋友拿走去破解了。在这里,被女/男朋友拿走就是“零假设”(当然严格来说,这并不是真的,所以请放心),在接受被外星人偷走的看法之前,你得先否认被女/男朋友拿走的可能性,比方说你没有女/男朋友。这个否定的过程,专业的说法就是“排除零假设”(Exclusion of the null hypothesis)。
在医学上,这个零假设就是安慰剂效应。衡量一个新药是否批准上市(美国FDA标准),就是在双盲实验中,新药的效果要明显好于安慰剂。比如你开发了一种新药可以治疗痛经,如果含药的白开水效果并不比一杯普通白开水要好,那么你的新药是无法上市的。只有当你女友告知某一杯白开水的效果明显改善了疼痛,而你发现正好是含药的那杯的话,那么这就不是安慰剂效应在起作用,那么恭喜你可以申请FDA批准了(前提是没被女友打死,因为白开水的安慰剂效应已经大不如前)。
在日常生活中,在没有排除零假设的情况下,我们往往得出一些五花八门的结论,而最常被取笑的就是股评家,还有彩票预测大师。股市的涨跌和彩票的号码通常是随机发生的,就像你每天不同时刻的心情一样,但股民们和彩票迷们并不认可随机的零假设,他们认为一定有什么原因导致的,所以新闻和媒体中就会看到各色的股评家,在一些城市里满大街也会有摆摊算号总结彩票趋势的大师们,就会给我们一些离奇的备选假设,可能是南美的一只蝴蝶,或者是北美的一次选举,也可能是中东的一场悲剧等等。
股评家和彩票大师往往被当作笑话看待,但学术研究中,经济学家却不认为自己是个笑话,他们往往以为经济是可预测的,殊不知有些重大的不可预测的“黑天鹅”事件也会发生,由此导致了很多悲剧。塔勒布就是一个善于讽刺和谩骂经济学家不懂随机性和不确定性的思想家,归根结底来说,经济学家在得出备选假设之前,没有首先排除零假设(见《塔勒布的“不确定”四部曲:如何避免蠢货》)。
不光是在经济学,人文学科和社会科学里也有众多的“笑话”,却被当作正经的学术理论。拿历史学科的研究来说,很多历史学家在没有排除随机和偶然的零假设下,就提出了他们的理论。当然,历史不同的是,她是已经发生事件的回顾,所以其零假设还需要解释当一个事件出现之前,为何历史并没有按照现状保持下去。
历史学家常常把已经发生了的事情当作必然发生的事情,于是急于寻找其发生的原因。例如,要解释为何秦统一了六国,那么不是去寻找秦能够统一的证据,而是要先解释为何战国时代七国并立的状态没有继续进行下去,同样的多国并立欧洲为何最终没有完成统一。
用塔勒布在《黑天鹅》中的话总结来说:
历史和社会不是缓慢爬行的,而是在一步步地跳跃。它们从一个断层跃上另一个断层,其间极少有波折。而我们(以及历史学家)喜欢相信那些我们能够预测的小的逐步演变。我们只是一台巨大的回头看的机器。
我们同时也是一台探测规律和模式的机器,不相信偶然和随机。