狡猾的谎言——我们是如何被事实和数字欺骗的?(13)

在医学界一个典型的案例——医学观察发现使用激素替代疗法的治疗冠心病的女性复发率率明显低于平均水平,于是很多医生认为这个疗法肯定比其他疗法更好,但之后的随机医学试验证实恰恰相反,这个疗法效果甚至还不如普通疗法,那么这是为什呢?

原来是因为该疗法前沿且价格高昂,而接受这一疗法的女性通常社会地位和财富地位相对较高,而她们的饮食习惯的健康程度和运动量也高于普通人,因而复发率低于普通人。

为了讲清楚因果和相关这个问题,我举一个栗子——比如某个地方车祸次数和黑熊袭击从数据表现上极其相关,大家可能第一时间想到的是黑熊袭击导致了车祸的发生,但事实上他们可能有四种关系:

黑熊袭击导致车祸发生

车祸发生导致黑熊袭击

车祸和黑熊袭击都由第三方因素(如火山爆发)引起

车祸发生和黑熊袭击完全没有关系

所以之后不要看到相关的数据就认为他们之间一定是因果关系,我们要认真分析背后可能的具体原因和逻辑关系,国外有一个神奇的网站(https://tylervigen.com/)专门收集那种不可能有联系的虚假相关关系,比如这个:

推荐阅读