从疫情数据和认知状况,来看三大常见的分析解读误区( 二 )

实际上 , 当一种不明的病症发作时 , 即使是多人出现类似相近症状 , 一开始可能还确定不了其严重程度 , 像这次疫情开始时只能叫“不明原因肺炎” 。 确认的过程需要依据受感染者的症状来诊断 , 可能需要看其病灶 , 细究病因 , 包括吃过啥、去过哪、接触过啥等等 。 流行病学的研究方法可能包括观察、实验、数学模型分析 , 甚至包括模拟疾病流行的过程 。

但即便是医生和医院 , 信息的收集依然存在局限 , 例如 , 来到医院看病的几个有限病例、其他事发地采集的样本 , 可能有很多没接触到的信息 , 或者基于时间、手段的差异 。 例如 , 没有来到医院的死亡者 , 或者受到感染却还没有发作的人群 , 包括携带病毒自己却不发作只传染他人的人 , 以及其他都还没有出现的各种情况等 。

所以在疫情时 , 不能机械地谈数据 , 数据也是可能不是完整事实的 。 分析结论的正确与否取决于样本数量、样本质量、样本采集的方法 , 也就是样本本身的代表性 。

2 幸存者偏差陷阱

推荐阅读