从疫情数据和认知状况,来看三大常见的分析解读误区( 四 )

可视化图标是提供疫情传播信息最直观的方法 , 全国疫情趋势图曾经出现过一个流传广泛的错误的图 , 因为是用今日新增疑似减去昨日新增疑似 , 得出每日新增疑似的数值 。

其中的原因 , 是新增疑似病例 , 并不等于今日疑似病例减昨日疑似病例 , 因为疑似病例最终会变为三类:转为确诊病例、排除疑似可能、保持疑似 , 因此 , 每天实际增加的疑似病例会比两日的累计差值更高 。 正确的计算方式是:今日疑似病例=昨日疑似病例+新增疑似-疑似确诊-排除疑似 。

此外 , 可视化地图也是提供疫情传播信息最主要的形式 , 通过以省份为单位 , 按照确诊人数将疫情严重程度分层 , 普通市民可以了解疫情的分布情况 。

但数据分析的陷阱在哪里呢?因为中国有数百个地市 , 是一个层次结构 , 而非平均分布的区域结构 , 并且按省份划分容易产生一种地域歧视的误区 , 因此 , 地市行政单元分级符号制图更数据更能反映现实情形 。

美国统计专家达莱尔·哈夫在《统计数据会说谎》中说:“在没有重要数据的情况下 , 千万不要轻易相信一个平均数 , 一张图表 , 或是一条趋势线 。 否则你就会像一个只凭平均气温选择露营地的人一样盲目 。 ”

推荐阅读