从疫情数据和认知状况,来看三大常见的分析解读误区( 四 )
可视化图标是提供疫情传播信息最直观的方法 , 全国疫情趋势图曾经出现过一个流传广泛的错误的图 , 因为是用今日新增疑似减去昨日新增疑似 , 得出每日新增疑似的数值 。
其中的原因 , 是新增疑似病例 , 并不等于今日疑似病例减昨日疑似病例 , 因为疑似病例最终会变为三类:转为确诊病例、排除疑似可能、保持疑似 , 因此 , 每天实际增加的疑似病例会比两日的累计差值更高 。 正确的计算方式是:今日疑似病例=昨日疑似病例+新增疑似-疑似确诊-排除疑似 。
此外 , 可视化地图也是提供疫情传播信息最主要的形式 , 通过以省份为单位 , 按照确诊人数将疫情严重程度分层 , 普通市民可以了解疫情的分布情况 。
但数据分析的陷阱在哪里呢?因为中国有数百个地市 , 是一个层次结构 , 而非平均分布的区域结构 , 并且按省份划分容易产生一种地域歧视的误区 , 因此 , 地市行政单元分级符号制图更数据更能反映现实情形 。
美国统计专家达莱尔·哈夫在《统计数据会说谎》中说:“在没有重要数据的情况下 , 千万不要轻易相信一个平均数 , 一张图表 , 或是一条趋势线 。 否则你就会像一个只凭平均气温选择露营地的人一样盲目 。 ”
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |S11淘汰赛数据盘点:场均时长为33分 55个不同英雄登场
- 中单|2021年英雄联盟世界赛终于落下帷幕!!大数据统计二!!
- 灵饰|梦幻西游:109级法系前排灵饰选择方法,用数据告诉你怎么做
- 卡牌|S11淘汰赛数据出炉,卡牌24场全被ban,压刀最多竟是辅助
- edg战队|堡垒之夜国服将清除数据,EDG创造队史晋级S11世界赛决赛
- 网游|颠覆你认知的网游土豪,程序员加班为他改游戏,还送专属服务器