大数据时代,传统统计学依然是数据分析的灵魂( 五 )
大数据时代 , 审核数据的真实性也有了更有效的手段 。 大数据的特征之一是多样性 , 不同来源、不同维度的数据之间存在一定的关联度 , 可以交叉验证 。 例如 , 某地的工业产值虚报了一倍 , 但用电量和能耗却没有达到相应的规模 。 这就是数据异常 , 很容易被系统识别出来 。 发现异常后 , 相关部门再进行复核 , 就能更有针对性地防止、打击数据造假 。
数据是一种资源 , 但数据又跟煤、石油等物质性资源不一样 。 物质性资源不可再生 , 你用多了 , 别人就用少了 , 因而很难共享 。 数据可以重复使用、不断产生新的价值 。 大数据资源的使用是非恶性竞争的 , 共享的前提下 , 更能够制造双赢 。 从另一个角度来说 , 数据如果不被融合、联系在一起 , 也不能称之为大数据 。
大数据不能被直接拿来使用 , 统计学依然是数据分析的灵魂
现在社会上有一种流行的说法 , 认为在大数据时代 , “样本 = 全体” , 人们得到的不是抽样数据而是全数据 , 因而只需要简单地数一数就可以下结论了 , 复杂的统计学方法可以不再需要了 。
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 李儒|三国杀:为什么叫李儒时代的骄傲,他到底有什么好骄傲的?厉害吗
- 梦幻西游|梦幻西游:诗情画意进入净台时代,郭无情买爆总17段野兽鞋
- 帝国时代4|老外做的《帝国时代4》,究竟能有中国味吗?
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- 地下城与勇士|DNF:“全民云上”时代到来,一个过气小副本,究竟有何魅力?
- steam|目前Steam上什么游戏比较火?《帝国时代4》屈居第二
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 帝国时代4|第五人格:孽蜥新紫皮“狰”,西装暴徒、斯文败类说的就是他吧
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解