大数据时代,传统统计学依然是数据分析的灵魂( 二 )

  • 什么是大数据呢?量的增多 , 是人们对大数据的第一个认识 。 随着科技发展 , 各个领域的数据量都在迅猛增长 。 有研究发现 , 近年来 , 数字数据的数量每3年多就会翻一番 。

  • 大数据区别于数据 , 还在于数据的多样性 。 正如高德纳咨询公司研究报告指出的 , 数据的爆炸是三维的、立体的 。 所谓的三维 , 除了指数据量快速增大外 , 还指数据增长速度的加快 , 以及数据的多样性 , 即数据的来源、种类不断增加 。

  • 从数据到大数据 , 不仅是量的积累 , 更是质的飞跃 。 海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析 , 原本孤立的数据变得互相联通 。 这使得人们通过数据分析 , 能发现小数据时代很难发现的新知识 , 创造新的价值 。

通过数据来研究规律、发现规律 , 贯穿了人类社会发展的始终 。 人类科学发展史上的不少进步都和数据采集分析直接相关 , 例如现代医学流行病学的开端 。 伦敦1854年发生了大规模的霍乱 , 很长时间没有办法控制 。 一位医师用标点地图的方法研究了当地水井分布和霍乱患者分布之间的关系 , 发现有一口水井周围 , 霍乱患病率明显较高 , 借此找到了霍乱暴发的原因:一口被污染的水井 。 关闭这口水井之后 , 霍乱的发病率明显下降 。 这种方法 , 充分展示了数据的力量 。

推荐阅读