吴军:落后最可怕的地方是思维方式的落后(13)

前面的几个例子无一不是先从大数据找到普遍规律,然后再应用于每一个具体的用户,并且影响到每一个具体的操作。以抓毒品种植和偷漏税为例,警察局或者税务局首先需要根据大数据了解用电或者纳税普遍的模式,然后要准确地估算出每一个地址正常的模式,这样就能够发现每一个异常的情况。

对于互联网公司的那些应用也如此,那些公司可以对每一个用户提供不同的服务,甚至做到每一次的服务都不相同。比如电商公司在用户浏览打印机或者电动牙刷时,如果发现他们在阅读产品介绍和评价,那么可能用户尚未完成购买,推荐相应的产品给用户是合理的;而当用户完成购买后,再搜索或浏览这些产品,推荐给用户打印机墨盒或电动牙刷头等耗材,就比推荐那些耐用产品本身更合理了。经常在亚马逊上购物的人对这一点会有体会,不仅不同的人看到的网页内容是不一样的,而且同一个人今天和昨天看到的内容也是不一样的,尤其是在完成一些购买行为之后。这种精细到每一次交易,甚至每一次内容展示的服务,在过去是想都不敢想的,但是靠大数据今天这已经变成了可能,而且它还代表着未来商业的趋势。

通过这件事我们也能进一步体会大数据完备性的特点。在过去,统计学家们一直试图寻找好的采样方法,以便在有限的样本中找到覆盖尽可能全的规律,但是在大数据时代,这些努力都不需要了,因此样本集可以等于全集。另外,我们还可以从这个案例中看到大数据时效性的特点。对于新的、过去没有见过的情况,Google的服务器反应是非常及时的,即在第二次就能把新鲜的数据提供给用户使用,这在大数据时代之前也是做不到的。

推荐阅读