互联网风口太多了，到底哪些才是真的趋势？( 八 )_：互联网风口太多了

——崔秋《云时代数据库的核心特点》

本来事情发展到这里就结束了，但 2014 年亚马逊又推出一个重磅炸弹：基于新型 NVME SSD 虚拟存储层的 Aurora，它实现了完全兼容 MySQL（甚至连 bug 都兼容）的超大单机数据库，同时在性能上高出 5 倍以上。

另外，各种不同用途的数据库也纷纷诞生并取得了较大的发展，比如用于 LBS 的地理信息数据库，用于监控和物联网的时序数据库，用于知识图谱的图数据库等。

可以说，数据库目前处于一个百花齐放的阶段，而由于云厂商的努力，基本上新的数据库都支持自动扩容、按使用付费的云计算特征。

大数据：从批处理到流处理

Google 在 03-06 年发布了关于 GFS、BigTable、MapReduce 的三篇论文，开启了大数据时代。在发展的早期，就诞生了以 HDFS/HBase/MapReduce 为主的 Hadoop 技术栈，并一直延续到今天。在这当中，不少组件都是可替换的，甚至有的发生了换代。这其中，最重要的换代就是处理引擎。

最开始大数据的处理大多是离线处理，MapReduce 理念虽然好，但性能捉急，新出现的 Spark 抓住了这个机会，依靠其强大而高性能的批处理技术，顺利取代了 MapReduce，成为主流的大数据处理引擎。