激荡十年:云计算的过去、现在和未来( 五 )

技术产品上看,早期的云上产品组合虽然还比较单薄,也存在一些限制,但计算和存储分离的核心理念已经得到初步确立,并深刻影响了基于云上应用程序的架构模式。具体来说,该理念一方面体现在云厂商纷纷将存储服务开辟为独立的产品类别,通过如 AWS S3、Azure Storage、阿里云 OSS 等服务清晰剥离了二进制对象与文件的负载与管理,并且提供了丰富的接口和 API 以供应用程序进行集成;另一方面,在虚拟机层面基于网络存储的托管磁盘服务也得到了大力发展和推广,如 AWS 的 EBS、Azure 的 Page Blob(后封装为 Managed Disk)以及阿里云的块存储(云盘),此类托管磁盘既很好地保障了数据可靠性,又提供了丰富的容量和性能级别选择,使得云上虚拟机的计算和存储充分解耦,在这两方面都能够独立扩展和调节。

在云计算的萌芽时期,另一个有趣现象是当时“云计算”和“大数据”纠缠不清的关系。可能是由于发展历程上几乎同期兴起,以及在大规模数据存储与计算上的确存在能力交集,两者的概念和定义一度容易互相混淆。早年笔者曾购买过一本很不错的 Hadoop 技术书籍,其副标题却是“开启通向云计算的捷径”,可见早期云计算的定义曾有较为模糊的阶段。当然,随着后续的时代发展,这样的歧义越来越少见了,云计算已多特指提供各类云端服务与组件的软硬一体化技术资源平台,是一个带有明确商业模式的综合性载体,而大数据则是技术上处理大体量数据的方法论和实现,主要是一种技术体系——所以两者各自独立又可互相依存,比如各云计算厂商都陆续推出了云上大数据分析服务,如 AWS 的 EMR、Azure 的 HDInsight、阿里云的 E-MapReduce,本质上正是开源大数据技术在云上的实现和适配。

推荐阅读