代码英雄之数据爆炸:身陷数据洪流,企业应如何赋能而生( 七 )

图5/6

新一代基于云的计算已经使大数据处理成为可能,在世界各地,我们正在学习如何有效利用和处理数据。对于像ChRIS这样的平台,一个关键因素是实现了基于云计算的一种新型存储。现实中的很多医院都会丢弃他们收集到的数据,因为他们确实无法控制所有数据。因此,拥有一套完善的存储解决方案对于企业来说至关重要。对于ChRIS,存储解决方案就是以一个名为Ceph的开源项目形式出现的。ChRIS的创造者Sage Weil就表示,Ceph是一个软件定义的存储系统,可以提供可靠的存储服务,在不可靠的硬件上也能够提供各种协议。它的设计初衷是可扩展的,因此可以拥有非常大的存储系统和非常大的数据集,我们可以使它们可用并容忍硬件故障和网络故障等,而不会影响可用性。

但是,当前的行业明显还没有解决可扩展存储的问题,而且随着数据量的持续增长,只会变得越来越难以管理。那么我们需要做些什么才可能解决这种日益增长的需求?

第一,针对产生的大量数据,我们需要可扩展的系统,这些系统不仅可以扩展正在存储的硬件和数据量,而且还要具有某种固定或接近固定的操作开销。第二,人们与存储交互的方式一直在发生变化,从文件存储、虚拟机的块存储到对象存储,这是行业中的一个关键趋势。下一阶段将不仅仅是提供一个对象存储端点或是把数据存储在一个集群中,而是真正采用这种高级别集群,地理上呈现分布式网格或私有数据中心,但在数据存储上依然能够管理分布其上的数据。第三,也许我们今天在某个位置写入数据,随着时间的推移会因为节省钱或者离数据更近等原因将其分层到其他地方,那出于降低成本的考虑,我们需要将其移至性能较低、容量更高的层。第四,数据的处理要合规,我们在收集数据时必须保持在某些政治边界内,遵守监管需求。最后,在某些行业会有像HIPAA这样限制数据移动方式的东西,因此,随着现代IT组织越来越多地分布在许多不同的数据中心和大量公有云以及私有云基础架构中,自动化管理将变得越来越重要。

推荐阅读