中科院谢高岗:从北京医院感染勒索病毒到华住旗下酒店开房记录泄漏,我们的数据面临什么威胁?( 三 )

高能耗

第二,数据量的激增会造成非常大的能耗。工信部2018年2月份做的一份统计显示,2017年国家有28.5万个数据中心,总耗电量超过1200亿千瓦时,占整个国家2%的用电量。预计到2020年用电量还将翻一倍,达到2962亿千瓦时。因此随着数据的增加,把能耗控制住也成为一个很大的问题。

存储的介质不同,对应的能耗也不一样。如光存储的优点是能耗非常低、存储的时间非常长,同时只能读取、病毒无法感染等,但缺点是吞吐量比较低,只有28兆/S读写的速度.

因此,我们在探讨说有无可能建立一个新的存储的方案,用大数据分析的方式来确定数据访问的模式,这样的数据访问模式能改造硬件系统、软件系统,把适合不同模式的数据放在不同的存储介质上,既保证性能,又降低能耗。

只是,想起来简单做起来很难。比如如何建立在线学习用户数据访问的模式,能随时做出调整。其次,每个业务和数据目标都不太一样,有些数据是冷数据,访问的效率性能不需要太高等。为了构建这样的性能,我们做了一些前期的工作,比如不要用安全的规则来控制数据访问,完全按照数据访问的行为来做安全检测。

推荐阅读