4个月建成的数据中心,如何承载“全球最快的AI训练集群”?( 八 )

相同的设计思路使得相似环境下的数据中心运营经验也得以更为简单地传承。华为云东莞松山湖数据中心此前设计的年均PUE为1.39,而通过借鉴其他数据中心经验,其实际运行后的年均PUE为1.3。据估计,经过进一步的运营优化,东莞松山湖数据中心也完全有可能将年均PUE降到1.25左右。

此外,华为也在探索间接蒸发冷却技术在数据中心的应用,比如在乌兰察布建设的三个数据中心,采用类似的预制模块化技术,但制冷系统采用更适合北方的间接蒸发冷却技术,相比传统的冷水机组,间接蒸发冷却技术天然具有模块化基因,在自然冷源充足的北方地区,也更有利于PUE降低。目前华为云乌兰察布数据中心已于近期投产,相比东莞数据中心,因为同样采用预置模块化技术,且有经验积累,其建设周期进一步缩短。

集群作战华为云的全栈数据中心能力

支撑华为云业务的数据中心数量快速增加,必然也对运维部门提出更大挑战,越来越多的数据中心需要管理,尤其是云数据中心,业内公认,数据中心的运营能力也是公有云服务提供商的核心竞争力之一。

俗话说,“三军易得,一将难求”。而在现代军队中,以我国的辽宁号航母为例,每一个舰上士兵都花费了大量的时间和金钱培养,更不要说舰长了,即使是这样,下水后也需要试航多年。数据中心运营同样是一个技术工种,不仅考验技术研发能力,同样还需要深厚的实践经验。

推荐阅读