全球训练速度最快集群Atlas900曝光 华为计算产业战略全公布( 六 )

现场进一步发布了华为AI全栈全场景重磅产品——昇腾910服务器集群Atlas900 , 华为称之为目前世界上训练速度最快的训练集群 , 在Fastest cluster ResNst-50@ImageNet测试中 , 华为成绩为59.8秒 , 比第二名70.2秒的成绩高出了10秒多 。

Atlas900由数千颗昇腾910 AI处理器互联构成 , 每颗昇腾910 AI处理器内置32个达芬奇AI Core , 单芯片提供比业界高一倍的算力(256TFLOPS@FP16) , 总算力达到256P~1024P FLOPS @FP16 。

Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式 , 在AI服务器内部 , 昇腾910 AI处理器之间通过HCCS高速总线互联;昇腾910 AI处理器和CPU之间以最新的PCIe 4.0(速率16Gb/s)技术互联 , 其速率是业界主流采用的PCIe 3.0(8.0Gb/s)技术的两倍;在集群层面 , 采用面向数据中心的CloudEngine 8800系列交换机 , 提供单端口100Gbps的交换速率 。

Atlas 900 AI训练集群采用全液冷方案 , 支撑>95%液冷占比 。 单机柜支持高达50kW超高散热功耗 , 实现PUE<1.1的极致数据中心能源效率 。 另外 , 在空间节省方面 , 与8kw风冷机柜相比 , 节省机房空间79% 。

推荐阅读