全球算力最强、训练速度最快的AI芯片——华为昇腾910正式推出( 二 )

昇腾910的设计规格:

所属系列:Ascend-Max

架构:达芬奇

半精度(FP16):256

TeraFLOPS整数精度(INT8):512 TeraOPS,128通道,全高清,视频解码器 -H.264/265

最大功耗:350W

栅长:7nm

全球算力最强、训练速度最快的AI芯片——华为昇腾910正式推出

昇腾910算力究竟有多强?来看一组实测数值:

半精度 (FP16) 算力达到256Tera-FLOPS整数精度 (INT8) 算力达到512Tera-OPS,并且,达到规格算力所需功耗仅 310W,明显低于设计规格的350W。徐直军同时表示,昇腾910总体技术表现超出预期,目前已被用于实际 AI 训练任务。其中,在典型的ResNet-50网络训练中,昇腾910与MindSpore配合,较现有主流训练单卡TensorFlow相比,性能提升接近 2 倍;每秒训练图片数量从965张提升到1802张。

推荐阅读