周五之后,AI风起,云天变( 八 )

目前来看 , 昇腾910芯片就符合“暴力不讲道理”的这个芯片“人设” 。 根据公布数据 , 测试结果表明昇腾910算力达到了半精度 (FP16): 256 Tera-FLOPS;整数精度 (INT8) : 512 Tera-OPS 。 并且合规算力所需功耗仅有310W 。 更直接的对比是 , 运用在实际AI训练任务中 , 在典型的ResNet-50 网络的训练中 , 昇腾910与MindSpore配合 , 与现有主流训练单卡配合TensorFlow相比 , 显示出接近2倍的性能提升 , 每秒训练的图片数量从965张提升到1802张 。

或许我们可以说得更直白一点 , 华为所指的主流训练单卡 , 就是英伟达的V100 。 事实上 , 目前能够基于云服务获取的AI训练算力 , 只能来自谷歌的TPU和英伟达的V100 。 后者基本要通过亚马逊的AWS来获取 。 而根据英伟达方面的指摘 , TPU2.0仅有V100二分之一的算力 , 并且限量出租 。

于是我们能看到 , 基于云服务的AI训练算力是十足的稀缺资源 , 价格昂贵且难以预约 。 这样的产业条件 , 显然是无法促进AI行业真正向前发展的 。

而现在 , 昇腾910部署到华为云之后 , 全球开发者拥有了第三个选择 , 中国公有云市场迎来了首个全栈云+AI解决方案 。 加之昇腾910算力比V100更强 , 华为云始终坚持普惠定价策略和充足能力供给 , 训练这个天梯 , 或许真正能够拥抱算力层的解决方案 。

推荐阅读