原创<br> 华为最强云端AI芯片商用!性能超英伟达V100,开源AI框架对标谷歌( 六 )

达芬奇架构具备高算力、高效率、灵活可裁剪的特点,具体而言特性如下:

1、可扩展计算,芯片的计算单元可以纵向扩展,支持int8/int32/FP16/FP32多精度,拥有可扩展3D Cube以及张量Tensor/向量Vector/标量Scalar多种计算单元,并拥有皮秒级电流控制和硬件辅助的任务调度。

2、可扩展内存,既有专用的,也有分布的,显式控制的内存分布实际,包括4 TBytes/s L2 Buffer缓存和1.2 TByte/s HBM高带宽内存,和传统冯·诺依曼架构有所差异。

3、可扩展片上互联,基于LSU可扩展,片上有超高带宽Mesh网络。

4、算力和功耗覆盖范围广,从蓝牙耳机到昇腾910芯片,算力范围达1000万倍,功耗范围达20万倍,很少芯片架构可以覆盖如此广的范围。

原创<br> 华为最强云端AI芯片商用!性能超英伟达V100,开源AI框架对标谷歌

基于达芬奇架构的统一性,用户只需进行一次算子开发和调试,就可以横跨端边云进行部署,将算法迁移效率将大大提升。

推荐阅读