深度解读达芬奇架构：华为AI芯片的“秘密武器”( 四 )_来源：华为2019年6月

在2018年全联接大会上，华为推出AI芯片Ascend 310（昇腾310），这是达芬奇架构的首次亮相。

其中，Da Vinci Core只是NPU的一个部分，Da Vinci Core内部还细分成很多单元，包括核心的3D Cube、Vector向量计算单元、Scalar标量计算单元等，它们各自负责不同的运算任务实现并行化计算模型，共同保障AI计算的高效处理。

3D Cube矩阵乘法单元：算力担当

刚才已经提到，矩阵乘是AI计算的核心，这部分运算由3D Cube完成，Buffer L0A、L0B、L0C则用于存储输入矩阵和输出矩阵数据，负责向Cube计算单元输送数据和存放计算结果。

Vector向量计算单元：灵活的多面手

虽然Cube的算力很强大，但只能完成矩阵乘运算，还有很多计算类型要依靠Vector向量计算单元来完成。Vector的指令相对来说非常丰富，可以覆盖各种基本的计算类型和许多定制的计算类型。

深度解读达芬奇架构：华为AI芯片的“秘密武器”( 四 )