华为深度解读达芬奇架构:3D Cube计算引擎加速运算( 四 )
其中,Da Vinci Core只是NPU的一个部分,Da Vinci Core内部还细分成很多单元,包括核心的3D Cube、Vector向量计算单元、Scalar标量计算单元等,它们各自负责不同的运算任务实现并行化计算模型,共同保障AI计算的高效处理。
图3/6
3D Cube矩阵乘法单元是AI计算的核心,这部分运算由3D Cube完成,Buffer L0A、L0B、L0C则用于存储输入矩阵和输出矩阵数据,负责向Cube计算单元输送数据和存放计算结果。
虽然Cube的算力很强大,但只能完成矩阵乘运算,还有很多计算类型要依靠Vector向量计算单元来完成。Vector的指令相对来说非常丰富,可以覆盖各种基本的计算类型和许多定制的计算类型。
Scalar标量运算单元主要负责AI Core的标量运算,功能上可以看作一个小CPU,完成整个程序的循环控制,分支判断,Cube、Vector等指令的地址和参数计算以及基本的算术运算等。
推荐阅读
- 无尽梦魇|魔兽世界TBC:深度解析“翠绿的宝珠”对哪些职业保值
- 阴阳师|阴阳师:茶几翻身成唯一输出核心?活动“猿蟹大合战”玩法解读
- 李九|S组才是真正的宝藏!解说李九深度分析KPL秋季赛第三轮,爆发到了
- edg战队|EDG众将迎接决赛,小虎出面力挺,对DK的解读一针见血
- 王者荣耀|英雄联盟手游被指抄袭王者荣耀?王者玩家看好了,这叫深度还原
- 万圣节|炉石英雄竟成童话主角?万圣节“童话故事合集”解读
- 华为鸿蒙系统|鸿蒙2.0.1新版本开始推送!这次优化了更多功能
- fpx战队|深度分析:FPX四个0-1的惨败原因,S11的FPX能否登顶外战第一耻辱
- 王者荣耀|部落冲突:用“王者荣耀”来解读村庄四王,他们的用途一目了然!
- 魔兽世界|魔兽世界:暴雪解读副本规则,想要避免被“黑”,团长必须这么做